【AI News | 20250328】每日AI进展

此外，提供AI翻译、PPT制作、语音克隆等强大多媒体功能，支持大模型接入微信，并兼容易支付、微信支付等多种支付方式，扩展性强，应用场景广泛。结合混元和DeepSeek模型，其支持多种编程语言，覆盖开发、评审、文档校对等场景，用户可通过拖拽上传文件，享受便捷智能服务。积分按月重置，未用积分不结转，免费及附加积分永不过期，使用顺序为月度、附加、免费。眼镜通过AI技术实现物品识别、餐厅信息查询等功能，类

三道杠卷胡

1295人浏览 · 2025-03-28 22:47:20

三道杠卷胡 · 2025-03-28 22:47:20 发布

AI Repos

1、one-person-company
这两年我们常常听到超级个体 “一人公司” 的说法，那该拥有哪些 AI 工具才能一人顶一个公司？可以看下 GitHub 上这个项目 one-person-company，汇总了各类日常实用的 AI 工具，如 AI 对话、图文视频、开发工具、媒体工具、网站设计、Logo 设计等等。这里面收集整理的工具，均备注了是否免费、开源以及收费情况，希望能帮助到大家提升工作效率。
在这里插入图片描述

2、ruoyi-ai
一站式 AI 助手平台搭建的开源解决方案，包含前端应用、后台管理以及小程序等全套系统，开箱即用，并基于 MIT 协议开源（可自由商用）。提供完整的前端应用、后台管理及小程序应用，开箱即用。系统集成本地RAG方案，结合Milvus/Weaviate向量库、本地向量化模型与Ollama实现高效本地化检索增强生成。支持联网、SQL查询及Text2API等丰富插件，内置SSE、websocket协议，可对接多种大语言模型，并集成MidJourney和DALLE AI绘画功能。此外，提供AI翻译、PPT制作、语音克隆等强大多媒体功能，支持大模型接入微信，并兼容易支付、微信支付等多种支付方式，扩展性强，应用场景广泛。
在这里插入图片描述

AI News

1、Midjourney V7发布在即：AI艺术生成的新里程碑
Midjourney V7将于2025年3月31日发布，标志着AI图像生成领域的重大突破。新版本历经22个月研发，显著提升了图像的视觉连贯性、细节渲染和美学质量，尤其在自然语言理解上进步明显，能更精准地将复杂文字转化为视觉艺术。这一更新降低艺术创作门槛，让用户通过简单描述即可生成复杂作品，与DALL-E3、Adobe Firefly等竞争，巩固其市场领导地位。尽管部分功能尚未完全披露，V7被视为AI与人类创造力融合的象征，预示技术与艺术合作的未来。

2、小米真AI智能眼镜下月亮相：双芯架构引领智能交互
小米首款真AI智能眼镜预计下月发布，采用双芯架构，内置摄像头，拍摄效果媲美Meta Ray-ban。眼镜通过AI技术实现物品识别、餐厅信息查询等功能，类似苹果视觉智能系统，但无屏幕设计，交互依赖触摸和语音，或支持手势操控，需优化误操作问题。对标Meta Ray-ban，集成AI、音频和摄像头模块，以小米自有品牌发布，并可能与首发玄戒SoC芯片的小米15s Pro同台亮相，为用户带来创新的智能体验。

3、腾讯元宝升级：支持36种文件格式解析与智能处理
腾讯元宝AI助手于3月28日更新，支持36种文件格式解析与处理，包括Word、PDF、Excel及.py、.java等开发文件。新功能助力用户在工作与学习中提升效率，可解读代码、定位Bug、提供修改建议，并实现代码语言转换，如Python转JavaScript。本周内，元宝已接连迭代，接入DeepSeek V3-0324模型并推出HTML预览功能。结合混元和DeepSeek模型，其支持多种编程语言，覆盖开发、评审、文档校对等场景，用户可通过拖拽上传文件，享受便捷智能服务。

4、英伟达拟收购Lepton AI 加速布局云计算与AI基础设施
英伟达计划以数亿美元收购由贾扬清创办的AI初创公司Lepton AI，旨在加强云计算和企业软件市场竞争力，与亚马逊、谷歌等抗衡。Lepton AI专注于AI基础设施建设，提供Python SDK和云平台，帮助开发者简化AI模型部署与托管，降低技术门槛。其核心产品支持快速应用开发并提供按需计算资源。贾扬清作为知名AI科学家，带领团队解决AI基础设施的速度、成本与质量问题。此次收购将助力英伟达整合Lepton AI技术，进一步完善其云端布局。

5、MIT与哈佛推出Lyra：高效生物序列建模新突破
MIT、哈佛及卡内基梅隆大学联合推出Lyra，一种高效生物序列建模方法，参数仅为传统模型的12万分之一，使用两块GPU可在两小时内训练完成。Lyra受上位效应启发，采用次二次架构，结合状态空间模型和投影门控卷积，高效捕获序列的全局与局部依赖，推理速度提升64.18倍。在蛋白质预测、RNA分析等100多项任务中表现优异，达最佳性能。其高效性降低资源需求，有望推动生物研究及治疗开发、病原体监测等应用，加速科学探索。

6、Nvidia G-Assist发布：本地AI助手助力玩家体验升级
Nvidia推出实验性AI助手G-Assist，可在GeForce RTX显卡上本地运行，基于8亿参数Llama模型，需RTX30/40/50系列显卡及12GB显存。通过Alt+G激活，提供系统诊断、游戏优化、GPU超频及性能监控等功能，并支持控制Logitech等兼容外设。G-Assist专注PC相关任务，区别于云端AI助手，并开放GitHub代码库，支持开发者创建插件。继ChatRTX更新后，Nvidia持续推进AI与游戏整合，G-Assist展现其提升玩家体验及技术创新的愿景。

7、Therabot试验：AI聊天机器人显著改善心理健康
达特茅斯学院研究团队试验AI心理健康聊天机器人Therabot，历时四周，涉及106名抑郁症、焦虑症及饮食失调症患者。Therabot通过主动互动提供情感支持，试验结果显示抑郁症症状减轻51%，焦虑症减轻31%，饮食失调症身体形象改善19%，效果媲美传统治疗。设计经心理学家优化，含自残风险识别机制。研究强调其作为心理资源短缺补充的潜力，但提醒勿过度依赖AI，仍需关注应用风险。结果刊于《新英格兰医学杂志》。

8、Manus推出付费计划：Starter套餐39美元/月起
Manus宣布从免费测试转向商业化，推出Starter（39美元/月，3900积分）和Pro（199美元/月，19900积分）两款付费计划，并保留1000免费积分。Starter支持双任务运行、专属资源及优先访问；Pro增加高投入模式及测试功能。积分按月重置，未用积分不结转，免费及附加积分永不过期，使用顺序为月度、附加、免费。此定价策略满足用户多样需求，为平台发展提供稳定收入，标志着AI服务市场迈向成熟多元化阶段。

10、开源YuE发布：AI音乐生成媲美专业水准
香港科技大学与DeepSeek合作推出开源AI音乐生成模型YuE，采用双LLaMA架构，可生成5分钟完整歌曲，包括专业级歌声与伴奏，媲美Suno、Udio。其“双轨版下一token预测”策略分开建模人声与伴奏，提升音质与一致性；“结构化渐进生成”技术确保歌曲连贯性；独特音乐上下文学习避免抄袭，增强独创性。YuE在评测中表现卓越，为专业与业余音乐人提供全新创作体验，项目已于GitHub开放。

11、谷歌AI推出TxGemma：助力药物开发的高效语言模型
谷歌AI发布TxGemma系列大规模语言模型，专为药物开发设计，整合小分子、蛋白质等多元数据集，覆盖治疗开发多阶段。提供2亿至27亿参数选择，基于Gemma-2架构微调，包含交互式TxGemma-Chat模型提升透明度。利用6600万数据点的TDC数据集，TxGemma-Predict在预测性能上媲美甚至超越传统模型，尤其在数据稀缺领域表现优异。其在临床试验不良事件预测中展现高效性和数据效率，推理速度支持实时应用，已公开于Hugging Face，推动药物研究进步。

12、Twin携手Qonto推出AI发票操作员：自动化提升效率
法国初创公司Twin与金融科技企业Qonto合作，推出AI代理“发票操作员”，帮助超过50万Qonto客户自动化检索和上传发票。用户启动代理后，系统自动识别缺失发票交易，引导用户登录相关服务，下载PDF并附加至账户。基于OpenAI的CUA模型和Chromium浏览器，该工具支持数万服务，远超传统RPA和API自动化效率。Twin计划将AI代理扩展至电商订单管理等领域，未来或开发通用平台，助力多行业高效任务处理。

13、阿里通义千问发布QVQ-Max：视觉推理模型开启多场景应用
阿里通义千问团队推出QVQ-Max视觉推理模型，能够分析、推理图片和视频内容，并支持插图设计、短视频剧本生成等创作任务。其核心能力包括细致观察细节、深入推理结论和灵活应用场景。在职场中，它助力数据分析与编程；学习上，帮助解答图表难题并讲解概念；生活中，提供穿搭建议与烹饪指导。目前已集成至Qwen Chat，用户可上传内容并使用推理功能。阿里表示，未来将持续优化QVQ-Max性能与功能。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

天赐范式第26天：可信AI就在我的电脑里，因我始终遵循ZFC公理，所以今天我敢说：“天赐范式的AGI”——“不是在路上”，豆包，文心，DEEPSEEK如是说~

DeepSeek技术社区

有哪些小众但口碑爆棚的AI论文写作神器？查重→降重→排版→答辩 PPT 一站式生成全流程

DeepSeek技术社区

Claude+DeepSeekv4pro网络信息搜索报告

WebSearch功能测试摘要测试显示Claude Code的WebSearch功能表现优异： 6组测试(中英文各3组)成功率100%，首条相关性100% 覆盖AI、财税、统计等多领域，平均返回10条结果时效性优秀，可获取5天内最新技术发布信息技术文档深度足够，包含代码示例和对比数据中文搜索质量与英文持平，政府数据可溯源官方公报主要局限：无高级搜索语法和时间排序控制。相比传统搜索引擎，优