
【AI News | 20250328】每日AI进展
此外,提供AI翻译、PPT制作、语音克隆等强大多媒体功能,支持大模型接入微信,并兼容易支付、微信支付等多种支付方式,扩展性强,应用场景广泛。结合混元和DeepSeek模型,其支持多种编程语言,覆盖开发、评审、文档校对等场景,用户可通过拖拽上传文件,享受便捷智能服务。积分按月重置,未用积分不结转,免费及附加积分永不过期,使用顺序为月度、附加、免费。眼镜通过AI技术实现物品识别、餐厅信息查询等功能,类
AI Repos
1、one-person-company
这两年我们常常听到超级个体 “一人公司” 的说法,那该拥有哪些 AI 工具才能一人顶一个公司?可以看下 GitHub 上这个项目 one-person-company,汇总了各类日常实用的 AI 工具,如 AI 对话、图文视频、开发工具、媒体工具、网站设计、Logo 设计等等。这里面收集整理的工具,均备注了是否免费、开源以及收费情况,希望能帮助到大家提升工作效率。
2、ruoyi-ai
一站式 AI 助手平台搭建的开源解决方案,包含前端应用、后台管理以及小程序等全套系统,开箱即用,并基于 MIT 协议开源(可自由商用)。提供完整的前端应用、后台管理及小程序应用,开箱即用。系统集成本地RAG方案,结合Milvus/Weaviate向量库、本地向量化模型与Ollama实现高效本地化检索增强生成。支持联网、SQL查询及Text2API等丰富插件,内置SSE、websocket协议,可对接多种大语言模型,并集成MidJourney和DALLE AI绘画功能。此外,提供AI翻译、PPT制作、语音克隆等强大多媒体功能,支持大模型接入微信,并兼容易支付、微信支付等多种支付方式,扩展性强,应用场景广泛。
AI News
1、Midjourney V7发布在即:AI艺术生成的新里程碑
Midjourney V7将于2025年3月31日发布,标志着AI图像生成领域的重大突破。新版本历经22个月研发,显著提升了图像的视觉连贯性、细节渲染和美学质量,尤其在自然语言理解上进步明显,能更精准地将复杂文字转化为视觉艺术。这一更新降低艺术创作门槛,让用户通过简单描述即可生成复杂作品,与DALL-E3、Adobe Firefly等竞争,巩固其市场领导地位。尽管部分功能尚未完全披露,V7被视为AI与人类创造力融合的象征,预示技术与艺术合作的未来。
2、小米真AI智能眼镜下月亮相:双芯架构引领智能交互
小米首款真AI智能眼镜预计下月发布,采用双芯架构,内置摄像头,拍摄效果媲美Meta Ray-ban。眼镜通过AI技术实现物品识别、餐厅信息查询等功能,类似苹果视觉智能系统,但无屏幕设计,交互依赖触摸和语音,或支持手势操控,需优化误操作问题。对标Meta Ray-ban,集成AI、音频和摄像头模块,以小米自有品牌发布,并可能与首发玄戒SoC芯片的小米15s Pro同台亮相,为用户带来创新的智能体验。
3、腾讯元宝升级:支持36种文件格式解析与智能处理
腾讯元宝AI助手于3月28日更新,支持36种文件格式解析与处理,包括Word、PDF、Excel及.py、.java等开发文件。新功能助力用户在工作与学习中提升效率,可解读代码、定位Bug、提供修改建议,并实现代码语言转换,如Python转JavaScript。本周内,元宝已接连迭代,接入DeepSeek V3-0324模型并推出HTML预览功能。结合混元和DeepSeek模型,其支持多种编程语言,覆盖开发、评审、文档校对等场景,用户可通过拖拽上传文件,享受便捷智能服务。
4、英伟达拟收购Lepton AI 加速布局云计算与AI基础设施
英伟达计划以数亿美元收购由贾扬清创办的AI初创公司Lepton AI,旨在加强云计算和企业软件市场竞争力,与亚马逊、谷歌等抗衡。Lepton AI专注于AI基础设施建设,提供Python SDK和云平台,帮助开发者简化AI模型部署与托管,降低技术门槛。其核心产品支持快速应用开发并提供按需计算资源。贾扬清作为知名AI科学家,带领团队解决AI基础设施的速度、成本与质量问题。此次收购将助力英伟达整合Lepton AI技术,进一步完善其云端布局。
5、MIT与哈佛推出Lyra:高效生物序列建模新突破
MIT、哈佛及卡内基梅隆大学联合推出Lyra,一种高效生物序列建模方法,参数仅为传统模型的12万分之一,使用两块GPU可在两小时内训练完成。Lyra受上位效应启发,采用次二次架构,结合状态空间模型和投影门控卷积,高效捕获序列的全局与局部依赖,推理速度提升64.18倍。在蛋白质预测、RNA分析等100多项任务中表现优异,达最佳性能。其高效性降低资源需求,有望推动生物研究及治疗开发、病原体监测等应用,加速科学探索。
6、Nvidia G-Assist发布:本地AI助手助力玩家体验升级
Nvidia推出实验性AI助手G-Assist,可在GeForce RTX显卡上本地运行,基于8亿参数Llama模型,需RTX30/40/50系列显卡及12GB显存。通过Alt+G激活,提供系统诊断、游戏优化、GPU超频及性能监控等功能,并支持控制Logitech等兼容外设。G-Assist专注PC相关任务,区别于云端AI助手,并开放GitHub代码库,支持开发者创建插件。继ChatRTX更新后,Nvidia持续推进AI与游戏整合,G-Assist展现其提升玩家体验及技术创新的愿景。
7、Therabot试验:AI聊天机器人显著改善心理健康
达特茅斯学院研究团队试验AI心理健康聊天机器人Therabot,历时四周,涉及106名抑郁症、焦虑症及饮食失调症患者。Therabot通过主动互动提供情感支持,试验结果显示抑郁症症状减轻51%,焦虑症减轻31%,饮食失调症身体形象改善19%,效果媲美传统治疗。设计经心理学家优化,含自残风险识别机制。研究强调其作为心理资源短缺补充的潜力,但提醒勿过度依赖AI,仍需关注应用风险。结果刊于《新英格兰医学杂志》。
8、Manus推出付费计划:Starter套餐39美元/月起
Manus宣布从免费测试转向商业化,推出Starter(39美元/月,3900积分)和Pro(199美元/月,19900积分)两款付费计划,并保留1000免费积分。Starter支持双任务运行、专属资源及优先访问;Pro增加高投入模式及测试功能。积分按月重置,未用积分不结转,免费及附加积分永不过期,使用顺序为月度、附加、免费。此定价策略满足用户多样需求,为平台发展提供稳定收入,标志着AI服务市场迈向成熟多元化阶段。
10、开源YuE发布:AI音乐生成媲美专业水准
香港科技大学与DeepSeek合作推出开源AI音乐生成模型YuE,采用双LLaMA架构,可生成5分钟完整歌曲,包括专业级歌声与伴奏,媲美Suno、Udio。其“双轨版下一token预测”策略分开建模人声与伴奏,提升音质与一致性;“结构化渐进生成”技术确保歌曲连贯性;独特音乐上下文学习避免抄袭,增强独创性。YuE在评测中表现卓越,为专业与业余音乐人提供全新创作体验,项目已于GitHub开放。
11、谷歌AI推出TxGemma:助力药物开发的高效语言模型
谷歌AI发布TxGemma系列大规模语言模型,专为药物开发设计,整合小分子、蛋白质等多元数据集,覆盖治疗开发多阶段。提供2亿至27亿参数选择,基于Gemma-2架构微调,包含交互式TxGemma-Chat模型提升透明度。利用6600万数据点的TDC数据集,TxGemma-Predict在预测性能上媲美甚至超越传统模型,尤其在数据稀缺领域表现优异。其在临床试验不良事件预测中展现高效性和数据效率,推理速度支持实时应用,已公开于Hugging Face,推动药物研究进步。
12、Twin携手Qonto推出AI发票操作员:自动化提升效率
法国初创公司Twin与金融科技企业Qonto合作,推出AI代理“发票操作员”,帮助超过50万Qonto客户自动化检索和上传发票。用户启动代理后,系统自动识别缺失发票交易,引导用户登录相关服务,下载PDF并附加至账户。基于OpenAI的CUA模型和Chromium浏览器,该工具支持数万服务,远超传统RPA和API自动化效率。Twin计划将AI代理扩展至电商订单管理等领域,未来或开发通用平台,助力多行业高效任务处理。
13、阿里通义千问发布QVQ-Max:视觉推理模型开启多场景应用
阿里通义千问团队推出QVQ-Max视觉推理模型,能够分析、推理图片和视频内容,并支持插图设计、短视频剧本生成等创作任务。其核心能力包括细致观察细节、深入推理结论和灵活应用场景。在职场中,它助力数据分析与编程;学习上,帮助解答图表难题并讲解概念;生活中,提供穿搭建议与烹饪指导。目前已集成至Qwen Chat,用户可上传内容并使用推理功能。阿里表示,未来将持续优化QVQ-Max性能与功能。
更多推荐
所有评论(0)