636f3813cdb9d40c8fe0e83802353474.png

“LeetTalk Daily”,每日科技前沿,由LeetTools AI精心筛选,为您带来最新鲜、最具洞察力的科技新闻。

近期,小米创始人雷军以千万年薪成功招揽了95后AI天才少女罗福莉,成为了营收的焦点。罗福莉不仅是开源大模型DeepSeek-V2的关键开发者,还在自然语言处理(NLP)领域取得了显著的成就,曾在阿里巴巴达摩院工作并发表多篇学术论文。她的加入以及小米在AI领域布局的加速,尤其是在大模型研发方面的雄心壮志。

0a40d9dab355a34c7c320fead2a5619b.jpeg

雷军与年轻AI人才的招募策略

雷军以千万年薪招揽95后AI天才少女罗福莉的举动,反映了小米在人工智能(AI)领域对年轻人的高度重视和积极招募的策略。罗福莉作为DeepSeek开源大模型DeepSeek-V2的关键开发者其中,拥有北京大学计算语言学硕士学位,并在阿里巴巴达摩院工作期间发表了多篇国际顶级会议论文,展现出其在AI领域的卓越能力和潜力。

小米在AI领域的布局相对较晚,面对激烈的市场竞争,雷军出手招揽顶尖人才,迅速提升公司的技术实力和市场竞争力。通过高额薪酬吸引年轻人才,不仅仅是为了获取技术空缺,更是希望借助这些年轻人的创新思维和活力,推动小米在AI领域的快速发展。这种策略也反映了当前科技行业对年轻人的渴求,尤其是在快速发展的AI领域,企业需要不断引入新鲜血液,以保持技术的前沿性和竞争力。

此外,雷军的这一举动也表明了小米对AI技术未来发展的重视。随着AI技术的不断进步和应用场景的扩展,企业在技术研发上的投入极为重要。小米希望通过罗福莉的加入,能够在大型模型的研发上取得突破,进一步提升其在智能硬件和互联网服务中的竞争优势。

罗福莉的学术成就与职业背景

罗福莉是一位年轻人工智能专家,她的教育背景和职业经历为她在自然语言处理(NLP)领域的成就奠定了精细的基础。罗福莉本科就读于北京师范大学,专业为计算机科学2019年,她在国际顶级ACL会议上发表了8篇论文,其中2篇为第一作者,这一成就使她迅速走红,成为“人工智能天才”少女”的代名词。

f20c39d0bbf85a561df7d1faff7573b3.jpeg

在阿里巴巴达摩院工作期间,罗福莉主导了多语言预训练模型VECO的开发,并参与了AliceMind的开源项目。这些经历不仅提升了她的技术能力,也让她在市场上积累了丰富的人脉和她的研究成果,尤其是在词义消歧和文本风格转换方面,推动了NLP技术的发展,进一步巩固了她在该领域的地位。

2022年,罗福莉加入了量化对冲基金公司幻方量化,专注于深度学习相关的策略建模和算法研究。随后,她又跳槽到DeepSeek,成为深度学习研究员,参与研发MoE大模型DeepSeek-V2。模型养成高效率而受到广泛关注,罗福莉在其中的贡献不可忽视。

罗福莉的职业生涯展现了她在AI领域的卓越才能和潜力。她不仅在学术界取得了显著的成就,还在工业界的多个重要项目中发挥了关键作用。如今,她已被小米创始人雷军以千万年薪招揽,领导小米的AI大模型团队,这一举动引起了她在AI领域的影响力进一步扩大。罗福莉的成功不仅源于她的学术背景和职业经历,更在于她对技术的热情和对未来的无限可能的追求。

小米在AI领域的战略布局

小米在AI和算力领域的投资计划正在加速推进,尤其是在大模型的研发上。雷军领导的团队正在建设一个规模庞大的GPU万卡集群,这一计划的实施将推动小米在AI算力领域的实施力方面的重大投入[ 25据小米集团总裁卢伟冰的确认,预计2024年小米的研发费用将达到240亿元,2025年将攀升至300亿元,预计自2022年至2026年的五年内,小米的研发投入将超过1000亿元,主要集中在AI、操作系统和芯片等基础技术的研发上。

0cc15f00ca36dac072902e15529b4a9f.jpeg

小米在AI领域的布局相对较晚,但随着AI技术的快速发展,尤其是在手机市场中,AI的应用已经成为区分高端和低端产品的关键因素。IDC预测,到2025年,中国新第一代AI手机市场的出货量将达到1.18亿台,同比增长59.8%。在这样的市场背景下,小米必须加大对AI大模型的投入,以保持其在智能手机市场的竞争力力。

小米的AI团队自2016年成立以来,经过多次扩展,现已拥有3000多名相关领域的专业人员。此次重金招募“95后AI天才少女”罗福莉,罗福莉在NLP领域的卓越表现和她在DeepSeek大模型开发中的关键角色,使她成为小米AI团队的理想人选。她的加入不仅将提升在小米AI技术上的实力,也将为小米的品牌形象注入新的活力。

小米在AI大模型的研发上选择了轻量化和本地部署的策略,这与其他竞争对手的做法有所不同。雷军曾表示,如何在高成本的AI大模型业务中平衡成本是他考虑的核心问题。这一策略反映了小米在成本控制和用户体验之间的平衡考量,尤其是在当前竞争激烈的市场环境中。

随着小米在AI和算力领域的持续投入,未来五年内的研发费用超过千亿元的战略意义不仅在于提升自身的技术实力,更在于在行业内部建立起建立的竞争壁垒。小米的这一系列目前,对整个行业产生的影响,推动AI技术的进一步发展和应用,尤其是在智能手机和智能家居等领域的融合应用上。

DeepSeek大模型的技术创新

DeepSeek-V2和DeepSeek-V3模型在技术上具有显著的创新特点,尤其是在训练效率和成本控制方面。DeepSeek-V2的推出引起了国内大型模型技术的一个重要里程碑,其极高,训练成本GPT-4 的 1/100,吸引了广泛的关注。该模型采用了多头潜在话题(MLA)和 DeepSeek MoE架构等创新技术,使得训练效果变得更加经济性,推理效率更高。在此基础上,DeepSeek-V3的发布进一步提升了模型的性能,其参数量达到671B,激活参数对于37B,使用的预训练代币量高达14.8万亿,性能上与全球顶尖的闭源模型不相上下。

67af2a9d11f6abefb6110e22059a351a.jpeg

罗福莉在DeepSeek的研发过程中扮演了关键角色。她不仅参与了DeepSeek-V2的开发,还在DeepSeek-V3的研发中发挥了重要作用。罗福莉的学术背景和研究成果为她在AI领域的快速崛起奠定了基础。她在2019年国际顶级会议ACL上发表了8篇论文,其中2篇为第一作者,迅速获得了业界的认可。她的研究成果,特别是在自然语言处理(NLP)领域的贡献,推动了相关技术的发展,使她颂扬了“天才AI少女”。

🚀LeetTools 解决您“多步骤、极具体、定制化”复杂搜索任务。

👇点击阅读原文,获取开源地址

🚀帮我们点亮一颗🌟,愿您的开发之路星光璀璨

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐