DeepSeek之后,大模型下半场的走向如何?

蚂蚁华为阿里云已做出选择:携手近百家企业联手组局,将探索的航道驶向医疗新大陆。

他们共同发布了一个新产品:“大模型一体机”全栈解决方案

如今,医疗机构想要快速、安全、稳定实现大模型落地,只需一键接入蚂蚁医疗大模型一体机设备,即可完成国产算力、医疗大模型、AI训推一体这一连串的私有化部署。同时还定制化配置成熟应用,直接给医院业务系统、医疗诊断、患者服务大升级。

img

浙江省人民医院、北京市中医院、上海仁济医院等7家机构已成为首批接入合作的医疗机构。比如,浙江省人民医院选择在一体机中配备了医生助手、达摩院影像筛查应用

img

不止如此,蚂蚁与浙江卫健委合作的AI健康应用“安诊儿”已覆盖超1000家公立医院,这一方案也正应用于湖南、上海等地。收购“互联网在线诊疗鼻祖”之称的好大夫之后,助力产品持续升级,推出了AI医生助手系列功能,为29万注册医生提供更趁手的AI工具。

种种动作齐发,AI医疗落地按下加速键。

各大厂商联手,也让这些进展更值得期待。但问题是,为什么都看好AI医疗?而且纷纷选择与蚂蚁合作?

大模型正在全方位融入医疗

追溯来看,深度学习浪潮刚刚兴起时,诺奖得主Hinton就看到了AI大幅提升医疗行业效率的前景。虽然AI还没能取代影像医生,但得益于CV算法的成熟,AI医疗影像场景的探索已经十分深入。

生成式AI浪潮爆发,更进一步解决底层模型能力问题。大模型表现出的强泛化能力,使得AI在行业落地可以摆脱原本的“烟囱”模式(专门从头训练专业模型),而是通过微调等方法快速提升通用大模型某一单项能力。DeepSeek掀起的最新趋势,更是将行业落的算力、算法门槛都大幅降低,AI大规模落地开始爆发。

img

在这之中,AI医疗始终备受关注。

一方面,医疗行业需要AI:医患比例不平衡问题使得医疗领域增效需求非常明显。生成式AI在简历生生成、简单问诊等方面表现值得关注。GPT-4、Med-PaLM等先进模型在医学问答测试中的表现甚至超越人类专家平均水平。另一方面,AI也需要医疗——海量医疗数据尚未被挖掘,AI医疗上限还远未到达,需要行业进一步合理利用数据、驱动创新发生。

所以,AI医疗成为大模型落地进程中格外重要的一部分,这也是为何各大厂商聚集于此合力推动AI医疗落地。

但为什么由蚂蚁组局?

探索早、布局广。

2023年以来,支付宝在AI医疗领域的进展频频,与浙江卫健委合作首创数字健康人“安诊儿”;2024年7月推出国内首批多模态医疗大模型、8月发布“AI健康管家”、面向医疗机构、泛健康行业开放专业智能体生态……逐渐形成了以AI为纽带的医疗行业全布局。

如今,蚂蚁在AI医疗上完成了“三端一体”战略布局。

逐一拆解,具体动作分别是:

  • 面向机构:通过大模型一体机向医院输出全栈式解决方案、面向卫健委的可复制“安诊儿”模式,面向各地医保局的医保智能体等
  • 面向医生:好大夫发布包括AI科普、AI病历、AI科研等AI医生助手系列工具,助力医生“医教研”
  • 面向患者用户:推出“AI健康管家”,提供找医生、读报告、问诊等刚需日常医疗健康服务

“三端一体”,覆盖医疗服务全体系。

img

首先来看让医疗机构能更加“AI化”的大模型一体机。

不完全统计,春节之后全国已有百家医院宣布接入DeepSeek。市场热情和需求都空前高涨。

由于医疗机构内数据涉及患者隐私,上云处理存在风险隐患,一体机成为医疗机构拥抱大模型的优先选择。它实现了“国产算力+垂直大模型+专业应用”一体化,“开箱即用”免去了复杂的环境配置和算法开发流程,让医疗机构可以快速便捷部署应用。

在这之中,蚂蚁医疗大模型一体机更进一步强调了医疗专业能力以及隐私保护。

软件方面,它集成了蚂蚁医疗大模型核心能力,也可一键调用DeepSeek-R1/V3、Qwen等主流大模型。

其中,蚂蚁医疗大模型曾在MedBench医疗大模型评测医学知识问答、医学语言生成、复杂医学推理三类单项中位居第一,并长期位居综合榜第一。

它不仅能完成图文音视频等多模态交互,还已具备“医学思维”推理能力。

img
img

硬件方面,蚂蚁与华为、阿里云、苹果等主流硬件厂商合作,主打“训推一体”,提供从开发到部署的全流程支持,可以“开箱即用”。

隐私保护方面结合了蚂蚁可信AI平台“蚁鉴2.0”的隐私计算能力,实现数据可用不可见、诊疗过程全程可溯源,确保医院等AI部署数据安全。

其次面向医生方面,今年1月蚂蚁宣布完成对好大夫在线收购,双方共同探索AI助力医生,在蚂蚁的技术加持下,好大夫发布AI医生助手系列能力,为医生临床诊断、学术研究提供支持。

其中,最新推出的AI科研助手深度融合了DeepSeek智能引擎,能对多源医疗数据实时解析,快速定位关键文献、生成结构化综述,将文献检索效率显著提升。它能为医生的临床决策提供辅助性建议,通过整合患者病历、影像数据以及最新医学指南,提供实时诊断建议,在辅助肿瘤识别等复杂场景中表现更准确。

在服务患者用户方面,去年9月,蚂蚁集团推出了AI健康管家(在支付宝内搜索即可体验)。

它提供找医生、读报告、陪看诊、问医保等用户常需的AI服务,并连接全国各地90万名医生,其中70%来自三甲医院,让用户还可选择进一步与专家的AI助理一对一问诊。

img

最近,AI健康管家新增了DeepSeek深度思考模式、自研智能思考模式,以及健康自测、体检报告解读等功能,接入全国60多位名医AI智能体。

蚂蚁集团数据显示,半年多来,AI健康管家已经服务了近4000万用户。

img

由此三方面,从医疗机构、医生到患者,蚂蚁AI医疗的布局目前已进化得更加完整全面。

这也解释了为何行业伙伴都选择和蚂蚁共同探索AI医疗。

对于医疗行业伙伴,蚂蚁的先进技术与落地经验能够让他们更快搭上AI快车道;对于华为阿里云等技术伙伴,借助蚂蚁生态可以更好服务医疗机构/企业用户,推动AI落地到医疗业务实处。

此次蚂蚁牵头的一系列动作,是对AI医疗落地的进一步探索,也为行业提供了一定参考路线。

实际上,随着趋势发展,AI医疗行业迎接新机遇,新的挑战也开始浮现。

场景化阶段,懂行业更重要

当前阶段,医疗领域的大模型数量已经相当可观,仅国内AI医疗大模型的数量就已经超过50个,模型质量也有了长足进步。技术落地下半场,已经不缺大模型了,更缺少的是对AI与行业结合的理解。

一系列新挑战由此浮现:

  • 临床场景认知鸿沟
  • 医疗数据获取与质量保证
  • 产品融入与工作流对接
  • 价值量化与商业模式不确定

一方面,医疗工作流程复杂且高度个性化,各科室、各医院间存在显著差异。AI和实际场景匹配,才能确保技术被真正用起来。如果技术理解成本太高,或者技术太先进/落后与实际情况脱节,就会使实际落地价值大打折扣。

另一方面,医疗数据虽然规模庞大,但是存在数据孤岛现象且质量参差不齐,容易影响AI医疗模型性能和泛化能力。如何去获取更多高质量数据训练模型?也是厂商们接下来亟需解决的。

以及AI医疗需要通过严格的临床研究证明其对医疗质量、患者预后或医院运营效率的实际改善。这意味着AI医疗落地项目往往周期更长、成本更高,其商业模式也需要进一步明确。

img

行业内该怎么应对?蚂蚁的做法提供一定参考:

  • 行业积累久,对医疗场景理解深刻
  • 支付宝超级平台提供独特落地通道
  • 全链路融入行业场景和整合生态的能力
  • 先进技术布局,并与产品应用实现模型迭代闭环

2014年,蚂蚁开始探索与医院合作,2016年上线医保线上支付服务、打造“未来医院”。如今,支付宝医疗健康已经是国内规模最大的医保第三方在线服务平台,正在发展成为一站式的医疗健康服务平台。在支付宝“医疗健康”频道内,整合了挂号问诊、医保凭证、买药送药、体检检查等2万项服务。

11年长期积累使得蚂蚁更能准确识别医疗场景痛点,开发真正满足实际需求的AI解决方案。

一方面,庞大的用户基础和流量入口使蚂蚁能够快速触达海量用户;另一方面,支付宝成熟的支付体系和医保通道解决了医疗服务的支付环节,实现”诊疗-支付”一体化流程。

2023年开始,蚂蚁在大模型技术布局上也从产业出发,重点关注了医疗健康领域。自研底座通用大模型加入了强大的专家知识增强,使得医疗大模型可以更严谨、更符合产业落地的实际需求。

聚焦到最新进展,蚂蚁还联合硬件厂商、垂直领域玩家,共同探索AI医疗产品。

由此,蚂蚁构建出了一个以AI为核心能力,衔接底层技术厂商、上层医疗机构客户等维度的AI医疗开放生态。

正如DeepSeek能够推动落AI落地趋势,离不开它始终“坚持开放”的策略,AI医疗亦是如此。

医疗AI落地的复杂性表明,单一技术公司难以独立攻克所有挑战。技术厂商与医院、医疗设备商、医疗信息化企业和保险机构建立深度战略合作,形成”技术+场景+渠道+支付”的完整价值链,优势互补的伙伴生态正在形成。

蚂蚁与华为阿里云等伙伴的合作就是一次尝试。

在AI大规模落地中,医疗+AI无疑是最具想象力的一部分。它为医疗资源不平衡、医疗体系改革升级提供机遇,带来的成果将可能直接影响每一个人。但AI医疗也表现出技术周期更长、落地场景更深等特点,是AI大规模落地中最复杂的领域之一。

这也是为何蚂蚁此次牵头的动向更值得被关注,它迈出了非常具有探索性的一步。

AI医疗的前景,也因大厂们之间的通力合作而更值得被关注。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐