随着 DeepSeek 等大模型技术从通用领域向垂直场景加速渗透,人工智能正深刻重塑文娱、数字人及多模态交互等前沿领域。在内容创作端,AI 已能辅助生成剧本、音乐和视频,大幅提升生产效率;数字人技术日趋成熟,虚拟主播、智能客服等应用快速普及;多模态交互的突破则让“语音+视觉+情感”的自然互动成为可能。这一技术浪潮正在重构人机协作模式,推动 AI 应用进入场景化落地的新阶段。

4月12日,由科大讯飞开放平台主办、CSDN 承办的“2025 iFLYTEK 开发者 TALK”系列沙龙在重庆市成功举办。本次沙龙聚焦 DeepSeek 等大模型技术在文娱、数字人及多模态交互领域的前沿应用,吸引了重庆及周边地区的 70 余名开发者、企业技术负责人及高校师生参与。现场,来自科大讯飞、重庆大学、Flomesh 的四位技术专家分别从技术架构、游戏设计、数字人应用及多模态 Agent 等维度,分享了大模型技术在相关领域的最新实践与未来趋势。

直播回放视频可前往AI大学堂官网查看:https://www.aidaxue.com/

从规则反射到自主学习,AI Agent 进入“工程化时代”

科大讯飞星辰 Agent 开发平台负责人金豪以《讯飞星辰 Agent 开发平台落地和实践》为主题,详细介绍了 AI Agent 的技术演进与讯飞星辰 Agent 平台的技术实践。他指出,随着模型在任务规划、工具使用、代码生成等方面能力的增强,支持复杂任务处理的 Agent 类应用所需核心能力走向可用阶段,其应用方向也从固定任务流类应用向支持开放复杂任务的 Agentic 类应用方向发展。

在此应用大趋势下,讯飞星辰平台采用“低代码敏捷开发+企业级核心组件+深度定制优化工具链”三位一体的架构,支持四类 Workflow 开发范式,并通过 MCP 模型上下文协议打破工具孤岛,极大降低了 AI 应用拓展工具的门槛。此外,平台突破传统 AI 应用“重开发、轻调优”“重上线、轻迭代”的局限,提供“测评-调优-监控-迭代”全链路闭环优化体系,从数据管理、模型定制、模型托管推理全流程一站式 MaaS 精调能力,帮助开发者高效围绕应用场景构建专属模型,优化应用效果。金豪强调,讯飞星辰平台的目标是让开发者能高效构建复杂 Agent 应用,加速大模型技术的商业化落地。 

让游戏 NPC“活过来”!大模型如何重构游戏体验?

重庆大学副教授、硕士生导师尹云飞在《多模态大模型驱动下的游戏角色设计优化与创新探索》的主题分享中,着重探讨了多模态大模型如何优化游戏角色设计。他指出,传统的单 NPC 路径规划、多 NPC 智能学习依赖有限状态机、遗传算法等技术,存在智能性不足、剧本缺乏多样性、角色行为固定等问题。

尹教授团队利用 DeepSeek 等大模型,结合小样本学习和 Adapter 跨域推理技术,使 NPC 能基于动态环境做出更拟人的决策。在多角色协同方面,大模型赋能的行为树优化让 NPC 具备战术调整能力(如掩体躲避、小队配合)。此外,由于传统养成类游戏(如 Pokemon)的指令集固定且有限,尹云飞展示了如何通过 DeepSeek 赋能,将自然语言命令实时转化为结构化游戏指令,大幅提升交互自由度。尹云飞认为,未来的游戏 NPC 将具备记忆、情感和成长性,推动游戏设计从“预设脚本”向“生成式交互”演进。 

AI 数字人:开启未来的数字新引擎

当前,数字人技术正逐步演进为以 AI 为核心驱动力的创新发展范式,科大讯飞虚拟人平台研发部经理付新勇以《科大讯飞数字人技术进展与应用》为题,分享了数字人技术的发展历程及讯飞的创新实践。讯飞的 2D 数字人技术包括形象拍摄训练、形象捏脸、照片驱动,以及超拟人数字人实时交互和视频生成等。

在此基础上,讯飞推出 AIGC 音视频内容创作平台“讯飞智作”以及 AI 虚拟人交互平台。其中,讯飞智作搭载讯飞星火大模型,支持文案生成、图片生成、AI 后期、视频理解等功能,提供更智能、高效的音视频生产方式。讯飞的 AI 虚拟人交互平台则支持以可视化方式快速配置数字人交互对话应用,满足各类场景的对话和交互需求;同时也提供一站式开发工具和多类交互方式、交互模板、数字人形象,适用多种终端的智能交互应用。此外,付新勇还展示了数字人在文旅接待、数据大屏语音智控、Web 客服等场景的落地案例,并展望未来数字人可能具备“类人意识”,甚至获得法律意义上的社会身份,成为连接物理与数字世界的核心节点。 

协议标准化加速 AI 技术的规模化落地

Flomesh 技术专家、Flomesh 开发者生态负责人彭柳以《Road to Agent: MCP + 多模态》为分享主题,从协议层解析了 Agent 技术的演进与标准化挑战。他将 Agent 发展分为四个阶段:以 AlphaGo 为代表的专用 Agent、基于 LLM 构建的 Prompt Agent、预先定义好的 Workflow Agent,以及具备自主规划能力的 Agentic Agent。

演讲中,彭柳重点解析了两大关键协议:MCP 协议(Model Context Protocol)和 A2A 协议(Agent2Agent)。MCP 协议用于标准化外部资源调用,类比“USB-C 接口”,统一模型与工具的交互标准;A2A 协议解决 AI 代理间的协作难题,类似“外交官协议”,标准化任务分派、进度同步等流程,从而消除“信息关税”。在多模态应用方面,彭柳分享了视频理解Agent的创新实践。传统方法需要组合图像、区域、音频等多个模型,而端到端多模态LLM展现出显著优势。彭柳还特别介绍了“密集描述”技术——通过多模态大模型检测视频中的多个目标区域并生成细节描述,为影视剪辑、内容审核等场景提供新工具。他强调,协议标准化将推动 Agent 生态从“垂直集成”走向“水平协作”,加速 AI 技术的规模化落地。

思维碰撞:开发者工坊激荡 AI 未来火花

活动在热烈的互动氛围中渐入佳境。在最后的开发者Talk智汇工坊环节,8个小组围绕技术突破场景应用商业化与生态三大方向展开深度探讨,现场思维碰撞的火花不断迸发。小组代表们精彩的总结发言,将这场技术盛宴推向高潮,与会开发者纷纷表示,这种理论与实践相结合的交流模式带来了诸多启发。

至此,本次由科大讯飞开放平台主办的2025 iFLYTEK开发者TALK·重庆站活动在热烈的掌声中圆满落幕。整场活动不仅展现了AI智能体领域的最新技术成果,更通过讲师分享、互动问答、小组讨论等丰富形式,打造了一个开放、专业的交流平台。参会者踊跃的提问和深入的探讨,充分彰显了重庆开发者社区的技术热情和创新活力,也为AI智能体技术的未来发展注入了新的动能。

展望未来,随着多模态理解、自主决策等技术的持续突破,大模型技术将深度融入文娱、数字人及多模态交互等前沿领域核心业务流程,而中国开发者依托科大讯飞等领先平台构建的创新生态,通过场景驱动的技术迭代和商业模式创新,不仅有望在虚拟偶像培育、沉浸式娱乐等细分赛道实现领跑,更将在全球 AI 竞赛中扮演越来越重要的角色,为世界人工智能发展贡献“中国方案”!

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐