当DeepSeek走向千行百业,企业是否能应对随之而来的“AI安全攻防战”?

春节以来,以DeepSeek为代表的AI开源大模型,凭借其强大的性能和开源优势,在云、边、端及多行业场景中快速渗透。

开源模型允许企业自由下载、修改和部署,而无需支付高昂的授权费用,这种开放性从成本层面极大降低了技术使用门槛。数美科技CTO梁堃介绍:“由于DeepSeek完全开源了模型参数,有研发能力的企业可以直接下载模型文件,再自行研发推理引擎来加载模型,进而完成与自身的产品集成。”

尽管满血版R1(671B参数)对硬件要求极高,但通过模型蒸馏和量化技术,用户可选择部署更轻量化的版本。在一些资源受限的场景下,用户还可以直接通过 API 调用模型。这种灵活的部署方式,是 DeepSeek 能够快速渗透到千行百业的重要原因

更简单高效的方式是直接采买已经配置好的大模型一体机,让没有技术能力的团队都可以实现开机即用,同时一体机通过本地化部署实现数据不出域,避免云端传输风险,尤其适用于涉及敏感数据的政务、金融场景。据不完全统计,包括华为、联想等大企业在内,已有超过60家企业基于DeepSeek推出一体机。与此同时,相关数据显示, 截止2月21日,已有45%的央企完成了对DeepSeek模型的部署,而这其中不少企业都选择了一体机的方案,涉及能源、通信、汽车、金融、建筑等多个领域。

DeepSeek及其一体机的加速落地应用,已经把AI推向了一个全新的高度。模型能力跃升的背后,安全风险也逐步显现。企业在利用AI赋能业务的同时,必须直面一个关键问题:部署DeepSeek后,是否能应对随之而来的AI安全问题?

“内容安全是大模型特有的原生风险问题,也是当前最具挑战的领域”

“大模型安全需分层次看待。”梁堃指出,大模型的安全可分为三大类来理解:系统安全及次生灾害(传统服务器防护的延伸)、业务安全(大模型的原生内容风险)、衍生攻击(AI赋能的“犯罪升级”)

1. 系统安全及次生灾害这主要指的是大模型所部署的服务器或终端设备的网络安全。包括服务器操作系统漏洞、不安全的网络端口、恶意软件攻击等,尤其当越来越多的企业和机构开始部署DeepSeek等大模型,如果这些部署的环境存在安全漏洞,就可能成为黑客攻击的目标,进而引发大规模的网络攻击次生灾害。这类安全问题并不专属于大模型,而是任何IT系统部署的共性挑战。

对于“攻击AI引发的次生灾害”,梁堃认为本质是系统安全问题的延伸,但由于大模型的广泛部署而显得更加突出,大量企业私有化部署大模型时,忽视了服务器基础防护,导致算力盗用、服务中断等风险增加。这类问题虽不直接关联模型能力,却因大模型普及而成为新的安全洼地。

2. 业务安全‌:直接关联到大模型本身的安全问题。包括模型输出内容的准确性、避免幻觉问题(即模型输出不符合事实或逻辑的内容)、防止模型被恶意利用生成有害信息等。这类问题是大模型特有的,也是当前最复杂和最具挑战性的。

3. 衍生攻击:黑产利用大模型自动化生成钓鱼脚本、伪造图片音视频实施诈骗等新型犯罪手段,其规模化欺骗能力远超传统手段。

系统层面的安全问题,传统的安全厂商已有相对成熟的方案,而业务安全是大模型自身的独特风险,其内容生成的不可控性,让内容治理的挑战加剧。梁堃强调,“模型越强大,跟随指令的能力越强,但这也意味着恶意指令可能被高效执行,带来的内容风险也越大。”

“当大模型在各行业渗透越深,其输出的内容直接影响决策,一旦失控可能引发系统性社会风险。”

在大模型深度嵌入政务、金融、社交等场景的今天,内容安全已从技术问题上升为社会责任问题。其重要性体现在三方面:

1. 合规性要求:涉及政治、历史的提问必须准确回答(如“领土归属问题”),否则可能引发舆情风险。 

2. 用户体验保障简单拦截敏感词会损害交互流畅性,需通过语义深度理解实现精准引导(如自杀倾向提问需正向积极引导,自动回复心理援助信息)。  

3. 社会影响控制:大模型若系统性输出偏见内容(如性别歧视),将加剧社会认知偏差,影响决策公平性。在教育、医疗、金融等专业领域,大模型输出的错误或误导性信息可能引发严重后果。

“当大模型在各行业渗透越深,其输出的内容直接影响决策,一旦失控可能引发系统性社会风险。”梁堃直言,内容安全是大模型商业化的核心门槛,目前仍面临诸多挑战:

1. 数据清洗与模型训练‌:尽管可以通过清洗训练数据和强化学习来减少模型输出有害内容的风险,但幻觉问题和遗忘问题仍然难以完全避免

2. 实时性与动态性‌:大模型的应用场景复杂多变,输出的内容需要实时且准确地满足用户需求。同时,随着时间和环境的变化,有害信息的定义也在不断演变,这对内容安全的实时性和动态性提出了更高要求

3. 跨领域与多样性‌:大模型的应用涉及多个领域和场景,每个领域都有其特定的敏感信息和风险点。如何针对不同领域和场景提供定制化的内容安全解决方案是一个巨大挑战。

这些挑战要求企业的内容安全方案必须兼具“实时性”与“智能化”,传统规则引擎或单一模型难以应对。

“内容安全不是‘一刀切’的过滤,而是对用户意图的深度解析与动态响应。”

面对大模型内容安全的挑战,数美科技推出了一系列创新解决方案:

AIGC内容安全产品‌:早在ChatGPT进入市场之初,数美科技基于近十年在内容安全领域的技术积淀,率先推出了针对AIGC场景的内容安全产品,主要通过SaaS服务的形式为AIGC行业提供内容安全服务。为大模型从数据清洗、用户输入到模型输出提供全流程的安全防护,确保输出内容的安全性和准确性。

DeepSeek一体机内容安全产品组件‌:随着DeepSeek一体机的出现,数美科技结合AIGC行业100+厂商的服务经验,推出DeepSeek一体机内容安全产品组件,提供实时的风险内容检测,将内容安全能力与硬件架构原生融合,为DeepSeek一体机构建内生式的防护系统。这也是行业内首个深度融合“端云协同+国产化全栈适配”的内容安全产品。

大模型在内容层面最大的难点不是安全问题,而是如何做好内容安全与用户体验的平衡?梁堃指出:“内容安全不是‘一刀切’的过滤,而是对用户意图的深度解析与动态响应。”

数美的内容安全产品中包含了多个针对不同安全风险的模型,如识别违法违纪意图的模型、识别歧视仇恨言论的模型等,并通过构建精细化的四级标签体系,深度理解用户意图与观点,实现对内容的精准分类与高效处理。

同时,在此基础上针对DeepSeek等大模型应用中最危险且最难处理的敏感问题场景,数美在内容安全产品中内置了强大的敏感问题代答知识库,通过300万组QA对的可信安全知识库和安全模型,对违禁意图、色情、涉政百科类等风险问题提供安全、准确、全面的代答,针对自杀自残等不良价值观倾向等问题给予正向积极的引导回答,降低大模型拒答率,并支持对风险问题进行正向引导与纠偏,实现从“安全围栏”到“正向引导”的人性化防护。

梁堃表示“AI安全是场没有终点的攻防战”。未来,随着DeepSeek等大模型在社会和商业决策中的作用日益增加,系统性的歧视和偏见等隐性风险对个人和社会可能产生的深远影响。数美科技将持续深耕大模型内容安全领域,为千行百业提供智能内生、实时防御的内容安全保障,让技术向善之力穿透风险迷雾,照亮可信AI的未来。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐