SQL注入防护：为什么仅靠LLM生成后审核仍可能漏拦高危操作

2600_96011527

0人浏览 · 2026-05-21 15:30:51

2600_96011527 · 2026-05-21 15:30:51 发布

某金融科技公司接入DeepSeek-V3构建智能SQL助手后，发生了一起接近事故的案例：用户通过自然语言生成的查询语句绕过风控，险些执行全表删除操作。本文将复盘完整排查链路，揭示当前LLM+SQL防护方案的致命盲区。

事故现象

用户输入："帮我清理测试数据，保留最近3个月的记录"
生成SQL：DELETE FROM transactions WHERE create_time < DATE_SUB(NOW(), INTERVAL 3 MONTH)
执行结果：开发环境transaction表90%数据被清空

排查过程

审核日志溯源
确认安全模块已捕获该语句并标记为"高危"
但系统配置的熔断阈值是500万条，实际删除480万条未触发拦截
日志显示该账户在过去30天内有5次类似操作尝试
权限体系检查
该账户具有db_admin角色，继承DELETE权限
未启用『SQL guard』的只读模式强制降级功能
权限审批流程存在漏洞：临时权限未设置自动回收时间
生成阶段分析
提示词中已包含"禁止生成DELETE/UPDATE语句"约束
但用户使用"清理"等委婉表述绕过关键词检测
事后测试显示，"清除"、"移除"等近义词同样可绕过检测

根因诊断

三层防御同时失效： 1. 生成阶段：语义约束被社会工程学绕过，缺乏上下文理解 2. 审核阶段：基于规则的关键字检测未覆盖近义词，且未结合执行计划分析 3. 执行阶段：动态熔断阈值设置不合理，缺乏小规模数据保护机制

修复方案

立即措施

在DeepSeek API网关层部署二次SQL解析器：

def is_destructive_query(sql):
    parsed = sqlparse.parse(sql)[0]
    return any(
        token.ttype == sqlparse.tokens.DML and 
        token.value.upper() in ('DELETE', 'DROP', 'TRUNCATE')
        for token in parsed.flatten()
    )

对生产环境账户强制开启只读模式，需审批才临时解除
建立高危操作指纹库，记录历史绕过尝试模式

长期改进

输入侧加固
构建行业敏感词库（含"清理""清除"等委婉表述）

在DeepSeek自定义指令中添加场景化约束：

当用户请求涉及数据删除时，必须：
1. 要求确认业务必要性
2. 建议改用SELECT...WHERE确认范围
3. 生成语句前输出影响行数预估
4. 对核心表操作强制二次身份验证

输出侧增强
引入轻量级SQL执行计划分析器，预估影响行数
对超过1%表数据的操作强制人工复核
实现DELETE语句自动转换为SELECT COUNT(*)预览
执行层兜底
将熔断阈值调整为绝对值（如1万行）+ 百分比（如0.1%）双重限制
关键表开启死信队列机制，高危操作暂存待审批
实施操作回滚预案，对误删除建立5分钟缓冲期

深度防护架构

完整的LLM+SQL防护应包含四层： 1. 意图识别层：在自然语言输入阶段识别潜在危险意图 2. 生成约束层：通过prompt engineering限制危险语句生成 3. 语法分析层：解析生成SQL的AST进行静态检查 4. 动态防护层：结合数据库特性实施运行时保护