OpenClaw办公自动化:千问3.5-35B-A3B-FP8处理会议录音转纪要

1. 为什么选择OpenClaw处理会议纪要

每次开完会最痛苦的事情是什么?对我来说就是整理会议纪要。上周三的部门例会结束后,我盯着手机里1小时12分钟的录音文件发呆——手动转写需要至少2小时,提取关键结论又要1小时,最后整理待办事项还得半小时。这种重复劳动让我开始寻找自动化解决方案。

尝试过几款SaaS工具后,发现三个痛点:一是隐私问题,敏感会议录音上传到第三方服务器总让人不放心;二是定制化差,标准化模板无法匹配我们团队的特殊需求;三是流程割裂,转文字、提取结论、生成待办需要切换三个平台操作。直到发现OpenClaw+千问3.5的组合,才真正实现"录音进,纪要出"的一站式处理。

2. 环境准备与模型部署

2.1 本地部署OpenClaw

在MacBook Pro上安装OpenClaw比预想的简单。官方一键脚本自动处理了90%的依赖问题:

curl -fsSL https://openclaw.ai/install.sh | bash
openclaw onboard --install-daemon

配置向导选择Advanced模式时,遇到第一个坑:系统提示需要Node.js 18+,而我本机是16.x。用nvm install 18切换版本后重试顺利通过。建议在安装前先运行node -v检查版本。

2.2 接入千问3.5-35B-A3B-FP8模型

关键步骤是在~/.openclaw/openclaw.json配置模型端点。由于公司内网已部署千问3.5镜像,我的配置如下:

{
  "models": {
    "providers": {
      "qwen-local": {
        "baseUrl": "http://192.168.1.100:8080/v1",
        "apiKey": "internal-use-only",
        "api": "openai-completions",
        "models": [
          {
            "id": "qwen3.5-35b-a3b-fp8",
            "name": "千问多模态版",
            "contextWindow": 32768,
            "maxTokens": 8192
          }
        ]
      }
    }
  }
}

这里有个细节要注意:如果模型服务启用了API密钥验证,需要确保apiKey字段值与服务端一致。我们最初因为两端密钥不匹配,导致一直返回403错误。

3. 会议纪要自动化全流程搭建

3.1 音频处理技能安装

OpenClaw本身不包含音频处理模块,需要安装社区技能:

clawhub install audio-processor meeting-minutes

这个audio-processor技能包实际上调用了本地的ffmpeg进行音频预处理。我在测试时发现,如果系统没有安装ffmpeg,会静默失败。建议先用brew install ffmpeg确保依赖就位。

3.2 飞书集成配置

为了让生成的待办事项直接同步到日历,需要配置飞书通道。这个过程最耗时的是获取企业自建应用的App Secret——需要在飞书开放平台提交审核材料。我们的审批用了2个工作日,建议提前准备。

配置成功后,飞书消息可以直接触发OpenClaw任务。例如发送"处理今天10点的会议录音",系统就会自动定位最新录音文件开始处理。

4. 实战:一小时会议五分钟出纪要

上周五的产品评审会成了最佳测试案例。以下是完整的自动化处理流程:

  1. 录音转写
    OpenClaw监测到会议结束(通过日历事件状态变化触发),自动将m4a文件分割为每5分钟一个片段。这里采用分段处理是为了避免长音频转录时丢失上下文。千问3.5的语音识别准确率约92%,比我们之前用的商业API高3个百分点。

  2. 关键结论提取
    模型会分析转写文本,识别出"决策点"(如"确定采用方案B")和"待跟进"(如"John需要在下周三前提交原型图")。这里有个实用技巧:在技能配置里添加团队术语表,能显著提升识别准确率。比如我们把"鲁棒性"加入术语表后,模型就不再错误转写为"路棒性"。

  3. 待办事项生成
    系统自动关联责任人飞书账号,生成如下结构化数据:

    - [ ] @李四 调研竞品定价策略(优先级:高,截止:2024-03-15)
    - [ ] @王五 更新用户画像模板(优先级:中,截止:2024-03-18)
    
  4. 日历同步
    通过飞书接口自动创建带提醒的日历事件。这里我们踩过一个坑:初始实现时没有检查日历冲突,导致重复创建。后来在技能里增加了check_conflict预处理步骤。

从录音文件到飞书日历同步完成,实际耗时4分38秒。相比之下,人工处理平均需要3-4小时。更重要的是,自动化流程不会漏记关键结论——上周人工整理的纪要漏掉了2个重要待办事项。

5. 效果优化与注意事项

经过两周的调优,总结出几个提升效果的关键点:

音频质量方面

  • 使用外置麦克风录音,将语音识别错误率降低40%
  • 避免多人同时发言,模型对重叠语音的处理仍不理想
  • 会前收集专业术语表导入系统,提升领域词汇识别率

模型参数方面

  • temperature设为0.3,平衡创造性和稳定性
  • 设置maxTokens=1500确保完整输出,避免截断
  • 启用json_mode获取结构化输出,方便后续处理

系统安全方面

  • 录音文件存储在加密的NAS目录,OpenClaw只有读取权限
  • 飞书API调用采用最小权限原则
  • 定期清理临时转写文本

最大的惊喜是千问3.5的多模态能力——有次会议包含了白板照片,模型竟然正确识别了手写公式并将其转为Latex格式插入纪要。这种能力在技术讨论场景特别有用。

6. 更适合哪些场景

这个方案特别适合以下会议类型:

  • 每日站会(规律性强、议程固定)
  • 技术评审(术语多、需要精确记录)
  • 跨时区会议(录音时差处理方便)

但对于头脑风暴类会议,自动化纪要会丢失很多非结构化信息。我们现在的做法是:先用自动化处理基础纪要,再由人工补充创意部分。这种"人机协作"模式效率最高。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐