OpenClaw办公自动化:千问3.5-35B-A3B-FP8处理会议录音转纪要
本文介绍了如何在星图GPU平台上自动化部署千问3.5-35B-A3B-FP8镜像,实现会议录音智能转写与纪要生成。该方案通过AI模型自动提取会议关键结论并生成待办事项,特别适用于技术评审、跨时区会议等场景,将原本3-4小时的人工处理流程缩短至5分钟内完成。
OpenClaw办公自动化:千问3.5-35B-A3B-FP8处理会议录音转纪要
1. 为什么选择OpenClaw处理会议纪要
每次开完会最痛苦的事情是什么?对我来说就是整理会议纪要。上周三的部门例会结束后,我盯着手机里1小时12分钟的录音文件发呆——手动转写需要至少2小时,提取关键结论又要1小时,最后整理待办事项还得半小时。这种重复劳动让我开始寻找自动化解决方案。
尝试过几款SaaS工具后,发现三个痛点:一是隐私问题,敏感会议录音上传到第三方服务器总让人不放心;二是定制化差,标准化模板无法匹配我们团队的特殊需求;三是流程割裂,转文字、提取结论、生成待办需要切换三个平台操作。直到发现OpenClaw+千问3.5的组合,才真正实现"录音进,纪要出"的一站式处理。
2. 环境准备与模型部署
2.1 本地部署OpenClaw
在MacBook Pro上安装OpenClaw比预想的简单。官方一键脚本自动处理了90%的依赖问题:
curl -fsSL https://openclaw.ai/install.sh | bash
openclaw onboard --install-daemon
配置向导选择Advanced模式时,遇到第一个坑:系统提示需要Node.js 18+,而我本机是16.x。用nvm install 18切换版本后重试顺利通过。建议在安装前先运行node -v检查版本。
2.2 接入千问3.5-35B-A3B-FP8模型
关键步骤是在~/.openclaw/openclaw.json配置模型端点。由于公司内网已部署千问3.5镜像,我的配置如下:
{
"models": {
"providers": {
"qwen-local": {
"baseUrl": "http://192.168.1.100:8080/v1",
"apiKey": "internal-use-only",
"api": "openai-completions",
"models": [
{
"id": "qwen3.5-35b-a3b-fp8",
"name": "千问多模态版",
"contextWindow": 32768,
"maxTokens": 8192
}
]
}
}
}
}
这里有个细节要注意:如果模型服务启用了API密钥验证,需要确保apiKey字段值与服务端一致。我们最初因为两端密钥不匹配,导致一直返回403错误。
3. 会议纪要自动化全流程搭建
3.1 音频处理技能安装
OpenClaw本身不包含音频处理模块,需要安装社区技能:
clawhub install audio-processor meeting-minutes
这个audio-processor技能包实际上调用了本地的ffmpeg进行音频预处理。我在测试时发现,如果系统没有安装ffmpeg,会静默失败。建议先用brew install ffmpeg确保依赖就位。
3.2 飞书集成配置
为了让生成的待办事项直接同步到日历,需要配置飞书通道。这个过程最耗时的是获取企业自建应用的App Secret——需要在飞书开放平台提交审核材料。我们的审批用了2个工作日,建议提前准备。
配置成功后,飞书消息可以直接触发OpenClaw任务。例如发送"处理今天10点的会议录音",系统就会自动定位最新录音文件开始处理。
4. 实战:一小时会议五分钟出纪要
上周五的产品评审会成了最佳测试案例。以下是完整的自动化处理流程:
-
录音转写
OpenClaw监测到会议结束(通过日历事件状态变化触发),自动将m4a文件分割为每5分钟一个片段。这里采用分段处理是为了避免长音频转录时丢失上下文。千问3.5的语音识别准确率约92%,比我们之前用的商业API高3个百分点。 -
关键结论提取
模型会分析转写文本,识别出"决策点"(如"确定采用方案B")和"待跟进"(如"John需要在下周三前提交原型图")。这里有个实用技巧:在技能配置里添加团队术语表,能显著提升识别准确率。比如我们把"鲁棒性"加入术语表后,模型就不再错误转写为"路棒性"。 -
待办事项生成
系统自动关联责任人飞书账号,生成如下结构化数据:- [ ] @李四 调研竞品定价策略(优先级:高,截止:2024-03-15) - [ ] @王五 更新用户画像模板(优先级:中,截止:2024-03-18) -
日历同步
通过飞书接口自动创建带提醒的日历事件。这里我们踩过一个坑:初始实现时没有检查日历冲突,导致重复创建。后来在技能里增加了check_conflict预处理步骤。
从录音文件到飞书日历同步完成,实际耗时4分38秒。相比之下,人工处理平均需要3-4小时。更重要的是,自动化流程不会漏记关键结论——上周人工整理的纪要漏掉了2个重要待办事项。
5. 效果优化与注意事项
经过两周的调优,总结出几个提升效果的关键点:
音频质量方面
- 使用外置麦克风录音,将语音识别错误率降低40%
- 避免多人同时发言,模型对重叠语音的处理仍不理想
- 会前收集专业术语表导入系统,提升领域词汇识别率
模型参数方面
- 将
temperature设为0.3,平衡创造性和稳定性 - 设置
maxTokens=1500确保完整输出,避免截断 - 启用
json_mode获取结构化输出,方便后续处理
系统安全方面
- 录音文件存储在加密的NAS目录,OpenClaw只有读取权限
- 飞书API调用采用最小权限原则
- 定期清理临时转写文本
最大的惊喜是千问3.5的多模态能力——有次会议包含了白板照片,模型竟然正确识别了手写公式并将其转为Latex格式插入纪要。这种能力在技术讨论场景特别有用。
6. 更适合哪些场景
这个方案特别适合以下会议类型:
- 每日站会(规律性强、议程固定)
- 技术评审(术语多、需要精确记录)
- 跨时区会议(录音时差处理方便)
但对于头脑风暴类会议,自动化纪要会丢失很多非结构化信息。我们现在的做法是:先用自动化处理基础纪要,再由人工补充创意部分。这种"人机协作"模式效率最高。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。
更多推荐


所有评论(0)