CyberSelf:实验室专属赛博师兄计划(2)——PRD文档
CyberSelf 赛博师兄 - 产品需求文档 (PRD)
文档版本: v1.0
创建日期: 2026-04-16
产品定位: 基于 Hermes Agent 的实验室专属智能助手系统
核心价值: 知识传承 · 24/7可用 · 零运行成本 · 数据安全
1. 产品概述
1.1 产品愿景
CyberSelf 赛博师兄是一个基于 Hermes Agent 框架和本地大模型的智能助手系统,旨在将实验室师兄的经验和知识数字化,为实验室成员提供全天候的科研指导、校园生活支持和实验室管理建议。
1.2 目标用户
- 主要用户: 实验室在读研究生(硕士/博士)
- 次要用户: 实验室导师、访问学者、本科实习生
- 使用场景: 科研咨询、校园办事、实验室规范查询
1.3 核心价值主张
| 价值点 | 说明 | 用户收益 |
|---|---|---|
| 知识传承 | 师兄经验数字化,形成可复用知识资产 | 新生快速融入,减少重复提问 |
| 24/7可用 | 全天候响应,不受时间地点限制 | 随时获取帮助,提高效率 |
| 零运行成本 | 本地大模型部署,无API费用 | 长期可持续使用 |
| 数据安全 | 内网部署,敏感信息不外泄 | 实验室数据安全可控 |
| 正向引导 | 传递积极价值观和实验室文化 | 营造良好科研氛围 |
2. 知识库架构设计
2.1 知识库结构
基于实验室实际需求,知识库分为三大维度:
knowledge_base/
├── research/ # 研究生生活维度
│ ├── papers/ # 实验室论文库
│ ├── patent/ # 实验专利文档
│ ├── competition/ # 竞赛项目资料
│ ├── software/ # 实验室软著材料
│ └── projects/ # 实验室项目文档
├── campus/ # 校园生活维度
│ ├── facilities/ # 设施指南(图书馆、食堂、体育馆等)
│ ├── procedures/ # 办事流程(选课、报销、请假等)
│ └── activities/ # 活动信息(讲座、社团、竞赛等)
└── lab/ # 实验室生活维度
├── manuscripts/ # 实验室手册(新生指南、设备使用等)
├── rules/ # 规章制度(考勤、安全、经费等)
└── management/ # 管理建议(时间管理、团队协作等)
2.2 知识内容规划
2.2.1 研究生生活维度 (research/)
papers/ - 实验室论文库
- 已发表论文全文及解读
- 论文写作模板和范例
- 投稿经验和审稿意见处理
- 文献管理工具使用指南
patent/ - 实验专利
- 专利申请流程和模板
- 已授权专利文档
- 专利撰写技巧和注意事项
- 专利检索方法
competition/ - 竞赛项目
- 历年参赛项目总结
- 竞赛准备经验分享
- 获奖作品展示和分析
- 竞赛资源和时间节点
software/ - 实验室软著
- 软件著作权申请流程
- 代码规范和文档要求
- 已登记软著清单
- 软著材料准备指南
projects/ - 实验室项目
- 在研项目介绍和进展
- 项目申报书范例
- 项目管理经验
- 结题报告模板
2.2.2 校园生活维度 (campus/)
facilities/ - 设施指南
- 图书馆资源和使用方法
- 食堂分布和推荐菜品
- 体育设施预约流程
- 打印店、快递点等生活服务
procedures/ - 办事流程
- 选课系统使用指南
- 报销流程和注意事项
- 请假审批流程
- 宿舍维修申请
- 校园卡充值和挂失
- 成绩查询和证明开具
activities/ - 活动信息
- 学术讲座信息汇总
- 社团活动推荐
- 学科竞赛通知
- 校园文化活动
- 志愿服务机会
2.2.3 实验室生活维度 (lab/)
manuscripts/ - 实验室手册
- 新生入学指南
- 实验室设备使用手册
- 常用软件安装和配置
- 服务器使用规范
- 实验室安全手册
- 应急处理流程
rules/ - 规章制度
- 考勤制度和请假规定
- 实验室安全规范
- 经费使用管理办法
- 设备借用和维护制度
- 会议制度(组会、进度汇报)
- 成果署名和知识产权规定
management/ - 管理建议
- 时间管理方法和工具
- 科研进度规划建议
- 团队协作技巧
- 导师沟通策略
- 压力管理和心理调适
- 工作生活平衡建议
3. 功能需求
3.1 核心功能
F1: 智能问答系统
功能描述: 基于知识库内容,回答用户关于科研、校园、实验室的各类问题。
需求优先级: P0(必须实现)
功能细节:
- 支持自然语言提问
- 基于向量检索匹配相关知识
- 回答附带知识来源引用
- 不确定时明确告知并建议咨询人工
- 支持多轮对话和上下文理解
验收标准:
- 知识库覆盖问题准确率 ≥ 85%
- 平均响应时间 < 3秒
- 回答附带可追溯的来源信息
F2: 知识库管理
功能描述: 支持知识的增删改查和版本管理。
需求优先级: P0(必须实现)
功能细节:
- 支持 Markdown 格式文档上传
- 自动提取文档元数据(标题、标签、创建时间)
- 支持文档分类和标签管理
- 支持文档版本历史记录
- 支持文档搜索和筛选
验收标准:
- 支持批量导入文档
- 文档更新后自动重建索引
- 支持按维度/子目录浏览知识
F3: 个性化推荐
功能描述: 根据用户角色和历史交互,主动推荐相关知识。
需求优先级: P1(重要)
功能细节:
- 新生入学时推送新生指南
- 根据时间节点推送相关提醒(选课、报销截止等)
- 根据用户提问历史推荐相关内容
- 支持用户订阅特定主题更新
验收标准:
- 推荐内容相关性 ≥ 70%
- 支持用户反馈推荐质量
F4: 多渠道接入
功能描述: 支持多种交互方式,方便不同场景使用。
需求优先级: P1(重要)
功能细节:
- CLI 命令行接口(开发调试)
- Web 界面(日常使用)
- API 接口(第三方集成)
- 微信/企业微信机器人(移动端)
验收标准:
- 至少实现 CLI 和 Web 两种接口
- 接口响应一致性
3.2 辅助功能
F5: 使用统计分析
功能描述: 记录和分析用户使用情况,优化知识库。
需求优先级: P2(可选)
功能细节:
- 记录高频问题
- 统计知识库覆盖率
- 分析用户满意度
- 生成使用报告
F6: 反馈收集机制
功能描述: 收集用户反馈,持续改进系统。
需求优先级: P1(重要)
功能细节:
- 回答后支持点赞/点踩
- 支持用户提交纠错
- 支持用户提交新问题建议
- 定期汇总反馈生成改进清单
4. 技术架构
4.1 整体架构
┌─────────────────────────────────────────┐
│ 用户交互层 │
│ CLI / Web UI / API / 微信机器人 │
└──────────────┬──────────────────────────┘
│
┌──────────────▼──────────────────────────┐
│ Hermes Agent 框架 │
│ - 对话管理 - 技能调度 - 记忆系统 │
│ - 工具集成 - 上下文管理 │
└──────────────┬──────────────────────────┘
│
┌──────────────▼──────────────────────────┐
│ 本地大模型推理服务 │
│ - Ollama / vLLM / LocalAI │
│ - 模型:Qwen2.5 / DeepSeek / GLM4 │
└──────────────┬──────────────────────────┘
│
┌──────────────▼──────────────────────────┐
│ 知识库 & 向量数据库 │
│ - 文档存储:knowledge_base/ │
│ - 向量索引:ChromaDB / Milvus │
│ - 元数据:SQLite / PostgreSQL │
└─────────────────────────────────────────┘
4.2 技术选型
| 组件 | 技术方案 | 理由 |
|---|---|---|
| Agent 框架 | Hermes Agent | 项目基础,成熟稳定 |
| 大模型 | Qwen2.5-14B / DeepSeek-V2-Lite | 中文能力强,本地部署 |
| 模型服务 | Ollama | 简单易用,OpenAI 兼容 |
| 向量数据库 | ChromaDB | 轻量级,易集成 |
| 文档存储 | 文件系统 + Git | 版本管理,易维护 |
| Web 框架 | FastAPI + Streamlit | 快速开发,易部署 |
| 前端 | React / Vue(可选) | 渐进式开发 |
4.3 部署方案
推荐配置:
- GPU: RTX 4090 (24GB) 或 RTX 3090 (24GB)
- CPU: 8核以上
- 内存: 32GB+
- 存储: 500GB SSD
部署方式:
- 开发环境: WSL + Ollama + Hermes CLI
- 生产环境: Docker 容器化部署
- 备份方案: 定期备份知识库和配置文件
5. 数据需求
5.1 初始数据准备
阶段一:核心知识(MVP)
- 实验室新生指南(10-15页)
- 常见问题 FAQ(50-100条)
- 实验室规章制度(5-10份文档)
- 校园办事流程(10-15个流程)
阶段二:扩展知识
- 实验室论文库(近3年论文)
- 专利和软著材料
- 竞赛项目总结
- 设备使用手册
阶段三:持续更新
- 用户反馈的新问题
- 实验室最新动态
- 校园政策更新
- 活动信息更新
5.2 数据格式规范
文档格式: Markdown (.md)
元数据标准:
---
title: 文档标题
category: research/campus/lab
subcategory: papers/facilities/manuscripts
tags: [标签1, 标签2]
author: 作者
created: 2026-04-16
updated: 2026-04-16
version: 1.0
---
文件命名规范:
- 使用英文或拼音
- 小写字母,单词间用连字符
- 示例:
new-student-guide.md,lab-safety-manual.md
6. 用户体验设计
6.1 交互流程
典型场景1:新生咨询
用户: 我是新生,怎么选课?
赛博师兄:
你好!选课流程如下:
1. 登录教务系统(链接:xxx)
2. 在"选课管理"模块选择课程
3. 注意选课时间:第1-2周
4. 建议优先选择必修课
详细指南请查看:[选课完整指南](campus/procedures/course-selection.md)
需要我详细解释某个步骤吗?
典型场景2:科研咨询
用户: 怎么写论文的相关工作部分?
赛博师兄:
相关工作(Related Work)部分的写作要点:
1. **结构建议**:
- 按主题分类,不是简单罗列
- 每个主题3-5篇代表性工作
- 突出与本文的区别和联系
2. **写作技巧**:
- 客观评述,避免贬低他人工作
- 指出现有方法的局限性
- 说明本文的创新点
3. **参考范例**:
实验室论文《xxx》的相关工作部分写得很好,可以参考。
[查看论文](research/papers/xxx.pdf)
需要我提供具体的写作模板吗?
6.2 界面设计原则
- 简洁明了: 避免复杂操作,一键直达
- 信息层次: 重要信息突出显示
- 响应及时: 显示"正在思考"状态
- 来源可追溯: 回答附带知识来源链接
- 移动友好: 支持手机端访问
7. 实施计划
7.1 开发阶段
Phase 1: MVP(最小可行产品)- 4周
目标: 实现核心问答功能,验证技术可行性
交付物:
- Hermes Agent 基础配置
- 本地大模型部署(Ollama + Qwen2.5-14B)
- 知识库目录结构创建
- 核心知识文档准备(50-100条FAQ)
- CLI 命令行交互界面
- 基础问答功能
验收标准:
- 能够回答知识库内的问题
- 准确率 ≥ 80%
- 响应时间 < 5秒
Phase 2: 功能完善 - 6周
目标: 完善知识库,优化用户体验
交付物:
- 知识库扩充至200+条目
- Web 界面开发
- 多轮对话支持
- 知识来源引用功能
- 反馈收集机制
- 使用统计功能
验收标准:
- 知识库覆盖主要场景
- Web 界面可用
- 支持多轮对话
Phase 3: 优化迭代 - 持续
目标: 根据用户反馈持续优化
交付物:
- 个性化推荐功能
- 微信机器人接入
- 知识库持续更新
- 性能优化
- 用户手册和文档
7.2 里程碑
| 时间节点 | 里程碑 | 关键指标 |
|---|---|---|
| Week 4 | MVP 上线 | 50+ FAQ,CLI 可用 |
| Week 10 | 功能完善 | 200+ 知识条目,Web 可用 |
| Week 16 | 正式发布 | 覆盖主要场景,用户满意度 ≥ 80% |
| 持续 | 迭代优化 | 知识库持续更新,功能持续完善 |
8. 成功指标
8.1 产品指标
| 指标 | 目标值 | 测量方法 |
|---|---|---|
| 知识库规模 | 300+ 条目 | 文档数量统计 |
| 问答准确率 | ≥ 85% | 人工评测 + 用户反馈 |
| 响应时间 | < 3秒 | 系统日志统计 |
| 用户满意度 | ≥ 80% | 问卷调查 |
| 日活跃用户 | ≥ 10人 | 访问日志统计 |
| 问题覆盖率 | ≥ 70% | 能回答的问题 / 总提问数 |
8.2 业务指标
| 指标 | 目标值 | 测量方法 |
|---|---|---|
| 减少重复咨询 | 50% | 对比使用前后咨询量 |
| 新生融入时间 | 缩短30% | 新生问卷调查 |
| 知识查询效率 | 提升50% | 对比查找时间 |
| 实验室文化认同 | ≥ 85% | 文化认同度问卷 |
9. 风险与应对
9.1 技术风险
| 风险 | 影响 | 概率 | 应对措施 |
|---|---|---|---|
| 模型性能不足 | 回答质量差 | 中 | 测试多个模型,选择最优方案 |
| 硬件资源不足 | 响应慢 | 低 | 优化模型参数,考虑量化 |
| 知识库检索不准 | 答非所问 | 中 | 优化向量检索策略,增加关键词匹配 |
9.2 运营风险
| 风险 | 影响 | 概率 | 应对措施 |
|---|---|---|---|
| 知识库更新不及时 | 信息过时 | 高 | 建立定期更新机制,指定维护人员 |
| 用户使用率低 | 项目失败 | 中 | 加强宣传,收集反馈改进 |
| 回答错误误导用户 | 信任度下降 | 中 | 回答附带免责声明,建议核实 |
9.3 数据风险
| 风险 | 影响 | 概率 | 应对措施 |
|---|---|---|---|
| 敏感信息泄露 | 隐私问题 | 低 | 内网部署,访问控制 |
| 知识库数据丢失 | 服务中断 | 低 | 定期备份,版本管理 |
更多推荐


所有评论(0)