CyberSelf 赛博师兄 - 产品需求文档 (PRD)

文档版本: v1.0
创建日期: 2026-04-16
产品定位: 基于 Hermes Agent 的实验室专属智能助手系统
核心价值: 知识传承 · 24/7可用 · 零运行成本 · 数据安全


1. 产品概述

1.1 产品愿景

CyberSelf 赛博师兄是一个基于 Hermes Agent 框架和本地大模型的智能助手系统,旨在将实验室师兄的经验和知识数字化,为实验室成员提供全天候的科研指导、校园生活支持和实验室管理建议。

1.2 目标用户

  • 主要用户: 实验室在读研究生(硕士/博士)
  • 次要用户: 实验室导师、访问学者、本科实习生
  • 使用场景: 科研咨询、校园办事、实验室规范查询

1.3 核心价值主张

价值点 说明 用户收益
知识传承 师兄经验数字化,形成可复用知识资产 新生快速融入,减少重复提问
24/7可用 全天候响应,不受时间地点限制 随时获取帮助,提高效率
零运行成本 本地大模型部署,无API费用 长期可持续使用
数据安全 内网部署,敏感信息不外泄 实验室数据安全可控
正向引导 传递积极价值观和实验室文化 营造良好科研氛围

2. 知识库架构设计

2.1 知识库结构

基于实验室实际需求,知识库分为三大维度:

knowledge_base/
├── research/           # 研究生生活维度
│   ├── papers/        # 实验室论文库
│   ├── patent/        # 实验专利文档
│   ├── competition/   # 竞赛项目资料
│   ├── software/      # 实验室软著材料
│   └── projects/      # 实验室项目文档
├── campus/            # 校园生活维度
│   ├── facilities/    # 设施指南(图书馆、食堂、体育馆等)
│   ├── procedures/    # 办事流程(选课、报销、请假等)
│   └── activities/    # 活动信息(讲座、社团、竞赛等)
└── lab/               # 实验室生活维度
    ├── manuscripts/   # 实验室手册(新生指南、设备使用等)
    ├── rules/         # 规章制度(考勤、安全、经费等)
    └── management/    # 管理建议(时间管理、团队协作等)

2.2 知识内容规划

2.2.1 研究生生活维度 (research/)

papers/ - 实验室论文库

  • 已发表论文全文及解读
  • 论文写作模板和范例
  • 投稿经验和审稿意见处理
  • 文献管理工具使用指南

patent/ - 实验专利

  • 专利申请流程和模板
  • 已授权专利文档
  • 专利撰写技巧和注意事项
  • 专利检索方法

competition/ - 竞赛项目

  • 历年参赛项目总结
  • 竞赛准备经验分享
  • 获奖作品展示和分析
  • 竞赛资源和时间节点

software/ - 实验室软著

  • 软件著作权申请流程
  • 代码规范和文档要求
  • 已登记软著清单
  • 软著材料准备指南

projects/ - 实验室项目

  • 在研项目介绍和进展
  • 项目申报书范例
  • 项目管理经验
  • 结题报告模板
2.2.2 校园生活维度 (campus/)

facilities/ - 设施指南

  • 图书馆资源和使用方法
  • 食堂分布和推荐菜品
  • 体育设施预约流程
  • 打印店、快递点等生活服务

procedures/ - 办事流程

  • 选课系统使用指南
  • 报销流程和注意事项
  • 请假审批流程
  • 宿舍维修申请
  • 校园卡充值和挂失
  • 成绩查询和证明开具

activities/ - 活动信息

  • 学术讲座信息汇总
  • 社团活动推荐
  • 学科竞赛通知
  • 校园文化活动
  • 志愿服务机会
2.2.3 实验室生活维度 (lab/)

manuscripts/ - 实验室手册

  • 新生入学指南
  • 实验室设备使用手册
  • 常用软件安装和配置
  • 服务器使用规范
  • 实验室安全手册
  • 应急处理流程

rules/ - 规章制度

  • 考勤制度和请假规定
  • 实验室安全规范
  • 经费使用管理办法
  • 设备借用和维护制度
  • 会议制度(组会、进度汇报)
  • 成果署名和知识产权规定

management/ - 管理建议

  • 时间管理方法和工具
  • 科研进度规划建议
  • 团队协作技巧
  • 导师沟通策略
  • 压力管理和心理调适
  • 工作生活平衡建议

3. 功能需求

3.1 核心功能

F1: 智能问答系统

功能描述: 基于知识库内容,回答用户关于科研、校园、实验室的各类问题。

需求优先级: P0(必须实现)

功能细节:

  • 支持自然语言提问
  • 基于向量检索匹配相关知识
  • 回答附带知识来源引用
  • 不确定时明确告知并建议咨询人工
  • 支持多轮对话和上下文理解

验收标准:

  • 知识库覆盖问题准确率 ≥ 85%
  • 平均响应时间 < 3秒
  • 回答附带可追溯的来源信息
F2: 知识库管理

功能描述: 支持知识的增删改查和版本管理。

需求优先级: P0(必须实现)

功能细节:

  • 支持 Markdown 格式文档上传
  • 自动提取文档元数据(标题、标签、创建时间)
  • 支持文档分类和标签管理
  • 支持文档版本历史记录
  • 支持文档搜索和筛选

验收标准:

  • 支持批量导入文档
  • 文档更新后自动重建索引
  • 支持按维度/子目录浏览知识
F3: 个性化推荐

功能描述: 根据用户角色和历史交互,主动推荐相关知识。

需求优先级: P1(重要)

功能细节:

  • 新生入学时推送新生指南
  • 根据时间节点推送相关提醒(选课、报销截止等)
  • 根据用户提问历史推荐相关内容
  • 支持用户订阅特定主题更新

验收标准:

  • 推荐内容相关性 ≥ 70%
  • 支持用户反馈推荐质量
F4: 多渠道接入

功能描述: 支持多种交互方式,方便不同场景使用。

需求优先级: P1(重要)

功能细节:

  • CLI 命令行接口(开发调试)
  • Web 界面(日常使用)
  • API 接口(第三方集成)
  • 微信/企业微信机器人(移动端)

验收标准:

  • 至少实现 CLI 和 Web 两种接口
  • 接口响应一致性

3.2 辅助功能

F5: 使用统计分析

功能描述: 记录和分析用户使用情况,优化知识库。

需求优先级: P2(可选)

功能细节:

  • 记录高频问题
  • 统计知识库覆盖率
  • 分析用户满意度
  • 生成使用报告
F6: 反馈收集机制

功能描述: 收集用户反馈,持续改进系统。

需求优先级: P1(重要)

功能细节:

  • 回答后支持点赞/点踩
  • 支持用户提交纠错
  • 支持用户提交新问题建议
  • 定期汇总反馈生成改进清单

4. 技术架构

4.1 整体架构

┌─────────────────────────────────────────┐
│         用户交互层                       │
│  CLI / Web UI / API / 微信机器人         │
└──────────────┬──────────────────────────┘
               │
┌──────────────▼──────────────────────────┐
│         Hermes Agent 框架               │
│  - 对话管理  - 技能调度  - 记忆系统    │
│  - 工具集成  - 上下文管理               │
└──────────────┬──────────────────────────┘
               │
┌──────────────▼──────────────────────────┐
│      本地大模型推理服务                  │
│  - Ollama / vLLM / LocalAI              │
│  - 模型:Qwen2.5 / DeepSeek / GLM4      │
└──────────────┬──────────────────────────┘
               │
┌──────────────▼──────────────────────────┐
│         知识库 & 向量数据库              │
│  - 文档存储:knowledge_base/            │
│  - 向量索引:ChromaDB / Milvus          │
│  - 元数据:SQLite / PostgreSQL          │
└─────────────────────────────────────────┘

4.2 技术选型

组件 技术方案 理由
Agent 框架 Hermes Agent 项目基础,成熟稳定
大模型 Qwen2.5-14B / DeepSeek-V2-Lite 中文能力强,本地部署
模型服务 Ollama 简单易用,OpenAI 兼容
向量数据库 ChromaDB 轻量级,易集成
文档存储 文件系统 + Git 版本管理,易维护
Web 框架 FastAPI + Streamlit 快速开发,易部署
前端 React / Vue(可选) 渐进式开发

4.3 部署方案

推荐配置:

  • GPU: RTX 4090 (24GB) 或 RTX 3090 (24GB)
  • CPU: 8核以上
  • 内存: 32GB+
  • 存储: 500GB SSD

部署方式:

  1. 开发环境: WSL + Ollama + Hermes CLI
  2. 生产环境: Docker 容器化部署
  3. 备份方案: 定期备份知识库和配置文件

5. 数据需求

5.1 初始数据准备

阶段一:核心知识(MVP)
  • 实验室新生指南(10-15页)
  • 常见问题 FAQ(50-100条)
  • 实验室规章制度(5-10份文档)
  • 校园办事流程(10-15个流程)
阶段二:扩展知识
  • 实验室论文库(近3年论文)
  • 专利和软著材料
  • 竞赛项目总结
  • 设备使用手册
阶段三:持续更新
  • 用户反馈的新问题
  • 实验室最新动态
  • 校园政策更新
  • 活动信息更新

5.2 数据格式规范

文档格式: Markdown (.md)

元数据标准:

---
title: 文档标题
category: research/campus/lab
subcategory: papers/facilities/manuscripts
tags: [标签1, 标签2]
author: 作者
created: 2026-04-16
updated: 2026-04-16
version: 1.0
---

文件命名规范:

  • 使用英文或拼音
  • 小写字母,单词间用连字符
  • 示例: new-student-guide.md, lab-safety-manual.md

6. 用户体验设计

6.1 交互流程

典型场景1:新生咨询
用户: 我是新生,怎么选课?
赛博师兄:
你好!选课流程如下:
1. 登录教务系统(链接:xxx)
2. 在"选课管理"模块选择课程
3. 注意选课时间:第1-2周
4. 建议优先选择必修课

详细指南请查看:[选课完整指南](campus/procedures/course-selection.md)

需要我详细解释某个步骤吗?
典型场景2:科研咨询
用户: 怎么写论文的相关工作部分?
赛博师兄:
相关工作(Related Work)部分的写作要点:

1. **结构建议**:
   - 按主题分类,不是简单罗列
   - 每个主题3-5篇代表性工作
   - 突出与本文的区别和联系

2. **写作技巧**:
   - 客观评述,避免贬低他人工作
   - 指出现有方法的局限性
   - 说明本文的创新点

3. **参考范例**:
   实验室论文《xxx》的相关工作部分写得很好,可以参考。
   [查看论文](research/papers/xxx.pdf)

需要我提供具体的写作模板吗?

6.2 界面设计原则

  • 简洁明了: 避免复杂操作,一键直达
  • 信息层次: 重要信息突出显示
  • 响应及时: 显示"正在思考"状态
  • 来源可追溯: 回答附带知识来源链接
  • 移动友好: 支持手机端访问

7. 实施计划

7.1 开发阶段

Phase 1: MVP(最小可行产品)- 4周

目标: 实现核心问答功能,验证技术可行性

交付物:

  • Hermes Agent 基础配置
  • 本地大模型部署(Ollama + Qwen2.5-14B)
  • 知识库目录结构创建
  • 核心知识文档准备(50-100条FAQ)
  • CLI 命令行交互界面
  • 基础问答功能

验收标准:

  • 能够回答知识库内的问题
  • 准确率 ≥ 80%
  • 响应时间 < 5秒
Phase 2: 功能完善 - 6周

目标: 完善知识库,优化用户体验

交付物:

  • 知识库扩充至200+条目
  • Web 界面开发
  • 多轮对话支持
  • 知识来源引用功能
  • 反馈收集机制
  • 使用统计功能

验收标准:

  • 知识库覆盖主要场景
  • Web 界面可用
  • 支持多轮对话
Phase 3: 优化迭代 - 持续

目标: 根据用户反馈持续优化

交付物:

  • 个性化推荐功能
  • 微信机器人接入
  • 知识库持续更新
  • 性能优化
  • 用户手册和文档

7.2 里程碑

时间节点 里程碑 关键指标
Week 4 MVP 上线 50+ FAQ,CLI 可用
Week 10 功能完善 200+ 知识条目,Web 可用
Week 16 正式发布 覆盖主要场景,用户满意度 ≥ 80%
持续 迭代优化 知识库持续更新,功能持续完善

8. 成功指标

8.1 产品指标

指标 目标值 测量方法
知识库规模 300+ 条目 文档数量统计
问答准确率 ≥ 85% 人工评测 + 用户反馈
响应时间 < 3秒 系统日志统计
用户满意度 ≥ 80% 问卷调查
日活跃用户 ≥ 10人 访问日志统计
问题覆盖率 ≥ 70% 能回答的问题 / 总提问数

8.2 业务指标

指标 目标值 测量方法
减少重复咨询 50% 对比使用前后咨询量
新生融入时间 缩短30% 新生问卷调查
知识查询效率 提升50% 对比查找时间
实验室文化认同 ≥ 85% 文化认同度问卷

9. 风险与应对

9.1 技术风险

风险 影响 概率 应对措施
模型性能不足 回答质量差 测试多个模型,选择最优方案
硬件资源不足 响应慢 优化模型参数,考虑量化
知识库检索不准 答非所问 优化向量检索策略,增加关键词匹配

9.2 运营风险

风险 影响 概率 应对措施
知识库更新不及时 信息过时 建立定期更新机制,指定维护人员
用户使用率低 项目失败 加强宣传,收集反馈改进
回答错误误导用户 信任度下降 回答附带免责声明,建议核实

9.3 数据风险

风险 影响 概率 应对措施
敏感信息泄露 隐私问题 内网部署,访问控制
知识库数据丢失 服务中断 定期备份,版本管理

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐