OpenClaw+千问3.5-9B：学术论文阅读助手

本文介绍了如何在星图GPU平台上自动化部署千问3.5-9B镜像，构建学术论文阅读助手。该系统能自动处理PDF文献，生成结构化笔记，帮助研究者高效筛选关键论文，节省70%的文献处理时间。典型应用场景包括每日自动抓取预印本论文并生成学术简报，特别适合需要跟踪跨领域研究进展的学者。

宋老师的博客

340人浏览 · 2026-04-06 04:28:37

宋老师的博客 · 2026-04-06 04:28:37 发布

OpenClaw+千问3.5-9B：学术论文阅读助手

1. 为什么需要自动化文献处理？

去年冬天，当我面对堆积如山的未读论文时，突然意识到传统阅读方式已经跟不上信息爆炸的速度。作为研究者，每天需要跟踪领域内最新进展，但手动下载、阅读、整理20篇论文至少需要6小时——这还不包括做笔记和关联分析的时间。

正是在这种困境下，我开始尝试用OpenClaw+千问3.5-9B搭建自动化文献处理系统。经过三个月的迭代，现在我的工作流变成：早晨喝咖啡时查看系统自动生成的文献简报，下午直接精读筛选后的3-4篇关键论文。这个转变让我节省了70%的文献处理时间，也意外发现了许多过去容易忽略的跨领域关联研究。

2. 系统架构与核心组件

2.1 技术选型思路

选择OpenClaw作为基础框架主要考虑三个因素：首先是本地化处理能力，我的研究数据涉及未公开实验数据，必须确保所有处理在本地完成；其次是可扩展性，OpenClaw的Skill机制可以灵活添加PDF解析、笔记生成等模块；最后是千问3.5-9B在学术文本理解上的突出表现，特别是在数学公式和专业术语的处理上明显优于通用模型。

整套系统运行在我的MacBook Pro（M1 Pro芯片，32GB内存）上，主要组件包括：

OpenClaw核心框架（v2.3.1）
千问3.5-9B本地模型（通过星图平台镜像部署）
自定义开发的PDF处理Skill
飞书机器人交互接口

2.2 关键配置细节

模型接入环节有个值得注意的坑：最初直接使用默认的API调用方式，发现处理长论文时经常超时。后来在openclaw.json中调整了以下参数才稳定运行：

{
  "models": {
    "providers": {
      "qwen-local": {
        "baseUrl": "http://localhost:5000/v1",
        "apiKey": "sk-xxxxxx",
        "api": "openai-completions",
        "models": [
          {
            "id": "qwen3-9b",
            "timeout": 600000,
            "temperature": 0.3
          }
        ]
      }
    }
  }
}

特别是timeout设置为10分钟（600000毫秒），这对处理50页以上的PDF至关重要。温度参数调到0.3后，生成的笔记也更具学术严谨性。

3. 自动化文献处理全流程

3.1 每日文献收集阶段

我设置了定时任务，每天凌晨3点自动执行以下流程：

通过RSS订阅抓取预印本平台（arXiv、bioRxiv）的新论文
根据关键词过滤无关内容
下载PDF到指定文件夹（按日期/领域分类）

这里遇到过一个典型问题：某些平台的PDF链接是动态生成的，直接用wget下载会失败。解决方案是在OpenClaw中配置了Puppeteer Skill，模拟浏览器行为获取真实下载链接。

3.2 核心处理环节

PDF解析采用组合策略：先用pdf2text提取纯文本，再用PyMuPDF获取结构化信息（章节标题、参考文献等）。这个环节最耗时的不是技术实现，而是处理各出版社千奇百怪的PDF格式——有些论文把文字存储为图片，有些表格排版错乱。最终我的解决方案是：

def hybrid_parse(pdf_path):
    # 优先尝试保留结构的解析
    try:
        doc = fitz.open(pdf_path)
        structured_text = ""
        for page in doc:
            structured_text += page.get_text("blocks")
        if len(structured_text) > 1000:
            return structured_text
    except:
        pass
    
    # 回退到普通文本提取
    return pdf2text(pdf_path)

3.3 智能笔记生成

千问3.5-9B的提示词设计经过多次迭代。最初简单的"总结这篇论文"会导致模型泛泛而谈，现在使用的多阶段提示模板效果更好：

你是一位专业的研究助手，请按以下步骤处理论文：
1. [识别] 用一句话说明论文解决的核心问题
2. [创新点] 列出不超过3个方法论或技术突破
3. [验证] 指出实验设计中最强的证据和最弱的环节
4. [关联] 推荐3篇相关研究（需来自不同团队）

论文内容：
{{PDF_TEXT}}

这种结构化输出极大提升了笔记的实用性。有个有趣的发现：当要求模型"指出弱点"时，它往往能发现审稿人可能忽略的方法论缺陷。

4. 实践中的挑战与解决方案

4.1 模型理解偏差问题

在早期测试中，模型有时会把论文中的"未来工作"章节误认为已实现成果。通过添加负面示例微调后有所改善，但更有效的方案是在提示词中明确要求：

特别注意：区分作者已经完成的工作和计划中的工作。
如果提到"未来将研究..."或"有待进一步探索..."，
必须在总结中明确标注为"未验证方向"。

4.2 文献关联推荐优化

最初的推荐结果总是偏向知名团队的高引论文，缺乏多样性。后来引入两个改进：

在OpenClaw中配置了本地Zotero数据库接口
添加推荐多样性约束：

def diversify_recommendations(papers):
    # 确保不超过一篇来自同一实验室
    lab_counts = {}
    final_selection = []
    for paper in papers:
        lab = extract_lab(paper['author'])
        if lab_counts.get(lab, 0) < 1:
            final_selection.append(paper)
            lab_counts[lab] = lab_counts.get(lab, 0) + 1
    return final_selection