Harness CLI 哪家强?社区有话说

引言

最近,Reddit r/ZaiGLM 社区的一个帖子引发了热议:《Best Harness》。一位用户发问:

“GLM 5.1 的最佳 CLI harness 是什么?我试过 claudecode 和 kilocode,还没用过 opencode。你们的体验如何?”

帖子获得了 11 个 upvote 和 25 条评论。社区成员纷纷分享自己的实战经验。这些真实的用户反馈,比任何官方评测都更有参考价值。

本文整理了社区的讨论精华,并加入技术分析,帮你选到适合自己的 harness。


热门 Harness 选手盘点

1️⃣ OpenCode:社区人气王

票数统计:至少 6 位用户直接推荐

核心评价

用户 评价
lalamax3d “Opencode”
Humble-Scale4941 “opencode”
Livelife_Aesthetic “Opencode for sure, those lads are pushing updates multiple times a day… pretty great now and only getting better”
OptimusTron222 “OpenCode is a beast! If not for account bans it would have even killed Claude Code”

亮点

  • 高频更新:用户特别提到"一天多次更新",活跃度极高
  • 持续改进:“只变得更好”
  • 功能强大:被称为"野兽级别"

潜在问题

  • 账户风险:有用户提到"account bans"问题
  • VSCode集成争议:一位用户批评"在VSCode终端运行时,不能识别打开的文件"

2️⃣ Pi Agent:低调的实力派

票数统计:2 位用户强烈推荐

用户 评价
LearnedByError “I’ve used Claude, opencode, kilocode and pi. Pi is by far the best
MSPlive “Hermes or pi agent”

亮点

  • 用户用了 Claude、OpenCode、Kilocode 之后,认为 Pi 是最好的
  • 跨平台对比:在多个 harness 中脱颖而出

需要关注

  • 讨论中没有详细说明 Pi 的具体优势
  • 有用户表示"听说很多好评,准备尝试"

3️⃣ Hermes Agent:值得尝试

票数统计:2 位用户提及

用户 评价
MSPlive “Hermes or pi agent”
stateq2 “Hermes Agent works best for me so far. I haven’t tried OpenCode yet.”

亮点

  • 有用户明确表示 Hermes 对他效果最好
  • 与 Pi Agent并列提及

4️⃣ Droid (Factory.ai):争议选手

票数统计:推荐3票,但有争议

用户 评价
Buff_Grad “Try Droid by Factory.ai. Consistently tops charts, is free and lets you use your own subs/api keys.”

争议点

另一位用户反驳:

“Not free? 402 Payment Required…”

Buff_Grad回应:

“It’s free lol. Read this Doc page: https://docs.factory.ai/cli/byok/overview”

技术细节

  • Droid 支持 BYOK (Bring Your Own Keys)
  • 有用户质疑需要订阅才能用自己的 API keys
  • 官方文档可能有免费方案

5️⃣ Claude Code:专业编码首选

票数统计:正反两极评价

用户 评价
Old_Stretch_3045 Claude Code VSCode extension is great for professional coding. Everything else I’ve tried feels like toys for landing pages…”
CharacterPerformer47 “Claude Code works well for my use case. I didn’t notice the ‘drifting from instructions’ you mention.”
United_Wind4815 “claude code + oh-my-claudecode (omc) is my best experience”

亮点

  • VSCode 扩展版本更适合专业编码工作
  • 可搭配 oh-my-claudecode 增强体验

原帖作者的痛点

“Claudecode is great most times but starts drifting from instructions

社区反馈:有用户没遇到这个问题,可能与使用场景有关。


6️⃣ Kilocode:已融入 OpenCode

重要更新:一位用户指出:

“kilocode is an opencode now btw”

这意味着 Kilocode 已经成为 OpenCode的一部分。

原帖作者体验

“Kilocode is amazing and tries to one-shot everything. It needs explicit instructions not to go in and implement during brainstorming.”

特点

  • 强执行力,倾向于"一次搞定"
  • 需要明确指令防止"过早动手"

7️⃣ Forge Code (.dev):潜力选手

票数统计:1票推荐

用户 评价
Practical-Bite6628 “forge code .dev Just use it last week, and won’t regret.”

关注点:有用户追问:

“How about its token use? Doesn’t it burn more tokens than opencode cli because forge uses subagents and complex planning and all that?”

潜在问题

  • 多 agent架构可能消耗更多 tokens
  • 复杂planning可能增加 overhead

技术分析:为什么 Harness 选择如此重要?

Harness = 模型的"驾驶舱"

模型本身是引擎,Harness 是驾驶舱。好的 Harness:

  • 让模型知道"什么时候该思考"
  • 控制推理深度(reasoning effort)
  • 管理 context window 使用
  • 协调工具调用节奏

差的 Harness:

  • 模型"过早动手"(Kilocode 的one-shot倾向)
  • 模型"偏离指令"(Claude Code 的drifting问题)
  • Context overflow 导致不稳定(GLM 5.1 的潜在问题)

关键参数对比

Harness 更新频率 Token效率 VSCode集成 BYOK支持
OpenCode ⭐⭐⭐⭐⭐ - 有争议
Pi Agent - - - -
Hermes - - - -
Droid - 有争议 ✓(免费?)
Claude Code - - ⭐⭐⭐⭐⭐
Forge - 有争议 - -

社区实战经验提炼

GLM 5.1 的使用建议

一位深度用户分享:

“I use 5.1 often in both Opencode and Openclaw. It has been running much better recently but there can be rate limit issues depending on your plan and time of day (especially during Asia peak hours).”

建议

  • 设置 5-turbo 作为 fallback
  • Context window 高时需要"guardrails"来控制
  • 最近两周稳定性明显改善

Token 消耗的隐性成本

关于 Forge 的讨论揭示了一个关键问题:

多 agent 架构可能"burn更多 tokens"

这与 Stanford 的"Swarm Tax"研究呼应——复杂架构不一定更好,可能只是在浪费算力。

在选择 Harness 时,要问:

  • 这个 harness 有多少 subagents?
  • Planning阶段消耗多少 tokens?
  • 有没有"thinking budget"控制?

Drifting vs One-shot:两种极端

问题 表现 解决方案
Drifting 模型偏离指令,自作主张 明确边界,分阶段任务
One-shot 模型急于执行,不先思考 要求先分析再动手

两种极端都需要更精细的 prompt engineering


如何选择适合你的 Harness?

决策 Checklist

[ ] 你的主要场景是什么?(专业编码 vs 快速原型)
[ ] 你需要 VSCode 集成吗?
[ ] 你有多 agent 架构需求吗?(关注 token 消耗)
[ ] 你是否需要 BYOK?(用自己的 API keys)
[ ] 更新频率对你重要吗?(OpenCode每天更新)
[ ] 你介意账户风险吗?(OpenCode 的 bans 问题)
[ ] Token 效率优先还是功能优先?

场景匹配建议

场景 推荐
专业编码(VSCode重度用户) Claude Code + oh-my-claudecode
快速迭代、实验性项目 OpenCode 或 Pi Agent
多平台灵活性 Hermes Agent
BYOK优先、不想付费 OpenCode 或 Droid(确认免费方案)
大型复杂任务(需多agent) Forge(但关注 token 消耗)
GLM 5.1 专属优化 OpenCode + 5-turbo fallback

总结:社区的智慧

Reddit讨论揭示了一个重要事实:

没有"最好的"harness,只有"最适合"的harness。

每个 harness 都有trade-offs:

  • OpenCode 活跃但可能有账户风险
  • Claude Code 专业但需要 VSCode环境
  • Pi Agent低调但实战口碑好
  • Droid 宣称免费但存在争议
  • Forge 强大但可能消耗更多 tokens

核心建议

  1. 先试 OpenCode:社区票数最高,更新最活跃
  2. 备选 Pi/Hermes:如果 OpenCode 不合适
  3. 专业场景用 Claude Code:VSCode深度集成是优势
  4. 警惕多 agent overhead:Forge 等方案可能增加 token 消耗
  5. 设置 fallback:GLM 5.1高峰期rate limit问题

附录:社区投票统计

Harness 推荐票数 核心优势 主要争议
OpenCode 6+ 高频更新、功能强大 账户风险、VSCode集成
Pi Agent 2 跨平台口碑好 信息较少
Hermes 2 稳定可靠 -
Droid 1 BYOK、榜单领先 免费争议
Claude Code 混合 VSCode专业集成 drifting问题
Forge 1 强执行力 token消耗疑问

参考来源


关键词:AI Harness, CLI工具, OpenCode, Claude Code, Pi Agent, Hermes, Droid, Factory.ai, GLM 5.1, Agent架构, Token效率, VSCode集成

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐