Harness CLI 哪家强?社区有话说
没有"最好的"harness,只有"最适合"的harness。OpenCode 活跃但可能有账户风险Claude Code 专业但需要 VSCode环境Pi Agent低调但实战口碑好Droid 宣称免费但存在争议Forge 强大但可能消耗更多 tokens核心建议先试 OpenCode:社区票数最高,更新最活跃备选 Pi/Hermes:如果 OpenCode 不合适专业场景用 Claude Co
Harness CLI 哪家强?社区有话说
引言
最近,Reddit r/ZaiGLM 社区的一个帖子引发了热议:《Best Harness》。一位用户发问:
“GLM 5.1 的最佳 CLI harness 是什么?我试过 claudecode 和 kilocode,还没用过 opencode。你们的体验如何?”
帖子获得了 11 个 upvote 和 25 条评论。社区成员纷纷分享自己的实战经验。这些真实的用户反馈,比任何官方评测都更有参考价值。
本文整理了社区的讨论精华,并加入技术分析,帮你选到适合自己的 harness。
热门 Harness 选手盘点
1️⃣ OpenCode:社区人气王
票数统计:至少 6 位用户直接推荐
核心评价:
| 用户 | 评价 |
|---|---|
| lalamax3d | “Opencode” |
| Humble-Scale4941 | “opencode” |
| Livelife_Aesthetic | “Opencode for sure, those lads are pushing updates multiple times a day… pretty great now and only getting better” |
| OptimusTron222 | “OpenCode is a beast! If not for account bans it would have even killed Claude Code” |
亮点:
- 高频更新:用户特别提到"一天多次更新",活跃度极高
- 持续改进:“只变得更好”
- 功能强大:被称为"野兽级别"
潜在问题:
- 账户风险:有用户提到"account bans"问题
- VSCode集成争议:一位用户批评"在VSCode终端运行时,不能识别打开的文件"
2️⃣ Pi Agent:低调的实力派
票数统计:2 位用户强烈推荐
| 用户 | 评价 |
|---|---|
| LearnedByError | “I’ve used Claude, opencode, kilocode and pi. Pi is by far the best” |
| MSPlive | “Hermes or pi agent” |
亮点:
- 用户用了 Claude、OpenCode、Kilocode 之后,认为 Pi 是最好的
- 跨平台对比:在多个 harness 中脱颖而出
需要关注:
- 讨论中没有详细说明 Pi 的具体优势
- 有用户表示"听说很多好评,准备尝试"
3️⃣ Hermes Agent:值得尝试
票数统计:2 位用户提及
| 用户 | 评价 |
|---|---|
| MSPlive | “Hermes or pi agent” |
| stateq2 | “Hermes Agent works best for me so far. I haven’t tried OpenCode yet.” |
亮点:
- 有用户明确表示 Hermes 对他效果最好
- 与 Pi Agent并列提及
4️⃣ Droid (Factory.ai):争议选手
票数统计:推荐3票,但有争议
| 用户 | 评价 |
|---|---|
| Buff_Grad | “Try Droid by Factory.ai. Consistently tops charts, is free and lets you use your own subs/api keys.” |
争议点:
另一位用户反驳:
“Not free? 402 Payment Required…”
Buff_Grad回应:
“It’s free lol. Read this Doc page: https://docs.factory.ai/cli/byok/overview”
技术细节:
- Droid 支持 BYOK (Bring Your Own Keys)
- 有用户质疑需要订阅才能用自己的 API keys
- 官方文档可能有免费方案
5️⃣ Claude Code:专业编码首选
票数统计:正反两极评价
| 用户 | 评价 |
|---|---|
| Old_Stretch_3045 | “Claude Code VSCode extension is great for professional coding. Everything else I’ve tried feels like toys for landing pages…” |
| CharacterPerformer47 | “Claude Code works well for my use case. I didn’t notice the ‘drifting from instructions’ you mention.” |
| United_Wind4815 | “claude code + oh-my-claudecode (omc) is my best experience” |
亮点:
- VSCode 扩展版本更适合专业编码工作
- 可搭配 oh-my-claudecode 增强体验
原帖作者的痛点:
“Claudecode is great most times but starts drifting from instructions”
社区反馈:有用户没遇到这个问题,可能与使用场景有关。
6️⃣ Kilocode:已融入 OpenCode
重要更新:一位用户指出:
“kilocode is an opencode now btw”
这意味着 Kilocode 已经成为 OpenCode的一部分。
原帖作者体验:
“Kilocode is amazing and tries to one-shot everything. It needs explicit instructions not to go in and implement during brainstorming.”
特点:
- 强执行力,倾向于"一次搞定"
- 需要明确指令防止"过早动手"
7️⃣ Forge Code (.dev):潜力选手
票数统计:1票推荐
| 用户 | 评价 |
|---|---|
| Practical-Bite6628 | “forge code .dev Just use it last week, and won’t regret.” |
关注点:有用户追问:
“How about its token use? Doesn’t it burn more tokens than opencode cli because forge uses subagents and complex planning and all that?”
潜在问题:
- 多 agent架构可能消耗更多 tokens
- 复杂planning可能增加 overhead
技术分析:为什么 Harness 选择如此重要?
Harness = 模型的"驾驶舱"
模型本身是引擎,Harness 是驾驶舱。好的 Harness:
- 让模型知道"什么时候该思考"
- 控制推理深度(reasoning effort)
- 管理 context window 使用
- 协调工具调用节奏
差的 Harness:
- 模型"过早动手"(Kilocode 的one-shot倾向)
- 模型"偏离指令"(Claude Code 的drifting问题)
- Context overflow 导致不稳定(GLM 5.1 的潜在问题)
关键参数对比
| Harness | 更新频率 | Token效率 | VSCode集成 | BYOK支持 |
|---|---|---|---|---|
| OpenCode | ⭐⭐⭐⭐⭐ | - | 有争议 | ✓ |
| Pi Agent | - | - | - | - |
| Hermes | - | - | - | - |
| Droid | - | 有争议 | ✓ | ✓(免费?) |
| Claude Code | - | - | ⭐⭐⭐⭐⭐ | ✓ |
| Forge | - | 有争议 | - | - |
社区实战经验提炼
GLM 5.1 的使用建议
一位深度用户分享:
“I use 5.1 often in both Opencode and Openclaw. It has been running much better recently but there can be rate limit issues depending on your plan and time of day (especially during Asia peak hours).”
建议:
- 设置 5-turbo 作为 fallback
- Context window 高时需要"guardrails"来控制
- 最近两周稳定性明显改善
Token 消耗的隐性成本
关于 Forge 的讨论揭示了一个关键问题:
多 agent 架构可能"burn更多 tokens"
这与 Stanford 的"Swarm Tax"研究呼应——复杂架构不一定更好,可能只是在浪费算力。
在选择 Harness 时,要问:
- 这个 harness 有多少 subagents?
- Planning阶段消耗多少 tokens?
- 有没有"thinking budget"控制?
Drifting vs One-shot:两种极端
| 问题 | 表现 | 解决方案 |
|---|---|---|
| Drifting | 模型偏离指令,自作主张 | 明确边界,分阶段任务 |
| One-shot | 模型急于执行,不先思考 | 要求先分析再动手 |
两种极端都需要更精细的 prompt engineering。
如何选择适合你的 Harness?
决策 Checklist
[ ] 你的主要场景是什么?(专业编码 vs 快速原型)
[ ] 你需要 VSCode 集成吗?
[ ] 你有多 agent 架构需求吗?(关注 token 消耗)
[ ] 你是否需要 BYOK?(用自己的 API keys)
[ ] 更新频率对你重要吗?(OpenCode每天更新)
[ ] 你介意账户风险吗?(OpenCode 的 bans 问题)
[ ] Token 效率优先还是功能优先?
场景匹配建议
| 场景 | 推荐 |
|---|---|
| 专业编码(VSCode重度用户) | Claude Code + oh-my-claudecode |
| 快速迭代、实验性项目 | OpenCode 或 Pi Agent |
| 多平台灵活性 | Hermes Agent |
| BYOK优先、不想付费 | OpenCode 或 Droid(确认免费方案) |
| 大型复杂任务(需多agent) | Forge(但关注 token 消耗) |
| GLM 5.1 专属优化 | OpenCode + 5-turbo fallback |
总结:社区的智慧
Reddit讨论揭示了一个重要事实:
没有"最好的"harness,只有"最适合"的harness。
每个 harness 都有trade-offs:
- OpenCode 活跃但可能有账户风险
- Claude Code 专业但需要 VSCode环境
- Pi Agent低调但实战口碑好
- Droid 宣称免费但存在争议
- Forge 强大但可能消耗更多 tokens
核心建议:
- 先试 OpenCode:社区票数最高,更新最活跃
- 备选 Pi/Hermes:如果 OpenCode 不合适
- 专业场景用 Claude Code:VSCode深度集成是优势
- 警惕多 agent overhead:Forge 等方案可能增加 token 消耗
- 设置 fallback:GLM 5.1高峰期rate limit问题
附录:社区投票统计
| Harness | 推荐票数 | 核心优势 | 主要争议 |
|---|---|---|---|
| OpenCode | 6+ | 高频更新、功能强大 | 账户风险、VSCode集成 |
| Pi Agent | 2 | 跨平台口碑好 | 信息较少 |
| Hermes | 2 | 稳定可靠 | - |
| Droid | 1 | BYOK、榜单领先 | 免费争议 |
| Claude Code | 混合 | VSCode专业集成 | drifting问题 |
| Forge | 1 | 强执行力 | token消耗疑问 |
参考来源
- Reddit r/ZaiGLM: Best Harness
- Factory.ai文档: BYOK Overview
- oh-my-claudecode: GitHub
关键词:AI Harness, CLI工具, OpenCode, Claude Code, Pi Agent, Hermes, Droid, Factory.ai, GLM 5.1, Agent架构, Token效率, VSCode集成
更多推荐



所有评论(0)