V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  fennu2333  ›  全部回复第 1 页 / 共 1 页
回复总数  13
@callmecaiyuyu 哈哈我也是被 OpenClaw 更新摧残得不行,Chorus 开发的时候是最大努力做向后兼容,程序员的职业操守😂
@TheBlade 哈哈感谢支持,做项目的时候很焦虑怕有认知脱节所以才啃论文,x 上这个方向的项目一茬又一茬看都看不过来
@shyrock2026 我感觉更像是把前面的那一套东西拼在一起,Harness 这个概念确实有造词嫌疑,我自己写 Chorus 的时候确实对 CC 的交付质量有提升,有一点像把一套工作环境给 agent 配置好,让他在这套规则和环境下面玩,产出价值
@evan1 省流版的省流版就是每个章节的 TLDR 😂
@Reminders 我一开始试过 gh ,也试过在 linear 这样的任务管理工具上做,我写过一个 cc 插件直接把这一套流程跑在 linear 上,结果还是一般。我总结下来不管 gh 还是 linear 都提供了环境,但是不提供约束和反馈,比如有一个 kanban 给 agent 用,但是没约束他 task 和 task 的上下游关系,或者某个 task 他的完成标准一定要启动一个 review agent 从第三方的角度去审查等等。所以我自己做的时候就特别关注给 agent friendly 的反馈。比如在 Chorus 上 Agent 想要标记某个任务为完成,Chorus 给他的报错信息特别具体,“你不能这么做因为 xxx 项目的校验还没有完成” 或者 “上游 xxx 任务还没有完成,你应该先去做 xxx” 等,帮你把这些 drive 流程的 PE 藏在了各个环节里来解决 Agent 做着做着忘的问题
@yangyaofei 哈哈我觉得有困难,虽然这个论文总结的 pattern 挺不错的,但毕竟这种研究都有滞后性,很多提到的项目已经比较老了,没有 cover 比较新的框架
1 天前
回复了 kenshinhu 创建的主题 程序员 如何 实践 Harness 工程?
正好我昨天也发了一篇自己的实践: https://v2ex.com/t/1205752

我的理解是 Harness 在于给 Agent 构造外部环境和约束,让 Agent 能在你制定的规则下满足你某个垂直领域的需求,写 Skill ,CC 插件 等等手法最终的目的还是让 Agent 能更好地遵从你的工作流程来真正创造价值

有兴趣也可以看下最近比较火的一篇 Harness 综述 https://v2ex.com/t/1206029
@Reminders 我的理解是这样的,CC 本身也是一种 Harness ,他解决的问题是怎么让 LLM 帮你写代码,写了提示词和工具约束 LLM 去遵循一定的软件开发套路。而 Chorus 这一层 Harness 是在 CC 外面给了一套环境,一个更固定的流程和约束:必须把和用户讨论的结果记录在案,必须在每个任务完成时固定启动一个 Agent 去 review 等等。包括前面楼层 @hymxm 提到的 multica 等工具也是一样的,如果把 LLM 比作一个人,那么 LLM + CC 等于 教会这个人按照规范写代码变成 AI SDE, LLM + CC + Chorus 等于把这个 AI SDE 放到一个工作环境里去执行开发工作
@drbuglu 感谢👍 最近都在做大功能 issue 都没顾得上修哈哈
2 天前
回复了 zhengmin4516 创建的主题 程序员 使用 ai 编程后的感想和困惑
对于 2 ,用上 Coding Agent 之后单位时间的产出已经是过去的好多倍了,一开始我也会很虚,但是人的精力终究是有限的,就算你真能搞清楚,交付的量一大还是会忘。我现在干脆让 Agent 把轨迹和决策保存下来,真出问题了也要翻出来看(当然也是让 ai 看。。。)
@aomino233 大 feature 我会先用 pencil.dev 这个工具和 AI 一起把界面 Design 给画清楚了再干,防止他放飞
@craftsmanship Token 会比直接用 CC 裸跑多出 30%到 50%,但我跑过几个 bench ,比如 PRDBench ,用上 Chorus 之后 Haiku 能跑分超过裸 Opus ,真实项目上没有跑过严谨测试,不过我以后也想研究下能不能实现弱模型➕Harness 的模式来省钱,就算 Token 用得比 Opus 多三倍,用 Haiku 还是便宜
@jony83 嗯一方面确实想自己写一个实践下,另一方面用下来感觉 skill base 的 TDD 插件用起来很虚,所以我自己在 Chorus 里加了很多校验,强迫 cc 提交证据证明确实按照要求完成了
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3365 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 12:38 · PVG 20:38 · LAX 05:38 · JFK 08:38
♥ Do have faith in what you're doing.