Claude Code关于harness新的认知 #AI #ClaudeCode #harness #Anthropic #dynamicworkflow
✅ 已完成任务ID: 1160
30秒速读
核心摘要
本次科普Claude Code的Harness动态工作流的特性、模式与实操避坑要点。
可执行建议
- 常规简单编码等静态流可覆盖的场景,不要强行使用动态工作流,避免不必要的资源消耗
- 搭建动态工作流时要设置合理预算上限,禁止让单个Agent同时承担执行和校验职责
高价值评论洞察
- 受众看完原理科普后实操需求强烈,不再满足于特性讲解,迫切想要上手落地相关功能
- 目标用户对Anthropic全系列产品的更新动态敏感度极高,相关新动态内容很容易获得受众关注
用户关注点
- Claude Code Harness动态工作流的具体操作落地步骤
- Anthropic旗下AI产品的最新版本发布信息
可复用选题/回应建议
- 后续产出Claude Code Harness动态工作流的分步实操教程,匹配用户的上手需求
- 关联Claude fable5新特性与动态工作流的适配玩法,借最新产品热度提升内容流量
代表性评论
- "我们该怎么操作呢",直接反馈了用户看完原理科普后的核心诉求,是后续内容迭代的核心参考方向
- "Claude fable5 发布了",补充了Anthropic最新产品动态,为后续内容选题提供了新的关联切入点
基本信息
标签与备注
标签
备注
暂无备注
转录文本
下一段有关最近对于dolkharness的一些认知,概括作者Morris最近说了一句广为流传的话,叫做“我不为Cloud写Prompt了,我写Loop,我的工作者写Loop”。什么是Loop呢?来分享一下Loop。它们内部叫做Dynamic Workflow,相当于一个临时拉起来的、可以快速构建的工作流。Dynamic Workflow怎么使用呢?简单来说,对应的是Steady Workflow默认的这种静态模式:把所有规划和执行都放到同一个上下文窗口的方式就是静态。静态的好处是更便于规划,而且绝大部分场景代码也够用。但是遇到长任务、大规模并行、强结构化或者对抗性的场景就会崩,所以需要引入动态的工作流模式。 动态的工作流就是Dynamic Workflow,是让Cloud自行临场写一个Harness,一个JavaScript文件,里面用几个特殊的函数,Sponsor Agent在用标准的JavaScript处理之间流动的数据,有点绕,配图就很好理解了。它其实相当于一个Distribute Agent,基于上下文去决定是否分支出更多的小Agent,每一个Agent是独立的上下文,互相不会污染。同时每个Agent可以指定自己的模型,如果推理要求高的时候,用贵的模型,探索的时候,用便宜的,中间的三类Agent之间的隔离级别可以筛选,可以有一定的沟通,也可以完全独立。通过这种方式,它就可以基于问题的复杂度、基于上下文去决定到底开多少层的任务,以及开多少个并行的Agent,每一层也可以灵活地做动态调整。 简单一句话就是,只要跟它说一句“给我做一个工作流”,或者触发一个Actor Code,Trio Code就可以自动开启动态。Dynamic Workflow就算中途被打断,也能恢复。Dynamic Workflow具体能解决哪三个问题呢?作者在自己的发文里表达了以下几点。 第一叫Agent Laziness,就是复杂任务做了一半就显示全部完成了,因为它根本就没有跟踪任务进度,跟踪能力比较差,这个是静态工作流的一个特有问题。比如说五十项安全审核做了二十项,就说剩下的都已经处理完了。 第二个叫Self Preferential Bias,就是让Cloud验证自己输出时,更加倾向于偏袒自己,相当于在一个静态工作流里面,裁判跟选手是同一个人。 第三个问题叫Goal Drift,循环之后逐渐偏离目标,每次信息都被压缩,做着做着就忘记自己来干什么了。 那Dynamic Workflow就能有效解决这几个问题,通过不同的Cloud各自的上下文加状态隔离,来实现分布式模式的容错。在Dynamic Workflow里面,有很重要的三件套,一个就是Agent,Agent就不用说了,基本上就是建立一个完整的稳定的环境;第二种叫Parallel;第三个叫Pipeline。其实很好理解,就跟电路里面的并行跟串行一样,Parallel就是并行,从一个节点分散出多个分支,然后独立完成对应任务。Pipeline就是串行,一个元素依赖于一个任务,一步步完成一个流程,当然过程中,基于它的返回结果,也可能要改变之后的计划。 Dynamic Workflow常见的搭建模式有六个,分别是Adversify and Act,就是让分类Agent先判断任务,再去决定路由到对应的处理节点;第二叫Split and Sequence,就是拆成多个子任务并行跑,最终由一个Agent合并;第三叫Adversify and Fiction,就是一个Agent做执行,另外一个做检测,互相考核;第四叫Generate and Filter,就生成多个想法,最终决定保留最头部的结果;第五叫Tournament,就是成对比较淘汰赛,最终通过多轮比赛决定最合适的答案;最后叫Loop Pan Down,就跟一个Agent里面的Go循环一样,一直循环一直到结束为止,配合的也是Sash HO。从这点来说,Prompty跟OpenAI的标准是统一的,这六个模式很少独立出现,一般一个Workflow里面通常会组合两到四个。 当然了,Cloud团队也提出了比较容易踩的坑。比如说普通的静态流程能解决的问题,就不要上Dynamic Workflow,否则这个流程很费资源,一般日常的编码任务不需要五个评审。第二点就不要设太苛刻的预算,一个体量很大的Workflow不能不设上限,否则很可能还没有做完就已经结束了。另外的坑,比如说让一个Agent既干活又验证,那基本上就是让裁判员当运动员,肯定是不行的。其他的问题,比如说Loop模式配置不对,就是有循环但是没有结果,没结果的话,可能第一次循环就已经结束了。 以上就是FFV对于Harness的一些理解。我相信这些新的认知已经在Cloud DE,包括Cloud Code后端代码中进行了更新。之前就有相关代码泄露过这些新的逻辑,目前提供方法论,需要相关的团队自己去消化,自己去执行了。