1. 核心结论
Prompt Engineering 解决“怎么问”;Loop Engineering 解决“怎么让系统自己反复问、做、验、记,直到结果可用”。
这篇内容之所以重要,是因为它指出了 AI 工程工作的新抽象层:人不再站在每一步中间手动提示 Agent,而是设计一个循环系统,让 Agent 自动发现任务、分配任务、生成方案、运行验证、记录状态,并把需要人判断的部分推回给人。
过去
你写 prompt,Agent 回复;你看结果,再写下一条 prompt。人是循环里的手动触发器。
现在
你设计循环:定时发现问题、启动 Agent、自动测试、失败回喂、成功提交、记录状态。
未来
工程师的杠杆从“写更好的提示词”上移到“设计更可靠的反馈系统”。
2. 什么是 Loop Engineering
Loop Engineering 可以翻译为“循环工程”或“反馈环工程”。它不是简单地让 Agent 多跑几次,而是把目标、上下文、执行、验证、状态、重试和人类审批设计成一个可重复运行的系统。
| 层级 | 你在做什么 | 系统能力 |
|---|---|---|
| Prompt | 写一次请求 | 模型生成一次答案 |
| Workflow | 把多个步骤串起来 | Agent 按流程完成任务 |
| Loop | 加入验证、状态和重试 | 系统能自动迭代到达条件 |
| Loop System | 加入调度、隔离、子代理、外部工具 | 长期运行,自动发现和处理工作 |
关键差异:Loop 不等于自动化脚本。脚本通常按固定步骤跑;Loop 会根据验证结果决定下一步,并把失败信息重新喂给 Agent。
3. Loop Engineering 架构图
好的 Loop 一定有“停止条件”。例如:所有测试通过、lint 清零、PR 创建成功、Linear ticket 状态更新、审查 Agent 没有 blocker。没有停止条件,就只是无限消耗 token。
4. 五个组件,加一个外部记忆
Addy Osmani 的拆解非常清楚:一个可用的 Loop 需要五个能力,再加一个长期状态存储。
| 组件 | 作用 | 通俗理解 |
|---|---|---|
| Automations | 按时间或事件自动发现工作 | 让系统自己醒来,不再等你手动打开聊天框 |
| Worktrees | 隔离并行 Agent 的代码改动 | 每个 Agent 在自己的分支/目录里做事,避免互相踩文件 |
| Skills | 固化项目知识和操作规范 | 把反复解释的背景写成可复用说明书 |
| Plugins / Connectors | 接入 Slack、Linear、数据库、GitHub、CI 等真实工具 | 让 Agent 不只会说,还能进入你的工作环境 |
| Sub-agents | 拆分探索、实现、验证等角色 | 不要让写代码的 Agent 自己给自己打分 |
| State / Memory | 记录已完成、失败、待办、下一步 | 模型会忘,仓库和文件不会忘 |
最容易被低估的是 State。没有外部状态,Agent 每次都像失忆;有状态文件或任务板,它才知道昨天试过什么、失败原因是什么、今天该继续哪里。
5. 一个真实 Loop 长什么样
把它想象成一个每天早上自动运行的代码维护系统:
发现
定时任务读取昨天的 CI 失败、GitHub issues、最近 commits,把异常写入 triage 文件。
执行
每个值得处理的问题开一个独立 worktree,派实现 Agent 修复,再派验证 Agent 审查。
闭环
测试通过就创建 PR、更新 ticket;无法处理就进入人类 inbox;结果写回状态文件,明天接着跑。
goal: "让 auth 模块所有测试通过,并确保 lint clean"
trigger: "每天 09:00 + CI 失败事件"
context:
- AGENTS.md
- auth/SKILL.md
- recent_ci_failures.md
loop:
1. 读取失败日志和相关文件
2. 在独立 worktree 中修复
3. 运行 npm test auth && npm run lint
4. 失败则把错误回喂给实现 Agent
5. 成功则让 review sub-agent 审查
6. 通过后创建 PR 并更新 Linear
stop_condition:
- tests pass
- lint pass
- review has no blocker
6. 你可以直接套用的 Loop 设计模板
| 问题 | 你要写清楚什么 |
|---|---|
| Goal | 成功到底是什么,不要写“优化一下”,要写“测试 X 通过、指标 Y 达标”。 |
| Context | Agent 必须读哪些文件、规范、历史决策、API 文档。 |
| Tools | 允许调用哪些命令、数据库、MCP、外部系统。 |
| Isolation | 是否必须使用 worktree、容器、临时目录,避免污染主分支。 |
| Verifier | 哪些自动检查算通过,哪些必须人工确认。 |
| State | 结果写到哪里,下一轮如何读取。 |
| Budget | 最大轮数、最大 token、最大运行时间、失败后如何停。 |
适合先做的 Loop
CI failure triageIssue 分类依赖升级检查文档同步
这些任务目标清晰、验证容易、写操作风险低。
不适合一开始做的 Loop
自动合并主分支生产数据库写入支付/退款安全策略自动修改
这些任务失败代价高,必须先有人类审批和回滚机制。
7. Loop 的风险:越自动,越要工程化
Loop Engineering 不是“让 Agent 自己跑就完了”。它会放大生产力,也会放大错误。
| 风险 | 表现 | 防线 |
|---|---|---|
| Token 成本失控 | 一个循环 50K-200K token,多 Agent 并行更贵 | 预算上限、轮数上限、压缩上下文、只在高价值任务上使用子代理 |
| 验证虚假通过 | Agent 自己认为完成,但真实测试没覆盖 | 自动测试、独立 verifier、人类 review、可复现实验日志 |
| 理解债 | 代码快速增长,但人类不理解系统变化 | 要求变更说明、架构摘要、关键 diff review |
| 认知投降 | 人停止判断,只接受 Loop 输出 | 人类保留产品判断、技术判断和最终责任 |
| 并行冲突 | 多个 Agent 改同一文件,互相覆盖 | worktree 隔离、任务分片、合并前审查 |
核心提醒:Loop 不是让工程师消失,而是把工程师的位置上移。你不再每一步敲 prompt,但你仍然要设计目标、边界、验证和责任。
8. 我的判断
为什么这会成为 2026 的关键词
因为单次 prompt 的边际收益在下降。真正的差距来自系统:谁能把 Agent 放进一个稳定、可验证、可持续改进的环境里,谁就能获得更大的生产力杠杆。
它和 Agent Harness 的关系
Harness 是单个 Agent 跑得更稳的环境;Loop 是让 Agent 反复运行、互相检查、跨工具完成任务的上层调度。可以理解为:Harness 管一次执行,Loop 管长期循环。
最重要的实践原则
先从小 Loop 做起:只读、低风险、可验证、可回滚。等状态、验证、预算、隔离都稳定后,再逐步接入写操作和外部系统。
一句话总结
Prompt 是技能,Loop 是系统。未来的 AI 工程师不只是会和模型对话,而是会设计让模型可靠工作的反馈系统。
9. 资料来源
- Rahul 原始 X 帖子
- X Article:Loops: What Every AI Engineer Needs to Know in 2026
- Addy Osmani:Loop Engineering
- Reddit 镜像讨论:Boris Cherny 关于 loops 的引用
- Stop Prompting AI and Start Building Loops
注:原始 X Article 本文未能匿名完整打开;本文结合搜索索引摘要和可访问长文做结构化解读。