Loop Engineering · AI Agent Systems

Loop Engineering:AI 工程师在 2026 必须理解的新工作范式

这份笔记解读 Rahul 的 X Article《Loops: What Every AI Engineer Needs to Know in 2026》,并结合 Addy Osmani 对同一概念的系统展开。核心观点:未来高手不是手动提示 Agent,而是设计能自动发现、执行、验证、记录、再继续的反馈循环。

读取边界:原始 X Article 匿名访问需要登录;可索引摘要显示其主题为 Loop Engineering。本文结合 X 搜索摘要、原帖壳,以及 Addy Osmani 同题长文中可访问的完整框架整理,不做原文逐字转载。
Loop从一次 prompt 到闭环系统
5+1五个组件加外部记忆
CodexAutomations · Skills · Subagents
Claude CodeHooks · /loop · /goal · Worktrees
风险Token 成本、理解债、安全边界

1. 核心结论

Prompt Engineering 解决“怎么问”;Loop Engineering 解决“怎么让系统自己反复问、做、验、记,直到结果可用”。

这篇内容之所以重要,是因为它指出了 AI 工程工作的新抽象层:人不再站在每一步中间手动提示 Agent,而是设计一个循环系统,让 Agent 自动发现任务、分配任务、生成方案、运行验证、记录状态,并把需要人判断的部分推回给人。

过去

你写 prompt,Agent 回复;你看结果,再写下一条 prompt。人是循环里的手动触发器。

现在

你设计循环:定时发现问题、启动 Agent、自动测试、失败回喂、成功提交、记录状态。

未来

工程师的杠杆从“写更好的提示词”上移到“设计更可靠的反馈系统”。

2. 什么是 Loop Engineering

Loop Engineering 可以翻译为“循环工程”或“反馈环工程”。它不是简单地让 Agent 多跑几次,而是把目标、上下文、执行、验证、状态、重试和人类审批设计成一个可重复运行的系统。

层级你在做什么系统能力
Prompt写一次请求模型生成一次答案
Workflow把多个步骤串起来Agent 按流程完成任务
Loop加入验证、状态和重试系统能自动迭代到达条件
Loop System加入调度、隔离、子代理、外部工具长期运行,自动发现和处理工作

关键差异:Loop 不等于自动化脚本。脚本通常按固定步骤跑;Loop 会根据验证结果决定下一步,并把失败信息重新喂给 Agent。

3. Loop Engineering 架构图

Automation定时发现 / Issue triage / CI 扫描 Agent Worker读取 Skill / 修改代码 / 调用工具在独立 worktree 中执行 Verifier测试 / 类型检查 / Lint / Review State / MemoryMarkdown · Linear · DB · Progress file Human Review批准 PR / 处理异常 / 改规则 循环的本质:目标 → 尝试 → 验证 → 状态更新 → 下一次尝试,直到停止条件成立

好的 Loop 一定有“停止条件”。例如:所有测试通过、lint 清零、PR 创建成功、Linear ticket 状态更新、审查 Agent 没有 blocker。没有停止条件,就只是无限消耗 token。

4. 五个组件,加一个外部记忆

Addy Osmani 的拆解非常清楚:一个可用的 Loop 需要五个能力,再加一个长期状态存储。

组件作用通俗理解
Automations按时间或事件自动发现工作让系统自己醒来,不再等你手动打开聊天框
Worktrees隔离并行 Agent 的代码改动每个 Agent 在自己的分支/目录里做事,避免互相踩文件
Skills固化项目知识和操作规范把反复解释的背景写成可复用说明书
Plugins / Connectors接入 Slack、Linear、数据库、GitHub、CI 等真实工具让 Agent 不只会说,还能进入你的工作环境
Sub-agents拆分探索、实现、验证等角色不要让写代码的 Agent 自己给自己打分
State / Memory记录已完成、失败、待办、下一步模型会忘,仓库和文件不会忘

最容易被低估的是 State。没有外部状态,Agent 每次都像失忆;有状态文件或任务板,它才知道昨天试过什么、失败原因是什么、今天该继续哪里。

5. 一个真实 Loop 长什么样

把它想象成一个每天早上自动运行的代码维护系统:

发现

定时任务读取昨天的 CI 失败、GitHub issues、最近 commits,把异常写入 triage 文件。

执行

每个值得处理的问题开一个独立 worktree,派实现 Agent 修复,再派验证 Agent 审查。

闭环

测试通过就创建 PR、更新 ticket;无法处理就进入人类 inbox;结果写回状态文件,明天接着跑。

goal: "让 auth 模块所有测试通过,并确保 lint clean"
trigger: "每天 09:00 + CI 失败事件"
context:
  - AGENTS.md
  - auth/SKILL.md
  - recent_ci_failures.md
loop:
  1. 读取失败日志和相关文件
  2. 在独立 worktree 中修复
  3. 运行 npm test auth && npm run lint
  4. 失败则把错误回喂给实现 Agent
  5. 成功则让 review sub-agent 审查
  6. 通过后创建 PR 并更新 Linear
stop_condition:
  - tests pass
  - lint pass
  - review has no blocker

6. 你可以直接套用的 Loop 设计模板

问题你要写清楚什么
Goal成功到底是什么,不要写“优化一下”,要写“测试 X 通过、指标 Y 达标”。
ContextAgent 必须读哪些文件、规范、历史决策、API 文档。
Tools允许调用哪些命令、数据库、MCP、外部系统。
Isolation是否必须使用 worktree、容器、临时目录,避免污染主分支。
Verifier哪些自动检查算通过,哪些必须人工确认。
State结果写到哪里,下一轮如何读取。
Budget最大轮数、最大 token、最大运行时间、失败后如何停。

适合先做的 Loop

CI failure triageIssue 分类依赖升级检查文档同步

这些任务目标清晰、验证容易、写操作风险低。

不适合一开始做的 Loop

自动合并主分支生产数据库写入支付/退款安全策略自动修改

这些任务失败代价高,必须先有人类审批和回滚机制。

7. Loop 的风险:越自动,越要工程化

Loop Engineering 不是“让 Agent 自己跑就完了”。它会放大生产力,也会放大错误。

风险表现防线
Token 成本失控一个循环 50K-200K token,多 Agent 并行更贵预算上限、轮数上限、压缩上下文、只在高价值任务上使用子代理
验证虚假通过Agent 自己认为完成,但真实测试没覆盖自动测试、独立 verifier、人类 review、可复现实验日志
理解债代码快速增长,但人类不理解系统变化要求变更说明、架构摘要、关键 diff review
认知投降人停止判断,只接受 Loop 输出人类保留产品判断、技术判断和最终责任
并行冲突多个 Agent 改同一文件,互相覆盖worktree 隔离、任务分片、合并前审查

核心提醒:Loop 不是让工程师消失,而是把工程师的位置上移。你不再每一步敲 prompt,但你仍然要设计目标、边界、验证和责任。

8. 我的判断

为什么这会成为 2026 的关键词

因为单次 prompt 的边际收益在下降。真正的差距来自系统:谁能把 Agent 放进一个稳定、可验证、可持续改进的环境里,谁就能获得更大的生产力杠杆。

它和 Agent Harness 的关系

Harness 是单个 Agent 跑得更稳的环境;Loop 是让 Agent 反复运行、互相检查、跨工具完成任务的上层调度。可以理解为:Harness 管一次执行,Loop 管长期循环。

最重要的实践原则

先从小 Loop 做起:只读、低风险、可验证、可回滚。等状态、验证、预算、隔离都稳定后,再逐步接入写操作和外部系统。

一句话总结

Prompt 是技能,Loop 是系统。未来的 AI 工程师不只是会和模型对话,而是会设计让模型可靠工作的反馈系统。

9. 资料来源

注:原始 X Article 本文未能匿名完整打开;本文结合搜索索引摘要和可访问长文做结构化解读。