返回博客列表
·2 分钟阅读·
vibe-codingclaude-codecodexai-agentproductivity

Vibe Coding 实战指南:从 Boris Cherny 和开源社区学到的 Agent 编程技巧

基于 Anthropic Claude Code 负责人 Boris Cherny 的内部试用经验,结合 Karpathy、开源社区的最佳实践,整理出一套完整的 Vibe Coding 工作流。

Vibe Coding 实战指南:从 Boris Cherny 和开源社区学到的 Agent 编程技巧

"这是近 20 年编程生涯中最大的工作流变化,它在几周内发生了。" —— Andrej Karpathy

2026 年初,AI 编程 Agent 的能力发生了质的飞跃。从 Andrej Karpathy 的 viral tweet,到 Anthropic Claude Code 负责人 Boris Cherny 的内部 dogfooding 分享,再到开源社区的集体实践,一种全新的编程范式正在形成 —— Vibe Coding

本文整合了一线实践者的经验,为你提供一套可直接落地的工作流。


一、什么是 Vibe Coding?

Vibe Coding 不是"不用脑子的编程"。它的核心是:

  • 用自然语言描述意图,让 AI Agent 执行具体实现
  • 从命令式转向声明式:不给步骤,给成功标准
  • 人机协作:人类负责方向、审查和验证,Agent 负责执行和迭代

Karpathy 描述了自己的转变:

从 80% 手动编码 + 20% AI 辅助,变为 80% Agent 编码 + 20% 手动修改。

Boris Cherny 作为 Claude Code 的创造者,他的日常工作流已经演变为:

"Claude do blah blah /go"


二、Boris Cherny 的 6 个核心技巧

2026 年 4 月 16 日,Boris 在内部试用 Opus 4.7 数周后分享了以下技巧:

1. Auto Mode — 摆脱 Babysitting

问题:Agent 执行长任务时,你需要不断批准权限提示。

解决方案:启用 Auto Mode。

  • 权限提示被路由给模型分类器判断安全性
  • 安全命令 → 自动批准
  • 风险命令 → 暂停询问

效果:可以并行运行多个 Claude 会话,一个"烹饪"时切换去处理下一个。

启用方式

  • CLI:Shift+Tab 循环切换 Ask → Plan → Auto
  • Desktop/VS Code:下拉菜单选择

适用:Opus 4.7 的 Max、Teams、Enterprise 用户


2. /fewer-permission-prompts Skill

功能:扫描会话历史,找出安全但反复触发权限提示的命令,推荐加入白名单。

用途:不使用 Auto Mode 时,减少权限干扰。


3. Recaps — 长会话的记忆锚点

功能:Agent 工作的简短摘要,包括"做了什么"和"接下来做什么"。

示例

* Cogitated for 6m 27s
* recap: Fixing the post-submit transcript shift bug.
  The styling-flash part is shipped as PR #29869.
  Next: I need a screen recording of the remaining
  horizontal rewrap on `cc -c` to target that separate cause.

场景:离开长时间运行的会话几分钟后回来,秒懂当前状态。

关闭/config 中禁用


4. Focus Mode — 只看结果

功能:隐藏所有中间工作过程,只展示最终结果。

前提:对模型的信任度达到"相信它会运行正确的命令、做出正确的编辑"。

切换/focus


5. Effort Level — 按需调节智能

Opus 4.7 使用自适应思考(adaptive thinking),通过 effort 调节:

级别 用途
low / medium 快速响应、低 token 消耗
high / xhigh 日常任务(Boris 大多数任务用 xhigh)
max 最难的任务(仅当前会话有效)

设置/effort

注意:max 只作用于当前会话,其他级别会持续到下次会话。


6. 给 Claude 验证工作的方法

这是"2-3 倍提升"的关键。验证方式因任务而异:

任务类型 验证方式
Backend 让 Claude 启动 server/service 做端到端测试
Frontend Claude Chromium 扩展控制浏览器
Desktop Computer Use

Boris 的 /go Skill 流水线

Claude do blah blah /go

/go 执行:
1. 端到端自测(bash / browser / computer use)
2. 运行 /simplify 简化代码
3. 提交 PR

对于长时间运行的任务,验证尤其重要 —— 当你回来时,你知道代码是能工作的。


三、Karpathy 的洞察:从命令式到声明式

Andrej Karpathy 在 2026 年 1 月的分享中提出了几个关键认知:

1. 给成功标准,而非执行步骤

不要:"先创建文件 A,然后写函数 B,再调用 C..."

:"实现 X 功能,通过以下测试..."

LLM 擅长循环直到满足特定目标。让它自己找路。

2. 先写测试,再写实现

TDD(测试驱动开发)在 Agent 编程中更重要:

  • 给 Agent 写测试
  • 让它写通过测试的代码
  • 你审查测试是否覆盖了关键场景

3. 利用 Agent 的"耐力"

"它们从不疲倦,从不气馁,只是不断尝试。"

Agent 可以在一个问题上来回迭代 30 分钟,人类早放弃了。这是"感受 AGI"的时刻。

4. 速度提升 vs 能力扩展

LLM 辅助不只是让你更快完成原计划的事,更重要的是:

  • 可以编码以前不值得编码的小工具
  • 可以处理以前因知识/技能限制无法触及的代码

四、开源社区的最佳实践

1. CLAUDE.md / CODEX.md — 项目上下文文件

在仓库根目录放置一个 markdown 文件,包含:

  • 项目架构概述
  • 编码规范
  • 常见陷阱
  • 测试策略

Agent 每次会话自动加载,减少重复上下文。

关键原则(来自 Karpathy):

  • Think Before Coding:让 Agent 先思考再动手
  • Simplicity First:避免过度工程化
  • Surgical Changes:精准修改,不波及无关代码
  • Goal-Driven Execution:目标导向,而非步骤导向

2. Plan Mode — 先规划再执行

复杂任务前,让 Agent:

  1. 分析需求
  2. 列出实现步骤
  3. 识别潜在风险
  4. 确认后再执行

Boris 提到:"Things get better in plan mode."

3. 技能(Skills)系统

将重复工作流封装为可复用的 skills:

/epic      → 规划大型功能
/run-epic  → 执行规划中的阶段
/go        → 测试 + 简化 + 提 PR
/simplify  → 代码简化

4. 并行 Agent 工作流

多个 Agent 同时处理不同任务:

  • Agent A:实现功能
  • Agent B:写测试
  • Agent C:审查代码

Auto Mode 让这成为可能。


五、常见陷阱与对策

❌ 陷阱 1:Agent 过度复杂化

Agent 喜欢用 1000 行代码实现本可以用 100 行搞定的事。

对策:主动要求简化。"能不能用更简单的方式?" —— 它通常能立刻精简。

❌ 陷阱 2:错误假设不验证

Agent 会做出错误假设并继续执行,不寻求澄清。

对策

  • 在 CLAUDE.md 中明确列出常见假设
  • 要求 Agent 在不确定时暂停询问
  • 关键决策点加入确认步骤

❌ 陷阱 3:不清理死代码

Agent 经常留下不再使用的变量、函数、导入。

对策:定期运行 /simplify 或要求"清理所有未使用的代码"。

❌ 陷阱 4:修改无关代码

Agent 有时会修改与任务无关的代码(注释、格式等)。

对策

  • 明确要求"只修改与任务直接相关的代码"
  • 使用 Focus Mode 关注最终 diff

❌ 陷阱 5:Brain Atrophy(大脑萎缩)

过度依赖 Agent 会导致:

  • 放弃自己的设计判断
  • 接受 Agent 的默认方案
  • 创新能力下降

对策

  • 保持对设计方向的掌控
  • 主动挑战 Agent 的方案
  • 定期手写关键代码保持手感

六、推荐工作流

日常开发流程

1. 启动 Claude Code,加载项目上下文
2. 用自然语言描述需求(声明式)
3. 进入 Plan Mode,让 Agent 分析并列出步骤
4. 审查计划,确认或调整
5. 切换到 Auto Mode,让 Agent 执行
6. 中途用 Recaps 检查进度
7. 完成后用 /go 验证(测试 + 简化 + PR)
8. 人工审查最终 diff

长任务管理

1. 将大任务拆分为多个子任务
2. 每个子任务一个 Claude 会话
3. 使用 Recaps 保持上下文连贯
4. 定期保存进度(commit)
5. 用 /focus 减少信息噪音

七、工具选择建议

工具 适用场景 优势
Claude Code 复杂项目、长会话、需要深度推理 Agent 能力强、上下文管理优秀
Codex (OpenAI) 快速原型、与 GPT 生态集成 与 ChatGPT/IDE 集成好
Cursor 日常编码、实时代码补全 IDE 体验流畅
Windsurf 协作编码、多文件编辑 良好的文件级操作

八、写在最后

Vibe Coding 不是让程序员失业,而是让程序员从"打字员"升级为"架构师"。

正如 Boris Cherny 所说:

"工程师比以往任何时候都更重要 —— AI 正在改变这个职业,但不是取代它。"

关键转变:

  • 写代码描述意图
  • 执行步骤定义成功标准
  • 单人编码指挥 Agent 团队

2026 年,这种工作流正在从"早期采用者"走向"主流工程师"。现在入手,正是时候。


参考资源

  1. Boris Cherny's Tips (2026-04-16) — Opus 4.7 Dogfooding 经验
  2. Andrej Karpathy's Tweet Thread (2026-01-26) — "A few random notes from Claude coding"
  3. Anthropic Postmortem (2026-04-23) — Claude Code 质量事件分析
  4. Karpathy's CLAUDE.md — GitHub 10万+ Stars 项目上下文模板
  5. 开源社区 Skills 实践 — /epic, /go, /simplify 等工作流

本文持续更新。如果你有好的实践,欢迎分享。