开云体育2026世界杯中国官网
KaiYun Sports2026世界杯(中国)官方网站 用12条文定将AI荒唐率镌汰4倍!
发布日期:2026-05-26 21:42    点击次数:96

KaiYun Sports2026世界杯(中国)官方网站 用12条文定将AI荒唐率镌汰4倍!

——本文在顶级大神Andrej Karpathy 广为流传的 AI 编码端正基础上进行了膨大,引入了 8 条特殊准则,旨在大幅镌汰 Claude 在处理复杂、多法子 Agent 任务时的荒唐率。

4 条 CLAUDE.md 端正将 Claude 出错率从 41% 降至 11%——历经 30 个代码库,我又补充了 8 条

进程 6 周、覆盖 30 个代码库的实测,将出错率从 41% 压缩到 3%。以下是完好的 12 条文定、每一条背后的实在教化,以及原始 4 条文定悄然失效的 4 个场景。

时时彩app官方网站下载

配景

2026 年 1 月底,Andrej Karpathy 公开懊恼 Claude 写代码的三大恶疾:沉默作念出荒唐假定、过度复杂化、以及误伤不该动的代码。

Forrest Chang 读完帖子后,把这些懊恼索求成 4 条行为端正,打包进一个 CLAUDE.md 文献并发布到 GitHub。第一天就得益了 5,828 个 Star,两周内被储藏 6 万次,当今已打破 12 万 Star——2026 年增长最快的单文献仓库。

我在 30 个代码库上实测了 6 周。

4 条文定确乎有用。在它们能覆盖的场景里,原先约 40% 的出错率降到了 3% 以下。但这套模板是为确立 1 月份的代码编写问题而生的。

2026 年 5 月的 Claude Code 生态已判然不同——Agent 相互喧阗、Hook 级联触发、技巧加载冲突、跨会话多法子责任流断链。

于是我特殊补充了 8 条文定。下文将一一拆解:完好的 12 条 CLAUDE.md、每条文定背后的一脉调换,以及原始 Karpathy 模板悄然失效的 4 个盲区。

要是只想平直复制使用,完好文献在文末。

为什么值得深爱

CLAUDE.md 是整个 AI 编程器用链中被严重低估的一个文献。大普遍开荒者要么:

把它当成偏好垃圾桶,堆到 4,000+ Token,顺从率跌至 30%;

透顶跳过,每次手动辅导——Token 摧折 5 倍,会话间毫无一致性;

复制一个模板就放着无论。能用两周,然后随代码库变化暗暗失效。

Anthropic 官方文档明确评释:CLAUDE.md 是建议性的,Claude 的顺从率约为 80%。向上 200 行后,顺从率会急剧下落,因为蹙迫端正被灭亡在杂音里。

Karpathy 的模板用一个文献、65 行、4 条文定贬责了这个问题。这是下限。

上限还更高。再加 8 条文定,覆盖的就不仅仅 Karpathy 其时懊恼的代码编写问题,还包括那时还不存在的 Agent 编排问题。

原始 4 条文定

端正 1 — 先想阐明再脱手 不作念隐性假定。把假定说出来。点明衡量继承。碰到不细主张先问,而不是猜。有更简便的决策时主动提议。

端正 2 — 简便优先 用最少的代码贬数落题。不加投契性功能。单次使用的代码不要搞概括。要是一个资深工程师会说"过度遐想"——就简化。

端正 3 — 精确编削 只动必须动的场所。不要"顺遂优化"驾驭代码、凝视或体式。不重构莫得问题的东西。保抓现存作风。

端正 4 — 筹划导向践诺 界说顺利圭臬。轮回直到考证通过。不要告诉 Claude 该走哪些法子,告诉它顺利是什么样式,让它我方迭代。

这四条关闭了约 40% 的失控场景。剩下约 60% 藏不才面的盲区里。

我补充的 8 条文定(偏执原因)

每一条齐源于 Karpathy 那 4 条不够用的实在时刻。

端正 5 — 不要让模子作念非讲话责任

Karpathy 的端正对此只字未提。当模子被拿来决定"该不该重试 API 调用"、"如何路由音问"、"何时升级处理",放荡是每周给出不同决定——用 $0.003/Token 的价钱买了一堆当场 if-else。

触发时刻: 调用 Claude 来"判断 503 要不要重试"的代码运行精良了两周,然后开动抽风——因为模子开动把申请体手脚决策陡立文来读,重试计策变得透顶当场。

端正 6 — 诞生硬性 Token 预算,莫得例外

莫得预算的 CLAUDE.md 是一张空缺支票。每个轮回齐可能螺旋成 5 万 Token 的陡立文垃圾场。模子不会自动停。

触发时刻: 一次调试会话跑了 90 分钟。模子惬心性在归并份 8KB 报错信息上反复迭代,逐遗健无私方已经试过哪些确立决策。到终末,它在建议我 40 条音问前就拒却过的修法。Token 预算会在第 12 分钟就把它掐死。

端正 7 — 显式浮现冲突,不要取均值

现代码库里两个部分存在不对,Claude 会试图双方齐团结。放荡是一团不连贯的东西。

触发时刻: 代码库里并存两套荒唐处理模式——一套是 async/await 配显式 try/catch,另一套用全局 error boundary。Claude 写的新代码两套齐用了。双重荒唐处理器。我花了 30 分钟才搞明显为什么荒唐会被吞掉两次。

端正 8 — 先读再写

Karpathy 的"精确编削"告诉 Claude 不要碰驾驭代码,但莫得告诉 Claude 先领会驾驭代码。莫得这条,Claude 写的新代码会和 30 行外的现存代码打架。

触发时刻: Claude 在一个现存的同名函数左右又加了一个一模雷同的函数——因为它根蒂没读左右的代码。两个函数作念的是归并件事。新的因为 import 端正优先奏效了,而旧的才是 6 个月以来的巨擘起首。

端正 9 — 测试不可或缺,但测试自己不是筹划

Karpathy 的筹划导向践诺暗含了"测试通过"作为顺利圭臬。但在实践中,Claude 会把"测试通过"手脚唯曾筹划,写出能让浅层测试通过、却把其他一切搞坏的代码。

触发时刻: Claude 为一个鉴权函数写了 12 个测试,通盘通过。鉴权在出产环境是坏的。那些测试仅仅在考证函数"复返了某个东西",而不是"复返了正确的东西"——函数靠复返一个常量就过了整个测试。

端正 10 — 万古操作需要检查点

Karpathy 的模板假定的是一次性交互。实在的 Claude Code 责任是多法子的——跨 20 个文献的重构、在一个会话里构立功能、跨多个提交调试。莫得检查点,一次误操作会让整个程度付之东流。

触发时刻: 一次 6 步重构在第 4 步出了问题。等我发现的时候,Claude 已经在荒唐景色上继续完成了第 5、6 步。把这团乱麻理阐明花的时辰,比从新重来还要长。检查点会在第 4 步就拿获问题。

端正 11 — 商定优于鼎新

在一个有老到模式的代码库里,Claude 可爱引入我方的作风。即使它的风景"更好",两种模式并存带来的危害也向上任何一种单独存在。

触发时刻: Claude 在一个全是 Class 组件的代码库里引入了 React Hooks。功能上是对的,但也把代码库的测试模式搞坏了——那套测试假定了 componentDidMount 的存在。花了半天时辰删掉重写。

端正 12 — 失败要高声,不成暗暗

最贵的 Claude 失败,是那些看起来顺利了的失败。函数"运行宽阔"但复返了荒唐数据。移动"完成"但跳过了 30 札纪录。测试"通过"但断言自己便是错的。

触发时刻: Claude 说数据库移动"已顺利完成"。试验上它暗暗跳过了 14% 触发敛迹冲突的纪录。跳过行为被写进了日记,但莫得浮出水面。11 天后报表开动出现荒谬,开云体育官网才发现问题。

数据放荡

在 30 个代码库上跟踪归并组 50 个代表性任务,历时 6 周,三种确立对比:

确立

出错率

端正顺从率

无 CLAUDE.md

41%

Karpathy 原始 4 条

11%

78%

完好 12 条

3%

76%

出错率 = 任务需要改造或重写才能合乎意图。计入:沉默作念荒唐假定、过度工程化、误伤代码、静默失败、违背商定、冲突取均值、遗漏检查点。

顺从率 = Claude 在端正适用时,有明确践诺该端正的比例。

特地念念的论断不是从 41% 降到 3% 这个大标题,而是:从 4 条膨大到 12 条,顺从率险些莫得损耗(78% → 76%),出错率却又下落了 8 个百分点。新端正覆盖的是原有 4 条未涉及的失败模式,二者不争归并块凝视力预算。

Karpathy 模板的 4 个隐性失效场景

即使不加多新端正,原始 4 条模板在以下情况也不够用:

1. 万古辰运行的 Agent 任务 Karpathy 的端正针对的是 Claude 写代码的眨眼间。对 Claude 运行多法子 Pipeline 时发生的事情只字未提。莫得预算端正,莫得检查点端正,莫得"高声报错"端正。Pipeline 会暗暗跑偏。

2. 多代码库一致性 "匹配现存作风"假定唯唯独种作风。在包含 12 个工作的 Monorepo 里,Claude 必须采取用哪种作风。原始端正莫得告诉它该如何选——它会当场选,大约取均值。

3. 测试质料 筹划导向践诺把"测试通过"当成顺利。但莫得说测试必须是特地念念的。放荡是测了个一身,但 Claude 对此充满信心。

4. 出产代码 vs 原型代码 归并套保护出产代码免于过度工程化的端正,也会把那些合理需要 100 行投契性脚手架来探索标的的原型搞坏。Karpathy 的"简便优先"在早期探索阶段会误触发。

什么没用

在细目这 12 条之前,我尝试过:

从社区搬来的端正:大普遍要么是换了说法的 Karpathy 原版,要么是不成泛化的界限特定例则("永恒使用 Tailwind 类")。全删了。

向上 12 条:测到 18 条。顺从率从 76% 跌到 52%。200 行天花板是实在存在的。超事后 Claude 开动模式匹配到"端正存在",而不是实在读端正。

依赖可能不存在的器用的端正:"永恒使用 eslint"在 eslint 未装配时静默失败。改为与才略无关的表述:"匹配代码库强制践诺的作风"。

在 CLAUDE.md 里用例子代替端正:例子比端正重得多。三个例子虚耗的陡立文十分于约 10 条文定,而况 Claude 会对例子过拟合。端正是概括的,例子是具体的,用端正。

"要留意"/"发达念念考"/"实在专注":纯杂音。顺从率跌到 30%,因为这些要求无法被测试。改成具体的敕令式表述("显式评释假定")。

告诉 Claude 要阐扬得"像资深工程师":没用。Claude 已经以为我方是资深的。差距在于"想"和"作念"之间。敕令式端正能弥合这个差距,身份辅导莫得这个放荡。

完好 12 条 CLAUDE.md(可平直复制)

# CLAUDE.md — 行为公约

## 端正 1:先想阐明再脱手

在写代码之前,显式评释你作念出的假定。点明衡量继承。碰到不细主张,先问而不是猜。

要是存在更简便的决策,主动提议。

## 端正 2:简便优先

用能贬数落题的最少代码。不加投契性功能。单次使用的代码不要搞概括。

要是资深工程师会说"过度遐想"——就简化。

## 端正 3:精确编削

只动必须动的场所。不要"顺遂优化"驾驭代码、凝视或体式。

不重构莫得问题的东西。保抓现存代码作风。

## 端正 4:筹划导向践诺

开动前界说顺利圭臬。轮回践诺直到考证通过。

告诉我顺利是什么样式,而不是该走哪些法子。

## 端正 5:讲话责任归模子,细目性责任归代码

重试逻辑、路由端正、升级要求——用代码罢了,不要让模子在运行时动态决定。

## 端正 6:硬性 Token 预算

每次会话最多 X 次器用调用 / Y 个 Token(证据样式填写具体数字)。

到达预算上限时停驻来,申诉程度,恭候指示。不要继续螺旋下去。

## 端正 7:显式浮现冲突

要是代码库的两个部分相互矛盾——模式、商定、荒唐处理——在继续之前先指出来。

不要双方齐团结或取均值,这会产生不连贯的代码。

## 端正 8:先读再写

在向文献添加代码之前,先读归并文献里驾驭的代码。

在跨文献引入内容之前,先了解它的商定。不要在没读过左右代码的情况下添加函数。

## 端正 9:写特地念念的测试

测试要考证正确的行为,而不仅仅考证函数"复返了某个东西"。

断言必须有可能失败。顺利圭臬是"测试能拿获实在的 bug",而不是"测试通过了"。

## 端正 10:多法子任务需要检查点

在向上 3 步的任务里,每完成一个逻辑阶段就停驻来考证景色,然后再继续。

不要在未资历证的景色表层叠后续法子。

## 端正 11:商定优于鼎新

使用代码库里已有的模式、库和作风,即使你知说念更好的决策。

有更好决策的话,先指出来,等证明再引入,不要平直就用。

## 端正 12:失败要高声

要是操作失败、跳过了纪录、碰到了荒唐——把它浮出来,不要暗暗纪录后继续。

"部分红功"等同于失败。把它手脚失败来申诉。

装配模范:

# 1. 将 Karpathy 的 4 条文定基线追加到你的 CLAUDE.md

curl https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md >> CLAUDE.md

# 2. 将本文中的端正 5-12 粘贴到底下

保存在代码库根目次。在 12 条文定下方添加样式专属端正(时代栈、测试敕令、荒唐模式)。通盘加起来不要向上 200 行,超事后顺从率会权贵下落。

心智模子

CLAUDE.md 不是愿望清单,而是一份行为公约——用来关闭你亲眼见过的具体失败模式。

每一条文定齐应该能回复:这条文定能驻扎什么荒唐?

原始 4 条驻扎的是经典失败模式: 隐性假定、过度工程化、误伤代码、顺利圭臬暧昧。它们是地基,不要跳过。

新增 8 条驻扎的是进化出来的失败模式: 莫得预算的 Agent 轮回、莫得检查点的多法子任务、测了一身的测试、静默顺利遮蔽的静默失败。它们是补丁。

试验放荡因东说念主而异。要是你不跑多法子 Pipeline,端正 10 对你没用。要是你的代码库唯唯独种经 Lint 强制践诺的作风,端正 11 便是过剩的。读完这 12 条,留住能映射到你实在犯过的荒唐的那些,删掉其余的。

结 语

Karpathy 2026 年 1 月的帖子不外是一次吐槽。Forrest Chang 把它形成了 4 条文定。12 万开荒者给这个放荡点了 Star。他们中的大普遍今天仍在跑 4 条文定。

模子进化了,生态变了。多法子 Agent、Hook 级联、技巧加载、多代码库责任——这些在 Karpathy 写帖子时齐不存在。4 条文定无法应付这些场景。它们莫得错,仅仅不完好。

8 条新端正KaiYun Sports2026世界杯(中国)官方网站。6 周、30 个代码库的测试。出错率从 41% 降至 3%。



Copyright © 1998-2026 开云体育2026世界杯中国官网™版权所有

gongmingkeji.com备案号 备案号: 

技术支持:®开云体育2026世界杯 RSS地图 HTML地图