

AI 写代码如何验收?我给我方作念了一张查验清单
以前我用 AI 写代码,最热心的是:
它能弗成写出来。
当今我更热心另一件事:
它说完成了,我到底如何验收?

这个问题很现实。
尤其像我这种非中途落发的东谈主,用 Codex、Claude Code 改名目,一初始很容易被 AI 的速率带着走。
它说修好了。
它说代码依然更新。
它说测试通过。
它说当今不错用了。
你看着它输出一大段阐扬,很容易就松连络:
行,那应该好了。
但用久以后我发现,这个 “应该好了” 很危境。
因为 AI 写代码不是交功课。
它是在动你的名目。
它可能果真修好了问题。
也可能修好了一个所在,顺遂埋了另一个坑。
也可能功能能跑,但经过永别。
也可能页面看起来没问题,但数据、权限、设立、历史记载被它动过。
是以我当今越来越合计:
精深东谈主用 AI 写代码,实在要补的不是“怎 么写 Prompt”,而是“如何验收 AI 干完的活”。
今天这篇不讲复杂表面。
就讲我我方当今用 Codex / Claude Code 改名目后,会照着看的一张查验清单。
它不高档。
但很管用。

01 先看它有莫得跑偏
验收的第一步,不是看代码。
而是先回到任务自身。
你一初始让 AI 作念什么?
它终末作念的,照旧这件事吗?
这个查验相等费劲。
因为 AI 很容易 “顺遂作念多极少”。
你让它修一个按钮样式,它顺遂整理了组件结构。
你让它改一个案牍,它顺遂改了页面布局。
你让它补一个剧本参数,它顺遂改了剧本启动方式。
它不是专门纷扰。
它仅仅太念念把事情作念好意思满。
但名目里最怕的即是这个。
我我方用 Codex 改 Obsidian 内容系统时,时常会提醒它:
此次只改这一个文献
不要顺遂整理目次
不要顺遂更新历久驰念
不要顺遂改别的 Skill
这个提醒不是实足。
因为 AI 很容易把 “更好意思满” 相识成 “更好”。
但对真名目来说,任务没跑偏,比它多作念极少更费劲。
是以我当今验收时,第一句会问:
此次调动,是否只贬责了我指定的问题?
如若谜底是含糊的,我会先停驻来。
别急着看它写得多好。
先看它有莫得越界。
验收的第一步,不是判断它写得好不好,而是判断它有莫得作念多。
02 看它到底改了哪些文献
AI 说 “我改好了”,这句话弗成胜仗信。
你要看它改了哪些文献。
如若是代码名目,我会看:
git status
git diff
如若是 Obsidian 内容系统,我会看:
它新增了哪些札记
它改了哪些高下文文献
有莫得遭受 memory、log、index
这个行为很浅陋。
但好多东谈主会跳过。
效果即是,AI 改了 10 个文献,你只看见了其中 1 个。
等背面出问题,你根柢不知谈问题从那边来的。
我当今比拟习尚让 AI 终末给我一个调动选录:
改了哪些文献
每个文献为什么改
有莫得新增文献
有莫得删除或转移文献
有莫得动到设立、数据、进口和历久规矩
这不是花样主义。
这是给我方留后路。
因为名目不是一次聊天。
你今天看不出问题,过几天可能要追忆查。
阿谁期间,一份澄澈的调动选录,比 AI 那时夸我方 “完成得很好” 有效得多。
AI 改了什么,比 AI 说了什么费劲。
03 查验有莫得碰禁区
我让 AI 改名目时,最怕它顺遂碰 4 类所在。
.env、密钥、权限、部署设立
数据库、转移、历史数据、历久驰念
名目进口、目次结构、依赖版块、构建剧本
中枢业务经过、景象机、历久规矩
这些所在不是永恒弗成改。
但弗成让 AI 顺遂改。
是以验收时,我会专门扫一眼:
它有莫得动 .env?
有莫得动数据库结构?
有莫得改 package.json 或 lockfile?
有莫得改启动高唱、路由进口、目次结构?
有莫得改中枢经过规矩?
如若有,我不会飞快说它错。
但我会条目它阐扬:
为什么必须改?
有莫得别的决策?
此次调动会影响那边?
需要
我作念什么稀奇考据?
这个行为能挡住好多隐形风险。
AI 最容易让东谈主减弱警惕的所在,即是它讲得很自信。
但你不要只听它讲。
你要看它动了那边。
AI 的口吻越自信,你越要看它有莫得碰禁区。
小9直播2026世界杯官网
04 看中枢功能有莫得果真可用
好多 AI 写代码的效果,是 “代码层面看起来对了”。
但真用的期间,不一定对。
比如你让它改一个表单。
它可能字段王人写了。
但提交以后莫得教导。
比如你让它改一个页面。
它可能桌面规定常。
但手机端挤在沿途。
比如你让它修一个剧本。
它可能能跑一次。
但换一个参数就报错。
是以验收弗成只看代码。
要看你领先要贬责的阿谁功能,是否果真能用。
我当今会尽量用一句话界说 “中枢可用”:
此次改完后,王者荣耀下注用户应该能完成什么行为?
比如:
用户能掀开页面
用户能提交表单
剧本能按指定参数生收效果
内容名目能按新模板创建好意思满文献
客服经过能走到正确阶段
如若这个行为没跑通,那就不算验收通过。
哪怕代码写得再漂亮,也不算。
功能可用,不是代码看起来合理,而是用户果真能走完。
05 跑考据高唱,不要只靠嗅觉

如若名目有测试,就跑测试。
如若有 lint,就跑 lint。
如若有 build,就跑 build。
如若是剧本,就跑一次真实高唱。
如若是前端,就至少掀开页面看一眼。
这一步听起来像妄言。
但好多精深东谈主用 AI 写代码时,最容易跳过。
因为 AI 会说:
我已教师证过了。
但你要看它到底如何考据的。
它是跑了高唱,照旧仅仅读了一下代码?
高唱效果是什么?
有莫得失败?
失败以后是修好了,照旧绕昔日了?
我当今最不可爱 AI 说一句决然话:
表面上应该不错。
真名目里,“表面上”没用。
要么跑了。
要么没跑。
要么通过。
要么没通过。
要么阐发为什么没法考据。
这几句话要讲澄澈。
莫得考据高唱的“完成”,只可算表面完成。
06 我方作念一次东谈主工试用
再强的 AI,也替代不了你我方试一遍。
尤其是作念网页、悭吝具、内容系统、自动化经过的期间。
AI 看的是代码。
你用的是效果。
它合计功能对了,但你一用可能飞快发现不顺遂:
按钮案牍不当然
页面律例永别
步伐太绕
输出效果不是你念念要的形式
某个限度场景它没念念到
我我方作念 Obsidian 内容系统时,这种嗅觉相等彰着。
AI 不错帮我补模板、改目次、写 Skill。
但终末这套东西顺不顺,唯有我我方走一遍才知谈。
比如从选题插足内容出产:
文献是不是好找?
长文终稿、东谈主话审稿、配图提倡是不是在正确位置?
memory 和 log 有莫得按规矩更新?
这些东西 AI 不错查验一部分。
但实在的体验,我我方必须走一遍。
是以东谈主工试用不是花费期间。
它是验收里最接近真实使用的一步。
AI 能查验代码逻辑,但你智商查验使用体验。

07 看有莫得留住新坑
AI 写代码有期间会出现一种情况:
目下的问题贬责了,但新坑出来了。
比如:
它为了修一个报错,加了一堆凝视代码
它为了让测试通过,把实在的问题绕昔日了
它为了完成任务,改了一个过于正常的逻辑
它把一个小问题修成了大重构
这类问题不是每次王人能飞快看出来。
但你不错刻意问它:
此次调动可能带来什么反作用?
还有哪些所在莫得考据?
有莫得为了快速通过而作念的临时处理?
有莫得加多新的依赖、复杂度或爱护本钱?
这个问题一问,好多风险会浮出来。
尤其是 Codex / Claude Code 这种能读名目、能改文献、能跑高唱的器具,你弗成只让它当推论者。
你还要让它当复盘助手。
让它我方说澄澈:
那边可能有风险
那边仅仅暂时处理
那边需要下次不息看
好用的 AI,不仅仅帮你改完,还要帮你把风险说澄澈。
08 终末让它写一份验收选录
这一步是我当今越来越爱好的。
AI 改完名目,不要只让它说 “完成了”。
让它写一份验收选录。
我会让它按这个形式写:
本次筹画是什么
实践改了什么
改了哪些文献
跑了哪些考据
哪些考据莫得跑
有莫得碰禁区
还有哪些风险和下一步
这份选录不是写给 AI 的。
是写给将来的我方。
你过几天追忆不息作念名目,能快速知谈此次作念到哪了。
你下次让另一个 AI 接着改,也能把这份选录当高下文。
你以后复盘某个问题,也能翻追忆查。
对一东谈主公司来说,记载不是晓喻责任。
记载即是你的第二个队友。
因为你莫得十个东谈主帮你记取每个决定。
你只可靠系统、清单和记载。
记载不是蒙胧,记载是在给将来的我方减负。
我的 AI 写代码验收清单
终末我把这张清单放在这里。
以后你用 Codex、Claude Code、Cursor,大致任何能帮你改名成见 AI,王人不错照着过一遍。
查验项要问我方的问题任务是否跑偏它是不是只贬责了我指定的问题?有莫得顺遂作念多?改了哪些文献我看过 git status / git diff / 文献列表了吗?有莫得碰禁区有莫得动 .env、数据库、依赖、进口、中枢经过?中枢功能是否可用用户或我我方能完成蓝本要完成的行为吗?考据高唱是否跑过测试、lint、build、剧本、页面预览有莫得实践跑?有莫得东谈主工试用我有莫得像真实用户相似走一遍?有莫得新坑有莫得反作用、临时处理、新依赖、复杂度加多?有莫得验收选录AI 有莫得写澄澈调动、考据、风险和下一步?
这张表不是让你形成专科尺度员。
它是让你别被 AI 的速率带着跑。
AI 写代码越快,东谈主越要慢半拍。
先验收,再不息。
先看澄澈,再折服。
先把记载留住来,再插支配一个任务。
这即是我当今用 AI 写代码最真实的变化。
以前我只念念知谈:
AI 能弗成帮我写出来?
当今我更热心:
它写完以后,我能弗成接得住?
能接得住,AI 才是器具。
接不住王者荣耀下注,它即是一个跑得很快、但随时可能把名目带偏的新东谈主。