你是不是也遇到过这种情况:AI信誓旦旦地跟你说“Bug已修复”,结果一运行测试全线飘红?或者代码看起来逻辑完美,一提交PR就被CI/CD打脸?这真不是你一个人的痛。😭 这种“假装成功”是当前AI编程最大的隐患。今天给大家安利一个绝对能治好AI“幻觉病”的神级Skill——Verification Before Completion。它不是一段普通的代码,而是一条写进Agent灵魂的铁律:没有证据,就没有完成。
核心功能
Verification Before Completion 的核心逻辑非常简单粗暴,就是为了打断AI的“盲目自信”。它强制要求在任何“任务完成”的声明发出之前,必须执行严格的验证流程。这不仅仅是一个检查清单,更是一个逻辑防火墙。
- 强制证据链:禁止使用“应该修复了”、“看起来没问题”这种模糊词汇。没有运行命令的截图或日志,任何Claim都视为无效。
- 阻断虚假报告:在Agent试图提交代码或结束对话前,强制插入“运行-读取-验证”的三部曲。
- 重新定义完成:只有当退出代码为0、测试用例全部通过,且有明确的输出证据时,任务才算Done。
适用平台
这个Skill简直是为现代AI编程助手量身定制的“最强外挂”,完美适配以下平台,能显著提升AI的交付质量,减少你还要亲自Debug AI代码的痛苦:
- Cursor(强烈推荐写入 .cursorrules)
- GitHub Copilot
- Claude Code
- OpenAI Codex
- Gemini Code Assist
- 腾讯云 CodeBuddy
- 华为云 CodeArts
当你在这些工具中配置了此Skill,它们就像换了个脑子,不再会胡乱猜测代码是否可行,而是像一个资深工程师一样,跑通测试才敢跟你汇报。
实操代码示例
这个Skill的本质是一段极具约束力的系统提示词(System Prompt)。以下是它在执行时的核心逻辑流,建议直接灌输给你的Agent:
BEFORE claiming any status:1. IDENTIFY: What command proves this claim?2. RUN: Execute the FULL command (fresh, complete)3. READ: Full output, check exit code, count failures4. VERIFY: Does output confirm the claim? - If NO: State actual status with evidence - If YES: State claim WITH evidence5. ONLY THEN: Make the claim
并在你的规则文件中加入这条“红线”:
NO COMPLETION CLAIMS WITHOUT FRESH VERIFICATION EVIDENCEIf you haven't run the verification command in this message, you cannot claim it passes.
优势分析
为什么要强推这个Skill?因为它解决的是信任问题。
- 消灭“红绿循环”:很多时候我们以为修好了,结果是测试环境没清理或只跑了部分测试。这个Skill强制全量验证,拒绝侥幸心理。
- 节省人类精力:你不需要再去猜AI写的代码能不能跑,凡是它提交上来的,一定是经过验证的。
- 培养工程素养:它潜移默化地将“测试驱动开发”(TDD)的红绿循环理念植入到AI的工作流中。
应用场景
这玩意儿在以下场景简直是救命稻草:
- 自动化重构:当让Cursor大规模修改老旧代码时,防止它破坏原有的业务逻辑。
- CI/CD流水线脚本编写:确保生成的Pipeline配置是真的能跑通,而不是语法正确逻辑错误的废代码。
- Bug修复:强制AI先复现Bug(红),再修复(绿),最后回归验证,形成完整的闭环。
最佳实践
为了让 Verification Before Completion 发挥最大威力,这里有几个亲测有效的配置建议:
- 集成到 .cursorrules:如果你是Cursor用户,把这套规则放在项目根目录的规则文件中,权重设为最高。
- 定义清晰的验证命令:在任务开始前,明确告诉Agent“运行 `npm test` 才是唯一的验证标准”,不要让它自己发明验证方式。
- 拒绝“Just this once”:哪怕是很小的改动,也要坚持让Agent运行验证。因为往往就是那一行“看起来没问题”的修改,搞崩了整个生产环境。
觉得Agent写代码总是差点意思?或者受够了来回Code Review的拉锯战?为了让你的AI助手真正变得专业、靠谱,建议去 Skill优仓 下载这个Skill的完整配置。把它装进你的工作流,你会发现,那个曾经只会“瞎编”的AI,突然变得稳重又可靠了。🚀










暂无评论内容