规划、纠偏和记忆会始终连成一体,而不是在每个任务里临时拼凑。
- 先界定范围,再开始实现把模糊需求整理成可直接落地的规格,明确范围和验收标准。
- 基于证据纠偏,不靠猜测借助测试、日志、CI 输出和评审反馈,按照当前规格修正偏差。
- 复用项目记忆沉淀关键决策和根因,让下一个任务从真实上下文出发。
spec-coding-skills 帮助代理在编码前先定义完成标准,用证据修正偏差,并复用项目记忆,而不是每个任务都从零开始。
规划、纠偏和记忆会始终连成一体,而不是在每个任务里临时拼凑。
npx skills add H2Sxxa/spec-coding-skills --all规划 -> 纠偏 -> 记忆
三个技能会彼此增强,而不是像彼此割裂的提示词那样各自运作。
Root SPEC.md
仓库无需 fork 技能,就能通过根目录配置覆盖语言、验证命令和知识库路径。
+88.9 分
在一个本地 3 轮提示的小型演示中,技能引导输出与预期工作流结构的匹配度明显更高。
每个技能单独使用都有效,但真正的价值在于它们能在任务生命周期中彼此传递上下文。
这套流程在日常使用中依然很轻量:先读取本地约定,再围绕明确的完成条件做规划,并在运行证据与预期不一致时补齐差距。
如果目标仓库定义了根目录 SPEC.md,技能就会据此遵循本地语言、验证和知识库约定。
在规划或纠偏开始前,`spec-index` 会先查找相关决策、根因和风险点。
`spec-plan` 会把模糊请求整理成可执行规格,包含可测试的验收标准和执行护栏。
这些技能不会取代编码,而是收紧“应该做什么”和“如何验证”的边界。
当现实与规格出现偏差时,`spec-crlp` 会基于证据执行“修复-验证-重复”的闭环,而不是悄悄改变目标。
可复用的发现会回流到 `spec-index`,让后续任务继承项目记忆,而不是重复踩坑。
在一个本地 3 轮提示的 Codex 演示中,技能引导输出在规划、纠偏和记忆结构上,比通用基线输出稳定得多。
11.1% → 100.0%
33.3%
100.0%
在实现前补齐范围边界、验收标准、验证计划和记忆上下文。
0.0%
100.0%
推动 agent 采用基于证据的调试方式,并显式记录根因、验证过程和记忆沉淀。
0.0%
100.0%
把一次性的调试知识整理成带结构、标签和复用条件的可检索项目记忆。
这个基准检查 agent 是否产出了能让真实开发更稳妥的工作流产物:清晰的范围、可测试的验收标准、结构化的纠偏步骤,以及可检索的项目记忆。
这并不是对最终代码质量的统计性结论。更适合把它看作流程质量前后对比的紧凑演示,而不是通用基准声明。
先看概览,验证本地工作流,再检查这个紧凑的基准,然后再把这些技能接入真实仓库。