规划。纠偏。沉淀。

给 AI 编码代理一套更紧的规格闭环。

spec-coding-skills 帮助代理在编码前先定义完成标准，用证据修正偏差，并复用项目记忆，而不是每个任务都从零开始。

落到实践会怎样

规划、纠偏和记忆会始终连成一体，而不是在每个任务里临时拼凑。

先界定范围，再开始实现把模糊需求整理成可直接落地的规格，明确范围和验收标准。
基于证据纠偏，不靠猜测借助测试、日志、CI 输出和评审反馈，按照当前规格修正偏差。
复用项目记忆沉淀关键决策和根因，让下一个任务从真实上下文出发。

准备好后再安装一条命令，装齐三个技能。

npx skills add H2Sxxa/spec-coding-skills --all

核心闭环

规划 -> 纠偏 -> 记忆

三个技能会彼此增强，而不是像彼此割裂的提示词那样各自运作。

仓库级控制

Root SPEC.md

仓库无需 fork 技能，就能通过根目录配置覆盖语言、验证命令和知识库路径。

演示基准

+88.9 分

在一个本地 3 轮提示的小型演示中，技能引导输出与预期工作流结构的匹配度明显更高。

三个技能

一个闭环，串起规划、纠偏与持久记忆。

每个技能单独使用都有效，但真正的价值在于它们能在任务生命周期中彼此传递上下文。

spec-plan

把模糊请求整理成可执行的规格

在实现开始漂移之前，先明确范围边界、假设、验收标准、验证步骤、执行护栏和阻塞问题。

打开文档

spec-crlp

基于证据调试，而不是靠猜

结合 lint、测试、日志、CI 输出和评审反馈，围绕当前规格与当前代码运行纠偏闭环。

打开文档

spec-index

构建可检索的项目记忆

沉淀决策、根因、修复模式、风险点和验证规则，让后续任务从上下文出发，而不是从零摸索。

打开文档

默认工作流

这套闭环在真实仓库里如何运作。

这套流程在日常使用中依然很轻量：先读取本地约定，再围绕明确的完成条件做规划，并在运行证据与预期不一致时补齐差距。

先读仓库约定

如果目标仓库定义了根目录 SPEC.md，技能就会据此遵循本地语言、验证和知识库约定。

取回历史上下文

在规划或纠偏开始前，`spec-index` 会先查找相关决策、根因和风险点。

先定义完成标准，再开始实现

`spec-plan` 会把模糊请求整理成可执行规格，包含可测试的验收标准和执行护栏。

在常规编码循环中实现

这些技能不会取代编码，而是收紧“应该做什么”和“如何验证”的边界。

用真实反馈闭环纠偏

当现实与规格出现偏差时，`spec-crlp` 会基于证据执行“修复-验证-重复”的闭环，而不是悄悄改变目标。

沉淀可复用经验

可复用的发现会回流到 `spec-index`，让后续任务继承项目记忆，而不是重复踩坑。

演示基准

一个小信号，说明这套流程确实会改变 agent 的行为方式。

在一个本地 3 轮提示的 Codex 演示中，技能引导输出在规划、纠偏和记忆结构上，比通用基线输出稳定得多。

演示总体结果

11.1% → 100.0%

+88.9 pts

规划一个已有功能

改进点

基线

33.3%

使用技能后

100.0%

在实现前补齐范围边界、验收标准、验证计划和记忆上下文。

修复一个失败测试

改进点

基线

0.0%

使用技能后

100.0%

推动 agent 采用基于证据的调试方式，并显式记录根因、验证过程和记忆沉淀。

保存一个可复用的根因

改进点

基线

0.0%

使用技能后

100.0%

把一次性的调试知识整理成带结构、标签和复用条件的可检索项目记忆。

它衡量什么

这个基准检查 agent 是否产出了能让真实开发更稳妥的工作流产物：清晰的范围、可测试的验收标准、结构化的纠偏步骤，以及可检索的项目记忆。

它不宣称什么

这并不是对最终代码质量的统计性结论。更适合把它看作流程质量前后对比的紧凑演示，而不是通用基准声明。

更快上手

评估或采用这个项目所需的一切都在这里。

先看概览，验证本地工作流，再检查这个紧凑的基准，然后再把这些技能接入真实仓库。

概览

了解三个技能的职责，以及它们如何组成默认工作流。

阅读内容

测试

查看 smoke 测试、本地验证步骤，以及用于验证这个项目的小型 eval 流程。

阅读内容

演示基准

查看本地 3 轮提示基准，以及这些数字能说明和不能说明什么。

阅读内容