跳到主要内容
规划。纠偏。沉淀。

给 AI 编码代理一套更紧的规格闭环。

spec-coding-skills 帮助代理在编码前先定义完成标准,用证据修正偏差,并复用项目记忆,而不是每个任务都从零开始。

落到实践会怎样

规划、纠偏和记忆会始终连成一体,而不是在每个任务里临时拼凑。

  • 先界定范围,再开始实现把模糊需求整理成可直接落地的规格,明确范围和验收标准。
  • 基于证据纠偏,不靠猜测借助测试、日志、CI 输出和评审反馈,按照当前规格修正偏差。
  • 复用项目记忆沉淀关键决策和根因,让下一个任务从真实上下文出发。
准备好后再安装一条命令,装齐三个技能。
npx skills add H2Sxxa/spec-coding-skills --all
核心闭环

规划 -> 纠偏 -> 记忆

三个技能会彼此增强,而不是像彼此割裂的提示词那样各自运作。

仓库级控制

Root SPEC.md

仓库无需 fork 技能,就能通过根目录配置覆盖语言、验证命令和知识库路径。

演示基准

+88.9 分

在一个本地 3 轮提示的小型演示中,技能引导输出与预期工作流结构的匹配度明显更高。

三个技能

一个闭环,串起规划、纠偏与持久记忆。

每个技能单独使用都有效,但真正的价值在于它们能在任务生命周期中彼此传递上下文。

spec-plan

把模糊请求整理成可执行的规格

在实现开始漂移之前,先明确范围边界、假设、验收标准、验证步骤、执行护栏和阻塞问题。

打开文档
spec-crlp

基于证据调试,而不是靠猜

结合 lint、测试、日志、CI 输出和评审反馈,围绕当前规格与当前代码运行纠偏闭环。

打开文档
spec-index

构建可检索的项目记忆

沉淀决策、根因、修复模式、风险点和验证规则,让后续任务从上下文出发,而不是从零摸索。

打开文档
默认工作流

这套闭环在真实仓库里如何运作。

这套流程在日常使用中依然很轻量:先读取本地约定,再围绕明确的完成条件做规划,并在运行证据与预期不一致时补齐差距。

01

先读仓库约定

如果目标仓库定义了根目录 SPEC.md,技能就会据此遵循本地语言、验证和知识库约定。

02

取回历史上下文

在规划或纠偏开始前,`spec-index` 会先查找相关决策、根因和风险点。

03

先定义完成标准,再开始实现

`spec-plan` 会把模糊请求整理成可执行规格,包含可测试的验收标准和执行护栏。

04

在常规编码循环中实现

这些技能不会取代编码,而是收紧“应该做什么”和“如何验证”的边界。

05

用真实反馈闭环纠偏

当现实与规格出现偏差时,`spec-crlp` 会基于证据执行“修复-验证-重复”的闭环,而不是悄悄改变目标。

06

沉淀可复用经验

可复用的发现会回流到 `spec-index`,让后续任务继承项目记忆,而不是重复踩坑。

演示基准

一个小信号,说明这套流程确实会改变 agent 的行为方式。

在一个本地 3 轮提示的 Codex 演示中,技能引导输出在规划、纠偏和记忆结构上,比通用基线输出稳定得多。

演示总体结果

11.1% → 100.0%

+88.9 pts

规划一个已有功能

改进点
基线

33.3%

使用技能后

100.0%

在实现前补齐范围边界、验收标准、验证计划和记忆上下文。

修复一个失败测试

改进点
基线

0.0%

使用技能后

100.0%

推动 agent 采用基于证据的调试方式,并显式记录根因、验证过程和记忆沉淀。

保存一个可复用的根因

改进点
基线

0.0%

使用技能后

100.0%

把一次性的调试知识整理成带结构、标签和复用条件的可检索项目记忆。

它衡量什么

这个基准检查 agent 是否产出了能让真实开发更稳妥的工作流产物:清晰的范围、可测试的验收标准、结构化的纠偏步骤,以及可检索的项目记忆。

它不宣称什么

这并不是对最终代码质量的统计性结论。更适合把它看作流程质量前后对比的紧凑演示,而不是通用基准声明。

更快上手

评估或采用这个项目所需的一切都在这里。

先看概览,验证本地工作流,再检查这个紧凑的基准,然后再把这些技能接入真实仓库。

概览

了解三个技能的职责,以及它们如何组成默认工作流。

阅读内容

测试

查看 smoke 测试、本地验证步骤,以及用于验证这个项目的小型 eval 流程。

阅读内容

演示基准

查看本地 3 轮提示基准,以及这些数字能说明和不能说明什么。

阅读内容