Superpowers

Agentic skills framework — 为 coding agent 注入工程纪律的完整 SDLC 工作流，composable skills + auto-triggering，横跨 Claude Code / Codex / Cursor / Gemini CLI 等 8+ 平台。
状态: active · 总分: 3.3/5 · 推荐度: 3/5

一句话总结

Superpowers 是一套把「软件工程纪律」编码为 agent skill 的框架——brainstorm → spec → plan → TDD → subagent-driven dev → review → ship，全链路流程由 skill 自动触发，而非靠 agent 自觉遵守。适合希望 agent 像 senior engineer 一样工作的开发者，不适合快速原型或一次性的简单任务。

总体评价

Superpowers 是一个高可见度的 agentic skills 框架。它的核心创新在于 auto-triggering：技能不是用户手动调用的命令，而是 agent 根据上下文自动激活的强制工作流。设计哲学上把 AI agent 视为「能力强但缺乏纪律的初级工程师」，用硬性流程关卡（brainstorming 的「无 spec 不写代码」、TDD 的「先写测试再写实现」、debugging 的「无根因不修 bug」）来弥补 agent 天然的随意性 [Docs]。

219k stars 是极高的点时可见度信号，但不能直接解释为生产采用或真实质量证明。项目仍不到一年历史、快速迭代带来了明显的成熟度问题：breaking changes 频繁、平台兼容性参差不齐（Claude Code 深度集成 vs OpenCode 相关问题曾被报告）、截至 2026-06-07 仍有 121 个 open issues 和 141 个 open PRs [GH] [GH:issues]。

如果你已经在用 Claude Code 做日常开发，Superpowers 值得认真尝试。如果你的 agent 平台是 Codex 或 OpenCode，体验会打折，但核心方法论仍然有价值。

推荐度：3/5

2026-06 推荐度重校准：年轻、有 breaking changes，高权限 hooks/subagents，独立验证不足。

角色定位：面向使用 coding agent（Claude Code、Codex、Cursor 等）进行中等复杂度以上项目开发，希望 agent 遵循严谨工程流程（TDD、spec-first、正式 review）的开发者。

推荐理由：

方法论扎实——TDD、root-cause debugging、subagent code review 是通行工程实践；Superpowers 将它们写成 agent 不可跳过的流程步骤 [Docs]
跨平台设计——同一套 skill markdown 文件，覆盖 Claude Code / Codex / Cursor / Gemini CLI / OpenCode / Copilot 等 agent 平台，降低单一客户端锁定风险 [Docs]
社区可见度——219k stars 是点时可见度信号；README/第三方资料提到 chardet v7.0.0 使用 TDD 流程获得 41x 性能提升的案例，但本条未独立复现实测 [Docs] [GH]

主要顾虑：

不到一年历史，版本迭代带有 breaking changes（slash command 废弃、review loop 替换），长期稳定性待观察
平台体验不均——Claude Code 得到最深度集成，其他平台受限于各自 agent 的能力边界
121 open issues / 141 open PRs 对于年轻项目仍是较高维护负载，其中曾有 worktree 数据损坏、subagent HEAD 游离等实质性 bug 报告；本条不声明这些 issue 当前仍未修复 [GH] [GH:issues]
Token 消耗不小——subagent-driven development 的 full review loop 在 Codex 上有过消耗 5h token 预算的 issue 报告；本条未复测当前版本 token 消耗（#1152 [GH:issues]）

结论：如果你在 Claude Code 上做 TDD 式中大型项目，可以谨慎试用；如果在 Codex/其他平台，可以关注但预期体验有折扣。对快速原型/一次性脚本场景过度设计，不适合。

优势

Auto-triggering 机制——技能根据上下文自动激活，不需要用户记住命令或手动调用。这是 Superpowers 区别于 Spec Kit（slash command 驱动）最本质的设计差异。
完整 SDLC 覆盖——从 brainstorming 到 finishing-a-development-branch，7 步工作流覆盖整个开发生命周期，每个步骤有明确的 gate condition 防止 agent 走捷径。
TDD 流程——test-driven-development 技能要求 RED-GREEN-REFACTOR 循环，强制 agent 先写失败测试再写实现；chardet 案例按文档/第三方资料作为参考，不作为本条实测证据 [Docs]。
Subagent 架构——subagent-driven-development 文档化 fresh context、spec compliance review 与 code quality review；本条把它作为设计面评价，未实测 agent 能稳定自主工作数小时 [Docs]。
维护者背景——Jesse Vincent 的公开工程履历可解释项目方法论来源，但本条不据此推断当前维护响应速度或生产质量。
社区可见度——GitHub stars / forks 是高可见度信号；Discord 活跃度、生态广度和维护者响应速度本轮未重新核验，不能据此推断生产采用。
MIT 许可 + 纯 Markdown 技能格式——零厂商锁定，技能可以 fork/定制/跨平台迁移。

劣势

仍不到一年的项目——2025 年 10 月创建，版本号已到 v5.1.0，版本迭代快速，breaking changes 常见。追求最新版的用户需要持续跟进更新。
Claude Code 偏倚——README/文档侧重 Claude Code 体验，其他平台体验可能打折扣。旧 issue 曾报告 OpenCode 上 skill 工具函数缺失（#1492 [GH:issues]），这类平台差异仍需复核当前版本。
Worktree 依赖——using-git-worktrees 是核心工作流步骤；旧 issue 曾报告过 repo/worktree 相关故障（#1546 [GH:issues]），在其他平台上实现程度不一。
重流程，轻上下文——完整的 7 步工作流对于小修改/小项目是明显过度工程。框架没有内建的「轻量模式」或按场景自动降级的设计。
文档分散——主要文档在 README 和内联 skill 文件里，没有独立文档站点。对非 Claude Code 平台的安装和使用说明不够详尽。
Token 成本——subagent-driven development 的 full review loop 在复杂 plan 上 token 消耗可观；旧 issue #1152 报告过完整 5h token 预算被单次运行耗尽，本条未复测当前版本 [GH:issues]。
SessionStart hook 的隐式执行——技能通过 platform hook 自动注入 context，用户可能不知道 agent 加载了哪些 skill。这既是优势（自动触发），也是透明性/安全性的 trade-off。

适合什么场景

使用 Claude Code 做中大型项目的日常开发
希望 agent 强制遵循 TDD 和 spec-first 流程
需要 agent 自主工作数小时不偏离计划的复杂任务
多 agent 平台环境，想用统一方法论管理
学习 agentic SDLC 方法论——即使不完全采纳，workflow 设计本身有学习价值

不适合什么场景

快速原型、一次性脚本、探索性 coding——7 步工作流是过度负担
小项目/简单修改——相对于工作量，流程开销不成比例
非 Claude Code 平台且对 agent 体验要求高——Codex/OpenCode 上的 Superpowers 不如 Claude Code 上顺滑
对 token 成本极度敏感的场景——subagent review loop 有不可忽视的消耗
不想频繁跟进 breaking changes 的稳定型团队——项目仍在快速演进期

与类似项目对比

项目	定位	相对本项目
github/spec-kit	Spec-Driven Development 工具包，slash command 驱动	定位不同：Spec Kit 更偏 artifact-centric（spec 是持久产物），Superpowers 更偏 process-centric（流程是核心）与 auto-triggering；两者可以互补而非替代。
Claude Code 内置 skills	Claude Code 自带的基础技能	Superpowers 额外文档化 brainstorming/planning/subagent workflow 等流程；是否替代内置 skills 取决于使用场景。
OpenCode built-in skills	OpenCode 内置技能系统	与 Claude Code 类似，基础功能。Superpowers 的 OpenCode 支持曾有 issue 报告（#1492 [GH:issues]），当前版本需复核。
Cursor Rules	Cursor 的指令注入机制	Cursor Rules 更偏 instruction 注入；Superpowers 更偏可迁移 workflow/skill 文档。
goose / auggie 内置 workflow	各平台自带的开发辅助	各平台 workflow 与 Superpowers 的跨平台 skill 文件定位不同；本条不评价谁更优。

它能做什么

14 个 composable skill，分四个类别 [Docs]：

类别	技能	核心功能
Testing	test-driven-development	RED-GREEN-REFACTOR 循环，写入反模式参考
Debugging	systematic-debugging	4 阶段根因追溯（调查→假设→修复→验证）
	verification-before-completion	确认修复确实生效
Collaboration	brainstorming	Socratic 式设计精化，产出 spec 文档
	writing-plans	将设计拆分为 2-5 分钟的可执行任务，含精确文件路径和验证步骤
	executing-plans	批量执行 plan，人类检查点介入
	dispatching-parallel-agents	并行 subagent 工作流
	subagent-driven-development	逐任务分派 fresh subagent，两阶段 review
	requesting-code-review	Pre-review checklist，severity-based issue tracking
	receiving-code-review	如何处理 review 反馈
	using-git-worktrees	隔离分支 workspace，验证 test baseline
	finishing-a-development-branch	merge/PR/keep/discard 决策 + 清理
Meta	writing-skills	按最佳实践创建新 skill，含测试方法论
	using-superpowers	技能系统入门指南

支持平台 [Docs]：Claude Code（官方 marketplace + 社区 marketplace）、Codex CLI/App、Cursor、Gemini CLI、OpenCode、GitHub Copilot CLI、Factory Droid、Goose CLI、Kilo Code。

能力评分 4/5。覆盖完整 SDLC、支持 8+ 平台，但非 Claude Code 平台体验需额外复核（OpenCode 技能工具调用曾有 #1492 报告 [GH:issues]），且没有 built-in CI/CD 集成（需外部触发）。

运行环境与资源占用

场景	CPU	内存	存储	说明
最小	N/A	N/A	< 5 MB	仅安装 skill 文件，本地文件系统

运行时：无持久服务——Superpowers 是一组 markdown 文件 + shell script hooks + JS plugin manifests。实际运行由 agent（Claude Code / Codex 等）驱动
操作系统：macOS / Linux / Windows（WSL），取决于目标 agent 的平台支持
Docker：无
GPU：不需要
外部依赖：git（worktree 功能需要 Git ≥ 2.5）+ 至少一个支持的 coding agent + 该 agent 的 API 额度

评分 4/5。作为纯 markdown + 少量 shell/JS 的框架，自身资源占用极低（< 5 MB 磁盘）。但框架的 subagent 编排设计会显著增加 agent 运行时的 token 消耗；旧 issue #1152 报告过 5h 预算被单次运行耗尽，本条未复测当前版本 [GH:issues]。

上手体验

安装难度因平台而异 [Docs]：

Claude Code（最佳）：/plugin install superpowers@claude-plugins-official，一键安装，即刻生效
Cursor：/add-plugin superpowers，同样简单
Codex CLI/App：需要手动 "fetch and follow instructions from .codex/INSTALL.md"，非原生 marketplace
OpenCode：类似 Codex；旧 issue 曾报告 skill 函数缺失问题（#1492 [GH:issues]），当前版本需复核
Gemini CLI：gemini extensions install 命令，较简洁

初次体验：开始新 session 后说 "help me plan this feature"，如果安装正确，agent 会宣布正在使用哪个 skill 并进入格式化流程。但第一次遇到完整的 brainstorming → plan → review 链路时，流程感可能令人不适应——从「直接写代码」到「先回答 5 个 Socratic 问题」的切换需要心理准备。

评分 3/5。Claude Code 上接近 4，但其他平台拉低了平均值。安装方式不统一，非 Claude Code 平台缺乏充分的故障排查文档。

代码质量

语言分布：Shell 66.4%、JavaScript 24.8%、HTML + Python + TypeScript 少量 [GH]。

项目结构清晰：skills/ 目录每个 skill 有独立文件夹，内含 SKILL.md + references/ + templates/ 等子目录。docs/ 下有测试文档和平台特定 README。

测试方面 [Docs]：有专门的 docs/testing.md，subagent-driven-development 的集成测试覆盖 6 个验证点（plan loading、full task text、self-review、review order、review loops、independent verification），但测试仅在 Claude Code headless 模式下运行（10-30 分钟耗时）。Token 使用分析工具有助于优化。

但关注点：

Shell 代码占总量的 2/3——大规模 shell 脚本可维护性天然低于强类型语言
121 open issues / 141 open PRs 对不到一年历史的项目仍显示较高维护负载；旧 issue 中有严重性较高的 bug 报告（worktree 损坏 #1546、subagent HEAD 游离 #1543、无声 stall #1545），本条不声明这些问题当前仍可复现 [GH] [GH:issues]
快速迭代节奏意味着 regression 风险——版本间行为变更需要用户主动跟进 release notes

评分 3/5。结构清晰，测试覆盖关键路径但有限（仅 Claude Code 平台），shell-heavy 代码基础维护成本中等，bug 密度需关注。

可扩展性

Superpowers 的 extensibility 是其设计核心之一 [Docs]：

writing-skills——完整的 skill 创作工作流：定义技能边界、编写 SKILL.md（含 trigger description、instructions、pitfalls）、创建 references/templates/assets、编写测试（test-first，测试先于 skill 实现）
SKILL.md 标准格式——纯 markdown + YAML frontmatter，任何人都可以创建新 skill 或 fork 现有 skill。不锁定特定 agent 平台
市场分发——Claude Code 有官方 + 社区 marketplace；Codex / Copilot 有各自的 marketplace；社区贡献路径清晰
平台 hooks——SessionStart hooks 允许 skill 在 session 开始时自动注入 context；每平台有独立的 install 脚本

但局限：

skill 之间的组合/编排逻辑主要由 agent 自动决定，创作者对触发顺序的控制力有限
没有 skill 依赖声明机制——如果 skill A 依赖 skill B 的产出，无法在 SKILL.md 中形式化表达

评分 4/5。完全开放、跨平台、skill-first 的设计哲学，创作工具链完整（writing-skills + SKILL.md + 市场分发）。扣 1 分主要因为 skill 依赖声明机制缺失、触发顺序控制依赖 agent 自动判断——创作者的编排能力有限。

文档质量

主文档为 README.md，非常详尽：overview → installation（6 平台）→ 7 步工作流 → 技能库表格 → 哲学 → 常见问题 [Docs]。

docs/ 下有 testing.md（集成测试说明）、各平台特定 README（codex、opencode、windows），以及 plans/ 和 superpowers/ 子目录。

不足：

没有独立文档站点——所有文档散落在 repo 内
非 Claude Code 平台的安装/故障排查文档较薄弱
技能行为细节大量内联在 SKILL.md 文件中而非集中文档——要理解一个 skill 的完整行为，需要直接读其 markdown 文件
版本间行为变更的迁移指南缺失（如 slash command 废弃、review loop 替换）

评分 3/5。README 是 5 分水平，但整体文档结构分散，缺少站点化和版本化。对非 Claude Code 用户不友好。

社区与成熟度

维度	评分	说明
社区活跃度	4/5	219k stars 的可见度极高；但 stars 是关注度信号，不等于生产采用证明。这里不给出未重新核验的 Discord 活跃度、registry 收录或响应速度判断
成熟度	2/5	2025-10-09 创建（仍不到一年），版本迭代快速，v5.1.0 中包含 breaking changes（slash command 废弃、review loop 替换、worktree 行为大改），API/行为稳定性无承诺

社区方面的积极信号主要限于本轮可核验的 GitHub 可见度、fork 数、issue/PR 活动和 release 标签；其他生态收录、Discord 活跃度或维护者响应速度需要另做来源采集后再写入。

成熟度方面的顾虑：版本迭代速度快且包含行为变更，用户需要持续跟进。旧 issue 中包含了一些可能影响日常使用的问题（silent stall #1545、HEAD 游离 #1543）；截至 2026-06-07 仍有 121 open issues / 141 open PRs [GH] [GH:issues]。对追求稳定的团队而言，这是最大的风险点。

安全与风险

Superpowers 本身主要是一组 markdown 文件 + shell 脚本 + JS plugin manifests；本条未发现其提供持久网络服务或中心化状态，但仍需审查安装脚本、hooks 与 npm supply chain [GH] [Docs]。

具体风险点：

SessionStart 自动执行：各平台的 SessionStart hook 会在 session 开始时自动运行 install 脚本，如果安装了不可信来源的社区 skill，存在执行恶意代码的理论风险
Subagent 权限：subagent-driven development 会分派 subagent 执行代码，subagent 拥有与主 agent 相同的文件系统权限。恶意 skill 可能通过 subagent 执行有害操作
依赖信任链：Superpowers 通过 npm 发布 plugin，其依赖链的安全性取决于 npm 生态的供应链安全

评分 3/5。作为纯文件框架，无网络服务、无用户数据——攻击面天生低。但 SessionStart 自动执行、subagent 全权限继承、npm 供应链依赖构成了非零风险。项目无形式化威胁模型、无签名发布、无权限边界——这些缺失使得 3 分比 4 分更符合事实。

学习价值

高。即使不完全采纳 Superpowers，其方法论有独立学习价值：

Agentic SDLC 设计——brainstorm → spec → plan → subagent TDD → review → ship 的链路是目前最完整的 agent 工作流参考实现。理解它有助于设计自己的 agent workflow
Skill 触发模型——auto-triggering vs slash-command 的设计差异是 agent interaction design 的核心议题。Superpowers 提供了一个极端（流程优先）的参考
TDD 在 agent 语境下的实践——chat-based TDD 与传统 IDE TDD 在节奏和约束上有本质差异，Superpowers 的 TDD skill 提供了 agent 原生的 TDD 流程设计
Subagent 编排——fresh context per task + two-stage review 的组合对于理解 agent 上下文管理有参考价值
写作 SKILL.md 的方法论——writing-skills 本身是关于「如何写好的 agent instruction」的元技能，包含测试 methodology，可迁移到任何 skill/instruction 创作场景

Guides

Vibecoding Guide

Knowledge Base

Mcp

Memory

Prompts

Skills

Probes

Vector Search

Platforms

Programming Language Guides

Go

Rust

Android Privacy Tools

Superpowers

Superpowers

一句话总结

总体评价

推荐度：3/5

优势

劣势

适合什么场景

不适合什么场景

与类似项目对比

它能做什么

运行环境与资源占用

上手体验

代码质量

可扩展性

文档质量

社区与成熟度

安全与风险

学习价值

Vibecoding Guide

Go

Rust

Superpowers

Superpowers ​

一句话总结 ​

总体评价 ​

推荐度：3/5 ​

优势 ​

劣势 ​

适合什么场景 ​

不适合什么场景 ​

与类似项目对比 ​

它能做什么 ​

运行环境与资源占用 ​

上手体验 ​

代码质量 ​

可扩展性 ​

文档质量 ​

社区与成熟度 ​

安全与风险 ​

学习价值 ​

Superpowers

一句话总结

总体评价

推荐度：3/5

优势

劣势

适合什么场景

不适合什么场景

与类似项目对比

它能做什么

运行环境与资源占用

上手体验

代码质量

可扩展性

文档质量

社区与成熟度

安全与风险

学习价值