Scientific Agent Skills

135 个即用型科学 Agent Skills，横跨生物信息学、化学信息学、蛋白质组学、临床研究、材料科学、机器学习等 17+ 领域，基于开放的 Agent Skills 标准。由 K-Dense Inc. 维护。
状态: active · 总分: 3.9/5 · 推荐度: 3/5

一句话总结

面向生物医药/化学/材料/数据科学研究者的 Agent Skills 集合：通过 135 个精心编排的技能文档，将任何支持 Agent Skills 标准的 AI agent 转化为能执行复杂多步科学工作流的研究助手。

总体评价

Scientific Agent Skills 是目前开源生态中覆盖面最广的科学 Agent Skills 合集之一。其核心价值不在于提供新工具，而在于为 135 个科学 Python 库、数据库和平台提供结构化、经过工程优化的 skill 文档——每个 skill 包含代码模式、最佳实践、常见陷阱和参考材料，使得 AI agent 能可靠地编排复杂的科学管线。

适合：使用 Cursor/Claude Code/Codex 等现代 agent 进行科学计算的研究者；需要快速搭建药物发现、基因组分析、材料筛选等管线的团队。

不适合：不使用 Agent Skills 生态的研究者（需先采纳支持该标准的 agent）；研究领域偏纯数学/理论物理（当前 skills 偏应用科学）。

一句话：若你的研究涉及已验证的 17+ 科学领域且使用现代 AI agent，这是值得优先关注的技能包之一；但 7 个月的年龄和高度集中于 K-Dense 的维护模式是长期依赖的关键风险。

推荐度：3/5

2026-06 推荐度重校准：采用证据弱，skill/code-execution 模型有指令供应链风险，维护集中；阅读价值高但采用推荐应保守。

角色定位：面向使用 Claude Code、Cursor、Codex 或 Gemini CLI 进行科学计算的研究者，特别是生物信息学、药物发现、化学信息学、临床研究、材料科学、单细胞组学等领域的从业者。

推荐度降至 3/5 后，保留的核心正面理由是领域匹配度：对上述领域的研究者而言，这是一套覆盖面极广、文档质量优秀的即用技能集；但对于纯数学/物理/随机图方向（Develata 的研究重点），受益有限。另外，项目仅 7 个月历史且维护高度集中于 K-Dense，中期可持续性存疑。

核心痛点：仅 7 个月历史 — 未经历足够时间的社区压力测试；版本迭代极快但无稳定性承诺和迁移指南；高度依赖 K-Dense 组织，关键人物风险显著。

结论：值得了解、跟踪并尝试安装几个与你研究相关的 skill，但不应将其视为不可替代的基础设施。将关键人物/组织集中风险纳入依赖评估。

优势

领域覆盖极广 — 135 个 skill、100+ 数据库、70+ 优化的 Python 包 skill，覆盖 17+ 科学领域。这是当前开源生态中最全面的科学 Agent Skills 合集
文档质量高 — 每个 skill 包含完整的使用指南、代码示例、最佳实践章节和常见陷阱，远超市面上大多数「只给 prompt 模板」的 skill 项目；23 个完整工作流示例展示了多 skill 编排能力
基于开放标准 — 遵循 Agent Skills 开放标准（agentskills.io），不限特定 agent 平台，Cursor、Claude Code、Codex、Gemini CLI 均可使用
安装简便 — npx skills add 或 gh skill add 一键安装，agent 自动发现可用 skill
安全流程 — 明确的安全免责声明 + 每周 LLM 安全扫描（Cisco AI Defense Skill Scanner）+ 用户自查指引

劣势

项目极年轻 — 创建于 2025 年 10 月，仅 7 个月历史，尚未经历足够的时间检验和社区压力测试
维护高度集中 — 组织账号 K-Dense-AI 维护，顶级贡献者 TKassis（105 次贡献）远超其他贡献者（38-9 次），关键人物风险显著
领域偏应用科学 — 对纯数学、理论物理、计算理论等方向覆盖不足；Develata 的随机图研究方向受益有限
安全模型依赖用户自查 — skill 可执行任意代码、安装包、网络请求、修改文件，安全最终责任在用户侧，skill 审查机制无法完全消除供应链风险
无稳定性承诺 — 版本号从 v2.34 跳到 v2.38（数周内），无版本策略文档，无迁移指南，无人工撰写的 CHANGELOG（release note 为自动化生成的提交列表），API 稳定性无保障
生态系统依赖 — 需要 Python 3.11+、uv 包管理器、支持 Agent Skills 标准的 agent，有轻微的生态锁定效应

适合什么场景

使用 Claude Code/Cursor/Codex 等现代 agent 进行生物信息学或化学信息学研究
需要快速搭建药物发现管线（ChEMBL → RDKit → DiffDock → AlphaFold → PubMed）
单细胞 RNA-seq 分析（Scanpy → Cellxgene → PyDESeq2 → Reactome/KEGG）
临床变异解读（VCF → Ensembl VEP → ClinVar → COSMIC → 临床报告）
材料科学计算、量子化学、分子动力学模拟
研究 grant 写作、科学海报/幻灯片制作、文献综述（附带的分析与写作工具）
需要一键接入 78+ 科学数据库（ChEMBL、PubChem、ClinVar、COSMIC 等）

不适合什么场景

纯数学/随机图/统计物理研究 — 当前 skill 覆盖不足，受益有限
不使用 Agent Skills 标准 agent 的研究者 — 需先采纳支持该标准的工具
对供应链安全要求极高的环境 — skill 执行任意代码，安全最终依赖用户审查
需要长期稳定 API 的项目 — 项目仅 7 个月历史，无稳定性承诺
希望「all-in-one」工具而非 skill 集合的场景 — 这只是给 agent 的提示/文档，不提供独立的 GUI 或运行时

与类似项目对比

项目	定位	相对本项目
Claude Scientific Writer	K-Dense 旗下的科学写作专用技能集	本项目覆盖面更广（含实验分析等），但写作专项不如 CSW 深入
awesome-claude-skills 生态	社区维护的松散 skill 集合	本项目统一管理、质量一致，社区版本碎片化但跨组织风险更低
Aminer / Paper Digest	学术搜索引擎/文献综述	本项目是 agent 技能文档，不是搜索服务；可与搜索服务互补
各库官方文档	RDKit、Scanpy 等科学库的官方文档	本项目提供「让 agent 可靠使用这些库」的结构化指导，与官方文档互补而非替代

与 Claude Scientific Writer 的区别：CSW 专注科学写作（论文、审稿、海报），Scientific Agent Skills 涵盖从实验到写作的全流程。两者出自同一组织，可配合使用。

它能做什么

科学数据库查询：通过统一的 database-lookup skill 接入 78+ 公共 REST API（ChEMBL、PubChem、ClinVar、COSMIC、UniProt、Ensembl、Reactome、KEGG、Open Targets 等），另有专用 skill 覆盖 DepMap、Imaging Data Commons、PrimeKG、U.S. Treasury 等。

Python 科学计算：70+ 优化的 Python 包 skill，包括 RDKit（化学信息学）、Scanpy（单细胞分析）、PyTorch Lightning（深度学习）、BioPython、OpenMM（分子动力学）、PennyLane/Qiskit（量子计算）、TimesFM（时间序列预测）、scVelo（RNA 速度）等。每个 skill 包含文档和使用示例，目标是提升 agent 在对应库上的代码生成可靠性和上下文感知能力。

分析工具与科学写作：30+ 分析/写作工具涵盖文献综述、科学写作、同行评审、海报生成、幻灯片制作、Mermaid 图表、文档处理等。另有 10+ 研究/临床工具：假设生成、grant 写作、临床决策支持、治疗方案制定、法规合规检查、情景分析等。

科学平台集成：Benchling、DNAnexus、LatchBio、OMERO、Protocols.io 等科学平台的专用集成 skill。

完整工作流：23 个工作流示例展示多 skill 编排，详见 docs/examples.md [Docs:examples]。

运行环境与资源占用

场景	CPU	内存	存储	说明
最小（仅 skill 文件）	N/A	N/A	~35 MB	纯 markdown 文件，零运行时
日常使用	2-4 cores	按 Python 科学包	~35 MB + pip 包	按需安装依赖，非一次性全量

运行时：Skill 文件本身为纯 markdown，运行时由 agent（Claude Code / Codex 等）驱动，Python 包按需安装
操作系统：macOS、Linux、Windows WSL2 [GH]
Docker：无
GPU：不需要（skill 集合本身，底层科学包可能用到 GPU）
外部依赖：Python 3.11+（推荐 3.12+），uv 包管理器 [GH]

性能评价：Skill 文件本身是纯 markdown，零运行时开销。资源占用的主体是各 skill 引用的 Python 科学包，但这些包的安装是按需触发的——只有被激活的 skill 才会安装对应依赖。与「一次性安装全量依赖」的方案相比，这种设计在磁盘和内存占用上更高效。评分 5/5 反映的是 skill 集合本身的设计效率，而非底层科学包的性能特征。

上手体验

安装路径：

bash

# 通用方式
npx skills add K-Dense-AI/scientific-agent-skills

# 或通过 GitHub CLI (v2.90.0+)
gh skill install K-Dense-AI/scientific-agent-skills

# 锁定特定版本
gh skill install K-Dense-AI/scientific-agent-skills --pin

安装后 agent 自动发现 skill，也可在 prompt 中显式调用。

入门时间估算：

安装到首次使用：5-10 分钟（需预装 Python 3.11+ 和 uv）
读懂 README 并运行第一个示例工作流：30-60 分钟
为特定研究问题编排自定义多 skill 管线：需领域知识 + 2-4 小时实验

文档引导：README 包含 4 个代表性工作流（药物发现、单细胞 RNA-seq、虚拟筛选、临床变异解读）[GH]，23 个完整示例在 docs/examples.md [Docs:examples]，scientific-skills.md 提供完整 skill 目录。

学习曲线：技能本身不陡——本质上就是让 agent 读文档后写代码。实际门槛在于：(1) 理解何时激活哪个 skill；(2) 编排多 skill 管线；(3) 领域知识（需要懂得该领域的分析流程才能有效指挥 agent）。

代码质量

项目结构：scientific-skills/ 目录按领域组织，每个 skill 为独立子目录，包含 SKILL.md（主文档）及可选的 references/ 和 scripts/ 子目录。结构一致性好。

SKILL.md 质量：以 RDKit skill 为例 [GH]，包含 12 个核心能力章节、工作流示例、最佳实践、常见陷阱、参考文件链接和示例脚本。代码示例丰富且可执行。minor 问题：社区 PR 中曾出现内部链接断裂（reference/ → references/），属于模板批量生成中的路径不一致 [GH:PR]。

CI/CD：自动化 release（github-actions 自动发布，无人工撰写 release note），社区 PR 有社区审查流程，但未见正式的 CI 测试覆盖（如 skill 示例代码的自动化测试）。

维护模式：高度自动化 + 社区贡献，但核心维护精力高度集中于 TKassis。贡献者多样性偏低（top 贡献者 105 次，第二仅 38 次）。

总体：结构良好，skill 文档质量一致；minor 链接断裂问题可修但非致命；测试覆盖不足和贡献者集中是长期隐忧。评分 4/5 反映结构质量和一致性，减去测试和贡献者分散度的扣分。

可扩展性

添加自定义 skill：遵循 Agent Skills 开放标准，用户可在同一目录下创建自定义 SKILL.md 文件，agent 自动发现。Skill 格式有明确规范，RDKit 等示例可作为模板参考 [GH]。

Fork 开发：MIT 许可证允许任意 fork 和修改。但由于项目更新频繁（数周内多个 minor 版本），fork 可能面临与上游同步的维护成本。

社区贡献：通过 PR 贡献新的 skill 或修复，流程清晰 [GH:PR]，社区已有多个贡献者提交 skill 优化。

局限性：没有正式的「插件注册系统」或「skill 市场」— 添加 skill 就是提交 PR 或在本地 fork。对于组织级使用场景，缺少 skill 版本管理和依赖解析。

评分 4/5：技能添加机制清晰、MIT 许可开放、fork-friendly，但缺少组织级的 skill 管理和版本控制工具。

文档质量

文档分为两层：

产品文档（skill 作为文档产品）：

23 个完整工作流示例 [Docs:examples]，覆盖从药物发现到量子计算的多领域
README 质量高：功能列表、安装说明、安全警告、代表性示例 [GH]
每个 SKILL.md 结构一致，包含能力说明、代码示例、最佳实践、陷阱、参考资料
代码示例丰富且贴近实际使用场景

项目文档：

README 详尽，in-code 注释充分
无 CHANGELOG——release note 为自动化生成的提交列表，无人工撰写的变更摘要 [GH:releases]
无架构文档（说明为什么 skill 按此方式组织，设计原则等）
无迁移指南（版本间变更无记录）

总体：产品层文档质量 4-5 分水平；项目层文档有缺失。给定 99% 的用户是「使用 skill 的科学研究者」而非「贡献者」，加权偏向产品层。评分 4/5。

社区与成熟度

维度	评分	说明
社区活跃度	4/5	22,747 stars，2,456 forks，158+ PR 活跃合并 [GH:PR]。37 个 open issue 相对于项目规模极低，说明质量较高或响应及时。但贡献者集中度高（TKassis 105 次，第二仅 38 次），跨组织贡献正在增长但核心仍在 K-Dense
成熟度	3/5	仅 7 个月历史（2025-10-19 至今），版本迭代极快但无稳定性承诺和迁移指南。未发现直接的破坏性变更证据，但快速的版本号跳跃（v2.34→v2.38 数周内）提示 API 稳定性可能不是当前优先事项。项目在 GitHub 上不是 archived 状态且持续活跃，但尚未进入「可以放心依赖」的成熟阶段

安全与风险

代码执行风险：skill 本质上是给 agent 的操作指南，agent 会根据 skill 指令执行任意 Python 代码、安装包、发起网络请求、修改文件。项目明确声明用户需自行审查 skill 内容后才使用 [GH]。每周通过 Cisco AI Defense Skill Scanner 进行 LLM 安全扫描 [GH:security]。

供应链风险：135 个 skill 依赖大量第三方 Python 包（RDKit、Scanpy、PyTorch 等），供应链攻击面广。每个 skill 可独立安装其依赖，减少了不必要的暴露，但无法消除底层包的风险。

许可风险：MIT 许可证，无 copyleft 约束，商业友好。

数据隐私：科学数据库查询通过公共 API 进行，谨慎处理敏感研究数据（如患者 VCF 文件）的用户应注意网络传输和数据驻留。

总体：攻击面由设计决定（skill = 代码执行），已有安全扫描流程但不完美。评分 3/5 反映「有安全关注点，但不影响正常使用」——前提是用户执行了建议的安全审查。

学习价值

值得学习：

Skill 工程化：如何将科学 Python 库的使用模式系统化为结构化的 agent skill 文档。RDKit skill 是一个优秀的参考样本 [GH]——从能力说明到代码模式到最佳实践到常见陷阱的完整结构
工作流编排：23 个示例展示了多 skill 的链式编排模式，对设计自己的 agent skill 或工具链有参考价值
科学 agent 设计模式：如何平衡 skill 的「通用性」（让 agent 理解何时用）和「具体性」（提供足够细节让 agent 不出错）
安全模型：明确的安全边界声明（用户最终负责）和安全扫描集成是 agent skill 安全设计的务实参考

局限性：项目的学习价值在于「如何写好的 agent skill」，而非「如何构建 agent infrastructure」。它是一个应用案例，而非架构参考。

适合阅读的受众：想为自己的研究领域编写 agent skills 的研究者；对科学 agent 管线设计感兴趣的工具开发者；想理解 agent skill 最佳实践的 AI 工程师。

Guides

Vibecoding Guide

Knowledge Base

Mcp

Memory

Prompts

Skills

Probes

Vector Search

Platforms

Programming Language Guides

Go

Rust

Android Privacy Tools

Scientific Agent Skills

Scientific Agent Skills

一句话总结

总体评价

推荐度：3/5

优势

劣势

适合什么场景

不适合什么场景

与类似项目对比

它能做什么

运行环境与资源占用

上手体验

代码质量

可扩展性

文档质量

社区与成熟度

安全与风险

学习价值

Vibecoding Guide

Go

Rust

Scientific Agent Skills

Scientific Agent Skills ​

一句话总结 ​

总体评价 ​

推荐度：3/5 ​

优势 ​

劣势 ​

适合什么场景 ​

不适合什么场景 ​

与类似项目对比 ​

它能做什么 ​

运行环境与资源占用 ​

上手体验 ​

代码质量 ​

可扩展性 ​

文档质量 ​

社区与成熟度 ​

安全与风险 ​

学习价值 ​

Scientific Agent Skills

一句话总结

总体评价

推荐度：3/5

优势

劣势

适合什么场景

不适合什么场景

与类似项目对比

它能做什么

运行环境与资源占用

上手体验

代码质量

可扩展性

文档质量

社区与成熟度

安全与风险

学习价值