Scientific Agent Skills
135 个即用型科学 Agent Skills,横跨生物信息学、化学信息学、蛋白质组学、临床研究、材料科学、机器学习等 17+ 领域,基于开放的 Agent Skills 标准。由 K-Dense Inc. 维护。
状态:
active· 总分: 3.9/5 · 推荐度: 3/5
一句话总结
面向生物医药/化学/材料/数据科学研究者的 Agent Skills 集合:通过 135 个精心编排的技能文档,将任何支持 Agent Skills 标准的 AI agent 转化为能执行复杂多步科学工作流的研究助手。
总体评价
Scientific Agent Skills 是目前开源生态中覆盖面最广的科学 Agent Skills 合集之一。其核心价值不在于提供新工具,而在于为 135 个科学 Python 库、数据库和平台提供结构化、经过工程优化的 skill 文档——每个 skill 包含代码模式、最佳实践、常见陷阱和参考材料,使得 AI agent 能可靠地编排复杂的科学管线。
适合:使用 Cursor/Claude Code/Codex 等现代 agent 进行科学计算的研究者;需要快速搭建药物发现、基因组分析、材料筛选等管线的团队。
不适合:不使用 Agent Skills 生态的研究者(需先采纳支持该标准的 agent);研究领域偏纯数学/理论物理(当前 skills 偏应用科学)。
一句话:若你的研究涉及已验证的 17+ 科学领域且使用现代 AI agent,这是值得优先关注的技能包之一;但 7 个月的年龄和高度集中于 K-Dense 的维护模式是长期依赖的关键风险。
推荐度:3/5
2026-06 推荐度重校准:采用证据弱,skill/code-execution 模型有指令供应链风险,维护集中;阅读价值高但采用推荐应保守。
角色定位:面向使用 Claude Code、Cursor、Codex 或 Gemini CLI 进行科学计算的研究者,特别是生物信息学、药物发现、化学信息学、临床研究、材料科学、单细胞组学等领域的从业者。
推荐度降至 3/5 后,保留的核心正面理由是领域匹配度:对上述领域的研究者而言,这是一套覆盖面极广、文档质量优秀的即用技能集;但对于纯数学/物理/随机图方向(Develata 的研究重点),受益有限。另外,项目仅 7 个月历史且维护高度集中于 K-Dense,中期可持续性存疑。
核心痛点:仅 7 个月历史 — 未经历足够时间的社区压力测试;版本迭代极快但无稳定性承诺和迁移指南;高度依赖 K-Dense 组织,关键人物风险显著。
结论:值得了解、跟踪并尝试安装几个与你研究相关的 skill,但不应将其视为不可替代的基础设施。将关键人物/组织集中风险纳入依赖评估。
优势
- 领域覆盖极广 — 135 个 skill、100+ 数据库、70+ 优化的 Python 包 skill,覆盖 17+ 科学领域。这是当前开源生态中最全面的科学 Agent Skills 合集
- 文档质量高 — 每个 skill 包含完整的使用指南、代码示例、最佳实践章节和常见陷阱,远超市面上大多数「只给 prompt 模板」的 skill 项目;23 个完整工作流示例展示了多 skill 编排能力
- 基于开放标准 — 遵循 Agent Skills 开放标准(agentskills.io),不限特定 agent 平台,Cursor、Claude Code、Codex、Gemini CLI 均可使用
- 安装简便 —
npx skills add或gh skill add一键安装,agent 自动发现可用 skill - 安全流程 — 明确的安全免责声明 + 每周 LLM 安全扫描(Cisco AI Defense Skill Scanner)+ 用户自查指引
劣势
- 项目极年轻 — 创建于 2025 年 10 月,仅 7 个月历史,尚未经历足够的时间检验和社区压力测试
- 维护高度集中 — 组织账号 K-Dense-AI 维护,顶级贡献者 TKassis(105 次贡献)远超其他贡献者(38-9 次),关键人物风险显著
- 领域偏应用科学 — 对纯数学、理论物理、计算理论等方向覆盖不足;Develata 的随机图研究方向受益有限
- 安全模型依赖用户自查 — skill 可执行任意代码、安装包、网络请求、修改文件,安全最终责任在用户侧,skill 审查机制无法完全消除供应链风险
- 无稳定性承诺 — 版本号从 v2.34 跳到 v2.38(数周内),无版本策略文档,无迁移指南,无人工撰写的 CHANGELOG(release note 为自动化生成的提交列表),API 稳定性无保障
- 生态系统依赖 — 需要 Python 3.11+、uv 包管理器、支持 Agent Skills 标准的 agent,有轻微的生态锁定效应
适合什么场景
- 使用 Claude Code/Cursor/Codex 等现代 agent 进行生物信息学或化学信息学研究
- 需要快速搭建药物发现管线(ChEMBL → RDKit → DiffDock → AlphaFold → PubMed)
- 单细胞 RNA-seq 分析(Scanpy → Cellxgene → PyDESeq2 → Reactome/KEGG)
- 临床变异解读(VCF → Ensembl VEP → ClinVar → COSMIC → 临床报告)
- 材料科学计算、量子化学、分子动力学模拟
- 研究 grant 写作、科学海报/幻灯片制作、文献综述(附带的分析与写作工具)
- 需要一键接入 78+ 科学数据库(ChEMBL、PubChem、ClinVar、COSMIC 等)
不适合什么场景
- 纯数学/随机图/统计物理研究 — 当前 skill 覆盖不足,受益有限
- 不使用 Agent Skills 标准 agent 的研究者 — 需先采纳支持该标准的工具
- 对供应链安全要求极高的环境 — skill 执行任意代码,安全最终依赖用户审查
- 需要长期稳定 API 的项目 — 项目仅 7 个月历史,无稳定性承诺
- 希望「all-in-one」工具而非 skill 集合的场景 — 这只是给 agent 的提示/文档,不提供独立的 GUI 或运行时
与类似项目对比
| 项目 | 定位 | 相对本项目 |
|---|---|---|
| Claude Scientific Writer | K-Dense 旗下的科学写作专用技能集 | 本项目覆盖面更广(含实验分析等),但写作专项不如 CSW 深入 |
| awesome-claude-skills 生态 | 社区维护的松散 skill 集合 | 本项目统一管理、质量一致,社区版本碎片化但跨组织风险更低 |
| Aminer / Paper Digest | 学术搜索引擎/文献综述 | 本项目是 agent 技能文档,不是搜索服务;可与搜索服务互补 |
| 各库官方文档 | RDKit、Scanpy 等科学库的官方文档 | 本项目提供「让 agent 可靠使用这些库」的结构化指导,与官方文档互补而非替代 |
与 Claude Scientific Writer 的区别:CSW 专注科学写作(论文、审稿、海报),Scientific Agent Skills 涵盖从实验到写作的全流程。两者出自同一组织,可配合使用。
它能做什么
科学数据库查询:通过统一的 database-lookup skill 接入 78+ 公共 REST API(ChEMBL、PubChem、ClinVar、COSMIC、UniProt、Ensembl、Reactome、KEGG、Open Targets 等),另有专用 skill 覆盖 DepMap、Imaging Data Commons、PrimeKG、U.S. Treasury 等。
Python 科学计算:70+ 优化的 Python 包 skill,包括 RDKit(化学信息学)、Scanpy(单细胞分析)、PyTorch Lightning(深度学习)、BioPython、OpenMM(分子动力学)、PennyLane/Qiskit(量子计算)、TimesFM(时间序列预测)、scVelo(RNA 速度)等。每个 skill 包含文档和使用示例,目标是提升 agent 在对应库上的代码生成可靠性和上下文感知能力。
分析工具与科学写作:30+ 分析/写作工具涵盖文献综述、科学写作、同行评审、海报生成、幻灯片制作、Mermaid 图表、文档处理等。另有 10+ 研究/临床工具:假设生成、grant 写作、临床决策支持、治疗方案制定、法规合规检查、情景分析等。
科学平台集成:Benchling、DNAnexus、LatchBio、OMERO、Protocols.io 等科学平台的专用集成 skill。
完整工作流:23 个工作流示例展示多 skill 编排,详见 docs/examples.md [Docs:examples]。
运行环境与资源占用
| 场景 | CPU | 内存 | 存储 | 说明 |
|---|---|---|---|---|
| 最小(仅 skill 文件) | N/A | N/A | ~35 MB | 纯 markdown 文件,零运行时 |
| 日常使用 | 2-4 cores | 按 Python 科学包 | ~35 MB + pip 包 | 按需安装依赖,非一次性全量 |
- 运行时:Skill 文件本身为纯 markdown,运行时由 agent(Claude Code / Codex 等)驱动,Python 包按需安装
- 操作系统:macOS、Linux、Windows WSL2 [GH]
- Docker:无
- GPU:不需要(skill 集合本身,底层科学包可能用到 GPU)
- 外部依赖:Python 3.11+(推荐 3.12+),uv 包管理器 [GH]
性能评价:Skill 文件本身是纯 markdown,零运行时开销。资源占用的主体是各 skill 引用的 Python 科学包,但这些包的安装是按需触发的——只有被激活的 skill 才会安装对应依赖。与「一次性安装全量依赖」的方案相比,这种设计在磁盘和内存占用上更高效。评分 5/5 反映的是 skill 集合本身的设计效率,而非底层科学包的性能特征。
上手体验
安装路径:
# 通用方式
npx skills add K-Dense-AI/scientific-agent-skills
# 或通过 GitHub CLI (v2.90.0+)
gh skill install K-Dense-AI/scientific-agent-skills
# 锁定特定版本
gh skill install K-Dense-AI/scientific-agent-skills --pin安装后 agent 自动发现 skill,也可在 prompt 中显式调用。
入门时间估算:
- 安装到首次使用:5-10 分钟(需预装 Python 3.11+ 和 uv)
- 读懂 README 并运行第一个示例工作流:30-60 分钟
- 为特定研究问题编排自定义多 skill 管线:需领域知识 + 2-4 小时实验
文档引导:README 包含 4 个代表性工作流(药物发现、单细胞 RNA-seq、虚拟筛选、临床变异解读)[GH],23 个完整示例在 docs/examples.md [Docs:examples],scientific-skills.md 提供完整 skill 目录。
学习曲线:技能本身不陡——本质上就是让 agent 读文档后写代码。实际门槛在于:(1) 理解何时激活哪个 skill;(2) 编排多 skill 管线;(3) 领域知识(需要懂得该领域的分析流程才能有效指挥 agent)。
代码质量
项目结构:scientific-skills/ 目录按领域组织,每个 skill 为独立子目录,包含 SKILL.md(主文档)及可选的 references/ 和 scripts/ 子目录。结构一致性好。
SKILL.md 质量:以 RDKit skill 为例 [GH],包含 12 个核心能力章节、工作流示例、最佳实践、常见陷阱、参考文件链接和示例脚本。代码示例丰富且可执行。minor 问题:社区 PR 中曾出现内部链接断裂(reference/ → references/),属于模板批量生成中的路径不一致 [GH:PR]。
CI/CD:自动化 release(github-actions 自动发布,无人工撰写 release note),社区 PR 有社区审查流程,但未见正式的 CI 测试覆盖(如 skill 示例代码的自动化测试)。
维护模式:高度自动化 + 社区贡献,但核心维护精力高度集中于 TKassis。贡献者多样性偏低(top 贡献者 105 次,第二仅 38 次)。
总体:结构良好,skill 文档质量一致;minor 链接断裂问题可修但非致命;测试覆盖不足和贡献者集中是长期隐忧。评分 4/5 反映结构质量和一致性,减去测试和贡献者分散度的扣分。
可扩展性
添加自定义 skill:遵循 Agent Skills 开放标准,用户可在同一目录下创建自定义 SKILL.md 文件,agent 自动发现。Skill 格式有明确规范,RDKit 等示例可作为模板参考 [GH]。
Fork 开发:MIT 许可证允许任意 fork 和修改。但由于项目更新频繁(数周内多个 minor 版本),fork 可能面临与上游同步的维护成本。
社区贡献:通过 PR 贡献新的 skill 或修复,流程清晰 [GH:PR],社区已有多个贡献者提交 skill 优化。
局限性:没有正式的「插件注册系统」或「skill 市场」— 添加 skill 就是提交 PR 或在本地 fork。对于组织级使用场景,缺少 skill 版本管理和依赖解析。
评分 4/5:技能添加机制清晰、MIT 许可开放、fork-friendly,但缺少组织级的 skill 管理和版本控制工具。
文档质量
文档分为两层:
产品文档(skill 作为文档产品):
- 23 个完整工作流示例 [Docs:examples],覆盖从药物发现到量子计算的多领域
- README 质量高:功能列表、安装说明、安全警告、代表性示例 [GH]
- 每个 SKILL.md 结构一致,包含能力说明、代码示例、最佳实践、陷阱、参考资料
- 代码示例丰富且贴近实际使用场景
项目文档:
- README 详尽,in-code 注释充分
- 无 CHANGELOG——release note 为自动化生成的提交列表,无人工撰写的变更摘要 [GH:releases]
- 无架构文档(说明为什么 skill 按此方式组织,设计原则等)
- 无迁移指南(版本间变更无记录)
总体:产品层文档质量 4-5 分水平;项目层文档有缺失。给定 99% 的用户是「使用 skill 的科学研究者」而非「贡献者」,加权偏向产品层。评分 4/5。
社区与成熟度
| 维度 | 评分 | 说明 |
|---|---|---|
| 社区活跃度 | 4/5 | 22,747 stars,2,456 forks,158+ PR 活跃合并 [GH:PR]。37 个 open issue 相对于项目规模极低,说明质量较高或响应及时。但贡献者集中度高(TKassis 105 次,第二仅 38 次),跨组织贡献正在增长但核心仍在 K-Dense |
| 成熟度 | 3/5 | 仅 7 个月历史(2025-10-19 至今),版本迭代极快但无稳定性承诺和迁移指南。未发现直接的破坏性变更证据,但快速的版本号跳跃(v2.34→v2.38 数周内)提示 API 稳定性可能不是当前优先事项。项目在 GitHub 上不是 archived 状态且持续活跃,但尚未进入「可以放心依赖」的成熟阶段 |
安全与风险
代码执行风险:skill 本质上是给 agent 的操作指南,agent 会根据 skill 指令执行任意 Python 代码、安装包、发起网络请求、修改文件。项目明确声明用户需自行审查 skill 内容后才使用 [GH]。每周通过 Cisco AI Defense Skill Scanner 进行 LLM 安全扫描 [GH:security]。
供应链风险:135 个 skill 依赖大量第三方 Python 包(RDKit、Scanpy、PyTorch 等),供应链攻击面广。每个 skill 可独立安装其依赖,减少了不必要的暴露,但无法消除底层包的风险。
许可风险:MIT 许可证,无 copyleft 约束,商业友好。
数据隐私:科学数据库查询通过公共 API 进行,谨慎处理敏感研究数据(如患者 VCF 文件)的用户应注意网络传输和数据驻留。
总体:攻击面由设计决定(skill = 代码执行),已有安全扫描流程但不完美。评分 3/5 反映「有安全关注点,但不影响正常使用」——前提是用户执行了建议的安全审查。
学习价值
值得学习:
- Skill 工程化:如何将科学 Python 库的使用模式系统化为结构化的 agent skill 文档。RDKit skill 是一个优秀的参考样本 [GH]——从能力说明到代码模式到最佳实践到常见陷阱的完整结构
- 工作流编排:23 个示例展示了多 skill 的链式编排模式,对设计自己的 agent skill 或工具链有参考价值
- 科学 agent 设计模式:如何平衡 skill 的「通用性」(让 agent 理解何时用)和「具体性」(提供足够细节让 agent 不出错)
- 安全模型:明确的安全边界声明(用户最终负责)和安全扫描集成是 agent skill 安全设计的务实参考
局限性:项目的学习价值在于「如何写好的 agent skill」,而非「如何构建 agent infrastructure」。它是一个应用案例,而非架构参考。
适合阅读的受众:想为自己的研究领域编写 agent skills 的研究者;对科学 agent 管线设计感兴趣的工具开发者;想理解 agent skill 最佳实践的 AI 工程师。