时间:2026-03-09 10:38
人气:
作者:admin
文章介绍了AI Agent开发从提示词工程向模块化、工程化转变的趋势。重点解析了Anthropic的Agent Skills和社区Superpowers工作流系统,阐述Skills的模块化架构、渐进式披露机制及其与MCP的适用边界与混合策略。此外,还介绍了Superpowers的TDD工作流方法论和Planning with Files的上下文管理机制。文章最后提供了开发高质量Skills的实战建议,指出未来AI开发将更注重能力封装与组合,而非单纯的Prompt调试。

在构建复杂 Agent 时,开发者面临的核心矛盾是上下文窗口的有限性与知识无限性之间的冲突。为了让 Agent 学会特定任务,塞入大量 Prompt 会迅速消耗 Token,导致“上下文污染”(Context Rot)。
Agent Skills 应运而生。它不是又一套 Prompt 模板,而是一种标准化的能力封装机制。
从工程视角看,一个 Skill 是一个遵循特定协议的文件夹,包含三个核心部分:
SKILL.md) :这是 Skill 的“大脑”,采用 YAML Frontmatter + Markdown Body 结构。YAML 定义了 name 和 description(触发逻辑),Markdown Body 定义了具体的执行指令。scripts/) :存放 Python、Bash 或 Node.js 脚本。这些脚本是自包含的,通过工具调用协议执行,确保沙箱隔离。resources/) :存放静态资源(模板、PDF、规则说明),默认不加载,仅在需要时引用。Agent Skills 解决了 Token 效率问题,其核心在于按需加载:
YAML Frontmatter。这只需极少 Token,让 Agent 知道自己“会什么”。description 时,系统才将 Markdown Body 注入当前上下文。resources/ 或调用 scripts/。这种机制使得 Agent 可以挂载成百上千个 Skills,而不会撑爆上下文窗口。
概念层面讲“渐进式披露”很容易,但真正落地要解决三个工程问题:怎么从 SKILL.md 抽元数据、怎么让模型在多技能里做选择、怎么避免每轮交互都加载长文档。以开源 Agent 宿主(如 Cherry Studio)的实现为例,典型做法是:
1. 元数据提取:只解析 Frontmatter,不吞全文
parseSkillMetadata 的函数读取 SKILL.md,提取 name、description 等字段,生成结构化 PluginMetadata。.md 文件名,这样一个 Skill 可以带 resources/、scripts/ 等附件,而不是被限制成单文件。2. 元数据缓存:把“技能索引”持久化,避免重复解析
.claude/plugins.json),而不是只放在内存里。3. 工具化注入:模型看到的是“技能菜单”,不是技能全文
AgentToolsType.Skill),并被统一纳入 MCP 工具列表。name/description/参数结构 等信息拼装成工具定义注入 System Prompt,模型在每一轮对话里看到的是可用工具集合,并基于描述做路由决策。4. 调用时再展开:把长文档留到真正需要的那一刻
command 等参数)时,宿主才会进入对应的执行/渲染链路。SKILL.md 的 Body、引用的 resources/,或直接执行 scripts/),把“信息”从默认上下文挪到按需读取与可执行资产上。理解 Skills 的关键在于厘清它与 MCP 的边界。

根据量化分析,Skills 与 MCP 在 Token 成本和延迟上存在显著差异:

基于此,我们可以得出明确的选择原则:
| 场景类型 | 推荐方案 | 原因 |
|---|---|---|
| 实时数据查询 | MCP | Skills 是静态文档,无法获取实时状态;MCP 直接连接数据源。 |
| 高频简单操作 | MCP | 简单操作(如文件读写)无需复杂指导,Skills 会造成 Token 浪费。 |
| 复杂计算 | MCP | 解释执行代码容易出错,MCP 可调用原生优化代码(如 C++ 图像处理)。 |
| 状态保持操作 | MCP | Skills 无状态,MCP 工具可维护会话级状态(如断点续传)。 |
| 工作流指导 | Skills | 固化最佳实践、多步骤决策流程,AI 需要理解“为什么”做。 |
最强大的 Agent 往往是 Skills 与 MCP 的组合:

例如,在 systematic-debugging Skill 中,Agent 遵循 Skill 定义的“根因分析 -> 假设验证”流程,但在执行每一步时,调用 query_logs 或 run_test 等 MCP 工具。
Superpowers Skills 是一套经过实战验证的高级 Agent 工作流系统,其核心理念是将测试驱动开发(TDD) 应用于 Prompt 和文档编写。
编写技能 = 将 TDD 应用于流程文档。
Superpowers 定义了从需求到交付的完整闭环:
subagent-driven-development:在当前会话中,为每个任务分派子 Agent,适合快速迭代。executing-plans:在并行会话中批量执行任务,适合大规模实现。
Superpowers 的一条铁律:如果认为有 1% 的可能性某个技能适用,必须调用该技能。
这避免了 AI 的“合理化”倾向——即当任务看似简单时,AI 往往会跳过必要的规范步骤(如先写测试)。
Agent 在长任务中常面临 Volatile Memory(易失性记忆)和 Goal Drift(目标漂移)问题。planning-with-files Skill 引入了“三文件模式”,将文件系统作为 Agent 的外部记忆。
task_plan.md(指挥塔):notes.md(外部存储器):[deliverable].md(最终交付物):这种模式本质上构建了一个 File-Based State Machine(基于文件的状态机)。通过不断更新 task_plan.md 中的状态(如将 [ ] 改为 [x]),Agent 即使在上下文重置后,也能从磁盘中恢复执行进度,实现长程任务的可靠交付。
开发 Skill 的最佳实践是默认让 AI 来写 Skill。
SKILL.md。SKILL.md 中声明依赖,或在 scripts/ 中提供 setup.sh。description 中不仅写功能,更要写明确的触发场景(Trigger Phrases)。/,拒绝 Windows 反斜杠。Agent Skills 标志着 AI 应用开发正在从“手工作坊”走向“工业化组装”。
对于架构师和开发者而言,未来的核心工作将不再是反复调试 Prompt,而是设计合理的 Skill 边界,构建企业专属的“能力货架”,并灵活组合 Skills 与 MCP,打造出既聪明又可靠的 AI Agent。
对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?
答案只有一个:人工智能(尤其是大模型方向)
当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右。
再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。

对于想入局大模型、抢占未来10年行业红利的程序员和小白来说,现在正是最好的学习时机:行业缺口大、大厂需求旺、薪资天花板高,只要找准学习方向,稳步提升技能,就能轻松摆脱“低薪困境”,抓住AI时代的职业机遇。
如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!
下面是我整理的大模型学习资源,希望能帮到你。

????????扫码免费领取全部内容????????


从入门到进阶这里都有,跟着老师学习事半功倍。


2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。







该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身:基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例:如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…
????????扫码免费领取全部内容????????

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
