📌 开头
视频来源:马克的技术工作坊《一期视频带你打通 AI 底层逻辑!》,2026-03-14 发布,19.2万观看
链接:https://v.douyin.com/U18fUm92KfU/
核心一句话:用老板与员工的比喻,系统拆解 LLM → Token → Context → Prompt → Tool → MCP → Agent → Agent Skill 的 AI 核心概念链。
核心问题
- 背景:AI 概念爆发,但大量专业术语(LLM、Token、MCP、Agent)让普通用户望而却步
- 当前问题:概念之间关系模糊,业界缺乏系统性科普视角
- 本文贡献:用「老板指挥超级大脑完成复杂任务」的主线,串起 AI 技术栈的完整脉络
视频章节与核心概念
1. LLM(大语言模型)— 00:31
全称 Large Language Model,基于 Google 2017 年提出的 Transformer 架构(论文《Attention Is All You Need》)。本质是「文字接龙」—— 通过预测下一个概率最高的词(Token)生成内容。
视频比喻:「超级大脑」,整个系统的核心智能来源。
2. Token(词元)— 03:03
模型处理文本的最小单元,通过 Tokenizer(分词器)将文字转换为数字(Token ID)。Token 与汉字并非一一对应,如「工作坊」会被拆分为「工作」和「坊」。中文 Token 化效率通常低于英文。
视频比喻:「按字数(Token)结算工资」—— 模型输出的计价单位。
3. Context(上下文)— 08:10
模型每次处理任务的信息总和,含对话历史、系统配置、工具列表等。Context Window 为其最大 Token 容量——主流模型可达百万级(如 Claude 3.5 支持 200K tokens)。超出容量则需借助 RAG 等技术补充。
视频比喻:「记忆」,模型能「记住」多少信息取决于 Context Window 大小。
4. Prompt(提示词)— 11:41
分两类:User Prompt(用户输入的问题/指令)和 System Prompt(开发者配置的人设/规则)。Prompt 工程是决定模型输出质量的关键手艺。
视频比喻:「写好指令」—— 老板给员工下达的明确任务说明。
5. Tool(工具调用)— 15:11
模型调用的外部函数(如天气查询、代码执行),解决模型无法感知实时信息的问题。Tool Use 让 LLM 从「只会说话」升级为「能做事」。
视频比喻:「办公工具」—— Excel、计算器、打印机,能实际执行任务的实体。
6. MCP(模型上下文协议)— 19:20
全称 Model Context Protocol,由 Anthropic 于 2025 年提出并开源(https://modelcontextprotocol.io)。统一工具接入标准的协议,让工具仅需开发一次即可适配多平台。
核心价值:解决 AI 工具生态碎片化问题。传统方案每个数据源需要独立开发接口;MCP 提供通用协议,一次开发,处处运行。
视频比喻:「统一标准」—— 就像 USB 接口,让各种设备都能即插即用。
7. Agent(智能体)— 21:10
能自主规划、调用工具完成复杂任务的系统。与简单问答的区别在于:Agent 能拆解目标、多步执行、自我反思。
视频比喻:「项目经理」—— 能理解老板的模糊目标,主动拆解任务、调配资源。
8. Agent Skill(智能体技能)— 24:10
给 Agent 的说明文档,提前设定规则,告诉 Agent 擅长什么、如何正确使用工具。本质是结构化的 System Prompt + Tool 描述的组合包。
视频比喻:「专业技能证书」—— 持证上岗,知道怎么干活。
关键洞察
洞察一:概念链的本质是「能力扩展路径」
LLM → Tool → MCP → Agent → Agent Skill 不是孤立概念,而是一条能力扩展路径:
- LLM 解决「智能从哪来」
- Tool 解决「LLM 不能做什么」
- MCP 解决「Tool 生态碎片化」
- Agent 解决「如何自主完成任务」
- Agent Skill 解决「Agent 如何正确上岗」
洞察二:MCP 是 AI 工具化的关键基础设施
2025 年 Anthropic 开源 MCP 后,业界快速跟进。Block、Apollo 等企业已集成 MCP,GitHub、Slack、Google Drive 等主流平台均有 MCP Server 实现。MCP 的崛起反映了 AI 行业从「模型竞争」转向「生态竞争」的趋势。
洞察三:Agent Skill 代表了 AI 能力封装的新范式
传统 AI 应用需要大量定制开发;Agent Skill 提供了一种「即插即用」的能力封装方式。Skill 本质是把专家经验结构化为可复用、可组合的 AI 能力单元。这与 OpenClaw 的 Skill 系统设计理念一致。
引发思考
这条概念链的终局是什么?当 MCP 统一协议层、Agent Skill 标准化能力封装,LLM 成为真正可编排的基础设施后,AI 应用开发的门槛将进一步下降。但真正的壁垒将从「接入技术」转向「领域知识深度」—— 谁更懂行业,谁的 Skill 就更值钱。
对于个人而言,理解这些底层概念的价值不在于成为技术专家,而在于能够:站在系统视角思考 AI 能做什么、不能做什么;准确描述需求(写出好 Prompt);判断哪些场景适合引入 Agent,哪些场景还在 AI 能力边界之外。
相关阅读
- 《Attention Is All You Need》(Transformer 原始论文,Google,2017):https://arxiv.org/abs/1706.03762
- Anthropic MCP 官方介绍:https://www.anthropic.com/news/model-context-protocol
- HuggingGPT(LLM 作为控制器,2023):https://arxiv.org/abs/2303.17580
- Model Context Protocol 规范与 SDK:https://modelcontextprotocol.io






