2025AISummary

思维链与推理模型(thinking chain and reasoning model)

由OpanAI在2025年11月23日发布的新模型GTP-o1中引入了思维链(thinking chain)的概念。其使用强化学习博弈的方式，通过对模型的奖励和惩罚，来训练模型生成符合要求的思维链。2025年AI界更是发现, 推理模型不仅自己强，它还是一个极其优秀的“老师”, deepSeek就是使用deepseek-R1模型蒸馏Qwen模型来实现高性能小模型, 打破了Scaling Law的天花板

模型蒸馏(Model Distillation)

DeepSeek开源并公布了一系列基于deepseek-R1模型蒸馏的小模型, 如deepseek-R1-3b, deepseek-R1-7b等, 这些模型在性能上都超过了Qwen和Llama基座模型, DeepSeek在蒸馏小模型时使用了大量由deepseek-R1模型生成的高质量COT(Chain of Thought)数据, 这些数据包含了丰富的推理逻辑和知识, 可以帮助小模型更好地理解和处理复杂的任务, 并且可以通过对COT数据的垂类整合实现拥有更强的垂直专业能力的专家小模型

RAG(Retrieval-Augmented Generation)

在2025年，RAG技术经历了从“向量检索”向“知识关联”的范式转变, GraphRAG(图增强检索)成为主流，通过结合知识图谱，模型能够处理跨文档的全局性问题。此外，Long-Context(长文本)技术的突破让部分场景摆脱了大量切片的烦恼，Embedding配合Late Interaction和Rerank提升匹配精确度, 让RAG依然作为低成本、高实时性、带引用溯源的解决方案，在知识库中占据统治地位。

MOE的发展(Evolution of Mixture of Experts)

MoE(专家混合模型)成为了所有高性能模型的标配。DeepSeek 进一步优化了多头潜在注意力(降低KV Cache)与MoE的结合，通过超大规模的参数总量（约 671B）配合极低的激活参数（约 37B），实现了极高的推理效率。

MCP：AI 时代的“通用串行总线”

由Anthropic在2025年推出的模型上下文协议(MCP)，解决了AI工具链中最大的痛点：工具孤岛。为AI Agent提供了接口标准，推动了AI Agent生态的爆发式发展。MCP 引入了三个关键能力：

Resources（资源）：允许模型以标准方式读取外部数据（如读取本地文件或数据库记录）。
Tools（工具）：允许模型执行动作（如发送一封邮件或在本地运行一段 Python 脚本）。
Prompts（提示词模板）：预设的交互模式，通过标准化的协议传递给模型。

AI agent

如果说2024年我们还在探索Agent的可能性，那么2025年则是Agent真正进入生产力的阶段。AI Agent 不再只是一个会说话的机器人，它演变成了具备感知 (Perception)、决策 (Planning)、记忆 (Memory) 和执行 (Action) 能力的完备系统。

认知架构的成熟：推理驱动得益于推理模型（如 o1, DeepSeek-R1）等的成熟，Agent 获得了强大的“慢思考”能力。
- 自我修正（Self-Reflection）： Agent 在执行任务时，不再是一条路走到黑，而是会不断审视自己的输出。如果代码运行报错，它会根据错误日志自动迭代。
- 长期记忆（Long-term Memory）：通过向量数据库与个性化Profile的结合，Agent能够记得你在三个月前对某个项目的偏好。
从 Single-Agent 到 Multi-Agent Systems (MAS) 2025年，人们意识到一个全能的 Agent 往往不如一群专才 Agent:
- 协同作业：类似于一家公司的运作，一个 Agent 负责架构设计，一个负责编写代码，一个负责安全审计。
- SOP 自动化：复杂的企业级流程（如入职办理、财务报销）被拆解为多个 Agent 之间的标准化消息传递。
Agentic Workflow：流程即智能吴恩达（Andrew Ng）提倡的 Agentic Workflow 理念在 2025 年得到全面验证。比起追求一个更大的模型，通过多次迭代、工具调用和循环逻辑（Loops），较小的模型（如蒸馏后的 DeepSeek-R1-7B）也能在特定任务上超越顶级闭源模型。

AutoGLM到豆包AI手机

AI 不再仅仅是一个对话框。从智谱的AutoGLM到字节跳动深度集成的“豆包AI手机”，LAM (Large Action Model) 概念正式落地。模型不再只是通过 API 返回文本，而是具备了屏幕理解与模拟点击的能力，能够跨App完成订餐、打车等复杂操作。这意味着AI硬件正式从“AI Inside”演进为“AI Native”。

Cursor

在2025年Cursor成为300亿美金独角兽, 不仅是一个编辑器，也是一个“AI 结对编程伙伴”。通过对整个代码库（Codebase）的索引和对Composer模式的持续迭代，开发者从“写代码”转变为“审查代码”。它证明了未来的软件开发，核心竞争力将从语法熟练度转向系统架构能力和需求定义能力。

claude code

如果说Cursor是IDE里的领航员，Claude Code 则是 2025 年直接空降到开发者终端（CLI）的特工。它不再局限于编辑器的 UI，而是通过获取系统的 Shell 权限，直接执行 Git 指令、运行本地测试、自动修复构建错误。它标志着AI从“建议者”变成了“执行者”。

Vibe Coding：从“敲代码”到“传达感觉”

2025年末，由Andrej Karpathy等技术大牛推流的Vibe Coding概念席卷了开发者社区。这标志着软件开发进入了第三阶段：从“手动编写语法”到“AI辅助补全”，再到现在只需提供“氛围”(Vibes), 意图即代码

google的Gemini架构

2025年，Gemini 3 pro展现了原生多模态混合MOE架构的强大, 不同于其他模型通过外挂视觉编码器等，Gemini实现了音频、视频、图像和文本在同一神经元层级的统一处理, 这使得模型在处理多模态任务时表现出色, 并且大幅提升了推理效率。

2025 DeepSeek实验性项目: 光学压缩技术和流形约束超链接

光学压缩技术：将OCR的压缩比和还原精度再次提升, 对长上下文的压缩提供了一定的启发
流形约束超链接：在超链接的基础上，引入流形约束，确保超链接不会出现梯度爆炸和梯度消失的情况

2026年开年王炸 : promote skills（提示词技能化）

2026年伊始，anthropic提出了promote skills让传统的“长篇提示词”正在消亡。开发者不再编写复杂的Prompt，而是通过问答将特定对话内容通过AI封装为“skill”，通过MCP协议挂载。进一步减少了promote带来的上下文的长度损耗，通过问答的方式了解开发者的需求，开发者可以更专注于业务逻辑的实现，而不是prompt的编写。

2026展望 : Agentic AI与具身智能的交汇

2026 年将是 Agentic AI（智能体化 AI）从概念走向闭环的转折点：

从“对话”到“交付”： AI 不再只是停留在对话框里，而是基于预设目标（Goal-oriented）进行自主决策。它会主动监测进度、遇到报错自动检索文档、修正错误并交付最终结果。
群体智能（MAS）的规模化：数以万计的微型 Agent 将在私有网络中协作，形成一个自动化的“虚拟工厂”，处理从供应链优化到自动化营销的所有流程。
AI Native 硬件爆发：随着LAM（大动作模型）的成熟，2026年我们将看到更多不依赖屏幕、以语音和视觉传感为核心的穿戴设备，AI 正式从“Inside”变为“Native”。
具身智能的曙光：将多模态大模型注入机器人躯壳，AI将拥有物理世界的直觉，真正走进实验室和工厂。

从思维链到自主智能：2025AI大跃进与2026黎明展望