思维链与推理模型(thinking chain and reasoning model)
由OpanAI在2025年11月23日发布的新模型GTP-o1中引入了思维链(thinking chain)的概念。其使用强化学习博弈的方式,通过对模型的奖励和惩罚,来训练模型生成符合要求的思维链。2025年AI界更是发现, 推理模型不仅自己强,它还是一个极其优秀的“老师”, deepSeek就是使用deepseek-R1模型蒸馏Qwen模型来实现高性能小模型, 打破了Scaling Law的天花板
模型蒸馏(Model Distillation)
DeepSeek开源并公布了一系列基于deepseek-R1模型蒸馏的小模型, 如deepseek-R1-3b, deepseek-R1-7b等, 这些模型在性能上都超过了Qwen和Llama基座模型, DeepSeek在蒸馏小模型时使用了大量由deepseek-R1模型生成的高质量COT(Chain of Thought)数据, 这些数据包含了丰富的推理逻辑和知识, 可以帮助小模型更好地理解和处理复杂的任务, 并且可以通过对COT数据的垂类整合实现拥有更强的垂直专业能力的专家小模型
RAG(Retrieval-Augmented Generation)
在2025年,RAG技术经历了从“向量检索”向“知识关联”的范式转变, GraphRAG(图增强检索)成为主流,通过结合知识图谱,模型能够处理跨文档的全局性问题。此外,Long-Context(长文本)技术的突破让部分场景摆脱了大量切片的烦恼,Embedding配合Late Interaction和Rerank提升匹配精确度, 让RAG依然作为低成本、高实时性、带引用溯源的解决方案,在知识库中占据统治地位。
MOE的发展(Evolution of Mixture of Experts)
MoE(专家混合模型)成为了所有高性能模型的标配。DeepSeek 进一步优化了多头潜在注意力(降低KV Cache)与MoE的结合,通过超大规模的参数总量(约 671B)配合极低的激活参数(约 37B),实现了极高的推理效率。
MCP:AI 时代的“通用串行总线”
由Anthropic在2025年推出的模型上下文协议(MCP),解决了AI工具链中最大的痛点:工具孤岛。为AI Agent提供了接口标准,推动了AI Agent生态的爆发式发展。MCP 引入了三个关键能力:
- Resources(资源): 允许模型以标准方式读取外部数据(如读取本地文件或数据库记录)。
- Tools(工具): 允许模型执行动作(如发送一封邮件或在本地运行一段 Python 脚本)。
- Prompts(提示词模板): 预设的交互模式,通过标准化的协议传递给模型。
AI agent
如果说2024年我们还在探索Agent的可能性,那么2025年则是Agent真正进入生产力的阶段。AI Agent 不再只是一个会说话的机器人,它演变成了具备感知 (Perception)、决策 (Planning)、记忆 (Memory) 和 执行 (Action) 能力的完备系统。
- 认知架构的成熟:推理驱动
得益于推理模型(如 o1, DeepSeek-R1)等的成熟,Agent 获得了强大的“慢思考”能力。
- 自我修正(Self-Reflection): Agent 在执行任务时,不再是一条路走到黑,而是会不断审视自己的输出。如果代码运行报错,它会根据错误日志自动迭代。
- 长期记忆(Long-term Memory): 通过向量数据库与个性化Profile的结合,Agent能够记得你在三个月前对某个项目的偏好。
- 从 Single-Agent 到 Multi-Agent Systems (MAS)
2025年,人们意识到一个全能的 Agent 往往不如一群专才 Agent:
- 协同作业: 类似于一家公司的运作,一个 Agent 负责架构设计,一个负责编写代码,一个负责安全审计。
- SOP 自动化: 复杂的企业级流程(如入职办理、财务报销)被拆解为多个 Agent 之间的标准化消息传递。
- Agentic Workflow:流程即智能 吴恩达(Andrew Ng)提倡的 Agentic Workflow 理念在 2025 年得到全面验证。比起追求一个更大的模型,通过多次迭代、工具调用和循环逻辑(Loops),较小的模型(如蒸馏后的 DeepSeek-R1-7B)也能在特定任务上超越顶级闭源模型。
AutoGLM到豆包AI手机
AI 不再仅仅是一个对话框。从智谱的AutoGLM到字节跳动深度集成的“豆包AI手机”,LAM (Large Action Model) 概念正式落地。模型不再只是通过 API 返回文本,而是具备了屏幕理解与模拟点击的能力,能够跨App完成订餐、打车等复杂操作。这意味着AI硬件正式从“AI Inside”演进为“AI Native”。
Cursor
在2025年Cursor成为300亿美金独角兽, 不仅是一个编辑器,也是一个“AI 结对编程伙伴”。通过对整个代码库(Codebase)的索引和对Composer模式的持续迭代,开发者从“写代码”转变为“审查代码”。它证明了未来的软件开发,核心竞争力将从语法熟练度转向系统架构能力和需求定义能力。
claude code
如果说Cursor是IDE里的领航员,Claude Code 则是 2025 年直接空降到开发者终端(CLI)的特工。它不再局限于编辑器的 UI,而是通过获取系统的 Shell 权限,直接执行 Git 指令、运行本地测试、自动修复构建错误。它标志着AI从“建议者”变成了“执行者”。
Vibe Coding:从“敲代码”到“传达感觉”
2025年末,由Andrej Karpathy等技术大牛推流的Vibe Coding概念席卷了开发者社区。这标志着软件开发进入了第三阶段:从“手动编写语法”到“AI辅助补全”,再到现在只需提供“氛围”(Vibes), 意图即代码
google的Gemini架构
2025年,Gemini 3 pro展现了原生多模态混合MOE架构的强大, 不同于其他模型通过外挂视觉编码器等,Gemini实现了音频、视频、图像和文本在同一神经元层级的统一处理, 这使得模型在处理多模态任务时表现出色, 并且大幅提升了推理效率。
2025 DeepSeek实验性项目: 光学压缩技术和流形约束超链接
- 光学压缩技术:将OCR的压缩比和还原精度再次提升, 对长上下文的压缩提供了一定的启发
- 流形约束超链接:在超链接的基础上,引入流形约束,确保超链接不会出现梯度爆炸和梯度消失的情况
2026年开年王炸 : promote skills(提示词技能化)
2026年伊始,anthropic提出了promote skills让传统的“长篇提示词”正在消亡。开发者不再编写复杂的Prompt,而是通过问答将特定对话内容通过AI封装为“skill”,通过MCP协议挂载。进一步减少了promote带来的上下文的长度损耗,通过问答的方式了解开发者的需求,开发者可以更专注于业务逻辑的实现,而不是prompt的编写。
2026展望 : Agentic AI与具身智能的交汇
2026 年将是 Agentic AI(智能体化 AI)从概念走向闭环的转折点:
- 从“对话”到“交付”: AI 不再只是停留在对话框里,而是基于预设目标(Goal-oriented)进行自主决策。它会主动监测进度、遇到报错自动检索文档、修正错误并交付最终结果。
- 群体智能(MAS)的规模化: 数以万计的微型 Agent 将在私有网络中协作,形成一个自动化的“虚拟工厂”,处理从供应链优化到自动化营销的所有流程。
- AI Native 硬件爆发: 随着LAM(大动作模型)的成熟,2026年我们将看到更多不依赖屏幕、以语音和视觉传感为核心的穿戴设备,AI 正式从“Inside”变为“Native”。
- 具身智能的曙光: 将多模态大模型注入机器人躯壳,AI将拥有物理世界的直觉,真正走进实验室和工厂。