AI

2025AISummary

从思维链到自主智能:2025AI大跃进与2026黎明展望

Posted by Byolio on January 15, 2026

思维链与推理模型(thinking chain and reasoning model)

由OpanAI在2025年11月23日发布的新模型GTP-o1中引入了思维链(thinking chain)的概念。其使用强化学习博弈的方式,通过对模型的奖励和惩罚,来训练模型生成符合要求的思维链。2025年AI界更是发现, 推理模型不仅自己强,它还是一个极其优秀的“老师”, deepSeek就是使用deepseek-R1模型蒸馏Qwen模型来实现高性能小模型, 打破了Scaling Law的天花板

模型蒸馏(Model Distillation)

DeepSeek开源并公布了一系列基于deepseek-R1模型蒸馏的小模型, 如deepseek-R1-3b, deepseek-R1-7b等, 这些模型在性能上都超过了Qwen和Llama基座模型, DeepSeek在蒸馏小模型时使用了大量由deepseek-R1模型生成的高质量COT(Chain of Thought)数据, 这些数据包含了丰富的推理逻辑和知识, 可以帮助小模型更好地理解和处理复杂的任务, 并且可以通过对COT数据的垂类整合实现拥有更强的垂直专业能力的专家小模型

RAG(Retrieval-Augmented Generation)

在2025年,RAG技术经历了从“向量检索”向“知识关联”的范式转变, GraphRAG(图增强检索)成为主流,通过结合知识图谱,模型能够处理跨文档的全局性问题。此外,Long-Context(长文本)技术的突破让部分场景摆脱了大量切片的烦恼,Embedding配合Late Interaction和Rerank提升匹配精确度, 让RAG依然作为低成本、高实时性、带引用溯源的解决方案,在知识库中占据统治地位。

MOE的发展(Evolution of Mixture of Experts)

MoE(专家混合模型)成为了所有高性能模型的标配。DeepSeek 进一步优化了多头潜在注意力(降低KV Cache)与MoE的结合,通过超大规模的参数总量(约 671B)配合极低的激活参数(约 37B),实现了极高的推理效率。

MCP:AI 时代的“通用串行总线”

由Anthropic在2025年推出的模型上下文协议(MCP),解决了AI工具链中最大的痛点:工具孤岛。为AI Agent提供了接口标准,推动了AI Agent生态的爆发式发展。MCP 引入了三个关键能力:

  • Resources(资源): 允许模型以标准方式读取外部数据(如读取本地文件或数据库记录)。
  • Tools(工具): 允许模型执行动作(如发送一封邮件或在本地运行一段 Python 脚本)。
  • Prompts(提示词模板): 预设的交互模式,通过标准化的协议传递给模型。

AI agent

如果说2024年我们还在探索Agent的可能性,那么2025年则是Agent真正进入生产力的阶段。AI Agent 不再只是一个会说话的机器人,它演变成了具备感知 (Perception)、决策 (Planning)、记忆 (Memory) 和 执行 (Action) 能力的完备系统。

  1. 认知架构的成熟:推理驱动 得益于推理模型(如 o1, DeepSeek-R1)等的成熟,Agent 获得了强大的“慢思考”能力。
    • 自我修正(Self-Reflection): Agent 在执行任务时,不再是一条路走到黑,而是会不断审视自己的输出。如果代码运行报错,它会根据错误日志自动迭代。
    • 长期记忆(Long-term Memory): 通过向量数据库与个性化Profile的结合,Agent能够记得你在三个月前对某个项目的偏好。
  2. 从 Single-Agent 到 Multi-Agent Systems (MAS) 2025年,人们意识到一个全能的 Agent 往往不如一群专才 Agent:
    • 协同作业: 类似于一家公司的运作,一个 Agent 负责架构设计,一个负责编写代码,一个负责安全审计。
    • SOP 自动化: 复杂的企业级流程(如入职办理、财务报销)被拆解为多个 Agent 之间的标准化消息传递。
  3. Agentic Workflow:流程即智能 吴恩达(Andrew Ng)提倡的 Agentic Workflow 理念在 2025 年得到全面验证。比起追求一个更大的模型,通过多次迭代、工具调用和循环逻辑(Loops),较小的模型(如蒸馏后的 DeepSeek-R1-7B)也能在特定任务上超越顶级闭源模型。

AutoGLM到豆包AI手机

AI 不再仅仅是一个对话框。从智谱的AutoGLM到字节跳动深度集成的“豆包AI手机”,LAM (Large Action Model) 概念正式落地。模型不再只是通过 API 返回文本,而是具备了屏幕理解与模拟点击的能力,能够跨App完成订餐、打车等复杂操作。这意味着AI硬件正式从“AI Inside”演进为“AI Native”。

Cursor

在2025年Cursor成为300亿美金独角兽, 不仅是一个编辑器,也是一个“AI 结对编程伙伴”。通过对整个代码库(Codebase)的索引和对Composer模式的持续迭代,开发者从“写代码”转变为“审查代码”。它证明了未来的软件开发,核心竞争力将从语法熟练度转向系统架构能力和需求定义能力。

claude code

如果说Cursor是IDE里的领航员,Claude Code 则是 2025 年直接空降到开发者终端(CLI)的特工。它不再局限于编辑器的 UI,而是通过获取系统的 Shell 权限,直接执行 Git 指令、运行本地测试、自动修复构建错误。它标志着AI从“建议者”变成了“执行者”。

Vibe Coding:从“敲代码”到“传达感觉”

2025年末,由Andrej Karpathy等技术大牛推流的Vibe Coding概念席卷了开发者社区。这标志着软件开发进入了第三阶段:从“手动编写语法”到“AI辅助补全”,再到现在只需提供“氛围”(Vibes), 意图即代码

google的Gemini架构

2025年,Gemini 3 pro展现了原生多模态混合MOE架构的强大, 不同于其他模型通过外挂视觉编码器等,Gemini实现了音频、视频、图像和文本在同一神经元层级的统一处理, 这使得模型在处理多模态任务时表现出色, 并且大幅提升了推理效率。

2025 DeepSeek实验性项目: 光学压缩技术和流形约束超链接

  • 光学压缩技术:将OCR的压缩比和还原精度再次提升, 对长上下文的压缩提供了一定的启发
  • 流形约束超链接:在超链接的基础上,引入流形约束,确保超链接不会出现梯度爆炸和梯度消失的情况

2026年开年王炸 : promote skills(提示词技能化)

2026年伊始,anthropic提出了promote skills让传统的“长篇提示词”正在消亡。开发者不再编写复杂的Prompt,而是通过问答将特定对话内容通过AI封装为“skill”,通过MCP协议挂载。进一步减少了promote带来的上下文的长度损耗,通过问答的方式了解开发者的需求,开发者可以更专注于业务逻辑的实现,而不是prompt的编写。

2026展望 : Agentic AI与具身智能的交汇

2026 年将是 Agentic AI(智能体化 AI)从概念走向闭环的转折点:

  1. 从“对话”到“交付”: AI 不再只是停留在对话框里,而是基于预设目标(Goal-oriented)进行自主决策。它会主动监测进度、遇到报错自动检索文档、修正错误并交付最终结果。
  2. 群体智能(MAS)的规模化: 数以万计的微型 Agent 将在私有网络中协作,形成一个自动化的“虚拟工厂”,处理从供应链优化到自动化营销的所有流程。
  3. AI Native 硬件爆发: 随着LAM(大动作模型)的成熟,2026年我们将看到更多不依赖屏幕、以语音和视觉传感为核心的穿戴设备,AI 正式从“Inside”变为“Native”。
  4. 具身智能的曙光: 将多模态大模型注入机器人躯壳,AI将拥有物理世界的直觉,真正走进实验室和工厂。