2025 LLM 总结
推理
The year of “reasoning”
- OpenAI 于 2024 年 9 月发布了 o1,开启了“推理” 又称基于可验证奖励的强化学习(RLVR)的革命。
- 推理几乎成为所有其他主要人工智能实验室模型的标志性特征。
- 推理能力的真正突破在于驱动工具,能够使用工具的推理模型可以规划、分析、更新计划,从而更好的实现预期目标。
- 推理模型在代码生成和调试方面也表现出色。推理技巧意味着它们可以从错误入手,逐步深入代码库的多个不同层级,最终找到根本原因。
Agent
The year of agents