推理模型演进之路:从 Chain-of-Thought 到 Diffusion LLM 的五年狂飙

推理模型演进之路:从 Chain-of-Thought 到 Diffusion LLM 的五年狂飙 当 o1 在 AIME 数学竞赛中拿下 83% 的分数时,我们见证的不只是一个模型变强了,而是一条全新技术路线的崛起。 开篇:一个反直觉的事实 2022 年,Google 的研究者发表了一篇论文:只要在 prompt 后面加上一句 “Let’s think step by step”,大语言模型在数学推理任务上的准确率就能大幅提升。这听起来近乎荒谬——模型的架构没有变,训练数据没有…

阅读更多