LLM - 日思录

推理模型演进之路：从 Chain-of-Thought 到 Diffusion LLM 的五年狂飙当 o1 在 AIME 数学竞赛中拿下 83% 的分数时，我们见证的不只是一个模型变强了，而是一条全新技术路线的崛起。开篇：一个反直觉的事实 2022 年，Google 的研究者发表了一篇论文：只要在 prompt 后面加上一句 “Let’s think step by step”，大语言模型在数学推理任务上的准确率就能大幅提升。这听起来近乎荒谬——模型的架构没有变，训练数据没有…

阅读更多→