【“50美元”复刻De­e­p­S­e­ek的R1真相】有报道称,李飞飞等斯坦福

黑夜黑眼睛 2025-02-06 22:05:36

【“50美元”复刻De­e­p­S­e­ek的R1真相】

有报道称,李飞飞等斯坦福大学和华盛顿大学的研究人员,以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。

该模型在数学和编码能力测试中的表现,据称与Op­e­n­AI的O1和De­e­p­S­e­ek的R1等尖端推理模型不相上下。

记者调查后发现,s1模型的训练并非从零开始,其基座模型为阿里通义千问(Qw­en)模型。

s1用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对千问模型进行微调而成。

0 阅读:2
黑夜黑眼睛

黑夜黑眼睛

感谢大家的关注