微软发布了Phi-4-reasoning模型。参数14b,开源推理模型。🔗

又仁看科技 2025-05-01 09:53:21

微软发布了Phi-4-reasoning 模型。参数14b,开源推理模型。

🔗 huggingface.co/microsoft/Phi-4-reasoning

该模型基于约 140 万条精心筛选的 o3-mini 推理演示数据进行监督微调,并进行了少量强化学习。

虽然是个小模型但跑分不低,特别是在AIME 25上。能力应该是侧重于数学和推理。

AI创造营AI生活指南

0 阅读:4
又仁看科技

又仁看科技

感谢大家的关注