微软发布了Phi-4-reasoning 模型。参数14b,开源推理模型。
🔗 huggingface.co/microsoft/Phi-4-reasoning
该模型基于约 140 万条精心筛选的 o3-mini 推理演示数据进行监督微调,并进行了少量强化学习。
虽然是个小模型但跑分不低,特别是在AIME 25上。能力应该是侧重于数学和推理。
AI创造营AI生活指南
微软发布了Phi-4-reasoning 模型。参数14b,开源推理模型。
🔗 huggingface.co/microsoft/Phi-4-reasoning
该模型基于约 140 万条精心筛选的 o3-mini 推理演示数据进行监督微调,并进行了少量强化学习。
虽然是个小模型但跑分不低,特别是在AIME 25上。能力应该是侧重于数学和推理。
AI创造营AI生活指南
猜你喜欢
【1评论】【2点赞】
【5评论】【3点赞】
【21评论】【71点赞】
【160评论】【31点赞】
作者最新文章
热门分类
科技TOP
科技最新文章