【百度文心4.5开源:自主龙芯CPU第一时间深入合作】近日,发布两个月的文心4.5系列模型正式开源,包括47B、3B激活参数的MoE混合专家模型与0.3B参数的稠密模型等10款,而就在文心大模型开源首日,龙芯中科与百度启动了技术合作,基于最新发布的龙芯3C6000系列。
双方将共同推进国产算力基础设施与大模型技术的融合创新,为AI产业化应用提供安全可控的“中国芯”解决方案。
据悉,百度文心4.5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPS利用率(MFU)达到47%。
实验结果显示,文心4.5系列模型在多个文本和多模态基准测试中达到SOTA水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。
核心技术点包括:多模态混合专家模型预训练、高效训练推理框架、针对模态的后训练。