DeepSeek刚刚发布了关于大模型训练的最佳端到端论文。内容涵盖:—软件(

春蕴评趣事 2025-05-20 18:27:03

DeepSeek 刚刚发布了关于大模型训练的最佳端到端论文。

内容涵盖:

— 软件(MLA,FP8 训练,DeepEP,LogFMT)

— 硬件(Multi-Rail Fat Tree,Ethernet RoCE 交换机)

— 混合(IBGDA,3FS 文件系统)

DeepSeek 的工程深度令人难以置信AI探索计划AI探索计划AI软件AI探索计划 ​​​

0 阅读:1
春蕴评趣事

春蕴评趣事

感谢大家的关注