DeepSeek 刚刚发布了关于大模型训练的最佳端到端论文。
内容涵盖:
— 软件(MLA,FP8 训练,DeepEP,LogFMT)
— 硬件(Multi-Rail Fat Tree,Ethernet RoCE 交换机)
— 混合(IBGDA,3FS 文件系统)
DeepSeek 的工程深度令人难以置信AI探索计划AI探索计划AI软件AI探索计划
DeepSeek 刚刚发布了关于大模型训练的最佳端到端论文。
内容涵盖:
— 软件(MLA,FP8 训练,DeepEP,LogFMT)
— 硬件(Multi-Rail Fat Tree,Ethernet RoCE 交换机)
— 混合(IBGDA,3FS 文件系统)
DeepSeek 的工程深度令人难以置信AI探索计划AI探索计划AI软件AI探索计划
作者最新文章
热门分类
社会TOP
社会最新文章