来看看深度求索 DeepSeek 的新一代模型吧,一上来一如既往的 DeepSeek 范儿:今天,我们全新系列模型 DeepSeek-V3 首个版本上线并同步开源。
我的 X 信息流有一半是美国 AI 圈在讨论 DeepSeek-V3,所有人都震惊于 DeepSeek 用十分之一的算力做出了和 GPT-4o 及 Claude-3.5-Sonnet 性能相当的模型,然后直接开源了。
基本上,同类模型大概需要 1.5 万块 H100,DeepSeek 用了 2048 块 H800 做出来了。
结尾再次强调了「以开源精神和长期主义追求普惠 AGI」。