#AI圈的中国制造#国产大模型DeepSeek公布了最新开源版本 V3,它

差评XPIN 2025-01-03 11:34:07

#AI圈的中国制造# 国产大模型 DeepSeek 公布了最新开源版本 V3,它性能国际一流,技术力牛逼,价格击穿地心,这一套不解释连招打得业内大模型厂商们都有点晕头转向了。连OpenAI 创始成员 Karpathy 都看嗨了,甚至发出了灵魂提问,难道说大模型们压根不需要大规模显卡集群?

因为开源模型王者 Llama 3.1 405B,训练周期花费了 3080 万 GPU 时,Meta 光是在老黄那买了 16000 多个 GPU,保守估计至少都花了十几亿人民币。而 V3 只花了不到 280 万 GPU 时,大概只花了 4000 多万人民币。。。所以这个 DeepSeek 到底什么来头?

0 阅读:40
差评XPIN

差评XPIN

用知识和观点Debug the world!