这波DEEPSEEK确实很火,用约相当于Llama3系列模型7%的训练成本,起

泛舟啊 2025-01-28 18:13:47

这波DEEPSEEK确实很火,用约相当于Llama 3系列模型7%的训练成本,起到与现有大模型(如o1)相当的效果。

但其暂时无法撼动整个行业的生态。(所以美股这轮的震荡又是一次布局的机会)

2024年,微软、谷歌、亚马逊、Meta、苹果等北美五大科技公司合计资本开支2253亿美元,2025年有望继续增长19.6%。

其中很大一部分投入是用在包括GPT-5、Llama4等在内下一代模型的算力投资。

目前北美四大AI公司主要通过扩大GPU集群规模的方式探索下一代大模型。

比如1月21日宣布的The Stargate Project所显示,下一代大模型所需的算力可能达到百万卡集群的规模。

所以DeepSeek的方式是否在下一代模型研发中有效还有待观察。(这才是重头戏如果能在下一代模型研发中也胜出那就是撼动了整个生态)。

在这之前英伟达等AI产业链内生产核心产品的公司依然会占据绝对优势。

0 阅读:0
泛舟啊

泛舟啊

感谢大家的关注