游戏百科

30分钟破冰!Claude Code硬刚英伟达,打破CUDA垄断

作者丨遥遥领先题图丨来源网络30分钟完成技术破冰!Claude Code硬刚英伟达CUDA垄断的表现,彻底颠覆了行业固有

作者丨遥遥领先

题图丨来源网络

30分钟完成技术破冰!

Claude Code硬刚英伟达CUDA垄断的表现,彻底颠覆了行业固有认知!

AI开发者johnnytshi在Reddit分享的经历,让英伟达筑建十余年的CUDA护城河,首次被AI轻松撕开缺口。

本文从技术实测细节、商业布局逻辑切入,拆解这场破冰之战的核心逻辑,同时给不同人群提供可落地的参考方向。

Claude Code硬刚英伟达

对深耕AI框架开发的工程师而言,CUDA转ROCm的迁移工作,曾是动辄数周的“苦差事”。传统流程不仅要搭建Hipify翻译层环境,还得手动修正大量兼容性Bug。

而johnnytshi的操作堪称颠覆性——借助Claude Code,全程不用中间转换工具,仅用半小时就完成了完整CUDA后端代码的ROCm迁移,甚至无需手写一行代码。

这一事件的震撼之处,不在于迁移本身,而在于AI直接绕开了英伟达的生态封锁,为AMD ROCm撬开了打破垄断的缺口。

Claude Code的突破,核心在于其智能体框架具备的“自主研判能力”。它不是机械替换代码关键词,而是能深度吃透核函数的底层运行逻辑。

此次迁移中,最棘手的数据布局差异问题,就被AI自主识别并优化,确保核心计算流程不受影响,为打破CUDA垄断奠定技术基础。

实际操作中更便捷的是,开发者只需通过命令行(CLI)交互,不用再耗费精力调试复杂的翻译层环境。

AMD软件副总Anush E.对此直言意外,认为GPU编程的未来必然属于AI智能体,而这正是瓦解CUDA垄断的关键力量。

GitHub实测细节:量化数据下的ROCm后端表现

johnnytshi在GitHub仓库(lc0项目PR#2375)中公开的日志,披露了完整实现流程。

此次为AMD GPU搭建的ROCm后端,适配了注意力网络架构,涵盖多头自注意力、FFN等核心模块,通过rocBLAS和MIOpen分别处理矩阵运算与卷积任务。

实测数据显示,在Radeon 8060S(RDNA 3.5架构)上,FP16精度下性能突破2000 nps,自动Batch Size调优后最小批次可设为64。

编译时添加“-Drocm=true -Damd_gfx=gfx1151”参数即可适配,两款测试模型均能生成正确结果,仅遗憾未覆盖所有AMD架构。

值得一提的是,测试中rocWMMA表现不及rocBLAS,AI也主动选择了更优方案。Claude Code的表现虽亮眼,但并非毫无短板。

处理简单或中等复杂度内核时,它能高效完成迁移与优化,可面对针对特定硬件缓存层级、内存访问模式做过极致优化的复杂内核,AI目前还难以完全替代人类专家。

比如这类深度贴合硬件特性的高性能内核,AI没法精准拿捏硬件与代码的深度适配点,复刻不出人类专家的经验性优化思路。

这也说明,在高端GPU性能极限压榨场景中,人类工程师的核心作用仍不可替代。

AI编程进化史:智能体如何瓦解CUDA垄断

过去几个月,ZLUDA项目和微软内部的尝试都在挑战CUDA的市场主导权,但自动化水平有限——ZLUDA仍需依赖翻译层适配,微软方案也只能在特定场景下使用。

Claude Code代表的智能体式编程,凭借“理解+自主决策”实现了跨越式突破,为打破CUDA长期垄断提供了全新路径。

从行业走向来看,GPU编程正慢慢成为AI智能体的主场,未来开发者或许只需明确需求,AI就能独立完成跨平台适配与性能优化,CUDA的生态霸权将不再是不可撼动的壁垒。

Anthropic内部已率先实现“无手写代码”模式,工程师不再专注编码,转而聚焦需求拆解与逻辑校验,所有编码工作都交由Claude完成。

有意思的是,这一模式还延伸到了非技术部门:财务团队用纯文本描述数据需求,Claude就能自动生成执行流程并输出Excel结果。

斯坦福AI讲师Kian Katanforoosh更是将公司全员切换到Claude Code,他坦言这款工具的编程能力提升明显,能让新人快速上手复杂项目。

Anthropic CEO Dario Amodei的预测更为大胆:未来6-12个月,AI或将彻底接手软件工程师的编码工作。

Claude Code上线不到一年,年度经常性收入(ARR)就突破10亿美元,2025年底又新增至少1亿美元,成为Anthropic增速最快的业务板块。

这一成绩并非个例,竞争对手Cursor在同年11月也达成10亿美元ARR目标。巨大的市场潜力,吸引OpenAI、谷歌、xAI纷纷入局,赛道竞争愈发激烈。

商业爆发:10亿ARR背后的赛道争夺

从商业角度看,企业对高效编程工具的付费意愿,正是这一领域爆发的关键,AI编程工具也从开发者辅助工具,升级为企业级核心生产力工具。

在编程领域站稳脚跟后,Anthropic推出了面向非编程人群的AI智能体Cowork,将智能体能力拓展到全办公场景。

它能直接管理电脑文件、操控各类软件,还能自动处理项目管理中的繁琐事务——比如识别未提交表单的成员,通过办公软件发送提醒并跟进进度。

对职场人来说,这意味着繁琐的流程化工作将被AI接手,个人精力能集中在更具创造性的事务上,本质是AI智能体对办公生产力模式的重塑。

面对AI编程的浪潮,行业专家Cherny给出了务实建议:工程师无需恐慌,AI智能体只是编程抽象化迭代进程中的新一步,就像从汇编语言到高级语言的进化。

他自己每天都会借助多个编程智能体开展工作,把代码编写、调试等繁琐事务交给AI,自己专注于架构设计与逻辑把控。

在他看来,AI最终会接手所有重复性工作,工程师的核心竞争力将转向需求解读、复杂问题攻克与创新设计。

这场由Claude Code掀起的变革,不仅撕开了英伟达CUDA的垄断防线,更重塑了软件工程的底层运行逻辑。

对普通开发者来说,AI编程工具能降低技术门槛,减少对CUDA生态的单一依赖;对企业而言,它能打破英伟达的技术绑定,提升研发效率;对行业来讲,它将推动GPU生态摆脱CUDA单一主导,走向多元化竞争。

你在工作中是否用过AI编程工具?欢迎在评论区分享你的真实体验与感受!