从亏钱生意到利润1000%，英伟达靠什么成为万亿GPU霸主？

2023-10-18

创业邦关注

英伟达为CUDA生态铺垫了十余年。

来源丨快鲤鱼（ID：akuailiyu）

作者丨李霜霜

编辑丨海腰

2023年6月13日，英伟达市值突破万亿美元大关，仅次于苹果、微软、Alphabet和亚马逊，成为美国第五大市值公司，第二季度，英伟达在数据中心业务收入超过100亿美元，高于英特尔和AMD营收之和。

GPU芯片在超级计算和全球巨头大模型训练战中地位举足轻重，而掌握全球80%GPU市场份额的英伟达赚得盆满钵满。然而，这种垄断式的市场占有率不是一夜砌成的“城墙”。

据Tractica数据，预计到2025年全球AI硬件市场收入将达到2349亿美元，其中GPU的收入占23.2%。

英伟达在GPU市场的构筑的护城河，CUDA是其中至关重要的一环。

一套完善的编译器生态

2006年，正是在AMD收购了ATI、英特尔依然蝉联全球第一大芯片厂商的时候，英伟达推出了CUDA（Compute Unified Device Architecture），它是英伟达研发的平行运算平台及编程模型。

AI大神吴恩达简单评价了CUDA的意义：“在CUDA出现之前，全球能用GPU编程的可能不超过100人，有CUDA之后使用GPU就变成一件非常轻松的事。”

多数CUDA的推荐者认为，CUDA完善的编译器生态是英伟达GPU在高性能计算领域成功的关键。

具体来讲，CUDA具有易部署、开发接口灵活、编程语言适配、工具及代码库完备等优点，并且兼容Windows、Linux和MacOS多个操作系统。

CUDA的开发让GPU不再是简单的图形处理器，适用对象也从游戏制作人变为科学家、工程师或艺术家。

随着不断迭代，CUDA在针对AI或神经网络深度学习领域推出了非常多的加速库，构成了CUDA的软硬件生态站。

大卫·罗森塔尔在Acquired.FM中介绍，CUDA的代码库是经过优化的，开发人员调用这些库开发程序更加便利。因此，CUDA有庞大的社区资源，2023年5月注册开发者增加至400万人。

投入过百亿的CUDA生态

英伟达凭借CUDA几乎垄断了训练芯片市场，业界也几乎没有巨头对CUDA生态造成颠覆性冲击。

英伟达为CUDA生态铺垫了十余年。

2007年，英伟达的GPU研发技术已占据强势地位，次年英特尔的大客户苹果将MacBook除CPU外直接替换成英伟达Tesla架构的GPU便印证了这一点。

据报道，经年累计英伟达对CUDA总投入早已超过100亿美元。

在黄仁勋商业化考虑之下，CUDA生态需要培养潜在开发者，成为受到程序员和企业欢迎的技术平台。

在2006年推出CUDA后，英伟达的第一个战略便瞄准了“软件开发人员”，投入巨资让开发者习惯使用CUDA平台。

初期，开发者社区有这样一句话：CUDA在编程语言和共享存储器两个层次的并行都简化了编程，使得本科生也能使用CUDA写出大规模高性能计算程序。

为扩大覆盖率，英伟达将CUDA引入大学课堂，与伊利诺伊大学等高校合作完善函数库。在2010年时，已有250所大学开放CUDA的教学课程，并有相关论文数千篇。以此为基础完善生态，英伟达建立研究中心、教学中心、认证计划，到2015年已有800所大学开发相关课程。

再从业界来看，英伟达投入资金做inception计划（初创加速计划），让初创公司运用CUDA做项目铺垫基础。

至今，已有超过100家初创公司利用了CUDA。此外，英伟达开源了Cub、NCCL等通用场景下的开发库，并优化中间件性能的基础库给厂家使用，再次扩大了生态系统。

因此，许多开发者依赖于CUDA，同时凭借强大的核心能力在消费市场上受到青睐。

2012年，在ImageNet竞赛一举夺冠的AlexNet面世后，CUDA已迭代至5.0版本，支持了动态库和GPU指针。

2016年，OpenAI成立之时，CUDA8.0已经支持半精度浮点数和张量核心，软件生态已由学界和业界人士熟知、互相推荐。

2022年底，ChatGPT的发布将生成式AI送到人们眼前，CUDA12.0支持了新的NVIDIA Hopper 和 NVIDIA Ada Lovelace 架构功能，并为所有GPU提供了额外的编程模型增强。

等到大模型热度吹进各家企业时，英伟达已经深化了他们在行业中的差异化，成为市场玩家购物篮的第一选择。

目前为止，基于CUDA的GPU销量超过百万。

而众多GPU芯片厂家中，为什么是英伟达做出了唯一的CUDA开发环境？

从亏钱生意到利润1000%

回顾世纪初期，英伟达与微软、ATI、AMD、英特尔五家巨头的混战，英伟达在图形处理市场中逐渐占据优势。

2006年7月，AMD以54亿美元溢价收购ATI，芯片市场重新洗牌。同年，英伟达的首席科学家David Kirk提出了“将GPU技术通用化”的思路，从主要做3D渲染的任务中脱离出来，探索通用计算任务。

这个思路就是CUDA。而当时，愿意担起这门费钱费力的技术活的也是英伟达。

几大家芯片公司中，老对手AMD买下ATI后GPU研发进入弱势地位，英特尔取消了自研GPU计划。英伟达则在GPU技术方面将巨头们甩在了身后。

17年前，研发CUDA是一个超前的决定，英伟达的CUDA进化并非一帆风顺，黄仁勋则坚持“加速计算”是未来。

英伟达和英特尔在2006年秋天共同开发了基于CUDA的新型GPU，即G80 GPU。而两者的合作持续不长久，CUDA的研发决策需要英伟达长久地投入大量资金。

从产品特性上来说，CUDA逻辑电路在硬件产品中增加会导致芯片的散热需求增高，由此也会带来成本上升、故障增多的风险。

从财报表现来看，CUDA也是一门亏钱生意，在2008年金融危机前后表现得更为明显。

在最艰难的时候，黄仁勋也没有中断CUDA，直到2012年辛顿教授带队以GPU代替CPU训练AI模型做出了AlexNet。

2020年，黄仁勋在接受Barron周刊时强调：“英伟达将推动下一个人工智能大爆炸。”

这5年，为了迎接人工智能，英伟达做了3件事。

第一，2019年3月，英伟达以69亿美元收购了高性能计算互联技术公司Mellanox 。这家公司的主要产品InfiniBand，被认为速度更快、带宽更高，是数据传输的有效方式，而Mellanox是唯一的InfiniBand规范提供商。

第二，英伟达于2022年9月发布新一代AI芯片“Drive Thor”，专为大规模GPU集群协调设计，是英伟达一款完全集成的解决方案。

第三，英伟达推出专为加速计算和生成式AI打造的Hopper架构，H100便是基于此架构的GPU。市场消息称，H100是英伟达利润率高达1000%的产品，出货量超过900吨。

随着ChatGPT发布，带动AI服务器出货量和价格上涨，英伟达的GPU芯片价格水涨船高。英伟达的DGX H100售价总价为268495美元，包含8GPU+4NVSwitch基板等，每台毛利率接近190000美元。

英伟达的财务收入令人瞩目，据悉，过去3个财年的复合年增长率（CAGR）达到35.2%，预计2023年收入将飙升51.4%至408亿美元。

CUDA构筑的壁垒能被打破吗？

2016年，AMD推出基于开源项目的GPU生态系统ROCm，类似英伟达的CUDA系统，然而ROCm技术相较落后，在2023年4月才登录Windows平台。由于切入时间较晚，AMD开发者数量远也低于英伟达。在Github上，贡献CUDA软件包仓库的开发者超过32600位，而ROCm只有不到600个。

英伟达大约占据全球80%的GPU市场份额，光从销量来看，都是一家独大。

而英伟达的垄断市场的优势可以持续多久？

针对这一问题，Semi Analysis首席分析师Dylan Patel给出观点：随着PyTorch支持更多GPU厂商，再加上OpenAI的Triton搅局，英伟达手中的利器CUDA 逐渐锋芒不再。

软件生态来看，CUDA的霸主地位确实受到各方攻击。

近年，AI开发框架PyTorch因灵活的eager模式使用比率逐渐超越了TensorFlow，PyTorch2.0版本将会对AMD、英特尔、特斯拉、谷歌等GPU和加速器进行支持完善。

OpenAI则直接推出了“简化版CUDA：Triton”，操作难度低于CUDA。

2023年第一季度，AMD宣布ROCm系统融入PyTorch2.0框架，TensorFlow和Caffe深度学习框架也已加入第五代ROCm。其6月发布下一代数据中心加速处理器（APU）AMD MI300软件方面能够全面兼容英伟达CUDA生态，被业内认为有机会挑战英伟达在人工智能的行业地位。

尽管如此，从算力角度来看，英伟达H100的升级产品DGX GH200解决了大规模AI的关键瓶颈，适配资金充沛且性能要求高的潜在客户。短期内，CUDA生态仍然稳健，大多数需要训练芯片的用户在仍然会选择英伟达。

本文（含图片）为合作媒体授权创业邦转载，不代表创业邦立场，转载请联系原作者。如有任何疑问，请联系editor@cyzone.cn。

创业邦

xiaomishuhao
010-53391121
db@cyzone.cn
+86 13810169549
北京市朝阳区利泽西街东湖国际中心A座9层

关于我们

法律相关

订阅服务

杂志订阅

旗下服务

爱奇清科（北京）信息科技有限公司地址：北京市朝阳区利泽西街东湖国际中心A座9层 | 网络文化经营许可证（京网文[2018]2153-213号）

违法和不良信息举报电话：010-53391121 举报邮箱：db@cyzone.cn

京公网安备 11010502035114号

营业执照出版物经营许可证