资讯详情
中国AI,不想再活在CUDA里
张永堃| 2026-05-20 14:29:57
AI芯片英伟达华为


出品/未来科技界

作者/张永堃

编辑/李彦

5月14日,中美工商界代表会议结束后,英伟达创始人黄仁勋被记者围住。有人追问:“英伟达会向华为出售芯片吗?”黄仁勋一脸诧异,只是意味深长地留下一句:“你这问题太奇怪了……”

毕竟,在中美芯片管制持续收紧的背景下,英伟达与中国市场的关系,早已被卷入了一场更复杂的技术竞争、产业替代与地缘博弈之中。而华为,正是那个“被迫成长”起来的强力竞争者。

联想到上个月,同样是围绕芯片问题,黄仁勋就在一档播客中曾被激怒。起因是主持人以MAGA的那一套扬言:“美国应当彻底停止向中国出售任何先进芯片,以此从根源上遏制中国人工智能产业的发展,避免未来在AI领域被中国反超。”。黄仁勋直言这种想法“短视且危险”,并指出,中国的AI研究人员占全球的50%,同时,禁售只会倒逼中国自己造芯片,而中国也确实造得出来。

一次沉默加上一次愤怒,黄仁勋的考量肯定不止于商业利益,他对全球AI竞争格局有着更深层次的判断。

“五层蛋糕”,决定人工智能的未来

2026年初,黄仁勋在达沃斯论坛上首次抛出“五层蛋糕”比喻,之后又发表署名长文系统阐述。这五层从下往上依次是:能源、芯片、基础设施、模型、应用。

在黄仁勋的“五层蛋糕”理论中,能源是AI体系最底层的基础,没有稳定的电力,再强的模型也无法运行;芯片则是将电力转化为算力的核心引擎,也就是AI加速器,决定训练与推理效率。再往上是数据中心、散热、网络通信等基础设施层,负责承载大规模算力集群;其上是大模型、多模态等算法能力;而最顶层,则是自动驾驶、工业机器人等应用场景,真正决定AI能否转化为现实生产力与商业价值。

在黄仁勋看来,AI竞争是这五层的系统协同,每一层的进步都会拉动其他层面。这个框架的价值在于,它把AI从一个“芯片问题”重新定义为“全社会基础设施问题”。同时,黄仁勋的观点也暴露了美国选择出口管制的根本缺陷:禁售芯片只能卡住第二层。

英伟达失守中国,催熟了中国的AI生态

美国的芯片封锁,并不是从大模型时代才开始的。早在2018年,美国便开始施压荷兰,限制ASML向中国出口先进光刻机,2021年至2023年间,芯片禁售政策从“实体清单制裁”扩大为“全面技术封锁”。黄仁勋曾透露这一禁令让英伟达在中国的高端业务几乎完全停滞。

但正如黄仁勋所说,“卡脖子”只会加速国产自研的进程。过去几年,国产AI芯片厂商在持续迭代产品架构与算力性能。未来科技界统计了国内主要AI芯片厂商2026年旗舰产品的数据。从整体趋势来看,国产AI芯片正在向更高算力、更大集群规模以及更完善的软件适配能力持续演进。


除已公布参数的产品外,平头哥的真武810E(PPU)、沐曦的曦索X206、燧原科技的燧原L600、天数智芯的天垓Gen 3等新品也已陆续亮相。就在5月20日,2026阿里云峰会推出了平头哥新一代训推一体AI芯片“真武M890”,国产AI芯片生态仍在持续扩张。

除芯片之外,中国在能源、基础设施、模型与应用四层的优势,正在反向“托起”整个AI体系。

首先是能源。黄仁勋曾提到:“当你拥有充裕能源时,它可以弥补芯片的不足。”而中国恰恰拥有全球最强的电力供给能力。据国家统计局报道,2025年,中国发电量达9.7万亿千瓦时,位居全球第一。IDCA在2026年5月发布的《全球数据中心报告》显示,相比美国数据中心用电已占全国电力约6%、逼近电网承载压力,中国这一比例仅约0.8%,仍有巨大余量。“东数西算”推进后,西部低电价与绿电资源,也正在降低AI训练成本。

其次是基础设施。AI竞争不仅是算力竞争,也是散热与数据中心能力竞争。随着液冷服务器需求爆发,中国液冷产业链正在快速成熟。此前3M退出氟化液市场后,国内企业迅速补位,中石油克拉玛依石化等厂商已实现浸没式冷却液国产化,AI基础设施自主能力正在提升。

模型层则是美国最难忽视的变量。黄仁勋今年曾公开表示:“如果DeepSeek最先运行在华为平台上,那将是灾难性的。”2026年3月,中国开源模型在Hugging Face平台的月下载占比已达41%,首次超过美国的36.5%。比如通义千问系列全球下载量就逼近十亿次,衍生模型突破20万个,开发者生态规模已超越美国公司Meta的Llama。

而真正决定AI长期竞争力的,仍是应用层,而应用恰恰是中国公司的强项。据中国信通院数据,AI在各行业的平均渗透率已达39.2%。以医疗为例,全国已有68%的基层医院使用AI辅助诊断;在高端制造领域,62.3%的企业正用AI优化生产流程;金融行业的AI渗透率也达到58.7%,广泛应用于风控与智能客服。

正是这些丰富的应用场景,催生了海量的算力需求,直接拉动了国产AI加速卡的市场份额。市场研究机构IDC的报告显示,2025年中国AI加速服务器市场中,本土GPU和AI芯片厂商占据了近41%的市场份额,AI加速卡总出货量达到约400万张。

这也是黄仁勋真正担心的地方:中国芯片厂商或许短时间内还没有追平英伟达的能力,但一个能够自我循环、自我迭代的AI生态,已经开始形成。

DeepSeek在国产芯片上跑通了

4月24日,DeepSeek V4预览版发布,该模型实现了与华为昇腾等国产芯片的深度适配。这标志着,中国AI产业在摆脱对英伟达CUDA生态依赖的进程中迈出关键一步。

过去十多年,英伟达真正的护城河,从来不只是GPU硬件本身,而是“CUDA+硬件”共同构成的软件生态。全球数百万开发者早已习惯CUDA的编程模型、工具链与调试体系,大量AI框架、算子和行业模型,也都建立在CUDA之上。某种程度上,AI行业长期默认了一个前提:顶级模型必须运行在CUDA生态里。

而DeepSeek V4与国产芯片的协同,第一次让这一假设出现松动。这意味着,中国开始出现“顶级模型+国产算力+国产软件栈”的完整闭环——不仅芯片在国产化,连训练框架、编译器、算子库与开发工具,也开始逐步摆脱对CUDA体系的依赖。

这也是为什么,未来AI竞争的关键,已经不只是单卡性能,而是谁能真正建立开发者生态。因为生态的核心永远是开发者:每一名从CUDA迁移到国产平台的开发者,都会带走一部分原有生态的黏性;而他们在新平台上开发的算子、工具和行业模型,又会进一步完善国产生态,吸引更多企业与开发者加入,最终形成正向循环。

未来科技界根据公开数据统计,目前国产AI芯片厂商的开发者生态已初步形成。


其中,华为昇腾开发者规模已达到约400万人,占国产AI芯片阵营总量近八成,“头雁效应”正在显现。与此同时,平头哥、摩尔线程等厂商也在持续加码工具链与社区建设,国产AI生态正在从“单点突破”走向“体系竞争”。

结语

技术封锁从未真正扼杀创新,它只是重新绘制了竞争的版图。

中国这片拥有14亿人口的大陆,拥有全球最复杂的产业场景、最庞大的工程师群体,以及最愿意快速落地新技术的市场环境。一旦这些能力与国产算力平台开始深度耦合,AI的发展路径就可能从“追赶美国”,逐渐转向“长出自己的技术范式”。

黄仁勋其实已经看到了这种趋势。短期内,英伟达CUDA生态、GPU性能与系统能力的领先地位依旧毋庸置疑。但在AI时代,单点技术领先并不等于永远领先。真正决定产业格局的,是生态能否持续扩张与自我演化。

英伟达的城墙还很厚,但国内在拆这堵墙的人,已经快排到巴黎了。

转载之前请先阅读转载说明,违规转载法律必究
寻求报道或合作,请点击这里
如果您加入壹览的讨论群,请联系我们的工作人员(微信号:star_3979)