从“专用”到“通用”—华为 AI 芯片架构大转向背后的信号
- 2025-07-13 00:20:24
- 119
科技 I 渝码科技
7 月 11 日,《The Information》援引多位供应商人士消息称,华为正酝酿一次“推到重来”式的芯片重新设计。
将现有昇腾系列所采用的 ASIC(专用集成电路)路线,整体转向更接近 GPGPU(通用图形处理器)的架构,并同步推出兼容 CUDA 的中间件。
该消息若属实,这不仅意味着华为在AI芯片技术路线上的重大调整,更可能重塑中国 AI 算力市场的竞争格局。
1、为什么“改弦更张”?
在 A100/H100禁售、特供版“阉割”的背景下,英伟达仍通过 GUDA生态牢牢占据中国 AI 训练 90% 以上份额。
国内大模型初创公司宁可高价求购“水货”,也不愿迁移到其他平台,核心原因就是软件栈迁移成本过高。
同时,昇腾 910B在INT8/FP16推理场景下能效比出色,但面对大模型训练所需的高带宽、双精度浮点、稀疏计算等需求,AISC 的固定管线难以灵活扩展;而GUDA的可编程性天然适合算法快速迭代。
此外,华为 CANN平台虽持续迭代,但开发者规模、开源模型仓库、第三方框架插件与 CUDA 相比差距明显。
兼容 CUDA ,等于拥抱现成的十万级开发者与数千个加速库。
2、“重新设计”到底改什么?
根据爆料,华为新一代 AI 芯片将在三大层面动刀:
架构:放弃纯 ASIC 的“硬化”思路,转向 GPGPU 的 SIMT(单指令多线程)+ Tensor Core 混合设计,保留部分可配置矩阵单元,兼顾能效与灵活性。
互联:或采用类似 NVLink 的 die-to-die 高速总线,方便多芯堆叠,解决大模型训练中“内存墙”问题。
软件:推出“CUDA-to-CANN”动态翻译层,开发者无需改一行 CUDA 代码即可在华为芯片上运行;同时继续维护原生 CANN 栈,确保长期可控。
3、时间表与落地挑战
供应链消息指出,华为内部已成立“GPU-Lab”特别项目组,由 2012 实验室与海思联合牵头,目标 2025 Q2 完成首颗流片,2025 Q4 小规模送测。
真正的挑战在于:
先进工艺:GPGPU 对 5 nm 以下 EUV 产能需求高,在美国制裁阴影下如何持续获得良率可控的代工资源,仍是最大不确定因素。
IP 风险:SIMT 指令集、纹理单元、缓存一致性协议等核心 IP 是否涉及英伟达/AMD 专利?华为需要绕开或取得交叉授权。
商业闭环:兼容 CUDA 只是“敲门砖”,如何在训练、推理、云、端之间形成可持续的订阅或授权商业模式,比做一颗芯片更难。
4、产业影响:谁喜谁忧?
云厂商:阿里、腾讯、百度等原本被迫“囤货”英伟达,一旦华为 GPGPU 性能/软件差距缩小,议价权将显著增强。
服务器 OEM:浪潮、超聚变等可顺势推出“国产 GPU 整机”,降低供应链风险。
国产 AI 芯片初创:壁仞、沐曦、天数等原本走 GPGPU 路线的公司,将面临华为在资金、渠道、生态上的降维打击;而坚持 ASIC 路线的寒武纪、地平线,则需要在细分场景里跑得更快。
最终用户:大模型创企、高校、科研院所,短期内多了一个“能用 CUDA”的国产备选方案,长期看仍需观察性能、价格、可持续供应。
个人认为,“做芯片,十年磨一剑;换架构,等于把剑回炉重铸。”华为此次若真从 ASIC 转向 GPGPU,既是一次技术路线的自我否定,也是一场生态战略的豪赌。
赌赢了,中国在 AI 算力的“第二选择”将真正落地;赌输了,则可能丢掉昇腾多年积累的 ASIC 优势。
但可以确定的是,在美国持续加码的出口管制下,留给中国厂商“试错”的时间窗口,正在迅速收窄。
- 上一篇:山东历史
- 下一篇:岁任达华回山东老家收麦子