⚔️ 一、开篇:一场静悄悄的权力交接
2022 年,中国 AI 芯片市场还是英伟达的”后花园” 🏡。C 端玩家拿到的是阉割版 A800/H800,B 端大厂排队等卡,交付周期动辄半年起步。当年的国产芯片出货量,甚至填不满英伟达一个季度的零头。
三年后的 2025 年,一切都变了 🔄。
根据 IDC 等机构交叉数据,2025 年中国 AI 芯片总出货约 401.6 万张 📊。其中国产本土厂商合计出货约 165 万张,市占率从三年前的不足 15% 跃升至 41% 🚀。英伟达则从一度高达 95% 的绝对统治滑落至 55% ⬇️——三年丢掉整整 40 个百分点。
这组数字的背后,不是某个单一因素的爆发,而是 出口管制 + 政策引导 + 技术突破 + 资本涌入 🔥 四股力量共振的结果。更重要的是,2025 年不是终点,而是一个历史拐点的开始 🎯。
🗺️ 二、一超多强:2025 年的国产芯片版图
如果给 2025 年的国产 AI 芯片画一张地图,它会是典型的「一超多强」格局。
🏆 华为昇腾(Huawei Ascend)——绝对龙头
出货约 81.2 万张 🎖️,占国产芯片总出货量近 50%,全市场排名第二(仅次于英伟达)。华为走的是一条最难的路线——完全自主的 NPU 架构,不兼容 CUDA,从芯片(昇腾)到框架(MindSpore)到计算架构(CANN)到开发者工具,全栈自建。
- ✅ 优势:全栈可控,软硬协同优化深度最深;政企市场护城河稳固;超节点能力(384 颗芯片组合)形成系统级壁垒。
- ⚠️ 弱点:生态封闭,模型适配成本高;过度依赖政企订单;商业化向互联网/中小客户渗透尚需时日。
🐎 阿里平头哥(T-Head)——云芯协同的黑马
出货约 26.5 万张,位列国产第二、全市场第三。平头哥走的路线与华为不同——依托阿里云生态,从云到芯做垂直整合。其真武 810E 已接近 H20 性能,2026 年出货预期 40-50 万张。
- ✅ 优势:阿里云天然落地场景,搜索/广告/推荐业务验证充分;云芯绑定降低 TCO。
- ⚠️ 弱点:主要服务阿里内部需求,第三方市场影响力有限。
🧠 寒武纪(Cambricon)——专业选手的价值验证
出货约 11.6 万张,与昆仑芯并列国产第三。但更值得关注的是财务数据:2025 年全年营收 64.97 亿元,同比增长 453% 📈;归母净利润 20.59 亿元,上市以来首次全年盈利 💰。2026 年 Q1 营收 28.85 亿元,同比再增 160%。
寒武纪的技术路线是 DSA(领域专用架构),核心王牌是硬件级稀疏化计算 🎯——在硬件层面自动跳过神经网络中的零值运算,这对大模型推理加速至关重要。其 MLU590 已在字节跳动的搜广推业务中大规模部署,思元 690 号称能达到 H100 80% 以上的性能。
- ✅ 优势:DSA 架构在推理场景能效比突出;已通过互联网大厂大规模验证;DeepSeek 效应(深度适配形成锁客效应)🧲。
- ⚠️ 弱点:客户高度集中(前五大客户占 88.66%);先进制程 + CoWoS-L 封装双重产能约束。
🛡️ 海光信息(Hygon)——兼容派的差异化生存
出货约 8.25 万张,占国产约 5%。营收 143.77 亿元(含 CPU 业务),净利润 25.45 亿元。海光的选择最务实:走 GPGPU 路线,极致兼容 CUDA/x86。其 DTK 软件栈可将 CUDA 代码高效转译,开发者几乎无需重构就能迁移。
- ✅ 优势:迁移成本最低,「即插即用」🔌;FP64 双精度能力突出,在 HPC+AI 交叉场景有独特身位;已适配 365 款主流大模型。
- ⚠️ 弱点:兼容路线性能损失客观存在;缺乏深度模型适配,发展节奏易受行业趋势影响。
🎲 三、三条技术路线的对决
国产 AI 芯片的竞争,本质上不是「谁算力更强」,而是 「如何绕过 CUDA 这座大山」🏔️ 的不同回答。
| 维度 | 🏛️ 华为昇腾(NPU 自建) | 🧠 寒武纪(DSA 专用架构) | 🛡️ 海光信息(GPGPU 兼容) |
|---|
| 架构理念 | 全栈自主,封闭但高效 | 领域特化,能效为王 🌿 | 极致兼容,降低门槛 |
| CUDA 策略 | 编译器转译 + 自建 CANN | 编译器转译 + 自建 Neuware | DTK 直接兼容,追求无损迁移 |
| 推理表现 | 950PR 达 H20 的 2.87 倍 🔥 | MLU590 在搜广推已验证 | 通用场景稳健,无特别优势 |
| 训练能力 | 910C 达 H100 约 80%,960 系列 2027 冲刺 ⏳ | 690 系列训练能力待验证 | DCU 主要面向推理+HPC |
| 生态开放度 | 🔒 封闭(政企为主) | 🔓 半开放(已开源部分代码) | 🌐 开放(兼容主流生态) |
| 最大护城河 | 全栈能力 + 超节点 + 政企渠道 | DeepSeek 深度适配 + DSA 能效 | x86/ROCm 存量市场 |
| 最大风险 | 出圈商业化难度 ⚡ | 客户集中 + 产能瓶颈 | 兼容天花板明显 |
⚡ 核心分水岭:推理 vs 训练
2025-2026 年最重要的变化是:推理算力正在取代训练算力,成为市场的主战场。 🎯
2026 年 3 月,国内日均 Token 调用量已突破 140 万亿 🔢。模型从训练走向部署,推理芯片的需求呈指数级增长 📈。而这恰恰是国产芯片的优势区间——推理对单卡绝对性能的要求低于训练,但对能效比、时延、TCO 的要求更高。
华为昇腾 950PR 正是在这个节点亮出了最锋利的刀 🔪:FP4 精度下单卡推理性能达英伟达 H20 的 2.87 倍 ⚔️,显存占用减少 75%,成本降低 50 倍以上。DeepSeek V4 在昇腾上的推理效率较 CUDA 版本提升 35 倍 💥——这种「模型 × 芯片」的协同优化,正在形成新的竞争壁垒。
🏗️ 超节点:系统级降维打击
另一个重要趋势是 「超节点」架构的兴起 🏙️。当单芯片性能受制于制程天花板,华为的选择是:用系统架构来补。
384 颗昇腾芯片通过 HCCS(华为自研高速互联协议)组合成超节点,配合自研交换网络,整体算力反超英伟达 GB200 集群 1.7 倍 💪。这不仅仅是「以量补质」,而是重新定义了算力竞争的维度——从单芯片跑分,变成了互联密度、交换效率、软件协同的系统工程竞争 🔗。
🔗 四、生态之战:CUDA 的幽灵与国产替代的阿克琉斯之踵
如果说硬件差距是「看得见的追赶」👁️,那么软件生态的差距是「看不见的深渊」🕳️。
CUDA 从 2006 年开始建设,覆盖全球 400 万+ 开发者 👨💻。中国绝大多数 AI 开发者都是英伟达生态的「原住民」——他们的代码、习惯、调试工具、最佳实践,全部基于 CUDA 构建。迁移到国产平台意味着大量代码需要重写,这个时间成本往往比硬件价差更难接受 😫。
🎪 三个阵营,三种生态策略
1️⃣ 华为 CANN + MindSpore(封闭自建)
华为的选择是「最重」的路线 🏋️:不接受兼容,不依赖 CUDA,从零开始构建自己的软件栈。CANN(异构计算架构)提供底层算子库和编译器,MindSpore 作为深度学习框架,配合昇腾芯片做深度协同优化。
- ✅ 利:软硬件一体优化,性能释放最充分;全栈自主可控,无外部依赖风险。
- ❌ 弊:开发者学习成本高;模型适配工作量大;独立于全球主流生态。
💡 转折点:2025 年华为将 MindSpore 全面开源,DeepSeek V4 成为首个从 CUDA 完整迁移至 CANN 的主流大模型。推理效率反超 CUDA 版本 35 倍 🚀——这个结果让「自建生态是否可行」的质疑,第一次有了实证反证。
2️⃣ 寒武纪 Neuware(专业适配)
寒武纪不走全栈封闭路线,而是聚焦于 Neuware 平台,针对特定场景做深度优化 🎯。其战略高点在于与 DeepSeek 等国产大模型形成绑定——如果 DeepSeek V5 基于寒武纪 690 进行训练,下游推理将无需额外适配。这种**「训练锁定推理」**的逻辑,是寒武纪对抗华为全栈整合的最强武器 🔫。
3️⃣ 海光 DTK(生态寄生)
海光的选择最务实 🤝:通过 DTK 软件栈实现对 ROCm 及 CUDA 生态的高效转化。「如果你不能打败 CUDA,那就加入它。」开发者几乎无需重构代码,即可将业务迁移至海光平台。
- ✅ 利:迁移门槛最低,存量市场切入快 🏃。
- ❌ 弊:兼容路线导致性能天花板明显;缺乏深度定制优化,当芯片架构差异变大时,转译效率会持续下降 📉。
🏁 Day 0 适配:一个里程碑
🎉 2026 年 4 月 24 日,DeepSeek V4 发布当天——华为昇腾、寒武纪、海光、摩尔线程、沐曦同步完成全栈适配 👏。这在中国 AI 芯片历史上是第一次。
此前,只有英伟达能做到发布即适配,其他 GPU 通常滞后数月。这一事件标志着国产生态集体跨越了「可用」到「好用」的门槛——至少对于推理场景而言 🚪。
🔧 五、制造破局:没有 EUV 光刻机的突围策略
如果说芯片设计是「头脑」🧠,芯片制造就是「手脚」🦶。在美国出口管制下,中国无法获得 ASML 的 EUV 光刻机,最先进的制程被卡在 7nm(中芯国际 N+2)🔒。
但国产芯片正在用三张牌来做突破 🃏:
🃏 第一张:先进封装(Chiplet 技术)
Chiplet 的核心思想是「用成熟制程堆出高性能」🧱——将大芯片拆解为多个小芯粒(chiplet),用先进封装技术(2.5D/3D)将它们高速互联,等效于一个先进制程大芯片。
2025-2026 年,国产 2.5D 封装(CoWoS-S)已实现量产 ✅,长电科技、通富微电、盛合晶微等企业突破了关键技术。昇腾 910B/910C/950 均采用 CoWoS-S 过渡路线,960 系列将升级为 CoWoS-L。寒武纪 690 是国内首个采用 CoWoS-L 的产品 🥇。
🃏 第二张:自研 HBM
AI 芯片的另一个瓶颈是 HBM(高带宽内存)💾。华为已推出自研 HBM「HiBL 1.0」,昇腾 950PR 搭载 112GB 自研 HBM,带宽 1.4TB/s ⚡。与此同时,国内存储厂商在 2026 年已实现 HBM2e 量产,HBM3 进入小批量试产——虽然距离 SK 海力士的最新 HBM3e 仍有代差,但已能满足当前国产芯片的基本需求。
🃏 第三张:产能扩张
中芯国际正快速扩产先进制程产能 🏭:2026 年 7nm 产能预计翻倍至 6 万片/月,5nm 工艺进入试产阶段,目标 2026 年内实现量产。华为也在自建晶圆厂(SiCarrier),与中芯国际合作,有望突破产能瓶颈 💪。
🔮 六、未来走势:2026-2030 的五条主线
1️⃣ 国产化率从加速到见顶
国产 AI 芯片市占率预计 2026 年突破 50%,2027 年冲击 70-80% 🎯。但越往后,替代的边际难度越大——最容易被替代的推理场景先被吃掉,剩下的训练场景和存量 CUDA 绑定场景需要更长时间的生态建设。
📊 摩根士丹利预测 2030 年中国 AI 芯片可寻址市场达 670 亿美元,2024-2030 年复合增长率约 23%。
2️⃣ 推理为王,训练破局
推理算力需求正在经历指数级增长 📈(日均 Token 调用量从万亿级跃升至百万亿级)。国产芯片已在此区间建立了明确的 性能 + 成本优势 💰。
训练端,昇腾 960 系列(2027 年批量出货)有望规模切入大模型训练场景。华为路线图显示:从 910C(H100 约 80% 性能)→ 950(推理专用)→ 960(训练突破)→ 970(远期目标),训练能力的追赶正在加速 ⏩。
3️⃣ 大模型 × 芯片深度耦合
DeepSeek V4 开启了一个新模式——模型发布与芯片适配同步完成 🤝。随着 DeepSeek、Qwen、GLM 等国产大模型持续迭代,「国产模型 + 国产芯片」的闭环正在从「可选」走向「默认」 ✅。
未来 2-3 年,我们会看到更多「模型选型看芯片,芯片迭代看模型」的协同进化 🔄。这不仅是技术层面的绑定,更是生态层面的锁定效应 🧲。
4️⃣ 洗牌期到来
芯片是典型的赢者通吃行业 🏆。当推理市场逐步成熟、增长率从 50-100% 回落到稳态时,行业必然洗牌。二线厂商(沐曦、天数智芯、壁仞等)如果不能快速找到差异化定位或规模化订单,将面临生存压力 😰。
💡 一个关键观察是:2025-2026 年的 IPO 潮(摩尔线程、壁仞、燧原等)为这些企业注入了资本弹药 🧨,但资本市场对「营收 vs 估值」的压力也将更早到来。
5️⃣ 全球视野下的算力博弈
🌍 国产芯片的崛起不仅改变了中国市场,也在重塑全球算力格局。英伟达正在失去一个占其总收入约 20% 的市场。与此同时,中国正在通过「数据中心出海」和「算力外交」,在东南亚、中东、非洲等地区建设基于国产芯片的智算中心,将算力竞争从「技术封锁 vs 技术突围」的二元博弈,推向更复杂的多极格局 ♟️。
🏁 七、结语:拐点之后
2025 年是中国 AI 芯片行业的分水岭 ⛰️。不是因为它完美解决了所有问题——远没有——而是因为它第一次证明了一条路是可行的:在先进制程被卡、软件生态被封锁、市场被巨头垄断的条件下,用系统创新和工程能力完成「从替代到自强」的第一步 🚶➡️🏃。
接下来的三年将是更艰难的「深水区」🌊:
- ❓ 训练芯片能否真正实现规模化替代?
- ❓ 软件生态能否从「Day 0 适配」进化到「开发者首选」?
- ❓ 当政策红利见顶,商业化能力能否撑起估值?
答案还不确定,但方向已经清晰:算力主权不再是一个口号,而是一个正在发生的现实。 🎯
📅 2026 年 5 月 | 🤖 由 Hermes Agent 辅助编写
⚔️ 一、序幕:静かなる主権交代
2022年、中国のAIチップ市場はまだNVIDIAの「庭先」だった 🏡。消費者向けには性能を落としたA800/H800が提供され、企業はカードを待つ長い列に並び、納期は半年以上が当たり前だった。当時の国産チップの出荷量は、NVIDIAの四半期分にも満たなかった。
三年後の2025年、状況は一変した 🔄。
IDCなどのデータによると、2025年の中国AIチップ総出荷数は約401.6万枚 📊。このうち中国本土メーカーが約165万枚を出荷し、シェアは3年前の15%未満から**41%に急上昇 🚀。一方のNVIDIAは、かつての95%という絶対的支配から55%**にまで後退 ⬇️——この3年間で実に40ポイントものシェアを失ったのだ。
この数字の背景にあるのは、単一の要因の爆発ではなく、輸出規制 + 政策誘導 + 技術的ブレイクスルー + 資本流入 🔥 という四つの力の共振である。さらに重要なのは、2025年が終点ではなく、歴史的転換点の始まりであるということだ 🎯。
🗺️ 二、群雄割拠:2025年の国産チップ勢力図
2025年の国産AIチップを地図に描くと、典型的な「一強多強」の構図が浮かび上がる。
🏆 華為昇騰(Huawei Ascend)——絶対的リーダー
出荷量約81.2万枚 🎖️、国産チップの総出荷の約**50%**を占め、市場全体ではNVIDIAに次ぐ第2位。華為は最も難しい道を選んでいる——完全自社のNPUアーキテクチャ、CUDA非互換、チップ(昇騰)からフレームワーク(MindSpore)、計算アーキテクチャ(CANN)、開発者ツールに至るまで、全スタックを自社で構築している。
- ✅ 優位性:全スタック制御による最深のハードウェア・ソフトウェア協調最適化;政府・企業市場での強固な堀;スーパーノード(384チップ結合)によるシステムレベル障壁。
- ⚠️ 弱点:エコシステム閉鎖性、モデル適合の高コスト;政府・企業受注への過度な依存;消費者・中小企業向けへの浸透に時間。
🐎 アリババT-Head(平頭哥)——クラウド・チップ連携のダークホース
出荷量約26.5万枚、国産第2位・市場全体第3位。T-Headは華為とは異なる路線を歩む——アリババクラウドのエコシステムを基盤に、クラウドからチップへの垂直統合を進めている。真武810EはH20に迫る性能を持ち、2026年の出荷予測は40〜50万枚とされる。
- ✅ 優位性:アリババクラウドという天然の実装環境、検索・広告・推薦での実績十分。クラウド・チップ結合によりTCO削減。
- ⚠️ 弱点:主にアリババ内部需要にサービス、サードパーティ市場への影響力限定的。
🧠 寒武紀(Cambricon)——専門プレイヤーの価値証明
出荷量約11.6万枚、百度Kunlunxinと並んで国産第3位。しかしより注目すべきは財務データだ:2025年の年間売上高は64.97億元、前年比453%増 📈。純利益は20.59億元で、上場以来初の通期黒字を達成 💰。2026年第1四半期の売上高は28.85億元、前年比160%増とさらに加速している。
寒武紀の技術路線はDSA(領域特化アーキテクチャ)であり、最大の武器はハードウェアレベルのスパース化計算 🎯——ハードウェア上でニューラルネットワークのゼロ値演算を自動的にスキップする技術で、大規模モデルの推論高速化に極めて重要だ。MLU590はByteDanceの検索・広告・推薦システムに大規模導入され、思元690はH100の80%以上の性能を達成できるとされる。
- ✅ 優位性:DSAアーキテクチャによる推論シナリオでの優れたエネルギー効率;インターネット大手での大規模検証済み;DeepSeek効果(深層適合による顧客ロックイン効果)🧲。
- ⚠️ 弱点:顧客の極度な集中(上位5社で88.66%);先進プロセス+CoWoS-Lパッケージの二重の生産能力制約。
🛡️ 海光信息(Hygon)——互換派の差別化戦略
出荷量約8.25万枚、国産シェア約5%。売上高143.77億元(CPU事業含む)、純利益25.45億元。海光の選択は最も実利的だ:GPGPU路線で、CUDA/x86との極限の互換性を追求。DTKソフトウェアスタックはCUDAコードを効率的に変換し、開発者はほぼコードを書き換えることなく移行できる。
- ✅ 優位性:移行コスト最小、「プラグアンドプレイ」🔌;FP64倍精度性能が突出し、HPC+AI交差領域で独自のポジション;365の主要大規模モデルに適合済み。
- ⚠️ 弱点:互換路線による性能ロスは客観的に存在;深層モデル適合の欠如、発展リズムが業界トレンドの影響を受けやすい。
🎲 三、三つの技術路線の対決
国産AIチップの競争は、本質的には「誰の演算能力が高いか」ではなく、「いかにしてCUDAという巨大な壁を迂回するか」🏔️ への異なる答えである。
| 次元 | 🏛️ 華為昇騰(NPU自社) | 🧠 寒武紀(DSA専用) | 🛡️ 海光信息(GPGPU互換) |
|---|
| アーキテクチャ理念 | 全スタック自社、閉鎖的だが高効率 | 領域特化、エネルギー効率重視 🌿 | 極限互換、参入障壁低減 |
| CUDA戦略 | コンパイラ変換+自社CANN | コンパイラ変換+自社Neuware | DTKで直接互換、無損失移行追求 |
| 推論性能 | 950PR:H20比2.87倍 🔥 | MLU590:検索・広告・推薦で実証済み | 汎用シナリオ堅調、特段の優位性なし |
| 訓練能力 | 910C:H100比約80%、960シリーズ2027年本格化 ⏳ | 690シリーズ:訓練能力は検証待ち | DCU:主に推論+HPC向け |
| エコシステム開放度 | 🔒 閉鎖的(政府・企業向け主体) | 🔓 半開放(一部コードをOSS化) | 🌐 開放(主要エコシステムと互換) |
| 最大の堀 | 全スタック能力+スーパーノード+政府チャネル | DeepSeek深層適合+DSAエネルギー効率 | x86/ROCm既存市場 |
| 最大のリスク | 商業化の難しさ ⚡ | 顧客集中+生産能力ボトルネック | 互換性の天井 |
⚡ 核心の分水嶺:推論 vs 訓練
2025〜2026年における最も重要な変化は、推論演算が訓練演算に取って代わり、市場の主戦場になりつつあることだ 🎯。
2026年3月、中国国内の1日あたりのトークン呼び出し量は140兆を突破 🔢。モデルが訓練からデプロイへと移行するにつれ、推論チップの需要は指数関数的に増加 📈。そしてこれはまさに国産チップの強みが発揮される領域だ——推論では訓練ほどの単一カード絶対性能は要求されないが、エネルギー効率、レイテンシー、TCOへの要求はより厳しい。
華為昇騰950PRはまさにこのタイミングで最も鋭い刃を抜いた 🔪:FP4精度における単一カード推論性能はNVIDIA H20の2.87倍 ⚔️、メモリ使用量は75%削減、コストは50分の1以下。DeepSeek V4の昇騰における推論効率は、CUDA版と比較して35倍も向上 💥——この「モデル×チップ」の協調最適化が、新たな競争障壁を形成しつつある。
🏗️ スーパーノード:システムレベルの降格爆撃
もう一つの重要なトレンドは**「スーパーノード」アーキテクチャの台頭** 🏙️。単一チップの性能がプロセス微細化の天井に制約される中、華為が選んだのはシステムアーキテクチャで補うことだった。
384個の昇騰チップをHCCS(華為自研の高速相互接続プロトコル)で結合し、自社開発のスイッチネットワークと組み合わせることで、NVIDIA GB200クラスターを1.7倍上回る総合演算能力を実現 💪。これは単なる「数で質を補う」のではなく、演算競争の次元そのものを再定義する——単一チップのベンチマークスコアから、相互接続密度、スイッチ効率、ソフトウェア協調のシステムエンジニアリング競争へと変貌させているのだ 🔗。
🔗 四、エコシステムの戦い:CUDAの亡霊と国産代替のアキレス腱
ハードウェアのギャップが「目に見える追跡」👁️ だとすれば、ソフトウェアエコシステムのギャップは「目に見えない深淵」🕳️ である。
CUDAは2006年から構築され、世界中の400万人以上の開発者 👨💻 をカバーしている。中国の大半のAI開発者はNVIDIAエコシステムの「ネイティブ」だ——彼らのコード、習慣、デバッグツール、ベストプラクティスのすべてがCUDA上に構築されている。国産プラットフォームへの移行は大量のコード書き換えを意味し、その時間コストはしばしばハードウェアの価格差よりも受け入れがたい 😫。
🎪 三つの陣営、三つのエコシステム戦略
1️⃣ 華為 CANN + MindSpore(閉鎖的自社構築)
華為の選択は最も「重い」路線 🏋️:互換性を受け入れず、CUDAに依存せず、ゼロから自社のソフトウェアスタックを構築する。CANN(異種計算アーキテクチャ)が低レイヤーの演算ライブラリとコンパイラを提供し、MindSporeがディープラーニングフレームワークとして機能し、昇騰チップとの深い協調最適化を実現する。
- ✅ 利点:ハードウェア・ソフトウェア一体最適化による最大限の性能引き出し;全スタック自主制御、外部依存リスクなし。
- ❌ 欠点:開発者の学習コスト高;モデル適合の作業量多;グローバル主流エコシステムからの孤立。
💡 転換点:2025年、華為はMindSporeを完全にオープンソース化。DeepSeek V4は、CUDAからCANNへ完全移行した初のメインストリーム大規模モデルとなった。推論効率はCUDA版を35倍上回った 🚀——この結果は「自社エコシステムは本当に機能するのか」という疑問に対して、初めての実証的反証をもたらした。
2️⃣ 寒武紀 Neuware(専門適合)
寒武紀は全スタックを閉じる路線ではなく、Neuwareプラットフォームに集中し、特定のシナリオに特化した深い最適化を行う 🎯。戦略の要は、DeepSeekなどの国産大規模モデルとの結びつきにある——もしDeepSeek V5が寒武紀690上で訓練されれば、下流の推論は追加の適合を必要としない。この**「訓練で推論をロックする」**ロジックが、寒武紀が華為の全スタック統合に対抗する最強の武器である 🔫。
3️⃣ 海光 DTK(エコシステム寄生)
海光の選択は最も実利的 🤝:「CUDAに勝てないなら、それに加われ。」DTKソフトウェアスタックを通じてROCmおよびCUDAエコシステムへの効率的な変換を実現。開発者はほとんどコードを書き換えることなく、業務を海光プラットフォームに移行できる。
- ✅ 利点:移行障壁最低、既存市場への迅速な参入 🏃。
- ❌ 欠点:互換路線による明確な性能天井;深層カスタム最適化の欠如、チップアーキテクチャの差が大きくなると変換効率が持続的に低下 📉。
🏁 Day 0適合:一つのマイルストーン
🎉 2026年4月24日、DeepSeek V4のリリース当日——華為昇騰、寒武紀、海光、Moore Threads、Metaxが同時に全スタック適合を完了 👏。これは中国AIチップ史上初めてのことである。
これまでは、NVIDIAだけがリリースと同時に適合を完了でき、他のGPUは通常数ヶ月遅れていた。この出来事は、国産エコシステムが一丸となって「使える」から「使いやすい」への閾値を越えたことを示している——少なくとも推論シナリオにおいては 🚪。
🔧 五、製造の打開:EUV露光装置なき突破戦略
チップ設計が「頭脳」🧠 なら、チップ製造は「手足」🦶 である。アメリカの輸出規制下で、中国はASMLのEUV露光装置を入手できず、最先端プロセスは7nm(SMIC N+2)に制限されている 🔒。
しかし国産チップは三つのカードで突破を図っている 🃏:
🃏 第一のカード:先進パッケージ(Chiplet技術)
Chipletの核心は「成熟プロセスで高性能を積み上げる」🧱 ことにある——大きなチップを複数の小さなチップレットに分割し、先進パッケージ技術(2.5D/3D)で高速に相互接続し、先進プロセスの大きなチップと同等の性能を実現する。
2025〜2026年、国産2.5Dパッケージ(CoWoS-S)は量産を実現 ✅、長電科技(JCET)、通富微電(TF)、盛合晶微(SH)などの企業が重要技術を突破した。昇騰910B/910C/950はいずれもCoWoS-S移行路線を採用し、960シリーズはCoWoS-Lにアップグレードされる。寒武紀690は国内初のCoWoS-L採用製品 🥇。
🃏 第二のカード:自社HBM
AIチップのもう一つのボトルネックはHBM(高帯域幅メモリ)💾。華為は自社開発HBM「HiBL 1.0」を発表し、昇騰950PRには112GBの自社HBMを搭載、帯域幅1.4TB/s ⚡。同時に、国内メモリメーカーは2026年にHBM2eの量産を達成し、HBM3は小ロット試作段階に入っている——SKハイニックスの最新HBM3eとはまだ世代差があるものの、現在の国産チップの基本ニーズは満たせている。
🃏 第三のカード:生産能力拡大
SMICは先進プロセスの生産能力を急速に拡大 🏭:2026年の7nm生産能力は倍増して月産6万枚、5nmプロセスは試作段階に入り、2026年中の量産を目指す。華為も自社ファブ(SiCarrier)を建設中で、SMICとの協力を通じて生産能力のボトルネック突破を目指している 💪。
🔮 六、未来予測:2026〜2030年の五つのシナリオ
1️⃣ 国産化率、加速から頭打ちへ
国産AIチップの市場シェアは2026年に**50%を超え、2027年には70〜80%**に達すると予想 🎯。しかし、代替が進むほど限界難易度は高まる——最も代替しやすい推論シナリオが先に置き換えられ、残った訓練シナリオや既存のCUDAロックインシナリオは、より長いエコシステム構築の時間を必要とする。
📊 Morgan Stanleyは2030年の中国AIチップの総アドレス可能市場を670億ドルと予測、2024〜2030年の年平均成長率は約23%。
2️⃣ 推論が王座に、訓練が突破口に
推論演算の需要は指数関数的に増加 📈(1日あたりのトークン呼び出し量が兆単位から百兆単位へ急増)。国産チップはこの領域で明確な性能+コスト優位性を確立 💰。
訓練面では、昇騰960シリーズ(2027年に大量出荷予定)が大規模モデルの訓練シナリオに本格参入する見込み。華為のロードマップ:910C(H100の約80%性能)→ 950(推論特化)→ 960(訓練突破)→ 970(長期目標)、訓練能力の追跡が加速 ⏩。
3️⃣ 大規模モデル × チップの深層結合
DeepSeek V4は新たなモデルを切り開いた——モデルリリースとチップ適合の同時完了 🤝。DeepSeek、Qwen、GLMなどの国産大規模モデルが継続的に進化するにつれ、「国産モデル+国産チップ」のクローズドループは「オプション」から「デフォルト」へ ✅。
今後2〜3年は「モデル選定はチップ次第、チップの進化はモデル次第」の協調進化へ 🔄。技術的結合だけでなく、エコシステムレベルのロックイン効果 🧲。
4️⃣ 再編期の到来
チップは典型的な勝者総取りの産業 🏆。推論市場が成熟し成長率が安定期に落ち着くにつれ、業界の再編は避けられない。二線メーカー(Metax、Iluvatar CoreX、BirenTechなど)が差別化されたポジショニングや規模のある受注を迅速に見つけられなければ、生存圧力に直面 😰。
💡 重要な観察点:2025〜2026年のIPOラッシュ(Moore Threads、Biren、Enflameなど)はこれらの企業に資本の弾薬を注入 🧨 したが、資本市場が「収益対評価額」に求めるプレッシャーもより早く訪れるだろう。
5️⃣ グローバル視点での演算パワーゲーム
🌍 国産チップの台頭は中国市場を変えただけでなく、世界の演算パワー構図も再形成。NVIDIAは総収入の約**20%**を占める市場を失いつつある。同時に中国は「データセンター海外展開」と「演算外交」を通じて、東南アジア、中東、アフリカなどの地域で国産チップベースの知能演算センターを建設し、演算競争を「技術封鎖 vs 技術突破」の二元的ゲームから、より複雑な多極構造へと押し上げている ♟️。
🏁 七、結論:転換点の先に
2025年は中国AIチップ産業の分水嶺 ⛰️。すべての問題が完璧に解決されたからではない——まだ程遠い。しかし、先進プロセスが制限され、ソフトウェアエコシステムが封鎖され、市場が巨人によって独占される条件下でも、システムイノベーションとエンジニアリング能力で「代替から自強へ」の第一歩を達成できることを、初めて証明した年だからだ 🚶➡️🏃。
これからの三年はさらに困難な「深海域」🌊:
- ❓ 訓練チップは本当に規模のある代替を実現できるか?
- ❓ ソフトウェアエコシステムは「Day 0適合」から「開発者の第一選択肢」へ進化できるか?
- ❓ 政策の追い風が収まったとき、商業化能力は評価額を支えられるか?
答えはまだ不確かだが、方向性はすでに明確だ:演算主権はもはやスローガンではなく、現実になりつつある。 🎯
📅 2026年5月 | 🤖 Hermes Agent 補助執筆