拒絕依賴 英偉達(dá),亞馬遜 新自研AI訓(xùn)練芯片2025年末量產(chǎn)

全球主要云計(jì)算廠商(如亞馬遜AWS、微軟Azure、谷歌云、甲骨文OCI、阿里云、華為云等),目前幾乎都在使用英偉達(dá)的AI芯片。不過,云廠商一直期望能夠自研AI芯片,擺脫對(duì)英偉達(dá)的依賴。
國(guó)際市場(chǎng)調(diào)研機(jī)構(gòu)TechInsights 2024年數(shù)據(jù)顯示,英偉達(dá)目前在AI芯片市場(chǎng)份額高達(dá)65%。AI芯片主要分成訓(xùn)練、推理兩類。在訓(xùn)練芯片市場(chǎng),英偉達(dá)幾乎處于壟斷地位。全球幾乎所有公司,都要靠英偉達(dá)的AI芯片訓(xùn)練模型。
今年3月,英偉達(dá)創(chuàng)始人黃仁勛曾在GTC(Nvidia GPU Technology Conference)2025大會(huì)披露,美國(guó)四大云廠商——亞馬遜AWS、微軟Azure、谷歌GCP、甲骨文OCI 2024年采購(gòu)了130萬枚Hopper(H100/H200)系列芯片,2025年將采購(gòu)360萬枚Blackwell系列芯片(GB200)。
作為全球最大云廠商,亞馬遜AI芯片自研步伐正在加快。它自研的Trainium系列AI芯片已大規(guī)模出貨。6月20日,《財(cái)經(jīng)》在亞馬遜云科技中國(guó)峰會(huì)了解到,亞馬遜自研的AI訓(xùn)練芯片Trainium 3將于2025年末量產(chǎn)。亞馬遜自研的上代Trainium 2芯片,也已經(jīng)被亞馬遜投資的AI創(chuàng)業(yè)公司Anthropic用于訓(xùn)練大模型。
01 亞馬遜自研AI芯片已大規(guī)模出貨
Trainium 3在2024年12月初首次被發(fā)布,但當(dāng)時(shí)尚未大規(guī)模量產(chǎn)。亞馬遜AWS CEO(首席執(zhí)行官)Matt Garman(馬特·加曼)在re:Ivent演講時(shí)曾披露,Trainium 3芯片性能比其前代產(chǎn)品Trainium 2提升兩倍,能效提高40%。這款芯片采用了臺(tái)積電的3nm工藝制程,這是數(shù)據(jù)中心芯片最先進(jìn)的工藝。
亞馬遜管理層在2024年報(bào)后的投資者電話會(huì)中曾披露,公司在全力開發(fā)Trainium 3,預(yù)計(jì)將于2025年底發(fā)布預(yù)覽版,并隨后將Defining(直譯為定義,指芯片設(shè)計(jì)最初階段,對(duì)芯片功能、功耗、性能、成本等指標(biāo)進(jìn)行規(guī)劃)Trainium 4。
Anthropic使用Trainium 2訓(xùn)練大模型被認(rèn)為是一個(gè)重要突破。因?yàn)椋壳按蟛糠衷茝S商的自研AI芯片通常只被用于推理這種難度更低的工作。自研AI芯片用于訓(xùn)練,需要進(jìn)行大量軟件適配工作。這需要亞馬遜和Anthropic共同投入工程師進(jìn)行反復(fù)測(cè)試。
Anthropic聯(lián)合創(chuàng)始人兼首席計(jì)算官Tom Brown(湯姆·布朗)2024年12月曾宣布“雷尼爾計(jì)劃”(Project Rainier)——Anthropic未來將使用一個(gè)擁有數(shù)十萬Trainium 2芯片的集群。芯片數(shù)量將是Anthropic當(dāng)時(shí)算力集群的5倍以上。
亞馬遜管理層在2025年一季度財(cái)報(bào)電話會(huì)中披露,Trainium 2相比其他AI芯片,性價(jià)比高出30%-40%。一位亞馬遜AWS中國(guó)區(qū)人士介紹,Anthropic和亞馬遜的緊密戰(zhàn)略關(guān)系是這些合作的基礎(chǔ)。
Anthropic是一家對(duì)標(biāo)OpenAI的AI創(chuàng)業(yè)公司。它和亞馬遜AWS深度綁定。大部分亞馬遜AWS的客戶,都會(huì)默認(rèn)首選Claude系列模型。國(guó)際創(chuàng)投數(shù)據(jù)庫(kù)Crunchbase顯示,Anthropic 2023年至今已完成14次融資,總金額182億美元。其中,亞馬遜向Anthropic三次投資80億美元,是Anthropic最大投資者。
02 科技大廠自研芯片越順利,對(duì)英偉達(dá)越不利
2025年,生成式AI的落地在加速。這將導(dǎo)致算力消耗大幅增長(zhǎng)。幾乎所有云計(jì)算廠商都在加大資本開支,用于采購(gòu)芯片、服務(wù)器,建設(shè)數(shù)據(jù)中心。
亞馬遜管理層在2024年財(cái)報(bào)后的電話會(huì)議曾披露,計(jì)劃2025年投入1000億美元資本支出,增速接近30%,主要用于云業(yè)務(wù)。這在全球科技公司的資本開支計(jì)劃中是最高的。
亞馬遜1000億美元資本開支,其中很大一部分會(huì)被用于采購(gòu)芯片。一位中國(guó)云廠商戰(zhàn)略規(guī)劃人士曾分析,科技公司的資本開支,80%被用于算力基礎(chǔ)設(shè)施。算力開支中,至少30%被用于采購(gòu)AI芯片。如果照此計(jì)算,亞馬遜2025年AI芯片采購(gòu)支出可能超過200億美元。
目前,亞馬遜沒有公布AI芯片中,自研芯片和英偉達(dá)芯片的占比。但亞馬遜管理層在2024年12月的re:Ivent曾明確表示,未來AI訓(xùn)練/推理自研芯片的采購(gòu)比例將提升。
在亞馬遜的算力集群中,自研AI芯片占比越大,英偉達(dá)AI芯片占比相應(yīng)就會(huì)越小。這是個(gè)此消彼長(zhǎng)的關(guān)系,而且類似情況也出現(xiàn)在其他云廠商——目前,包括亞馬遜、微軟、谷歌、華為、阿里、百度等科技公司都在自研AI芯片,這些自研芯片都會(huì)蠶食英偉達(dá)的市場(chǎng)。
記者了解到,目前華為的自研芯片昇騰、百度的自研芯片昆侖芯都被用于訓(xùn)練大模型。英偉達(dá)過去無可替代的壟斷地位正在松動(dòng)。
英偉達(dá)2024年報(bào)披露,目前超過45%的收入來自大型云廠商及科技公司。亞馬遜、微軟、華為、阿里、百度等大型科技公司自研芯片越順利,對(duì)英偉達(dá)的未來業(yè)績(jī)?cè)鲩L(zhǎng)就越不利。
事實(shí)上,亞馬遜的CPU(中央處理器)已實(shí)現(xiàn)了類似替代工作。目前,亞馬遜全球新增算力的一半以上都是基于Arm架構(gòu)Graviton系列自研芯片,數(shù)量已超過英特爾、AMD銷售的x86系列芯片。
一位中國(guó)云廠商芯片負(fù)責(zé)人曾表示,云計(jì)算需要降低計(jì)算成本。理論上說,在實(shí)現(xiàn)量產(chǎn)的前提下,自研芯片通常比英特爾、英偉達(dá)的芯片采購(gòu)成本、運(yùn)營(yíng)成本更低。節(jié)省下來的成本可以讓利給客戶,用于降低算力價(jià)格,最終實(shí)現(xiàn)云計(jì)算的規(guī)模優(yōu)勢(shì)。



