OpenAI 租用 谷歌 TPU,首次大規(guī)模使用“非英偉達(dá)”芯片

英偉達(dá)的芯片主導(dǎo)地位正被侵蝕,OpenAI租用谷歌TPU,為首次大規(guī)模使用“非英偉達(dá)”芯片。
周六,據(jù)媒體報(bào)道,作為全球最大的人工智能芯片客戶之一,OpenAI近期開始租用谷歌的TPU芯片為ChatGPT等產(chǎn)品提供算力支持,這是該公司首次大規(guī)模使用非英偉達(dá)芯片。
據(jù)知情人士透露,此次合作安排使得OpenAI緩解對(duì)微軟數(shù)據(jù)中心的依賴,同時(shí)為谷歌的TPU提供了挑戰(zhàn)英偉達(dá)GPU市場(chǎng)主導(dǎo)地位的機(jī)會(huì)。OpenAI希望通過谷歌云租用的TPU芯片降低推理計(jì)算成本。
隨著ChatGPT付費(fèi)訂閱用戶從年初的1500萬增長(zhǎng)至超過2500萬,加上每周數(shù)億免費(fèi)用戶的使用,OpenAI的算力需求正在快速攀升。
值得一提的是,越來越多公司正在開發(fā)推理芯片以減少對(duì)英偉達(dá)的依賴并長(zhǎng)期降低成本。亞馬遜和微軟,以及OpenAI和Meta等大型AI推理芯片都已啟動(dòng)自主研發(fā)推理芯片的計(jì)劃,見聞此前文章提及,微軟造芯計(jì)劃受挫,Maia 100目前僅用于內(nèi)部測(cè)試,Braga的AI 芯片面臨至少六個(gè)月的延遲,且預(yù)計(jì)其性能將遠(yuǎn)低于英偉達(dá)Blackwell芯片。
OpenAI需求激增推動(dòng)轉(zhuǎn)向谷歌芯片
OpenAI主要通過微軟和甲骨文租用英偉達(dá)服務(wù)器芯片來開發(fā)訓(xùn)練模型并為ChatGPT提供算力。 據(jù)了解,該公司去年在此類服務(wù)器上的支出超過40億美元,其中訓(xùn)練和推理成本各占一半,預(yù)計(jì)2025年在AI芯片服務(wù)器上的支出將接近140億美元。
谷歌TPU轉(zhuǎn)向的直接推動(dòng)因素是今年早些時(shí)候ChatGPT圖像生成工具的爆紅,這給OpenAI在微軟的推理服務(wù)器帶來了巨大的壓力。為了應(yīng)對(duì)不斷增長(zhǎng)的計(jì)算需求和成本壓力,OpenAI首先尋求了谷歌云的支持。
據(jù)谷歌云員工透露,谷歌雖然向該競(jìng)爭(zhēng)對(duì)手開放其強(qiáng)大的TPU芯片,但還是會(huì)將更強(qiáng)大的TPU保留給自己的AI團(tuán)隊(duì)開發(fā),然后供Gemini模型使用。
谷歌大約10年前就開始研發(fā)TPU芯片,并從2017年開始向訓(xùn)練自有AI模型的云客戶提供這一服務(wù)。除了OpenAI外、蘋果、Safe Superintelligence和Cohere等公司也一直租用谷歌云的TPU,部分原因是這些公司的一些員工在谷歌工作,熟悉TPU的運(yùn)作方式。
據(jù)知情人士透露,同樣是全球最大AI芯片客戶之一的Meta近期也考慮使用TPU。
此外,谷歌云還向其客戶出租英偉達(dá)支持的服務(wù)器,因?yàn)橛ミ_(dá)芯片是行業(yè)標(biāo)準(zhǔn),這樣做帶來的收益仍然比出租TPU多得多。開發(fā)者對(duì)控制這些芯片的專用軟件更加熟悉。谷歌此前已向英偉達(dá)訂購(gòu)了超過100億美元的最新Blackwell服務(wù)器芯片,并于今年2月開始向部分客戶提供。



