原標(biāo)題:
英特爾AI芯片Gaudi 3登場(chǎng),狠挖英偉達(dá)墻腳
轉(zhuǎn)載:
https://www.163.com/dy/article/IVFVAFQM05118O92.html
英偉達(dá)如今在 AI 芯片市場(chǎng)的地位無(wú)可爭(zhēng)議,直線上漲的數(shù)據(jù)中心收入和市值就是最好的佐證。但王權(quán)沒(méi)有永恒,英偉達(dá)并非不可撼動(dòng)。
在英偉達(dá)發(fā)布最新一代 BlackWell GPU 的三周后,4 月 9 日晚,英特爾在 Vision 2024 大會(huì)上發(fā)布了一系列關(guān)于芯片的大消息。
會(huì)上,英特爾發(fā)布了面向數(shù)據(jù)中心的第六代至強(qiáng)處理器,也提前展示了面向下一代 AI PC 的 Lunar Lake 處理器。不過(guò)縱觀整場(chǎng)大會(huì),英特爾花費(fèi)最多篇幅也最重視的,可能還是最新一代的 AI 芯片:
英特爾 Gaudi 3。
超越英偉達(dá) H100:Gaudi 3 性能更強(qiáng)、成本更低
Gaudi 3 最直接的升級(jí)體現(xiàn)在性能和成本方面。
相比英偉達(dá) H100,Gaudi 3 的人工智能推理性能平均提高 50%,能效平均提高 40%。基準(zhǔn)測(cè)試中,Gaudi 3 可以在 Llama2-7B、Llama2-13B 模型中將訓(xùn)練時(shí)間縮短到英偉達(dá) H100 的一半,同時(shí)推理吞吐量也比后者平均高出了 50%。
可以說(shuō),Gaudi 3 至少在 Llama2 等關(guān)鍵大模型中擊敗了基于英偉達(dá) Hopper 架構(gòu)的 H100 GPU,這也是目前市售產(chǎn)品中技術(shù)最先進(jìn)的 AI 芯片。
而 Gaudi 3 還有另一個(gè)極其重要的升級(jí)——比 H100 低得多的成本,按照英特爾的原話是:
(Gaudi 3 的)成本僅為英偉達(dá) H100 的一小部分。
也怪不得 Gaudi 3 剛剛發(fā)布,英特爾就宣布 Naver(韓國(guó)互聯(lián)網(wǎng)巨頭)、博世、IBM、Ola 等一大批公司成為英特爾 Gaudi 加速器的客戶和合作伙伴。而最早在今年第二季度,英特爾就將向戴爾、惠普以及超微等 OEM 廠商率先供貨,第三季度正式上市。
耐人尋味的是,英特爾往年在 Vision 大會(huì)上基本不會(huì)發(fā)布新的芯片,今年卻一反常態(tài)發(fā)布了六代至強(qiáng)處理器和 Gaudi 3 AI 芯片兩款重磅產(chǎn)品。
考慮到英特爾 CEO 帕特·基辛格(Pat Gesinger)去年底就炮轟過(guò)英偉達(dá)的 CUDA 生態(tài)「既淺又窄」,似乎除了軟件生態(tài)上的對(duì)抗,英特爾也在加快硬件上的追趕。
不過(guò),Gaudi 3 真的有機(jī)會(huì)挑戰(zhàn)英偉達(dá)的 GPU 霸權(quán)嗎?
要知道,相比英偉達(dá)兩年前基于 Hopper GPU 架構(gòu)的 H100,上個(gè)月基于 BlackWell GPU 架構(gòu)發(fā)布的 B100 又進(jìn)行了一輪大幅的升級(jí),包括馬斯克也不禁感慨,「目前沒(méi)有什么比英偉達(dá) GPU 更好的 AI 芯片了!
Gaudi 3 硬件追上英偉達(dá)了嗎?
不同于 BlackWell 采用了最新的臺(tái)積電 3nm 工藝,Gaudi 3 基于臺(tái)積電 5nm 工藝打造,同時(shí)張量核心從 24 個(gè)升級(jí)到了 32 個(gè)。
相比上一代的 Gaudi 2,Gaudi 3 在 FP8 性能、BF16 性能、網(wǎng)絡(luò)帶寬、內(nèi)存帶寬都得到了全面的提升,其中 FP8 吞吐量更是高達(dá) 1835 TFLOPS:
基本翻了一番。
比較奇怪的是,搭載 128GB 內(nèi)存的 Gaudi 3 沒(méi)有采用最新的 HBM3(高帶寬內(nèi)存),而是采用了稍微有點(diǎn)過(guò)時(shí)的 HBM2e。
除了更低的傳輸帶寬,HBM2e 的單顆容量也只有 16GB,相比之下 HBM3 的傳輸帶寬得到了大幅提升,單顆容量也能達(dá)到 24GB,甚至是 32GB。
此外,Gaudi 3 采用了英偉達(dá) BlackWell 類(lèi)似的雙芯片設(shè)計(jì),同時(shí)封裝了兩個(gè)相同的芯片,并通過(guò)高帶寬鏈路進(jìn)行連接。每個(gè) Gaudi 3 芯片都具有 48MB 板載 SRAM,整個(gè)芯片提供 96MB SRAM,總帶寬為 12.8TB/秒。
I/O 方面,英特爾并沒(méi)有放棄以太網(wǎng)路線,在 Gaudi 3 上將以太網(wǎng)端口的速率從 100GB/s 升級(jí)到了 200GB/s,再考慮到雙芯片的設(shè)計(jì)和每個(gè)芯片 24 個(gè)以太網(wǎng)端口,每一張 Gaudi 3 的以太網(wǎng) I/O 總帶寬高達(dá) 8.4TB/s。
總的來(lái)說(shuō),英特爾在 Gaudi 3 的升級(jí)上并不激進(jìn),甚至可以說(shuō)有些保守,包括成本要低得多的 5nm 工藝和 HBM2e 內(nèi)存,都說(shuō)明了這一點(diǎn)。雖然相比上一代 Gaudi 2 已經(jīng)有了明顯的進(jìn)步,在部分大模型上超越 H100,但顯然很難與英偉達(dá)最新的 B100 相抗衡。
但英特爾的決策未必錯(cuò)了。
一方面,考慮到英偉達(dá)在 AI 加速計(jì)算方面的技術(shù)和生態(tài)領(lǐng)先優(yōu)勢(shì),英特爾就算不惜一切代價(jià)進(jìn)行追趕,很可能也難以追平,同時(shí)高昂的芯片成本,還會(huì)導(dǎo)致英特爾直接錯(cuò)失正在快速增長(zhǎng)的 AI 芯片市場(chǎng)。
另一方面,在成本優(yōu)勢(shì)明顯的前提下,英特爾只要能做到超越英偉達(dá) H100 的表現(xiàn),自然能夠吸引足夠的客戶進(jìn)行采購(gòu)。
更何況就連英偉達(dá)自己也預(yù)計(jì),「下一代產(chǎn)品(B100)將出現(xiàn)供應(yīng)緊張」。面對(duì)「想買(mǎi)不能買(mǎi)」的窘境,很多客戶自然而然也會(huì)轉(zhuǎn)向其他可替代的 AI 芯片。
這其中,就有屬于 Gaudi 3 的機(jī)會(huì)。
硬件、軟件生態(tài)齊頭并進(jìn),英特爾能否扛起大旗?
「整個(gè)行業(yè)都希望能干掉 CUDA,包括 Google、OpenAI 等公司都在想方設(shè)法讓人工智能訓(xùn)練更加開(kāi)放。我們認(rèn)為 CUDA 的護(hù)城河既淺又窄!够粮裾f(shuō)。
在前不久雷科技的報(bào)道中,我們就解析了全球科技巨頭組建 UXL 統(tǒng)一加速基金會(huì)對(duì)抗英偉達(dá) CUDA 的動(dòng)作。
簡(jiǎn)單來(lái)說(shuō),巨頭們基于英特爾 oneAPI 技術(shù),正在開(kāi)發(fā)一套開(kāi)源軟件平臺(tái)來(lái)替代英偉達(dá) CUDA 平臺(tái),允許人工智能開(kāi)發(fā)者在任何 AI 芯片上運(yùn)行他們的代碼,也包括英偉達(dá) GPU,核心是解除芯片硬件與軟件開(kāi)發(fā)平臺(tái)之間的強(qiáng)綁定關(guān)系,打破英偉達(dá) GPU 在開(kāi)發(fā)生態(tài)上的霸權(quán)。
正如高通人工智能和機(jī)器學(xué)習(xí)主管 Vinesh Sukumar 所言:「我們實(shí)際上是在向開(kāi)發(fā)者展示如何從英偉達(dá)平臺(tái)遷移出來(lái)!
軟件的推倒、硬件的追趕,英特爾顯然明白英偉達(dá)的成功既來(lái)源于軟件,也來(lái)源于硬件,只有齊頭并進(jìn)才能真正追趕上英偉達(dá)的腳步,甚至干掉 CUDA,干掉英偉達(dá)的護(hù)城河。
但英特爾能不能扛起「打倒英偉達(dá)」的大旗,奪回?cái)?shù)據(jù)中心市場(chǎng)的領(lǐng)先地位?關(guān)鍵可能取決于兩點(diǎn):
一是英特爾能不能在一眾英偉達(dá)挑戰(zhàn)者中脫穎而出,包括 AMD 以及一眾全球 AI 芯片公司都不會(huì)錯(cuò)過(guò)英偉達(dá) GPU「供不應(yīng)求」的機(jī)會(huì);
二是按照英特爾的路線圖,在合并 GPU 和 AI 芯片兩條產(chǎn)品線之后,代號(hào)「Falcon Shores」的下一代 GPU,能不能展現(xiàn)出超越英偉達(dá)最新一代 GPU 的潛力。
過(guò)去一年多,AI 掀起了一場(chǎng)不言而喻的革命,但不管 AI 將如何改變我們的生活,芯片算力依然是底層的驅(qū)動(dòng)力。
但英偉達(dá)生生占據(jù)了 AI 芯片市場(chǎng)的 80%,這顯然并不尋常,不過(guò)人們最不滿的關(guān)鍵其實(shí)還是:英偉達(dá)無(wú)法滿足所有人。在這個(gè)前提下,不管是英特爾、AMD 還是國(guó)產(chǎn) AI 芯片廠商,其實(shí)都還有機(jī)會(huì)。
換言之,英特爾 Gaudi 3 面對(duì)的還是一塊「廣闊天地」,自然「大有可為」。
文章來(lái)源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系凱熙電子evapa_cn#126.com刪除!(請(qǐng)將#換成@)
|