98新超碰,人人澡人人爱,麻豆精品传媒国,碰国产久久久,思思99热久在线播放,青青草五月婷婷,日韩国产精品在线,久久亚洲成人,久久88视频网站

熱設(shè)計(jì)網(wǎng)

英偉達(dá) Blackwell 芯片又又又曝問題,老黃大半年沒搞定,微軟們被迫換貨、換方案

熱設(shè)計(jì)網(wǎng)

image.png

英偉達(dá)Blackwell芯片過熱問題推遲交付,AMD推出新品挑戰(zhàn)。

據(jù) The Information 最新報(bào)道,英偉達(dá)下一代 Blackwell 芯片在高密度服務(wù)器機(jī)架中出現(xiàn)嚴(yán)重過熱問題,導(dǎo)致設(shè)計(jì)變更和客戶方面的部署延遲。這讓 Google、Meta 和微軟等主要客戶對(duì)能否按時(shí)部署 Blackwell 產(chǎn)生擔(dān)憂。

過熱問題或拖累交付計(jì)劃

英偉達(dá)早在今年 3 月發(fā)布了 Blackwell 系列產(chǎn)品,原計(jì)劃是 2024 年第二季度發(fā)貨,但之前已經(jīng)因?yàn)樵O(shè)計(jì)缺陷而推遲。

據(jù)報(bào)道,Blackwell GPU 在高密度服務(wù)器機(jī)架中面臨嚴(yán)重的過熱問題。這些高密度服務(wù)器機(jī)架集成了 72 塊 AI 芯片,每個(gè)機(jī)架功耗高達(dá) 120kW。但高密度和高功耗的設(shè)計(jì)帶來了散熱難題,不僅限制了 GPU 性能,還可能損壞硬件組件。

為解決這一問題,英偉達(dá)不得不多次調(diào)整機(jī)架設(shè)計(jì),并對(duì)冷卻系統(tǒng)進(jìn)行工程修訂。據(jù)悉,英偉達(dá)已指示供應(yīng)商實(shí)施多項(xiàng)改進(jìn)措施。

英偉達(dá)對(duì)此回應(yīng)稱,散熱問題和設(shè)計(jì)變更是技術(shù)開發(fā)中的正常流程,并重申正在與云服務(wù)商和供應(yīng)商合作,確保最終產(chǎn)品符合性能和可靠性要求。

image.png


戴爾宣布,基于英偉達(dá) GB200 NVL72 架構(gòu)且采用液冷技術(shù)的服務(wù)器機(jī)架已發(fā)貨

在等待 Blackwell 問題解決的同時(shí),一些客戶已開始考慮替代方案。據(jù)報(bào)道,部分客戶比如微軟,已計(jì)劃通過更換部分組件來定制 Blackwell 機(jī)架,以適應(yīng)其數(shù)據(jù)中心需求。

一位云計(jì)算公司高管透露,他們正在增加當(dāng)前一代 Hopper 芯片的采購量。分析認(rèn)為,這可能在短期內(nèi)提升英偉達(dá)的收入,尤其是 Hopper 芯片的利潤率較高。然而,這種轉(zhuǎn)向也可能削弱未來對(duì) Blackwell 及其 NVLink 服務(wù)器的需求,對(duì)英偉達(dá)的長期增長構(gòu)成潛在威脅。

在散熱問題之前,因?yàn)榉庋b設(shè)計(jì)的問題,Blackwell 芯片的發(fā)布至少被推遲了三個(gè)月。Blackwell 芯片采用臺(tái)積電的 CoWoS-L 封裝技術(shù),通過局部硅互連(LSI)橋?qū)崿F(xiàn)高達(dá) 10 TB/s 的數(shù)據(jù)傳輸速度。然而,GPU 芯片、LSI 橋和主板之間的熱膨脹特性不匹配,曾導(dǎo)致芯片變形和系統(tǒng)故障。

為解決這一問題,英偉達(dá)調(diào)整了芯片結(jié)構(gòu),并重新設(shè)計(jì)模具,最終在 10 月底完成了修正。

Tom’s Hardware 指出,盡管此類調(diào)整在大規(guī)模技術(shù)推廣中很常見,但還是可能會(huì)進(jìn)一步推遲 Blackwell 的預(yù)期發(fā)貨時(shí)間。

Blackwell 需求驚人,性能表現(xiàn)屢創(chuàng)新高

Blackwell 芯片自發(fā)布以來,市場(chǎng)需求和關(guān)注度一直很高。黃仁勛在此前采訪中曾多次表示,市場(chǎng)對(duì) Blackwell 芯片的需求強(qiáng)到“瘋狂(insane)”。

在近期的 MLPerf Training 4.1 基準(zhǔn)測(cè)試中,Blackwell GPU 也繼續(xù)展現(xiàn)領(lǐng)先的性能。

上周,英偉達(dá)公布了 Blackwell GPU 在 MLPerf v4.1 AI 訓(xùn)練工作負(fù)載方面的成績——在 MLPerf Training 4.1 的測(cè)試中,訓(xùn)練 Llama 270B 模型的速度較前代 Hopper GPU 快了達(dá) 2.2 倍。此外,得益于 HBM3e 高帶寬內(nèi)存的應(yīng)用,Blackwell僅需 64 塊 GPU 即可完成此前需 256 塊 Hopper GPU 才能達(dá)到的計(jì)算任務(wù)。

與此同時(shí),Hopper 平臺(tái)也在持續(xù)優(yōu)化。在本輪 MLPerf 訓(xùn)練測(cè)試中,Hopper 的每 GPU GPT-3 175B 訓(xùn)練性能比首次引入該基準(zhǔn)時(shí)提高了 1.3 倍。

分析師普遍認(rèn)為,AI 應(yīng)用的發(fā)展仍處于早期階段,Blackwell 的推出將繼續(xù)推動(dòng)英偉達(dá)業(yè)績?cè)鲩L。摩根士丹利預(yù)計(jì),Blackwell 新產(chǎn)品線將在 2025 年第一季度提升公司收入,預(yù)計(jì)銷售額將在 50 億至 60 億美元之間。

隨著 Blackwell 預(yù)計(jì)于 2025 年 1 月底開始大規(guī)模交付,其實(shí)際表現(xiàn)能否滿足市場(chǎng)預(yù)期,將成為接下來觀察的重點(diǎn)。

AMD 推出新款 AI 芯片,挑戰(zhàn) Blackwell

在英偉達(dá)努力解決技術(shù)問題的同時(shí),AMD 也在加速進(jìn)軍 AI 芯片市場(chǎng)。上個(gè)月,AMD 宣布推出全新 AI 芯片Instinct MI325X,并且計(jì)劃在 2024 年底前開始生產(chǎn)。AMD 的這一動(dòng)作被認(rèn)為是對(duì)英偉達(dá)在 GPU 市場(chǎng)主導(dǎo)地位的挑戰(zhàn)。

目前,英偉達(dá)的 GPU 在 AI 芯片市場(chǎng)占據(jù) 90% 以上份額,而 AMD 一直穩(wěn)居第二。此次發(fā)布的 MI325X 是去年推出的 MI300X 的繼任者,AMD 計(jì)劃每年發(fā)布一款新芯片,以更快響應(yīng)市場(chǎng)需求并縮小與英偉達(dá)的差距。

AMD 預(yù)計(jì),到 2028 年,AI 芯片市場(chǎng)規(guī)模將達(dá)到 5000 億美元。AMD CEO 蘇姿豐表示,“AI 需求正在迅速超出預(yù)期,全球范圍內(nèi)的投資仍在加速?!痹谛阅芊矫?,蘇姿豐表示,MI325X 在處理 Meta 的 Llama 3.1 模型時(shí)推理性能比 Nvidia H200 高出 40%。

雖然 AMD 沒有宣布新的客戶名單,但公司此前已透露過 Meta、微軟和 OpenAI 正在使用其 AI 芯片的消息。AMD 也強(qiáng)調(diào),其芯片在生成內(nèi)容和預(yù)測(cè)類 AI 應(yīng)用中具有優(yōu)勢(shì),這得益于其先進(jìn)的內(nèi)存設(shè)計(jì)。

然而,英偉達(dá)的 CUDA 語言已成為 AI 開發(fā)的事實(shí)標(biāo)準(zhǔn),其技術(shù)生態(tài)和市場(chǎng)優(yōu)勢(shì)仍然是 AMD 最大的競爭障礙。有分析指出,隨著 Meta、微軟等云巨頭對(duì) AI 需求的持續(xù)增長,AMD 有機(jī)會(huì)通過價(jià)格和性能的差異化策略,吸引更多客戶,尤其是在生成式 AI 模型推理等細(xì)分領(lǐng)域。

參考鏈接:

https://www.reuters.com/technology/artificial-intelligence/nvidias-design-flaw-with-blackwell-ai-chips-now-fixed-ceo-says-2024-10-23/

https://www.tomshardware.com/pc-components/gpus/nvidias-data-center-blackwell-gpus-reportedly-overheat-require-rack-redesigns-and-cause-delays-for-customers

image.png

標(biāo)簽: 芯片元器件 導(dǎo)熱散熱 點(diǎn)擊: 評(píng)論:

留言與評(píng)論(共有 0 條評(píng)論)
   
驗(yàn)證碼:
乐都县| 宜兴市| 邯郸县| 荔波县| 改则县| 仁化县| 临泉县| 尉犁县| 克东县| 甘泉县| 日喀则市| 梨树县| 巢湖市| 彩票| 武义县| 吉安市| 柘城县| 东至县| 仙居县| 清水河县| 漳浦县| 方正县| 康保县| 阳谷县| 根河市| 九江市| 正定县| 石棉县| 南丰县| 徐州市| 望谟县| 龙游县| 牟定县| 西华县| 四子王旗| 清涧县| 金坛市| 呼伦贝尔市| 通辽市| 赤壁市| 合山市|