18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)和AMD新芯片,突破PCIe限制

智能計(jì)算芯世界 ? 來(lái)源:半導(dǎo)體行業(yè)觀察 ? 2024-03-01 09:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

學(xué)過(guò)微處理器的同學(xué)可能還記得,最初的8086/8088處理器沒(méi)有浮點(diǎn)單元。主板通常有一個(gè)額外的插槽,用于可選的8087 數(shù)學(xué)協(xié)處理器。數(shù)學(xué)協(xié)處理器進(jìn)入了 CPU 本身,如今,CPU 沒(méi)有可選的數(shù)學(xué)協(xié)處理器。

然而, SIMD 處理器(例如GPU)有多種選擇。眾所周知,GPU 可以比 CPU 主機(jī)更快地加速數(shù)學(xué)處理(例如矩陣運(yùn)算)。

隨著Nvidia GH-200 處理器 和AMD MI300A APU的推出,市場(chǎng)正在見(jiàn)證“8087 時(shí)刻”——即 CPU 吸收外部性能硬件。Nvidia 和 AMD 都已將 GPU 納入處理器中,其結(jié)果是 HPC 性能大幅躍升,并預(yù)示著未來(lái)的發(fā)展。

再見(jiàn) PCI

AMD 和 Nvidia 的 GPU 都依賴(lài) PCI 總線與 CPU 進(jìn)行通信。CPU 和 GPU 有兩個(gè)不同的內(nèi)存域,數(shù)據(jù)必須通過(guò) PCI 接口從 CPU 域移動(dòng)到 GPU 域(并返回)。

使用第 5 代 PCIe 總線中全部 16 個(gè)通道的 GPU 的最大帶寬約為 63GB/s。此瓶頸將限制 CPU 和 GPU 之間的內(nèi)存移動(dòng)。

Nvidia GH200 通過(guò) 900 GB/s 雙向 NVLink-C2C 連接 Grace CPU 和 Hooper GPU。結(jié)果大約快了 14 倍。此外,GH200 還帶來(lái)了單一共享 CPU-GPU 內(nèi)存域的優(yōu)勢(shì)。無(wú)需通過(guò) PCI 總線在 CPU 和 GPU 之間移動(dòng)數(shù)據(jù)。如圖 1 所示,CPU 和 GPU 對(duì)所有內(nèi)存具有一致的視圖。CPU內(nèi)存高達(dá)480GB LPDDR5X(帶ECC),GPU具有96GB HBM3或144GB HBM3e??偟南喔桑▎斡颍﹥?nèi)存在 576GB 到 624GB 之間。

wKgZomXhLMiARMptAADkHTuyYxg500.jpg

當(dāng)前的 AMD Instinct MI300A APU 中采用單一內(nèi)存域,具有 128 GB HBM3 內(nèi)存,使用 Infinity Fabric 在 CPU 和 GPU 之間一致共享,封裝峰值吞吐量為 5.3 TB/s 。 雖然 MI300A 目前不支持像 GH200 那樣額外的 DDR 內(nèi)存擴(kuò)展,但 CXL 是一個(gè)值得將來(lái)記住的詞。

對(duì)于 GH200 和 MI300A,關(guān)鍵的突出短語(yǔ)是“呈現(xiàn)單個(gè)存儲(chǔ)域”。在傳統(tǒng)的CPU-PCIe-GPU組合中,GPU內(nèi)存量通常小于CPU內(nèi)存,數(shù)據(jù)必須通過(guò)PCIe接口進(jìn)行混洗。這兩個(gè)新設(shè)計(jì)消除了這個(gè)瓶頸。單個(gè)大內(nèi)存域一直對(duì) HPC 有吸引力,而 GenAI 的增長(zhǎng)加速了這種需求(即,能夠在內(nèi)存中加載大型模型并使用 GPU 運(yùn)行它們)。對(duì)于傳統(tǒng) GPU,GPU 內(nèi)存量限制了模型大小,需要采用分布式 GPU 方法。(注:GH200 可以通過(guò)外部 NVLink 連接,創(chuàng)建海量統(tǒng)一內(nèi)存;例如,Nvidia-AWS NLV32可以提供高達(dá) 20 TB 的統(tǒng)一內(nèi)存。)

離你的桌面并不遠(yuǎn)

技術(shù)領(lǐng)域明顯的趨勢(shì)之一是從昂貴的新技術(shù)市場(chǎng)轉(zhuǎn)向低成本的大宗商品市場(chǎng)。高性能計(jì)算也不例外。隨著市場(chǎng)需求,從多核到高級(jí)內(nèi)存的一切都已從高端轉(zhuǎn)移到“手機(jī)”。遷移到單個(gè)內(nèi)存域就是這些變化之一。

最近,在 Linux 基準(zhǔn)測(cè)試網(wǎng)站Phoronix上,杰出的測(cè)試員Michael Larabel在 GH200 工作站上運(yùn)行了 HPC 基準(zhǔn)測(cè)試。該系統(tǒng)由德國(guó)的GPTshop.ai提供。

據(jù)了解,系統(tǒng)塔式機(jī)箱配備 GH200 Grace Hopper Superchip,配備 576G 內(nèi)存、雙 2000+ W 電源、QCT 主板以及多種配置選項(xiàng),包括 SSD 和 NVIDIA Bluefield/Connect-X 適配器。一項(xiàng)有趣且有用的功能是 TDP 可以從 450W 編程到 1000W(CPU + GPU + 內(nèi)存),這在非數(shù)據(jù)中心環(huán)境中應(yīng)該很有用。另外,默認(rèn)風(fēng)冷噪音據(jù)稱(chēng)為25分貝。液體冷卻也是一種選擇。

然而,桌面超級(jí)工作站并不便宜。目前可用的型號(hào) GH200 576GB起價(jià)為 47,500 歐元(根據(jù) Phoronix 的說(shuō)法,由于在歐盟以外地區(qū)運(yùn)輸時(shí)無(wú)需繳納 19% 的增值稅,因此該價(jià)格相當(dāng)于 41,000 美元)

這個(gè)價(jià)格可能看起來(lái)很高,但考慮到具有 80 GB HBM2e 內(nèi)存的 Nvidia H100 PCIe GPU 目前的市場(chǎng)價(jià)格在 3 萬(wàn)美元到 3.5 萬(wàn)美元之間。這不包括為 GPU 供電和運(yùn)行的主機(jī)系統(tǒng)。此外,用戶還受到 80GB GPU 內(nèi)存的限制,該內(nèi)存通過(guò) PCIe 總線與主內(nèi)存域分開(kāi)。

GPTshop工作站提供576GB的單域內(nèi)存。HPC 和 GenAI 用戶會(huì)發(fā)現(xiàn)這半 TB 的 CPU-GPU 內(nèi)存很有吸引力。

初步基準(zhǔn)

借助 GPTshop,Phoronix 能夠遠(yuǎn)程運(yùn)行多個(gè)基準(zhǔn)測(cè)試?;鶞?zhǔn)應(yīng)被視為初步的,而不是最終的績(jī)效衡量標(biāo)準(zhǔn)。特別是,基準(zhǔn)測(cè)試僅針對(duì) CPU,沒(méi)有使用 Hopper A100 GPU。因此,基準(zhǔn)圖是不完整的。Phoronix 計(jì)劃在未來(lái)測(cè)試基于 GPU 的應(yīng)用程序。

據(jù) Phoronix 稱(chēng),Ubuntu 23.10 與 Linux 6.5 一起使用 GCC-13 作為標(biāo)準(zhǔn)編譯器。使用類(lèi)似的環(huán)境來(lái)測(cè)試可比較的處理器,包括 Intel Xeon Scalable、AMD EPYC 和 Ampere Altra Max 處理器。完整的列表可以在Phoronix 網(wǎng)站上找到。

此外,沒(méi)有可用于基準(zhǔn)測(cè)試運(yùn)行的功耗數(shù)據(jù)。據(jù) Phoronix 稱(chēng),NVIDIA GH200 目前似乎沒(méi)有在 Linux 下公開(kāi)任何 RAPL/PowerCap/HWMON 接口,僅用于讀取 GH200 的功率/能源使用情況。系統(tǒng)上的BMC確實(shí)通過(guò)Web界面暴露了整個(gè)系統(tǒng)的功耗,并且功率數(shù)據(jù)沒(méi)有通過(guò)IPMI暴露。

盡管存在這些限制,一些重要的基準(zhǔn)測(cè)試還是首次在 Nvidia 之外的 GH200 上運(yùn)行。

好奧萊 HPCG

Phoronix 報(bào)告的第一個(gè)測(cè)試是標(biāo)準(zhǔn)HPCG內(nèi)存帶寬基準(zhǔn)測(cè)試,如圖 2 所示。

wKgaomXhLMiAWYYtAAWDqsqK-uw329.jpg

可以看出,GH200 Arm 的性能達(dá)到了可觀的 42 GFLOPS,略高于 Xeon Platinum 8380 2P(40 GFLOPS),略低于 EPYC 9654 Genoa 2P(44 GFLOPS)。另外值得注意的是 72 核 Arm Grace CPU,其性能幾乎是 Ampere Altra Max 128 核 Arm 處理器的兩倍。

GH200 在其他基準(zhǔn)測(cè)試中表現(xiàn)良好。最令人印象深刻的結(jié)果如圖 3 所示。使用 72 核 Arm GH200 的NWChem (C240-Bucky Ball) 運(yùn)行時(shí)間為 1404 秒,僅落后于領(lǐng)先者 128 核 Epyc 9554 (2p),成績(jī)?yōu)?1323 秒。

wKgZomXhLMiAVoZlAATrg6t09VQ779.jpg

即將發(fā)生的事情

Nvidia GH200 和 AMD MI300A 引入了新的處理器架構(gòu)。與吸收 8087 數(shù)學(xué)協(xié)處理器類(lèi)似,高端 CPU 也開(kāi)始吸收 GPU(或 SIMD 處理單元)。然而,這個(gè)想法并不是全新的。自 2011 年以來(lái),AMD 已將中等 GPU 集成到其臺(tái)式機(jī)/筆記本電腦APU 處理器中。雖然這些高端處理器可能被認(rèn)為是“專(zhuān)用”的,因此價(jià)格昂貴,但隨著時(shí)間的推移,對(duì) GenAI 的巨大興趣可能會(huì)將這些設(shè)計(jì)推向商品價(jià)格點(diǎn)。隨著更多基準(zhǔn)的出現(xiàn),這個(gè)故事將繼續(xù)發(fā)展。

此外,引入具有足夠內(nèi)存的個(gè)人高性能工作站,可以在您的辦公桌旁運(yùn)行一些最大的法學(xué)碩士,這是一個(gè)重要的里程碑。更不用說(shuō)運(yùn)行許多大內(nèi)存 GPU 優(yōu)化的 HPC 應(yīng)用程序的能力了。數(shù)據(jù)中心和云仍將是當(dāng)今的主力,但必須要說(shuō)的是“擁有重置按鈕”。


審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微處理器
    +關(guān)注

    關(guān)注

    11

    文章

    2408

    瀏覽量

    85107
  • PCIe
    +關(guān)注

    關(guān)注

    16

    文章

    1406

    瀏覽量

    87229
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4022

    瀏覽量

    97079
  • AMD芯片
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    3040

原文標(biāo)題:英偉達(dá)和AMD新芯片,突破PCIe限制

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    今日看點(diǎn)丨消息稱(chēng)智駕基礎(chǔ)芯片配套8GB小容量存儲(chǔ)芯片價(jià)格開(kāi)始暴漲;英偉達(dá)推出具身智能推理模型Cosmos Re

    了一項(xiàng)特殊協(xié)議,兩家企業(yè)同意將特供中國(guó)的芯片收入的15%上繳給美國(guó)政府,以換取相關(guān)產(chǎn)品的出口許可證。 2023年10月,美國(guó)商務(wù)部公布對(duì)華半導(dǎo)體出口管制最終規(guī)則,進(jìn)一步加大對(duì)人工智能相關(guān)芯片、半導(dǎo)體制造設(shè)備的對(duì)華出口限制。
    發(fā)表于 08-12 09:41 ?1710次閱讀

    英偉達(dá)擬再推中國(guó)特供GPU,今年6月量產(chǎn)!

    電子發(fā)燒友網(wǎng)綜合報(bào)道 近年來(lái),美國(guó)政府對(duì)華半導(dǎo)體出口管制政策不斷收緊,英偉達(dá)等半導(dǎo)體企業(yè)面臨嚴(yán)峻挑戰(zhàn)。為保持在中國(guó)市場(chǎng)的競(jìng)爭(zhēng)力,英偉達(dá)推出了多款特供版GPU,以滿足政策
    發(fā)表于 05-27 00:03 ?4549次閱讀

    美國(guó)限制英偉達(dá)向華出售H20芯片

    出口H20芯片,以及任何其他性能達(dá)到H20內(nèi)存帶寬、互連帶寬或其組合的芯片,都必須獲得出口許可。 公告披露,美國(guó)政府稱(chēng),這旨在解決相關(guān)產(chǎn)品可能被用于或被轉(zhuǎn)用于中國(guó)超級(jí)計(jì)算機(jī)的風(fēng)險(xiǎn)。4月14日,美國(guó)政府通知英偉
    的頭像 發(fā)表于 04-16 17:28 ?780次閱讀

    特朗普要叫停英偉達(dá)對(duì)華特供版 英偉達(dá)H20出口限制 或損失55億美元

    據(jù)外媒報(bào)道,英偉達(dá)公司發(fā)布了一項(xiàng)通知稱(chēng),美國(guó)政府于9日告知英偉達(dá)公司;特供版的H20芯片出口到中國(guó)需要許可證,緊接著在14日又告知
    的頭像 發(fā)表于 04-16 16:59 ?1755次閱讀

    英偉達(dá)市值一夜蒸發(fā)近2萬(wàn)億 英偉達(dá)股價(jià)下跌超8%

    財(cái)年第四財(cái)季和全財(cái)年業(yè)績(jī)數(shù)據(jù)上看,2025財(cái)年第四財(cái)季及全年的營(yíng)收和利潤(rùn)都實(shí)現(xiàn)了大幅增長(zhǎng),大家特別關(guān)注的數(shù)據(jù)中心業(yè)務(wù)也是業(yè)績(jī)?cè)鲩L(zhǎng)的核心動(dòng)力,展現(xiàn)出英偉達(dá)在AI領(lǐng)域的強(qiáng)大實(shí)力。而且英偉達(dá)
    的頭像 發(fā)表于 03-04 10:19 ?888次閱讀

    英偉達(dá)殺瘋了!Blackwell橫掃市場(chǎng),AMD、英特爾加入降本浪潮

    。與此同時(shí),隨著AI大模型的普及,高計(jì)算量需求和成本壓力也成為行業(yè)關(guān)注的焦點(diǎn)。如何在性能與成本之間找到平衡,成為整個(gè)AI芯片行業(yè)共同面臨的挑戰(zhàn)。AI大模型的出現(xiàn)對(duì)芯片市場(chǎng)產(chǎn)生了哪些影響,DeepSeek帶來(lái)的“AI降本浪潮”又會(huì)給AMD
    的頭像 發(fā)表于 03-02 00:02 ?2285次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>殺瘋了!Blackwell橫掃市場(chǎng),<b class='flag-5'>AMD</b>、英特爾加入降本浪潮

    英偉達(dá)回應(yīng)美新規(guī):在華業(yè)務(wù)不受影響

    ,BIS近日修訂了出口管理法規(guī)(EAR),加強(qiáng)了對(duì)與高級(jí)計(jì)算集成電路(IC)相關(guān)的盡職調(diào)查程序要求,并公布了經(jīng)批準(zhǔn)的IC設(shè)計(jì)實(shí)體名單。只有名單上的企業(yè)所設(shè)計(jì)的芯片才不會(huì)受到額外的出口限制。 針對(duì)這一新規(guī),英偉
    的頭像 發(fā)表于 01-20 10:52 ?798次閱讀

    荷蘭與英偉達(dá)、AMD商討AI設(shè)施建設(shè)

    近日,荷蘭政府在其官方網(wǎng)站上發(fā)布消息稱(chēng),荷蘭經(jīng)濟(jì)事務(wù)大臣迪爾克·貝爾亞爾茨在訪問(wèn)硅谷期間,與英偉達(dá)AMD兩大科技公司進(jìn)行了深入的戰(zhàn)略討論。此次訪問(wèn)時(shí)間為1月8日至1月9日,旨在探討如何支持荷蘭人
    的頭像 發(fā)表于 01-13 10:06 ?637次閱讀

    荷蘭與英偉達(dá)、AMD商討共建人工智能設(shè)施

    荷蘭政府正在積極尋求與全球領(lǐng)先的科技公司英偉達(dá)AMD的合作,共同推動(dòng)荷蘭人工智能設(shè)施的建設(shè)與發(fā)展。 據(jù)荷蘭政府官方網(wǎng)站的消息,荷蘭經(jīng)濟(jì)事務(wù)大臣迪爾克·貝爾亞爾茨于近日對(duì)美國(guó)硅谷進(jìn)行了訪問(wèn),期間
    的頭像 發(fā)表于 01-10 13:36 ?938次閱讀

    微軟大手筆采購(gòu)英偉達(dá)AI芯片

    據(jù)全球知名市場(chǎng)調(diào)研機(jī)構(gòu)Omdia的最新估計(jì),微軟在2024年的英偉達(dá)Hopper架構(gòu)芯片采購(gòu)計(jì)劃上展現(xiàn)出了驚人的手筆。這一舉動(dòng)旨在幫助微軟在構(gòu)建下一代人工智能(AI)系統(tǒng)的激烈競(jìng)爭(zhēng)中搶占先機(jī)。 據(jù)悉
    的頭像 發(fā)表于 12-20 15:50 ?877次閱讀

    剛剛!英偉達(dá)最新回應(yīng)!

    12月10日消息,據(jù)報(bào)道,英偉達(dá)市值一夜蒸發(fā)掉了889億美元(約合人民幣6460億元)。 據(jù)此前媒體報(bào)道,近日英偉達(dá)公司因涉嫌違反《中華人民共和國(guó)反壟斷法》及《市場(chǎng)監(jiān)管總局關(guān)于附加
    的頭像 發(fā)表于 12-10 18:13 ?1073次閱讀

    英偉達(dá)被立案調(diào)查 英偉達(dá)回應(yīng)反壟斷調(diào)查

    英偉達(dá)被立案調(diào)查!?國(guó)家市場(chǎng)監(jiān)督管理總局在12 月 9 日晚宣布,英偉達(dá)公司涉嫌違反《中華人民共和國(guó)反壟斷法》及《市場(chǎng)監(jiān)管總局關(guān)于附加限制
    的頭像 發(fā)表于 12-10 15:03 ?706次閱讀

    英偉達(dá)加速認(rèn)證三星新型AI存儲(chǔ)芯片

    近日,英偉達(dá)首席執(zhí)行官黃仁勛近日在接受采訪時(shí)透露,英偉達(dá)正在全力加速對(duì)三星最新推出的AI存儲(chǔ)芯片——HBM3E的認(rèn)證進(jìn)程。這一舉措標(biāo)志著
    的頭像 發(fā)表于 11-26 10:22 ?916次閱讀

    英偉達(dá)計(jì)劃2025年推出基于Arm架構(gòu)的消費(fèi)級(jí)CPU,挑戰(zhàn)英特爾和AMD

    ,這款CPU將融合英偉達(dá)的CPU和GPU設(shè)計(jì),專(zhuān)注于高端設(shè)備市場(chǎng),并預(yù)計(jì)在2026年3月左右進(jìn)一步擴(kuò)大推廣范圍。這一舉措標(biāo)志著英偉達(dá)試圖打破英特爾和
    的頭像 發(fā)表于 11-05 15:29 ?2044次閱讀