本站真誠介紹香港這個「東方之珠」和「亞洲國際都會」

亞洲國際都會 asiasworldcity

反英偉達聯盟的里程碑,UA Link 1.0:正式發佈

(本文内容不代表本站观点。)
香港飛龍 Hong Kong HK Dragon
香港飛龍.online 官方授權發布的第4代「香港飛龍」標誌

本文内容:

如果您希望可以時常見面,歡迎標星收藏哦~在很早之前,我們就報道了UAlink。該聯盟於2024年5月由一羣供應商成立,其中包括AMD、AWS、博通、思科、谷歌、HPE、英特爾、Meta、微軟和AsteraLabs,他們認爲世界需要一箇NvidiaNVLink技術的開放替代方案,以允許創建運行大規模AI工作負載所需的聯網GPU集羣。UALink的會員們希望創建一箇更便宜的替代方案,他們可以自行控制和部署超大規模,或者通過創建我們其他人購買的硬件從中獲利。他們還認爲,世界已經準備好迎接一種可應用於多箇供應商的GPU的網絡標準,而不需要用戶爲每個加速器供應商創建專用的網絡孤島。爲了實現這些目標,UAC還希望在大多數組織已經運營的以太網網絡上開展工作。在此前的文章中,我們對此有了深入的描述。現在,這個標準的第一個版本,終於正式發佈。UALink1.0:連接1024個GPU,帶寬200GT/s據官方介紹,這個名爲UALink200G1.0的規範定義了AI計算艙中加速器和交換機之間通信的低延遲、高帶寬互連。UALink1.0規範支持AI計算艙內最多1024個加速器實現每通道200G的擴展連接,爲下一代AI集羣性能提供開放標準互連。UALink聯盟董事會主席KurtisBowman表示:“隨着對AI計算的需求不斷增長,我們很高興能夠提供一項必不可少的開放行業標準技術,使下一代AI/ML應用能夠推向市場。UALink是唯一一款針對擴展AI的內存語義解決方案,它針對降低功耗、延遲和成本進行了優化,同時增加了有效帶寬。UALink200G1.0規範帶來的突破性性能將徹底改變雲服務提供商、系統OEM和IP/芯片提供商處理AI工作負載的方式。”UALink爲加速器創建了一箇交換機生態系統,爲新興的AI和HPC工作負載提供關鍵性能支持。它使用讀取、寫入和原子事務實現跨系統節點的加速器到加速器通信,並定義了一組協議和接口,從而爲AI應用程序創建多節點系統。英特爾公司網絡和邊緣事業部高級副總裁兼總經理SachinKatti在談到這個新標準的時候表示:“UALink是人工智能計算發展的重要里程碑。英特爾很自豪能夠共同領導這項新技術,並利用我們的專業知識來創建開放、動態的AI生態系統。作爲這個新聯盟的創始成員,我們期待通過UALink標準帶來新一波行業創新和客戶價值。這一舉措擴大了英特爾對AI連接創新的承諾,包括在超級以太網聯盟和其他標準機構中擔任領導角色。”UALink爲加速器創建了一箇交換機生態系統,爲新興的AI和HPC工作負載提供關鍵性能支持。它使用讀取、寫入和原子事務實現跨系統節點的加速器到加速器通信,並定義了一組協議和接口,從而爲AI應用程序創建多節點系統。據聯盟總結說,UALink的主要優勢包括以下幾點:1高性能爲一箇艙內的數百個加速器提供低延遲、高帶寬的互連;提供簡單的加載/存儲協議,具有與以太網相同的原始速度和PCIe交換機的延遲;專爲實現93%有效峯值帶寬的確定性性能而設計;2低功耗實現高效的開關設計,降低功耗和複雜性;3成本效益使用明顯更小的芯片面積進行鏈路堆棧,降低功耗和採購成本,從而降低總擁有成本(TCO);提高帶寬效率可進一步降低TCO;4開放、標準化多家供應商正在開發UALink加速器和交換機;利用成員公司的創新來將尖端功能納入規範並將可互操作的產品推向市場;UALink聯盟總裁PeterOnufryk表示:“隨着UALink200G1.0規範的發佈,UALink聯盟的成員公司正在積極構建一箇開放的生態系統,以擴大加速器連接。我們很高興看到各種解決方案即將進入市場,並支持未來的AI應用。”正如Dell'OroGroup副總裁SamehBoujelbene所說,AI正以前所未有的速度發展,開啓了具有新擴展定律的AI推理新時代。隨着計算需求激增和速度要求繼續呈指數級增長,擴展互連解決方案必須不斷髮展,以跟上這些快速變化的AI工作負載要求。我們很高興看到UALink1.0規範的發佈,該規範通過在同一AI計算艙內爲多達1,24個加速器實現每通道200G的擴展連接來應對這一挑戰。這一里程碑標誌着我們在滿足下一代AI基礎設施需求方面邁出了重要一步。究竟是怎麼做到的?其實當UALink小組成立時,其成員對於他們究竟會怎麼做和做什麼有些含糊其辭。有人說PCI-Express和以太網不是合適的東西,因爲已經做的事情簡單而優雅,網絡生態系統應該很容易採用和產品化。製造PCI-Express交換機的公司(AsteraLabs、Broadcom、Marvell和Microchip)將希望製造UALink交換機,我們將其稱爲UASwitch,以區別於計算引擎上的UALink端口。具體到UALink1.0規範,則定義了一種用於加速器的高速、低延遲互連,支持每通道200GT/s的最大雙向數據速率,信號傳輸速率爲212.5GT/s,以適應前向糾錯和編碼開銷。UALink可配置爲x1、x2或x4,四通道鏈路在發送和接收方向上均可實現高達800GT/s的速度。一箇UALink系統支持通過UALink交換機連接的最多1024個加速器(GPU或其他),每個加速器分配一箇端口和一箇10位唯一標識符以實現精確路由。UALink電纜長度優化爲<4米,在64B/640B有效載荷下實現<1μs的往返延遲。這些鏈路支持跨一到四個機架的確定性性能。UALink協議棧包括四個硬件優化層:物理層(physical)、數據鏈路層(datalink)、事務層(transaction)和協議層(protocol)。物理層使用標準以太網組件(例如200GBASE-KR1/CR1),幷包括使用FEC減少延遲的修改。數據鏈路層將來自事務層的64字節flit打包成640字節單元,應用CRC和可選重試邏輯。該層還處理設備間消息傳遞並支持UART樣式的固件通信。事務層實現壓縮尋址,在實際工作負載下以高達95%的協議效率簡化數據傳輸。它還支持直接內存操作,例如加速器之間的讀取、寫入和原子事務(atomictransactions),從而保留本地和遠程內存空間之間的順序。由於它面向現代數據中心,UALink協議支持集成的安全和管理功能。例如,UALinkSec爲所有流量提供硬件級加密和身份驗證,防止物理篡改,並通過租戶控制的可信執行環境(如AMDSEV、ArmCCA和IntelTDX)支持機密計算。該規範允許虛擬Pod分區,其中加速器組通過交換機級配置在單個Pod內隔離,以在共享基礎架構上實現併發多租戶工作負載。而UALinkPod將通過專用控制軟件和固件代理使用PCIe和以太網等標準接口進行管理。通過RESTAPI、遙測、工作負載控制和故障隔離支持完全可管理性。具體而言,從外到內,UALink堆棧從稍微修改過的以太網SerDes開始,其信號速率爲215.5GT/秒,一旦考慮到編碼開銷,每個UALink通道的帶寬就會減少到200Gb/秒:此以太網物理層具有標準前向糾錯(FEC)並遵守IEEEP802.3dj規範。通過單向和雙向代碼字交織改善了延遲,並且略有變化以支持680字節flit。(flit或流控制單元是鏈路級別的數據原子單位。)這是巧妙之處,PCI-Express已隨6.0規範發生變化併爲UALink奠定了基礎。隨着PCI-Express6.0的推出,控制該標準的PCI-SIG(主要由英特爾主導)不再僅僅實施標準FEC(這會大幅增加PCI-Express數據傳輸的延遲),而是轉向混合使用流量控制和循環冗餘校驗(CRC)錯誤檢測,這實際上提高了信號傳輸的可靠性,同時降低了延遲。一些智能功能正在添加到UALink中,而內存結構不需要的大量功能並未包含在內。“我們從200Gb/秒SerDes開始,”受僱主委託從事UALink工作的英特爾研究員PeterOnufryk表示:“它每個端口有四個通道,速度爲800Gb/秒,您可以聚合多箇端口。您還可以在結構中使用多達1,024個加速器,因此它在我們所處的空間中可擴展性相當高。”UALink是一種簡單的協議,因此它不是PCIExpress,但它針對擴展結構進行了優化,具有簡單的內存讀寫和原子操作以及大型操作。它消除了PCI-Express的排序限制,因此唯一的排序是在256字節邊界內。但如果跨越,您可以重新排序。“UALink的思考方式是,它具有PCI-Express交換機的延遲、PCI-Express交換機的功率、PCI-Express交換機的面積,但具有以太網SerDes。”PeterOnufryk強調。順便說一句,1024個計算引擎一致性限制僅限於UALink交換基礎設施的單層。如果要添加更多層級(這會增加延遲),您可以爲計算引擎構建更大的NUMA域。UALink1.0規範支持每通道100Gb/秒和200Gb/秒的速度,前者用於構建100Gb/秒、200Gb/秒和400Gb/秒的端口,後者用於構建200Gb/秒、400Gb/秒和800Gb/秒的端口。我們不知道未來的UASwitch會有多少個端口,所以我們不知道它與任何現有的NVSwitch相比如何。但顯然,如果Nvidia能夠整合端口以從設備中獲取更多帶寬,那麼UALink的採用者也可以做到。專爲確定性性能而設計在UALink1.0的演示文稿中,有一句話很有趣,那就是——“專爲確定性性能而設計,可實現93%的有效峯值帶寬。”這是在之前的資料中沒有看到過的。UALink成員在今年早些時候的演示中表示,UALink的功耗僅爲同等以太網ASIC芯片面積的一半到三分之一(每個端口),並且每個內存結構加速器可節省150瓦到200瓦的功耗。更小的芯片尺寸意味着更便宜的芯片,更低的功耗意味着更少的電力和冷卻消耗,從而降低整體TCO。這些演示還表示,UALink端口到端口的跳變延遲將低於100納秒。Onufryk表示,根據PCI-Express交換機的基數和品牌,PCI-Express交換機的端口跳變延遲最低爲70納秒,最高爲250納秒。在21世紀初的商用芯片時代,我們看到10Gb/秒以太網交換機的延遲爲350納秒到450納秒,而普通以太網交換機的延遲達到1毫秒甚至2毫秒的情況也很常見。與InfiniBand交換機100納秒到120納秒的延遲相比,這個延遲相當高。UALink聯盟並未強制執行延遲限制,因此供應商可以自行決定。AMD架構與戰略總監、UALink項目聯合負責人兼UALink聯盟主席庫蒂斯·鮑曼(KutisBowman)表示,UALink交換機的延遲時間在100納秒到150納秒之間“感覺合適”。“就像任何事情一樣,”鮑曼說。“一旦第一批Switch推出,他們就會想辦法改進。我們可能會看到一些不錯的中端數據,然後,隨着時間的推移,他們會把這個數字往左移。”至於這些交換機的基數(即它們驅動多少條通道和端口,以及總帶寬是多少),這也取決於UALink交換機製造商。“我們已經指定了物理層,也指定了數據包如何根據ID路由,人們可以隨心所欲地構建,”Onufryk說。“這就像PCI-Express——有些人構建小型交換機,有些人構建大型交換機,他們都在努力找到正確的位置。”從概念上講,UALink機架式機櫃可能如下所示:僅僅因爲UALink1.0協議能夠支持1024個設備互連的加速器NUMA內存域,並不意味着人們會立即投入其中,開始構建能夠擴展到如此規模的東西。(不過,如果有人真的這麼做了,那可就太有趣了。)我們來看看Nvidia有多保守。理論上,使用NVLink4端口的NVSwitch3結構可以在共享內存池中跨越多達256個GPU,但Nvidia的商業產品僅支持8個GPU。藉助NVSwitch4和NVLink5端口,Nvidia理論上可以支持跨越多達576個GPU的內存池,但實際上,僅在DGXB200和B300NVL72系統中最多具有72個GPU的機器上提供商業支持。並且Nvidia在其路線圖上最大的域(至少現在)在單個內存映像中只有576個GPU芯片,每個插槽有4個GPU芯片,每個機架有72個插槽。看起來,在某種程度上,UALink可能具有擴大規模的優勢,但這很大程度上取決於支持AI處理的全網絡在具有數百個共享高帶寬內存的計算引擎的機器上運行得如何。重要的是要意識到UALink並非NVLink的山寨版。儘管NVLink看起來像是PCI-Express和InfiniBand的結合體,但它們確實不同。(而且NVLink和NVSwitch的出現早於Nvidia收購MellanoxTechnologies。)Bowman表示:“UALink和NVLink之間存在差異。NVLink是x2的,所以它們總是將兩個通道組合在一起。UALink允許端口使用x1、x2或x4,之後你可以組合端口,就像Nvidia可以組合NVLink端口一樣。所以它們之間存在一些差異,雖然這些差異很細微,但根據你試圖構建的系統類型和所需的帶寬,它們確實會有所幫助。我們認爲,單向800Gb,即雙向1.6Tb,在這些UALink設備即將面世的時間段內,提供的帶寬足夠了。”通常情況下,當一項網絡規範發佈後,首批使用該技術的設備投入使用大約需要兩年時間。但鮑曼表示,這一次只需要十二到十八個月,因爲需求量非常大,而且每個製造UALink交換機的人都知道自己在做什麼。https://www.tomshardware.com/tech-industry/ualink-has-nvidias-nvlink-in-the-crosshairs-final-specs-support-up-to-1-024-gpus-with-200-gt-s-bandwidthhttps://www.businesswire.com/news/home/20250408050548/en/UALink-Consortium-Releases-the-Ultra-Accelerator-Link-200G-1.0-Specificationhttps://www.nextplatform.com/2025/04/08/ualink-fires-first-gpu-interconnect-salvo-at-nvidia-nvswitch/半導體精品公衆號推薦專注半導體領域更多原創內容關注全球半導體產業動向與趨勢*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅爲了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。今天是《半導體行業觀察》爲您分享的第4089期內容,歡迎關注。『半導體第一垂直媒體』實時專業原創深度公衆號ID:icbank喜歡我們的內容就點“在看”分享給小夥伴哦


(本文内容不代表本站观点。)
---------------------------------
本网站以及域名有仲裁协议(arbitration agreement)。

依据《伯尔尼公约》、香港、中国内地的法律规定,本站对部分文章享有对应的版权。

本站真诚介绍香港这个「东方之珠」和「亚洲国际都会」,香港和「东方之珠」和「亚洲国际都会」是本站的业务地点名称。

本网站是"非商业"(non-commercial),没有涉及商业利益或竞争。


2025-Jun-26 11:33am (UTC +8)
栏目列表