嘿嘿无码在线中文字幕-69精品人妻一区二区三区蜜桃-免费无码国产在线97-亚洲系列无码专区偷窥无码

行業門戶
NEWS CENTRE
首頁
>
新聞中心
>
全面擁抱UEC!AMD發布第三代 DPU Salina :以AI速度交付網絡創新
全面擁抱UEC!AMD發布第三代 DPU Salina :以AI速度交付網絡創新
2024-10-11 閱讀:202

C114訊 10月11日消息(岳明)大模型需要大算力,大算力需要大集群,大集群需要大網絡!

如何去構建這張大網絡,在本周舉行的“Advancing AI 2024”上,AMD給出了明確的答案:全面擁抱以太網,全面擁抱DPU。

UEC加速成熟:Ethernet is the answer

與傳統數據中心存在很大不同,主要由GPU服務器聯網構成的智算中心需要完全不同的網絡架構。

當大模型訓練時,并行計算節點越多,通信效率越重要,智算網絡性能成為集群算力提升的關鍵。但傳統網絡技術難以適應大規模AI集群的發展需求,在實際組網過程中面臨著四大難題:大規模網絡擁塞控制難、突發大象流負載均衡難、巨量鏈路長期穩定運行難、敏感隱私數據安全保障難。

對此,業界有幾種不同的解決方案。比如英偉達主導的InfiniBand,雖然現在市占率很高,但InfiniBand在產業開放性、部署成本方面非常不友好。另外就是從底層革新傳統以太網機制,在最大限度的利用以太網產業開放性和成熟性的同時,重構高擴展、高穩定、高可靠的以太網堆棧,滿足大規模AI和HPC不斷增長的網絡需求。UEC就是該技術路徑的典型代表,通過構建支持RoCE(RDMA over Converged Ethernet)的無損網絡,做到不丟包,支持以太網RDMA,滿足高帶寬和高利用率需求。

在“Advancing AI 2024”上,AMD執行副總裁,數據中心解決方案事業部總經理Forrest Norrod就指出,網絡成為制約AI系統性能的關鍵,平均30%的訓練時間被用來等待聯網;而在訓練和分布式推理中,通信更是占40%-75%的時間。這對于動輒部署萬卡集群的用戶而言是難以承受的。

在他看來,UEC是AI網絡變革的首選:從總體擁有成本(TCO)角度來看,相比較于InfiniBand,以太網下降了50%;可擴展性角度來看,以太網可以支持高達100萬+GPU的超大規模集群部署,遠遠超過InfiniBand;從生態系統的角度來看,UEC聯盟已經有超過97名成員,其中包括微軟、Meta、AMD、博通等眾多大廠,UEC1.0規范也將在明年一季度發布。有意思的是,英偉達在前段時間也加入了UEC。

在“Advancing AI 2024”的現場,不僅是AMD,思科、微軟等多位技術負責人均進行了分享。他們認為在當前的RDMA 環境下,超以太網協議有望支持百萬節點互聯,同時以太網的開放特性,能夠讓諸如LPO等新技術加速滲透,帶來高性價比、高容量、高開放程度的AI網絡。

第三代DPU Salina:以AI速度交付網絡創新

在AMD的AI網絡戰略拼圖中,既有關注底層芯片級互聯的Infinity Fabric,極具性能優勢的在AMD的AI網絡戰略拼圖中,既有關注底層芯片級互聯的Infinity Fabric,但DPU占據了更為重要的版圖。

對于云服務提供商而言,要實現利益最大化,就必須要充分釋放CPU/GPU等算力資源。云服務先驅亞馬遜率先引入了DPU概念和產品,實現將網絡、存儲、管理、安全和監控等工作負載一并卸載,而這也為亞馬遜贏得了市場先機。

DPU的好處得到用戶的廣泛認可。2022年4月,AMD斥資19億美元購買DPU廠商Pensando,并成功實現了第一代Capri和第二代Elba兩大DPU的量產。在“Advancing AI 2024”的現場,AMD正式發布了采用P4引擎的第三代DPU產品—Salina,以AI速度交付網絡創新。

從AMD提供的產品技術規格上來看,Salina采用5nm制程工藝打造,實現兩倍于上一代的性能。而且,AMD Pensando DPU支持軟件前向兼容,節省了應用程序開發所需的時間。在性能方面,Salina最高支持800G(400G*2)網絡,這與AI數據中心網絡演進是完全匹配的,同時Salina支持完全可編程,具備相當的靈活性。

在會議現場,包括IBM云、微軟Azure、甲骨文云、思科等用戶的技術高管也都談到了AMD Pensando DPU在不同應用場景中的價值。微軟Azure主要是用基于DPU的智能交換機來完成SDN解耦,而甲骨文云和IBM云則是硬件上用到DPU卡,軟件上除了使用Pensando提供的SDK和庫,還有定制的邏輯應用,方便客戶添加軟件定義的服務。

13560189272
地址:廣州市天河區黃埔大道西201號金澤大廈808室
COPYRIFHT ? 2010-2020 廣州市名聯網絡科技有限公司 ALL RIGHTS RESERVED 粵ICP備10203057號
  • 這里是二維碼
柳州市| 东乡| 五河县| 焉耆| 民县| 广州市| 罗山县| 溧水县| 仁化县| 青浦区| 土默特右旗| 清远市| 明水县| 聂拉木县| 晋中市| 西贡区| 潍坊市| 财经| 镇平县| 临江市| 达孜县| 东光县| 高安市| 望谟县| 贺兰县| 疏附县| 进贤县| 荣成市| 苍溪县| 宾阳县| 自治县| 榆社县| 贵德县| 剑川县| 玉门市| 阳朔县| 繁昌县| 晋城| 榕江县| 云安县| 怀来县|