是德科技(NYSE: KEYS )推出Keysight AI (KAI)數據中心構建器,這是一款先進(jìn)的軟件套件,通過(guò)模擬真實(shí)工作負載來(lái)評估新算法、組件和協(xié)議對AI訓練性能的影響。KAI數據中心構建器的工作負載模擬功能將大型語(yǔ)言模型(LLM)和其他人工智能(AI)模型訓練工作負載集成到AI基礎設施組件的設計和驗證中——包括網(wǎng)絡(luò )、主機和加速器。該解決方案實(shí)現了硬件設計、協(xié)議、架構和AI訓練算法之間的更緊密協(xié)同,提升系統性能。![]() Keysight AI (KAI)數據中心構建器是一款先進(jìn)的軟件套件,通過(guò)模擬真實(shí)工作負載來(lái)評估新算法、組件和協(xié)議對AI訓練性能的影響 AI服務(wù)提供商使用各種并行處理策略(也稱(chēng)為數據或模型并行)來(lái)加速AI模型訓練。將模型并行與AI集群拓撲和配置對齊可以提高訓練性能。在A(yíng)I集群設計階段,關(guān)鍵問(wèn)題最好通過(guò)實(shí)驗來(lái)回答。許多問(wèn)題集中在圖形處理單元(GPU)之間的數據傳輸效率上。關(guān)鍵考慮因素包括: AI主機或機架內GPU互連的scale up設計 Scale out網(wǎng)絡(luò )設計,包括每個(gè)GPU的帶寬和拓撲 網(wǎng)絡(luò )負載均衡和擁塞控制的配置 訓練框架參數的調整 KAI數據中心構建器的工作負載模擬解決方案再現了真實(shí)AI訓練任務(wù)的網(wǎng)絡(luò )通信模式,加速實(shí)驗,降低達到熟練程度所需的學(xué)習曲線(xiàn),并更深入洞察性能下降的原因,這些是通過(guò)真實(shí)AI訓練任務(wù)實(shí)驗難以獲得的。是德科技客戶(hù)可以訪(fǎng)問(wèn)包括GPT和Llama在內的LLM工作負載庫,以及數據并行(DP)、全分片數據并行(FSDP)和三維(3D)并行等流行的模型分區方案。 使用KAI數據中心構建器中的工作負載模擬應用程序,AI服務(wù)提供商可以: 實(shí)驗并行參數,包括并行數據大小及其在可用AI基礎設施上的分布(調度) 了解并行內和并行間通信對整體任務(wù)完成時(shí)間(JCT)的影響 識別低性能的集合通信操作并深入識別瓶頸 分析網(wǎng)絡(luò )利用率、尾部延遲和擁塞,了解它們對JCT的影響 KAI數據中心構建器的新工作負載模擬功能使AI服務(wù)提供商、GPU云提供商和基礎設施供應商能夠將真實(shí)的AI工作負載引入其實(shí)驗室環(huán)境,以驗證AI集群和新組件的不斷演變的設計。他們還可以通過(guò)實(shí)驗微調模型并行方案、參數和算法,以?xún)?yōu)化基礎設施并提高AI工作負載性能。 是德科技網(wǎng)絡(luò )測試與安全解決方案副總裁兼總經(jīng)理Ram Periakaruppan表示:“隨著(zhù)AI基礎設施規模和復雜性的增長(cháng),對全棧驗證和優(yōu)化的需求變得至關(guān)重要。為了避免昂貴的延誤和返工,必須將驗證轉移到設計和制造周期的早期階段。KAI數據中心構建器的工作負載模擬為AI組件和系統設計提供了非常高的真實(shí)性,優(yōu)化工作負載以實(shí)現最佳性能! KAI數據中心構建器是是德科技人工智能(KAI)架構的基礎,這是一系列端到端解決方案,旨在通過(guò)使用真實(shí)AI工作負載模擬驗證AI集群組件,幫助客戶(hù)在數據中心擴展人工智能(AI)處理能力。 是德科技在2025年4月1日至3日于舊金山Moscone中心舉行的OFC 2025會(huì )議上展示KAI數據中心構建器及其工作負載模擬功能,展位號1301。 |