作者:泰克科技 數據中心正在部署基于人工智能 (AI) 的技術(shù),處理器密集型服務(wù)器正在推動(dòng)能源需求的增長(cháng),下表說(shuō)明了這種發(fā)展趨勢所帶來(lái)的巨大影響。國際能源署 (IEA) 預測,到 2030 年,數據中心的耗電量將占全球耗電量的 7%,相當于印度全國的耗電量。 ![]() 圖 1:數據中心 CPU 和 GPU 技術(shù)的功耗。 由于電力需求不斷增長(cháng),關(guān)注能源效率至關(guān)重要。泰克與知名電源完整性專(zhuān)家 Steve Sandler 合作,開(kāi)發(fā)了出色的測量技術(shù),旨在改進(jìn)下一代人工智能數據中心的運營(yíng)效率/能效。 提高電源分配網(wǎng)絡(luò ) (PDN) 的能效提高供電網(wǎng)絡(luò ) (PDN) 的能源效率 PDN 必須為驅動(dòng)服務(wù)器機架中的 GPU 敏感負載提供許多低噪聲直流電源軌。追求更高速度和更高密度意味著(zhù),需要在更低電壓水平和更大電流下實(shí)現更快邊緣速率、更高頻率和更多軌道。這突顯了良好電源完整性的重要性。 進(jìn)行電源完整性測試的目的是,驗證到達負載點(diǎn) (POL) 的電壓和電流在所有預期運行條件下是否滿(mǎn)足負載的電源軌規格要求。要在千兆赫頻率下準確測量毫伏級電源軌噪聲,尤其需要注意。 讓我們通過(guò)基于的服務(wù)器系統的電源分配網(wǎng)絡(luò )高能級結構圖,了解如何評估 PDN 性能。 ![]() 圖 2:數據中心的高能級配電網(wǎng)絡(luò )。 如圖所示,典型數據中心通過(guò) 12 V、24 V 或 48 V 直流電源為其基于 AI 的服務(wù)器供電,然后在主板上將電壓轉換為其他電源電壓。工程師能夠查看從電源輸出到 FPGA、處理器和其他復雜 IC 的鏈路中的每個(gè)環(huán)節,因此可以將電源軌阻抗控制在非常低的水平,以便輸送由 GPU 技術(shù)驅動(dòng)的 AI 服務(wù)器所需的高電流。阻抗管理的棘手之處在于配電網(wǎng)絡(luò )由許多阻抗組成,包括電壓調節器、去耦電容器和 PCB 走線(xiàn)。高速交換和熱插拔服務(wù)器卡會(huì )引入意外的阻抗變化,這可能導致過(guò)多的瞬變或噪聲。 要確保穩定節能的設計,首先要最大限度地減少 PDN 中的噪聲。電源軌噪聲規格可以達到數百兆赫或數千兆赫的頻率范圍,其幅度達到毫伏級。 評估能效首先要對交流線(xiàn)路輸入和輸出進(jìn)行電能質(zhì)量測量,以確保線(xiàn)電壓和線(xiàn)電流符合要求。用于評估質(zhì)量的測量值如下所示: • 頻率 • 有效電壓和電流 • 有效值 • 阻抗阻抗 • 波峰因數(電壓和電流)波峰因數(電壓和電流 • 有功功率、無(wú)功功率和視在功率真實(shí)功率、無(wú)功功率和視在功率 • 功率因數和相位功率因數和相位 為了確保準確進(jìn)行這些測量,示波器探頭的選擇非常重要;使用差分探頭測量系統的線(xiàn)電壓,使用電流探頭測量系統的線(xiàn)電流。 另一個(gè)關(guān)鍵測量是對 PDN 控制環(huán)路響應進(jìn)行頻率響應分析。這將提供有關(guān)控制環(huán)路速度和電源穩定性的重要信息。借助波特圖查看分析結果,圖 3 中是示例設置。 ![]() 圖 3:電源分配網(wǎng)絡(luò )阻抗的測量設置。 電源完整性探測系統應受重視電源完整性探測系統值得關(guān)注 當今示波器配備的高阻抗 10X 無(wú)源探頭可能具有足夠的帶寬,但會(huì )使您想要測量的噪聲信號發(fā)生衰減。1X 探頭可無(wú)衰減地傳遞噪聲信號,但其帶寬僅為幾百兆赫。具有 50Ω 輸入阻抗的傳輸線(xiàn)探頭或電纜具有出色的高頻性能,但在直流情況下會(huì )產(chǎn)生顯著(zhù)負載,除非增加直流隔離器。 衰減傳輸線(xiàn)探頭產(chǎn)生的負載較小,同時(shí)保持低噪聲和高帶寬。 電源軌探頭是另一類(lèi)低噪聲探頭,偏移范圍高達 4 GHz,直流偏移范圍為 -60 至 +60 Vdc。在識別噪聲源方面,電源軌探頭是一種比傳統無(wú)源探頭更準確的替代工具,如下圖 4 所示。根據電源軌的電壓,可能需要直流阻斷器。 如果需要,請確保直流阻斷器為示波器提供浪涌保護,并且不受直流或交流偏置的影響。電源軌探頭雖然能夠測量很小的噪聲,但也是單端測量。 因此,需要使用能夠進(jìn)一步減少測量接地環(huán)路誤差的同軸隔離器。Picotest 提供多種直流阻斷器和同軸隔離器來(lái)滿(mǎn)足此類(lèi)需求。 詳細了解終極電源軌噪聲測量。 ![]() 圖 4:使用無(wú)源探頭(下方跡線(xiàn))和電源軌探頭(上方跡線(xiàn))的電源線(xiàn)紋波測量比較。 快速低噪聲采集與超快速邊緣負載相結合,可模擬 AI 級處理器工作負載,從而可以準確評估 PDN 設計中的電源軌噪聲電壓以及電源軌與電源軌之間的串擾。在結合使用泰克 5 B 系列 MSO 或 6 B 系列 MSO 示波器的情況下,Picotest提供了完整的負載設備系列,最高為 2,000 安培、1 納秒的邊緣負載,并支持高達 65Ms/s 的采樣率,以進(jìn)行精確的模擬實(shí)驗。(見(jiàn)圖 5)快速、低噪聲采集與超快邊緣負載相結合,可模擬 AI 級處理器工作負載;允許準確評估 PDN 設計中的電源軌噪聲電壓和電源軌到電源軌串擾。與泰克 5 系列 B MSO 或 6 系列 B MSO 示波器結合使用 ![]() ![]() 圖 5 顯示了對 AI 級處理器進(jìn)行偽隨機高幅度負載的特性分析。 使用 PICOTEST 負載設備進(jìn)行特性分析,并通過(guò)泰克 6 系列 B MSO 示波器進(jìn)行測量,可以確保特性分析的準確性。泰克 6 系列 B MSO 示波器是捕獲低噪聲、高分辨率信號的理想儀器。 示波器測量分析有助于節省時(shí)間并減少錯誤 識別和分析 PDN 中的故障點(diǎn)可能耗費時(shí)間。在電源分配網(wǎng)絡(luò )中尋找紋波、過(guò)沖、欠沖、開(kāi)啟、關(guān)閉、時(shí)間趨勢、穩定時(shí)間和抖動(dòng)信號是一項復雜的任務(wù)。值得慶幸的是,當今大多數現代示波器都提供了內置分析軟件,用于設置儀器和自動(dòng)執行信號采集和顯示。下方為波紋自動(dòng)測量示例。將這些特性?xún)戎玫絻x器中,再加上具備通過(guò)遠程 PC 進(jìn)行自動(dòng)化的功能,可以簡(jiǎn)化大型團隊的 AI 性能評估工作,同時(shí),還可以評估 AI 支持性能隨時(shí)間和溫度的變化情況,以測試服務(wù)器的效率和耐久性。 ![]() 圖 6:自動(dòng)紋波測量,并在 5 系列 B MSO 示波器顯示屏的右側顯示注釋結果。 總結 由于人工智能 (AI) 推動(dòng)下一代數據中心的能源需求增長(cháng),評估電源分配網(wǎng)絡(luò ) (PDN) 的性能和效率變得比以往任何時(shí)候都更加重要。采用良好的 PDN 測試和測量策略,將會(huì )使 AI 就緒數據中心達到最佳運行性能、可靠性和能效,https://www.picotest.com/solutions/tektronix/,了解更多詳情:6 系列 B MSO | Tektronix。 |