近日,Marvell(美滿(mǎn)電子)宣布推出采用共封裝光學(xué)器件(CPO)技術(shù)的定制XPU架構。 Marvell的這一舉措是對當前人工智能行業(yè)發(fā)展需求的有效回應。在數據處理量持續增長(cháng)的當下,傳統AI加速器在計算能力與互聯(lián)規模方面存在局限,最多只能在單一機架內連接數十個(gè)XPU。而新推出的CPO架構能夠將互聯(lián)規模提升至多個(gè)機架上的數百個(gè)XPU,極大地拓展了計算資源的集成范圍。 該定制XPU架構基于Marvell之前推出的定制HBM計算架構,在這一基礎上進(jìn)一步鞏固了Marvell在定制芯片領(lǐng)域的領(lǐng)導地位。其架構運用高速SerDes、D2D接口和先進(jìn)的封裝技術(shù),將XPU計算模塊、HBM內存以及其它小芯片與該公司的3D硅光子學(xué)引擎集成于同一基板之上。 這種集成方式具有諸多優(yōu)勢。在互連距離和數據傳輸速率方面,它能實(shí)現XPU間最大互聯(lián)距離達到傳統銅線(xiàn)連接方式的百倍,從而大大加快數據傳輸速度,這對于大數據傳輸和高并發(fā)計算場(chǎng)景意義重大。從信號完整性和延遲方面來(lái)看,由于CPO技術(shù)將光學(xué)元件直接集成到單一封裝內部,有效縮短了電氣路徑長(cháng)度。這一改變顯著(zhù)減少了信號損失、增強了高速信號完整性,并且極大地降低了延遲。 同時(shí),新架構還降低了數據鏈路受電磁干擾(EMI)的影響,優(yōu)化了元件清單(BOM),提升了能效表現。以Marvell現有的6.4Tb/s 3D硅光子學(xué)引擎為例,該引擎集成了數百個(gè)組件,能提供32條200Gb/s的電氣和光學(xué)I/O,這意味著(zhù)在單個(gè)器件內能夠實(shí)現2倍的帶寬和2倍的輸入/輸出帶寬密度,而且與100Gb/s接口同類(lèi)設備相比,每比特功耗降低了30%。 目前,許多客戶(hù)正在積極評估該技術(shù)以集成到下一代解決方案之中,這也顯示出該CPO架構在推動(dòng)人工智能服務(wù)器發(fā)展方面的巨大潛力,未來(lái)有望在A(yíng)I服務(wù)器性能提升方面發(fā)揮重要作用。 |