英特爾工具的新功能提升了跨平臺生產(chǎn)力 今天,英特爾宣布英特爾 oneAPI工具包的2023年版本已在英特爾開(kāi)發(fā)者云平臺(Intel Developer Cloud)上線(xiàn),并正在通過(guò)現有的渠道推送。新的oneAPI 2023工具包支持即將推出的第四代英特爾至強可擴展處理器、英特爾至強 CPU Max 系列和英特爾數據中心GPU,包括Flex系列和新的Max系列。這些工具可提升性能和生產(chǎn)力,并增加了對新的Codeplay1插件的支持,使開(kāi)發(fā)者能更容易地為那些非英特爾的GPU架構編寫(xiě)SYCL代碼。這些基于標準的工具提供了硬件方面的選擇,也讓在跨架構系統上運行的高性能應用的開(kāi)發(fā)變得更加輕松。 英特爾oneAPI 2023工具包包括一套完整的最新編譯器、庫、分析和移植工具,以及優(yōu)化后的AI和機器學(xué)習框架,讓開(kāi)發(fā)者能為oneAPI支持的CPU、GPU和FPGA構建高性能、跨架構的應用。開(kāi)發(fā)者可使用這些工具快速實(shí)現性能目標,并通過(guò)單個(gè)代碼庫節省時(shí)間,從而將更多時(shí)間用于創(chuàng )新。 新版本的oneAPI工具包可幫助開(kāi)發(fā)者利用英特爾硬件的先進(jìn)功能: • 第4代英特爾至強可擴展處理器和至強CPU Max系列,內置英特爾高級矩陣擴展(英特爾 AMX)、Quick Assist 技術(shù)(QAT)、英特爾AVX-512、bfloat16 及更多。 • 英特爾數據中心GPU,包括內置基于硬件的AV1編碼器的Flex系列,以及Max系列。Max系列提供靈活數據類(lèi)型的支持,內置英特爾 Xe矩陣擴展(英特爾XMX)、矢量化引擎(vector engine)、英特爾Xe-Link互聯(lián)擴展和其它功能。 oneAPI 2023工具包具有先進(jìn)的軟件性能: • 英特爾 Fortran編譯器(Intel Fortran Compiler)提供了完整的 Fortran 語(yǔ)言直至 Fortran 2018標準的支持,并擴展了對 OpenMP GPU 分流的支持,加快了符合標準的應用程序的開(kāi)發(fā)。 • 英特爾 oneAPI數學(xué)內核庫(oneMKL)包含OpenMP 分流能力的擴展,提高了可移植性。 • 英特爾 oneAPI 深度神經(jīng)網(wǎng)絡(luò )庫(oneDNN) 支持第四代英特爾至強處理器和Max系列CPU處理器的高級深度學(xué)習功能,包括英特爾AMX、英特爾AVX-512、VNNI 和 bfloat16。 通過(guò)豐富的SYCL支持,以及代碼遷移和分析工具的強化,讓面向多架構系統的代碼開(kāi)發(fā)變得更輕松,進(jìn)而提高開(kāi)發(fā)者的生產(chǎn)力。 • 英特爾oneAPI DPC++/C++編譯器增加了Codeplay為英偉達和AMD GPU開(kāi)發(fā)的新插件的支持,以簡(jiǎn)化SYCL代碼的編寫(xiě),并提高代碼面向這些處理器架構的可移植性。這提供了一個(gè)統一的構建環(huán)境,并整合了工具,以提高跨平臺生產(chǎn)力。作為該解決方案的一部分,英特爾和Codeplay將為英偉達GPU的oneAPI插件開(kāi)始提供商業(yè)化的優(yōu)先支持(priority support)。 • 基于開(kāi)源 SYCLomatic的英特爾 DPC++ 兼容性工具增加了100多個(gè)新的CUDA APIs支持,讓從CUDA到SYCL的代碼遷移變得更容易。 • 用戶(hù)可以使用英特爾VTune Profiler識別大規模MPI應用中的不均衡問(wèn)題。 • 英特爾 Advisor為英特爾數據中心GPU Max系列添加了自動(dòng)化roofline分析,以識別內存、緩存或計算瓶頸,確認其原因并進(jìn)行優(yōu)先處理,同時(shí)提供可操作的建議,以?xún)?yōu)化從CPU到GPU 的工作負載分流中的重復數據傳輸成本。 ![]() 48%4的開(kāi)發(fā)者面向使用多種處理器的異構系統進(jìn)行開(kāi)發(fā),因此需要更高效的跨架構編程來(lái)應對現實(shí)工作負載日益擴大的范圍和規模。結合使用oneAPI 的開(kāi)放、統一的編程模型與英特爾基于標準的多架構工具,開(kāi)發(fā)者能夠在CPU和加速器的硬件、性能、生產(chǎn)力和代碼可移植性方面自由地進(jìn)行選擇。相反,為專(zhuān)有編程模型(如 CUDA)編寫(xiě)的代碼,缺乏面向其它硬件的可移植性,讓開(kāi)發(fā)實(shí)踐變得孤立,將企業(yè)困于一個(gè)封閉的生態(tài)系統中。 此外, 開(kāi)放生態(tài)系統也在繼續擴大對oneAPI的使用,新的oneAPI卓越中心正在陸續成立。劍橋大學(xué)Open Zettascale 實(shí)驗室正致力于將重要的百萬(wàn)兆級的備選代碼(candidate codes)移植到oneAPI上,包括CASTEP、FEniCS和AREPO。該中心還提供課程和研討會(huì ),由專(zhuān)家講授oneAPI使用方法和工具,用于編譯和移植代碼以及優(yōu)化性能。目前,在全球總共已經(jīng)建立了30個(gè)oneAPI卓越中心。 *可前往英特爾新聞發(fā)布室了解更多產(chǎn)品性能具體細節:https://www.intel.com/content/ww ... ware.html#gs.lgulrs 了解更多信息,請訪(fǎng)問(wèn):Codeplay宣布為英偉達和AMD硬件推出oneAPI插件 | 英特爾oneAPI 2023工具包的功能細節|介紹英特爾oneAPI 2023工具包(博客)| 英特爾oneAPI 工具包2023版預覽 (網(wǎng)絡(luò )研討會(huì )錄像)| oneAPI和Codeplay |