來(lái)源:新浪數碼 5月10日下午消息,后摩智能發(fā)布首款存算一體智駕芯片——鴻途H30,最高物理算力256TOPS,典型功耗 35W,或成為國內率先落地存算一體大算力 AI 芯片的公司。 在人工智能技術(shù)飛速發(fā)展的今天,高效的 AI 計算能力成為智能駕駛普及應用的重要基石。后摩智能以底層技術(shù)創(chuàng )新為驅動(dòng)力,采用存算一體架構突破芯片算力和功耗的瓶頸,實(shí)現了芯片能效比的階躍,為快速發(fā)展的智能汽車(chē)產(chǎn)業(yè)帶來(lái)了全新的解決方案。 通過(guò)底層架構創(chuàng )新,實(shí)現 AI 計算效率的極致突破 一直以來(lái),計算效率的提升都是科技發(fā)展和變革的底層驅動(dòng)力。如今,一部小小的智能手機,計算能力和效率已經(jīng)比2000年代的個(gè)人PC提高了至少 1000倍。這種計算能力的提升,為人們帶來(lái)了豐富多彩的生活和便捷體驗。從大型機到 PC 再到手機,技術(shù)發(fā)展與應用變革的趨勢也表明,每 1000倍效率提升將會(huì )創(chuàng )造一個(gè)新的計算時(shí)代,并改變人們的生活方式。伴隨著(zhù)AI技術(shù)的躍進(jìn),未來(lái)萬(wàn)物智能時(shí)代的計算系統,和今天的芯片相比,在計算能力和效率上至少要再有 1000倍以上的提升。 后摩智能創(chuàng )始人兼 CEO 吳強表示:“2年前,后摩智能成立,我們堅定地選擇以存算一體的底層架構創(chuàng )新,來(lái)實(shí)現 AI 計算效率的極致突破。存算一體架構將存儲和計算功能融合,比傳統架構更接近人腦的計算方式,具備遠高于傳統方式的計算效率。隨著(zhù) GPT 等大模型的出現,存算一體芯片越來(lái)越受到行業(yè)關(guān)注,我們很高興看到更多創(chuàng )業(yè)公司加入進(jìn)來(lái),與我們一起推動(dòng)硬科技的創(chuàng )新與應用! 發(fā)布會(huì )上,中國電動(dòng)汽車(chē)百人會(huì )副理事長(cháng)兼秘書(shū)長(cháng)張永偉指出,智能駕駛市場(chǎng)規模龐大,仍處于加速滲透的階段,為新技術(shù)和新企業(yè)提供了創(chuàng )新發(fā)展的巨大機遇。存算一體作為一種創(chuàng )新技術(shù),對工藝制程依賴(lài)度低,具有極高的競爭力,為智能駕駛芯片提供了更具前瞻性的技術(shù)路徑選擇。采用多種技術(shù)路徑實(shí)現芯片國產(chǎn)化布局,將有利于解決汽車(chē)芯片供應鏈中存在的同質(zhì)化競爭問(wèn)題,助力提升產(chǎn)業(yè)鏈的韌性和供應鏈的安全性。 存算一體,為智能駕駛打造高效計算引擎 后摩智能聯(lián)合創(chuàng )始人兼研發(fā)副總裁陳亮表示,鴻途H30 以存算一體創(chuàng )新架構實(shí)現了六大技術(shù)突破,即大算力、全精度、低功耗、車(chē)規級、可量產(chǎn)、通用性。鴻途H30 基于 SRAM 存儲介質(zhì),采用數字存算一體架構,擁有極低的訪(fǎng)存功耗和超高的計算密度,在 Int8 數據精度條件下,其 AI 核心IPU 能效比高達 15Tops/W,是傳統架構芯片的7 倍以上。為了更好地實(shí)現車(chē)規級,后摩智能基于鴻途H30 自主研發(fā)了硬件增強機制和檢測機制,在提升芯片可靠性的同時(shí),進(jìn)一步保障了功能安全性。 為了充分發(fā)揮存算一體帶來(lái)的高計算效率,后摩智能面向智能駕駛場(chǎng)景打造了專(zhuān)用 IPU(處理器架構)——天樞架構,采用多核、多硬件線(xiàn)程的方式擴展算力,實(shí)現了計算效率與算力靈活擴展的完美均衡,AI 計算可以在核內完成端到端處理,保證通用性。天樞架構的設計理念源自于庭院式的中國傳統住宅,以大布局設計保障計算資源利用效率的同時(shí),再進(jìn)一步結合現代住宅多層/高層的設計優(yōu)勢,以多核/多硬件線(xiàn)程的方式靈活擴展算力。得益于靈活、高效的硬件架構設計,鴻途H30 實(shí)現了性能 2 倍提升的同時(shí),還降低了 50% 功耗。 據陳亮介紹,天樞架構是后摩智能自主研發(fā)的第一代 IPU(處理器架構),第二代天璇架構已經(jīng)在研發(fā)中,將采用Mesh 互聯(lián)結構,可根據應用場(chǎng)景的不同配置計算單元的數量,整體性能、效率和靈活性將進(jìn)一步躍升,支持多場(chǎng)景應用,例如成本和功耗敏感的智能終端、大模型等場(chǎng)景。第三代天璣架構已經(jīng)開(kāi)始規劃,將為萬(wàn)物智能打造。 顛覆式技術(shù)賦能智能駕駛,鴻途H30再創(chuàng )性能新高 發(fā)布會(huì )上,后摩智能聯(lián)合創(chuàng )始人兼產(chǎn)品副總裁信曉旭對鴻途H30 的產(chǎn)品性能與優(yōu)勢做了詳細介紹。得益于存算一體的架構優(yōu)勢,鴻途H30 基于 12nm 工藝制程,在 Int8 數據精度下實(shí)現高達 256TOPS 的物理算力,所需功耗不超過(guò) 35W,整個(gè) SoC 能效比達到 7.3Tops/W,具有高計算效率、低計算延時(shí)、低工藝依賴(lài)等特點(diǎn)。在實(shí)際性能測試中,鴻途H30 基于Resnet 50 模型的 Benchmark,在 Batch Size 等于1 和 8 的條件下分別達到了 8700 幀/秒和 10300 幀/秒的性能。 目前,基于鴻途H30 已成功運行常用的經(jīng)典 CV 網(wǎng)絡(luò )和多種自動(dòng)駕駛先進(jìn)網(wǎng)絡(luò ),包括當前業(yè)內最受關(guān)注的 BEV 網(wǎng)絡(luò )模型以及廣泛應用于高階輔助駕駛領(lǐng)域的 Pointpillar 網(wǎng)絡(luò )模型。以鴻途H30 打造的智能駕駛解決方案已經(jīng)在合作伙伴的無(wú)人小車(chē)上完成部署,這是業(yè)界第一次基于存算一體架構的芯片成功運行端到端的智能駕駛技術(shù)棧。 本次發(fā)布會(huì ),后摩智能同步推出了基于鴻途H30 芯片打造的智能駕駛硬件平臺——力馭。有賴(lài)于鴻途H30極高的計算效率和計算密度,力馭平臺 CPU 算力高達200 Kdmips,AI 算力高 256Tops,支持多傳感器輸入,能夠為智能駕駛提供更充沛的算力支持,進(jìn)一步提升了系統的可靠性。力馭平臺功耗僅為 85W,可采用更加靈活的散熱方式,實(shí)現更低成本的便捷部署,有利于推動(dòng)大算力智能駕駛場(chǎng)景的普及應用。 為了讓客戶(hù)擁有更好的產(chǎn)品使用體驗,后摩智能還基于鴻途H30 芯片自主研發(fā)了一款軟件開(kāi)發(fā)工具鏈——后摩大道,支持 PyTorch、TensorFlow 、ONNX 等主流開(kāi)源框架,編程兼容 CUDA 前端語(yǔ)法,同時(shí)支持 SIMD 和 SIMT 兩種編程模型,兼顧運行效率和開(kāi)發(fā)效率,以無(wú)侵入式的底層架構創(chuàng )新保障了通用性的同時(shí),進(jìn)一步實(shí)現了鴻途H30 的高效、易用。 信曉旭透露,鴻途H30 將于6月份開(kāi)始給 Alpha 客戶(hù)送測。同時(shí),后摩智能的第二代產(chǎn)品鴻途H50 已經(jīng)在全力研發(fā)中,將于2024年推出,支持客戶(hù) 2025年的量產(chǎn)車(chē)型。 鴻途H30 的發(fā)布,開(kāi)啟了存算一體大算力芯片商用落地的新階段。后摩智能將堅定不移地專(zhuān)注于底層技術(shù)創(chuàng )新,打造極致效率的計算芯片,與生態(tài)鏈上的合作伙伴密切合作,共同推進(jìn)萬(wàn)物智能的實(shí)現。 |