2018年7月Google在其云端服務(wù)年會(huì )Google Cloud Next上正式發(fā)表其邊緣(Edge)技術(shù),與另兩家國際公有云服務(wù)大廠(chǎng)Amazon/AWS、Microsoft Azure相比,Google對于邊緣技術(shù)已屬較晚表態(tài)、較晚布局者,但其技術(shù)主張卻與前兩業(yè)者有所不同。 Google AI布局逐漸走向邊緣 除了同樣提倡基礎的物聯(lián)網(wǎng)閘道器(IoT Gateway)軟件Edge IoT Core、人工智慧/機器學(xué)習(AI/ML)軟件Edge ML外,還針對人工智慧/機器學(xué)習推出專(zhuān)屬的加速運算芯片,稱(chēng)為Google Edge TPU,成為此次盛會(huì )一大焦點(diǎn)。 在Google發(fā)表Edge TPU前已發(fā)表過(guò)Cloud TPU芯片,首次發(fā)表是在Google另一個(gè)更全面、更盛大的例行年會(huì )Google I/O 2016上。Cloud TPU顧名思義用于云端機房,而TPU是TensorFlow Processing Unit的縮寫(xiě),言下之意是針對TensorFlow而設計的硬件加速運算器,TensorFlow則是Google于2015年11月提出的人工智慧框架,是目前諸多人工智慧框架中的一大主流,其他知名的框架如Caffe/Caffe 2、Apache MXnet等。 目前人工智慧框架百花齊放,其他常見(jiàn)的亦有Keras、PyTorch、CNTK、DL4J、Theano、Torch7、Paddle、DSSTNE、tiny-dnn、Chainer、neon、ONNX、BigDL、DyNet、brainstorm、CoreML等。若以簡(jiǎn)單譬喻而言,人工智慧的開(kāi)發(fā)撰寫(xiě)如同文書(shū)撰寫(xiě),人工智慧框架就如同記事本、Word等文書(shū)處理器,功效在于協(xié)助與便利開(kāi)發(fā)撰寫(xiě)。 Google自行開(kāi)發(fā)設計的Cloud TPU僅用于自家云端機房,且已對多種Google官方云端服務(wù)帶來(lái)加速效果,例如Google街景圖服務(wù)的文字處理、Google相簿的照片分析、乃至Google搜尋引擎服務(wù)等。Google Cloud TPU也改版快速,2016年首次發(fā)表后2017年推出第二代,2018年推出第三代芯片 不過(guò),Google之后對Cloud TPU的技術(shù)態(tài)度似有變化。2018年2月宣布可申請租用TPU運算力,如同Google Cloud Platform(GCP)的公有云服務(wù)般,依據運算芯片的使用時(shí)間計費,每小時(shí)6.5美元(至2018年9月已降至4.5美元) ,與GCP的CPU租用服務(wù)相比相當昂貴,GCP的CPU租用服務(wù),以臺灣彰化濱海工業(yè)區的機房(不同位置的機房費率不同)而言,標準型計價(jià)約在0.055至5.28美元間,且8種計費費率中有5種低于1美元/小時(shí)。 TPU租用費亦同樣高于GPU租用,GCP的NVIDIA GPU租用費率約在0.49至2.48美元間,視規格等級而異(Tesla K80/P100/V100)。Google Cloud TPU雖可租用,但Google是否愿意單獨銷(xiāo)售Cloud TPU給系統商,讓系統商制造及銷(xiāo)售TPU運算系統,仍待進(jìn)一步觀(guān)察。 在Google推出云端用的Cloud TPU后,讓人未預料的是Google也針對邊緣提出專(zhuān)屬的TPU芯片,然在此前仍有些征兆,即2017年11月Google提出輕量版的TensorFlow Lite(某種程度取代此前的TensorFlow Mobile),使電力有限的行動(dòng)裝置也能支援TensorFlow,2018年推出的Edge TPU芯片即是以執行TensorFlow Lite為主,而非原宗的TensorFlow。 Google Edge裝置內的作業(yè)系統為Linux或Android Things,而后執行Google Edge IoT Core基礎功能軟件、Google Edge ML人工智慧軟件,并可選用配置Google Edge TPU。 Google Edge軟硬件架構概觀(guān) 圖3左側為物聯(lián)網(wǎng)感測器,右側為Google云端系統及服務(wù)。另外Edge TPU也支援Android Neural Networks 神經(jīng)網(wǎng)路應用程式介面(API),簡(jiǎn)稱(chēng)NNAPI。NNAPI于在2017年12月Android 8.1釋出時(shí)一同提出,NNAPI可視為T(mén)ensorFlow Lite、Caffe2等框架的基礎層。由此可知Edge TPU所支援呼應并加速的軟件,于2017年便已先行到位。 NNAPI可透過(guò)硬件抽象層與驅動(dòng)程式,運用GPU、特定處理器或數位訊號處理器(DSP)等,使人工智慧運算加速。資料來(lái)源:Google官網(wǎng)與Cloud TPU不同的是,Edge TPU估將由Google銷(xiāo)售給系統商,再由系統商配置于前端裝置內,包含感測器節點(diǎn)、裝置或閘道器內,Edge TPU不是自用或租用而是銷(xiāo)售。 Edge TPU技術(shù)輪廓 雖然Google對Cloud TPU、Edge TPU的技術(shù)資訊揭露均不多,但仍有若干資訊可推測其背后意向與考量。 首先是Google很明白Edge定位的系統運算力有限,所以Edge TPU的運算任務(wù)僅在于執行已訓練完成的人工智慧模型,即推測運算、推算工作(Inference,今日多譯成「推論」),真正要大量耗費運算力的模型訓練(Training),依然由充沛運算力的系統事先進(jìn)行,如工作站、伺服器、云端等,透過(guò)CPU/GPU/TPU進(jìn)行訓練。 其次,Edge TPU強調可同時(shí)執行處理多組每秒30張高清晰度畫(huà)質(zhì)的人工智慧判別運算,顯示Edge TPU將用于視訊影像類(lèi)的人工智慧應用,且為即時(shí)判別(30FPS)。 更進(jìn)一步的說(shuō)明,Edge TPU只負責人工智慧的加速判別、加速推算,僅為加速器、輔助處理器的角色。因此,必須與系統的主控芯片溝通聯(lián)系,這方面Edge TPU提供了兩種介接的方式,一是PCI Express介面,另一是USB介面。兩種介面均適合嵌入式設計,然PCI Express傳輸率較高,可避免傳輸瓶頸,而USB介面較可能定位在后裝型運用,即前端裝置已經(jīng)存在,但仍可透過(guò)USB連接Edge TPU,帶來(lái)加速效果。 也由于須與Edge裝置整合,因此Edge TPU設計之初已盡可能減少功耗,雖然Google官方并未正式揭露,但已表態(tài)將與Google合作的臺灣工控系統商也表示,其典型功耗(Thermal Design Power, TDP)僅在1.8瓦,很明顯只要現成芯片封裝即可散熱,幾乎可不加散熱片,更不需要馬達風(fēng)扇,便可讓Edge TPU正常運作。 至于Edge TPU支援的運算格式則為int8、int16,即8位元整數、16位元整數的人工智慧模型推算,但無(wú)法進(jìn)行更高位元數的整數,或者是浮點(diǎn)數的運算,如16位元浮點(diǎn)數(FP16)。 Google一發(fā)表Edge TPU即有合作伙伴與應用的揭露,如南韓樂(lè )金(LG)將用于產(chǎn)線(xiàn)制造上;另外紐西蘭、澳洲、英國的Smart Parking公司(顧名思義是與智慧停車(chē)相關(guān)的方案商)也表態(tài)采用,Smart Parking不單采用Edge TPU,其后端系統也大量采用GCP服務(wù);還有Xee公司將Edge TPU用于汽車(chē)駕駛輔助上,對影像與雷達資料進(jìn)行研判,而后給予駕駛潛在危險警告,如路況變差、輪胎過(guò)度磨損等。目前所知Google將Edge TPU訴求于三個(gè)目標,即制造、零售、汽車(chē)。 Movidius與Edge TPU的瑜亮情結 在Google尚未推出Edge TPU芯片前,其實(shí)Google已有使用前端的人工智慧加速芯片,2011年Google購并Motorola Mobility,而后于2014年將Motorola Mobility售給Lenovo,但Google仍保留下2個(gè)原屬于Motorola Mobility的研究專(zhuān)案,而未移轉給Lenovo,一是模組化手機專(zhuān)案Ara,另一是擴增實(shí)境技術(shù)專(zhuān)案Tango(此專(zhuān)案于2018年3月結束,改由ARCore技術(shù)接手)。 Google在2014年對外揭露Tango研究,此專(zhuān)案所發(fā)展的平板、手機等行動(dòng)裝置,即配置了Movidius公司的VPU芯片,VPU即Vision Processing Unit之意,更具體而言是視訊類(lèi)型的人工智慧運算、推算加速芯片。 Movidius自身發(fā)展第一代VPU,而后在與Google合作Tango計畫(huà)時(shí)則為第二代VPU,稱(chēng)為Myriad 2(芯片編號MA2150/MA2450,差別在于MA2150最高連接1Gbit記憶體,MA2450可至4Gbit)。不僅Google采用,包含多軸無(wú)人機大廠(chǎng)大疆亦用于無(wú)人機上。之后2016年英特爾(Intel)購并Movidius,接手后發(fā)展出第三代VPU,稱(chēng)為Myriad X(芯片編號MA2085/MA2485,MA2085封裝內無(wú)記憶體,MA2485內含4Gbit記憶體)。 Movidius在被英特爾收購后,Google依然鐘愛(ài)Movidius技術(shù)。2017年底Google推出AIY Vision Kit的開(kāi)發(fā)套件,該套件內仍可見(jiàn)MA2450芯片的蹤影。AIY Vision Kit是Google用來(lái)推行其影像人工智慧技術(shù)的評估套件,以樹(shù)莓派電腦(Raspberry Pi, RPi)為基礎提供擴充延伸的硬件配件,即可摸索與評估Google的影像人工智慧技術(shù)。 而所謂的AIY是Google自創(chuàng )的復合字,是以人工智慧(AI)與DIY(Do-It-Yourself自己動(dòng)手做)二字疊合而成。事實(shí)上Google在推出Vision Kit的同時(shí)也有推出Voice Kit,可供摸索評估Google的語(yǔ)音人工智慧技術(shù),但語(yǔ)音的人工智慧運算其運算負荷并不吃重,不需要專(zhuān)屬加速芯片。 從2014年的Tango到2017年底的AIY Vision Kit,Google均以第二代Movidius芯片為主,因此理論上順其發(fā)展,Google即便在Edge環(huán)節有其技術(shù)主張,認為可配置人工智慧硬件加速芯片,應也會(huì )屬意Movidius,而非自行研發(fā)Edge TPU。 不過(guò),最終Google提出了Edge TPU,因此不得不推測,英特爾購并Movidius后,Google可能認為后續新發(fā)展并不完全合乎期待,過(guò)往Movidius為小型獨立企業(yè)時(shí),可能提供Google高度支援,然英特爾可能對Movidius技術(shù)資產(chǎn)的后續延伸與新走向有不同的想法。 對此可若干比較第三代Movidius Myriad X與Edge TPU,前者支援FP16的16位元浮點(diǎn)數推測運算及8位元整數推算,而Edge TPU如前述僅支援8位元整數及16位元整數推算;Movidius Myriad系列仍可能顧及潛在市場(chǎng)機會(huì )最大化,雖未廣泛支援多種AI框架,但至少支援兩種現階段主流框架,即TensorFlow與Caffe Google可能對TensorFlow Lite寄予厚望,因而有專(zhuān)屬設計的加速芯片Edge TPU,Edge TPU可能一直維持比Movidius Myriad系列更低規(無(wú)浮點(diǎn)數)、更專(zhuān)精(只支援TensorFlow Lite )的技術(shù)發(fā)展定位,更高階的需求仍會(huì )選用Movidius Myriad系列,兩者高低并用并行。 或者Google未來(lái)只屬意自家Edge TPU,只在云端外推行Edge TPU,并一直維持低階定位,不往更高階發(fā)展,或Edge TPU僅是首發(fā),未來(lái)將持續發(fā)展更高階的Edge TPU,如此將與英特爾Movidius競爭,甚在效能規格大幅強化后而與NVIDIA Xavier競爭。 認為Edge TPU將與Movidius競爭的另一支持,在于Edge TPU也將推出USB隨身碟型態(tài)的開(kāi)發(fā)/運用套件,并同樣使用AIY之名推展。早于Movidius未被英特爾收購前,Movidius即有提供USB隨身碟型態(tài)的人工智慧評估/運用套件(圖6),英特爾收購Movidius套件產(chǎn)品仍持續,套件稱(chēng)為NCS(Neural Compute Stick)。 另一需考量的是,雖然Google在技術(shù)布局上已逐漸同時(shí)注重軟硬件的均衡與呼應,自身對于硬件發(fā)展的主導與涉入也日深,但就過(guò)往經(jīng)驗而言Google的硬件技術(shù)策略仍經(jīng)常搖擺,甚在短期內放棄,因此Edge TPU仍可能不是長(cháng)期技術(shù)策略中的一環(huán),而是一個(gè)技術(shù)嘗試,特別是Cloud TPU、Edge TPU均為加速作用的輔助處理器,為選擇性使用,必要時(shí)仍可由其他芯片實(shí)現相同運算效果,或在英特爾、NVIDIA等芯片商給予更多技術(shù)發(fā)展承諾后,仍可能停止自有芯片發(fā)展路線(xiàn)。 其他產(chǎn)業(yè)推測也包含,Google Edge TPU的技術(shù)授權來(lái)自于Movidius,有可能初始使用Movidius技術(shù)與架構之后獨立發(fā)展,也可能持續向英特爾Movidius取得授權,而始終與英特爾Movidius主力銷(xiāo)售芯片保持區隔與技術(shù)落差時(shí)間。 Edge TPU后續策略、動(dòng)向推測 展望未來(lái),Edge TPU由于將提供給系統商,估計日后揭露的技術(shù)資訊將較Cloud TPU為多,Cloud TPU由于目前只在Google機房端配置,至多提供遠端租用,因此可以不揭露更多技術(shù)資訊,事實(shí)上Google對于第三代Cloud TPU所揭露的資訊,已明顯少于前二代。 倘若Edge TPU推展順遂,支持的系統伙伴日增,則可激勵Google更快速發(fā)展新版Edge TPU。若推展不如預期,則Google也可能自行推出官方版的Edge閘道器、Edge裝置,作為產(chǎn)業(yè)示范,或自始至終不投入官方版示范,直接停止Edge TPU后續發(fā)展。 |