來(lái)源:澎湃新聞 如果有一天,你突然發(fā)現身上的一顆痣變得有些奇怪,你會(huì )怎么做?雖然這可能是一個(gè)危險的信號,但很多人因為工作忙、去醫院不便等種種原因,往往不會(huì )及時(shí)去檢查,F在,人工智能為這個(gè)問(wèn)題提供了更好的解決方案:在未來(lái),我們或許可以在手機上下載一個(gè)APP,開(kāi)個(gè)攝像頭讓機器醫生幫我們看一看,這是不是皮膚癌的早期癥狀。 斯坦福大學(xué)一個(gè)聯(lián)合研究團隊開(kāi)發(fā)出了一個(gè)皮膚癌診斷準確率媲美人類(lèi)醫生的人工智能,相關(guān)成果刊發(fā)為了1月底《自然》雜志的封面論文,題為《達到皮膚科醫生水平的皮膚癌篩查深度神經(jīng)網(wǎng)絡(luò )》(Dermatologist-level classification of skin cancer with deep neural networks)。他們通過(guò)深度學(xué)習的方法,用近13萬(wàn)張痣、皮疹和其他皮膚病變的圖像訓練機器識別其中的皮膚癌癥狀,在與21位皮膚科醫生的診斷結果進(jìn)行對比后,他們發(fā)現這個(gè)深度神經(jīng)網(wǎng)絡(luò )的診斷準確率與人類(lèi)醫生不相上下,在91%以上。 深度學(xué)習為醫學(xué)添磚加瓦 在中國,皮膚癌并不是癌癥家族中特別矚目的成員,這是因為黃種人的皮膚癌發(fā)病率要低于白種人。但在美國,皮膚癌卻是最常見(jiàn)的癌癥之一。每年約有540萬(wàn)美國人罹患皮膚癌。以黑色素瘤為例,如果在五年之內的早期階段檢測并接受治療,生存率在97%左右;但在晚期階段,存活率會(huì )劇降到14%。因而,早期篩查對皮膚癌患者來(lái)說(shuō)生死攸關(guān)。 一般情況下,來(lái)到醫院或診所后,醫生會(huì )基于視覺(jué)診斷進(jìn)行臨床篩查,再對疑似病變部位依次進(jìn)行皮膚鏡檢查、活體組織切片檢查和病理學(xué)診斷。 醫生使用皮膚鏡進(jìn)行檢查。但由于各種各樣的原因,很多人并不會(huì )及時(shí)為皮膚上出現的一些細小癥狀而跑一趟醫院。因而,基于人工智能的家用便攜式皮膚癌診斷設備將大大提高早期皮膚癌的篩查覆蓋率,挽救更多人的生命。但是,癌癥診斷,差之毫厘,謬以千里,人工智能能夠勝任將黑色素瘤從普通的痣中篩選出來(lái)的任務(wù)?斯坦福大學(xué)這個(gè)聯(lián)合研究團隊的結論是:基于深度學(xué)習的機器醫生診斷準確率十分驚人。 “我們意識到這是可行的,機器不僅能做,而且能做得和人類(lèi)一樣好”,斯坦福人工智能實(shí)驗室助理教授Sebastian Thrun說(shuō)道,“這時(shí)候我們的想法完全變了。我們說(shuō),‘瞧吧,這不僅僅是個(gè)學(xué)生作業(yè),這可能有益于全人類(lèi)’! 這種視覺(jué)處理算法基于時(shí)下大熱的深度學(xué)習,即通過(guò)大量的數據作為示例來(lái)訓練機器完成某些特定任務(wù)。近來(lái)深度學(xué)習不僅在視覺(jué)處理方面大放異彩,也在其他不同的領(lǐng)域碩果累累,譬如谷歌(微博)的圍棋AI阿爾法狗,就是在學(xué)習完3000萬(wàn)張人類(lèi)棋譜后擊敗世界圍棋冠軍李世石的。在機器學(xué)習過(guò)程中,開(kāi)發(fā)者不再需要對解題方法進(jìn)行編碼,而是任由計算機通過(guò)學(xué)習示例數據自己“摸索”出解法。具體到皮膚癌診斷這個(gè)案例中,就是研究者不再需要自己總結中皮膚癌在外觀(guān)上的一些規律性特征來(lái)教會(huì )計算機,而是由它自己總結其中的模式。 以谷歌一個(gè)區別貓狗的算法為藍本 研發(fā)者們沒(méi)有自己另起爐灶,而是以谷歌的一個(gè)能在128萬(wàn)張圖像中識別1000種物體的算法為藍本進(jìn)行加工。谷歌的這個(gè)算法原本是用來(lái)區分喵星人和汪星人的,現在,研究者們需要訓練它區別良性脂溢性角化。╞enign seborrheic keratosis)和角化細胞癌(keratinocyte carcinomas)、普通的痣和惡性黑色素瘤(malignant melanomas)。 但是,在數據方面,研究團隊面臨的第一個(gè)問(wèn)題就是并不存在一個(gè)現成可用的龐大皮膚癌數據庫。所以,斯坦福人工智能實(shí)驗室從互聯(lián)網(wǎng)上收集數據,與斯坦福醫學(xué)院進(jìn)行合作,給這一大堆混亂的照片分類(lèi)貼標簽。這工作并不容易,畢竟,原始數據里的語(yǔ)言就有好幾種,光把這些翻譯統一就很耗時(shí)。 接著(zhù),聯(lián)合研究團隊再一起對這鍋大雜燴進(jìn)行篩選。專(zhuān)業(yè)的皮膚科醫生會(huì )使用皮膚鏡,一種手持的顯微鏡,對相關(guān)部位的皮膚進(jìn)行放大觀(guān)察,形成的醫學(xué)影像具有一些固定標準。但這里的大多數照片不是專(zhuān)業(yè)的醫學(xué)影像,角度、尺寸和亮度五花八門(mén)。最后,他們選出了129450張皮膚病變圖片,其中包含2032種不同的疾病。每張照片是作為一個(gè)帶有相關(guān)疾病標簽的像素輸入進(jìn)算法的。這樣,研發(fā)者省去了許多前期的圖像分組工作,大大提高了數據量。 ![]() 圖片樣本:良性和惡性的上皮細胞/黑色素細胞/皮膚鏡下的黑色素細胞。經(jīng)過(guò)訓練后,研究者們使用由愛(ài)丁堡大學(xué)和國際皮膚影像合作項目(International Skin Imaging Collaboration Project)提供的高質(zhì)量的、經(jīng)活檢證實(shí)的照片來(lái)檢測機器的學(xué)習成果,照片涉及兩種最常見(jiàn)、也最致命的皮膚癌:惡性黑色素瘤和角質(zhì)形成細胞癌。21位人類(lèi)皮膚科醫生被要求觀(guān)察其中的370多張圖片,并對每一張作出判斷:是要進(jìn)一步進(jìn)行活檢或治療,還是告訴病人一個(gè)好消息。 在測試中,人工智能被要求完成三項診斷任務(wù):鑒別角化細胞癌、鑒別黑色素瘤,以及使用皮膚鏡圖像對黑色素瘤進(jìn)行分類(lèi)。研究者通過(guò)建構敏感性(sensitivity)-特異性(specificity)曲線(xiàn)對算法的表現進(jìn)行衡量。敏感性體現了算法正確識別惡性病變的能力,特異性體現了算法正確識別良性病變,即不誤診為癌癥的能力。在所有三項任務(wù)中,該人工智能表現與人類(lèi)皮膚科醫生不相上下,敏感性達到91%。 ![]() 算法診斷不同數量的角化細胞和黑色素細胞圖片時(shí)的敏感性,均在91%以上。除了媲美人類(lèi)醫生的診斷敏感性之外,該算法還有一大亮點(diǎn),它的敏感性是可以調節的。研究者可以依據想要的診斷效果對敏感性進(jìn)行調整。 未來(lái)的掌上醫生 這個(gè)算法現在還需要依托一個(gè)計算機運行,但斯坦福的這個(gè)團隊會(huì )努力把它縮小到可以在手機上裝載的地步。他們覺(jué)得這種改裝還是挺容易的,只是還需要更多實(shí)打實(shí)的臨床檢驗。在不遠的未來(lái),也許人們手指輕輕一點(diǎn),就可以進(jìn)行靠譜的皮膚癌診斷。 Thrun實(shí)驗室的研究生Esteva說(shuō)道,“當我想到智能手機強大的存在感后,我真是靈光一閃。未來(lái)每個(gè)人口袋里都會(huì )裝著(zhù)一個(gè)超級計算機。如果我們用它來(lái)篩查皮膚癌,或者其他疾病呢?“ 誠然,深度學(xué)習這塊土壤培植了太多可能性。斯坦福大學(xué)針對皮膚癌篩查的這個(gè)算法只是打開(kāi)了通往新世界的一個(gè)小口子,在未來(lái),基于深度學(xué)習的人工智能將在更廣闊的醫療領(lǐng)域內與人類(lèi)大夫們并肩作戰。 |