尋求治愈癌癥的復雜性已使研究人員困擾了幾十年。雖然他們取得了顯著(zhù)的進(jìn)步,但他們仍在為之戰斗,因為癌癥仍然是全世界死亡的主要原因之一。 然而,科學(xué)家可能很快就有一個(gè)在他們身邊的關(guān)鍵新盟友 - 人工智能機器 - 可以以不同的方式解決這些復雜性的問(wèn)題。 考慮一個(gè)來(lái)自游戲世界的例子:去年谷歌的人工智能平臺AlphaGo,部署了深度學(xué)習的技術(shù),擊敗了世界頂級圍棋高手韓國著(zhù)名圍棋手李世石,圍棋是極其復雜的游戲,每一步的走法可能性比宇宙中星星的數量都要多。 這些相同的機器學(xué)習和人工智能的技術(shù)也可以帶到解決癌癥的大規?茖W(xué)謎題中來(lái)。 有一件事是肯定的 - 如果我們沒(méi)有更多的數據可以使用,我們就無(wú)法利用這些新科技來(lái)征服癌癥。例如,許多數據資料,包括醫療記錄,基因測試和乳房X線(xiàn)照片,如果被封鎖,那就無(wú)法被最好的科學(xué)思想和最好的學(xué)習算法所利用到。 好消息是,大數據在癌癥研究中的作用現在已進(jìn)入主要發(fā)展階段,一些大規模政府主導的基因測序計劃正在向前發(fā)展。這些包括美國退伍軍人事務(wù)部百萬(wàn)老兵計劃;英國的100,000基因組計劃;和NIH的癌癥基因組圖譜,其保存來(lái)自超過(guò)11,000個(gè)患者的數據,并且通過(guò)云分析開(kāi)放給任何地方的研究者。根據最近的一項研究,2025年可以測序多達20億個(gè)人類(lèi)基因組。 據羿戓信息所了解,還有其他趨勢推動(dòng)對新數據的需求,包括遺傳測試。在2007年,測序一個(gè)人的基因組成本1000萬(wàn)美元。今天你只需要花不到1,000美元。換句話(huà)說(shuō),10年前排序一個(gè)人,我們現在可以做10000。這個(gè)影響是很大的:發(fā)現你有基因突變或患上某些類(lèi)型癌癥的更高風(fēng)險有時(shí)可能是一個(gè)拯救生命的信息。而且隨著(zhù)投入越來(lái)越多,研究工作也面臨巨大的潛在規模。 研究人員(和社會(huì ))的一個(gè)核心挑戰是,目前的數據集缺乏數量和種族多樣性。此外,研究人員經(jīng)常面臨限制性法律術(shù)語(yǔ)和不愿意分享合作伙伴關(guān)系。即使組織共享基因組數據集,協(xié)議通常在個(gè)體機構之間針對單個(gè)數據集。雖然目前有更大的結算所和數據庫已經(jīng)做了偉大的工作,但我們需要更多的標準化術(shù)語(yǔ)和平臺工作來(lái)加速訪(fǎng)問(wèn)。 這些新技術(shù)的潛在利益超出了識別風(fēng)險和篩查的范圍。機器學(xué)習的進(jìn)步可以幫助加速癌癥藥物的開(kāi)發(fā)和治療選擇,使醫生能夠將患者與臨床試驗匹配,并提高他們?yōu)榘┌Y患者提供定制治療計劃的能力(赫賽汀,最早的例子之一,仍然是最好的例子之一) 。 我們相信有三件事情需要發(fā)生,使數據更可用于癌癥研究和AI程序。首先,患者應該能夠輕松地貢獻數據。這包括醫療記錄,放射學(xué)圖像和遺傳測試。實(shí)驗室公司和醫療中心應采用共同的同意書(shū),使數據共享容易和合法。第二,在人工智能領(lǐng)域,數據科學(xué)和癌癥的結合點(diǎn)上工作的研究人員需要更多的資金。正如Chan Zuckerberg基金會(huì )為醫藥新工具開(kāi)發(fā)提供資金一樣,新的人工智能技術(shù)需要為醫療應用提供資金。第三,應該產(chǎn)生新的數據集,重點(diǎn)是所有種族的人。我們需要確保所有人都能獲得癌癥研究的進(jìn)展。
|