DNA是個(gè)生物數據庫,存儲著(zhù)我們體內的海量基因代碼?茖W(xué)家發(fā)現,它的這種能力其實(shí)還可以用來(lái)存儲外部信息,一克DNA即能儲存上千億個(gè)千兆字節,相當于1000億G的內容。 近日,哈佛大學(xué)維斯生物工程研究所的研究人員將一本大約有5.34萬(wàn)個(gè)單詞的書(shū)籍編碼到不到一沙克(億萬(wàn)分之一克)的DNA(脫氧核糖核酸)微芯片中,連同文字一起的還有11張圖片和一段Java程序。這是迄今為止人類(lèi)使用DNA遺傳物質(zhì)儲存數據量最大的一次實(shí)驗,被刊登在最新《科學(xué)》期刊上。團隊負責人喬治·丘齊(GeorgeChurch)表示:“今后,拇指大小的設備或許就能存下整個(gè)互聯(lián)網(wǎng)的信息! DNA存儲的“野心” “利用DNA來(lái)存儲數據并不是一個(gè)新的概念。事實(shí)上,自從生物學(xué)確定了DNA結構,就有研究人員嘗試將其用于存儲和運算。北京華大基因研究中心醫學(xué)事業(yè)部主任甄二真告訴記者。 他介紹,DNA由4種堿基組成,分別為A(腺嘌呤)、C(胞嘧啶)、G(鳥(niǎo)嘌呤)及T(胸腺嘧啶),它們兩兩互補成對出現,共同構成了相互纏繞的雙鏈螺旋結構。DNA可以被視為四位運算存儲方式,存儲量比二位運算存儲大得多。 “目前通用的存儲模式都是二位運算的。為了存儲更多數據,早已有科學(xué)家嘗試過(guò)使用物理方法實(shí)現四位運算。但是技術(shù)上難以實(shí)現,只能出現"有"、"無(wú)"、"中間"三種狀態(tài),也就是三位運算,無(wú)法實(shí)際操作!闭缍嬲f(shuō),與之相比,DNA是天然的四位運算,有四個(gè)不同狀態(tài),與二位運算相比存儲量大、運算速度也快得多。 處于信息爆炸的時(shí)代,很多科學(xué)家嘗試以DNA存儲數據。比如今年年初,臺灣國立清華大學(xué)和德國卡爾斯魯厄技術(shù)研究所以三文魚(yú)的DNA作為基礎,制造出單次寫(xiě)入多次讀取的存儲器。不過(guò),這個(gè)DNA存儲器的有效時(shí)長(cháng)只有30小時(shí)。 甄二真表示,這些DNA無(wú)法長(cháng)期存儲數據是因為研究人員使用的是來(lái)自活細胞的基因組,這些細胞不僅會(huì )死亡,而且還會(huì )分裂復制,對其中存儲的數據有致命性打擊。 合成DNA:改變存儲模式 為了排除細胞會(huì )死亡、分裂、變異而使數據內容發(fā)生改變的危險,丘奇率領(lǐng)的團隊避免使用活細胞,而是采用人工合成的DNA片段,并將片段用噴墨打印機嵌入到芯片上。 這一次,丘奇選擇存儲在合成DNA片段上的信息是他的著(zhù)作《再生:合成生物學(xué)將如何改變未來(lái)的自然和自己》。首先,他把書(shū)中的圖片、文字、程序轉化為HTML格式的文件,再將其編譯為由0和1組成的電腦能夠讀懂的二進(jìn)制數據。隨后,這些二進(jìn)制數據被轉化為四種堿基,即把0轉為A或C,把1轉成G或者T,并將其建立在DNA雙鏈螺旋結構上來(lái)。 至于讀取數據的過(guò)程其實(shí)就是測序,通過(guò)DNA測序儀將DNA序列中的編碼按順序排列,還原為二進(jìn)制格式的數據,用電腦“讀”出來(lái)。 盡管聽(tīng)起來(lái)很復雜,甄二真表示其中重要一步就是將二進(jìn)制數據轉化為4位運算數據(A、C、G、T),做成DNA鏈結構,這可以使存儲量按級數增長(cháng)。而以經(jīng)化學(xué)反應得到的合成DNA取代活細胞使得這項研究成果更符合現實(shí)意義。此前以細胞內DNA來(lái)存儲信息一直無(wú)法取得技術(shù)突破,只能在短期內保證數據安全,此次轉換思路是被《科學(xué)》認可的關(guān)鍵。 突破傳統存儲的極限 與目前流行的存儲方式相比,DNA存儲的最大優(yōu)勢就是單位存儲量大。北京郵電大學(xué)信息與通信工程學(xué)院副教授陳光表示,現在使用的光介質(zhì)和磁介質(zhì)在存儲量上都幾乎達到了極限,這就需要研究其他存儲方式,比如DNA存儲這樣的生物介質(zhì)。 他告訴記者,磁介質(zhì)包括磁帶、磁盤(pán)、硬盤(pán)等。硬盤(pán)的存儲量可達上百G,但由于現在硬盤(pán)數據存儲密度提升的空間已經(jīng)有限,基本不太可能出現單碟1000G的硬盤(pán),所以如果硬盤(pán)體積不變,容量難以實(shí)現大幅突破。而CD、DVD等光介質(zhì)存儲對表面積的要求更大,磁介質(zhì)可以分幾層存儲數據,光介質(zhì)只能單層平鋪保存信息,單位存儲量更小。 DNA可以很好地解決這一存儲量的問(wèn)題。甄二真表示,這不僅與四位運算的特性有關(guān),也與DNA特有的雙鏈螺旋結構有關(guān)。這一結構可以把DNA序列壓縮得足夠小,整個(gè)立體空間都可以利用,比磁介質(zhì)和光介質(zhì)的平面存儲更具優(yōu)勢。按照哈佛團隊給出的數據,“一克DNA即能儲存上千億個(gè)千兆字節,相當于1000億G的內容”。 此外,合成DNA的穩定性也很優(yōu)秀。陳光介紹,磁介質(zhì)是建立在電磁的基礎上,工作環(huán)境受到限制,容易出現消磁等現象;而光介質(zhì)受環(huán)境影響小一些,但耐久性不理想。與這兩者相比,合成DNA不存在細胞死亡、變異等影響,在室溫下很穩定,甚至可以存放數萬(wàn)年而不變。 來(lái)源:北京青年報 |