首頁->新聞動態

高中生把數據編入體內,1千克DNA可儲存全球數據

  日期:2019-07-05  來源:基因谷



全球每年產生的數據需要4180億個1TB硬盤才能放下,若是把如此龐大的數據放到DNA上,只需 1kg DNA就夠了!最近一家公司將16G的維基百科存儲在了一個DNA分子上讓人驚嘆,DNA存儲已成為最受關注的新興技術之一,“我,就是數據”時代即將來臨。



“我,就是數據”時代悄然將至。


在科幻大片《超體》中,“女超人”Lucy憑借藥物的作用,大腦不斷被開發,獲得了包括心靈感應、瞬間吸收知識等技能。當大腦開發到100%時,已然達到了“I am everywhere”的至高境界。


而目前我們正處于數據爆炸增長的時代,現存的硬盤、3D內存芯片等數據存儲方式已然出現“負荷過重”的跡象。若是要存儲全球的數據似乎是一件較為棘手的事情,更不要提做到像Lucy那般集“全宇宙數據于一身”了。


一種新的方式便應運而生——DNA數據存儲。


其實,這種嘗試早就已經開始了。


去年年底,法國一位16歲高中生Locatelli便將《古蘭經》和《圣經》中的部分內容注入到了自己體內。把希伯來語和阿拉伯語的字符轉換成DNA堿基的特定組合,然后用購買的病毒編輯到DNA鏈里,最后用注射器注入自己的大腿(詳細內容見文末附錄)。


除了這位高中生之外,上周,一家位于波士頓的初創公司Catalog宣布,他們將維基百科英文版一共16G的所有文本存儲在了一個DNA分子上!


他們相信生物分子的壽命將比最新的計算機存儲技術長得多。


16G的維基百科,只需一個DNA分子便可輕松存儲


計算機存儲技術已經從帶磁鐵的電線變成了硬盤,變成了3D存儲芯片。但是下一代存儲技術可能會使用與地球上的生命一樣古老的方法:DNA。


初創企業Catalog近日宣布,維基百科英文版的所有文本都被塞進了我們身體使用的相同基因分子中。也就是說,他們將維基百科英文版一共16G的所有文本存儲在了一個DNA分子上!


Catalog用它的第一臺DNA書寫器完成了這項壯舉。


Catalog的DNA寫入機可以以每秒4兆比特的速度寫入數據,但該公司希望使其速度至少提高1000倍。


至于說這個DNA書寫器有多大,呃,如果你先把家里的冰箱、烤箱扔掉,再打掉一部分櫥柜,這臺機器就可以很容易地安裝在你的房子里啦(機器的大小與一輛現代SUV差不多)。盡管它不太可能很快就將手機的閃存芯片推到一邊,但Catalog認為,它對一些需要存檔數據的客戶已經很有用了。


DNA鏈很小,很難管理,但是生物分子可以存儲除了控制細胞如何變成豌豆植物或黑猩猩的基因以外的其他數據。Catalog使用了比人類DNA短但更多的預制合成DNA鏈,因此它可以存儲更多的數據。


依靠DNA而不是最新的高科技小型化設備來存儲可能聽起來像是倒退了一步。但是DNA是緊密的,化學上是穩定的,而且因為它是地球生物學的基礎,它可能不會像硬盤驅動器或CD那樣過時,也不會像軟盤驅動器那樣消失。


誰在市場上購買這種存儲?Catalog有一個合作伙伴要宣布, Arch Mission基金會正試圖將人類知識儲存在不只是在地球上,甚至在太陽系的其他地方——就像SpaceX發射到軌道上的Elon Musk的Tesla Roadster一樣。除此之外,Catalog還未透露其他客戶是誰,或者是否會為其DNA寫入服務收費。


該公司在一份聲明中說:“我們正在與政府機構、產生大量測試數據的主要國際科學項目、石油天然氣、媒體和娛樂、金融和其他行業的主要公司進行討論。”


總部位于波士頓的Catalog擁有自己的設備,可以在DNA中每秒記錄4兆比特的數據。優化的速度應該是當前速度的三倍,讓人們在一天內記錄125千兆字節——大約相當于高端手機可以存儲的容量。


傳統的DNA測序產品已經在生物技術市場上銷售,可以讀取DNA數據。“我們認為這一全新的序列技術用例將有助于(大大)降低成本,”Catalog認為計算業務是一個潛在的巨大市場。


Catalog首席執行官Hyunjun Park和首席技術創新官Nathaniel Roquet于2016年創立了這家公司。當時,Park是麻省理工學院的博士后,Roquet是哈佛大學的研究生。


Catalog使用尋址系統,這意味著客戶可以使用大型數據集。即使DNA以長序列存儲數據,目錄也可以使用分子探針讀取存儲在任何地方的信息。換句話說,它是一種像硬盤一樣的隨機存取存儲器,而不是像半個世紀前大型計算機鼎盛時期的磁帶盤那樣的順序存取。


盡管DNA數據可能會被宇宙射線破壞,但Catalog認為它是一種比其他方法更穩定的介質。畢竟,我們有幾千年前滅絕動物的DNA。我們打個賭,你抽屜里的U盤在25年后還會用嗎?


DNA存儲數據的意義何在?


近日,《科學美國人》與世界經濟論壇聯合發布了2019年全球十大新興技術,其中一項就是用DNA儲存數據。那么,用DNA存儲數據的意義何在呢?


據軟件公司Domo稱,2018年,谷歌每分鐘進行388萬次搜索,人們在YouTube上觀看了433萬個視頻,發送了159362760封電子郵件,推特了47.3萬次,在Instagram上發布了49000張照片。


到2020年,全球人均每秒將產生大約1.7兆字節的數據,假設世界人口為78億,這相當于每年約418個zettabytes。這么多的數據如果放在容量為1TB的硬盤上,需要4180億個硬盤才能放下!


如果是這樣的話,目前的數據存儲系統通撐不過一個世紀。此外,運行數據中心需要消耗大量的能量。簡而言之,我們將面臨一個嚴重的數據存儲問題,隨著時間的推移,這個問題將變得更加嚴重!


因此,硬盤存儲的一種替代方案——基于DNA的數據存儲才顯得尤為重要。由核苷酸A,T,C和G的長鏈組成的DNA是生命的信息存儲材料。數據可以按照這些字母的順序存儲,從而將DNA轉變為一種新的信息技術形式。


它已經過常規排序(讀取),合成(寫入)并且可以輕松準確地復制。DNA也是非常穩定的,正如生活在50多萬年前的化石馬的完整基因組測序所證明的那樣,存儲它不需要太多能量。


但是,DNA的存儲容量是讓人驚訝的。DNA可以以遠超過電子設備的密度精確存儲大量數據。例如,根據哈佛大學George Church及其同事于2016年發表在“Nature Materials”雜志上的計算,簡單的大腸桿菌的存儲密度約為每立方厘米1019比特。


在這樣的密度下,一個邊長約一米的DNA立方體可以很好地滿足全世界一年的數據儲存需求,換個維度講,1kg DNA就能儲存全球數據。


DNA數據存儲的前景不僅僅是理論上的。例如,2017年,哈佛大學的Church小組采用CRISPR DNA編輯技術,將人手的圖像記錄到大腸桿菌的基因組中,并以高于90%的準確率讀出。華盛頓大學和微軟研究院的研究人員已經開發出一個完全自動化的系統,用于編寫、存儲和讀取DNA編碼的數據。包括微軟和Twist Bioscience在內的一些公司正在致力于推進DNA存儲技術。


與此同時,DNA已經被研究人員用來以不同的方式管理數據,這些研究人員努力處理海量的數據。新一代測序技術的最新進展使得數十億個DNA序列可以輕松同時讀取。有了這種能力,研究人員可以使用DNA序列的條形碼作為分子識別“標簽”,以跟蹤實驗結果。DNA條形碼正被用于大大加快化學工程、材料科學和納米技術等領域的研究步伐。例如,在佐治亞理工學院,James E. Dahlman的實驗室正在迅速確定更安全的基因療法;其他人正在研究如何對抗耐藥性和防止癌癥轉移。


使DNA數據存儲變得通用的挑戰之一是讀取和寫入DNA的成本和速度,如果要與電子存儲競爭,則需要進一步降低這些成本和速度。即使DNA沒有成為一種無所不在的存儲材料,它幾乎肯定會被用來以全新的方式生成信息,并長期保存某些類型的數據。


DNA能夠存儲數據,是否也可遺傳?


前不久,新智元報道了一篇文章——頂級學術期刊《CELL》同日連續發表兩篇重磅文章,研究人員在對線蟲的研究中發現,記憶可以被遺傳,甚至持續3-4代!


在2016年的SXSW大會上,南加州大學教授Theodore Berger宣布了一個轟動整個科技界的消息:


在對猴子、老鼠的實驗中,通過人造海馬體完成了短時記憶向長期儲存記憶“幾乎完美”的轉換,這項技術可以完成對人腦記憶的備份,并復制到其他人的大腦中。

這就意味著記憶有可能“遺傳”給后代。


吉林快3开奖号码今天