將全世界信息保存到百萬年后,存儲在哪里?
起源于幾千年前的中華“陰陽”思想,被應用于今天的生物學技術領域,并可能逐步改變未來的大數據產業發展。這或許是中國科學家才能碰撞出的“科技+文化”火花。
4月25日,《自然-計算科學》(Nature Computational Science)發表華大研究成果,研究團隊開創了一套獨具優勢的“陰陽”編解碼系統,用以解決當前DNA信息存儲領域的技術難題。
所有信息在計算機中只由二進制的方式存儲,即0和1兩個數碼;
生物的遺傳信息則儲存在DNA中,以A、T、G、C四種堿基表現。
如果屏幕前的你是一位家長,在孩子學會這兩個知識點之后,或許可以引導他們思考:
倘若把信息語言的0和1,轉換為生物語言的ATGC,我們是不是就能把各類信息長久地保存在DNA中,讓DNA成為“完美”的存儲器了?
擅于把腦洞變為現實的科學家,已經用實際研究成果對這個問題給出了樂觀的回答。
DNA憑什么碾壓現有信息存儲器?
我們正處在前所未有的信息大爆炸時代,據估算,2025年全球每天將產生491EB數據(1EB=1024PB,1PB=1024TB),相當于每天制造出2億張DVD光盤。
隨著5G技術、大數據、人工智能等領域的蓬勃發展,海量數據如何長期穩定存儲已成為亟待解決的一大難題,而以“BT+IT”融合的DNA信息存儲技術,或能為這個問題提供更優解,因此受到了越來越多的關注。
畢竟在存儲信息這件事上,DNA可以說是坐擁數十億年經驗的資深前輩。相較于現有的U盤、硬盤、磁帶等介質,DNA具備無法比擬的優勢:
其一,超高的信息密度:2012年《科學》雜志文章指出,1克DNA理論上可以存儲455EB數據,相當于數千萬個1TB移動硬盤的大小;
其二,超長的待機時間:DNA作為相對穩定的分子,其半衰期長達521年,在理想狀態下甚至可保存成千上萬年;
其三,超強的生物兼容性:DNA作為絕大多數生物遺傳信息的載體,相對無機物、金屬等存儲介質而言,具有更強的生物兼容性。
2019年,“DNA數據存儲器”入選《時代周刊》年度100項最佳發明。我們有理由相信,DNA憑借其獨家天然優勢,在信息密度、復制與維護成本、使用壽命等方面都具有顛覆現有技術的巨大潛能。
研究10年,科學家們還有什么煩惱?
2012年開始,科學家們不斷進行DNA信息存儲的相關嘗試。由于必須考慮與當下合成測序技術的兼容性以及成本問題,前期DNA所能存儲的信息密度都較低。于是,科學家們聚焦于如何提升存儲的信息密度,也關注于生物技術兼容性問題,但仍不全面。
一直到2017年,科學家引進信息通信領域的編碼方法——噴泉碼,以條件過濾的方式篩選DNA序列,唯有滿足篩選條件方可進行最終生成,基于此實現了對生物技術的兼容。
盡管DNA噴泉碼的誕生幾乎解決了此前的技術瓶頸,但實際應用中也出現靈活性與適用性的問題。
一方面,噴泉碼技術的建立是基于通信技術領域的原理基礎,對原始數據類型偏好較強(如需要01分布相對均勻等),因此面向生物與信息融合新興領域的DNA存儲技術應用,存在一定的局限性。另一方面,通信領域的信號傳輸是即時的、可及時糾錯的,而生物領域的DNA分子存儲是異步異時的,一旦發生部分信息丟失或錯誤,便存在原有信息無法恢復的風險。
如何在保證信息轉換效率和技術兼容的同時,大幅提高信息恢復的穩定性?毋庸置疑,技術需要進一步發展。
以中華“陰陽”思想,解DNA存儲難題
面對DNA存儲中編解碼系統存在的棘手問題,深圳華大生命科學研究院(以下簡稱“華大研究院”)提供了全新的解決思路。中國科學家讓人驚喜的地方,在于能夠把我們引以為豪的古代哲學思想,融會貫通應用到現代生物學之中,并期待以之解決未來世界的難題。
4月25日,華大研究院、深圳國家基因庫等多家機構的研究團隊聯合在《自然》(Nature)子刊《自然-計算科學》發表研究論文。研究團隊結合DNA雙鏈模型,從中華文化中“陰陽”對立統一的思想獲得靈感,開創了一套名為“陰陽”的比特-堿基編解碼系統,驗證了該系統在信息密度、技術兼容性、數據恢復穩定性等多方面的優勢。
陰陽哲理博大精深,其特點可簡單概括為統一、對立和互化。研究院團隊將其巧妙應用到DNA編解碼系統當中,以兩套不同的規則,分別對兩條二進制信息進行“一對一”編譯轉換,再取兩者統一交集的部分為最終解,實現將兩條獨立的信息組合統一為一串DNA序列。
機智的朋友可能會問,人工合成的DNA要保存在哪?目前,常用的保存方法分為體內和體外兩種模式,兩者孰優孰劣尚未形成明確定論。為了全方位驗證“陰陽”系統的信息恢復穩定性,華大研究院團隊通過體外DNA干粉和細胞體內大片段兩種存儲環境進行測試,皆實現了原始存儲數據的完整恢復。
體外模式,研究團隊采用不同濃度的原始DNA文庫溶液進行了共200多組測試。結果證明,“陰陽”編碼采用的線性數據恢復模式在每種DNA分子的平均拷貝數僅有100時,仍然能恢復最高88%的原始數據。而DNA噴泉碼使用的編碼方式使得每個數據包間存在一定的拓撲關聯,在同樣條件下,平均恢復率僅有1.3%。
另一方面,研究將信息存在了酵母活細胞的體內,酵母菌株經過1000代以上傳代之后,信息仍可以被完美恢復。這在一定程度上意味著,利用活體細胞作為DNA存儲的載體,上千年后原始信息或仍能被解讀。這樣的存儲方式可以得到接近于天然DNA分子存儲理論極限的物理信息密度,每克DNA能存儲的信息量約為432.2 EB。
華大研究團隊曾將《開國大典》影片存儲于DNA中
從起步至今短短十年時間,DNA信息存儲領域已取得不少令人矚目的研究成果,包括檢索、修改等高級功能也已完成原理驗證性的測試,以微軟、谷歌等產業巨頭形成的DNA存儲聯盟更是在為其商業化廣泛合作蓄勢。
在探索DNA信息存儲的同時,華大也在DNA合成、DNA測序的設備與技術自主研發道路上持續深耕。基于華大的MPS合成技術和DNBSEQ測序技術,結合本研究的比特-堿基編解碼技術,華大已經實現了DNA存儲的全流程技術閉環。相信隨著華大等全球科研機構、數字信息產業界的不斷突破,在不遠的未來,“DNA硬盤”將成為我們日常生活中必不可少的數據存儲設備之一。
該研究由深圳華大生命科學研究院主導,深圳國家基因庫、首都師范大學、美國哈佛大學等多個研究團隊共同參與。華大研究院平質博士為論文第一作者,華大研究院沈玥研究員、徐訊研究員與哈佛大學George M. Church教授為論文的共同通訊作者。
該研究受到國家重點研發計劃、國家青年科學基金、廣東省高通量基因組測序與合成編輯應用重點實驗室、深圳合成生物學創新研究院等項目支持。本研究已通過倫理審查,嚴格遵循相應法規和倫理準則。
(文中圖片由華大研究院提供)
您可能也感興趣:
為您推薦
一季度社?;鹦逻M14只個股 養老金賬戶新進9只個股
一季度廣東保險業總資產增長9.99% 面向服務業加大風險保障力度
丹東發布工傷保險費率調整方案 將惠及1萬多戶參保單位
排行
最近更新
- 將全世界信息保存到百萬年后,存儲在哪里?
- 無人值守也放心!中老鐵路有了智能化變配電設施
- 世界首臺樁梁一體智能造橋機“共工號”投入使用
- 中國城市知識產權指數報告2022在京發布
- 攜手共謀縣域創新 四川首次舉辦局縣科技會商
- 北京新落成一座航天科普館 航天迷們有了新的打卡勝地
- 新疆首個煤炭無人智能化驗室建成
- ?訪客數破千萬,第131屆廣交會線上平臺運行平穩順暢
- 深圳地鐵13號線留百區間(留風段)雙線順利貫通
- 抖音推出“星河知識計劃”
- 中國華能集中開工逾150個新能源項目
- 大連二季度766個重大項目集中簽約 進一步延伸產業鏈條
- 重慶體育人 | 因材施教 巴南體育老師宋軍專注培養學生運動興趣
- 鎧俠擴展面向高端客戶端應用的PCIe?4.0固態硬盤產品陣容
- 護佑平安 全民反詐 | 因輕信“低價提前還車貸”,男子款未...
- 逾期未認證能領到養老金嗎
- LED顯示屏頭部品牌視爵光旭一舉進攻國內“視界” 爭奪萬億巨...
- 肥鄉聯社為春耕備耕物資儲備企業 迅速紓困 助力企業復工復產
- 通用今年將向自動駕駛子公司Cruise提供20億美元
- 陳根:物聯網大步向前,安全問題也不可忽視
- 工行唐山分行以綠色金融“貸”動綠色發展
- 三個關鍵點,教會你怎么給孩子選黃金首飾
- 儒卓力實施大中國區拓展戰略 擴大中國臺灣辦事處
- 德清縣政協組織參加“浙江數字政協”建設工作推進會議
- 冀州農商銀行“三舉措” 筑牢疫情防控和金融服務保障線
- 人民城市示范區 | 沙坪壩:“群眾家門口的風景”可望可及
- “十四五”文博事業如何布局?河南要打造中華文明標識體系
- 灤州農商銀行疫情期間累計代發各類款項六千余萬元
- 重慶市籃管中心“全民健身月籃球云課堂”第四期:籃球的體能訓練
- “小炒貨”撬動“大產業”——灤州農商銀行三招精準助力特色...