用 DNA 儲存數據更好?

A+A-
圖片來源:Mario Tama/Getty Images

目前,估計全球有約 1 萬億 GB 數碼資料(digital data);每日的電子郵件、照片、推文等其他數碼檔案,便增加約 250 萬 GB,當中大部分數據會儲存在不同的大型數據中心。要建立一個數據中心,可能需要佔用幾個足球場大的土地,加上維護,成本約 10 億美元。美國麻省理工學院的科學家團隊,正探索以其他形式—— DNA —— 儲存不斷增加的龐大數據。

所有動物均由 DNA 建構而成。不過,雙螺旋結構的 DNA,只有腺嘌呤(adenine,A)、胸腺嘧啶(thymine,T)、胞嘧啶(cytosine,C)、鳥嘌呤(guanine,G) 4 個鹼基(base);並分別由 A-T、C-G 組成兩組鹼基對(base pair)。人類 DNA 有約 30 億個鹼基對,當中約 99% 基因組人人完全相同,剩下 1%,便促成每個人獨一無二的外型特徵。僅 4 個鹼基,便足以塑造人類以至物種的千變萬化,麻省理工學院生物工程教授 Mark Ba​​the 便表示:「裝滿咖啡杯大小的 DNA,已能儲存世上所有數據。」

DNA 模型,DNA 由 4 個鹼基組合而成。 圖片來源:SSPL/Getty Images

現時的數碼儲存系統,以 0 及 1 編碼表示文本、照片等資料的信息;只要把 C-G 表示 0,A-T 表示 1,文件等同樣可以用 DNA 編碼。此外,DNA 非常穩定,生成後毋須額外成本,也是取代目前耗費大量能源,以維持數據儲存的一項好處。

早至 2016 年已有學術文術章探討以 DNA 儲存數據,但科學家同時點出一連串困難,例如生成 DNA 的成本極高昂、難以揀選已儲存資料等。Ba​​the 的團隊就嘗試以新方法,在芸芸 DNA 片段中,輕易揀選所需數據。

Bathe 與同事把每個數據文件分別裝進只有 6 微米的二氧化矽(silica)顆粒中,再在顆粒上標籤有關儲存內容的一小串 DNA 序列,以方便揀選儲存資料。研究人員證明,他們能用以上方法,從 20 張以 DNA 排序記錄的圖像中準確提取目標圖像。就可供使用標籤數量而言,該方法可同時應用於 1 垓文件。

合成大量 DNA 所需的成本,是實踐理論的障礙。現時,以 DNA 寫入 1PB(Petabyte,10,000 GB)數據,要花費 1 萬億美元。Bathe 估計,DNA 數據儲存若要與現時存儲檔案資料通用的磁帶(magnetic tape)競爭,其合成成本要下降 6 個數量級(order of magnitude),即降至百萬分之一,聽來極其龐大,但參考過去數十年快閃記憶體成本大幅下降的情況,Bathe 預計此將在未來十至二十年內實現。