大开眼界!重庆诞生“DNA活字打印机”
2024-12-05 10:55
近日,记者从两江新区科研院所中科计算技术西部研究院(下称:西研院)获悉,该院与中国科学院北京基因组研究所(国家生物信息中心)、中国科学院计算技术研究所等多家科研机构历经三年多的紧密合作与不懈努力研发出“DNA活字打印机”,该技术可以显著降低DNA存储系统的使用成本。
其中,研发团队研发了“DNA活字打印机”工程样机“毕昇一号”,这也是重庆诞生的首台“DNA活字打印机”,技术达到世界领先水平。
▲近日,位于两江新区的中科计算技术西部研究院,实验人员正在调试DNA活字存储喷墨打印机“毕昇一号”样机。记者 张锦辉 摄/视觉重庆
近日,上述研究成果以《Cost-Effective DNA Storage System with DNA Movable Type》为题,在国际知名期刊《ADVANCED SCIENCE》(《尖端科学》)发表。
什么是DNA存储,用DNA存储有哪些优势?“DNA活字存储”又是啥?“毕昇一号”有哪些功能?记者到西研院进行了打探。
个头小、容量大
DNA“天生”就适合存储数据
西研院科研人员杨东鑫介绍,在大数据时代,全球的数据增长呈现井喷之势。根据IDC的预测,仅2024年一年,全球就将生成159.2ZB数据。而1ZB等于1万亿GB。电脑硬盘的1TB仅等于1024GB。
为了存储海量数据,全球各地修建了大量的数据中心。硬盘、U盘等,也不断“扩容”。但常见的硬盘寿命往往不足10年,每5-6年就需要更新,以免造成数据丢失。
在此情况下,急需一种体积小、容量大、保存寿命长的存储介质。而携带海量遗传信息的脱氧核糖核苷酸(DNA),就是一种很好的存储工具。
早在10多年前,国际上就提出了基于DNA的数据存储技术,即通过人工合成的DNA保存文本、图片和声音等数据文件,随后经由高通量测序完成数据准确读取的技术。
▲DNA数据存储技术示意图。西研院供图
DNA具有超高存储密度,据估算,1克DNA理论上携带有455EB(1EB等于约10亿GB)的数据,在这样的密度下,1公斤DNA就能储存全球数据。
并且,存储数据的DNA可以保存为干粉,在恒温条件下,数据可以完好保存上万年。
“毕昇一号”DNA活字存储技术的当前成本约为每兆字节(MB)122美元,这一价格相较于现有的DNA存储技术展现出显著的成本优势。研究团队透露,后续研究可通过一系列技术革新来进一步降低存储成本。
▲DNA存储技术及其优势示意图。西研院供图
具体而言,通过增加活字连接段数和优化反应体系,他们有信心将存储成本削减至每兆字节仅需0.06美元。
此外,随着编码技术的不断进步,例如集成高密度喷泉码以及改进DNA活字的校验机制,预计“毕昇一号”DNA活字存储的成本还将持续下降。这一系列技术突破不仅预示着DNA存储技术成本的显著降低,更为其商业化进程的加速推进奠定了坚实基础。
建立DNA“活字库”
可重复灵活利用
为什么传统的DNA技术会如此昂贵?“DNA活字存储”系统又为啥能大幅降低成本?
这是因为用传统的存储技术,相当于“雕版印刷”,只能一次性使用,所以成本昂贵。
将数据文件存储到DNA中,需要转换格式。传统的文件在电脑中都用0和1组成的编码来代表,科学家用DNA的4种碱基(即A、T、G、C)与电脑编码对应,将文字、数据、图片等“翻译”为碱基的组合,再通过化学合成手段,将它们“写”入DNA中。
杨东鑫打了个比方:用传统的DNA存储技术来存储今天的《重庆日报》,就需要把报纸版面上的每个字、每个标点都用化学合成方式“写”入DNA,等于用化学合成方式重新印刷了一份《重庆日报》。
而如果要存储昨天的《重庆日报》,就得从头开始,把昨天的《重庆日报》全部内容进行一次化学合成,再重新“写”进DNA。
以此类推,如果要用DNA存储一个月的《重庆日报》,至少要重复合成28次以上,成本怎能不高?
▲“毕昇一号”全自动的DNA活字存储喷墨打印机示意图。西研院供图
还是用存储《重庆日报》的例子。如果使用“DNA活字存储”,每一天的《重庆日报》的报头、版面样式、字体等“活字”可以重复套用,只需要将每天不一样的内容重新“排版”组合即可。成本大幅降低。
▲毕昇一号DNA活字存储系统的工作流程示意图。西研院供图
“毕昇一号”打印的第一句话
来自苏轼的作品
在西研院的实验室,记者看到了“毕昇一号”。它约有1.4米宽,约5米长。上部是密密麻麻的白色试管,下部有一条自动传送带。
“这些白色试管,就是DNA‘活字’库,相当于传统打印机的墨盒。”杨东鑫介绍,目前“毕昇一号”的活字库规模可达556种,打印时,这些“活字”以溶液形式存储在数百个白色储液管中。“毕昇一号”会通过电脑程序,自动从“活字库”中选择所需的“活字”。
▲近日,位于两江新区的中科计算技术西部研究院,实验人员将调配有化学试剂如同“打印纸”的微量离心管放入“毕昇一号”样机。记者 张锦辉 摄/视觉重庆
而装“打印纸”的,则是一个个的微量离心管。
“打印”时,微量离心管在传送带上自动移动,“活字”和数据写入所需的基础溶液(酶、载体)从相应的白色储液管中精确注入到对应的离心管中。打印的过程实际上就是对数据写入的过程。
▲近日,位于两江新区的中科计算技术西部研究院,西研院科研人员杨东鑫正在关注DNA活字存储喷墨打印机打印过程。记者 张锦辉 摄/视觉重庆
在前期准备就绪的情况下,一次“DNA活字打印”最短大约仅需几分钟即可完成“活字”的精确打印(即数据的全程自动化写入)。打印完的“成品”DNA可长期稳定保存在冷冻冰箱中。
▲近日,位于两江新区的中科计算技术西部研究院,小试管中装的打印完成的液体“成品”DNA。可存储文本、图像、音频和视频等形式的数据。记者 张锦辉 摄/视觉重庆
▲近日,位于两江新区的中科计算技术西部研究院,实验人员将装有打印完成的液体“成品”DNA小试管放入冰箱冷冻。记者 张锦辉 摄/视觉重庆
记者了解到,2020年,西研院正式组建团队,参与到“DNA活字存储”项目研发中。为纪念发明活字印刷术的毕昇,将“DNA活字打印机”命名为“毕昇一号”。
2021年4月,团队基于“DNA活字存储”方案进行了首次全自动DNA存储联调试验,并顺利完成。“毕昇一号”打印的第一句话是“明月几时有?把酒问青天”,出自苏轼的《水调歌头·明月几时有》。
至今,团队使用“毕昇一号”,陆续实现了对文本、图片、音频和视频文件的存储与读取,圆满完成既定任务目标。
据悉,目前,西研院围绕“毕昇一号”DNA活字存储喷墨打印机已经获得了8项发明专利和2项实用新型专利。项目团队接下来的工作重点是完善并升级现有设备,目标在于尽快实现并推出成本更低的DNA存储技术平台。
凡注明来源重庆日报的作品,版权均属重庆日报所有,未经授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:重庆日报网”。违反上述声明者,本网将追究其相关法律责任。
除来源署名为重庆日报稿件外,其他所转载内容之原创性、真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考并自行核实。