联 系 人:吉恩特客服
手 机:136-0866-9917(微信同号)
地 址:河南省洛阳市高新区火炬创业园
***新一期Nature Biotechnology发表了一篇重磅文章,由华盛顿大学(University of Washington)和微软研究院(Microsoft Research)的科学家合作,将DNA存储数据的容量提升到人类***的新水平,为解决人类巨量大数据困扰提供了新思路。
研究人员开发的新存储方法可以使用细菌在一克 DNA 中存储多达 1ZB 的数据。
什么是ZB?
ZB,Zettabyte,十万亿亿字节,泽字节。根据美国这方面的权威IDC以及EMC公司的调查,2017年,全世界的数据总量是16ZB,而到了2020年,全世界的数据总量将达到44ZB。而全球***大的云存储公司:亚马逊Amazon的数据存储中心的硬盘数量也只够存储到EB(Exabyte,百亿亿字节,艾字节)级别的数据,而1ZB=1024EB,44ZB就等于45056EB,按照这个数据量,到2020年,全球的数据量需要现在的四万五千个亚马逊公司!也就是说仅仅需要一公斤的DNA就可以存储下全世界的数据!
多种存储介质比较,存储全世界的数据仅需要1公斤DNA,就像一袋子洗衣粉大小(图片来自Nature)
如何利用DNA来存储数据呢?
WIT 电信软件和系统集团研究部主任 Sasitharan Balasubramaniam 博士表示,我们研究的 DNA 就像细胞本身的软件,保存着细胞功能的各种代码,因此,我们可以将DNA看作我们自身数据的存储介质。在这种情况下,我们所做的就是将信息转换为数字数据,将其转换成核苷酸,然后用DNA来存储信息。
其中一种DNA编码存储的原理示意图,首先把英文字母转变成对应的0和1,然后把0和1转变成碱基A、T、C、G,具体而言,0可以用碱基a或者碱基c表示,而1可以用碱基G或者碱基T表示;编码的时候合成序列,解码的时候测序解读(图片来自Science)
该技术使用被称为质粒的双重应变 DNA 分子编码存储在大肠杆菌 Novablue 菌株中的数据。Novablue 菌株具有固定位置,使其可用于数据储存,并且可以通过释放大肠杆菌中的移动 HB101 菌株来转移数据,该菌株可通过接合过程提取数据。
虽然目前设计的方法非常昂贵,但随着时间的推移,成本应该会降低,此外,该方法的速度也很慢。目前数据检索需要三天时间,但研究人员认为该过程应该可以大大加快。