长芯存储 (News) 芯片封装主页/ 长芯存储 / 黑科技?Microsoft想将数据储存在DNA中
< 返回列表

黑科技?Microsoft想将数据储存在DNA中

DNA存储技术是一项着眼于未来,具有划时代意义的存储技术,它利用人工合成的脱氧核糖核酸(DNA)作为存储介质,具有高效、存储量大、存储时间长、易获取且免维护的优点。

Microsoft及华盛顿大学正在合作研究将数据存储到人工合成DNA分子中。团队已成功存储并读取多种类型数据,正在研究如何降低DNA存储成本并提高产量,使技术在未来十年内普及。

他们如何做到这一点?又遇到了哪些困难?

原文来自Forbes,作者John Cumbers

1862年,格雷戈尔·孟德尔(Gregor Mendel)通过培育豌豆来研究遗传。

一百年后的1962年,詹姆士·沃森(James Watson)、弗朗西斯·克里克(Frances Crick)和莫里斯·威尔金斯(Maurice Wilkins)因发现DNA结构获得诺贝尔奖。

今天,DNA领域的发展越发深入,令人难以想象。

当我们进入生物技术的时代,我们读写和编辑DNA的能力正在颠覆一切,从人类健康到制造业。下一个将要颠覆的可能是数据存储领域。

包括Facebook和Amazon在内的科技巨头及其数以百万计的用户每秒都会在互联网上生成千万亿字节的数据。Microsoft一直在默默地研究如何将这些数据储存在DNA碳基As、Ts、Cs和Gs而非0和1中。

“设想把互联网上所有的信息压缩到一个鞋盒里,”Microsoft首席研究员卡林·斯特劳斯(Karin Strauss)表示,“有了DNA数据储存,这将是有可能的。”

斯特劳斯正在与华盛顿大学计算机科学与工程学教授路易斯·塞兹(Luis Ceze)合作,使用DNA进行数据储存和计算。

通过利用人工合成的DNA分子,该团队成功地储存超过了1G的可读信息,包括各种形式的媒体,如古登堡计划(Project Gutenberg)的排名前100本书、OK Go乐队高清MV和“#MemoriesInDNA”计划。

DNA的信息密度是惊人的——仅仅一克就可以储存215千万亿字节,或者2.15亿千兆字节的数据。具体来说,笔记本电脑的平均硬盘驱动器只能容纳这个数字的百万分之一。

斯特劳斯说:“我们在分子层面上对所有的数据进行编码,使其尽可能小,并将其储存在一种介质中,这种介质将在相当长一段时间为人所用,因为它生命之间的永恒关联,它不会像软盘那样很快过时。”

图注:DNA数据的兴起

改进的DNA读写技术,包括增加可读写的DNA链长度,将有助于迅速增加DNA的数据存储量。

除了开创性的高密度数据储存。塞兹和斯特劳斯还用DNA对图像进行相似性搜索,并在最近创造了第一个全自动读写DNA的存储系统。

斯特劳斯说:“我们正在试图用一种系统的方法改进计算机,这种方法能在自然界中找到伟大的替代品和解决方案。”

塞兹补充道:“利用DNA的计算方法是更有吸引力的数据存储选择,在读写DNA时,我们可以自由选择如何定位比特在DNA序列中具体的位置,创造冗余,并提高对错误的容忍度。”

这项技术是如何工作的?数据先从0和1的代码转换为As、Ts、Cs 和Gs。然后这个遗传密码被合成为一个实际的分子(在Twist Bioscience公司的帮助下,该公司为Microsoft和华盛顿大学研究小组提供了这一技术),“编码”过程就完成了。

检索数据较为复杂。必须执行“处理”和“解码”两步。

研究人员通过一种聚合酶链反应(PCR,一种用于复制DNA的常见实验室技术)来模拟随机存取储存器(RAM),它锁定序列的目标部分,然后对其进行复制、测序、解码,并根据错误进行调整,以检索原始数据。

这种定向的方法是有效的,因为他只涉及所需的序列,而不是整个数据集。

由于生物技术的进步,特别是高通量DNA测序和合成技术的进步,以前只出现在科幻小说中的DNA数据储存技术正在兴起。

此外,由于这些生物程序设计人员控制进入实验的材料,而且,因为不需要在活的有机体中发挥作用,不需要极度精心设计它们的序列,因此与典型的生命科学实验相比,这种实验的管理成本更低。

然而,这一进程并非没有障碍。尽管有了巨大的进步,但DNA的研究速度很慢,成本也很高,仍然需要进一步提高效率。

斯特劳斯说:“自动化在过去和现在都是我面临的最大挑战之一。很高兴我们第一次证明了将信息从二进制数据转化为DNA,再由DNA转化回二进制数据是可能的,这同时也向我们展现了自动化带来的其他挑战。

但是一些生物技术方面对我们来说是非常新的,所以我们也正从中学习到很多内容。另外一个很重要的挑战是继续增加通量,降低DNA测序和合成的成本。要做到这些,我们还要继续努力。”

Microsoft与华盛顿大学的跨学科研究团队从其多样的背景中看到了价值。塞兹说:“这是非常令人兴奋的,这是生物技术和计算机科学的交叉点,这两个领域一直相辅相成。”

他称:“我认为如果这项技术继续以我们现在看到的趋势发展,可以想象,我们将在十年内看到DNA存储成为普通大众的一种存储形式。”

· 2019-08-11 10:02  本新闻来源自:图书馆杂志,版权归原创方所有

阅读:995
  • 联系长芯

    重庆总部:重庆市长寿区新市街道新富大道5号佳禾工业园8栋2层
    电话:023 40819981 (前台)

    深圳办事处:深圳市南山区留仙大道 1213 号众冠红花岭工业南区 2 区 1 栋 1 楼
    电话:0755-26975877 (前台)

    电子邮件:sales@longcore.com

    网址:http://www.longcore.com