博主呓语:

微软拟用DNA存储数据:一段就能顶一个数据中心

Posted by 破冰 on 2017-5-24 15:34 Wednesday

5 月 24 日消息,据 Technologyreview 报道,微软公司旗下研究院的研究人员表示,在早期利用 NDA 存储电影和文档的研究基础上,该公司正在研发利用生物学取代磁带驱动器的存储装置。

微软研究院的计算机架构师表示,该公司已经正式制定了一个目标,即在 2020 年之前,在数据中心内建立一个以 DNA 为基础的操作存储系统。微软研究院架构师道格·卡米(Doug Carmean)说:“我们希望 3 年内实现这样的愿景,即在原始商业系统中的 DNA 上存储相当于 1 个数据中心的数据量。”卡米还描述了最终设备的大小,它与 20 世纪 70 年代的施乐复印机差不多。在内部,微软怀有更宏伟的目标,即利用生物学取代磁带驱动器,这是一种用于归档信息的通用格式。卡米说:“我们希望把它命名为‘DNA 存储'。”

00.gif

这些计划表明,许多科技公司正严肃地对待这个看似奇怪的想法,希望将视频、照片或有价值的文档保存在基因构成的分子中。Semiconductor Research Corporation 首席科学家维克多·日尔诺夫(Victor Zhirnov)表示,努力增加计算机内存依然存在物理极限,而 DNA 却拥有令人难以置信的密度,可用其存储数据。

在 DNA 中,每部电影都被压缩到比方糖更小的体积。日尔诺夫说:“DNA 是宇宙中已知最密度最高的存储介质,这就是为什么人们会看重这种研究潜力的原因,我们正在解决存储信息呈现指数增长的问题。”去年七月份,微软公开宣称它在 DNA 链中储存了 200 兆字节的数据,其中包括一段音乐视频,创下了新的记录。卡米与微软研究院专家卡琳·斯特劳斯(Karin Strauss)、华盛顿大学计算机实验室科学家路易斯·塞泽(Luis Ceze)在预印 BioRxiv 上发表论文,介绍了他们取得的进展。

利用 DNA 存储数据的主要障碍仍然存在,将数字位转换成 DNA 编码(由A、G、C和T组成的核苷酸链)仍然费力而昂贵,因为制造 DNA 链需要漫长的化学过程。在其示范项目中,微软使用了 13448372 个独特的 DNA 片段。专家表示,在公开市场上购买这些材料要花 80 万美元。哥伦比亚大学研究 DNA 存储方法的教授雅尼弗·埃里奇(Yaniv Erlich)说:“用 DNA 存储数据的主要问题是成本高昂,因此微软方案最重要的地方是其是否能解决这个问题”。在阅读卡米等人的论文后,埃里奇说:“我没有看到帮助实现这个目标的任何进展,但也许他们还有更多新东西。”

微软表示,DNA 存储成本需要下降 10000 倍后才可能被广泛采用。虽然许多专家认为这是不可能的,但微软坚信这种进步可能会发生,前提是计算机行业需要它。将数字数据写入 DNA 的过程自动化也是至关重要的。根据数周的实验显示,卡米估计向 DNA 中转存数据的速率是每秒 400 字节。微软表示,这个速度需要增加到每秒 100 兆字节。

读取数据变得越来越容易,通过使用高速测序机就可实现,包括召回文件的特定部分,类似于计算机上的随机存取存储器。微软认为,如果 DNA 阅读获得两倍改进,就能促使该系统的效率满足商业用途。由于写入和检索数据到 DNA 中非常缓慢,任何早期使用的技术将仅限于特殊情况。这可能是因为需要存档的数据存在法律或监管原因,如警察机构的 CAM 视频或医疗记录。

微软目前正与位于旧金山的 DNA 制造商 Twist Bioscience 合作,后者是新成立的公司,致力于提高 DNA 产量。除 Twist Bioscience 之外,其他类似公司还包括 DNAScript、Nuclera Nucleics、Evonetix、Molecular Assemblies、Catalog DNA、Helixworks 以及从 Oxford Nanopore 剥离出来的 Genome Foundry。

有些初创公司正追求令人兴奋的愿景,即用一种使用酶的 DNA 代替 40 年的化学反应过程,就像我们自己的身体那样。Technicolor Research 的科学主管让·伯洛特(Jean Bolot)说:“我相信今年会看到结果。”他的公司始终在与电影公司讨论如何用 DNA 存储。他说,1951 年之前的半数电影因为存储在电影胶片上而丢失。现在有了新的格式,如高清视频和虚拟现实,正在扩大工作室保存这些作品的能力。

日尔诺夫表示,计算机芯片制造商非常看重 DNA 存储技术,因为传统媒介(如磁带或硬盘)存储数据总是存在物理限制。日尔诺夫所在的机构由微软、英特尔以及其他机构资助,他们正进行应用研究,并从 2013 开始开始瞄准 DNA。他说,认为 DNA 太“软”的半导体专家们惊讶地发现,它比硅器件长 100 到 1000 倍。这种分子非常稳定,经常可以从猛犸象骨头和远古人类遗骸中提取到。

但其最重要的特征是高密度性。DNA 可以在 1 立方毫米的片段上容纳 100 亿亿字节信息。日尔诺夫说“密度才是最重要的”。微软研究院发言人表示,该公司目前无法确认“产品计划的具体细节”。在公司内部,DNA 存储的想法显然得到许多人支持,但尚未被普遍接受。卡米说:“我们内部的人相信我们,但支持磁带存储的人还存在怀疑。”

除了质密耐用外,DNA 存储还有其他不被经常提到优势,即与人类物种的极端相关性。想想那些你已经无法读取的旧软盘或难以辨认出象形文字的粘土片。与这些媒介不同的是,DNA 永远不会过时。卡米表示:“只要我们依然是人类,我们永远都能读取 DNA。”

发表评论: