个体基因组数据存储又有新技术
2017年08月31日 来源:科技日报
以色列基因网(Geneformics)公司日前表示,其研发的工具和基础设施,可使基因组数据既能被压缩存储,又能十分容易地解压和提取。
绘制人体基因组图谱的关键不仅在于了解基因之间如何相互作用,还要能将绘图技术应用于个体,实现个性化医疗。然而,每个个体基因组的原始数据可达200至300千兆字节,而分析后的基因组数据却可能高达一个太字节。基因网公司CEO拉斐尔·菲特伯格认为,要想建立基因库,仅数据体积就会是巨大的障碍。
基因网公司最初以魏茨曼科学研究院计算生物学家伊兰·西格尔的数据压缩产品为基础。拉斐尔认为,数据压缩应以无损、透明的方式隐藏数据。从压缩和解压角度来讲,他们有能力以很高的速度解压数据,且实际上能以无损的形式将数据传输回所有程序中,这就使解压后的数据可位对位地与未压缩的原始文件呈现相同结果。
基因网公司最近公布了其首个完全基于云计算的新产品——Geneformics D。公司技术官艾瑞克·克赛特表示,新产品的操作原理仍是商业机密,这是个新兴行业,迄今还没有真正的压缩标准。“我们希望能在时机成熟时建立标准。那时,我们将会拥有影响数据存储空间的技术、知识产权以及市场影响力。”