引言
看过电影《蜘蛛侠》都会记住一句台词
“能力越大,责任越大”
男主角因为基因突变由弱小变强大
虽然是虚构的故事
但是人们对于身体的深度发掘
确实一直在进行
当今科技的发展
人们通过基因的研究
虽说没有向科幻片表现的那么神奇
但是通过基因检查第一时间查找
人类的一些疾病
目前取得了巨大的进展
翻译基因组研究院(TGen) 就是针对神经母细胞瘤试验的下一代基因组测序技术,这些测序技术产生了大量的数据,为了及时处理这些信息,TGen 需要构建一个新的 HPC 集群。
对于数据存储,TGen 构建了一个多层次解决方案,它结合了 Dell Fluid Data架构中的多种技术。“我们将拥有基于Dell 的文件系统,支持高速的并行文件访问,”Lowey 解释说。“Dell Compellent 存储将支持更多传统应用程序,如 Microsoft SQL Server 数据库和实验室的文件共享。最后,我们期望利用 Dell DX Object Storage Platform 进行数据归档。我们对 Dell DX 平台感到很兴奋,因为每 TB 的成本使得我们可以经济实惠地存储大量的数据,将数据量扩展到 PB 级,并且,平台将元数据与数据本身一起存储,这样的方式将使我们能够利用高级工具来挖掘我们庞大的数据集。
此性能提高对患者可能是生死攸关的。“我们采取分而治之的方法来处理数据,”Corneveaux 说。“我们可能会将 1 个 TB 分割成 1,000 个不同的作业,让它们在Dell 集群上分开运行,最后将它们全部重新合并在一起。将处理一个基因组的时间缩短了几天,甚至几周。我们在和可能 5 岁前就会死亡的患者打交道,所以几天也极为重要。如果我们能够帮助医生将正确的药物开给患者,我们就可以帮助让这种疾病好转。如果没有我们在这里已经建立的架构,这将是完全不可能的。”
此外,HPC 集群让 TGen 能够应对新的数据分析挑战。“我们现在可以解决更大的问题,”TGen 的神经基因组学助理教授 Matt Huentelman 说。“对于患有恶性癌症的病人来说,更重要的是,我们可以克服具有高时效要求的问题。在过去,要求即时结果的问题是禁地。我们有一条用于分析数据的路径,但我们知道结果不可能及时返回来给予帮助。现在我们可以深入探究当天就需要回答的问题。”
TGen 使用在基于 VMware 的虚拟平台上运行的 Dell OpenManage 来管理Dell 刀片服务器。“对我们的多台刀片服务器实现单点管理,这大大简化了管理工作,”Lowey 说。“一个人就可以轻松管理我们的 800 个核心,而在此之前,我们将需要至少两个人来做同样的工作。”
TGen 和 Dell 正在开发一个基于云的协作系统来促进这种互动。“该项目的目标是实现长期对象存储、站点之间的快速数据传输,以及从患者到生物信息科学家、试验管理人员的透明,”知识计算架构师 Preston Lee 说。
“Dell 与我们并肩合作来交付解决方案,”Mousses 说。“有一个愿意挽起袖子帮助我们解决一些最棘手的 IT 问题的合作伙伴在身边,是非常难能可贵的。”
Lowey 补充说:“Dell的工程师和架构师已经反复证明了他们是一群最聪明的技术人才。不管我有什么问题,每当我致电 Dell 时,我都相信自己会得到一个满意的答复。当我们提出问题时,Dell 支持服务人员总是会迅速而有效地予以答复,并且 Dell 卓越的HPC技术和整体方案正在帮助我们构建一个十分高效且易于管理的系统。”
小结
可以看到,戴尔端到端解决方案不仅让基因组研究院如虎添翼。同时因为戴尔本身基因的不断强大,也让戴尔在帮助用户实现价值的能力越来越强。正是印证了那句话“能力越大、责任越大”。