有些人认为,计算和I/O密集型的大数据工作负载不会偏离到云计算中,而为了安全性而保留在数据中心现有基础设施。
如今,似乎整个IT世界都可能迁移到云计算,但计算增长和I/O密集型的分析的许多新的大数据工作负载一直保持在企业的本地数据中心,而不是在云计算中,至少目前是这样。
新的网络工作负载都是围绕着移动设备、云服务、社交技术和大数据建立的,即所谓的第三平台。如IDC描述,可以迅速压倒现有的数据中心基础设施。这些工作负载具有不可预知的规模,分散的部件,并能产生、处理和储存大量的敏感数据。与此同时,公共云的成熟和成本尚未完全满足这些新的工作负载类型,尤其是大数据分析的实验组织的需求。
最近的服务器市场上的数字反映了这些动态。近年来,全球服务器市场持续增长,IDC报告称,2015年IBM公司的高端服务器业务有所下降(第四季度下降了17.2%)。总体而言,2015年服务器收入增长2.3%,达到了509亿美元,与2014年相比,单位出货量同比增加了2.9%,达到了920万台。
在成交量方面,通过超大规模的IT企业和电信运营商的投资,以支持新的工作负载的投资增长了4.9%,2015年第四季度达到了108亿美元。同时,2015年第四季度,企业在第三方平台的工作负载的新的可扩展系统的投资增长了21.1%,中端服务器市场增长达到了14亿美元。
这么多的分析工作负载仍然都在本地运行是毫不奇怪的,企业都在兜售这些第三方平台的应用程序,甚至是一些完全支持云计算的应用。
以一家基于ApacheHadoop软件的数据管理厂商Cloudera公司为例。“当我们建立应用时,我们认为主要的部署模式将是云计算。”Cloudera公司产品副总裁查尔斯•泽德万斯科说,“我们很快就明白了这个概念。”他指出,如今90%以上的企业都部署在本地运行。
为什么Cloudera公司没有放弃云计算?首先,一个云部署模型的分析立即消除了许多客户不需要移动到云计算的想法,或可能出于安全原因。
泽德万斯科说,“人们看到那些拥有大量的数据的组织,如联邦政府,金融服务行业,电信运营商等都在他们的数据中心进行了大量投资,因此不需要这种外包的能力。”
同时,这些用户会考虑采用数据中心托管服务,很多人预计Cloudera公司不仅仅主要经营Hadoop。“他们希望我们帮助托管他们的数据中心,我们有很多的任命蠕变。”他说。
利用亚马逊网络服务(AWS)并不是一个真正的选项。公共云服务处于起步阶段,只有有限的实例类型,很少有企业客户实施。因此,Cloudera公司建立和维护自己的数据中心这是一个昂贵的***。
“但此后发生了很多改变,”泽德万斯科说。现在Cloudera公司可以为大量的基础设施即服务提供商托管数据中心。无论AWS和WindowsAzure支持强大的实例类型,并对数据处理的工作量要求苛刻的。也有更多的数据和应用在云计算进行分析。
没有正确的方法托管工作负载
企业战略集团的高级分析师尼克•罗达说,尽管云计算具有灵活性,企业正在考虑为他们的大数据分析工作负载主要采和本地基础设施。
在一项调查中,ESG发现当涉及到新的大数据基础设施时,18%的受访者表示,他们正计划使用专用的(非虚拟化)服务器来分析工作负载;30%的受访者正在寻找传统的虚拟化基础设施;而21%的受访者正在考虑采用Oracle和Teradatata公司的专门的分析设备。只有21%的受访者正在考虑公共云,而另外10%正的受访者在考虑公共云/私有云的混合部署。“还有各种各样的部署选项在那里,人们仍在尝试。”罗达说。
通常情况下,围绕大数据服务器的决定最终是基于超出工作负荷需要的其他东西。有时候人们所思考的是,我们一直都是这么做的,于是人们坚持他们的意见或认为的***实践。”罗达说,“也就是说,分析应用程序比其他工作负载有不同的要求,这有很多的改变,也有一些人说,他们现有的基础设施是完全符合他们的新的需求。”
他说,任何新的基础设施应该评估其能力可以支持大数据的属性,例如:
•可扩展性。
•独立于位置适当的性能。
•成本效益。假设公共云总是更便宜的,这并不一定适用于分析工作负载。
进入数据生活
对于大数据工作负载,最重要的是在这里被处理生活中的数据。“如果你的社交平台是基于云计算的,那么它对你的基于云计算的分析平台是意义的。”罗达说。如果数据在内部已经存在,在数据中心服务器上处理它,以尽量减少网络费用。这也加快了访问时间和分析过程。
提供了很好的数据存取时间尤为重要,因为在使用分析数据库的员工大幅增加,罗达说。只有少数人,如商业分析师,数据科学家,以及一些高管需要这些数据库,目前在一些组织高达40%的员工依赖于这些数据。例如卡车司机可以查看运输的优化路径,或销售代表查看更新库存和定价等。
事实上,数据的位置是许多分析供应商的指南针。“无论你在哪里创建的数据,数据就会保留在那里,因为移动这些数据是很困难的。”泽德万斯科说。
从传统仓储企业到服务提供商这些不同行业厂商,希望吸引企业处理其大数据工作负载。