我们都知道,大数据通常与数据中心不断增长的结构和非结构化工作负载相关。而网络负责处理传输到服务器、存储阵列和云服务的数据流量。服务器之间的密集型I/O吞吐量常常发生在数据中心或者广域网之间。伴随着大数据的来临和应用的不断增长,新的问题将会出现。由于传统的IT设施在当初设计的时候,没有考虑到大数据的情形,瓶颈问题将变得更加普遍,尤其是在存储一端,问题更加明显。
这样一来,IT业务中就会出现一种新的分支:面向新一代数据中心的数据管理。下面,我们就给大家介绍大流量阻碍数据中心发展的几大缘由:
一、大流量是一种新型工作负载
大流量是指横跨广域网连接的数据中心内服务器间的通信流量,它不同于通常情况下的大数据工作负载——也就是用户对机器或者机器之间的通信流量。
二、传统IT不能胜任大流量要求
导致大流量出现的主要原因是IT过去几年所形成的优势:虚拟化的广泛部署和扩展系统;远程实时迁移;数据复制和备份;专门针对基于WAN分布式系统而编写的***应用,比如Hadoop, MapReduce, MongoDB和Cassandra。
#p# 三、大流量增长没有止境
大流量增长没有具体的指标可供参考,它的增长将永无止境。Forrester Research预测说,在未来几年,由机器运行产生的应用数据将达到50%的年增长。而且,存储巨头EMC官方发布过一份报告,认为在2009至2020年间,将实现44倍数据扩容,这意味着数据带来的流量增长将是一个巨大挑战。
四、大流量对IT人员影响巨大
不断增长的大流量将对大型组织机构的影响最为深远,而在其中,尤以生产一线的工人、CIO、CTO、存储管理员、灾备和服务器工作人员、网络管理员和数据中心管理员等受影响***。
五、数据中心和管理面临考验
日益增长的大流量将会给企业的数据中心及其管理带来严峻考验,因为它们需要解决传统和当前二者不同情形的数据传输过程中的问题。而且,还需要确保系统中基本的数据存储和访问功能正常运行。这些,将直接影响到业务的连续性、灾备和关键业务运行。
六、如何优化现有的系统
可能的解决办法包括扩充现有网络带宽、重复数据删除、压缩和精简配置软件。数据中心也考验使用传统的WAN优化软件,使用应用加速解决方案,或者针对这种新型的大流量特点开发新技术。
#p# 七、解决方案面临的现实问题
某些解决方案在某些情况下不可能得以执行。比如,如果数据中心彼此相隔遥远,有效的优化方案实际效果可能并不明显;或者,服务商不能为站点之间提供足够的带宽。
八、网络优化的相关问题
当企业对其网络的带宽和安全性进行优化,CIO和CTO需要事先知道对网络和数据中心带来何种影响。比如,在旧有系统中引人新软件,可能会出现不能与其他旧软件或者上一代版本软件实现兼容的问题,而这容易引发系统崩溃。
九、优化的常规指南
企业该对如何界定数据,以确保优化方案能在IT运营中无缝执行。考虑的因素应该包括:部署的难易程度、完全透明的网络渗透、与现有系统的兼容以及低功耗。
十、大数据未来情形
未来数据将不断增长,数据中心静态运算和存储资源将被传送到统一的资源池中,以省时省力的经济方式充分利用虚拟化和云服务,从而减轻内部数据中心的工作负载。