随着数据中心近年来的飞速发展,业界人士也正在不遗余力的拓展新的发展领域,面对数据中心运行需要不断地电力、更多的存储设备、更多的计算能力,迫切的需要使用一种新的运行模式。
在没有更多资金支持的情况下,依旧能让各系统高效运作,就需要对数据中心各个领域进行优化,包括硬件、软件的优化,以及规定、流程的优化。
数据中心现状:
虽然云计算,虚拟化和托管数据中心是受欢迎的,但大多数组织至少在内部至少具有部分计算能力。。根据451 Research对1200名IT专业人士进行的调查结果显示,有83%的北美企业拥有自己的数据中心。只有17%的企业将所有的IT运营迁移到云端,而49%的企业使用云或数据中心租赁集成到其自身数据中心业务的混合模式。
同样的研究表明,大多数数据中心的预算还是保持稳定,没有太大变化。尽管受到严格监管,医疗保健和金融部门在数据中心的运营,依旧增加投资费用。在不断增长的企业中,大多数企业都在进行升级或改造,以支持数据中心优化,并支持增加机架的密度。
与此同时,服务器密度也有所增加。自上世纪90年代中期,当时IBM AS / 400微型计算机是很普遍的,而如许多数据中心都已经是高密,服务器密度比从前增加84倍。电力需求在使用许多传统计算机时大约是每平方英尺100瓦,目前使用刀片服务器时电力需求增加到大约每平方英尺600瓦。随着服务器密度的增加和数据中心可用空间的减少,任何的收益都可能被额外的空气处理和电力设备(包括不间断电源和发电机)所占用。事实上,据CIO杂志报道称,预计到2020年数据中心的能源使用将增加81%。
合同和流程
为在这样的环境中运营,就要从多种来源实现节约。例如,自然资源保护委员会(Natural Resources Defense Council)建议数据中心“审查其内部组织结构及外部合同安排,并确保激励机制能够为效率最佳实践提供财务奖励。”
数据中心优化专家TeamQuest的负责人John Miecielica,建议管理人员在评估合同关系时要注意风险和效率。外部协议涉及风险,例如可以确保您有能力满足服务等级协议。要对它们进行定期检查,以确保其保持高效运行。
例如,2011年Lady Gaga在亚马逊网站上推广她的单曲时,导致服务器崩溃;在亚马逊增容之前,推广不得不停止。而另一个例子是2013年,Healthcare.gov上线时,该系统持续瘫痪6个月。
合理精简
事实上,优化数据中心项目中:识别并停止未使用的服务器,这对运维人员而言是一项极大的挑战,与此同时,还需要对服务器进行优化配置。
虚拟化可以实现在需要的时候轻松地进行资源的调配,但同时也使得跟踪这些资源变得更加困难。其结果是因为不能确定服务器是否被使用,所以实际上并未使用的服务器可能还在运行。自然资源保护委员会的一项研究报告显示,多达30%的未使用的服务器,依旧在运行。
同样地,系统可能匹配四个CPU,但实际上只使用两个CPU。这种情况就会占用其他机器可能需要的计算容量。使环境最优化,无论是物理的还是虚拟的。“评估能力不足的风险,规定满足可能重新利用的风险和资源以避免风险。
除了适合配置合适的硬件外,Miecielica还提供咨询,仔细检查应用程序,以确保它们的写入效率。 例如,一家公司习惯升级其硬件,但发现可能会通过优化应用程序来延迟这些升级。
类似的原理也适用于存储。虽然数据删除技术(删除重复的文件)被广泛使用,但是对于中小型企业(SMEs)来说,过密的存储仍然是个问题。删除技术可以释放急需的存储空间。这是中小型企业面临的两大问题(另一个问题是安全性)之一。
全方位监控
经理们应该考虑的另一个重要任务是,通过数据中心的优化是为基础设施和云计算建立强大的监控系统。
例如,数据中心基础架构管理(DCIM)系统可以根据实际使用情况而不是制造商的规格进行管理决策。
除了监控之外,管理者还需要分析来准确预测和解决问题。 Miecielica说:“DCIM和服务器监控以及连接两者的分析功能之后,监控软件功能会非常强大。” 分析数据能够帮助运维经理看到,是从X到Y的移动能够提高效率,还是将X移动到Z更有效率。
Miecielica建议,不仅要把数据中心看作是一种优化的单个系统的集合,还要全面地研究数据中心。“系统不是孤立运行的。它们是整体综合计划的一部分。”因此,可以确定可能产生额外的数据中心优化机会的协同作用。
数据中心优化显然超越了硬件,成为全系统的活动。 提供更多的电力,更多的容量和更多的存储,而不需要更多的钱是关键。