数据管理挑战升级 数据平台走向开放

服务器 数据管理
如今,IT 部门承受着巨大的压力,它需要为企业提供能从海量可用数据中提炼出有用业务信息的有效工具。对于现代企业而言,随着数据量呈爆炸性增长,数据分析流程日益复杂,以及 IT 预算逐渐紧缩,实施有效数据存取和管理开始变得日益复杂和迫切,成本也越来越高。

如今,IT 部门承受着巨大的压力,它需要为企业提供能从海量可用数据中提炼出有用业务信息的有效工具。对于现代企业而言,随着数据量呈爆炸性增长,数据分析流程日益复杂,以及 IT 预算逐渐紧缩,实施有效数据存取和管理开始变得日益复杂和迫切,成本也越来越高。数据平台必须能将高度可扩展性、出色性能和可靠性与创新型软件特性进行融合,充分发挥***查询流程和增强型硬件的优势,同时降低总成本。

  由微软SQL Server 2008 R2 和***英特尔至强处理器组成的开放架构数据平台便是一款足以应对当今数据管理挑战的企业级解决方案。本文将从可扩展性、性能、RAS、总体拥有成本(TCO)等几方面来展示该方案如何能满足大多数要求苛刻的企业在关键任务方面的要求。

 
基于x86架构的MS SQL开放数据平台

  基于x86架构的MS SQL开放数据平台

  数据管理挑战正在不断升级

  10 年前,数据库管理员(DBA)主要关心的问题是如何优化其数据库管理系统的性能。而今天,DBA们开始注重如何实施高效的数据库管理。因为一旦管理员可以自动化任务、标准化数据格式,制定维护流程,数据库能够自行履行其存储和检索数据的职责。

  同时,随着Web 2.0 和其它技术的发展与应用,数据库需要处理的数据量也在急速增加,其中包括视频、音频文件等大容量数据,而且数据已经渗透到了日常业务运营的方方面面。因此,今天的DBA们实际上面临比10年前更加复杂的情形与挑战,主要集中在以下几点:

  一是数据量飞速增加。由于最近几年来数据更新速度日益增加,各种新技术层出不穷,以及数据使用方式不断推陈出新,企业生成的数据量也逐渐呈井喷之势。现在,各大企业都已经采用ERP、CRM等解决方案,因此每天都会产生大量数据。

  二是数据关联性增加。新技术为我们使用数据的方式开创了更多可能性。在日常业务运营中,从电子商务网站到库存管理,都需要借助数据和数据库管理系统的能力,来将数据迅速传递给需要它的应用。

  三是服务器数量激增带动成本上升。由于顺应业务增长部署了更多物理服务器,而服务器CPU等资源的利用率却出现大幅下降,从而导致企业每年都需要从 IT 预算中支出大量的管理、维护和散热成本,使得IT预算不断紧缩的企业面临更大的压力。

  四是数据挖掘与分析处理的压力加大。如果这些数据不能被实时、有效地加以利用,形成对实际业务决策有用的信息,数据增长反过来会带来负面影响。

#p# 挑战驱动创新

  上述挑战一方面给企业带来现实压力,但另一方面也带来了创新机会。那么,面向ERP、CRM等关键业务的数据密集型工作负载,需要什么样的软硬件数据管理平台呢?笔者认为,至少需要满足以下几个方面的要求:

  一是可扩展的处理能力。为管理数据密集型工作负载,将海量原始数据转化成有用的信息,并提供实时分析和查询服务,需要有非常强大的系统处理能力做支撑,以优化复杂多线程的应用性能。

  二是出色的可靠性。由于某个数据库出现故障所产生的负面效应可能会波及整个企业,影响重大,因此需要平台能确保7*24小时不间断提供服务。

  三是灵活的虚拟化性能。为减少物理服务器的数量,提高IT的灵活性,通过虚拟化实现整合的能力已经成为标配,同时还需要通过虚拟机实时迁移、灾备等功能来提高可用性。

  四是成本节省。对于许多处在激烈竞争市场环境,IT预算紧缩的企业而言,降低包括硬件采购、软件许可证、管理维护、能耗等方面的成本一直是企业追求的目标。

  基于行业标准的开放数据管理平台

  2010年,微软推出了这样一款全新数据管理平台:在英特尔至强7500服务器上部署SQL Server 2008 R2所提供的托管型自助式 BI解决方案,可以针对超大型数据集近乎实时地分析和查询复杂数据。

  据了解,使用微软自助式BI方案,最终用户可以利用面向 Excel 的 PowerPivot插件等自助式分析工具,迅速查找到所需信息,进行特定分析和建模,帮助用户近乎实时地在大型数据集上执行复杂运算,从而获得有用信息,做出更好的业务决策。管理员也同样可以借助SQL Server 2008 R2的StreamInsight技术,在不到一秒内横跨多条数据流处理大量事件,帮助企业通过历史数据挖掘和持续了解动态数据,更迅速地识别和响应新趋势。

  因此,这种方案对事务处理能力提出非常高的要求,而基于至强7500的服务器可以扩展至8个以上处理器,每个处理器可容纳8个内核,支持 16 条线程,而且还有1-2TB超大内存容量,大大降低延迟,提高数据库性能和 SQL Server 2008 R2 的能力。当然,数据密集型工作负载,对于系统的可扩展性要求也很高。比如现在的SQL Server 2008 R2可以支持多达256 颗逻辑处理器(原来是64颗处理器)和超过 64 条线程,用户还可通过 SQL Server 2008 R2将数据仓库容量从数十万亿字节到数百万亿字节。对此,至强7500和至强E7也提供了相应的扩展性,在单一系统内,***可以支持到256颗CPU,从而能够支持到最苛刻的数据密集型应用。

  在可靠性上,至强7500 系列的服务器具备 20多项全新 RAS 特性,这些特性包括处理器间动态工作负载分配、互联错误检测和恢复,以及虚拟环境中的单个虚拟机恢复等。比如,Windows Server 2008 R2 具备 的Windows 硬件错误体系结构(WHEA)支持至强7500中的机器校验架构恢复(MCA)特性,可帮助平台在不中断操作系统应用的情况下,控制和恢复内存与高速缓存中的多位 ECC 错误——以前只有成本高昂的 RISC/UNIX 平台和大型机才具备这些功能。

  在TCO方面,X86服务器的硬件采购成本往往只有小型机的几分之一,但更重要的是,使用开放平台,有助于节省大量软件支持和许可成本。由于基于 UNIX 的软件通常按处理器内核数量而并非按插座数量计价,因此可节省成倍的成本。此外,由于微软不额外收取在线分析处理(OLAP)、数据挖掘、数据压缩、分区及其它特性的相关费用,因此相比Oracle等其他平台,在Windows Server 2008 R2 上运行 SQL Server 2008 R2的成本也更低。


#p# 另外,值得一提的是,SQL Server 2008 R2 已经支持 Hyper-V 实时迁移,允许用户在确保不停机的情况下在主机之间转移正在运行中的虚拟机。SQL Server 2008 R2还支持Sysprep,这样一来,管理员可以更轻松地创建 SQL Server 图像,随时随地迅速将它们部署在虚拟机中。对此,企业可以通过至强7500,以20:1的整合比率更换和整合过去的单核服务器,并可在1年内通过能耗、软件、许可证和维护成本的节省收回服务器更新带来的投资。

  测试:Temenos T24银行核心软件

  下面我们进一步通过测试来了解一下,“至强7500+微软SQL Server 2008 R2”这一组合的性能表现。

  Temenos 是一家全球性的银行软件系统供应商,它的产品涵盖了零售银行、对公及代理银行、通用银行、私人银行、伊斯兰银行以及微型金融及社区银行等市场,在120个国家里为1100多家客户提供服务。Temenos T24是该公司推出的目前世界上技术水平***的银行系统软件,旨在面向24小时不间断提供服务的银行业务应用。  

  2010年7-8月,微软、Temenos和英特尔在美国华盛顿进行了一次联合测试,主要了解Temenos T24在***x86平台上性能和可扩展性方面的表现。

  测试结果表明,在至强7500服务器上,运行微软SQL 2008 R2企业版、Windows Server 2008 R2数据中心版和Temenos T24 R10零售银行系统模型,每秒可处理的交易量达到5230 TPS(来自于320个代理),在线测试达到3437 TPS,每秒***可执行14万个SQL批处理,IOPS性能是每秒7.8个收支操作,在两小时之内可执行2500万个COB帐户处理,这些结果刷新了以往的记录。

  小结:走向开放

  数据管理不再是存储-检索的过程,随着技术应用的发展,以至强为核心的X86服务器,以及微软SQL Server数据库软件也在不断改进企业处理大规模数据的方式——对海量数据进行实时分析,并向企业各级用户快速提供有用的信息。比如中国人寿业务决策平台正是如此,将分散在公司各处的海量数据快速整合在 SQL Server 2008 R2 数据仓库内,然后提供决策分析时随时调用。

  以往,专用的数据平台通常都是基于 RISC 或 SPARC 架构而构建,上面跑基于UNIX 的软件,此类平台不仅购买成本高,在申请许可证、实施维护和培训方面的成本也较高。对于注重创新和成本效率的企业来说,今天开放的数据平台提供了新的选择。但这也意味着使用专有平台的企业需要做好迁移工作——将小型机换成X86服务器,将UNIX操作系统换成Linux或Windows,将应用和数据从原有系统迁移到新的系统中来。

责任编辑:张玉 来源: it168
相关推荐

2020-11-15 23:37:06

数据管理医疗保健数据数据库

2017-09-21 08:56:50

数据管理主流

2013-10-31 09:19:42

混合云混合云数据管理Data

2023-11-02 17:48:20

大数据

2019-08-04 20:09:14

物联网数据物联网IOT

2024-09-30 08:13:58

AI数据管理平台人工智能

2016-11-04 12:46:25

2023-11-03 19:52:43

大数据

2023-04-28 07:34:35

数据管理数据资产管理

2022-03-04 14:24:20

数据管理平台大数据

2023-03-08 17:12:56

Commvault

2019-07-26 11:34:56

Veritas

2022-05-29 22:56:13

数据安全元数据

2017-01-05 18:35:57

数据管理数据治理

2023-10-31 07:06:50

运营数据管理

2019-12-06 10:29:29

云原生数据公共云

2023-01-04 09:54:02

2014-09-01 17:35:42

云智慧APM

2024-06-07 06:37:34

点赞
收藏

51CTO技术栈公众号