去年11月11日,也就是我们俗称的“双十一”当天,淘宝集市、淘宝商城天猫联手创造了交易额达191亿的销售神话。然而,即便是这种神话也还不足以成为留传至今的佳话,其中最为重要的原因就是支撑电子商务的后台IT系统在“双十一 ”抢购热潮中出现了不少弊端。
一般来说,电子商务网站对于IT系统的依赖程度不亚于其他任何系统部门。电子商务网站的IT系统包括电子商务订单在线交易、后台管理,供应链管理、物流管理和产品数据库、客服系统等等,都需要有一个高可靠性、高性能并具有良好弹性扩展的IT系统的良好支撑。
而相比日常的电子商务交易,在“双十一”这种特殊的购物期间,IT系统往往会面临来自不可预测的海量用户因高并发访问带来的巨大考验。不可预知、突发性的高并发访问往往容易导致服务器过载、在线交易系统反应迟滞甚至瘫痪。
双十一购物狂欢,但背后的IT系统其实往往扮演着更为重要的作用(相比平日)。在高密度,高效率的电子商务运营中,没有IT系统几乎寸步难行。这几年电子商务发展迅猛,为了支撑电商的迅猛发展,IT系统渗入到业务的细节越来越深,从行业情报分析,引流广告投放,消费者接待,促销规则设定,订单处理,发货速度,会员营销,甚至员工的绩效考核,都依赖于系统的支撑。更重要的是这些系统内数据关联融通,会给企业更多的数据挖掘的机会,从而指导业务,进行决策分析。
我们将这种基于电商后端的IT系统,可以将它们抽象为整个电商的基础架构。这套基础架构涵盖软硬件和涉及到雇员、客户和商家的电商服务相关数据内容。下面,我们首先为大家介绍电商基础架构下,其主要衡量的指标和关键要素。
#p#
大家都知道,电子商务和传统商务最大的区别就是“电子化”,而这种电子化的背后,其实主要依赖于当前的IT技术和产品。这几年电商发展迅猛,IT系统渗透到电商各分支业务越来越细致、深入。从广告投放、促销规则、产品陈列、订单处理、会员管理甚至员工绩效考核、客服系统等等,都与IT有着紧密的关系。对于电商来说,作为支撑其IT架构的核心之一——服务器,在支撑这些业务系统方面有什么不同?在涉及在线交易的哪些环节,对服务器的考验最为苛刻?
在企业上网应用及实施电子商务的过程中,服务器作为网络的节点,存储、处理网络上80%的数据、信息,因此也被称为网络的灵魂。网络终端设备如家庭、企业中的微机上网,获取资讯,与外界沟通、娱乐等,必须经过服务器,因此也可以说是服务器在“组织”和“领导”这些设备。而在电商领域,其基础架构中的服务器不仅要有传统服务器在IT系统中所具有的高可靠性、高可用性、高扩展性和可维护性以外,还需要特别注重电商平台承载的网络流量、负载量、灵活性以及其他相关功能。鉴于高可靠性、高可用性、高可维护性、高扩展,我们在相关的文章中提及多次,这里我们主要为大家介绍更能体现电商应用特点的流量、负载、灵活性等要素。
流量
也就是指用户网站的访问数量(即一个月内允许用户网站被调用数据的总和),和服务器托管不同的,电商往往都有自己独立的数据中心。这种情况下,其对于“双十一”期间的高并发访问请求,往往要能最大化地呈现其潜能。对此,采用高性能服务器和更大网络带宽,并根据访问人数和网络流量的监控,来实现实时、动态的访问请求优化,这方面往往对服务器的性能、网络带宽、编程语言和数据库的效率有着较高要求。
负载
它的重要性要远远高于空间容量,虽然虚拟主机业务应用的前提是建立在多个用户共同分享一台独立服务器资源的基础上实现的,但是商家用户在进驻电商平台时候,其很多产品数据、销售数据都是寄存在电商服务器平台上的,与其他商家共享服务器资源。但如果共享过多的话,会容易引起服务器超量负载,导致服务器的稳定性变差,进而影响到服务器的整体性能。对于此类负载量过载的问题,通常可以采用负载均衡的方案来实现。
比如一种廉价有效透明的方法以扩展现有网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的来实现的,在DNS中为多个地址配置同一个名字,因而查询这个名字的客户机将得到其中一个地址,从而使得不同的客户访问不同的服务器,达到负载均衡的目的。关于更多负载均衡的相关话题,可以参考《灵活调配更高效 析服务器负载均衡技术》
灵活性
灵活性分两方面,一方面是指现有的服务器平台能否支撑不同的操作系统平台,尤其是在不额外增加预算开支的情况下,是否可以满足不同工作负载对于系统平台切换、容量递增的需求;另一方面是指现有的服务器平台能否很好地兼容、支持平台的平滑升级。对于目前应用较为广泛的x86架构来说,其灵活性整体会比其他架构的服务器灵活得多。
相关功能
相关功能主要是由于电商在后续发展过程中,开发出的新的模块功能,会对底层的基础设施提出更高的要求,有些要求会特别具有针对性。比如电商开发一套基于Hadoop大数据的数据挖掘和用户行为分析系统,该系统会结合现有的用户数据库和交易数据进行海量、深入的数据查询、汇总、统计、分析,并基于某种标量来对这些数据进行分类并呈现可视化的结果。这些都会对数据库系统尤其是服务器节点和存储节点之间的I/O提出更高要求,这些要求相比原有的服务器承载的业务量,会凸显出对IO、网络带宽的特殊需求。
#p#
前面我们介绍了,电商服务器需要特别注重稳定性、性能、扩展性和可维护性性,同时还需要能满足对于负载、灵活部署和行业属性的需求。因此,接下来我们将探讨电商服务器的部署和设计的一些原则和事项。
电商服务器通常会根据子系统而对其进行分类设计。通常来说,电商服务器包括有下载服务器、Web服务器、数据库服务器、素材处理服务器、缓存服务器等。WEB服务器集群系统与下载服务器系统分离,可以利用集群的形式解决单台服务器处理能力有限的问题,随着机器数量的增加,群集系统的WEB处理能力可以线性增长。同时具有解决单点故障的容灾能力,某台服务器的故障不会影响系统的运行,增加了系统的高可用性。
对于数据库服务器来说,可以采用双机热备的方案来解决数据库服务器的性能和高可用性方面的问题。条件成熟的可以考虑配置光纤存储设备和全闪存阵列解决系统的磁盘I/O性能问题,并以磁盘阵列的方式进行对数据的保护。当然了,为了确保各大服务器之间的高可用性和高数据传输,可对服务器网络端口和交换机网络设备同时进行冗余设计,并引入专线网络带宽,满足各大服务器和存储、服务器、交换机等设备之间网络连接的需要。
软件层面,尤其是在服务器操作系统方面,目前主流的还是基于Linux的各大发行版,以及Windows Server 2012等系统。如果是基于非x86的服务器(比如IBM的RISC服务器Power系列产品),还可以选择基于Unix变种的各大类型操作系统。
值得关注的是,目前的SDX趋势越来越明显,对于这种具有周期性变化的“双十一”促销,其带来的海量用户和对电商系统的压力考验,与其事先对硬件、软件架构分层部署和设计,不如将现有的IT基础设施以分布式计算、融合价格、工作负载为导向的方式来设计。目前来说,可探讨的一般考虑软件定义网络、存储、数据中心等形式,进而通过软件定义和优化的方式来呈现对于高并发访问、在线订单处理等一系列的业务应用。
#p#
对于电商用户而言,服务器在承载“双十一”狂欢购物潮中发挥的功效主要体现在可用性、响应时间和弹性扩展方面。对于可用性,主要体现在服务器要具有高可靠性、高稳定性,对于电商平台来说主要体现在应用支撑、网站访问和在线交易等环节。而DNS无法解析、连接超时、响应超时、重定向次数过多、服务器无响应等等,都是电商平台后端服务器系统面临的常见故障类型。
响应时间则体现在客户端发出访问请求直至收到最后响应的时间跨度,它不仅与服务器可用性有关,也与整个IT基础设施架构部署和网络带宽环境息息相关。
以上所谈及的响应时间和可用性,还不能完全满足不可预测的高并发访问带来的海量业务承载的需求。这就要求电商平台要能具备弹性扩展的功能和特性,支持根据业务和访问情况作出资源的弹性扩张。
具体落地实施方面,本文将根据以上说提的电商服务器在部署和业务支撑方面的要求,为大家分析几款具有代表性意义的服务器,这些产品相比其他同类产品来说,不仅拥有较高的可靠性、性能、和可维护性,而且更为重要的是,它们具有更为良好的模块扩展、部件定制化、性能优化的特点。接下来,将为大家介绍来自华为的Tecal RH5885 V2高性能高可靠服务器和戴尔的PowerEdge R910高端四路机架服务器。
选择华为RH5885 V2的原因何在?它不仅能满足电商系统对于高性能、高扩展性、高稳定性的需求,同时也支持定制化模块和应用优化,提供有PCIe SSD Tecal ES3000,可有效避免磁盘I/O瓶颈。此外,它也有基于大容量缓存(带电和不带电可选)的阵列控制器,可有效帮助数据的管理、备份,保护数据提升性能。
选择戴尔R910的原因, 一方面是因为虚拟化、整合、统一结构、联网和存储升级推动了对更坚固的网络通道的需求,而服务器必须能够提供连接来带动这一对带宽的需求。 PowerEdge R910可通过采用2x10 GbB LOM选项来满足这些需求,可避免由于采用riser卡的10 Gb功能带来可扩展性限制。具体的,我们将在接下来的文章中为大家详细讲解。
#p#
华为Tecal RH5885 V2高性能高可靠服务器
RH5885 V2从发布以来备受市场关注。今年在天津举办的863项目成果展上,国家科技部部长万钢对基于“RISC高端容错计算机”课题成果孵化出的这款4/8路服务器大为赞赏,尤其对其中的热插拔技术、芯片互联、“黑匣子”故障记录、PCIe热插拔、免开箱维护等创新技术尤为关注。
此外,在今年的CeBIT 2013展会上,我们也看到了其经过SAP HANA验证,成为大数据一体机,并提供应用预集成和软硬件一体机化管理。简单说来,华为这款Tecal RH 5885 V2服务器拥有35项容错技术,支持英特尔至强E7-4800系列处理器,提供多达9个PCI-E插槽和64个内存插槽(最大2TB DDR3内存扩展)。板载4个GE接口,集成BMC管理,支持8个2.5寸SAS/SATA/SSD硬盘。通过华为自研QPI线缆,可扩展至八路服务器。提供类似飞机“黑匣子”的故障记录功能,针对意外宕机快速定位问题,排除隐患,保障系统健康运行。华为RH5885 V2绝大部分部件采用模块化设计,简化了维护,减少了因为升级和更换部件造成的系统不可用时间。
戴尔PowerEdge R910高可靠性高扩展服务器
戴尔R910服务器也是基于至强E7-4800平台,该产品设计之初就以高可靠性、高扩展为目标。它合并了英特尔高级可靠性、可用性和可维护性(RAS)功能等特性,并具备远程IDRAC6连接和嵌入式诊断功能。 双内置SD模块可提供虚拟机管理程序级别的故障转移,这是一项根据戴尔客户的直接反馈而设计的可靠性特性。
该产品充分体现了戴尔帮助用户简化日常操作、充分利用基础架构和简化部署,帮助降低整体拥有成本的思想。该产品可以结合戴尔开放的生命周期管理器,帮助客户实施有效的部署流程和全面的服务器管理。