微信宕机引发“悲剧” IT基础架构深思

服务器
作为微信、微博等应用的支持中心,数据中心的基础架构只有在发生问题的时候才会被人们关注。此次微信断网虽然看似偶然的一件事,其实也能凸显了腾讯对于数据中新的网络方面的管理不足,如果在电缆埋放的路上有明显的提示牌,可能就能避免发生如今的宕机时间。

“微信是不是挂了?”这是很多人在7月22日早上见面后互问的最多的一句话。也是当天新浪微博出现频率最高的一个词。可以说一个APP的故障居然慌了整个世界,可见微信如今真的已经成为我们生活里不可或缺的一部分了。

 

[[81363]]

 

对于此次微信挂掉的事情,网上可谓刮起了一股吐槽风,诸如“腾讯小编,网友喊你们回家修微信!”、“我和我的小伙伴们失散了”等等,还有网友更是调侃说:“是不是让网友感受一下微信的重要性,好为将来收费做铺垫啊?”在众多吐槽的网友中,也不乏各界的知名人士。然而到底是什么原因造成的微信挂掉呢?

 

微信宕机引发“悲剧” 服务器架构深思

腾讯微博团队

在下午2:23分钟,腾讯微信团队在其官方微博上确认此次故障的原因是因市政道路建设导致网络光缆被挖断,从而使部分用户出现了无法正常使用微信功能的情况。一个小小的失误导致了微信大面积功能瘫痪,影响了众多网友的沟通问题,让疯狂的网友挂出下面的恶搞图片来讽刺此次微信带来的影响!

 

[[81364]]

网友调侃

虽然,大部分网友对此次微信宕机的态度是宽容、理解的,但是回首以往,无论是微信的光缆问题,还是12306网站的高并发问题,都是数据中心的IT基础架构出现了问题,可以说,如今的应用业务对传统的IT基础架构提出了新挑战。在如今,人们对事件的敏感度越来越高,一个小失误甚至会引起整个公司的业务发展。那么企业该如何改变数据中心的架构来适应时代的发展呢?

#p#

作为微信、微博等应用的支持中心,数据中心的基础架构只有在发生问题的时候才会被人们关注。此次微信断网虽然看似偶然的一件事,其实也能凸显了腾讯对于数据中新的网络方面的管理不足,如果在电缆埋放的路上有明显的提示牌,可能就能避免发生如今的宕机时间。

数据中心稳定运行离不开人们对其日常的维护,数据中心的设备不可能一成不变,层出不穷的新应用程序对硬件不断的提出新的要求。同时,各种突发事件考验着数据中心应对突发情况的能力。那么我们应从哪几方面对数据中心的能力进行评判呢?

 

[[81365]]
现代数据中心

a、首先要做的就是维护人员要预估企业IT设备的可控性。简单来说就是对数据中心的设备是否能够可控的业务服务,如增加新的应用程序是否需要增加新的服务器和存储设备。如果数据中心的承载能力已经达到极限,再添加新的应用程序很可能造成数据中心的瘫痪,从而影响所有的业务正常运存。

b、数据中心是否能够支持IT业务系统的高峰稳定运行。不同的业务类型的访问的高峰时间会有不同,企业要确保在业务高峰来临的时候,数据中心要有能够满足高峰业务稳定运行的能力。如,12306网站的瘫痪就是因为其在人们春节回家高峰时段的高频繁访问造成的IT业务系统崩溃。

c、原有的软件系统、监控系统以及维护人员是否能够及时发现的问题并且能够解决问题。及时发现问题、解决问题也是考验一个数据中心的能力的方面。例如,微信出现问题到解决问题,历时半天多的时间,虽然看起来时间并不很长,但是从发现问题到解决问题,整个解决过程拖沓,并不让网友满意。

d、确保业务可用的情况下,对能源造成的浪费最低。随着web 2.0时代的来临,人们对数据中心的衡量标准也开始改变,由原来的高性能向低功耗、高密度、减少TCO等方面转移。而能耗已经成为衡量一个数据中心的重要指标。

文章总结:数据中心随着移动计算时代的来临越来越重要,如今的很多功能都需要由数据中心来提供支持,而数据中心的运行情况直接影响到人们的应用感受。例如,如果微信频繁出现宕机或者网络断网的情况,那么可能会减少很多的用户。

 

数据中心的性能与多方面有关,服务器、存储、网络设备等都有很大关系。我们就需要对这些产品设备进行实时的检查来决定是否需要更换。下面请看我们对数据中心设备的作用进行逐一分析。

#p#

数据中心的动力之源——服务器

如果说处理器是服务器的心脏,那么服务器在这整个数据中心也起到同样的作用,关系到是否能够很好的支持ERP、CRM以及Web应用等业务的稳定运行。你必须为数据中心选择适合的服务器,在英特尔标准服务器、刀片服务器以及一些新兴的ARM服务器之间进行选择。

 

[[81366]]
服务器

在早期的数据中心中,人们更加重视服务器的规范性、实用性、安全性和可扩展性。但是随着web 2.0时代的来临,人们更加注重绿色环保,人们开始对高效率、低功耗、节能等方面的需求日益增强,同时还要考虑数据中心的不同来采用不同的组装策略。

数据中心在早期以机架式和刀片服务器为首选服务器,这主要是为了节省空间,追求高密度计算、业务连续行和高可用性等需求。但随着ARM进入服务器领域,人们认为低功耗、高密度、低TCO的ARM处理器将是数据中心服务器未来发展的主流方向。尤其是在互联网企业,定制化服务器更是深入企业人心。

大数据时代的数据仓库——存储

在数据中心,存储设备往往是人们忽视的一个部分。人们再以往更加重视的反而是性能和网络传输效率。但是随着大数据时代的来临,数据价值被人们逐渐重视。而且如今,数据呈现爆炸式增长,甚至影响着数据中心的整个存取过程。决定着整个数据中心的生态效率。

 

[[81367]]
存储设备

如今,数据增长迅速,日益繁多的应用系统在不断吃掉紧张的CPU和内存资源的同时也对存储系统提出了更多的要求。如今的数据不断吞噬着后端存储资源,相比于在摩尔定律下性能不在提升的处理器,存储的更新换代已经迫在眉睫。

 

在存储市场,闪存技术的突飞猛进被认为是未来取代传统硬盘的最佳介质。但目前数据中心中应用最多的还依然是硬盘。在高端存储领域,值得欣慰的是看到国产存储厂商崛起,以华为为领导的诸多国内存储厂商也逐渐拥有了非常好的数据中心解决方案。

#p#

数据中心的奇经八脉——网络

在数据中心中,我们时常会看到遍布排满的网线,可以说,网络是整个数据中心的奇经八脉。如果服务器是心脏,那么网络则是将这些分散的服务器连接在一起的脉络。其承担着各种任务的传输和运输。

 

[[81368]]
数据中心布线

在武侠故事中,我们同样会看到很多人打通了任督二脉而获得了绝世武功。数据中心的网络设备同样需要不断的进行技术革新,而且混乱的布线非常容易是数据中心陷入不稳定的境地,严重影响数据中心的稳定性。只有整体网络架构的升级,才能够使得整个数据中心的性能提升。

目前数据中心网络应用从2M,4M,8M到16M等不断提升,布线产品的在SAN网络中从原先的普通62.5/125u,50/125u的光缆布线,随着带宽的提升,将更广泛的应用50/125uOM3300采用VCSEL激光优化的万兆光纤。设备的更新不仅能为数据中心带来高效的传出效能,而且还保证传输中的稳定。

数据中心的综合规划——管理

如何将数据中心的性能最大化,如何让硬件、网络、软件等很好的结合起来发挥最大的作用用,这是很多数据中心都要面临的问题。数据中心的管理需要考虑多方面因素,从而为数据中心的问题运行提供最佳工具。

 

[[81369]]
数据中心管理

数据中心的管理需要我们非常重视,让用户能够对应用和性能有个更清晰的了解,通过管理,让数据中心发挥最大的性能。同时,数据中心还要面临移动计算时代新的挑战,移动设备,网络安全等方面都需要加入管理战略。

当然,除了一些管理工具外,我们还要对数据中心的软件架构、电源等多方面的管理重视,保证数据中心设备的性能最强,以满足用户的需求是数据中心每时每刻都要考虑的问题。

 

文章总结:数据中心的服务器、存储、网络以及工具管理等方面的信息都关系到整个数据中心的性能,其中的每个环节我们都不能忽视。可以说数据中心的性能关系非常重要,于是为了更好提供数据中心的整体性能,软件定义数据中心技术近年被大家提起,下面就让我们来看这个技术对数据中心有什么帮助。

#p#

在英特尔摩尔定律的促进下,如今的产品硬件已经发展到了一个非常高的高度。而且硬件设备越来越朝着统一的规范化发展,这使得越来越多的厂商的产品可以兼容,共同在一个架构里实现更大的功能。而软件定于数据就是在硬件发展到一定程度的情况下由VMware提出的,为了更好的提升数据中心的整体性能。

在软件定义的数据中心中,所有的资源——包括服务器、存储、网络和安全等方面都实现了虚拟化和自动化。完全虚拟化和自动化的数据中心可以作为云解决方案的基础,不管是公有云、私有云还是混合云。从而实现支持灵活、弹性、高效和可靠IT服务的云计算环境。软件定义数据中心主要包括以下三方面的改变:

 

[[81370]]
IT基础架构新挑战

计算模式的改变:

由于数据中心的发展,以前需要高性能才能够解决的问题,如今可以通过数据中心来解决问题。以前一个应用只能运行到一个程序上,而如今可以通过数据中心来解决,将一个应用运行在多个平台。每一个节点都是处理器,形成了一个巨大的计算结构。改变了人们对高性能处理器的追求。

存储模式的改变:

同样,软件定义的存储已经被提出了多年,其是软件定义数据中心的一个组成部分。由于在如今的存储类型上发生了很大的变化,非结构化数据大量出现,这就需要存储技术跟随变化。传统的存储会导致存储节点越来越大,并不适合非结构化的数据处理,而多节点的处理存储方式则更适合非结构化的数据存储。

网络模式的改变:

软件定义网络(SDN)是目前业界提出的一个新的发展思路。相比于传统的网络,软件定义的网络更强调把控制层和数据存储分开,这样用户依然可以保持传统的网络设备,于是每次升级或调整的时候只需要调整网络控制层就可以了,而没有必要调整非数据层,以免数据中心的业务受到影响。

 

文章总结:云计算与大数据的来临,必然会对IT基础架构形成强烈的冲击,尤其是对目前的互联网公司,接受的挑战也将更多。微信宕机时间虽然看似意外,其实警示我们对IT基础架构的管理不足。在未来,互联网应用的暴增将对现在的基础架构提出更多的挑战,而着很可能影响公司业务的发展。软件定义数据中心是目前人们认为解决未来基础架构问题的关键!可喜的是,目前,我们可以看到数据中心在计算、存储、网络等架构方面的改变,新的IT基础架构新的革命时代就要来临。

责任编辑:路途 来源: zol
相关推荐

2021-06-10 10:51:27

程序基础架构

2013-07-23 16:08:54

微信

2013-07-22 10:48:09

微信宕机

2013-07-24 09:27:06

微信宕机市值

2013-03-05 10:05:52

2012-07-05 09:54:04

Amazon宕机

2017-07-26 08:22:30

数据泄露信息安全网络安全

2021-11-22 08:33:27

微信聊天离婚

2013-07-22 10:14:03

微信故障宕机

2013-08-08 10:13:25

微信

2019-11-04 10:37:53

MongoDB宕机日志

2017-06-09 10:06:54

微信小程序架构分析

2017-06-09 12:58:20

微信小程序架构分析

2017-06-09 10:40:00

微信小程序架构分析

2009-04-15 15:29:47

升级网络故障网管员

2013-08-20 15:22:47

2019-08-26 11:39:43

存储

2019-04-10 09:39:42

代码存储系统RPC

2013-11-06 16:53:49

微信支付支付宝支付安全

2019-01-16 09:20:42

架构设计JVM FullGC宕机事故
点赞
收藏

51CTO技术栈公众号