中国电信为谷歌背锅?揭秘本月几桩离奇宕机事故

运维 服务器运维
苹果App Store出现全球性宕机!有网友在社交网络媒体上反馈,自己的App Store出现了打不开的情况,随后这个情况蔓延到iTunes Store上,不过那时只是国外用户反馈,所以跟国内用户影响并不大。

宕机月月有,本月特别多。

比如今天,又有两个互联网巨头被爆出现宕机事故。

早间消息,苹果App Store出现全球性宕机!有网友在社交网络媒体上反馈,自己的App Store出现了打不开的情况,随后这个情况蔓延到iTunes Store上,不过那时只是国外用户反馈,所以跟国内用户影响并不大。

[[250235]]

随后,这个问题开始蔓延到国内,不少iPhone、iPad用户都表示,自己的App Store出现了打不开的情况,至于是什么原因并不清楚。对此,有外媒报道称,App Store和iTunes Store今天出现了宕机,而且影响是全球性的。

[[250236]]

显然苹果也注意到了这个问题,目前他们已经修复了这个情况。根据宕机追踪器DownDetector给出的看,报告故障在美国东部时间晚上8点开始出现。

另外,据彭博社报道,随着美国传统“黑色星期五”促销日的临近,Facebook的广告购买系统在本周二发生了故障。

根据媒介购买者等知情人士透露,美国当地时间周二早些时候,企业和广告公司用来购买Facebook广告的系统发生了宕机。目前该系统正在恢复,但运行速度仍然很慢。

[[250237]]

Facebook发言人在电子邮件中表示:“正在开展的广告营销活动不应受到影响,广告将继续投放。然而,创建新营销活动,或是对现有营销活动进行调整的广告主可能会遇到问题。”

此次问题发生在“黑色星期五”来临之前,这是一年中美国最重要的购物日之一。广告主目前正在社交媒体、电子邮件和网站等渠道大举投放广告,以吸引人们在此期间消费。

这两起宕机事故,目前宕机故障报告还未出现,具体宕机原因还未可知。不过除了今天的宕机事件,本月已经有不少互联网巨头因各种奇葩的理由而宕机,比如腾讯云、谷歌、百度等。

谷歌网络服务宕机,却让中国电信背锅

北京时间11月11日,谷歌旗下的云服务、YouTube等网络服务在全球范围内均发生了数小时的宕机,外媒称因遭到来自中国电信IP的BGP劫持导致故障发生。虽然这次事件为中国电信带来了“宝贵”的谷歌流量,但是黑锅我们真的不背。

本次事件是由一家名为Main One的西非电信公司进行网络更新引发的。Main One是位于尼日利亚拉各斯的一家商业ISP供应商,在葡萄牙和南非之间运营着一条海底电缆。

该公司表示:由于更新时采用了错误配置,导致Google的流量被重定向至中国电信,持续时间长达74分钟。

微信图片_20181122162615

在这期间,全球范围内的用户再尝试连接Google、YouTube、Spotify和Nest等网络服务时,流量会通过一个名为TransTelekom的俄罗斯ISP供应商重定向至中国电信,中国电信无法解析这些莫名其妙的流量和请求,因此导致宕机事件。

腾讯20岁生日之际,腾讯云DNSPod 被恶意攻击了

11月9日晚间到凌晨,DNSPod出现问题,遭到大量用户在微博、朋友圈吐糟。恰巧昨天是腾讯20岁生日,因为这事儿,有点儿扫兴,有人故意而为之?

系统安全不能忽视,第十三届中国产业年度大典特设智能运维安全论坛,探讨安全技术与应用。

微信图片_20181122162619

以下是腾讯云对11月9日DNSPod域名解析失败的技术复盘:11月9日21:46至11月10日00:06期间, DNSPod出现云解析服务异常,导致用户域名解析失败, 给用户业务造成比较大的影响,对此我们表示诚挚的歉意。同时, 我们对本次故障的整个过程进行了深入的技术复盘。

并解释了此次的故障原因:部分基于DPDK的NS服务器集群被大量恶意请求包攻击,导致部分域名解析服务异常, 技术人员通过紧急封堵后恢复。

被DNSPod连累宕机的百度

而在11月9日上午,多名网友反馈称百度网站疑似崩溃,移动端和网页端均无法打开。

针对此事,下午,百度官方微博也作出了回应,并给出了解决方案,百度表示,是由于运营商DNS的问题影响了部分北京地区的联通网络用户的正常访问。经过双方的紧急处理,目前相关问题已经解决。

微信图片_20181122162623

GKE全球大宕机长达19小时

11月9日,Google公有云下的Kubernetes服务(GKE),从清晨4点30分开始,宕机将近19小时,直至当日深夜11点才完全完成修复。但是在修复过程中,却因为GCP的不稳定性,而使Google被大量网友诟病。

微信图片_20181122162626

根据Google所发布的公告,GKE服务从11月9日清晨4点30分起,Kubernetes节点池构建功能出现异常,管理员无法通过Cloud Console UI创建新节点,Google随即开始进行调查故障原因,并开始处理。

到11月9日清晨5点57分,Google表示,受到影响的企业用户,可以先改为使用GCP内置的gcloud command,创建新Kubernetes节点。

但11月11日,在知名开发者Hacker News网站上,网友发布《Google Kubernetes Engine连续第三天服务中断》表示,他目前正在评估两个独立的Google GCP项目,发现自提交支持请求以来,即使在40多个小时的时间内,他们也没有收到GCP支持的响应。

相关人士针对这些疑问,使用Google故障声明进行解答:通过云控制台用户界面创建Google Kubernetes引擎节点池的问题已于2018-11-09 14:30美国/太平洋地区解决。只是Google忘了将其标记为如此,因此才会引起误会,让大家认为此次宕机事件没有及时进行解决。

实际上,经过10个小时的维修,在11月9日下午2点30分时,Cloud Console UI建立节点池功能已经恢复正常。

以上梳理的宕机事故,故障缘由都较为奇葩,不过本月一系列的宕机事故也为各公司带来了不少经济上的损失。

早有调查显示表明,网络宕机损失已增加了38%,从2010年的平均505,502美元增加到2015年的740,357美元。企业和用户的宕机事件的损失变得更加昂贵,并增加企业的网络依赖性,意味着这一趋势将继续上升,其中损失最高的行业包括金融服务、通信、医疗保健、电子商务,以及托管数据中心。

责任编辑:武晓燕 来源: 中国IDC圈
相关推荐

2018-11-15 12:13:46

宕机网络服务谷歌

2011-01-21 18:06:13

华为1588v2时钟

2011-01-18 13:16:56

2021-03-09 10:10:23

中国电信ZStack

2011-12-09 12:07:53

电信

2013-06-26 09:39:26

云平台云资源管理ERP

2013-08-21 15:02:09

NECExpressClus

2009-08-31 16:12:41

中国电信软件商店

2012-10-23 13:14:43

2010-12-27 14:02:53

2013-02-01 18:18:43

Windows Ser中国电信案例

2011-10-13 12:33:23

电信Wi-Fi

2013-11-18 14:03:17

世界通信展中国电信4G

2010-06-10 23:10:48

中国电信华为

2013-11-20 16:34:15

SAPSAP中国商业同略会SaaS

2010-08-20 12:00:46

印度电信设备

2010-06-04 15:30:09

电信设备印度

2015-06-12 14:42:05

微软Windows Azu中国电信

2009-03-26 09:41:21

中国电信断网

2011-09-08 12:19:29

点赞
收藏

51CTO技术栈公众号