从IDC运营商和云服务商的角度来说,做好网络运维是企业的根本。国内对互联网带宽需求的快速增长,催生出很多大型的IDC服务商,他们在全省、全国,甚至全世界布局数据中心。快速布局的同时如何对数据中心流量精细运维与管理,关系着IDC行业的整体收益和发展。
在12月21日第十一届中国IDC产业年度大典的安全分论坛上,安畅网络的CTO 张玮就数据中心网络流量精细运维做了分享。
在全国范围内,安畅运营管理了13个数据中心,对外通过BGP进行互联,在全国几大城市建立了一个网络出口点。
基于自身的数据,张玮提供了几张分析图表,***个表示视频厂商,其流量在中午和下午六点钟之后达到高峰,周一到周五流量低,周末流量上涨;第二张图表示一家大型餐饮厂商的流量,其流量在中午和晚上吃饭时间达到高峰;第三章图表示上海著名的代驾公司,它在晚上八点到达流量的高峰。
由此可见企业有不同的流量波动特征,这个特征是根据业务活动体现出来的。很多流量的规律可以去追溯,不同公司的流量规律合力就形成了数据中心出口的流量规律。
想要真正的把握规律,需要通过一些理论、推导去证明,得到有效的结果指导应用。安畅网络在很多运营场景下做出口的监控,比如阈值的监控。经过检测,安畅获得数据流量的上限和下限,但是阀值波动幅度非常大,不同数据中心不同的时间点的差别也非常大。
面对这种情况,安畅构建几个数据模型。***就实际流量的小时图,统计学里叫观测值。第二,把观测值里的趋势提取出来。第三个是把观测样本图的波动提取。其实任何一个时间序列的数据都可以提取成这三个模式,这也是做预测的基础。
在做预测时候,安畅采用时间预测。时间序列模型包含两种,***种是基于视察的,第二种是基于胡尔特法。经过反复的测试和论证,安畅的做法是通过二元法,利用不同的统计分析工具得出结论。
具体预测的模型结果如上图所示,将安畅预测的模型贴近原始序列,整个原始序列值通过这个模型得以完全描述出来。数据模型可以通过工具生成算法,而算法能够真正应用到整个数据的管理之中。
对于算法的具体应用,张玮做出了如下的阐释:算法将被应用于流量的精细化的化管理之中,安畅网络的信息精细化管理主要包括以下几个方面:
***量异常的检测,在预测的结果里面,有一个概念叫执行度。算法模型会提供一个流量的上限值和下限值。数据中心由此获得监控数值的上限和下限。基于模型每天滚动预测,把结果动态地更新到平台里去,一旦流量超过预设单位,运营者就会开排查。除了特殊的波动情况,预测的精准度很高。
二。流量复用价值。流量复用价值对运营商很有帮助。传统数据中心流量采购昂贵,采购量一般怎么核算呢?只有建立在一定的预测基础上,去做采购、整合,给运营商带来高经济效益。
在流量复用上,安畅还为客户做独立的监控。按照客户产生的流量,系统可以预知未来一到两个月的流量。如果客户按采购带宽非常吃紧,安畅会提出预警:一旦带宽在实际使用产生很多冗余,安畅会自动建议削减客户购买的带宽。
除了利用流量预测的结果做动态的监控,安畅也实现总出口的监控。如上图所示,安畅现在有十个数据中心。针对不同的线路,把流量数据通过三层提取,总结各个数据中心实际运行过程中的实际数据占比。
安畅还做了做平台化的系统交付,用户下单之后,交付部门根据订单里具体用户配置,把用户的订单分配好。现场工程师按照工单做算法的处理,一切都结束之后平台就开始自动装机,***做好端口的限速。一切完成后,客户会自动地加入到监控名单里去。
客户的端口数据会自动加到监控平台,有时候客户会有临时的带宽采购,此时直接由交付在平台里做一个手工的设计即可,不需要任何现场工程师的操作。
安畅目前所作的整个大网的实时监控,把不同的线路进行交叉监控,每一个C端的IP段会有两个IP地址。不同的分段分成红色、橙色、绿色,不同的点代表线路监控。运行正常用绿色表示,超量不大用橙色表示,量大、断网是红色的,实现交叉监控,不需要外部监控的厂商合作。