可视运维就是将种类繁多的信息源产生的大量数据,通过映射成几何图元,再描绘成图形和图像清晰直观展现出来,可视运维提供了一种高效、一致性、透明化、面向用户的服务。在数据中心里,可视运维可不是一个新概念,几乎在数据中心诞生之初就有一些可视运维的技术和应用。比如:将网络流量映射到监控大屏上,通过监控大屏可以看到各个网络节点的流量转发情况,一旦有不通的地方,就会有告警出现。将整个网络结构图呈现到监控大屏上,一旦哪个网络设备失联,大屏上就会显示红色,并有告警出现,这些都是可视运维的范畴。如今,可视运维被人推到风口浪尖上,成为非常火热的一门技术,这是因为人们希望通过可视运维,可以做得更多,不再局限于以上简单应用。
运维的工作在众人眼里是一项投入没有产出的工作,运维的方面投入越多,就会影响到数据中心的生产利润。所以,运维的部门承担了繁重工作,却得不到足够重视。很多时候是看到架构师在夸夸其谈,畅想数据中心美好未来,给予这些建设者太多关注,其实真正实施时会遇到很多实际问题,这都需要运维的人员去擦屁股。可视运维就是运维者的机会,通过可视运维不仅能提升数据中心的生产效率,有隐患及时发现和消除,降低故障发生概率,还能给数据中心带来利润。
可视运维可以极大降低数据中心在运维上的人力和资金投入,为数据中心节省了真金白银。可视运维还能通过图形或者数字的方式将数据中心的运行状态和基础架构呈现出来,供用户观察和选择,让数据中心在用户面前不再是一座神秘的黑盒子,给了用户以视觉上的感受和冲击,吸引更多的用户将其业务能够部署到数据中心中来。可视运维还会将整个数据中心统计起来,让数据中心认清自己的家底,哪里有不足和缺点,及时进行补充和更正。可视运维更像是数据中心的一面镜子,镜子擦得越亮,看得就更清楚,看清楚自己,很多时候人们就是看不清自己,所以可视对数据中心来说至关重要。
可视运维并不是那么美好,还存在很多问题。比如:很多时候网络设备出现故障时,并不会所有业务都受影响,也许是一个端口,也许是一个IP,这时在网管监控的大屏上并不能显示出设备故障,对于这类故障,现有的可视手段还无法甄别,仍然要靠流量统计或者镜像等方式,逐台设备去检查,如此定位问题的时间会很长,尤其现在数据中心的网络规模都很大,这种方式更加不可取,这时就要对数据流量进行可视。可以监控到网络里每一条流量的转发情况,如果有一条流出现问题,都立即可以可视出来,这是现在可视运维要追求的东西。
再比如,要对整个数据中心的网络流量进行统计,大数据分析,从而得出一定的规律,数据中心拥有海量数据,正是研究大数据的***场所,通过数据分析就可能产生极大价值,为数据中心带来额外的收入,这也是现在可视运维要做的。除了流量上的可视,还有机房环境、设备运行参数、历史操作纪录、功耗和温度变化等等数据都要采集和可视出来。总之,只要有数据的地方,就要有可视,可视不仅要现实可见数据,还可以深入设备内部视察,将数据呈现出来。可视运维仅仅发现问题还不行,关键是要解决问题,所以可视运维还要引入执行动作,可以在发现问题时自动启动修复模式,让数据中心自动管理,这些都是现在的可视运维要解决的问题。传统的可视运维视角太窄,并没有给数据中心带来太多的价值,更多是为人们提供一些监控数据而已,绝大部分时候人们还是要靠自己的经验来分析问题,可视的运维带来数据影响十分有限,必须做出改变。
正因为可视运维仍不完善,才要发展。现在的数据中心对可视化的要求越来越高,希望数据中心里的任何运动都要能够图像或数字化呈现出来,这给可视运维提供了机会,也带来了挑战。在BAT的数据中心里,如果你的网络设备现在还不支持可视化,将不被考虑。支持可视化的程度直接决定了能够在BAT的数据中心占用的份额,BAT对不支持可视化的设备有一票否决权。
不仅是在BAT,在很多大型数据中心里都有新的可视化需求,传统网管监控已无法满足,这也催生了运维服务的市场,有不少软件公司加入到可视运维中来,开发出一些对数据中心进行可视的专用软件,向数据中心推荐使用。有些大型数据中心干脆自己做软件,将可视运维集成到自己的私有云中,将整个数据中心运行状态都在云上动态呈现,这对提升数据中心的运行效率极其有益,现在已经有不少的数据中心开始行动起来。
繁杂的运维事务不进一步封装,对运维的人员来说,都意味着很高的学习成本和事务执行成本。运维的管理中监控、流程、自动化、运维大数据这几个重要环节都少不了可视化呈现,才能降低运维成本。
可视代表了运维,可视运维的实现程度高低,在一定程度上反映出我们对运维工作的理解程度。可视程度越高,运维也就越简单,运维效率也就越高,间接地为数据中心创造了价值。现在的数据中心已经开始意识到这一点,在运维上,尤其是可视运维上舍得投入,与其所能带来的益处相比,这些投入实在微不足道。不难预见,未来可视运维将得到更加重视,是数据中心高速发展的法宝,必须要掌握它。