运维是数据中心生命周期里最为持久和关键的部分,但并没有得到足够多的关注和重视。运维的工作给人的感觉,普遍都没有技术含量。这是因为运维是个很宽泛的领域,运维的领域细分职位可达到30多个。比如:网络管理员、Linux运维工程师、安全运维工程师、CDN运维工程师、运维专家、运维经理、运维总监、CTO等等。在数据中心里这些运维位置,大部分是初级运维居多,而他们做的工作很多根本不能称之为运维。
例如部署服务、上线,甚至搬机器、重装系统等等,这些都是运维的工作中最为基础性的,但肯定不能只做这些,不然真的比较LOW了。要想成为运维专家,必须要努力工作和学习,在工作中逐渐发光发热,成就自己,也为数据中心带来收益。这时,我们要做的是利用对系统、网络、硬件、规范、服务方面的熟悉程度,结合专业知识,用技术方案解决深层次的问题,打造运维的使用工具、平台、框架,最终能给数据中心创造价值,这才是运维的真谛。要想成为这样的运维人,必须得有些独门的秘籍。本文介绍一些数据中心运维的私房菜,大家快快放到碗里来,一定会使你味觉大开,神清气爽。
网络:数据中心网络部分是比较重要的一块,一旦网络出了问题往往影响的是整个数据中心的业务,影响面比较大。对网络快速入门,必须要学习两本红宝书:大学课程教材《计算机网络》和《TCP/IP协议详解》,通过对这两本书的学习,对网络协议有了整体了解。接下来就要学习网络设备知识,作为数据中心网络产品的两大派系:思科和华为是有必要掌握的,有条件的话可以去学习思科的CCNA-->CCNP-->CCIE或者华为的HCNA-->HCNP-->HCIE,这些网络认证坚固基础网络知识,同时也实现了自家产品的使用风格,对于深入掌握网络技术有益。还要懂得出了网络问题时,怎样使用工具去分析,tcpdump、wireshark、sniffer等抓包软件一定要会用,PING、Xping、Tracert这些分析问题的命令也要会看,这样下来就可以利用这些技能去做网络运维了,随着经验的积累,一点点悟出其中的道理,反过来再去改进运维方法,从而在网络运维的工作中游刃有余,并逐渐找到提升工作效率、减少网络故障的方法。
Linux:在数据中心里,Linux就是所有设备的公共语言,几乎所有的设备都支持,掌握Linux知识必不可少。还是推荐两本红宝书:《鸟哥的私房菜》和《Linux就该这么学》,《鸟哥的私房菜》就像是一个大字典,作为一个查阅工具使用非常方便,《Linux就该这么学》则系统讲述了Linux的各个模块知识,有很多实例操作图片,不怕自己操作没有正确参照物,非常容易理解。当然,任何一门技术只有越用才会越熟练,一味学习而不去使用只会让你忘得越来越快,所以要重视日常基础性的运维,平日里在服务器上多做一些Linux命令操作,俗话说“熟能生巧”,机械式的反复操作Linux命令,操作多了也会有感觉。经常用电脑的人都会有这样的感受,学习键盘输入的时候非常难记,但是随着使用的次数和时间增多,到后来基本都是盲打,而且在键盘上敲打的时候,根本不经过大脑就可以敲出想要的东西,还很少出错,这就是“熟能生巧”而来的,Linux的命令有的晦涩难懂,有时就要反复敲打,机械式地强制记忆,慢慢地才会成为高手。Linux就是数据中心世界里的公共语言,掌握了它才能在数据中心行动自如,必须要精通才行。
脚本:掌握一门脚本语言已经成为高级运维工程师的必备计能,不会开发,你就不能充分理解数据中心的业务流程,就不能帮助调试、优化开发人员开发的程序。现在的数据中心动不动就几万台服务器的规模,这种情况下必须做自动化运维,靠人工去运维不可能,将几万台服务器登录一遍也要几十天的时间,更不用提运维了,所以必须交给软件去完成。这时就要用到脚本语言,使用脚本语言设计自动化运维的任务,比如:,Shell、TCL、Python,Perl等,实现运维的自动化。平日里对数据中心业务进行监测和分析,也时常要写一些测试脚本,所以脚本用处很大。Shell可以到网上找一些基本入门的书籍看看,选择Python的话就看看《Python基础教程》,选择Perl的话,就看看《Perl语言入门》和《Perl高效编程(第2版)》,正则脚本也要掌握,在Linux的使用中正则脚本必不可少。
智能:随着各种新技术的出现,运维的工作也将进入智能化时代,传统的人力和手工运维已根本无法满足数据中心高速发展的需要。运维的工作上了云平台,运维引入人工智能,运维也利用大数据分析数据等等,这些新技术在运维的工作中都可以发挥很大作用,让运维的工作处处体现了智能。通过机器不断地数据积累和持续学习,机器会把运维的人员从纷繁复杂、过度依赖人工的监控、发现、告警和修复工作中彻底解放出来,运维也将变得更加自动化、智能化,而实现智能运维还是要靠运维的技术人员,这些运维的人员研究如何才能让运维智能化,运维层次更高。智能运维是用机器来代替运维人员,在最少人工干预下,结合运用脚本与第三方工具,保证数据中心7X24小时高效稳定运行,这也是运维工作的***目标。
掌握网络、Linux、脚本、智能技术,并利用这些技术通过运维,提升数据中心的运行效率,并为数据中心创造价值,这才是高级运维的真谛,运维的工作将不会再让人不屑。快快拿走这些运维私房菜!