"运维管理无小事,节能增效保平安"
要确保数据中心安全、可靠、持续、经济、低耗与高效地运行,必须做好运行管理工作。要做好运行管理工作,必须尽快建立高效、规范的运维体系。只有将规范和流程引入到混乱的运行环境中,让每个运维技术人员一丝不苟地按规范做,让经常做的事情制度化,让制度化的事情标准化,让标准化的事情规范化,才能构建完善规范的运维体系,提升运维管理水平。在建立健全运维体系的过程中,要不断引入运行管理的新理念、新技术与新方法,实现节能、高效、简化管理的目的,改善系统的运维质量,保证数据中心安全稳定运行。
数据中心的运行管理,实际上指的是对数据中心各系统及运行设备的管理,它包括为业务和分析系统提供数据安全存储、可靠运行支撑的IT基础设施(包括运行环境、网络、存储、服务器)和通用软件(操作系统、数据库、中间件)等软、硬件系统的组合平台,还包括与使用该设备的人员进行沟通和交流的过程。它的一个基石就是对用户、软件和系统设备的支持。
本章将从人员、流程、技术等三个方面,分运行管理任务和机构与基本制度、数据资源管理、运行日常管理、基础设施管理、运行管理的新理念与新技术五个部分来介绍如何做好数据中心的运行管理。
一、管理的目标、任务及内容
1.管理的目标
运行管理的目标就是通过强化与规范运行管理工作,确保数据中心安全稳定运行,为数据中心的IT关键设备运营管理和数据信息安全,提供可持续的有力保障;为实现企业(机构,信息资源的存储、保护和应用,以及企业(机构)的核心运营提供高可用性的、持续可靠的服务支撑。
2.管理的任务
数据中心进入使用阶段后,这时的主要任务就是对数据中心进行管理和维护,包括对基础设施、业务系统、数据库及业务系统运行状态的监视监测,及时发现与处理问题;
对应用系统的运行进行实时控制,记录其运行状态,进行必要的修改与功能扩充,以便使应用系统真正符合管理决策的需要,为管理决策者服务,使数据中心真正发挥作用。
3.管理的内容
高效的数据中心,如果管理不规范,缺乏科学的组织与管理,中心的作用就不能充分发挥,本身也会陷入混乱。管理是多方面的,既包括数据中心日常的规章制度及规章制度的执行程度,还包括对数据中心中各系统运行的可靠管理。运行管理主要关注的有以下几方面内容:
(1)运维管理队伍建设。在数据中心运维过程中,人员因素应该是首要考虑的因素。无论多么先进的设备和技术,如果没有人进行管理是不能很好地发挥作用的。因此数据中心在建设过程就必须考虑队伍建设问题,如果等数据中心从"建设期"转人"维护期"才考虑队伍建设,那就太迟了,不利于提高运行管理效率。
(2)数据中心应配备专责运维人员。划分合理的角色,明确职责。
(3)建立相应的管理维护制度,对管理权限、维护记录、运行日志等方面作出规定。
(4)建立通畅的反馈机制,使研发、客户服务、运行形成良性循环。
(5)梳理管理流程,引入ITIL(InformationTechnologyInfrastructureLibrary,信息技术基础设施库)管理流程,提高运维效率,提高管理水平和服务质量。
(6)通过自动化、资源整合与管理、虚拟化、安全以及能源管理等新技术的采用,对数据中心进行7×24h监控和运行维护。
(7)建设运维管理信息系统,实行数据中心集中化管理。将数据中心监控和管理维护纳人整体集中监控和运维,使数据中心高效、安全、稳定运行。
(8)加强应急管理、提高系统可用率。建立完善的运行管理专项应急预案,明确运维人员在技术、管理、业务、安全等方面的职责,把责任落实到岗、落实到人;定期进行预案演练,并根据演练结果及时更新预案;配备核心应用和关键设备的备品备件,以备出现突发事件时尽快更换,及时修复,缩小影响,减少停运时间,提高可用率。
#p#
二、管理的组织机构
有效地组织好各类系统的运行对提高数据中心的运行效率是十分重要的。运行管理组织的建立与数据中心在企业(机构)中的地位是分不开的。目前,我国各企业(机构)中负责数据中心运行管理的大多是科信部、信息中心、信息部等信息管理职能部门。随着人们对信息作用的认识提高,数据中心在企业(机构)中的地位也在逐步提高。从数据中心在企业(机构)中的地位来看,目前信息机构主要有以下两种形式,如图12.1所示。
按照图12.1(a)的方式,信息部门与其他职能部门平行。这种组织结构的特点是信息资源可以为整个企业(机构)共享,但是由于系统运行中有关的协调和决策工作受到本身在组织内部所处地位的影响,对信息处理的决策能力较弱。
▲图12.1信息机构在组织中的地位
按照图12.1(b)的方式,信息中心在总经理(或行政机构首长)之下、各职能部门之上。这种组织结构的特点是有利于信息资源的共享,并且在系统运行过程中由于本身所处地位较高而便于进行协调和决策,但往往容易出现脱离管理或服务的现象。
由于目前计算机、网络、通信等各项技术的发展,客户/服务器体系结构的运用,数据中心在组织中的地位最好是将上述两种方式结合在一起,各尽其责。信息中心主任(CIU)最好是由组织中的副总经理(或行政机构副首长)兼任,这样更有利于加强对组织内部各种信息资源的管理。
此外,作为企业(机构)信息化的重点领域,数据中心的地位在企业(机构)信息化中显得越来越重要。因此在管理职能规划方面,一些信息化比较成熟的行业和企业(机构)也开始发生了变化。企业(机构)内部从几台服务器过渡到小的机房,从小的机房又转变成为数据中心,可以说,涵盖了企业(机构)除桌面端的所有IT基础架构设施,非常有必要设置专门的负责人来进行管理,保障IT对业务的强有力的支持,数据中心经理(或主任)"随需而生".过去,企业(机构)信息化的工作一般由科信部、信息中心、信息处等部们直接管辖,但现在,这一局面也在"随需而变".比特网(ChinaByte)数据中心频道近期对行业企业(机构)信息化的调研发现,数据中心经理(或主任)这一新的岗位人群正在悄然形成,他们也成为企业(机构)信息化团队中,特别是CIO的重要支持力量。
【编辑推荐】