请问当今的机房运维管理应该包括哪几部分?
机房运维管理应该和IT运维管理是相互关联的,机房运维管理的服务对象也是业务系统,为业务系统提供支撑平台。
因此机房运维管理应该和业务系统是相辅相成的,是IT基础架构的重要组成和容器,是运维管理的一个维度。
鉴于这些因素广通认为机房运维管理应该包括机房监控运行展现、IT系统统一预警、机房环境运维管理、机房值班运维管理、机房制度运维管理这几部分。
请问当今的机房运维管理的几个要素中,最为核心的是什么?
要说机房运维管理中哪个部分是最核心的内容,广通认为支撑业务系统的内容都应该是核心的内容,机房中网络设备、服务器、机房环境、机房强弱电等内容都是为业务系统提供支撑平台的。那么这些内容都是与业务系统息息相关的。但是所有的设备都是归人员来支配的,而好的人员管理制度和管理思路才能维护出优质的机房。
因此机房运维管理中应该说最核心的部分应该是机房运维制度+面向业务的管理理念结合。只有根据不同用户机房的不同运行情况,从业务支撑角度制定出合理、规范的运维制度,管理人员按照制度进行运维流转才能维护出优质的机房。因此机房运维管理中最重要的应该是优秀的制度运维管理。
请问如何衡量机房运维系统的优劣?
对于机房运维系统的优劣衡量来说,广通认为一个好的机房运维管理应该是能够对业务系统提供支撑平台,能够对整个业务系统的运行状况进行统一的展现、预警、管理、维护的。因此好的机房运维系统应该能够具备以下几点:
首先将机房中支撑业务系统的网络设备、服务器、安全设备、机房环境等内容进行统一的数据采集,通过数据分析与处理,能够在统一的平台上进行集中展现;
其次能够将出现问题的内容及时预警和告警,并且能够通过事件引擎过滤多余的告警信息,将有用的告警信息进行集中统一展现;
第三能够拥有良好的资源管理平台与被监控对象进行关联,在出现告警时能够及时准确地定位故障的资源点,评估资源对业务的影响程度;
第四所有的资源信息能够与实际环境中的资源情况实时同步,保证系统资源的资料是当前最准确的内容;
第五拥有优秀的故障处理流程平台,能够根据用户的实际情况制定出***的运维流程,运维流程的制定是动态实现的,可以根据工作需要二次编程开发随意调整的流程引擎来实现的;
第六拥有完善的值班管理,能够提供机房维护人员进行值班表编排及提供值班日志的记录功能;
第七拥有良好的运维制度管理,在制度管理中能够对制度的生成及制度的执行实现标准的流程化管理;
第八拥有完善的知识库管理,能够提供管理员记录、查询、检索知识的平台。
总体说来,好的机房运维系统就是能够对业务系统提供完善支撑的运维系统。
请问现阶段对于运维系统来说,能否涉及到UPS、空调等设备方面的自动化管理?如果可以,是采用什么技术手段实现的?
对于现阶段机房运维系统来说是能够涉及到UPS、空调等方面的自动化管理的,对于这方面的管理可以通过几种方法来实现,***种方法是通过标准的串口、SNMP等协议获取这些机房资源的数据进行监控及预警,第二种方法是通过对现有机房环境管理平台的集成,实现在统一的运维管理平台上进行统一展现和维护。
请问机房运维管理能否遵循ITIL规范标准,如果可以,机房运维管理应该如何与ITIL标准相结合?
机房属于IT基础架构部分,是明确包含在ITIL规范体系中的,是支持IT服务管理的底层建筑,机房运维管理也是能够遵循ITIL规范标准的,毕竟机房也是整个运维管理的一部分,机房也是为业务系统提供支撑的平台,因此它也是能够纳入到运维管理中的。对于机房运维管理可以实现对机房中的机房环境进行监控、预警;对于机房的建设的内容如机房布线情况、机房设备分部情况、机房门禁、机房监控等内容纳入资源配置管理作为资源配置的一个部分,对于机房的维护和故障处理通过运维工单进行标准化的流转,对于机房故障的处理结果纳入到知识库中进行统一管理,对于机房规范化制度建立统一的管理流程,通过以上内容实现对机房运维与ITIL标准的相结合,从而实现机房管理的ITIL标准化的管理。
详情参见51CTO.com专题:一剑一绝技,七剑统机房 链接:http://server.51cto.com/jifangqijian/