社区编辑申请
注册/登录
51CTO“一剑一绝技,七剑统机房”大型专题摩卡专家采访
服务器 数据中心
在本次的“一剑一绝技,七剑统机房”大型专题的IT运维篇中,我们采访了若干的IT运维系统专家,让我们来听听专家的意见和建议。

在本次的“一剑一绝技,七剑统机房”大型专题的IT运维篇中,我们采访了若干的IT运维系统专家,让我们来听听专家的意见和建议。

 

采访专家:摩卡软件产品总监  侯军

请问当今的机房运维管理应该包括哪几部分?

信息化的最直接的体现,就是企业的机房在逐渐扩大,各类大、中型组织的网络信息化建设的设备资金投入日趋增加,其职能运行与计算机网络的结合日趋紧密,为保证IT设备的安全、稳定、高效运行,保证网络设备的良好运行状态和设备使用寿命与安全,实现用户的***投资效益,就有必要对网络运行环境的电力供应、温度、湿度等环变量,UPS、空调设备运行状态变量,进行24小时实时监测与智能化调节控制,以保证网络运行环境的稳定与网络软硬件资源、设备的安全。

针对企业的机房监控系统应运而生,综合机房监控系统综合集成机房基础设备监控、报警处理、门禁考勤、视频监控等功能,并支持WEB访问,实现远程处理,并且一旦设备发生异常情况,将通过短信或告警的方式提供给信息中心工作人员,为故障点的及时排查提供有力的保证,提高了整个机房的可靠性也提升了整个机房的运行效率,实现了对机房的科学管理。

机房运维系统主要是对机房设备(如供配电系统、UPS电源、空调、消防系统、保安门禁系统等)的运行状态、温度、湿度、洁净度、供电的电压、电流、频率、配电系统的开关状态等进行实时监控并记录历史数据,实现对机房遥测、遥信、遥控、遥调的管理功能,为机房高效的管理和安全运营提供有力的保证。

机房监控网络化的发展趋势,不必重复投资,采用内部局域网通信和管理,更稳定更安全。采用TCP/IP方式,各监控机房可以很容易地与监控管理中心及数据库建立起联系,用较低的成本,对监控机房的动力设备、机房环境、安全保卫消防、视频图像等信息实施统一平台下的监控。

请问当今的机房运维管理的几个要素中,最为核心的是什么?

随着社会信息化程度的不断提高,机房建设规模日益扩大,其设备数量也日益增多,机房环境设备(如供配电系统、UPS电源、空调、消防系统、保安系统等)必须时时刻刻为IT系统提供正常的运行环境,若事故严重又不能及时处理就可能造成严重后果。因此,目前许多企业机房的管理不得不采用24小时专人值班来定时巡查机房场地设备,这样不仅加重了管理人员的负担,而且往往不能及时排除故障。尤其目前国内普遍缺乏机房场地设备的专业管理人员,对机房进行计算机自动化管理显得十分重要。计算机机房和数据中心支撑着各类企事业单位现代化生产体系的正常运行,一些机房甚至已成为无人值守型。在这种情况下,任何一个由于环境因素和人为失误造成的意外系统中断和设备损坏都会给企事业单位带来巨大的损失。为了减少这种损失,用户需要有一套先进、可靠的机房环境监控与预警系统来确保设备的安全运行。该系统必须能够随时随地观察到机房的情况、必须能及时地发出预防性报警、通知有关人员、采取措施、防止事故发生。

我大概总结了一下目前机房监控运维的功能特点:

一、能够对机房全天时视频监控,并用数字录像保存以备查阅。

二、系统可以机房的报警设置,例如红外,烟感,玻璃破碎器等,如果出现异常信号,系统能自动触发报警系统,能及时上传报警信息并进行本地及远程数字录像保存。

三、必要时可以在系统中可以加入门禁,并将门禁系统无缝接入,可以加强对人员的管理。

四、通过音视频监控,能够使管理人员随时查看机房设备和机房人员的工作情况,并可以通过系统进行对话,加强机房监控的同时还具有较强的互动性。

五、与配电系统结合,机房人员可以随时查看机房的电力配置情况。

六、系统中环境监测设备,能及时反应空调系统,温湿度,新风机和漏水监测等机房环境保障设备的数据。

七、系统能够产生报警信息。同时将启动在一定范围联动设备,例如录像、后备发电机、喷淋、新风机、空调等。

八、监控系统拥有人机对话界面和汉字支持功能;故障告警有明显的声光电形式。

九、可以真正的将机房管理,作为整个IT部门运维的一部分,实现与其他相关监控以及ITIL运维标准化管理的密切结合,从整体上提升IT运维管理的能力。
 

请问如何衡量机房运维系统的优劣?

参照目前机房监控网络化的发展趋势,一个好的机房运维系统特点在于,不必重复投资,采用内部局域网通信和管理,更稳定更安全。采用TCP/IP方式,各监控机房可以很容易地与监控管理中心及数据库建立起联系,用较低的成本,对监控机房的动力设备、机房环境、安全保卫消防、视频图像等信息实施统一平台下的监控。

所以,完善的机房监控系统应该具备三大特点:能够实现从设备运行情况到机柜微环境再到机房整体环境这样多层次的监控;能够有丰富的阈值设置以监测出危机的存在,并能有丰富的预警方式和预警流程保证相关人员能够收到警讯,达到预警的目的;具备网络化、智能化,能够随时随地通过网络查看机房内的情况。然而,传统机房环境监控是把重点放在对机房整体环境、空调及配电柜的监控上,而忽视了对设备内部的监控。另外,传统机房环境监控系统也缺少丰富的阈值、预警方式和预警流程设置,不能在真正意义上实现预警功能。

请问现阶段对于运维系统来说,能否涉及到UPS、空调等设备方面的自动化管理?如果可以,是采用什么技术手段实现的?

完善的机房监控系统应该是能够实现对从设备运行情况到机柜微环境再到机房整体环境这样多层次的监控,并能重点实现对设备内部的监控。 机房各个点的环境参数值是不同的,因此机房内整体环境监测的参数不能体现各机柜微环境参数,更不能体现重要设备内部的环境。也就是说,即使机房整体环境参数正常,IT设备所在处的环境也不一定正常。所以说机房的整体环境监控的重要性次于对设备的监控和对机柜内微环境的监控。

空调机的运行是为了降低机房内的温度,使机房内的整体温湿度保持在一个合适的范围内,机房各个点的温度参数值是不同的。空调机出风口的温度值不能说明机房的整体温度和机柜微环境温度,空调的正常运行不能说明设备就能正常运行。因此对空调的监控不能代表甚至取代对设备的监控。

漏水监测系统是为了监测机房内是否有漏水,以防止因漏水影响设备的正常运行。线式探测器是成线型布置在机房可能漏水的***处,而实际上点式漏水探测器同样可以反映机房的漏水情况且比线式探测器经济实惠、安装方便、维护简单。

机房内设备由于非常重要,一般都是采用UPS供电,并且UPS是双供电,只要对UPS进行监控就能确保设备正常供电并且能反映市电的情况。因此,对电源的有效监控是在不增加任何投资的情况下通过协议实现对UPS的监控,通过监控其电压、电流、电池使用情况、市电情况来确保设备的正常运行。

那么,当出现上述情况异常时又如何实现预警功能呢?首先,可以通过灵活的阈值设置多种侦测方式,确保能及时地发现潜在危机;其次,通过设置多种预警的方式,确保所有相关人员无论在何时何地都能收到警讯;再次,设置多个预警流程,确保不同的相关人员在不同时间接收到不同程度的警讯。 这样,一旦有危机出现,立刻将信息发送给相关人员直至危机得到有效处理,实现真正意义的预警功能,***程度地保护系统的运行。

请问机房运维管理能否遵循ITIL规范标准,如果可以,机房运维管理应该如何与ITIL标准相结合?

现在网管软件市场***繁荣,各种层次、各个方面的产品林林总总。有国内厂商的产品,有国外厂商的产品,有侧重主机管理的,有侧重网络管理的,有专职于流程的,有专注于机房监控的,根据什么选择一款全面综合的、基于ITIL标准的综合运维平台呢?依我看,不外乎下面几个方面:

1.满足现阶段需求

考虑未来需要网管软件是拿来帮助我们做运维的,所以最重要的方面满足我们的需求。运维工作中的需求很多,网管软件不可能解决所有的问题,所以我们提倡“满足现阶段需求,考虑未来需要”。一般来说,运维管理软件的实施过程一般是“先监控,后流程”,就是说,先把主机、网络数据库等监控的事情做好,然后再做ITIL运维流程。所以我们在选择网管软件的时侯,在保证监控满足现阶段需求的情况下,一定要考虑未来的需求,也就是运维流程的实施。因为ITIL运维流程是IT管理的未来,如果现阶段选择网管软件,仅仅局限在监控的范围内,选择仅仅满足系统监控的产品或者工具,而不考虑企业未来的需求,在企业发展到一定阶段,需要ITIL运维流程时,就必须把现有的监控系统推倒重来,这是谁都不想做的事情。

2.看行业的发展趋势

每个行业都有自己的发展趋势,网管软件行业也是。网管软件行业的发展趋势,现阶段来看,起码包括以下几点:

(1)B/S架构

软件发展的趋势是B/S,现在市面上几乎所有的企业级产品,都支持B/S结构,甚至只支持B/S,不支持C/S。网管软件也是如此,毕竟B/S相对于C/S,有太多的好处和优点,没有人不喜欢B/S的简单、方便、快捷、高效。

(2)Portal是趋势

门户技术的发展是一个趋势,他的优势包括统一登录、统一权限认证,统一界面风格,统一界面入口等。在知名厂商的解决方案中,都有管理门户的概念,包括BMC、Mocha、IBM等。

(3)J2EE是趋势

J2EE技术不仅仅是网管软件的主流技术,也是现在软件开发的主流技术。

随着IT的发展,没有那个厂商可以保证,在使用自家产品的情况下,就可以满足用户所有的需求,所以,针对用户的需求,厂商往往提供的是解决方案,即通过几个厂商的产品,来满足用户的需求。这种情况下,B/S架构,J2EE,Portal等这些未来的发展趋势,就显得至关重要。例如,在既关注机房环境监控,又关注IT设备监控的情况下,如果机房监控厂商与IT监控厂商都采用B/S架构,并且都采用Portal技术的情况下,建立一个统一的机房、IT监控的门户,是再容易不过。但是如果有厂商采用C/S架构,就使一切变成不可能了。用户也只有在几个界面之间频繁切换,采用两套告警体系,使用两个短信网关发送短信,安排不同的人员关注不同的设备了。

因此,在选择网管软件时,需要考虑整个行业的发展趋势。

3.厂商的背景和能力很重要

还有重要的一个方面,就是厂商的实力,如果厂商没有实力,没有产品蓝图,仅仅有一个产品,就很难保证后续的研发和售后的服务,只能听天由命了。国内很多的软件厂商,因为处于起步阶段,还处于几个人的小团队开发阶段,没有成熟的产品线,没有成熟的研发队伍,也没有很好的现金流,今年还风光无限,明年就关门大吉了。在选择产品的时侯,一定要规避开。

作为国内综合IT运维管理专家―摩卡软件根据国内广大机房用户的使用习惯,在网管软件的基础上,并提供了机房监控管理功能,该模块不仅支持基于SNMP的APC 其它机房设备,如智能配电柜(ISX-PDU),网络化空调、机柜电源插排和环境监测管理设备,以及其它UPS厂家的设备等。该产品具有实时监控、集中管理、资产管理、告警管理、日志管理、电池管理、语音\短信告警通知等功能。

因此Mocha BSM为企业提供了一个能够对网络物理运行环境变量、设备状态变量进行全方位监测、智能化自动调控报警的模块。
 

责任编辑:桑丘 来源: 51CTO

同话题下的热门内容

2022年数据中心虚拟化的主要趋势中国光网络研讨会|华为罗贤龙:以全光算网管控技术提升算网业务竞争力5G 如何影响数据中心以及如何做好准备中国算力大会 | 华为:以全光自动驾驶网络开启高效运维新纪元鲲鹏开发者创享日2022在长沙召开数据中心的停机时间怎么会成为企业的噩梦?紫光云与省工信厅签约,助力河北工业互联网加快发展万国数据与临港浦江国际科技城、壁仞科技达成战略合作,共建算力共享平台

编辑推荐

如何改变运维在数据中心中的地位详解IPv6与IPv4之间的差别!三大运营商不限量套餐哪家划算?详细对比国外12家值得注意的SD-WAN厂商UPS电源选择与电池容量计算
我收藏的内容
点赞
收藏

AISummit人工智能大会