硬件运维:记录一次被服务器电源模块坑成狗的案例

服务器 数据中心
事由今天开始,逐步把硬件运维过程中遇到的坑整理成公众号文章,以便踩到坑的人共勉,也给还没踩到坑的人一个提醒。至于这款电源模块,反正我已经被这款电源模块(这里说的艾默生电源PH-79RDR指的是DELL PC服务器使用的电源模块)坑过N回了,总体总结成3类问题。

事由

今天开始,逐步把硬件运维过程中遇到的坑整理成公众号文章,以便踩到坑的人共勉,也给还没踩到坑的人一个提醒。至于这款电源模块,反正我已经被这款电源模块(这里说的艾默生电源PH-79RDR指的是DELL PC服务器使用的电源模块)坑过N回了,总体总结成3类问题。

问题1 :PH-79RDR在低版本的BIOS中无法选择引导项

由于机房现场特殊的电源环境限制,该机房只能使用高压直流电源模块,于是将一台DELL R720服务器的电源模块更换为PH-79RDR,瞬间点亮,很是开心。

[[194125]]

然而,问题来了

我们装系统都是选择PXE安装,可这坑爹的,居然在引导(BIOS Boot Manager)的时候只有Normal选项,没其他选项。这里忘记截图,我贴上一个正常情况下的截图。

反复确认了几遍之后,放弃挣扎,拨打了dell售后根据工程师要求,将BIOS升级到2.4.3版本。照方法升级后,重启进BIOS Boot Manager很赞!问题解决了!!!

问题2 :PH-79RDR在2.4.3版本的BIOS中电源管理初始化失败

还开心着问题解决了的时候,我发现了新的问题。在某次重启过程中发现告警电源管理固件初始化失败。

  • Warning!Power management fireware not responsive。
  • Disconnect and reconnect system input power
  • Warning!Power management fireware initialization error。

不仅如此,最坑爹的来了,在系统命令行执行init 6命令后,只见关键,不见自动开机,必须点击开机键才能开机!

开机后继续卡在Strike the F1 key to continue,F2 to run the system setup program,无法进系统。

在DELL工程师的继续指导下,尝试了升级电源管理固件,各种不耐烦情况下,我还是尝试了4种不同的方法进行更新固件(windows下更新除外),全部以失败告终

问题3 :PH-79RDR电源官方不支持高压直流!

看来准备要更换电源模块才能解决问题了,按照工程师要求吧电源模块的备件号给他PH-79RDR,结果被告知,这款电源模块支持在交流环境下使用,什么,这款电源模块可是从你DELL买的,说不支持就不支持了,而且在高压直流环境下,已经有好几台服务器使用这款电源模块在线上跑着呢。经过各方查找,***证实PH-79RDR这款确实是非官方认证的资产高压直流,实际上是支持的!(期间为了能够正常派件保修,我将服务器换到交流环境下跑了一下,依然出现电源管理固件初始化失败的提示)

由于被官方告知,这款电源不支持高压直流,所以在DELL上门工程师陪同下,一起在交流环境做了一次测试,结果显示问题依旧。终于DELL终于同意更换电源模块了。结果更换完问题居然还在。

问题终于解决了

经过和dell工程师讨论,决定将BIOS版本降级到2.4.2试试。经过降级BIOS,重启。哇咔咔,一切***,所有问题解决。

结论与解决方案

1、艾默生电源PH-79RDR在BIOS 2.4.3版本下回出现电源管理初始化失败的问题,解决办法是将BIOS降级回2.4.2

2、艾默生电源PH-79RDR在1.*版本的BIOS下可能会出现引导选项缺失的问题

3、艾默生电源PH-79RDR在官方认证中,是不支持高压直流环境的,而实际使用过程中发现是可以支持的

4、补充一个艾默生电源PH-79RDR在另外一个案例中遇到的坑的结论,在电源管理固件本07.09.49下,该电源模块可能会出现异常自动重启的问题。解决办法是将电源固件版本升级到07.09.50

责任编辑:武晓燕 来源: 运维派
相关推荐

2013-12-24 13:59:03

2020-03-20 10:00:12

服务器网络攻击黑客

2013-12-23 09:38:11

2022-10-25 08:56:16

2010-04-28 17:14:52

Google服务器

2013-09-13 09:27:42

服务器LinuxApache

2020-03-22 15:17:17

服务器科技芯片

2018-03-02 10:42:44

2016-09-08 22:54:14

2020-03-14 14:17:01

服务器X86虚拟化

2022-09-14 12:01:35

服务器入侵篡改,

2019-08-01 15:05:22

2009-08-26 09:29:47

服务器电源

2018-08-29 09:23:30

2012-10-10 09:46:58

云计算服务器运维服务器

2018-05-10 08:18:12

无服务器运维服务器

2023-10-25 06:54:40

MySQL数据库

2017-10-18 09:06:41

2021-01-11 05:24:53

缓存服务器

2020-03-26 17:55:13

网络安全网络安全技术周刊
点赞
收藏

51CTO技术栈公众号