思科系统公司最新发出告警,旗下高端UCS B440刀片服务器存在一个潜在、能导致宕机的缺陷,甚至有可能会冒出火花进而伤及管理员。
上周,思科为使用UCS B440刀片服务器的用户发布了一项通知,通知上说由于刀片服务器使用了MOSFET功率晶体管,存在“导致组件过热从而冒出短暂的火花,进而导致系统宕机”的可能。思科还表示,“在某些特殊情况下,甚至会对周边的刀片服务器构成威胁。”
官网贴出的公告
其实早在去年7月12号的时候,思科曾就MOSFET发出过警告。当时思科表示“还没有证据表明MOSFET组件存在系统问题,发现的问题也仅仅属于一种随机组件故障范畴。”最后,思科工程师加紧为刀片服务器推出固件补丁,避免MOSFET出现过热和冒出火花。
然后在今年1月26日,公司通知客户说固件补丁监测到MOSFET出现异常并且有效遏制了“潜在的过热问题”的发生。目前,思科已经对B440系统主板进行修理,并对客户所使用的机器进行更换。思科还在公告中说,其他UCS B系列刀片服务器或者C系列机架服务器并不会受到MOSFET问题的影响。
如果你拥有B440系列产品,思科建议您尽快升级到最新的UCS刀片管理控制软件,它安装有最新的监控B440 MOSFET的补丁程序,并尽快安排对产品予以更换。
监控平台
另据悉,UCS B440-M1服务器最早是在2010年4月发布。其四路服务器系统基于英特尔八核Nehalem-EX架构的至强7500芯片。四路C460-M1机架服务器设计略有不同,因此它并不会受到MOSFET问题的干扰。早在去年3月份的时候,思科就已经升级了UCS刀片B440-M2服务器——一款支持十核至强E7处理器的四路服务器,去年4月开始出货。
在本周三(美国东部时间)召开的2012财年第二季度财报上,思科将很可能发布更多的有关该问题的报道,并透露出此次硬件更换所涉及的费用。
关于MOSFET
MOSFET,是Metal-Oxide-Semiconductor Field-Effect Transistor的简称。金属-氧化层-半导体-场效晶体管,简称金氧半场效晶体管。是一种可以广泛使用在模拟电路与数字电路的场效晶体管。它会随着芯片上的晶体管数量的大幅增加,而导致发热量也增加。般的积体电路元件在高温下操作可能会导致切换速度受到影响,或是导致可靠度与寿命的问题。在一些发热量非常高的积体电路芯片如微处理器,目前需要使用外加的散热系统来缓和这个问题。
在功率晶体管(Power MOSFET)的领域里,通道电阻常常会因为温度升高而跟著增加,这样也使得在元件中pn-接面(pn-junction)导致的功率损耗增加。假设外置的散热系统无法让功率晶体管的温度保持在够低的水平,很有可能让这些功率晶体管遭到热破坏(thermal runaway)的命运。