在英特尔的5600新至强处理器发布不久,各大系统生产商纷纷推出相关产品,并且纷纷推出测试数据,这些数据大都基于机架式服务器系统,而5600对于高密度的刀片服务器性能的提升如何?最近,美国夏威夷大学著名科学实验室ANCL(Advanced Network Computing Lab)对来自戴尔、惠普和IBM的三款刀片服务器做了测试,这三款产品都支持英特尔Xeon 5600处理器。其结果表明,新至强处理器使这些刀片服务器达到了新的高度。
虽然2010年刀片服务器竞争的开始就打上了自然灾害的烙印,ANCL仍用两个星期的时间测试市场上最好的刀片服务器系统并且发现它们的优点和缺点。他们建立了客户化电源监视循环,通过一系列测试运行戴尔、惠普和IBM的刀片服务器解决方案。
在这个测试中,戴尔、惠普和IBM的机箱都配置4台刀片服务器,起始价格是4万美元。
刀片服务器铁人三项
戴尔服务器
这次的测试计划没有进行HPC基准测试,而是选择了VMware的测试套件和一系列现实世界的性能指标。VMware测试包括一个单一的大规模客户化LAMP应用、一个运行Nginx服务器的负载平衡器、4个Apache Web服务器和两个MySQL服务器,这里配置了充足的vCPU和内存资源,以便让每一台刀片服务器中的物理和逻辑处理器都超负荷地工作。
惠普刀片服务器
这个工作量旨在模仿现实世界Web应用程序的使用模式,包括静态内容和动态内容加权的组合,以及随机数据库的更新、插入和删除操作,是在具体的并发水平上生成的,开始是50个并发连接并且增多到200个。所有三台刀片服务器的最佳点都是150个并发连接。因此,ANCL使用这些数字作为公布的结果。这些VMware测试首先在一台刀片服务器上运行,然后在两台刀片服务器上运行。这些刀片服务器都运行VMware ESX4并且由一个专用vCenter实例控制。
其它现实世界的测试是一系列同时以不同水平运行的常见的单线程任务,检测是否达到或超过每一台刀片服务器上的逻辑处理器数量,运行测试一直到超过物理内核工作负荷的8倍。这些测试包括155MB的WAV文件转换为LAME MP3文件、155MB视频文件从MP4转换到FLV视频、gzip和bzip2压缩试验以及MD5总和测试。它们展示了很好的实际工作量截面并且证明是整个刀片服务器始终如一的标志。
除了这些测试之外,ANCL还采用Ixia的IxChariot工具来测量在同一种机箱中几台刀片服务器之间的网络吞吐量使基准测试得分更全面。这些测试是以一些常见的工作量为基础的,包括iSCSI 32K和256K读取测试、一个流量仿真工作量和一个测试连接速率的BitTorrent P2P工作量。在使用这个基准测试的内置的客户端软件之前,ANCL还使用Ixia的IxLoad测试工具在LAMP应用程序上生成工作量以便进行初步测试。
配置5600处理器的刀片服务器对比测试
IBM刀片服务器
这次测试的服务器都配置了英特尔Westmere-EP X5670 2.93GHz处理器和每台刀片服务器至少24GB内存。选择Westmere的原因很清楚:六核比四核快,再加上Westmere在每个核心的性能方面略胜于Nehalem,它们现在是x64世界里速度最快的。
戴尔还带来了一套3.33GHz X5680处理器。然而,为了公平地进行比较,ANCL必须根据X5670处理器评估戴尔刀片服务器的性能。
ANCL还允许每个厂商选择带来什么类型的存储。戴尔使用的是Dell EqualLogic PS6010XV 10G iSCSI存储局域网阵列,惠普带来的是EVA 2124光纤通道阵列,IBM的System Storage DS5020也采用了光纤通道阵列。由于时间的限制和存储介质的不同,ANCL没有进行存储局域网阵列吞吐量测试。
这个刀片服务器的测试结果是非常有趣的,其结果基本上相同。在运行同样的Westmere X5670处理器的情况下,戴尔、惠普和IBM的刀片服务器解决方案在所有的测试中都在误差幅度范围内。
线程并发测试结果表明,戴尔、惠普和IBM刀片服务器总的来说不相上下,IBM以非常微弱优势排在头名。VMware LAMP应用测试的结果在统计学上也是不分胜负,IBM仅以0.7%的优势领先。一句话,这三台配置Westmere处理器的刀片服务器之间没有显著的性能差异。
由于戴尔同时也带来了一套英特尔3.33GHz Westmere X5680处理器,因此ANCL把这些处理器安装在戴尔的一台刀片服务器上重新运行了线程并发测试。测试结果比基于X5670处理器的测试快了大约12%,正好反映出每个内核增加的400MHz时钟速度。
有趣的是戴尔、惠普和IBM刀片服务器在Ixia IxChariot吞吐量测试中的表现同样好。这表明目前这些主要厂商已经稳定地应用英特尔Westmere处理器,内置10G交换结构已经成熟。Supermicro参加测试的产品没有10G交换结构,但是,在测试的刀片服务器的1G接口上的性能达到了技术标准。
【编辑推荐】