在云计算时代数据中心规模将扩展到成千上万台服务器,然而,在大规模数据中心的集群计算环境中,节点之间的通信带宽日益成为主要瓶颈,IT系统架构师们正在寻求这些服务器网络连接的更好途径,以提高性能、减少成本和能耗并支持无缝横向扩展,分布式核心网络为应对这些挑战提供新思路和新方法。
“大数据”(Big Data)的挑战
日益增多的网站、门户、搜索引擎和分析应用程序正在处理非常大的数据集,即所谓“大数据”。大数据就是一些数据集,其规模超过了常用软件工具在可容忍的流逝的时间内对其进行捕捉、管理和处理的能力。大数据规模从包含几TB到几PB数据集不等,要求高性能系统实时地或者接近实时地处理大量数据。适用于大数据的技术包括大规模并行处理(MPP)数据库、数据挖掘网格计算、Apache Hadoop框架、分布式文件系统、分布式数据库、Map Reduce算法、云计算平台、互联网和归档存储系统。大数据一般采用庞大的计算集群和先进技术及算法来减少数据集,并控制数据如何进出服务器,需要以非常高速和高性能的方式连接计算机的***网络架构。目前,各个网络厂商正在以支持大型计算集群的新网络架构配置来应对这些需求。传统分层网络(图1)分为核心层、汇聚层和接入层,对于担负以往工作负载的数据中心是也许适用的。
图1 传统三层数据中心架构
当通信方式以南北方向(换句话说,就是进出数据中心的通信)占主导地位的时候,传统数据中心三层架构还是具有优势的。但是当通信以东西方向为主导地位时候(如计算集群或虚拟化计算,如图2),分布式核心架构就非常适合。
图2 新一代数据中心流量模型
#p# 分布式核心网络架构
分布式核心网络是戴尔Force10专门研发的、高性能网络结构,网络性能能够升级到每秒160TB以上,如图3。分布式核心架构也称为“leaf-spine架构”,它包括两种类型节点: 一种节点连接服务器和架顶设备(leaf节点),第二种节点连接交换机(spine节点),leaf-spine系统架构内的任意两个端口之间提供延迟非常低的无阻塞性能,从而实现3级Clos网络。
图3 开放分布式核心大型数据中心网络架构
分布式核心架构优势
•节约成本。分布式核心架构通过使用多个低成本的以太网交换机进行大规模升级,不需要传统昂贵的机箱交换系统,无需单独板卡升级。
•高性能。任意点对点通信都有100%的均分带宽。
•集群工作负载优化。任何主机都能够以其网卡的100%带宽与网络内的任何其它主机进行通信。
•超级弹性冗余。重新启动或更换网络节点不损失整个交换架构可靠性,性能影响仅仅是总节点数之一,而不是传统双核架构的50%。
•灵活的控制平面。分布式核心架构可以使用基于标准以太网TRILL(多链路透明互联)协议或IP协议(OSPF和BGP)互联。
戴尔Force10 Z9000分布式核心交换机
大多数核心交换机(尤其是大型机箱交换机系统)不适合分布式核心设计,因为它们如果采用leaf和spine节点架构配置以支持横向扩展,则体积庞大和费用昂贵。而戴尔Force10 Z9000核心交换系统专门为leaf和spine网络设计。Z9000是2U的800W机架交换机,配置32个40GB以太网端口(128个10GB以太网端口),其成本仅仅是基于竞争对手的机箱竞争交换机的很小一部分,特别是在构建超大型横向扩展架构时。Z9000能够最多支持64个spine针节点和128个leaf叶节点,每台Z9000实现每秒2.5TB的交换容量,能以极小的空间和低能耗创建每秒160TB的庞大网络核心。网络设计规模大小可参照如下计算:
•网络设备节点数: 3N/2
•可接入网络端口数: N2/2
N = 每个网络节点的交换机端口数
每台Z9000交换机配置128个万兆以太网端口,N=128,代入计算得到***网络规模尺寸如下:
•网络设备节点数:192=3x128/2
•可接入网络端口数:8192=128x128/2
图4 Z9000分布式核心设备图
Z9000每台约消耗800瓦电源,其耗电量是竞争对手核心交换机的二十分之一,这项特性可以在使用大规模升级的核心网络情况下,数据中心用户也能在紧张的电费预算下柔韧有余。Z9000只占2U高度,是竞争对手的核心交换机高度的十分之一,使它能够有效地利用机房空间大规模升级。
Z9000灵活使用基于标准的3层和2层控制平面技术。在3层,由OSPF和BGP控制,ECMP可整体分配在leaf和spine架构上流量(目前可支持64条),BGP多路径能够用于在leaf和spine节点之间负载均衡,OSPF多域设计方式可以限制LSA广播域和提升路由效率。如果Z9000仅需实现2层转发,TRILL控制平面可以实现整个网络架构的多路径控制。总之,在3层或2层任何一种情况下,基于Z9000的分布式核心架构都能提供全面的灵活性和规模控制。
#p# 分布式核心网络架构经济
假设收敛比是3:1,Z9000架构可扩展到每秒160TB网络架构,并支持多达2.4万台万兆以太网服务器。然而基于Z9000架构解决方案的竞争优势最终在于分布式核心的经济因素,这个架构仅以少量成本、耗电量和机架空间从根本上重新定义了数据中心的网络架构经济学。因为这个解决方案在经济上更加可行,使得分布式核心解决方案广泛应用于我们的客户。
图5 Z9000横向扩展架构耗电量对比
图6 Z9000横向扩展架构占地面积对比
总而言之,分布式核心架构提供更大的伸缩性、更高的带宽和弹性,并且作为数据中心网络的基础处理大量的数据和使用大规模的计算集群。戴尔Force10秉承戴尔公司一贯开放的、性能高效和经济有效的高效企业级解决方案理念,研发的Z9000是唯一一款专门为分布式核心架构制造的核心交换机,对从小到大不同规模的横向扩展架构解决方案进行了成本优化。
作者简介
李海平,邮件:haipingli@139.com,新浪微博”行云流水万泉河”,近20年IT行业市场和管理经验,清华大学毕业,香港科技大学MBA,CCIE#4435 (R&S、SNA/IP),热衷研究应用经济学、商业管理和IT产业发展,在IT商业分析与业务整合、云计算与应用架构、虚拟化与基础架构业务拓展及管理等方面有多年经验。在多个国际IT行业组织担任会员包括DMTF、SNIA、PCI-SIG、SATA等,目前主管Dell大中华区下一代数据中心刀片服务器与网络业务,积极推动中国客户发展新兴科技,应用戴尔全球客户***实践。