一年一度开放数据峰会将于2018年10月16-17日在北京国际会议中心召开,每年峰会汇聚数千名数据中心专家,吸引40多家主流媒体进行全方位报道,开放数据中心峰会已成为数据中心行业的一大盛事!
在此次峰会上,ODCC将:
- 发布最新研究成果² 碰撞尖端热点技术
- 分享国际技术进展² 展示主流产品应用
ODCC关注数据中心产业的各个方面,从国家政策和法规,到地方制度和项目,从产业全局发展到具体技术落地,从尖端热点技术到传统行业推广,从国内到国际,从宏观到微观,全力推动中国数据中心产业发展!
时隔一年,备受瞩目的开放数据中心峰会将再次开启,此次峰会都会有哪些亮点呢,后续小编将陆续为大家一一剧透。
本次闪亮登场的是:T—Flex服务器系统
ODCC自2014年成立至今,围绕天蝎计划已经开展了天蝎2.0技术规范、天蝎冷存储2.0、天蝎公板X3等多个项目,为我国服务器产业的创新发展持续献力。2017年的峰会上,我们介绍了ODCC关于异构计算及其池化在 C-RAN中的应用探索,今年的峰会ODCC将围绕异构计算带来一款全新的天蝎3.0、19"机柜标准化异构计算产品——T—Flex服务器系统。
“高效的计算和存储,多元化系统资源的敏捷交付,端到端部件资源解耦,高性能的可定义互连,按需组装并柔性交付,具备裸机性能同时又能提供更灵活的生命周期管理效率是服务器系统设计的追求。” 在ODCC立项、由腾讯服务器技术团队自主开发的T-Flex服务器系统正是我们面向这一理念的全面实践,让服务器配置具备”可编程”的原力。统一系统形态,灵活资源配置。2U的系统规格,在腾讯基础架构中拥有最好的适配性。不再有CPU/内存等传统计算单元,取而代之的是高速PCIE 互联芯片,通过PCIE内部互联拓扑,实现PCIE设备与传统CPU计算资源的解耦合。
图1 T-Flex系统展示
如图2所示,基于PCIE互联拓扑,通过管理芯片实现PCIE资源的重构。这样就实现了业务端在源扩充的精准匹配,可以更深层次的针对业务进行资源调整,为智能分配提供基础。通过对传统资源的解耦和重构, 依托腾讯自动化运营平台, 满足业务部门的动态需求。
系统前窗(图3位置1)配置了多种模块化结构,可以容纳24块U.2 NVMe盘或者32条Ruler SSD,单盘30TB的存储容量,让单系统提供了多达1PB的高性能存储密度。通过T-Flex系统内置的PCIe交换芯片,就可以开启基于裸盘存储的共享经济初级模式了。多用户按需对物理盘位进行切分使用,属于PCIe直挂形态,硬件性能无损。后期设计升级后可以基于SR-IOV进行更加精细化的空间划分和管理。例如,当现有系统需要存储升级或扩容时,用户可以在现有核心系统增加一块PCIe扩展卡,无须更换新服务系统,即可实升级和扩容,避免大量数据迁移,并提高现有系统的使用有效性。
图3 T-Flex系统框架图
在T-Flex后窗(图3位置2)配置全高全长NVMeoF板卡(NVMe Over Fabrics),这即为块设备输出的共享进阶模式。如图4所示,多张NVMeoF板卡南向连接按业务规划所需的NVMe设备,北向提供100GbE网络带宽,以NVMoeF协议对外提块设备服务,PCIe交换芯片内建板卡间通信链路,在未来能提供额外的硬件冗余扩展功能。通过这样形态的组合,结合应用层的资源调度和负载均衡,就可以实现类似于AWS EBS的网络块设备服务了。NVMeoF板卡上的ARMv8拥有强大的处理能力,也支持相关二次开发,满足自有协议的实现和优化。
图4 存储直连与NVMeoF
T-Flex还可以支持类计算加速硬件。从Training导向的全高全长规格GPU,多形态的Inference加速卡,到通用FPGA板卡,T-Flex都可以量化支持。如图5所示,4台T-Flex系统组装为1台拥有16卡计算加速系统,GPU与处理器之间的带宽可通过接线形式自由配置,并支持一系列提升训练效率的功能:GPUDirect RDMA,GPU之间的P2P通信,NVMe direct等。
图4 GPU应用场景
综上所述, T-Flex服务器的部署实现了如下核心能力:
1、面向多种硬件资源的解耦和重构能力;
2、通用服务器形态下非凡的资源兼容和可视化能力;
3、面对应用层完全透明的多种互联技术;
4、依托于腾讯高度自动化运维平台的智能管理能力。
T-Flex服务器是ODCC天蝎计划的又一里程碑式产品,也意味着天蝎计划在推动我国服务器产业从“中国制造”到“中国设计”的又一次跃进。在ODCC十月峰会上,我们不仅会揭秘T-Flex服务器的更多设计细节,也会带来全方位的样机展示,想了解T-Flex服务器的更多信息,敬请关注ODCC于10月16、17日在北京举办的年度峰会。