【51CTO.com原创稿件】利用动态可重配置的加速堆栈技术,可将计算性能提升数倍乃至数十倍,而功耗却只有CPU的一半。在昨天举行的赛灵思发布会上,赛灵思全球战略高级副总裁Steve Glaser和 和云战略总监Andy walsh对赛灵思***的FPGA动态可重配置堆栈技术进行了详细的介绍,Andy walsh表示,这一全新的加速堆栈方案,可以为超大规模数据中心提供最开的开发和部署途径,比x86服务器CPU快40倍, 比Intel 收购的Altera的FPGA,赛灵思的FPGA在计算效率方面优势也非常明显,尤其在机器学习推断方面。
一、何为可重配置加速堆栈
可重配置加速堆栈技术的重点, 是要使超大规模数据中心的客户能够借助赛灵思的FPGA非常简单地来评估、开发、部署、应用加速。Andy walsh表示,之所以用“堆栈”这个词,是因为它包含一个开发板和***的用于超大规模云计算的FPGA。另外,还包括库和主要框架集成,并支持openstack,所以可以更加方便地进行加速资源的配置和管理。打造这一堆栈的目的就是要帮助企业加速利用FPGA来处理云计算、嵌入视觉、机器学习、5G、IoT等工作负载,甚至还有一些工作负载是企业当前没有想到的,但是由于赛灵思的产品具有可重配置这样的功能,所以就保留了以后可以为其他不同工作负载进行配置的灵活性。
从平台开发方面来讲,超大规模数据中心的平台开发者能够大大获益于这一堆栈,利用赛灵思提供的开发板让设计者马上开始研发。此外,赛灵思还提供了一个参考设计,超大规模数据中心的企业可以马上拿来进行定制,并根据供应商的情况进行定制,这就能够使得超大规模的公司节省很多时间,不需要在PCI或者存储器的设计方面存在磕磕绊绊的情况,直接缩短上市时间。
Andy walsh表示,通过堆栈,赛灵思可以和超大规模数据中心公司的应用开发者进行直接合作。大部分应用开发者不希望每次有新的应用必须要改变自己的行为习惯,他们喜欢用已经用熟的工具、语言和框架,他们喜欢在框架的层面进行开发,喜欢看到这些非常熟悉的名字,像Caffe、FFMPEG、SQL。在机器学习方面,我们用Caffe作为参考应用,用它来开发库,包括用于神经网络,矩阵乘法等等,所以我们和caffe进行了一个集成,这样,应用开发者马上就可以用Caffe进行编译,能够很快得到结果。
未来,赛灵思还计划推出更多支持框架,当然并不是要推出现在客户在使用的这些框架的支持,而是要推出非常方便的一个网络,使得客户能够很快的去测试、使用和评估。另外,赛灵思的堆栈还支持openstack,是***支持openstack的FPGA供应商。当然,这种支持还会延续到新推出的产品上,预计将于2017年***季度发布OpenStack Ocata 版本,其中就会包含对赛灵思FPGA的支持。
二、20倍的性能提升和40倍的效率提高
Andy walsh在演讲中提到,赛灵思的可重配置加速堆栈 在加速关键超大规模数据中心负载方面的计算效率提升非常明显,以视频转码为例,比CPU处理能够快20倍,并且功耗只有CPU的一半,所以它的计算效率( 每瓦功耗性能 )是CPU的40倍。另外,在机器学习和数据分析两种混合工作负载的加速方案中,1个服务器再加16个FPGA性能相当于一个机架,也就是24个服务器的性能,它的占用空间只有1/10,它的功耗也只有1/12,系统成本也只有1/12。
目前,已经有很多超大规模数据中心公开使用FPGA,它们使用的配置是池化的。从加速利用率方面来讲,池化需要非常高端的FPGA来加速不同的工作负载。虽然赛灵思FPGA可以池化,GPU也可以进行池化,定制的ASIC也可以进行池化,但是对于集成封装来说,进行池化的拓扑非常困难。例如大型数据中心想要进行池化,只需要8片、16片、24个FPGA,用赛灵思的产品就能够非常简单地解决。
另外,考验如何将池化和加速利用率转化成计算效率,也就是每瓦性能,一般会从超大规模云计算当中的机器学习来进行推断,机器学习分为训练和推断两部分。训练部分是给一个模型很多的测试数据,使它变得更加的智能,更加的精确,一般会在研发中心完成。当这些模型训练好之后,就要开始在市场上部署,投入市场上一些应用,它不需要再进行新的学习,而是不断的去做一些非常靠谱的猜测,这就是推断。推断市场要比训练市场高10到20倍,主要是在面向客户的数据中心,目前用来做推断解决方案***的是8位整数的数据类型,赛灵思在这方面的表现非常优越,尤其是在精度降低的整数位的数据类型方面。
三、目标:五年内使赛灵思的潜在用户增长5倍
赛灵思早已经敏感地意识到,行业大趋势对于其灵活的可编程方案的广泛需求,一向以通信、军工、航空航天等应用为主的FPGA可以在更大的应用蓝海中发挥重要作用。因而,早在五年前, 赛灵思就已经完成了一个转型,从一家单纯的FPGA公司成长为全可编程的企业。 Steve表示,市场呼唤更高集成度的可编程器件,然而阻碍可编程器件广泛应用的***障碍就是编程模式——只能硬件工程师才能编程的硬件语言编程模式。赛灵思之所以能够称为全可编程企业,就是在产品的集成度和编程模式上实现了***的突破,提供了包括拥有7个内核的异构多处理器MPSoC 产品和加速增强型UlstraScale+ FPGA在内的全可编程的产品, 包括针对不同应用需求的SDx软件定义的全可编程的编程模式。
Steve表示,赛灵思全可编程的器件和工具既能软件智能,又能硬件功能优化,并能够实现任意互连,这对物联网的新世界是至关重要的。他表示,赛灵思还会不断对自己的产品线进行转型和调整,支持各种各样的广泛的应用目的。
在过去两年里,赛灵思一直致力于推出三种新的环境—SDx。我们的目标是在今后五年的时间里使得赛灵思的潜在用户增长5倍,从目前现有的5万工程师用户发展到25万用户,这些用户主要是系统和软件工程师,他们对FPGA的硬件并不是非常了解。Steve 表示,正是由于我们在这些可编程器件和可编程模式方面取得的突破,才能够参与到四大业界高速增长的领域:云计算、嵌入视觉、5G和工业物联网)。
当然,在这四个行业领域,赛灵思所发挥的作用各不相同。在云计算领域,赛灵思FPGA不仅仅要加速一些计算工作负载,比如机器学习和大数据分析,还要加速存储和网络。在嵌入视觉领域,主要针对汽车,另外还有一些其他的机器,使得它们要看得见,看得清,一览无余。在物联网领域,赛灵思将专注工业物联网,专注于互联的智能机器,为它加上安全可靠的元素。在5G领域,赛灵思将会在5G技术开发领域扮演着非常重要的角色。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】