Graphcore发布第二代IPU:7nm工艺制程,性能翻8倍

原创
服务器 芯片
Graphcore推出的IPU产品是专门为人工智能计算所设计的,他们认为相对于GPU等芯片产品,IPU在人工智能计算上具备天然的优势。

【51CTO.com原创稿件】  AI在各种场景的应用落地,对算力提出了更高的要求,这就需要具备更高性能的计算芯片来满足AI面临的挑战。在芯片领域,除了CPU、GPU、FPGA等之外,专为AI应用设计的IPU也倍受关注。2020年7月15日,Graphcore(中文名称:拟未)在全球同步推出了第二代IPU:第二代 IPU(智能处理器)——Colossus MK2 GC200 和基于前者、可用于大规模集群系统的 IPU-Machine: M2000 (IPU-M2000),以及全新模块化机架规模解决方案IPU-POD64。同时,Graphcore宣布正式与金山云达成战略合作,并已推出面向开发者的IPU云服务。

[[337664]]

 

  Graphcore高级副总裁兼中国区总经理卢涛

  Graphcore高级副总裁兼中国区总经理卢涛在接受记者采访时表示,Graphcore目前所做的事情主要有三部分:一是专门为AI应用,从零开始设计IPU处理器;二是基于IPU处理器以及面向AI应用的Poplar软件栈和相关开发工具;三是围绕硬件和软件打造的IPU平台。

  IPU:专为人工智能计算而生

  Graphcore推出的IPU产品是专门为人工智能计算所设计的,他们认为相对于GPU等芯片产品,IPU在人工智能计算上具备天然的优势。

  据卢涛介绍,本次发布的产品在计算、数据和通信上有了颠覆性的技术突破。据了解,此次发布的Colossus MK2 GC200处理器,仍然延续了第一代的“同构众核”架构,不过制造工艺却从16nm提升为7nm,处理器内存储从 300MB 提升到了 900MB,晶体管数量更是达到了惊人的 594 亿(裸片823平方毫米),较 NVIDIA 今年5月发布最新旗舰 A100 的 540 亿还要多。

 

  此外,GC200的处理器核心(IPU-Tiles)从上一代的1217个提升到了1472个,能够执行8832个单独的并行线程。相较第一代产品,系统性能提升了8倍以上。

  在数据处理方面,GC200延续了第一代产品的高带宽高容量表现,这对于应对一些复杂的 AI 模型及算法很有帮助,官方声明它足以支持具有数千亿个参数的最大模型。另外在通信方面,Graphcore推出了自创的AI专属的IPU-Fabric横向扩展结构。官方数据显示,该结构的延迟为2.8Tbps,最多支持64000个IPU之间的横向扩展。

  除了发布了GC200处理器之外,Graphcore还推出了IPU-Machine:M2000 (IPU-M2000)。M2000在1U的机箱中集成4个GC200处理器,拥有1PFlops的计算能力和450GB的Exchange Memory;此外,其还具备IPU-Fabric的2.8Tbps超低延迟的通信能力。

 

  据介绍,IPU-M2000产品有多种配置形态,例如1个M2000的配置、4个M2000的配置、8个M2000的配置,并提供IPU-POD64的整机交付能力。卢涛表示,M2000是在构建超大规模、弹性AI计算集群中间的一个基本单元,IPU-POD64中集成了多达16个IPU-M2000。

 

  在此次媒体沟通会上,Graphcore还详细解读了最新发布Poplar SDK版本:Poplar SDK 1.2。Graphcore中国区技术应用总负责人罗旭表示,Poplar SDK 1.2主要有三大特性:一是与先进的机器学习框架进行了很好的集成;二是进一步开放低级别的API,让用户能够灵活的针对网络性能进行特定调优;三是增加了框架支持,包括对PyTorch和Keras的支持;四是优化了卷积库和稀疏库。

  罗旭表示,Graphcore开放了可以扩展的Poplar库,并支持TensorFlow 1、TensorFlow 2、ONNX和PyTorch。通过Poplar SDK、工具以及框架和容器化的支持,帮助用户能够更加容易地大规模部署IPU产品到实际生产环境之中。

  扎根中国市场,加强生态建设

  虽然Graphcore在产品上已经准备就绪,但由于市场竞争比较激烈,尤其是在市场已经大量部署了AI计算产品的情况下,如何使得用户转而使用IPU就成了一大挑战。

  据卢涛介绍,虽然在一个用户用一个新的计算平台替换老的计算平台时,确实是有一定的工作量,但Graphcore已经看到,有一些与Graphcore合作进展比较快的用户使用IPU替换原有产品的速度,要比大家想象得更加快一点。

  卢涛告诉记者,想要让用户下定快速替代原有产品的决定,必须要有三个重要的方面。一是是否能够为用户提供很大的价值;二是用户迁移的成本足够低、使用成本足够好;三是要构建中国的IPU开发者云、构建中国的创新社区,培育自己的生态。

 

  在谈到Graphcore未来商业化成功的突破点时,他强调,目前AI创新方面主要是三部分共同“出力”:CPU、GPU和IPU。而Graphcore是采取“两条路并行”的方式:一条路聚焦那些IPU比CPU、GPU表现得更好的业务场景,另一条路聚焦IPU本身激发的AI创新,这也是IPU从诞生开始就希望做到的。而这两条路,Graphcore都走得非常坚定。

  数据显示,这家成立仅 4 年的英国年轻公司已经累计获得了 4.5 亿美元融资,其投资人中既有红杉这样的金融投资者,也有戴尔、三星、微软这类战略投资者。与此同时,其团队规模也从几十人,发展到全球 450 人,其中工程技术人员占比 80% 以上。

  作为资本的宠儿,Graphcore 显然并不满足于英国本地的发展,根据其官网显示,除英国本土,Graphcore 已经在中国、美国、挪威等地设立了办公室。

  据介绍,Graphcore在市场策略方面将采取三个维度:云合作伙伴、OEM合作伙伴及渠道合作伙伴,在中国也是如此。

  “中国目前 AI 产业的体量可能是全球几个最大的国家之一,论落地速度也是全球最快的几个国家之一。未来我们将一方面加强国内团队、开发者社区的建设,一方面同国内各大云服务公司、AI产业公司加强沟通、展开合作,助力中国AI创新。” 卢涛如是说。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

责任编辑:张诚 来源: 51CTO
相关推荐

2012-05-15 18:04:57

Trinity

2009-02-13 16:54:50

EMCSSDSymmetrix

2019-08-15 13:27:28

AMDEPYC

2020-07-22 14:56:28

AMD EPYC

2017-12-21 11:09:31

AMD Navi显卡性能

2018-11-20 15:59:05

AMDCPUGPU

2019-12-17 19:47:25

第二代EPYCAMD

2012-05-14 11:53:37

Intel处理器芯片

2013-12-12 15:36:35

亚马逊

2019-10-08 11:49:06

第二代云计算多云

2019-09-30 07:10:08

第二代云计算IT专业人员

2022-03-04 09:59:16

处理器芯片半导体

2012-05-14 11:33:35

Intel7nm5nm

2015-03-12 11:06:53

第二代防火墙

2011-12-11 23:19:21

2013-05-03 09:44:02

Surface平板

2015-02-02 13:15:59

点赞
收藏

51CTO技术栈公众号