NVIDIA Marc Hamilton:利用开源的RAPIDS,为机器学习持续加速

原创
服务器 芯片
RAPIDS不需要创造新的算法,只是为了让XGBOOST和其它机器学习算法提速。RAPIDS里有两个部分组成:第一个是cuDF,它是CUDA的数据框架。第二个是cuML

  【51CTO.com原创稿件】利用GPU处理语音、视频、图片等非结构化数据已经成为行业共识,在今年的GTC大会上,NVIDIA不但发布了一系列全新的GPU芯片,而且还重点介绍了用于加速计算的RAPIDS。NVIDIA解决方案架构与工程团队副总裁Marc Hamilton在接受记者采访时表示,NVIDIA在深度学习领域已经专攻了六年,RAPIDS并不是一个全新的算法。它不是教人们怎么去编写新的代码,而是把已经写好的代码放在CUDA上,数据科学家不需要重新学习软件的用法,完全可以利用现有的软件,并为深度学习快速。据介绍,由于RAPIDS是开源的,所以软件中没有的功能企业可以自己去编写代码实现。

[[250503]]

NVIDIA解决方案架构与工程团队副总裁Marc Hamilton

  让机器学习算法加速的RAPIDS

  XGBOOST是机器学习中一个比较好的算法,Marc Hamilton告诉记者,现在越来越多的公司开始采用XGBOOST算法。他表示,每个企业都有不同的业务需要用到深度学习,如果企业同时有五个决策树,如果用CPU服务器计算,需要几周甚至几个月的时间,这是因为在每一个树状图的接替过程中,一个服务器与另外一个服务器要进行大量的信息交换,整体速度都被拉低了,利用RAPIDS则可以很好的解决这个问题。

  RAPIDS不需要创造新的算法,只是为了让XGBOOST和其它机器学习算法提速。RAPIDS里有两个部分组成:***个是cuDF,它是CUDA的数据框架。第二个是cuML,它是CUDA学习。据介绍,数据框架是帮助用户收集数据的,cuML和CUDA机器学习只是GPU支持XGBOOST或者其它的人工智能库。cuGRAPH是专门处理图像的,可以跟很多的软件相连。

  Marc Hamilton表示,RAPIDS的***层是通过CUDA进行编程。他强调,加速有不同方式,一种方式是在CUDA上对软件进行重新编程,第二种方式是使用CUDA软件库、cuML及机器学习的软件库,用来加速XGBOOST。第三种加速方式是在软件应用层面的加速,比如:SAP或者Oracle的某些工程的功能已经是通过GPU加速了。

  开源让RAPIDS简单易用

  据Marc Hamilton介绍,RAPIDS是开源的,非常易用增加新的功能,不需要重新学习。

  Marc Hamilton表示,现在很多新软件的开发过程和老软件非常不一样,如果买Oracle的数据库,需要一年更新一次。RAPIDS每天都会把新的代码放到上面去,每30天会把这些数据部署到英伟达的容器里,然后把它放到“云”上去。

  “如果今天你用当前版本RAPIDS用的非常好,那么这个版本会被放在容器里头一直待在“云”上,什么时候想用都会在那里,它并不会消失。” Marc Hamilton表示,如果你喜欢英伟达RAPIDS的下一个月的版本中的某个功能,就可以在下个月把新版本下载下来使用。

  据了解,“云”上的大部分版本都是由英伟达经过测试之后的,有一些版本没有经过测试,用户想要使用的,也可以自己下载代码,自已进行测试。“英伟达有很多想法,有些是新的算法、有些是额外的算法,我们都把它放到RAPIDS上去,而且每个月我们会基于客户给我们反馈,对它们进行优先化处理。” Marc Hamilton如是说。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

责任编辑:张诚 来源: 51CTO
相关推荐

2018-10-25 13:40:00

NVIDIARAPIDSGPU

2023-01-03 15:32:29

Aruba边缘计算安全

2017-04-13 11:20:56

机器学习代码

2020-04-16 09:18:45

MarsRAPIDSGPU

2020-09-28 20:44:44

机器学习开源工具编程语言

2017-06-23 14:11:56

2021-01-27 10:32:42

AI机器学习数据中心

2023-11-22 11:03:12

人工智能生成式AINVIDIA

2018-02-23 14:10:25

物联网

2020-10-22 09:14:59

NVIDIA

2020-12-18 14:59:01

腾讯云边缘计算

2022-07-20 15:11:28

加密货币金融比特币

2017-10-27 18:40:01

机器学习终身机器学习迁移学习

2022-10-25 16:18:41

人工智能机器学习金融

2022-10-18 09:57:40

​​Cloudera混合数据CDP

2014-12-23 14:57:42

开源项目机器学习

2018-03-04 08:22:35

谷歌开源机器学习
点赞
收藏

51CTO技术栈公众号