【51CTO.com原创稿件】利用GPU处理语音、视频、图片等非结构化数据已经成为行业共识,在今年的GTC大会上,NVIDIA不但发布了一系列全新的GPU芯片,而且还重点介绍了用于加速计算的RAPIDS。NVIDIA解决方案架构与工程团队副总裁Marc Hamilton在接受记者采访时表示,NVIDIA在深度学习领域已经专攻了六年,RAPIDS并不是一个全新的算法。它不是教人们怎么去编写新的代码,而是把已经写好的代码放在CUDA上,数据科学家不需要重新学习软件的用法,完全可以利用现有的软件,并为深度学习快速。据介绍,由于RAPIDS是开源的,所以软件中没有的功能企业可以自己去编写代码实现。
NVIDIA解决方案架构与工程团队副总裁Marc Hamilton
让机器学习算法加速的RAPIDS
XGBOOST是机器学习中一个比较好的算法,Marc Hamilton告诉记者,现在越来越多的公司开始采用XGBOOST算法。他表示,每个企业都有不同的业务需要用到深度学习,如果企业同时有五个决策树,如果用CPU服务器计算,需要几周甚至几个月的时间,这是因为在每一个树状图的接替过程中,一个服务器与另外一个服务器要进行大量的信息交换,整体速度都被拉低了,利用RAPIDS则可以很好的解决这个问题。
RAPIDS不需要创造新的算法,只是为了让XGBOOST和其它机器学习算法提速。RAPIDS里有两个部分组成:***个是cuDF,它是CUDA的数据框架。第二个是cuML,它是CUDA学习。据介绍,数据框架是帮助用户收集数据的,cuML和CUDA机器学习只是GPU支持XGBOOST或者其它的人工智能库。cuGRAPH是专门处理图像的,可以跟很多的软件相连。
Marc Hamilton表示,RAPIDS的***层是通过CUDA进行编程。他强调,加速有不同方式,一种方式是在CUDA上对软件进行重新编程,第二种方式是使用CUDA软件库、cuML及机器学习的软件库,用来加速XGBOOST。第三种加速方式是在软件应用层面的加速,比如:SAP或者Oracle的某些工程的功能已经是通过GPU加速了。
开源让RAPIDS简单易用
据Marc Hamilton介绍,RAPIDS是开源的,非常易用增加新的功能,不需要重新学习。
Marc Hamilton表示,现在很多新软件的开发过程和老软件非常不一样,如果买Oracle的数据库,需要一年更新一次。RAPIDS每天都会把新的代码放到上面去,每30天会把这些数据部署到英伟达的容器里,然后把它放到“云”上去。
“如果今天你用当前版本RAPIDS用的非常好,那么这个版本会被放在容器里头一直待在“云”上,什么时候想用都会在那里,它并不会消失。” Marc Hamilton表示,如果你喜欢英伟达RAPIDS的下一个月的版本中的某个功能,就可以在下个月把新版本下载下来使用。
据了解,“云”上的大部分版本都是由英伟达经过测试之后的,有一些版本没有经过测试,用户想要使用的,也可以自己下载代码,自已进行测试。“英伟达有很多想法,有些是新的算法、有些是额外的算法,我们都把它放到RAPIDS上去,而且每个月我们会基于客户给我们反馈,对它们进行优先化处理。” Marc Hamilton如是说。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】