作为催化剂,RAPIDS能让人工智能提速到多少?

[摘要]时至今日,已经没有人会去怀疑人工智能最终会改变世界的最终结果了。只不过,从技术角度来看,人工智能的爆发点决定于某几项技术。也许,这
时至今日,已经没有人会去怀疑人工智能最终会改变世界的最终结果了。只不过,从技术角度来看,人工智能的爆发点决定于某几项技术。也许,这几项技术的成熟之日,就会是人工智能催城拔寨之时。这也是RAPIDS和人工智能听起来相距甚远,实则却息息相关的原因。

数据科学家的甜蜜烦恼

尽管在中国,新手级别的数据科学家的年薪已经达到了20万人民币,但从全球范围来看,这个数字还是偏低,因为还不及美国同岗位年薪的三分之一,由此可知数据科学家的价值。但雇佣数据科学家的老板却相当烦恼,原因就在于数据科学完即使在工作期间,也有充足的时间去喝咖啡。以致于数据科学家有一个甜蜜的烦恼:被说成是不是去喝咖啡,就是在去喝咖啡的路上。

其实个中真实的原因,并非是因为数据科学家想要偷懒,而是计算系统处理海量的数据时间过长,以致于数据科学家将数据上传之后,有相当长的时间处于无事可做的状态。而这个时候,咖啡往往成为数据科学家们的最佳伴侣。

NVIDIA解决方案架构亚太区高级总监赵立威

但也许数据科学家们不曾想到,这份闲适的“甜蜜烦恼”正在走向终结,并且这份终结来源于一个看似和他们并不相关的RAPIDS平台。虽然NVIDIA在10月10日,才将RAPIDS平台公诸于众。因此由于时间太短,大数据行业还有人在怀疑它的能力,但在NVIDIA解决方案架构亚太区高级总监赵立威看来,这个结果是一定的。他毫不犹豫地给出了这样的结论:“RAPIDS平台可以为数据科学家提供在GPU上运行整个数据科学管线的工具,与仅用CPU的系统相比,计算速度将加快50倍。这意味着可以帮助数据科学家将模型训练时间从数天减少到数小时,或者从数小时减少到数分钟。”

细说RAPIDS平台

有人将硬件和软件比喻成容器和水的关系,硬件如容器,当容器变大之后,软件应用会如水一般,把容器盛满。但就算在后摩尔定律时代,硬件容器的增长也总是受限的,而云计算、大数据、人工智能等一浪高过一浪的技术浪潮,数据对传统企业而言,已如工业革命时代石油的重要性一样。所以在硬件算力增长有限的条件之下,如NVIDIA这样的厂商,就开始在硬件和软件应用息息相关的算法上做文章。

在硬件方面,与只应用CPU的系统不同,NVIDIA的GPU加速计算在应用CPU之外,还同时利用图形处理器,这样就可以加快科学、分析、工程、消费和企业应用程序的运行速度。但相应地,应用软件也需要做调整。为了让这种调整工作做到工作量最小化,同时工作效率最大化,RAPIDS平台登台亮相了。

考虑到讲解底层技术较为枯燥,赵立威给出了一张RAPIDS平台RAPIDS平台(如下图)。

赵立威介绍说:“在大数据应用市场上,Python语言的作用非常重要。由于大数据的应用,Python这种科学计算语言,已经变成了面向数据科学家的应用语言。而为了支持PYTHON语言开发在GPU下的应用,它就需要不同类型的数学函数库。这个数学函数库在经历了一系列的演化过程,最终形成了一个基本的框架,也就演化出了今天的RAPIDS平台。”

同样在这张架构图中,眼尖的人会一眼认出Apache arrow,它是 Apache 基金会全新孵化的一个顶级项目。它设计的目的在于作为一个跨平台的数据层,来加快大数据分析项目的运行速度。这样,RAPIDS平台一定是基于开源标准的。赵立威肯定了这一说法:“RAPIDS平台本身就是开源的,它基于开源标准,将使得数据转换更容易,目前它已为GPU加速分析和机器学习提供了一整套开源库。将RAPIDS平台、Python、Apache arrow配合起来应用,无论是数据准备、模式训练,还是最后的可视化,RAPIDS平台都有不同的模块给予支撑。”

360亿美金的大市场

分析师估算,面向数据科学和机器学习的服务器市场,每年价值约为200亿美元,加上科学分析和深度学习市场,高性能计算市场总价值大约为360亿美元。而此次通过RAPIDS平台,NVIDIA进入这一市场的步伐又深入了一步。

赵立威介绍说:“RAPIDS平台几年来进行的不只是技术上的积累,时至今日,我们已经通过和开源社区、IBM、惠普、Oracle、思科、联想、SAP的合作,形成了一个全球生态系统。而像沃尔玛这样勇于尝试的企业,也已经通过应用RAPIDS平台, 通过对历史数据的挖掘和预测,解决了生鲜类产品的库存问题,用数据去调整库存存,既保证了不同季节的备货,也解决了生鲜类产品的保质问题。”

回到我们的题目,作为催化剂,RAPIDS能让人工智能提速到多少呢?这其实是一个极难回答的问题,因为图灵奖获得者,计算机体系专家David Patterson早就指出,现在的IT技术面临新的挑战:摩尔定律也面临困难,晶体管的提升变慢。在架构上也有新的问题出现。这些问题突出体现在我们的应用对算力的需求,已经远远超过正常意义上的算力增长。这样应用需求算力与实际能增长的算力之间,已经构成了一对矛盾。而解开这对矛盾的关键,就是软硬件的结合,传统意义上的硬件工程师和软件工程师,将不得不进行一次大规模的跨界开发。RAPIDS平台不过是顺应这个大趋势的一次尝试。接下来,RAPIDS平台还会实现可视化操作,可以说,它未来的路还很长很长。与之下对应,人工智能应用的普及一定会提速,并且会随着RAPIDS平台这类技术的迭代,变得越来越快。




版权声明:

凡本网注明”来源:中国软件网(http://www.soft6.com)”的所有作品,版权均属于中国软件网或昆仑海比(北京)信息技术有限公司,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

任何行业、传播媒体转载、摘编中国软件网(http://www.soft6.com)刊登、发布的产品信息及新闻文章,必须按有关规定向本网站载明的相应著作权人支付报酬并在其网站上注明真实作者和真实出处,且转载、摘编不得超过本网站刊登、转载该信息的范围;未经本网站的明确书面许可,任何人不得复制或在非本网站所属的服务器上做镜像。

本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,昆仑海比(北京)信息技术有限公司将追究其相关法律责任。