2019 ISSCC 大会于2月17—21日在美国旧金山开幕,Facebook 首席 AI 科学家 Yann LeCun 在会上发表了主题演讲「 学习硬件:过去、现在和未来」,详细介绍了 学习研究的发展将如何影响未来硬件架构。
如今,只要在网络上搜索“ 学习”算法,都会显示很多相关的信息,在过去的数十年里,人工智能已经越来越成功地应用于生物识别、语音识别、视频识别、翻译等。国内更是诞生了诸如旷视科技、商汤科技、极链科技Video++、依图科技等优秀人工智能初创企业。设计人员将大量高度并行的计算加载到硬件上,尤其是最初为快速图像渲染而开发的图形处理单元(GPU)。这些芯片特别适合于计算密集型“训练”阶段,该阶段使用许多经过验证的例子来调整系统参数。在“推理”阶段,其中部署 学习处理的输入,需要更大的存储器访问和快速响应,目前已经可以使用GPU实现。
学习与GPU
为了快速应对增长的需求,许多公司都正在开发能够直接赋予 学习能力的硬件,迫切的需要进行推理以及培训。近年来随着 学习的迅速发展,卷积神经网络(Convolutional Neural Network)被广泛使用,特别是在图像识别场景中的应用。为了满足更多场景应用,需要有一种能够根据实际场景需求替换不同CNN网络模型的系统框架。在过去的20年里,视频、游戏等产业推动了GPU的进步,其绘制图形所需的矩阵正是 学习所需的计算类型。
GPU技术的进步则是推动了神经网络的发展,因为在没有GPU的情况下训练 学习模型在大多数情况下会非常缓慢。许多人把生产中 学习的想法想的过于复杂,我们可以在生产中使用CPU和选择的网络服务器进行深入学习。生产中进行训练是非常罕见的。即使你想每天更新你的模型权重,也不需要在生产中进行训练。这意味着你只是在生产过程中进行“推理”,比“培训”更快更容易。你可以使用任何你喜欢的Web服务器,并将其设置为简单的API调用。如果能够有效地批量处理数据,GPU只会提供更快的速度。
GPU在处理图形的时候,从最初的设计就能够执行并行指令,从一个GPU核心收到一组多边形数据,到完成所有处理并输出图像可以做到完全独立。由于最初GPU就采用了大量的执行单元,这些执行单元可以轻松的加载并行处理,而不像CPU那样的单线程处理。另外,现代的GPU也可以在每个指令周期执行更多的单一指令。所以GPU比CPU更适合 学习的大量矩阵、卷积运算的需求。 学习的应用与其原先的应用需求颇为类似。GPU厂家顺理成章的在 学习,找到了新增长点。
学习发展是否出现“瓶颈”
我们之所以使用GPU加速 学习,是因为 学习所要计算的数据量异常庞大,用传统的计算方式需要漫长的时间。但如果未来 学习的数据量有所下降,或者说我们不能提供给 学习所需要的足够数据量,是否就意味着 学习也要进入“瓶颈”了呢?
做 神经网络训练需要大量模型,然后才能实现数学上的收敛。 学习要真正接近成人的智力,它所需要的神经网络规模非常庞大,它所需要的数据量,会比我们做语言识别、图像处理要多得多。假设说,我们发现我们没有办法提供这样的数据,则很有可能出现瓶颈。
目前, 学习还在蓬勃发展往上的阶段。比如我们现阶段主要做得比较成熟的语音、图像、视频方面,整个的数据量还是在不断的增多的,网络规模也在不断的变复杂。可以说 学习是GPU计算发展的关键,谁能找到最适合 学习的模式,谁就是胜利者。
结语:
学习经过这么长时间的发展,在网络的种类、复杂程度和处理的信息量上都发生了天翻地覆的变化。当前,网络种类上,从早期的 AlexNet 和 GoogleNet 到现在各企业推出的 GAN以及各种 强化学习的网络,它们各自网络结构都有不同,开发者在适应最新的网络上常常会遇到一些麻烦。处理的信息量也在成倍地增长,算力需求越来越高的情况下,也将对搭载处理单元的硬件有着更高的要求。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )