新算法增强无人车在仿真环境中的训练效果

人阅读

2020-03-11 10:29:00

相关关键词
- 人工智能
- AI

滑铁卢大学CogDrive实验室探索了基于Domain Randomization 的模拟器到真实世界知识迁移算法。该算法可以使用效果较弱的domain adaptation方法来进行定向数据增强，让诸如自动驾驶汽车的智能体获得真实世界可用的策略。

随着数据科学的发展，很多之前过于复杂，难以解决的问题都可以通过数据拟合的方式来解决。基于学习的算法一般都基于独立同分布的假设，即用于训练的数据与真实环境遇到的数据符合统一分布，且相互独立。要符合这一假设，在训练时需要采集大量数据以覆盖真实使用时可能遇到的场景。对于自动驾驶，对数据量的需求格外巨大，而数据采集的过程是昂贵，费时费力，甚至危险的，数据标注的过程更是需要大量人力。

而模拟器作为一个廉价但有准确标注的数据源，如果可以解决模拟器与真实世界数据上的差异，带来的训练得到的策略上差异，将可以在自动驾驶领域发挥巨大价值。从统计学上讲，模拟器上的策略可用于真实世界的原因在于，模拟器于真实世界的数据具有相似的条件概率，仅是边缘概率有较大差异。通俗的理解就是，人在模拟器中的驾驶策略与在真实世界的驾驶策略是相似的，仅是模拟器里的车与真实世界的车，道路长得不太一样。

Figure1领域自适应与邻域随机化

为探索模拟器数据对于真实世界自动驾驶的可用性，滑铁卢大学CogDrive实验室探索了基于Domain Randomization 的模拟器到真实世界知识迁移算法。主流的用于知识迁移的邻域自适应算法一般是基于度量的，算法的关键在于量化两个不同数据分布之间的差异，最终寻求一个将两个数据分布映射到同一特征空间的映射函数。而Domain Randomization类算法一般侧重于寻找两个不同数据分布的共同特征空间（common latent space），再基于这个共同特征空间进行进一步的训练。

对于自动驾驶模拟器与真实的驾驶环境，一个先验知识是模拟器与真实世界在图像纹理，光照条件上有较大不同，而在几何信息上大致相同，基于这个先验知识，可以尝试构建一个从模拟器迁移到真实世界的语义分割算法。

一般的 Domain Randomization 方法首先对模拟器图像进行一些自定义的图像增强，然后使用增强后的图像进行训练。该团队的Domain Randomization则是基于图像风格迁移来进行随机化，从而进行知识的迁移。图像风格迁移（Neural Style Transfer）可以视作一种一类图像到另一类图像的Domain adaptaiton。使用图像风格迁移来进行Domain Randomization，实则是在使用一些效果较弱的Domain Adaptation方法来定向增强训练数据，从而使得目标域数据分布属于训练数据分布。

相比手工定义的图像增强，基于风格迁移的方法可以起到更好的效果。随后一个基于 Conditional GAN的随机化后的图像到原图像的映射网络被进一步用于将随机化后的图像映射为其对应模拟器原图。由于随机化后的图像与目标域图像有一个共同的特征空间，这个映射函数同样可以用于将真实世界的图像映射到对应的模拟器“风格”的图像，从而可以将一个完全由模拟器数据训练的语义分割模型应用到其中。

整个流程如图3所示。在真实数据使用过程中，仅有一个generator需要添加在语义分割模型之前，用于将真实世界的图像转化为符合模拟器数据分布的图像。

Figure3训练流程

更进一步，最后加在具体的任务网络前的这个Generator，它的作用在于将边缘分布与训练数据有一些差异的数据映射到与训练数据相同的边缘分布。这样一个模块不只可以用于完成模拟器到真实世界的知识迁移，也可以用于增强模型的鲁棒性。

在模拟器中使用该方法，可以定向增强训练数据，让无人驾驶汽车获取真实世界可用的策略。

（免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。）

新算法增强无人车在仿真环境中的训练效果

为您推荐

通信+AI新动向！德电与谷歌云合作开发网络智能体，优化RAN运营

差距仅仅0.3%！李飞飞最新报告揭示：中美AI模型性能基本持平

关税重锤下iPhone或涨价43%，苹果进入“帝国”崩塌倒计时？

电信行业如何在生成式人工智能时代蓬勃发展？

美科技七巨头遭特朗普关税血洗市值蒸发14万亿

苹果智能家居中心因AI问题延迟发布，预计发售期将推迟至2026年

微软否认停止中国区运营裁员实为旗下合资公司微创

五年复合增长率达35.2%！2028年中国AI总投资规模将超千亿美元

OpenAI宣布GPT-5推迟数月发布技术整合难度成倍上升

联合国警告：AI是把双刃剑，可能影响全球40%工作岗位

上一篇

下一篇