谷歌的人工智能研究人员最近展示了一种新的训练方式,可以让计算机理解为什么有些图像比其他图像更美观。
传统上,机器会使用基本的分类——比如判断一个图像是否有“猫”。新的研究表明,现在人工智能可以对图像质量进行评分,不管类别是什么。这个过程被称为神经图像评估(NIMA),它利用 学习训练卷积神经网络(CNN)来预测图像的评级。
根据研究人员发表的一份白皮书:“我们的方法与其他方法不同,因为我们通过卷积神经网络来预测人类的意见分数分布。我们的结果网络不仅可以被用来可靠地给图像打分,而且与人类的感知高度相关,并且还可以帮助在摄影通道中对照片编辑/增强算法进行调整和优化。”
NIMA模型避开了传统的方法,采用了10分制的评分标准。机器会检查图像的特定像素和整体美学。然后它会决定某一个评级有多大可能被一个人选择。基本上,人工智能会试图猜测一个人喜欢这张照片的程度。这并不能使机器获得感知或思考的能力,但它可能会让计算机成为更好的艺术家或策展人。这个过程可能会被应用于寻找一批最好的图片。
如果你是那种每次拍20或30张图片的人,为了确保你拥有最好的照片,这可以为你节省很多空间。假设,只要点击一下按钮,AI就可以查看存储中的所有图片,并确定哪些图片是类似的,然后保留最好的,删除剩余的。根据谷歌研究博客最近的一篇文章,NIMA也可以用来优化图像设置,从而产生完美的结果:
“我们观察到,由NIMA评分的对比调整可以改善基准的审美评分。因此,我们的模型能够引导一个 的CNN过滤器,找到其参数近乎理想的设置,比如亮度、高光和阴影。”
创建一个几乎和人类一样理解图像质量的神经网络似乎并不具有革命性,但对于拥有像人类一样视力的计算机应用程序却有很多。
为了让人工智能在现实世界中执行任务,比如在没有人类帮助的情况下安全地驾驶汽车,它必须能够“看到”并理解它的环境。NIMA,以及像它这样的项目,正在为未来的全功能机器打下基础。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )