看着上面的图片人类可以很容易的描述出“这是一个正在骑摩托车的人”、“三条狗在草地上奔跑”,但如果想让电脑“看”完图片之后能自动给出一段这样的概述就不是一件容易事了,而现在Google却已经做到了。
按照Google的说法,通过自行开发的机器学习系统,它们现在已经可以用自动化的方式来为图片添加自然语言描述。这项技术不但有望让那些对颜色不敏感的人群可以快速理解图片中的内容,也可以在网络状况不好的情况下用文本来暂时替代图片显示;当然,更重要的是它还可以让Google的图片搜索功能更强大。
在以前,业界在用计算机对图片进行自然语言描述时基本使用的都是计算机视觉和自然语言处理技术;但现在得益于机器翻译技术的进步,通过递归神经网络(RNN)转换,机器可以先把法语转换成一个矢量,接着另外一个RNN用户就可以通过这个矢量把法语转换成德语;这样Google只要能用另外一种具备图片识别能力的神经网络(卷积神经网络,CNN)替换掉第一个RNN就可以得到一句能描述图片的自然语言了。
所以整个自然语言的生成过程就是由读取视觉的神经网络CNN到产生语言的神经网络RNN,进而最终得到一句自然语言。Google方面的测试显示,这项技术的整体效果表现还不错。当然,我们从第一张图中也可以看到这其中是会出现一些小错误甚至完全不准确的情况,不过随着数据集的增加和成熟,整体的精确度会越来越高。
其实,早在今年6月份时,Google就发过一篇博客阐述它们是如何让用户可以根据图片中的内容来搜索;在9月份时,Google又更新了它们在图像中物体识别、分类和标记方面的进展。如今到了11月,Google在这方面的技术又有了新的突破。不难看出,最终机器将会更了解图片,而人们也会更容易找到自己想要的图片。
- 坦克400柴油版:回归实用主义,售价24.98万元起,不花哨的硬派越野车
- 优步CEO揭秘:马斯克拒绝合作无人出租车业务,背后真相究竟如何?
- 青岛消防新装备:机器狗,3.6小时不间断救援,实力演绎科技救援
- 王兴兴直言:国内教育体系陈旧,亟需改革
- 马斯克飞行汽车试飞:颠覆传统交通,200万飞行新时代?
- 俞敏洪反思教育弊端:传统教育改革迫在眉睫
- 马斯克砍向自动驾驶监管:裁员美国交管局,自动驾驶监管人员减半,引发行业震动
- 字节AI团队大变阵辟谣后:揭露背后不实信息的真实面目
- 360董事长周鸿祎宣布:取消抖音送车门槛,2月28日直播大放送,不再夸大宣传,真实抽奖!
- 北京新规:燃油车占用充电车位将被罚款+拖离,绿色出行新风尚
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。