内容生产背后的人工智能

过去几年涌现出的一系列人工智能技术,为内容生产提供了强大的工具。

漫步于卢浮宫无数画作中,你是否期待一位画师为你记录下独一无二的瞬间,给这个世界留下一份凝视与回眸?走进国家图书馆浩瀚书海中,你是否期待有人陪你一同探索世界?意外闯进J.K罗琳创建的魔法学校,你是否期待有人为你递上魔杖让所有平面之物跃然纸上?

随着不断迭代的算法和不断增强的算力,最新的人工智能技术正悄然将这一切变成现实,这些建立在数学基础上的抽象能力正成为人类拥有特殊技能的朋友,与我们共同追逐着未来的无限可能。

写实派画家——GAN

生成对抗网络(GAN/Generative Adversarial Networks)就像这个时代的写实派画家,这位画家的大脑和画笔就是Generator和Discriminator两个网络。在实际使用过程中,我们提供真实输入后,它会在Generator中生成假图片并在Discriminator中和真图做对比。起初,Discriminator很容易分辨真假图片。但随着Generator通过Discriminator的反馈不断优化生成的图片,分辨难度不断提升。最终,当Discriminator没办法分辨真假时,假图片就作为最终产物出现在了我们面前。

自诞生以来,生产对抗网络就在鸟类、花卉等图片的生成上不断展现出惊人的能力,而其生成的足以乱真的人脸照片和根据文本描述生成的照片,已经成为设计师必备的工具:前者可以作为素材库让设计师轻松积累素材,后者则能帮助设计师可以快速定向获取设计灵感来源。

印象派画家——VAE

除了“写实派画家”生成对抗网络,人工智能领域也有“印象派画家”——变分自编码器(VAE,Variational Auto-encoder)。不同于生成对抗网络,变分自编码器在获得输入时会先用“取色器”(编码器,encoder)提取画面的重要信息,并以此为核心拓展范围。例如,编码器取“红色”后会将该信息扩大到“红色系所有颜色”,再将这些扩大后的信息作为生成元素,举一反三生成更多新数据。

目前,这位AI时代的“梵高”已经在包括图像和音频合成等领域找到了施展空间。由于举一反三的属性,变分自编码器生成的新数据具有更好的扩展性和多样性,也更方便地设计师对这些数据做定向调整,从而将更符合预期的数据存入素材库作为灵感来源。

语言课代表——BERT

如同机器将图片依性质拆解为RGB等数值后才能理解图片一样,BERT(Bidirectional Encoder Representations from Transformer)也依据对文本的拆解在纷繁的语言世界中找到了梳理脉络、理解奥秘的方法。

我们可以将BERT理解为做英语试卷的考生,第一道题“MLM(MASKED LANGUAGE MODEL)”类似完形填空,我们给BERT的语料库会随机遮挡15%的词语,让BERT根据上下文猜测空缺部分从而训练其了解不同语境下的词语运用,进而更准确的对语义做出理解。第二道题“NSP(NEST SENTENCE PREDICTION)”会给到成组的句子,让BERT判断两个句子是否连续以及句子间的关系。有了这些基本能力后,我们只要增加输出层训练就能将BERT应用到不同场景。

目前,诞生不到五年的BERT已经可以和阅读理解、搜索与信息检索结合起来,帮助设计师将多轮对话等场景变成现实。除此之外,BERT还能利用其理解学习能力在长文本中提取出重点内容信息,让人们可以更高效地理解文本。

让二维变立体的神奇魔杖——NeRF

在更高维度上应用人工智能技术的努力从未停止,神经辐射场(NeRF,Neural Radiance Fields)的脱颖而出因此并不意外。神经辐射场能将图像分为3个空间位置向量和2个相机观测向量,在此基础上输出体密度(volume density,可以理解为透明度)和基于观测角度的物体空间点色彩,完成从“空间点位置+观测角度”到“空间点色彩+体密度”的映射。

在三维空间重建二维图像具有广阔应用前景。它能帮我们准确快速建立数字人体,从而成为数字人领域重要的建模工具;它也能运用到自动驾驶行业,让现实路况和虚拟情况实时融合,为自动驾驶提供天气和雨雪等场景数据,让设计师围绕人车交互进行更准确的设计思考。

技术从不抽象,它们总能直观地刺激我们的感官、激发我们的想象力。伴随着代码的迭代,技术终将以更加具象的形式成为我们的朋友。我们也将与它一同探索未知并阐述理解、思考艺术并定格瞬间,突破边界并一同走进那个虚实融合且酝酿着无数可能的“魔法世界”。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2023-03-17
内容生产背后的人工智能
过去几年涌现出的一系列人工智能技术,为内容生产提供了强大的工具。漫步于卢浮宫无数画作中,你是否期待一位画师为你记录下独一无二的瞬间,给这个世界留下一份凝视与回眸?走进国家图书馆浩瀚书海中,你是否期待有人陪你一同探索世界?意外闯进J.K罗琳创建的魔法学校,你是否期待有...

长按扫码 阅读全文

Baidu
map