AI手机摄影的三个流派,其中藏了个假的

在咱们身边,有一个铁打的定律,那就是一个东西或者名称火了,马上就会群起而模仿之。久而久之,这种“微创新”甚至“不用创新”的方式,被国人冠名为“山寨文化”。

互联网领域则更是如此,团购火了能百团大战,O2O火了能全面“开O”,共享经济火了,愣是连男友女友都能“共享”。

山寨得多,就连技术都可以山寨。比如说,去年手机AI刚刚崭露头角,到了今年,全面屏等技术普及之后,AI似乎就成为了各手机厂商普遍希望蹭的热点。

但问题来了,我们知道一块AI移动芯片要承载非常复杂的 架构,需要几年来部署开发;下围棋的AlphaGo要汇集几十位顶尖科学家的心血,几年迭代才能正式超越人类。

代表了机器智慧向人类接近的AI,难道真的有那么容易吗?

去年音箱大战的时候,有的跟风山寨产品甚至随便搭载个对话系统,连唤醒词都不换就披挂上阵。虽然对话交互这种形式也可以叫做“AI”,但这样的产品真的一点价值都没有。买到的用户只能惊呼:遇到个假的人工智能

今年,似乎轮到了手机AI遭遇这种奇遇。各厂商纷纷投入AI怀抱成为流行时,假的AI手机似乎也悄然来到了我们身边。

诚然,AI是一个泛概念,不同等级、不同完成度的技术孕育其中。但AI也不应该是一个永远跌落,毫无底线的技术。如果沾边就算的话,茶杯上加个计算合适水温的算法岂不也成了AI设备——问题是这事人类自己就能感觉出来啊。

所以说,AI的真与假,是建立在能给使用者带来哪些实际价值基础上的。有无法被其他技术解决方案替代的价值,或许才是消费者需要的真AI。也只有如此,AI作为一种技术才能持久。

AI手机的真与假,或许也应该有个边界。本尼迪克特·安德森在著名的《想象共同体》中,把极限特征作为框定族群的核心要素。AI手机带给消费者的价值,应该有哪些底线或者说边界呢?

今天开始,我们会用几篇文章,跟大家聊一聊手机AI背后的真实、夸张与谎言。摄影、游戏、视频这些我们耳熟能详的功能背后,一个到底什么是真AI手机的话题正在逐步清晰起来。

而这个话题首当其冲的,当然是AI摄影。

我们知道,识别和感知物理世界, 是AI的主要能力。利用AI算法进行影像理解,构成了AI技术的核心组成部分之一——机器视觉。而移植到手机上,AI与摄像头结合,带来摄影体验改变也就变成了手机AI的核心价值。

进入2018的春天,AI摄影近乎成为了每一款新上市手机的关键词。但其实AI是一个非常宽泛的概念,包括林林种种数十个技术体系。

就像同样是邀请朋友去看“水景”,去马尔代夫和去小区健身房看游泳池是绝不一样的。AI也是如此,耗资巨万的AlphaGo和成本几十块钱的语音交互音箱,可能都可以算到AI的体系,但价值之差等若霄壤。

在手机摄影这个领域也是如此,如何实现AI,如何让AI被消费者感受到,目前出现了完全不同的一些思路。今天的AI手机摄影,可以分为三个流派。

流派一:用芯片提供AI摄影通用加速

去年,华为发布了搭载NPU的麒麟970芯片开始,之后苹果也公开了A11仿生神经芯片。从后来华为、荣耀的相关搭载产品,以及苹果iPhoneX来看,基于AI专用芯片来实现手机的AI摄影功能,是这类手机的核心AI能力。

这可以看做是手机AI摄影的第一个流派:芯片派。

华为和荣耀搭载的麒麟970芯片,是世界上首款在CPU、GPU两个通用处理单元之外,加入了AI处理单元NPU(Neural network Processing Unit,神经网络单元)的移动芯片。由于利用了 学习处理技术,NPU可以比其他处理模式更快地处理卷积、迁移等 学习任务,也就可以达成更快的AI任务处理能力。根据数据显示,处理相同的AI任务,麒麟970的异构计算架构拥有约 50 倍能效和 25 倍性能的提升,图像识别速度可达到约2000张/分钟,这个记录迄今没有其他芯片打破。

在这之后,苹果也在发布iPhone X时发布了A11芯片,两家不约而同采取了相似的策略。A11集成了一个专用于处理AI任务的运算单元“神经网络引擎(Neural Engine)”,开启了iPhoneX的AI之路。

从底层芯片开始一层层叠加AI处理能力。有两个层面的价值,一是在硬件里完成终端AI计算,可以保证摄像任务的实时性和安全性。毕竟摄影任务上传到云端计算有卡顿可能,断网后无法工作,图片上传服务器面临的数据危险也是显而易见的。

另一方面,芯片派容易被忽略的价值在于对AI摄影任务进行通用加速。比如有的玩法要人脸识别,有的直播要读取动作指令,有的滤镜要搞空间处理,把这些全挤在CPU、GPU上手机马上会进入龟速状态,用云处理无法支持不说,更丧失了实时体验。APP的摄影需求有千千万,目前来看只有在终端有AI处理单元才能满足这些“未知需求”。

说到底,基于芯片的AI摄影到底有哪些体验呢?

华为Mate10、荣耀V10以及iPhone X的能力数据说明,AI摄影可以体现在识别、动作捕捉、光影分析、AR等几个方面。

比如iPhoneX利用A11仿生芯片,可以与结构光传感器、 陀螺仪进行结合,处理人脸、AR等任务,并可以快速处理图像识别。

而借助麒麟970芯片带来的NPU专项处理能力,荣耀V10、华为mate10等产品可以实现复杂的AI任务加速,从而完成场景识别拍照模式、图像增强与 处理、AI肖像处理、AI动态捕捉、AI夜拍等任务。包括当下较为少见的图像语义分割功能,通过强计算能力实现对取景器内的画面进行分割处理,进一步实现精准的智慧分区图像处理,相较图像处理App更接近修图师的专业效果。

接下来,荣耀、华为的新产品,以及新一代iPhone必然会继续这条路。而产品和技术先发优势,似乎也在催生AI体验的升级。比如荣耀最早从magic时代就开始积累AI手机的产品经验与训练数据,两年的时间自然形成了对新产品的供养体系。

这个流派的优点在于,用户可以体验到AI的多样化和增长性,手机里不是一成不变的AI体验,而是可以随着生态和技术的发展不断进化。问题是芯片流的门槛很高,需要研发的巨大投入和长达几年的等待周期。

流派二:基于摄像头搞AI

第二个AI手机摄影流派,不能不提到让人爱恨纠葛的谷歌。

众所周知,谷歌是不大力押注硬件技术的,而是在战略上选择强打AI算法优势和云计算强项。这个被谷歌称为AI First的战略,已经体现在谷歌各种穿戴、家庭以及移动设备上,其中pixel系列手机也不例外。

去年推出的谷歌pixel 2,给出了一个非常特别的AI摄影模式,它没有专属的AI芯片,却利用算法和AI图像处理单元完成了动态模糊摄影等摄影能力的补偿。甚至把摄像头切割成非常复杂的成像单元,来供给算法端实现对景深、空间感的AI计算。

这种“吃力不讨好”的方式,大概也只有谷歌会做。背后的核心原因,一方面是谷歌希望用户适应所有数据都上传到谷歌云的生活方式,另一方面也是希望加强AI优势的商业化通道。

谷歌手机的AI秘诀,不在底层芯片里,而是在摄像头区域里藏了一颗专用图像处理协处理器,即ImageProcessing Unit (IPU),专门用来结合云计算与算法集群处理AI拍照与视频任务。

但这样做的问题是图像任务会在专门的部件里处理,并且极大程度依赖云计算。但确实一定程度上绕开了开发芯片的难度,弥补了谷歌硬件上的弱势。这种剑走偏锋,让手机各部件自行AI的思路,有赖于谷歌强绝天下的算法积累,以及云计算处理能力。缺点是:除了谷歌大概没有人可以尝试。

流派三:搞个带算法的APP算了

在手机AI概念火热起来之后,国内手机厂商似乎很快就按耐不住了。雨后春笋版的“AI摄影”字样应运而生,于是也催生了AI摄影的第三个流派:APP派。

所谓APP派很好理解,想一想我们用的各种美颜拍照相机、动态美颜录制应用等等,这些能力,在今天基本都要用到AI算法来实现更好的效果。比如美图秀秀旗下的美图相机,就是在APP里集成了机器学习算法,用来识别拍摄人像和背景、光源间的关系,从而把人像分离出来。

假如把这种基于算法的“AI应用”或者“AI滤镜”,直接搭载到产品摄像头里,说这是AI摄影功能,行不行呢?

好像,大概,可能,也可以吧?

问题是缺少芯片的支持,算法方面也没有技术优势,用户拿到的AI体验可能存疑。

前不久,红米Note5主打了所谓“千元AI双摄”打开了这场关于AI的宣传战序幕。随后vivo X21也以AI摄影能力作为宣传。从产品说明中可见,这两部手机的解决方案基本就是上文所说的“AI滤镜”模式:开发具有一定识别特性的摄影功能,然后在不卡的前提下部署在手机中就可以了。

刚刚发布的小米Mix2S,本质上也是这种解决方案。小米提出的智能场景识别,即在利用图像数据训练处手机对不同景物的识别能力,再在手机相机中初始化搭载“美图相机”之类APP的算法功能,针对不同拍照对象进行针对性修图。

比如机器学习进行人脸和人体轮廓识别,自动进行背景虚化和抠图,以及自动叠加多张照片进行防抖等等。

这类手机的问题,在于芯片和摄像头中缺乏专项处理AI任务的单元,一旦运行高负载的AI任务就需要呼唤云端。而云端的相应速度不够,又导致AI摄影的识别率和准确率下降。

举个例子,处理夜拍效果时,手机需要运用光源捕捉、空间捕捉等AI算法,从而实现夜晚中清晰拍照和光源还原。

而这类APP派假如要加载夜拍类的AI应用就有点尴尬了。因为这类 学习的负载很大,用传统移动芯片+云计算来跑这类AI拍摄任务,会出现黑夜一层层褪去,半天无法对焦。拍照之后又要上传到云端进行很长时间“处理”,精准度和体验都很差。而一旦没网就更麻烦了。所以我们能看到的是,目前大部分国产手机宣传所谓的AI拍照时,都绝口不提夜拍、动作捕捉等复杂任务。

于是,这个流派中消费者看到的宣传材料里的“AI拍照”,也就变成了整个手机的全部AI能力。其实这些能力弄个不算太差的手机下载个相关APP就可以实现了,单独作为一款产品的主要宣传材料就有点奇怪。

最后,让我们总结一下三个流派的手机AI摄影,到底带给消费者怎样的差别。

芯片派:可以通过终端AI加速,来实现比较高等级的AI摄影任务,比如快速美化、物体识别方案拍照等等。而且通用加速能力和平台接口下放给开发者,更多的拍照应用,比如夜拍、动作抓拍、人脸替换、体态命令等等,必然会陆续加入到用户的手机中。用户相当于购买了持续升级的AI拍照设备。

摄像头派:基于摄像头的AI芯片,应该可以加入更多AI玩法,但是除了谷歌之外,其他开发者是绝对碰不到的。

APP派:抱歉,除了广告语上的1~2个基础AI功能外,别的就不用想了。

三个流派背后手机AI的孰真孰假,也就一目了然了。接下来一篇,我们会聊聊手机游戏上的真假AI。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2018-03-27
AI手机摄影的三个流派,其中藏了个假的
原标题:AI手机摄影的三个流派,其中藏了个假的在咱们身边,有一个铁打的定律,那就是一个东西或者名称火了,马上就会群起而模仿之。久而久之,这种“微创新”甚至“不用创新”的方式,被国人冠名为“山寨文化”。

长按扫码 阅读全文

Baidu
map