原标题:黑科技刷屏乌镇后,快手背后的AI天团终于现身了
当一家以短视频业务为主的企业进行产业延伸,它们会选择哪些方向?相信大多数人脑海中会立刻闪出这些答案:连接电商流量变现、建立MCN机构自制节目等。其实所有以内容为起点的产业,发展路径也大致如此。也正因如此,很多内容平台对于流量过度依赖,要大力维护平台头部博主或不断靠外部广告引流,最终使运营成本居高不下。
但同样以短视频为起点的快手,却给出了不同的答案。
科技公司:从短视频出发能到达哪些地方?
在今年的乌镇互联网大会上,有一个展台被围得水泄不通,好奇的观众、媒体排起了长队都想体验下展台上的黑科技。这个展台是快手的展台,但展台如此火爆并非是因为非常受欢迎的“手工耿”这样的快手网红,而是三项参与感较强的黑科技。
其中有 “世界上另一个你”,通过人脸识别找到快手平台上跟你长的最像的用户,就连现场体验的印度记者也找到一位和自己非常相似的印度快手用户;还有“快手平安系统”,可以将官方发布的国家预警信息第一时间推送给灾害发生地用户,并且聚集理解发生地用户所拍摄的视频向国家提供一线信息;最后还有快手的“萌面”魔法表情,把人的脸部表情实时复原在可爱的卡通形象上,把曾经只有苹果X独有的animoji玩法普及到了iOS、安卓的所有机型。
这三项黑科技,体现了快手这家科技公司在做的探索,通过短视频、通过AI等科技,带给用户更新奇的体验。
首先是对于人脸识别技术的无限应用可能。
在“世界上另一个你”项目中,快手所展示的其实是其量级极大、覆盖面极广的人脸数据库,以及适用于多种特征的识别技术。要知道不同性别、不同人种的人脸特征是有很大差异的,当数据样本分布不均时,就会出现自拍无法被识别五官的情况。
尤其是如今人脸识别已经成为一种高度商业化的AI技术,快手所展示出的不光是技术实力,还有面向全球的商业前景。
第二则是利用巨大用户量和AI技术对于智慧城市的补充。
快手平安系统可以说是和快手当下主营业务关联最小的技术了,可也是最具有实用性的之一。灾难预警一直是智慧城市建设的目标之一,但在智慧城市建设的过程中,快手可以凭借着自己巨大的用户量和对三四线城市及乡镇地区的覆盖来予以补充。
当乡镇、农村还来不及布设那么多应用于智慧城市的传感器时,平安系统对于用户拍摄内容的理解就让居民本身变成了更灵活的传感器,及时地搜寻信息。其实不止灾难预警,在用户分布基础和内容理解能力下,很多我们渴望通过智慧城市实现的效果,也能通过快手实现。
第三是利用技术对于软硬件进行协调。
快手的多媒体内容理解部门所推出的“萌面”魔法表情,让千元机也能实现iPhone X人脸结构光的效果,其实这种算法实现or硬件实现的分歧也曾在手机厂商中出现。之前谷歌的Pixel就一直坚持采用单目摄像头来实现双摄效果,解决途径就是算法。对于一些低造价的硬件产品来说,能够提升体验的算法非常重要。
快手在这方面的优异表现,也为自己赢得了更多和硬件厂商对话的可能。
内容淘金的AI天团:比黑科技更神秘的快手多媒体内容理解部门
也就是说,和其他很多内容产品不同,快手在技术本身、应用场景挖掘和硬件协调三个方向上都有很强大的延展能力。这种强大延展能力的来源,就是快手本身丰富的内容源。
内容虽然是金矿,但能让金矿发挥出价值的还是淘金者。在快手大量视频内容中淘金的,是快手的多媒体内容理解部门(英文全称:Multimedia Understanding 简称:MMU)。上文提到在乌镇刷屏的黑科技,就出自快手的多媒体内容理解部。团队由近百名算法工程师、应用工程师构成,聚焦多媒体内容的理解与应用。在内容理解方面,MMU主要通过对人脸、图像、音乐、视频四个维度实现对多媒体内容的感知,并融合感知内容和知识图谱,实现对视频高层语义及情感的理解,从而让机器高效看懂海量内容。目前,多媒体内容理解部的核心技术服务于内容安全、原创保护、视频创作、视频推荐、视频搜索及商业化等方面。
从快手的多媒体内容理解部出发,我们可以尝试探讨下:以内容为起点,用技术撬动更多价值,都需要哪些工具?
1、 不断增长的数据源
快手在数据上的优势不仅仅是量大,更重要的是类型丰富并且持续保持增长,让内容理解可以不断根据用户不同时期和状态的需要进行自我驱动的革新。
树立起快手强大内容理解的跨模态内容分类,就是建立在丰富的内容种类上,对于视频+音频、画面+用户行为等等元素进行综合理解才能达成。如果没有丰富的数据来源,也是很难实现的。
2、 充足的算力资源
想对内容尤其是视频内容进行 的挖掘,算力自然是不可或缺的。快手多媒体内容理解部拥有5000块GPU构成的超算中心,为种种新尝试提供源源不断的动力。不管是内容的理解还是生成,都可以利用好云端算力,减轻对用户终端算力的要求。
3、 深厚的人才底蕴
真正能把数据和算力利用起来的,还是人才。作为快手技术创新的中流砥柱,快手多媒体内容理解部是快手博士最多的部门,算法团队中有四成都是AI领域的博士,可以说是快手的“AI天团”。
在技术研究为导向的AI领域,人才可以说是企业的原动力,因此快手才能在跨模态融合技术方向占据业界领先优势。
4、 技术与业务的紧密贴合
现在企业里设立个AI研究院或实验室已经成了风尚,但如果目的是让技术对企业业务本身产生驱动,研究部门能否和业务线紧密贴合非常重要。像快手多媒体内容理解部的核心技术就服务于快速内容安全、原创保护、视频创作、视频推荐、视频搜索及商业化等方面。有业务线上的及时反馈,技术研究才能在快速迭代中不断接近正确方向。
当快手冠以AI之名:不仅淘金,还要点石成金
这四项优势可以说是多媒体内容理解部内容淘金的四样神器,让多媒体内容理解部驱动整个快手打开了更多的延展空间。
而从这次乌镇上展示的项目看来,快手的野心远远不仅是掌握矿脉,而是渴望点石成金的能力。
视频生成技术中体现出的跨模态识别算法,平安系统中体现出的强大算力和数据资源,加上快手多媒体内容理解部本身的人才储备,这一切都说明了快手正在无限贴近他们对于自身的定位:一家AI企业。
短视频只是输出AI技术的方式之一,当拥有点石成金的能力后,快手的未来可以有很多选择。
例如快手可以利用强大的算法推出高性价比的硬件产品,就像Snapchat推出AR眼镜一样。不管是自研还是合作的方式,以快手用户的技术和活跃度,相信可以很快拓展开市场。
要么快手可以和Facebook这类社交媒体平台一样,开放技术API将自身打造成时下流行的AR开发平台。一方面鼓励开发者为短视频业务贡献更多特效,另一方面可以接入营销类业务。
快手甚至可以面向产业成为可以输出技术的供应商,在安防、考勤等等领域提供人脸识别和视频内容理解技术。
总之在快手多媒体内容理解部的支持下,快手的AI技术可以在很多地方创造价值。AI企业未来五光十色的丰富可能性,也一样投射到了快手身上。
当然,这些都是局外人的猜测。或许快手会一直像CEO宿华说的那样,像阳光一样普照大地,利用技术去改变每一个普通人的生活。而在AI驱动的时代大幕上,每一家企业都置身洪流之中。拥有技术便意味着拥有选择权,任浪潮波动也一切由己。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。