大数据发展到今天,人们应该采取现实主义的态度了。我不想要大数据预测未来,这或许与能量守恒和相对论是冲突的,但我却很想要让大数据为我的生活服务,让我的生活更便捷。例如,在想要找一部多年前看过的电影,却又忘了名字时,互联网大数据所支持下的产品能尽快为我找到,这个要求不过分吧。
要求不过分,但实现起来并不容易,要想让用户轻松找到自己想要的内容,必须是大数据发挥作用。而传统以内容购买、制作为主的视频网站,在这一点上做得不好,因为他们的利益诉求点在于位置推荐,即让用户看到他们想让用户看的内容,而非内容筛选,即让用户精准找到自己想要的内容。我第一次上央视做访谈后,视频明明就是被电视台上传至优酷了,但不管是变换多少关键词,怎么也找不到,这种使用体验对我而言是负面的。
在这方面有能力做得好一些的,是百度视频。这个业务与传统视频网站不一样,百度视频并不去制作内容,购买内容,引导用户上传内容,这些都不是他们的工作,百度视频只需做好一件事,就能获得超然的市场地位,这件事就是做好分类,让所有的视频都能被需求者精准地找到。
分类问题往往会被人忽略,但实际上却是解决很多问题的钥匙。把视频的点击量和受欢迎程度作出列表,或分出情感、动作、武侠、枪战等类别,是最传统的分类方式,技术上容易,单维度,任何人都能干。百度视频追求的,是要从用户行为、心理、习惯、品味、兴趣等多个维度对视频进行分类,从而让用户获得更好的使用体验。
百度视频中收录了数亿个视频,每天会收到上亿次的搜索和观看请求,这数亿个视频中99%都是长尾内容。我们知道,长尾内容是百度搜索崛起的关键因素,未来百度视频崛起的关键,也一定会是长尾内容。这种内容虽然都不是时下热门,你能让用户很方便地找到,对提升用户体验而言却意义重大。当下,《乡村爱情故事》到处都能看到,我没必要去你百度视频上看,但要找一部赵本山早期拍摄的鲜为人知的乡村电影,则必须去百度视频上找,哪怕多搜几次,至少能找到。
搜索和推荐结果的精准性每上升1%,在技术上的要求就几乎要提升一倍,这已是非大数据不能做的工作了。这里面涉及影视知识图谱,自然语言处理,机器智能理解用户意图等要素,并不是简单的分类可以解释。百度在贴吧和知道等平台的用户数据,也都需要调用,用户的身份和性别,也需要识别,这几乎是一种互动式的动态数据分析,需要有高超的技术实力和极强的系统设备加以支持。
百度视频在这一块,目前是领先的,也缺乏竞争对手。不过百度视频还可以做得更好,用户的实际需求还有很大程度没有满足。用大数据来改善视频搜索结果的准确性,进行准确的个性化推荐,是个诱人的方向。用户想找什么就能找到什么,简单输入一个或几个关键词即可,不必去百度搜索里找到其中一个词,再根据这个词去找别的元素,最终在百度百科中找到视频的名称,完成多次搜索后再返回百度视频进行最后搜索。这一系列过程形成的用户体验,自然是很糟糕的。不过,能看得出来,百度视频在解决这些问题方面,正在变得越来越好,未来前途无限。
如果百度视频能将现有视频搜索的精确度再提高10%,足以颠覆整个视频行业。用户不必记住搜狐买了纸牌屋,优酷上才能看万万没想到,几年前的生活大爆炸是哪个网站独播来着?只需去百度视频上搜一下就好,正如之前百度搜索给人们塑造的习惯一样,明明知道淘宝的域名是什么,却偏偏要在搜索引擎中搜一下,然后再点击搜索结果进入。
百度视频是个入口,如果能把大数据的威力发挥出来,在搜索和推荐的体验上更进一步,在用户习惯形成之后,百度视频就是所有视频的超级入口。这个入口与置身其下的视频网站,在逻辑上完全反了,颠覆意义十足。一个是推给你什么你看什么,一个是你想看什么看什么,硬给你看的,不一定是你需要的,只有自己真正想看的,才是实际需求。
在实现这一目的过程中产生的数据,也是弥足珍贵的,将会是百度视频在未来实现利益的最大资产。用户对某个主题的热衷程度,会被机器准确地识别出来,这些数据用来指导内容生产,会是非常准确的。
百度视频未来产生的数据,在判断内容的受欢迎程度和市场需求上,也会成为重要标杆。有这些数据在,传统影视业虚假离谱的调查报告就不太好意思拿出来了,那些娱乐圈里人为的炒作和误导性的市场预期与反馈,也将无处遁形。
当然,这一切都是基于一个期望,即百度视频能在未来充分利用好百度的大数据资源,恰到好处地运用在用户体验的改善上去,让用户习惯于把百度视频当做入口,精准找到自己想要的影视片,甚至精准找到UGC内容。这个目标实现起来任重而道远,但却是百度视频唯一的正确方向,也是大数据从漂浮状态落地的为数不多的落脚点。
===================================================
我是微信公众账号gejia021的独立运营者,90%的原创科技与人生感悟文章,独立观点,不屑流俗。期图以一己之力,阐释和说明中国互联网的本质。
微信号gejia021,是覆盖1000万用户的,中国最大的自媒体联盟wemedia成员之一。亦是2013年十佳自媒体,科技原创力30人之一。
我在新浪微博的用户名为@葛甲,在新浪、搜狐博客、艾瑞专栏、今日头条等自媒体平台的用户名均为葛甲,欢迎订阅。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。