数据竞争与司法裁判

大数据

作者:高杉峻

近日,百度公司因未经许可,使用爬虫技术从汉涛公司运营的“大众点评网”上大量获取用户点评信息,用于自家的百度地图及百度知道产品,被汉涛公司一纸诉状以“不正当竞争”为由告上法庭,并经二审法院审理后,最终认定其行为构成不正当竞争,需立即停止以不正当的方式使用点评信息(下称“百度案”)。

无独有偶,在大洋彼岸的美国,LinkedIn公司因为采取了技术手段,禁止hiQ公司通过爬虫技术获取其网站上公开的用户资料信息,来预测用户是否有离职趋势或提供用户的技能分析报告,而在今年8月被法院通过“预先禁令”(Preliminary Injunction)要求其移除全部阻止hiQ访问其用户公开资料信息的技术障碍(下称“LinkedIn案”)。虽然预先禁令仅仅是程序性的司法意见,但由于其实质上对禁令理由进行了详细描述,因此同样具备分析价值。

对比两案,表面上同样是采用技术手段抓取其他网站信息的两个案件,至少在阶段性的司法意见上存在如此相反的结论,尤其是考虑到,LinkedIn案中抓取方甚至要求法院提前命令被抓取方移除技术障碍,这意味着被抓取方采用技术手段去防范此种行为都受到了法院一定程度上的压制,这种差异性的结果是更为有趣的。但两案在本质上是否存在重大事实区别,以及在不同的司法意见背后秉持着何种理念的差异,这是本文着重探讨的核心。

一、裁判核心意图差异比较

在此类案件中,市场行为正当与否往往是案件的核心焦点。

在百度案中,针对百度爬取用户点评信息并使用的行为是否具有不正当性,一审法院进行了如下分析:

大众点评网的点评信息是汉涛公司的核心竞争资源之一,能给汉涛公司带来竞争优势,具有商业价值。点评信息是汉涛公司长期经营的成果,付出了巨额成本。网络用户自愿在大众点评网发布点评信息,汉涛公司获取、持有、使用上述信息未违反法律禁止性规定,也不违背公认的商业道德。百度公司通过技术手段获取大众点评网上的点评信息用于充实自己的百度地图和百度知道,是实质性替代大众点评网向用户提供信息,对汉涛公司造成损害。Robots协议只涉及是否符合行业准则的问题,不解决抓取网站信息后的使用行为是否合法的问题。大众点评网Robots协议不禁止百度抓取其网站的信息,并不意味着百度公司可以任意使用上述信息,百度应本着诚实信用的原则和公认的商业道德,合理控制来源于其他网站信息的使用范围和方式。

二审法院在一审法院归纳的上述四个正当性评判标准之余,进一步提出了一个有趣的“劳动成果”的概念,并基于“商业道德”的角度综合考虑了如下因素进行阐述:

百度的行为是否有积极的效果。百度的行为是否超出必要限度。超出必要限度的行为是否对市场秩序产生影响。百度公司采取的“垂直搜索”技术是否影响竞争行为正当性的判断。

而在LinkedIn案中,由于只是程序性的预先禁令,法院对于正当性与否的简单论述是:如果同意领英禁止hiQ爬取数据的话,不利于保护公共利益。虽然用户的隐私利益尚不确定,但如果被告采取措施禁止公众获得用户已选择公开信息,是不利于交流及网络发展的。同时鉴于LinkedIn采取的禁止措施可能违反了加利福尼亚州不正当竞争法,法院更倾向认为本案中存在需要保护的公共利益。

As explained above, the actual privacy interests of LinkedIn users in their public data are at best uncertain. It is likely that those who opt for thepublic view setting expect their public profile will be subject to searches,date mining, aggregation, and analysis.On the other hand, conferring on privateentities such as LinkedIn, the blanket authority to block viewers from accessing information publicly available on its website for any reason, backedby sanctions of the CFAA, could pose an ominous threat to public discourse and the free flow of information promised by the Internet.Finally, given the Court‟s holding that hiQ has raised serious questions that LinkedIn‟s behavior may be anticompetitive conduct in violation of California‟s Unfair Competition Law, a preliminary injunction leans further in favorof the public interest, HIQ LABS, INC v.LINKEDIN CORPORATION,Case No.17-cv-03301-EMC,Line14-24,Page 24 of 25.

其实从以上法院的判决理由中不难看出,对于是否能爬取他人网站上用户公开信息的行为并不是法院需要关注的重点。正如LinkedIn案的法官在判决书中所归纳的,通过技术手段爬取公开信息,不过是将手动用笔将信息誊抄在纸上再录入电脑的行为,转换成了更快捷的技术手段罢了,法院关心的重点应该是爬取后获得的信息能否以及如何使用的问题。

二、案件事实和司法逻辑的差异

但详细分析就知道,对于我们关注的司法逻辑差异,其实并没有我们对完全相反的判决结果而引发的直观差异感那么大。

两国法院均未在案件中对“爬取公开信息并使用”的行为直接作出否定性的评价。

百度案中,法院认为对于未经许可使用或利用他人劳动成果的行为,不能当然的认定为构成反不正当竞争法意义上的“搭便车”和“不劳而获”,使用或利用不受法定权利保护的信息是基本的公共政策,也是一切技术和商业模式创新的基础,否则将在事实上设定了一个“劳动成果权”。但是,随着信息技术产业和互联网产业的发展,尤其是在“大数据”时代的背景下,信息所具有的价值超越以往任何时期,如果不加节制的允许市场主体任意的使用或利用他人通过巨大投入所获取的信息,将不利于鼓励商业投入、产业创新和诚实经营,最终损害健康的竞争机制。因此,市场主体在使用他人所获取的信息时,仍然要遵循公认的商业道德,在相对合理的范围内使用。

尤其考虑到百度在爬取大众点评网的评论信息并“大量”使用之前,其实在很长一段时间内只节选了部分评价的方式来呈献给用户,如一审法院就注意到,在百度地图早期的安卓版本(百度地图Android AUX专版3.1.0.162 Build 1061026),其商户页面仅显示了三条来自大众点评网的点评,且每条点评信息都未全文显示,每条信息都设置了指向大众点评网的链接。一审法院认为,百度地图的此类使用方式,不足以替代大众点评网向公众提供点评信息,不会对汉涛公司造成实质损害,该类行为不违背公认的商业道德和诚实信用原则,不构成不正当竞争(考虑到百度地图本身自带的流量,在不全面的信息提示后,用户在地图页面的跳转对大众点评的流量或许还有正向效果)。

在LinkedIn案中,法院也从公共利益方面进行了考量,认为虽然用户选择公开信息所属的隐私利益尚不确定,但如果LinkedIn有权采取措施禁止公众获得用户已选择公开的信息,是不利于公众交流及网络发展的,同时鉴于LinkedIn采取的禁止措施可能违反了加利福尼亚州不正当竞争法,法院更倾向认为本案中存在需要保护的公共利益。

而引起不同裁判结论的核心点其实是在案件事实上。百度案与LinkedIn案最大的不同就在于,用户公开信息被爬取后的使用方式与信息原始使用方式是否完全一致。如在一审法院认定的事实中,使用百度知道以“四叶(三里屯店)”为关键词进行检索,搜索结果排第一的是标题为“四叶(三里屯店)怎么样百度知道”的内容,点击该搜索结果,跳转至相应页面,该页面没有商户信息,只有点评信息,共有190条点评,全部来源于大众点评网。其后在百度知道中搜索“海底捞火锅(大钟寺中坤店)”、“金福源铁板烧”、“福临德海鲜火锅”等商户名称,也出现相同的情况,即百度知道会直接向网络用户提供来自大众点评网的点评信息。

同时,百度除了如前文提到最初曾在百度地图上遵循“最少、必要”原则使用了一段时间外,其后完全在实质上替代了大众点评网的服务。如在移动端百度地图V4.7.0版本中,每个商户可显示5条来自大众点评网的点评信息,这5条点评信息系全文显示,较长的点评信息有“点开展示”标识,点击该标识可查看该点评信息的全部内容,但页面仍停留在百度地图的页面,未跳转至大众点评网。

而LinkedIn案中,法院之所以在禁令中倾向性地支持hiQ从LinkedIn网站爬取数据,是因为hiQ的商业模式并不是在自己提供的产品或者服务中大规模复制LinkedIn网站中用户上传的信息,而是通过对LinkedIn网站上,用户所公开的信息的抓取,将该类数据作为基础而进行数据分析和加工,比如向自己的客户提供“某名特定人员是否有可能跳槽”的分析报告。

hiQ sells to its client businesses information about their workforces that hiQ generates through analysis of data on LinkedIn users‟ publicly available profiles. It offers two products: “Keeper,” which tells employers which of their employees are at the greatest risk of being recruited away; and “Skill Mapper,” which provides a summary of the skills possessed by individual workers. Docket No. 23-4 (Weidick Decl.). hiQ gathers the workforce data that forms the foundation of its analytics by automatically collecting it,or harvesting or “scraping” it, from publicly available LinkedIn profiles. hiQ’s model is predicated entirely on access to data LinkedIn users have optedto publish publicly,HIQ LABS, INC v.LINKEDIN CORPORATION,Case No.17-cv-03301-EMC,Line19-27,Page 2 of 25.

这类业务和LinkedIn网站作为社交平台的基础业务并不具备直接替代性。而相反不利于LinkedIn方的一个案件事实是,LinkedIn本身自己也推出了此类业务,通过自身获取的用户信息数据而提供同类型的增值服务。在这种情况下,法院基于对自由竞争的保护而以预先禁令要求LinkedIn网站移除技术障碍则是顺理成章的事情了。

Furthermore, hiQ has presented evidence that LinkedIn is seeking to compete with hiQ in the market of data analytics. In a news segment airing on national television on June 21, 2017, LinkedIn‟s CEO announcedthat “[w]hat LinkedIn would like to do is leverage all this extraordinary data we’ve been able to collect by virtue of having 500 million people join the site . . . to make sure that each individual member has information about where those jobs are” and that “[f]or employers, [the goal is to provide] an understanding of what skills they‟re gonna need to be able to continue to grow, and where that talent exists.” Docket No. 34 (Gupta Decl.) Ex. U. at 2,HIQ LABS, INC v.LINKEDIN CORPORATION,Case No. 17-cv-03301-EMC,Line2-9,Page 22 of 25.

三、百度案判决中额外的小“彩蛋”

百度案作为一个实体判决,二审法院在合法使用问题上做了一个看起来有些“奇怪”的论证:大众点评网的用户评论信息是汉涛公司付出大量资源获取且具有很高经济价值的劳动成果。百度未经汉涛公司许可,在其自身产品中大量使用用户评论信息,本质上属于“未经许可使用他人劳动成果”。劳动成果不属于法定权利时,虽有“模仿自由”及技术和商业模式创新的空间,但需要在相对合理的范围内使用。

百度案的法官“机智”的选择将用户点评信息定义成“劳动成果”而非由著作权法保护的作品,可能存在以下几点理由。

首先,著作权法虽是用于保护人类劳动成果的,但并非所有人类的劳动成果都能受到著作权法的保护(参见(2015)徐民三(知)初字第1324号上海学而思教育培训有限公司、上海闵行区学而思进修学校、上海长宁区学而思进修学校与上海乐课力投资管理有限公司、上海乐课力文化传播有限公司等著作权侵权纠纷、不正当竞争纠纷案)。劳动成果涵盖的范围远远大于受著作权法保护的作品范围。选择“劳动成果”这个没有特定部门法来规范的法律概念,可以让法官有更多空间来对用户点评信息应如何利用进行分析和解释。

其次,因我国著作权法只保护符合独创性要求的劳动成果,因此任何劳动成果只有同时符合“独立创作”和“具有最低限度的创作性”两方面的条件才能成为著作权法意义上的作品。作品的著作权属于作者(参见(2013)东民初字第10566号北京世纪先导文化发展中心与中嘉鑫胜(北京)文化传媒有限公司等侵害经营秘密纠纷一审民事判决书)。

而不选择从著作权的角度进行保护的另一个好处,则是法院也可以避免对案件所涉的用户评论信息是否属于作品进行逐一判断,继而无需探讨用户协议的效力问题,即汉涛公司是否能通过与用户签订协议,而合法获得用户点评的著作财产权益,以免使汉涛公司失去诉讼主体资格。在侵权诉讼中,法律通常要求原告享有完整权利、独占权利、排他权利或得到权利人同意起诉的明确授权。而在不正当竞争诉讼中,法律通常要求原告主张保护的权利或利益合法,而不要求完整性、独占性、排他性等条件的角度出发。因此,在本案中,二审法院只要出于汉涛公司有可以主张保护的权利或利益,并且不违反任何法律禁止性规定,就可以支持其作为权利人向百度公司主张不正当竞争。

正是基于上述逻辑,在评估“汉涛公司有何种可以主张保护的权利或利益”的问题上,根据法院认定的事实,大众点评网的帮助中心载明:网络用户发表点评、上传商户图片,根据点评内容的丰富程度,可获得相应的贡献值和D币。网站个别功能需要贡献值达到一定程度才可以使用。贡献值高的会员的点评,也会在一些活动和推荐中,拥有较高的优先权。D币是可以在大众点评网进行礼品兑换或参与其他活动的”站内货币”。因此法院有理由认为,汉涛公司为了获取用户点评信息付出了相应的商业投入,就促使用户积极在网站留言做出了一定物质或者精神上的鼓励(大众点评甚至为此调整了自己的“产品结构”),那么认定留存在网站中的用户点评是一种具备利益属性的“劳动成果”则是水到渠成的论证了。

当然,个人认为略微遗憾的是,该“彩蛋”的形成逻辑,只是作者通过法院事实查明部分,而且更多的是一审事实查明部分进行的推理,二审法院并未在判决书中清晰阐述其认为用户留言是本案原告也就是大众点评网的“劳动成果”的论证,到底基于的是哪个本案查明事实。取而代之的说理,是通过一个对于行业本身的一般性的评判,即“点评类网站具有集聚效应,即网站商户覆盖面越广,用户点评越多,越能吸引更多的网络用户参与点评,也越能吸引消费者到该网站查找信息。此类网站,在开办的早期通常只有投入而没有收益,甚至需要额外支付费用吸引用户发布点评。只有点评数量达到一定规模,网站才有可能进入良性循环。也只有网站的浏览量达到一定的数量,网站才有可能通过广告、团购等途径获取收益”来进行的论证。但事实上,对点评类网站这个细分行业本身商业模式的一般性评判,似乎并不能从本案事实和证据中直接得出,也不应当是一个司法判决断定的内容,略有越界之嫌。实际上,从个案本身的证据,仅就本案事实进行说理,依然可以得出同样判决结论。

延伸来看,尽管许多网站平台均以用户协议的方式来单方规定“用户在该网站发表的言论的权利归属于平台”,但网站用户所留下的言论的权利到底属于何种权利,如果涉及到著作权,是否以网站单方格式条款约定的方式就能合法转让给网站;如果涉及到人格权,是否网站又可以单方面无条件地进行商业利用,则是更复杂的问题。在商业竞争中,总会有竞争者们将这些问题抛给法院。对此,在立法目前尚未跟进、未来也难以及时跟进之余,值得期待的只能是一个个精彩的判决“作品”。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2017-10-16
数据竞争与司法裁判
作者:高杉峻 近日,百度公司因未经许可,使用爬虫技术从汉涛公司运营的“大众点评网”上大量获取用户点评信息,用于自家的百度地图及百度知道产品,被汉涛公司一纸诉状

长按扫码 阅读全文

Baidu
map