征信行业黑市数据泛滥 能否安全度过空档期?

一本财经的 调查《征信之乱》发布之后,刺破征信行业的那层窗户纸——数据之乱,是行业不可言说的秘密,却也是绕不过的硬伤。

征信行业,正处在特殊的“空档期”,一边是,行业监管尚未成型;一边是,行业乱象暗流涌动。

待发牌机构,如履薄冰,担忧监管层看到行业乱象,会“一刀切”。

中国征信行业,本有“换道超车”欧美的机会,却因为数据黑产盛行,恐怕存在劣币驱逐良币的风险。

征信行业正在紧张揣摩监管的“圣意”,是飘扬的红领巾,还是冰冷的闸刀?

1、行业的暗疮

“能不能帮我们联系黑客?我们想购买数据”,《征信之乱》发布后,后台最多的,是如此的留言。

有说“公司在冲用户量”,也有“公司融资困难,只能节约成本”,不管理由多悲情壮阔,实际上,他们对黑市数据垂涎已久,只是苦于没有渠道。

对于黑市数据的混乱和隐患,他们也极为了解。但在低价和暴利面前,大部分人会选择铤而走险。

可见,黑市数据的地下交易,已是行业的暗疮——没有人愿意揭开这个伤疤,这里满溢着欲望的脓汁。

就在昨日(11月21日),中国青年政治学院互联网法治研究中心发布了《中国个人信息安全和隐私保护报告》,从100多万的调查样本中,让人意识到,个人数据的外泄,已达到触目惊心的地步。

72%的人群认为,个人信息泄露问题严重。而81%的人,骚扰电话来电时,就知道姓名或单位等个人信息(详情见下表)。

实际上,黑产的可怕,远超我们想象。

黑客KK称,地下黑市交易数据,几乎可以涵盖一个人所有“可想到的信息”,包括购买记录、定位信息、开房记录,甚至在某某网页上的停留时间。

黑产数据,已可以从200多个维度了解一个人,“甚至比你自己更了解你自己”。

近两年,因为征信和大数据的兴起,给黑市注入了大量资金,推动黑市数据的迭代更新和流动交易。

“因为购买需求旺盛,每个月黑市上的数据都会翻新一轮”,KK称,黑市数据的流动速度,印证了市场的繁荣。

2、换道超车的机会

一边是黑市数据的急速涌动,一边是领头羊的乱中建序。

个人征信的的前行者,正试图为这个敏感而核心的行业,披荆斩棘,探出一条新路来。

中国的征信行业,完全有机会换道超车。

美国的征信体系,是市场主导型的,征信机构几乎都是民营性质。而其数据的来源,主要是银行和相关金融机构的信用信息。比如,费尔艾萨克公司推出了信用分模型——FICO分,已经成为世界通用的一种评分模型。

据中国网数据,在中国,截至2016年3月底,央行征信共收录8.85亿自然人数据,有信贷记录的自然人数3.7亿人,没有信贷记录的人多达5亿。这也意味着,中国还存在大量的“零征信”、“弱征信”人群——他们游离在央行征信体系之外,甚至没有迈进过银行,比如农民、蓝领、学生等。

正因为如此,也让中国征信体系的搭建,有了一些“曲线救国”的奇招。

中国一些征信公司,试图寻找一些看起来无关紧要的数据背后的逻辑,创新评分模型。

芝麻信用评分打通了淘宝的数据,以及支付宝的金融产品数据,包括花呗、借呗、余额宝等。芝麻信用分的风控模型中,网络消费、网络金融行为,成了一个重要的征信参考维度。

芝麻信用资深数据科学家赵星,曾在2016年中国科技金融FinTech创新大会上,曾经揭秘芝麻信用分的模型——采取“分群评分”,将有相同特征、画像、参数的人,放在一个模型中去分析。比如,有过逾期记录的人,会划分成一个群体。

“同样的交易行为,可能在不同的群体中,具有不同的意义”,赵星举例称,同样是在淘宝上购买了一件奢侈品,如果是一个已入中年的用户,可能是一个“加分项”,证明其财力雄厚。如果是一个刚毕业的大学生,又在多个平台有借贷行为,可能就是一个过度消费的“减分项”。

“我们也一直在挖掘,用户的购买习惯,和信用值之间的联系”,赵星称,比如,喜欢为家庭购置物品的人,比如孩子的尿布、奶粉,家里老人的保健品等,可能会更守信。

实际上,美国也有约5000万成年人没有征信局记录。于是FICO推出了FICO XD产品,通过电信运营商数据、水电煤数据、金融交易数据等判断个人的征信状况,和中国路径相似。

Viktor Mayer在《大数据时代》中提出,在小数据时代,我们总是试图寻找事物间的因果关系,也就是所谓的“线性关系”。随着数据越来越多,因果关系变得不再那么重要,而寻找数据的关联性,探求“是什么”,比知道“为什么”更重要。

美国沃尔玛连锁店通过大数据,发现了一个有趣的现象:尿布和啤酒摆在一起,销量会双双增加了。这是因为,美国的妇女们经常会嘱咐丈夫,下班后为孩子买尿布。而丈夫在买完尿布之后,又会顺手买回自己爱喝的啤酒。

美国的征信机构益百利,可以根据人的信用卡记录,预测个人的收入情况。FICO的首席执行官更是扬言:“我知道你明天会做什么。”Viktor Mayer称,在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”,了解其中的关联性即可。

而腾讯征信,也试图在社交信息的基础上,寻找其关联性。比如QQ群、QQ好友、说说、相册,甚至QQ音乐,也作为了参考维度。充了“QQ会员”,会不会成为一个加分项?

据称,除了微信支付、QQ钱包等金融产品外,腾讯正在无所不用其极的扩大维度,比如很多银行都在微信上开通了公众号,向用户发送消费数据;微信支付也推出了信用卡还款功能,以此采集更多金融数据。

说白了,其大概的模型是“社交+金融”。

除了蚂蚁金服和腾讯外,拉卡拉“考拉分”、华道征信“猪猪分”等,也都在做一些新的尝试。

因此,征信行业将其称为中国“换道超车”的时代。

3、监管的空档期

尽管是一个超车时代,却是一个极度危险的时代——所有的人都在急速行驶,但却没有交警和红绿灯。实际上,现在是征信行业最特殊的一个阶段,征信专家们将其称为“空档期”。

2015年1月,央行发布《关于做好个人征信业务准备工作的通知》,要求8家市场化机构做好个人征信业务的准备工作。然而近两年过去,牌照迟迟没有发放。

征信行业黑市数据泛滥 是解不了的死结?

一边是,监管体系还没有建立,一边是大量市场化的乱象,暗流涌动。

很多公司以“大数据公司”的名义,开展“征信业务”。这些都被市场分析人士认为是“行业隐患”,“开展征信业务,又不在监管范围之内,信息安全才难以保障”。

“其实,购买数据的大部分是一些较小的公司,他们目的就是挣点小钱,而大的公司则会相对谨慎,更爱惜自己的羽毛”,业内专家称。

黑市上的数据尽管便宜,但极为“不干净”,极难保证信用评价的公信力。

考拉征信总裁李广雨,曾对媒体透露过考拉征信的数据来源,主要是两个:来自股东拉卡拉的数据,有一亿个人支付数据、数百万小微个体工商户的银行卡收单数据,还有合作伙伴51job有招聘求职数据。除了这些“特色”数据之外,其余来自政府部门的公开数据,合作企业的数据,如电商、电信运营商等。

而京东金融的数据,也类似蚂蚁金服,大部分数据来源京东上的购物、消费、理财、众筹等。

媒体曾报告,芝麻信用分的数据源头,除了淘宝和支付宝的数据,还有三部分:

来自政府合作数据,比如法院、社保、公积金等;

还有一些来自合作的企业,比如一些采用芝麻信用分的消费金融、网贷平台等,其借贷纪录也会反馈回来;

当然,还有一些用户自己提供的数据,比如学历、车辆信息。芝麻信用会在用户授权后从相应的政府部门调取相应数据,进一步核实。

行业的前行者,走得如履薄冰,而急功近利者,却着急牟利。“很多投机取巧的创业者,只是想乘着这个空档期,捞一笔”,一位业内人士指出,这个“空档期”存在的时间过长,将可能给行业带来“毁灭性”伤害。

不止一位业内高管提出自己的担忧,害怕监管层看到了行业乱象之后,采取一刀切的方式,“放弃市场化道路,征信让国有机构来主导”。

“这无疑是在开倒车,让刚具雏形的征信行业,倒退到原点”,一位业内专家提出,现在最好的方式,是像支付行业的管理一样,尽早发牌照,让机构在监管之下,合法合规来做。

参照支付行业的发展历史,牌照的发放,的确在一定程度上,遏制行业的乱象。截止今年年初,央行共吊销了3家公司的支付牌照,对于不合规的公司,直接淘汰,防止行业的恶性竞争,出现“劣币驱逐良币”的现象。

如果黑市上购买数据的公司,成本降低,反而能获取暴利,谁还愿意安心合法采集数据?

“对征信机构的数据,需要进行溯源清查”,该业内专家称,在征信行业,对于数据不合规的公司,进行监管和淘汰,避免黑市上数据的流进征信领域。

而行业自律,恐怕也只能在牌照发放之后才能践行。“没有牌照,没有一个合法身份,大家怎么可能聚在一起成为一个行业?”业内人士称。

站在十字路口的征信行业,正在等待最终的抉择。但这个抉择,也并非全来自监管层的“圣意”。在远见和短视之间,还需要来一场理性与欲望的角斗。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2016-11-24
征信行业黑市数据泛滥 能否安全度过空档期?
一本财经的 调查《征信之乱》发布之后,刺破征信行业的那层窗户纸——数据之乱,是行业不可言说的秘密,却也是绕不过的硬伤。

长按扫码 阅读全文

Baidu
map