机器学习火了，FinTech又开始摩拳擦掌！

文|朵拉916

3月2日讯，机器学习，这项人工智能的核心技术，在过去一段时间内被人们频繁提起。不论是互联网行业、学术界，还是金融领域，似乎都有它的身影。毋庸置疑，同虚拟现实、区块链、大数据风控等新鲜事物一样，机器学习毫无争议的火了起来!

机器学习之火迅速蔓延，FinTech也不甘示弱

要说机器学习到底有多火，从互联网巨头们急不可耐争相布局机器学习阵地的动作便可略知一二：2014年5月，谷歌推出内嵌机器学习技术的无人驾驶汽车;2015年8月，阿里公布机器学习技术开放平台DTPAI;2016年9月，运用机器学习模拟人脑工作机制的“百度大脑”首度亮相。

机器学习在互联网界燃烧的熊熊火势，迅速蔓延到各大领域。善于追逐新风口的FinTech企业们，听闻机器学习强大的算法处理能力后深为叹服，纷纷摩拳擦掌，试图将其嵌入金融风控。国内BAT互联网三巨头自不必说，百度金融大数据风控、阿里芝麻信用系统、腾讯征信人脸识别技术，对机器学习技术都有所运用。

更为欣喜的是，笔者发现，互联网快速、广泛传播的特性，使机器学习等新技术不再只是BAT的天下，一些金融科技领域较为知名的公司，也纷纷运用这项新技术。近期频频传出即将进行集团化升级的钱牛牛就是其中之一，其母公司旗下payday loan品牌贷上钱，已将机器学习技术植入风控领域，并取得显著成效。

贷上钱是一款面向蓝领用户和年轻人群的小额、即时现金贷产品，为用户提供件均500-2000元的现金贷，帮助用户缓解发薪日前资金应急之需。为满足用户快速、便捷贷款的需求，贷上钱与腾讯达成战略合作，接入腾讯人脸识别技术，通过机器学习的方式快速判别借款者身份，完成精准授信。这项技术使贷上钱授信时间仅需120秒。

除此之外，钱牛牛母公司资方之一京东金融，在机器学习方面更是一马当先，不仅将其应用到大数据风控环节并取得一定成果，还在近期公布的2017年六大战略中提到，将机器学习与人工智能等作为重点核心，在未来三年投入资金、资源投入不低于100%。

没有数据，机器学习只是伪命题

众多领域纷纷涉入，再结合网上大量关于机器学习的讨论来看，其火爆程度可见一般。但我们知道，纵使机器学习拥有极为强大的算法结构和数据处理能力，但这项基于海量数据源的先进技术，在各大领域的应用，很大部分阻碍则来源于数据，倘若没有丰富靠的数据支撑，机器学习也只是个伪命题。

那么，机器学习对数据有哪些要求呢?笔者认为，数据对机器学习的影响主要存在三个短板。

首先，是数据来源的真实性问题。机器这个毫无感情色彩的载体，不会像人一样产生质疑，往往会根据输入给出相应的输出结果，即使获得的数据是假的，它也只会根据假数据进行运算，而不会产生丝毫怀疑。面对社会随处可见的欺诈现象，机器学习也许可以根据一些典型特征进行识别，但对于刻意造假则可能会失去效用。

其次，是数据的有效性问题。瞬息万变的世界，任何事物都在变，昨天的经验今天不一定适用。但我们拥有的大量数据都是过去一段时间沉淀下来的历史，不可否认这些历史数据具有一定的价值，但若要运用这些数据对未来进行精准推断，恐怕还是有些困难。

再者，则是数据分布的平衡性问题。在学术研究与教学中，很多算法都假设数据分布是均匀的，但当我们把这些算法应用于实际数据时，大多数情况下都无法取得理想的结果。因为实际数据往往分布很不均匀，存在“长尾现象”。

不过，针对机器学习存在的这些短板，各公司在相应的使用领域也都采取了应对之策。譬如，在风控方面，贷上钱针对基于机器学习技术的大数据风控难以识别数据造假的问题，引入了德国IPC人工验证做补充，通过机器风控提升效率，人工验证剔除欺诈，二者紧密结合，实现精准风控授信。

而对于数据分布不平衡问题，业界普遍通过采样、数据合成及加权等方式解决，百度大脑则通过模拟人脑工作机制，在搜索引擎强大的数据采样、合成和分析之下，取得了语音、图像、自然语言处理及用户画像的多项突破。

尽管机器学习还处于不断探索阶段，但对于整个科技领域而言，这项人工智能的核心技术，无疑是人类一次巨大的进步与革新，在未来将为我们带来无穷的力量!

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。

机器学习火了，FinTech又开始摩拳擦掌！

下一篇