“当两个百万富翁在街上相遇,他们都想知道谁更富有,但又不愿意让对方知道自己拥有的真正财富。如何在没有第三方的情况下,让对方知道谁更有钱?”1982年,中国科学院院士姚期智提出了著名的“百万富翁”设想。这个设想的背后,本质上反映了数据挖掘的服务。数字化时代,“数据”既如丰饶之角的宝藏,也如潘多拉魔盒,谁掌握着数据意味着谁拥有数字宝藏。如何打破数据保护与数据价值挖掘之间的矛盾?隐私计算的兴起,让姚期智“百万富翁”的设想,真正照进现实。
破冰数据流通的不愿与不敢
2021年隐私计算开启了在真实商业世界中落地应用元年,迅速借助资本力量起飞。这一赛道的崛起,源于市场需求的拉动和技术的日益成熟,同时网络安全法、数据安全法、个人信息保护法逐步完善了国家数据相关立法的顶层设计,为隐私计算发展注入了助推剂。
究竟什么是隐私计算,它又有着怎样的魔力,价值几何?隐私计算被定义为面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄露代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。隐私计算主要包括多方安全计算、联邦学习、可信执行环境、同态加密等技术,核心价值是能够实现“数据可用不可见”、“数据不动模型动”。
举个例子,政府、银行、互联网公司,他们都坐拥巨额“数据资产”。如今,电诈、网赌、洗钱高发,急需建立一个反诈反洗钱平台,但是想构建这个平台,必须有政府数据、互联网数据、银行数据,要他们把自家数据“贡献”出来才能实现。问题是,谁都不愿意也不敢把自家数据拿出来怎么办呢?
这时候,隐私计算发挥了作用,在保障原始数据不出库的情况下,通过隐私计算,可安全输出计算结果。以前,数据拥有方不敢给、不愿给,有了隐私计算之后,最终三家齐心协力共同构建了一个超精密的反诈反洗钱平台,这个例子就是隐私计算最常见的场景联合风控。
特别是在金融行业,解决单一金融机构自有数据量小、建模样本数量不足的问题,通过隐私计算,可以将多家机构数据在不泄露的情况下融合应用,提高模型的准确性,用于信贷风险评估、供应链金融、多头借贷等关键环节。除了联合风控,政务数据、医药研发、债券指数编写、联合营销都是隐私计算典型的应用场景。于普通人而言,未来随着隐私计算应用在多种业务场景中不断推广,个人信息也会得到更有效保护。
破除数据孤岛提升模型决策力
隐私计算爆火之后,阿里巴巴、微众银行、蚂蚁集团、平安科技等以及初创企业为代表的玩家相继入局。不过,隐私计算大规模商业化落地仍有不少挑战,这其中既包括技术本身复杂性,也有行业内卷。而在政策支持和市场共识推动下,隐私计算发展整体趋势向好。
推动隐私计算走向大规模商用的关键时期,“AI+隐私计算”的 结合,在跨业、跨域数据安全融合的基础上,实现了数据价值的 挖掘与释放,成为打开数据流通之门新的钥匙。在一众入局隐私计算的企业当中,萨摩耶云走出了自己独特的探索之路。
基于业界开源联邦学习框架Fate,萨摩耶云建立了自己的联邦学习平台。充分将联邦学习、多方安全计算、同态加密、秘密分享技术 融入AI决策智能平台,平台统一了从特征工程、算法建模、模型训练、模型评估、模型发布等全流程,企业能够轻松地实现联邦模型的训练、上线以及模型管理等功能,可视化联邦拖拽建模、模型管理及模型监控,大幅节省部署成本。
在萨摩耶云联邦学习平台中,每个参与方身份和地位相同,各方原始数据始终不出本地,数据提供者轻松进行联邦合作,建立虚拟共有模型,建模效果与传统中心式机器学习模型效果几乎一致。技术人员可以随时配置与调试各类策略模型,实时优化部署各项规则,快速响应业务决策。它允许从跨数据所有者分布的数据中构建集合模型,达到了数据安全可证明、模型性能可使用、机器学习效率可控、决策可解释、模型可监管,有效破除数据孤岛之困。
而萨摩耶云联邦学习平台正探索将Automan自动建模工具包联邦化,以提供更多的模型,尤其是风控领域的模型,来高效完成样本建模任务,缩短原始样本与经营决策的距离,实现整体降本增效。同时萨摩耶云联邦学习平台与FDN、星云进行合作,打通多维度、跨行业、跨场景的数据体系,让模型预测效能大幅提升。
技术融合保障数据可用不可见
未来的数字世界构建在数据要素充分流通的基础上,而隐私计算作为能够完美解决数据安全流通的最优技术解,在智能风控、智能决策分析,以及跨平台信息共享等场景上展现出广阔的应用空间。
融合决策智能、 学习和隐私计算技术,萨摩耶云已为包括金融、政务、物流、电商等多个产业提供了完整的端到端云原生解决方案。一站式、全链路解决方案,通过公有云、私有云及本地化部署模式部署,借助萨摩耶云联邦学习平台,企业灵活组合和调用多种模型,在数据不出门的前提下,建立从风险感知、风险探测、智能研判到自动处理的智能风控、联合营销、联合科研等跨机构数据合作任务,提升商业决策能力,驱动业务数智化转型。
强化治理体系,构筑数据安全底座。萨摩耶云通过了等保三级认证和ISO27001认证以及安全联盟行业验证、诚信网站等认证,其在信息安全和客户隐私保护上,执行行业最高信息技术安全标准,并建立数据安全应急处置机制,使用加密密钥和数字证书实现安全通信和数据传输,以提高系统弹性、可靠性和稳定性。
从搭建自己的联邦学习平台出发,萨摩耶云在隐私计算方面走出了一大步,正将探索发展可信执行环境技术纳入规划,基于可信执行环境对加密数据进行Spark SQL分析、实现多方加密数据在远端进行联合建模,打造数据安全可信共享的基础设施,通过透明可信分布式架构,端到端的应用闭环,在保证数据安全和隐私保护的前提下,实现多参与方数据可信共享、协同计算,数据可用不可见。
可信执行环境相比其他隐私计算技术,具有通用和高效的优势,不仅可以无缝支持通用计算框架和应用,而且计算性能基本可匹敌明文计算。它可以单独用于隐私计算,也可以与其他技术结合,尤其在安全可信云计算、大规模数据保密协作、隐私保护的 学习等场景中发挥重要作用。
可以肯定的是,随着技术性能以及市场认知的提高,隐私计算将持续推动数据价值安全流通,帮助各行各业重构技术设施,为数字经济形态的向好发展提供稳健助力。隐私计算元年已来,数据引发的变革仍将继续,对于萨摩耶云等站在浪潮之巅的弄潮者而言,未来充满着无限可能性!
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )