原标题:30 万奖金等你来!第三届 Apache Flink 极客挑战赛暨 AAIG CUP 报名开始
伴随着海量数据的冲击,数据处理分析能力在业务中的价值与日俱增,各行各业对于数据处理时效性的探索也在不断深入,作为主打实时计算的计算引擎 - Apache Flink 应运而生。
为给行业带来更多实时计算赋能实践的思路,鼓励广大热爱技术的开发者加深对 Flink 的掌握,Apache Flink 社区联手阿里云、英特尔、阿里巴巴人工智能治理与可持续发展实验室 (AAIG)、Occlum 联合举办 "第三届 Apache Flink 极客挑战赛暨 AAIG CUP" 活动,即日起正式启动。
划重点:作为全球首个基于推荐系统的流量攻击实时检测比赛,我们首次公开了 100 万流量作弊识别真实数据集!并应用 Intel SGX 加密技术保障风控模型数据安全。
过去两年,阿里云和英特尔、Apache Flink 社区联合举办了第一届和第二届 Flink 极客挑战赛,运用 Flink,Analytics Zoo,Proxima 等平台和技术,引导选手在垃圾分类,实时疫情追踪等热点民生问题上进行了思考和创新;阿里巴巴人工智能治理与可持续发展实验室 (AAIG) 主办了七期安全 AI 挑战者计划,如人脸识别对抗赛、辱骂文本对抗赛、防御模型白盒以及无限制对抗赛等,勇闯 AI 对抗无人区,并发起 AI 治理多学科交叉结合的新项目 AAIG-CUP。
今年的第三届 Flink 极客挑战大赛暨 AAIG CUP,利用了第三代英特尔®至強®可扩展处理器的 Intel® SGX 技术,引导选手在隐私保护的机器学习方面进行探索和开发。本届比赛将继续面向全社会开放,个人、高等院校、科研单位、企业、创客团队等人员均可报名参赛。
赛题背景
随着互联网的发展,网购成为越来越多人的选择,据阿里巴巴财报显示,2020 财年阿里巴巴网站成交总额突破一万亿美元,全球年度活跃消费者达 9.60 亿。
为了满足不同用户的个性化需求,电商平台会根据用户的兴趣爱好推荐合适的商品,从而实现商品排序的千人千面需求。为了获取更多的平台流量曝光,将自己的商品展现在更多的消费者面前,部分商家通过 HACK 平台的推荐机制从而增加商品的曝光机会。其中一种典型的手法为 "抱大腿" 攻击,该方法通过雇佣一批恶意用户协同点击目标商品和爆款商品,从而建立目标商品与爆款商品之间的关联关系,提升目标商品与爆款商品之间的 I2I 关联分。
商家通过这种方式诱导用户以爆款的心理预期购买名不符实的商品,不仅损害了消费者的利益,降低其购物体验,还影响了平台和其他商家的信誉,严重扰乱了平台的公平性。实时拦截此类行为,有助于在保证推荐的时效性的同时,保护实时推荐系统不受恶意攻击影响。
如何准确、高效地识别这类型的恶意流量攻击,实时过滤恶意的点击数据是推荐系统中迫切需要解决的问题。
除此之外,此类实时风控系统对数据安全的要求较高。如果系统的拦截算法意外泄漏,HACK 平台将得以针对性地加强恶意流量的伪装能力,增大平台监控恶意流量的难度。因此,此类系统有必要部署在加密的可信环境中。
本赛题要求选手基于 Flink,Analytics Zoo/BigDL 等组件,在 Occlum 环境中搭建保护数据安全的 PPML (Privacy Preserving Machine Learning) 应用,实现对恶意流量的实时识别。
赛程安排
本次大赛分为初赛、复赛和决赛三个阶段,时间安排如下:
初赛阶段
参赛队伍将采用 docker 镜像的提交方式,由选手提交打包好的代码镜像来运行得出搭建结果;参赛队伍通过天池平台下载小型训练集和测试集,用于本地训练和调试算法;最终完成的代码镜像提交到天池平台后,由评测系统在完整数据集上训练与预测。
复赛阶段
进入复赛后,将会进一步要求选手在半监督数据集上训练 学习模型,同时鼓励选手在工程上做一些优化与创新。
决赛阶段
最终的决赛将以答辩会的形式进行,晋级决赛团队需提前按照要求准备答辩 PPT,而在场评委将根据选手的技术思路、理论 现场表现进行综合评分。
活动激励
据悉,本次大赛最终将产生:
- 冠军队伍 1 支,奖金 10 万人民币;
- 亚军队伍 2 支,奖金各 5 万人民币;
- 季军队伍 3 支,奖金各 2 万人民币;
- 优胜奖队伍 4 支,奖金 1 万人民币。
同时,本次大赛在报名阶段还将延续上一届的 "鼓励师计划" 玩法,成功邀请小伙伴参赛即可成为鼓励师赢取丰厚的礼品!
彩蛋:本次比赛颁奖典礼预计将于 12 月 Flink Forward Asia 2021 (近期正式上线) 主论坛举办,活动信息获取欢迎关注 “Flink 中文社区” 公众号,更多参赛秘籍等你 Get~!
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。