2024 年10月,在信息检索和数据挖掘的国际学术会议CIKM (International Conference on Information and Knowledge Management) 上,京东探索研究院院长、京东科技人工智能业务负责人何晓冬博士发表的研究成果DSSM模型(基于点击数据学习用于网络搜索的 结构化语义模型:Learning deep structured semantic models for web search using clickthrough data)因对内容推荐架构产生重大影响并为产业带来巨大的经济效益,荣获 CIKM 2024年唯一的“最佳时间检验奖(Test of Time Award)”。
CIKM 由ACM SIGIR分会主办,是信息检索和数据挖掘领域的顶级学术会议之一,因CIKM论文的研究成果经常得到产业界的采纳,所以CIKM也是少数受到学术界和产业界共同关注的活动,只有少数高质量的论文能够脱颖而出被录用,2024年CIKM的录用率仅为23%。每年的“最佳时间检验奖”更是彰显了论文在学术和产业上的双重价值——以在过去10年产生重大和持续影响为评选标准。
本次获评的DSSM双塔模型是各类双塔模型的开山之作,奠定了召回和粗排阶段的基础架构,为后续众多改进型双塔模型奠定了基础。
DSSM双塔模型最大的特点是,user 和 item 是独立的两个子网络,即分别使用相对独立的两个复杂网络构建用户相关特征的 user embedding 和 item 相关特征的item embedding,因而被称为双塔模型。
DSSM模型不仅为内容推荐系统的基础模型和架构奠定了坚实的基础——是 语义学习方向最基础的模型结构,解决了语义相似度计算的问题。2016年,图灵奖得主Yoshua Bengio和Ian Goodfellow(GAN的发明者)、Aaron Courville三人共同编撰的 学习领域奠基性教材《Deep Learning》(引用量3万余次)一书中就将本次获评的DSSM模型视为基于内容的推荐系统的基础架构。同时,因为兼顾性能与效率,DSSM 模型对产业界十分友好,在发布后的10年中得到了大量的应用。
DSSM 语义匹配模型最早是应用于 NLP 领域中计算语义相似度任务。语义匹配本身是一种排序问题,和推荐场景不谋而合,所以 DSSM 模型被自然的引入到推荐领域中,如搜索引擎检索、广告相关性、问答系统、机器翻译等。过去10余年, 学习技术的应用极大地提升了互联网搜索引擎的语义理解能力、信息检索效率和用户搜索体验,使得搜索结果更加精准、丰富和个性化。头部搜索引擎,电商平台的搜索、推荐和广告业务中都大量采用了该技术,产生了巨大的经济价值。
何晓冬博士曾表示,“在多年的技术落地实践中,我们意识到,用AI来提升、赋能传统实体行业才能最大化影响力和应用价值,传统实体行业的体量足够大,提升1%就能创造巨大的应用价值。”何晓冬博士在京东科技负责人工智能在产业上的落地应用,近年来陆续与团队研发出了智能客服、数字人直播、智能外呼等多项专业可信赖的AI产品,在零售、物流、金融、政务文旅等领域获得了广泛应用。据公开消息,京东云言犀数字人已服务超5000家品牌,带动销售额超百亿;智能客服覆盖了消费者进店后30多个关键环节,可自动化应答售前、售中、售后全场景90%的服务咨询,服务品牌商家数量超40万;智能外呼与政务热线紧密结合,助力大同、东莞、保定、芜湖多地12345热线实现数智升级……
技术创新是企业发展的重要驱动力。不少技术人认为,能否让技术拥有广袤的实践场景,产生应用价值,是考评是否加入该企业的终极门槛。以京东为例,京东创立20多年来,持续投入供应链基础设施和技术创新应用,为用户带去“多快好省”的极致体验,也推动品牌和商家实现降本增效,不仅拥有海量应用场景,更积累了大量专业数据。可以说,技术与创新的基因早已植入京东的发展脉络。这也是京东可以让大量技术人在真实场景中充分发挥创造力,持续推出多项专业可信赖的AI等技术创新的重要原因。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。