目前,随着AI技术在金融领域的广泛应用,加快对多模态和预训练排序等创新技术的研究,将为金融行业数字化转型升级提供重要的技术支撑。度小满近年来在前沿技术领域积极布局,并不断取得新突破、新成果,为推动金融行业发展持续贡献科技力量。日前,度小满的两篇论文还分别入选了两大国际顶级会议。
据了解,度小满金融数据智能应用部AI-Lab的两篇论文分别入选ACM MM和CIKM国际顶级会议。两篇论文分别就多模态和预训练排序等多个热门话题提出了新颖的算法,并在相关任务上达到了国际顶尖水平,获得了审稿人的一致好评并最终录用。这标志着度小满在自然语言处理和计算机视觉等人工智能前沿领域的研究得到了国际同行的认可。
新模型可有效提升度小满视觉风控方面的技术能力
其中,度小满具有实体对齐网格的位置增强Transformer的论文被ACM MM录用,以下为该论文简介:
许多图像除了实际的物体和背景等信息外,通常还包含着很有价值的文本信息,这对于理解图像场景是十分重要的。因此本文主要研究基于文本的视觉问答任务,这项任务要求机器可以理解图像场景并阅读图像中的文本来回答相应的问题。然而之前的大多数工作往往需要设计复杂的图结构和利用人工指定的特征来构建图像中视觉实体和文本之间的位置关系。
为了直观有效地解决这些问题,我们提出了具有实体对齐网格的位置增强Transformer。与之前的模型相比,我们在不需要复杂规则的情况下,显式地引入了目标检测和OCR识别的视觉实体的连续相对位置信息。同时我们根据物体与OCR实体映射关系,用直观的实体对齐网格代替复杂的图形结构。在该网格中,不同位置的离散实体和图像的区块信息可以充分交互。
该模型能够整合目标检测、OCR以及基于Transformer的文本表示等多种方法的优势,增强算法对于图像中场景信息的理解,更精准的融合图像与文本多模态的信息,进一步助力证件识别、人脸与活体检测等业务场景,提升度小满在视觉风控方面的技术能力。
度小满开创性提出动态多粒度学习方法
度小满另一篇基于BERT的动态多粒度排序模型的论文被CIKM录用,以下为该论文简介:
近年来,预训练的语言模型广泛应用于文本的检索排序任务中。然而,在真实场景中,用户的行为往往受到选择或曝光偏差的影响,这可能会导致错误的标签进而引入额外噪声。而对于不同候选文档,以往的训练优化目标通常使用单一粒度和静态权重。这使得排序模型的性能更容易受到上述问题的影响。
因此,在本文中我们重点研究了基于BERT的文档重排序任务,开创性地提出了动态多粒度学习方法。该种方法能够让不同文档的权重根据预测概率动态变化,从而减弱不正确的文档标签带来的负面影响。此外,该方法还同时考虑了文档粒度和实例粒度来平衡候选文档的相对关系和绝对分数。在相关基准数据集上的实验进一步验证了我们模型的有效性。
在前沿技术领域,度小满持续加强探索研究,并将创新技术成果运用于金融各大领域,为推动金融行业创新发展持续贡献科技力量。未来,度小满将继续聚焦前沿技术创新,推动科技在金融场景的创新应用,助力金融行业高质量发展。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )