6月30日消息,澎思科技(Pensees)官方宣布其再次在单帧图片数据集(Market1501,DukeMTMC-reID,MSMT17)刷新世界纪录,大幅提升了跨域ReID算法的准确率。
此前,澎思科技曾在三大主流单帧图片行人再识别数据集、三大主流视频行人再识别数据集刷新世界记录。
据了解,澎思科技此次成果的取得源于澎思新加坡研究院对算法的自研创新和融合探索。本次,澎思科技将对抗生成网络与自监督学习算法结合进行模型的训练,通过迁移学习,进行高准确率的跨场景(数据库)行人再识别算法的研发,取得了突破性进展 。
澎思科技方面表示,该突破对于行人再识别技术在应用场景中的落地具有重要的意义。
澎思科技对行人再识别(ReID)算法进行了长期关注的研究。行人再识别(ReID)算法能够通过视频监控系统,在跨摄像头的条件下检索行人,大大拓展摄像资源的利用 。特别在公共安全领域,ReID可以弥补人脸识别的局限,提升对特定人物的识别追踪能力,并大大降低人力成本。然而相比人脸识别的百万级数据库,行人再识别面临着数据量不足和复杂应用场景变化的挑战。因此,展开高准确率的跨场景(数据库)行人再识别算法研究对于行人再识别技术的应用落地十分重要。
此次澎思科技刷新的ReID三大数据集,除了Market1501,DukeMTMC-reID两大常见数据集之外,还包含了MSMT17数据集。MSMT17,即Multi-Scene Multi-Time,是在CVPR 2018上提出的一个更接近真实场景的大型数据集,涵盖了多场景多时段,是目前最赋有挑战性的综合跨场景大数据集。与之前的数据集相比,该数据库中行人和摄像头数目更多,覆盖场景更复杂,时间跨度更广。因此,在该数据集下模型的表现更能体现出算法的实力。
MSMT17 数据集与其他数据集的直观对比
最终,通过与目前最新的主流算法进行对比,澎思科技的ReID算法无论在首位命中率(Rank-1 Accuracy),还是平均精度均值(Mean Average Precision,mAP)上的表现都明显更好,准确率更高。
本次,澎思科技创新性地将对抗生成网络与自监督学习算法结合进行模型的训练,通过迁移学习,进行高准确率的跨场景(数据库)行人再识别算法的研发,取得了突破性进展。
对抗生成网络在算法中主要有两个功能:一方面,进行数据库的域迁移,具体为原域到目标域的风格迁移;另一方面,进行目标域数据库的数据增强,具体为生成跨摄像头数据并给模型赋予相机风格不变的约束。自监督学习则是通过聚类的方式给目标域数据库打虚拟标签并微调之前训练好的网络。
源域模型训练
目标域模型自监督学习
近年来,单域行人再识别(Single-Domain Person ReID)取得了巨大进展,但与实际应用场景的要求还存在较大差距,跨域行人再识别(Cross-Domain Person ReID)的研究意义愈发显著。随着人工智能的不断发展演进,如何通过自动迁移学习、自监督学习、GAN等前沿技术实现模型优化,成为跨域行人再识别的重要研究方向。
澎思科技此次创新性地通过迁移学习提升了目标场景下的ReID性能,突破了行人再识别的落地应用限制,真正发挥了ReID的算法作用和技术优势,为行人再识别算法在各类产品和应用场景中的落地打下基础。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )