容联AI实现「数据自动化打标」和「测试集自动提取」

尊敬的用户:

本周迎来容联AI Call产品又一次更新,本次更新重点丰富自学习平台的功能,旨在让运营更智能,提高运营整体工作效率,实现【数据自动打标】,自动将原始数据进行数据清洗、数据标注、数据分类,有效缩短了数据标注工期。同时,打破传统测试集数据手动拆分方式,实现【测试集数据自动提取】,数据提取更科学,评测结果更真实。

如下为V5.1.1本次更新内容:

升级说明

1、打通线上「数据集」一体化流程

数据集上传、模型训练、模型评测、模型发布和解绑,都可以在自学习平台完成,打通线上数据集管理、模型训练、模型评测、模型发布一体化流程。

容联AI实现「数据自动化打标」和「测试集自动提取」

容联AI实现「数据自动化打标」和「测试集自动提取」

  2、数据自动打标功能

针对海量数据,通过人工对数据进行标注,无法保证高效的完成数据清洗标注以及数据分类。本次自学习平台新增数据自动打标动能,仅需上传原始数据集文件,系统按照配置策略,自动将原始数据进行数据清洗、数据标注、数据分类,人工仅需完成简单的复检,即可将数据用于模型训练,有效缩短了数据标注工期。

容联AI实现「数据自动化打标」和「测试集自动提取」

容联AI实现「数据自动化打标」和「测试集自动提取」

  3、模型训练更灵活

本次在模型训练任务上增加了任务排队机制,支持取消训练,在面对大量模型训练任务时,可以更好的承载超大并发量的模型训练任务,从而提升模型训练的效率。

容联AI实现「数据自动化打标」和「测试集自动提取」

4、测试集数据自动提取

过去的测试集数据是在训练集数据中通过手动的方式进行拆分,耗时耗力,如果数据拆分不均匀,还可能导致最终模型效果不佳、评测结果存在偏差。本次迭代打破传统方式,仅需在模型训练时,选择所需训练集文件,系统自动按照训练集标签数量提取一定比率的测试集数据出来,数据提取更科学,评测结果更真实。

容联AI实现「数据自动化打标」和「测试集自动提取」

  5、支持意图、多意图、情感、句式识别模型评测

在模型评测方面,本次新增单意图、多意图、情感、句式识别的模型评测结果输出,同时我们还对模型评测的指标计算方式进行调优处理,使模型结果数据评测更加精准有效。

6、内置通用模型数据,全平台可使用

结合容联在数据上的沉淀积累,容联将百万级数据通过清洗整理,并训练成行业场景的通用模型,尽可能实现开箱即用,减低冷启环节的耗时。本次更新容联将这些模型开放出来,可供全平台的租户使用。

7、数据安全升级

本次数据安全升级主要从两个方面进行了全新升级,一方面对数据本身的安全加密,采用符合绝大部分客户要求的密码算法对数据进行主动保护,另一方面对数据防护的安全,采用信息存储手段对数据进行主动防护。所有训练平台数据统一放入NAS目录进行存储。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

Baidu
map