人工智能作为如今最前沿的技术之一,每天都处于快速的更新迭代中。为了给客户提供最优质的服务,百度智能云也在不断升级自己的AI能力,推出更多产品和解决方案,助力企业的智能化转型。
接下来,我们将为您盘点一下百度智能云5月份AI技术的更新情况,希望对您的业务有所帮助。
更多AI技术能力上新
AI技术能力方面,5月,百度智能云在语音合成、文字识别、人体分析、图像识别四个技术方向上均有新能力提供,也催生了更多业务场景。
1、语音合成:全新推出精品音库
这次的语音合成产品新增了5个精品音库,包括童声音库度米朵、度小童、情感男声度博文、情感女声度小娇、度小雯,可以满足更丰富的场景需求。
2、文字识别OCR
▷ 手写文字识别模型升级
支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,中文识别准确率提升38%以上,识别准确率可达90%以上;而且现在注册还可以享受 50次/天的免费调用额度,先试后买,让您用着更放心。开通付费后即可无限调用,价格低至4.5元/千次起。
▷ 数字识别模型升级
支持对图片中的数字进行提取和识别,自动过滤非数字内容,返回结果包含数字内容及其位置信息,识别准确率超过99%;同样,现注册就可以领取 200次/天的免费调用额度,开通付费后,并发量即可提升至10次/秒,超出免费额度将按次进行阶梯计费;价格低至2元/千次起。
▷ 身份证识别模型升级
1)正面:即人像面——住址字段识别准确率提升至95%+。
2)反面:即国徽面——签发机关字段识别准确率提升至98%+。
▷ 银行卡识别模型升级
支持对银行卡的卡号、有效期、发卡行、卡片类型4个关键字段进行结构化识别,识别准确率超过99%。模型升级支持识别更多地方银行的银行卡及非常规卡片(如卡号在背面)。
▷ 出租车票识别模型升级
支持城市由北、上、深扩增至全国30余个主要城市和地区,精准识别出租车票的6个关键字段,包括发票号码、代码、车号、日期、时间、金额。
▷ 网络图片文字识别模型升级
模型升级,整体识别准确率提升11.8%,能够快速准确识别各种网络图片中的文字,在复杂字体和复杂背景的情况下仍能保持非常高的识别准确率。
3、人体分析:人体检测与属性识别模型升级
百度智能云在5月对人体分析模型进一步升级,21类属性的平均准确率从84.4%提升至88.1%。
4、图像识别
▷ 红酒识别技术正式开放
识别图像中的红酒标签,返回红酒名称、国家、产区、酒庄、类型、糖分、葡萄品种、酒品描述等信息,可识别数十万中外红酒。
▷ 货币识别技术正式开放
识别图像中的货币类型,返回货币名称、代码、面值、年份信息,可识别百余种国内外常见货币。
▷ 通用物体与场景识别模型升级
模型升级,Top1准确率绝对值提升7%。支持超过10万类物体和场景识别,接口返回单张图片内的1个或多个物体的名称,并关联百科词条信息,广泛应用于广告及内容推荐等业务场景中。
▷ 植物识别模型升级
模型升级,Top1准确率绝对值提升11.76%。支持识别2万多种植物和近8000种花卉,接口返回植物的名称及百科信息,适用于拍照识图类APP中。
更丰富的AI开发平台
5月,百度智能云新开放了2个AI开发平台,包括:EasyDL定制视频分类和iOCR财会版。除此之外,智能对话训练和服务平台UNIT全面升级至3.0,有哪些新功能,一起来看看吧!
1、EasyDL定制视频分类
面向视频分析场景,通过标注每类50个、10s以内的视频片段进行训练,从而实现 “需要连续图片帧组合判断”的视频内容分析,可用于定制工人操作行为规范识别AI模型、定制物体移动方向判断的AI模型等业务场景中。
2、iOCR财会票据识别
新开放的iOCR财会版为财务工作者带来了福音,许多繁琐的工作以后都有AI平台代劳啦。目前已经开放的功能包括:
1)新增票据检测分类功能,可直接识别发票粘贴单上的多张不同类型发票。
2)系统预置7种报销常用票据模板、4大行及招商银行的银行对账单模板,可满足80%以上财会场景需求。
3)对于特殊票据,支持快速自定义模板及分类器。
4)底层模型针对财会场景进行专项优化:支持自动去红章;支持套打偏移识别;金额数字识别精度更高。
3、理解与交互技术UNIT 3.0
▷ 重磅发布「我的知识」,一站式实现知识挖掘与语义理解
「我的知识」模块在UNIT中引入了百度知识图谱通用算法集合,帮助开发者使用自有数据构建企业图谱知识库与问答知识库,挖掘的知识可用于优化技能模型的理解效果、完善对话流程的控制与答复。
▷ 全新推出「对话式文档问答」,导入业务文档自动构建对话模型
基于「对话式文档问答」技术,开发者只需导入业务文档,即可自动构建出基于文档理解的对话技能,允许开发者对对话效果进行调优,具备持续学习能力,大幅降低了产品介绍、说明等场景下的智能业务问答开发成本。
▷ 全新发布对话日志挖掘工具「Data Kit」,大幅提升模型调优效率
离线对话日志挖掘工具Data Kit,支持从对话日志中挖掘出对话训练样本,来训练、优化对话模型的理解效果,帮助开发者以低成本不断提升模型理解效果,样本生产和标注效率平均提升8倍。
▷ 开放支持自定义调优的离线SDK,确保断网环境下的语义解析能力
具有端计算能力的离线SDK,可提供智能车载、智能家居等多个场景下的离线场景文件,并支持自定义调优,实现设备在断网环境下也可以提供语义解析服务。
▷ 预置技能增至58个,满足更多场景需求
新上线可定制预置技能3个,包括会议室预定、电台控制、购买药品,开发者可以根据业务需求调整这些技能的词典,让预置技能效果更贴合业务;同时还上线了含资源预置技能:成语问答、计算器、进制转换、单位换算,可直接解析出问题的答案。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。