各位小伙伴有没有感觉到,AI作为时代的宠儿,每天都在快速迭代。这不,站在技术最前沿的百度云,也在不断将AI能力纳入到产品和解决方案中,以方便开发者、用户应用到业务中,实现企业的智能化转型。
接下来,我们将为您呈现百度云1月份AI技术的更新情况,希望对您的业务有所帮助。
新开放AI技术能力
AI技术能力方面,1月,百度云在图像识别、人体分析、OCR、自然语言处理四个技术方向均有新能力提供,从而也催生了更多业务场景。
• 图像识别。1月新增两种能力:车辆分析和红酒识别。
在车辆分析的车型识别能力中,可以识别近3000款常见车型,比如可以识别小汽车的车型、年份、颜色、百科词条等信息。而在车流统计能力中,则根据视频抓拍图像序列,进行车辆检测和追踪,识别指定区域内各类车辆的进出情况,可输出含统计值和跟踪框的渲染结果图。除了这两个能力之外,车辆分析能力还包括车辆检测、车辆外观损伤识别等能力,适用于拍照识车、违停监测、路况分析、智能定损等场景下使用。
红酒识别则是输入一张红酒图片(酒标清晰可见),就能识别图片中的红酒名称,方便在电商购物、红酒鉴定等场景使用。
• 人体分析。人流量统计(动态版)公测上线,以面向门店、通道等出入口场景为主,此统计以头肩为识别目标,进行人体检测和追踪。可根据目标轨迹判断进出方向,实现动态人流量统计,极大提高识别率和精准度。
• OCR方面。3个新接口邀测上线:保单识别、税务局通用机打发票识别和行程单识别。这意味着百度云OCR能力的准确度提升,适合多种复杂的环境,处理能力也将大大提升。这对于大多数需要使用OCR环境的场景来说,是一个好消息。
• 自然语言处理。1月新增智能写作一系列能力。像之前我们报道过的智能写春联、智能写诗(《企业拜年,今年可以换种方式了》)能力,已经在春晚中得到应用,并受到不少企业的欢迎,为它们的营销活动增加不少乐趣,提升营销的用户体验和传播价值。除此之外,本次还增加了结构化数据写作、热点事件脉络、人物图谱功能接口等,可满足各类智能写作业务需求。
总体来说,这类能力集合了百度云领先的自然语言处理和知识图谱技术,提供自动写作和辅助写作的能力,全面提升内容创作效率,旨在成为最懂你的智能写作助手,广泛应用在媒体与内容创作行业、商业智能、行业报告与咨询机构和市场营销与活动中。
优化5大AI技术模型
从AI技术模型优化角度来说,1月模型易用性能大幅提升,方便开发者调用。
• 图像识别。通用物体和场景识别高级版开放购买。除了提供500次/天免费调用量外,还可以开通付费购买更多的调用量。可按照后付费阶梯计价(2-3元/千张),并享受10QPS的稳定并发能力。
• 图像搜索。图库管理后台易用性升级,支持在线测试检索效果。相同图搜索、相似图搜索、商品图搜索同步升级,不用调接口就能测试体验以图搜图的真实效果。
• 人脸识别。人脸离线识别SDK全面升级,各方面的速度有所提升,这表现在,人脸检测、活体检测、特征抽取速度提升150%,全新生活照及证件照模型精度同比1.0系列提高近1.5%,重写20余个底层API,降低了30%的开发量,新增的人脸通行、人证比对场景化示例工程,增加了10余个场景化配置能力,可在1分钟跑通全流程业务逻辑,应对各类场景细节需求的二次开发等。
此外,人脸检测升级,可以快速检测人脸并返回人脸框位置,定位五官与轮廓关键点数量,也从72个增加至150个,可更好的支持人脸特效场景。人脸搜索的1:N识别接口max_user_num参数上限从20增加到50,支持最多返回50个相似人脸。
• 人体分析。手势识别模型升级,增加“竖中指”手势,现共累计支持24种手势。该功能可用于审核场景。人体检测与属性识别模型升级,优化模型算法,增加“是否正常人体”属性,所有属性增加“不确定”输出项取值,区分不确定的识别结果,例如吸烟属性,以前输出项为“未吸烟、吸烟”,现在则为“未吸烟、吸烟、不确定”。
• 自然语言处理。评论观点抽取(定制版)优化,输出标签不再局限于现有“名词+形容词”的形式,解决原名词+动词(如:包裹破损)提取不出来的问题。
定制化平台与工具
为方便企业与开发者更好地研发使用,平台与工具的定制化依旧是AI能力升级的重点。1月在EasyDL定制化训练及服务平台、理解与交互技术UNIT均有较明显的突破。
• EasyDL定制化训练及服务平台
物体检测中“高精度标准算法”分布式训练后端优化,可将训练模型所用时间缩短至原先的1/2-1/3时间。新增可实时查看模型训练进度功能。此外,还可以添加短信提醒,训练完成时就会收到提醒信息,实现用户实时掌握全流程进度情况。新增云服务调用数据功能,可用于管理调用接口时上传的数据,提高模型的迭代效率,实现训练数据的持续丰富和模型效果的持续优化。
• 理解与交互技术UNIT
1、新增6个预置技能
1)电视剧:可用于电视剧查找的场景,支持精确搜索与模糊匹配。
2)机器人控制:解析用户与智能机器人的互动指令,提供做表情、拍照、举手等指令。
3)提醒:提供日程管理的功能,包括设置、查询及删除提醒。
4)发微信:识别用户对微信的操作指令,支持打开和关闭微信应用、收发微信等功能。
5)发短信:识别用户对短信的操作指令,支持打开和关闭短信应用、收发短信等功能。
6)屏幕控制:解析控制智能设备屏幕的指令,提供屏幕划动、列表的排序和选择、翻页等控制指令。
现在,UNIT已累计提供23个预置技能,开发者只需点点鼠标即可轻松获取对应场景的智能对话能力。
2、正式推出“技能复制”功能
开发者可通过该功能,将技能复制到任意账号中。基于此功能,可快速实现技能的备份、账号技能迁移,以及复制多个技能进行二次开发用于相似业务。
3、“UNIT对话测试助手”小程序,新增机器人和预置技能体验功能
UNIT对话测试助手小程序在原有支持自定义技能的基础上,增加机器人、预置技能的对话效果体验功能,还可以通过分享小程序来向其他开发者展示。
AI硬件产品与服务
• 远场语音开发套件重磅发布。远场语音开发套件集软硬件一体,包含麦克风阵列和开发板,支持声源定位、噪声消除等信号处理算法,5米内完美拾音,支持远场唤醒、远场识别、语音合成能力,使语音开发评估更简便、高效。
• EasyEdge端计算模型生成平台重磅发布。可基于多种 学习框架、网络结构的模型,零代码生成高性能端计算模型及封装SDK,适配多种AI芯片与操作系统,模型识别速度最高可提升10倍。
以上为大家介绍了这么多AI能力升级,想不想体验一下?1月AI体验中心小程序也有新突破。全新上线了3项能力,分别是人像分割、情绪识别、智能春联。在语音识别服务方面进行了优化,时延更低,并在小程序中增加了识别、合成用时信息。
关注百度云微信公众号,就可体验哦
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。