10月22日消息(南山)在ICT行业众多“风口”中,智能家居无疑是特别的一个。整个产业链,从运营商、设备商、终端制造商到家电家居厂商都认同智能家居是万亿级的大市场,互联网公司也纷纷入局,意图“降维打击”。但十多年来,先驱大多已经熬成了先烈,市场还没有真正起来,产业规模离万亿级差了一个数量级。
突破口是智能音箱,被互联网公司做成了单品爆款,比较典型的有小爱同学、小度音箱等。据笔者了解,为了形容小爱同学的“智能”,小米公司近期还特地拍摄了一段有趣的短视频。雷军:“我是谁?” 小爱同学:“他是我的爸爸,我很爱他……”
让智能家居“听懂”人们说的话,学会“察言观色”,这是更高层次的人工智能。可以判断,不仅是智能音箱,AI数据赋能让各类终端变得更加聪明,打开了智能家居爆发式发展的想象空间。
在日前举办的中国(杭州)国际智能产品博览会暨全球人工智能大会上,云测数据公司总经理贾宇航发表演讲提到,人工智能一共有三要素,算力、算法、数据。前两者是基础设施和能力,后者是让AI学习的知识素材。只有高质量的标注数据,才能高效训练算法,赋能各种类型的终端。云测数据宣布的“最高交付数据99.99%精准度”,正是AI数据服务受到产业重视,成为人工智能应用重要一环的标杆性成就。
小作坊到大生产
在人工智能三要素中,算力与算法已经取得令人醒目的进步,且仍处在高速发展中。从算法看,已批量诞生独角兽公司,最典型的是人工智能“四小龙”商汤、旷视、云从、依图。从算力看,今年发改委明确“新基建”范围,定义了算力基础设施,包括数据中心,智能计算中心等,算力发展迎来了政策层面的大利好。
在数据方面,业界也认识到其价值的重要性,“没有好的数据,人工智能没有未来”已成行业共识。随着人工智能技术落地场景,不同场景提出了更高质量、更多元的数据需求。从数据服务的趋势看,原有的小作坊式数据生产,逐渐向大规模专业第三方供应商迁移。
第三方定制化数据标注服务商,最具代表性的企业当属云测数据。其中,在《互联网周刊》联合eNet研究院共同发布的《2020年数据标注公司排行》中,云测数据位列第一。有媒体总结,目前中国在 AI 领域有五家公司被称为“人工智能五强”,算法层有商汤、旷视,AI数据领域有云测数据,硬件方面有涂鸦智能、地平线。这些公司专注于深耕AI细分领域并拥有让行业认可的成果。其中,云测数据在今年首场国家级重大国际经贸活动服贸会上,首次发布了一项数据标注领域的重要成果:云测数据项目最高交付精准度达到了99.99%,刷新了数据标注领域可达到的最高服务标准,显示出一向“低调”的数据服务领域,也和算力、算法一样正在取得显著进步。中国人工智能在底层基础支撑、中间技术创新、顶层应用之间正在形成完整的生态链。
据了解,云测数据一方面自建了数据场景实验室与数据标注基地来对相应AI数据进行生产。另一方面,在AI数据生产中,设计了从创建任务、分配任务、标注流转、到质检/抽检环节和最后的验收等更完善的管理流程,每个环节有相应专业人员来把控数据标注的质量和时间节点,从而提高了数据生产的质量和效率。
在笔者看来,云测数据“四个九”以及背后的数据生产方式,意味着数据标注产业“小作坊”式生产将越来越难以为继。随着人工智能场景化渗透带来的高质量数据需求大幅提升,数据标注产业呈现马太效应的趋势,将逐渐向头部公司聚集。
云测数据的“升维”打法
相比互联网公司运用互联网思维进军智能家居家居市场,号称降维打击,云测数据在AI数据标注方面,采取了“升维”的打法。提升数据精准度是其中一方面;另一方面,在数据场景化标注方面,云测数据也做了大量工作。
其行业首创的数据场景实验室,通过还原真实使用场景,深入研究人工智能长尾场景特点,完成在对应传感器下的场景数据采集工作。这种专注和用心,弥补了很多原始数据的不足。基于数据场景实验室,云测数据数据采集的维度,能够全方位支持企业在文本、语音、图像、视频等各类AI数据的需求。
以智能家居为例,由于智能家居多以房屋、住宅、社区为载体,应用场景相对更具集中性和确定性,因此更重产品更重体验。人工智能主要解决的是机器在看、听、理解方面的问题,语音识别与自然语言处理能力已经成为兵家必争之地。
云测数据标注数据的维度,在语音方面,支持ASR语音转写、声纹识别标注、说话人识别、语音切割、情绪判定标注等;在自然语言处理方面,支持OCR转写、NLU语句泛化、文本信息抽取、实体标注、词性标注、槽位填充等,支持全方位的标注类型。同时,具有自主知识产权的数据标注平台拥有灵活、高效、智能的特点,数据标注过程更加高效高质,最终帮助智能家居产品落地。
“从 学习、机器学习的发展趋势和应用方向可以明显看到,不管是钻得更深或是在应用层面铺得更广,我们都会需要更多数据。我觉得这个趋势至少还能保持十几年。”据甲子光年之前报道,AI企业对高质量数据需求呈现“饥渴”状态。这有助于云测数据等头部玩家能够迅速抓住行业转型的时机,在市场落地过程中,形成AI数据服务新的游戏规则。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。