构建语音识别技术壁垒,作业帮语音弹幕为课堂增温

为了全方位模拟线下课堂的高频互动场景,突出小组化学习理念,作业帮技术团队用了一年多的时间,借助AI语音交互、视觉互动等手段,不断丰富小组直播间的交互功能。语音弹幕作为其中第一个语音类产品,首先打破了在线直播课的沉默。

从键盘到话筒,多方案化解语音弹幕技术难点

为了改变传统大班线上课冷冰冰的氛围,在充分调研学生及家长的需求后,语音弹幕的研发需求被正式提上了日程。本着“试水”的心态研发上线后,团队却收到了意想不到的良好反馈。

从技术层面来说,语音识别在行业里并无秘密,但从在线教育场景来看,语音弹幕的瞬时高并发成为了最大难点。

暑假期间突发的高频次使用,让作业帮后端机器面临巨大的压力。为了抗住这“甜蜜的负担”,技术团队紧急增加机器,以几十万的成本使全公司集群扩了一倍。

在扛过了2020年暑期课程的难关后,技术团队化被动为主动,通过更加灵活的架构、行业最低的动态扩收容成本,持续研发支持几十万路并发的“端云一体”,最终从硬件层面成功化解瞬时高并发的技术难题。

自研自动筛选数据算法,作业帮巧妙突破语音识别技术瓶颈

在硬件准备到位后,技术团队开始对语音识别技术的准确率精细打磨。对于新闻类、速记类语音识别功能来说,接近100%的准确率并不稀奇,但在针对低龄小学生语音的场景下,准确率会因各种原因大打折扣。“尚处语言学习阶段的小学生语音表达不清晰、答非所问,又或者家长在一旁引导、方言和口音、环境噪音等问题,都会影响语音识别的准确率。”

据了解,目前方言识别在全行业尚无好的解决办法,只能靠手动标记;对于环境噪音,研发团队则采用传统的信道方法,提取其声学特征后判断过滤。

但在专业领域识别上,语音弹幕依靠丰富且独特的在线教育场景,提供足够量的资源库。相关研发人员表示,“和互联网大厂相比,算法的创新性很难,但是从玩法来说,在线教育场景将会助推技术发展到极致。”

摈弃手工标数据,作业帮技术团队攻坚克难,研发出一套自动筛选算法,能在短时间内自动挑选领域内数据,并迅速学习增强自身模型。

除了在技术上不断精进外,技术团队也积极推动着产品、研发闭环的打造,充分尊重和重视用户需求,以做产品的心态持续推动技术研发升级。

AI技术持续升级释放科技势能作业帮架起通往教育普惠桥梁

小组直播间上线后,为使直播课堂进一步向“即时交流”的线下课迈进,作业帮基于自身技术能力,增加了丰富多样的高频互动场景和AI互动功能。

近年来,AI技术逐渐进入大众视野。但对研发负责人王强强来说,AI技术的发展应用前景远不止于此“虽然目前AI技术仍处于感知智能阶段,远未达到认知智能的预期,但是它的前景是很远的。”

而在线教育,则是AI技术很好的一个应用场景。“AI对于在线教育来说最大的益处在于,让学生随时随地有一个老师”。未来,AI交互更加智能、自然,有利于在线课堂线下化的发展趋势。

谈及对于在线教育资源普惠的理解,王强强认为,对那些暂无机会直接接触优质信息资源的孩子来说,在线教育以跨越时间、空间的普惠性,缩短着由资源差异带来的信息差距。

未来,作业帮将持续推动产品功能升级,以科技引擎赋能教育普惠,让优质资源教育触手可及。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

Baidu
map