对话融云:从WICC大会百家争鸣,看风口之下音视频社交的三大新机遇

摘要:增长趋势会逆流吗?合规难题怎样解决?中小厂商如何入局?市场机遇转瞬即逝,怎么快速上车?音视频赛道的核心问题都在这里了。

年初 ClubHouse 的爆火引起了不少行业玩家对语聊房模式的复制热潮,也带来了音视频社交的一波爆发式增长。基于行业新风向,互联网通信云技术服务商——融云,在今年 WICC 大会进行了一次大胆的革新。

11 月 20 日,融云主办的全球互联网通信云大会 (WICC) 在广州召开。不同于往届专注 PaaS、IaaS 层技术研讨,今年融云邀请到 Unity、Beeto、StarMaker、LiveMe、积目、荔枝等多个社交泛娱乐领域的全球化厂商齐聚一堂,从海内外市场特征、技术实现与创新、内容合规、未来趋势等多个角度进行了更加贴合场景业务的 探讨。

会后,扬帆出海特别邀请到融云 COO 董晗,针对此次 WICC 大会上音视频社交的话题观点进行了专访。董晗表示,此次 WICC 与出海厂商们进行了一次非常透彻的探讨,结合融云多年服务出海开发者的经验,可以看到音视频社交领域的一些新趋势。

“最近关于 ClubHouse 缺少变现渠道的新闻,让不少人对音视频社交的前景心生忧虑。但基于与开发者的沟通和对国内外市场的分析观察,我们认为这个增长趋势是不会逆流的。如今我们的通信技术已经处于国际领先水平,在融云这样的服务商赋能下,很多开发者已经成功摸索出自己的业务模式。尤其是在出海业务上,音视频社交依然大有可为。”

增加“轻量级社交模块”是趋势

近两年,在“视觉经济”被推上极致的同时,“耳朵经济”也以后来者的姿态迎头赶上。“在我看来,疫情之下,音频的属性特征成为‘耳朵经济’崛起的重要原因。首先,语音对话是人们最自然的交流方式;其次,音频具有‘伴随性’特征,可以一边听一边做其他事;另外,音频相比于视频,对带宽的要求更低。除了单向输出的电台模式,我们发现音频场景下的互动趋势越来越明显,互动播客、语音陪玩、多人语音聊天等各类玩法异军突起,成为陌生人社交的新风口,吸引大量企业入局。”

基于融云丰富的语音社交领域服务经验,董晗详细介绍了她所观察到的一些行业变化。

“作为音频社交的一种,中国的语聊房业务更偏向于社交娱乐场景。不过,最近语聊房在属性和玩法上有了一些新的趋势。比如,之前大多社交娱乐类软件都是单纯做语音社交;而现在,除了社交娱乐类软件,工具类、生活类、汽车类、酒店类、旅行类等各种软件,都会增加语音社交的功能,把它当作一个必不可少的‘社交模块’。”

另外,不同的社交场景在 APP 用户增长及变现中所承担的角色不同。董晗解释道:“比如从变现能力来说,1v1 聊天场景用户的付费意愿更高,但并不是所有 APP 都有能力用这种重度社交模式留下用户。所以,我们看到这样的现象:很多 APP 会在主流服务基础上增加直播、语聊房等模块,这样可以用更轻量级的社交调动用户活跃度,进而向重度社交,乃至付费变现导流。通过多种社交场景的叠加,可以增强 APP 的用户粘性和变现能力,这也提升了他们对通信云技术的需求程度。”

事实上,正如董晗所言,如今语聊、直播越来越“轻量化”,为了提升用户粘性,大部分 APP 都在渗透社交。然而在这样的趋势下,厂商的运营能力和开发能力也在面临比较大的挑战。

“这其实也是我们把语聊房、直播等场景都做成 SDK 提供给开发者的原因——‘开箱即用’的场景化SDK帮开发者解决了通信和功能实现难题,开发者得以把更多精力和时间用于玩法创新和运营上。”

近期,融云语聊房 SDK 2.0 上线。作为业界首个完全基于场景化的 SDK,不同于行业普遍存在的基于开源代码的二次开发服务方式,这个SDK直接封装了场景功能,让开发者通过调用不超过20个API,就能实现一个语聊房,最大限度地降低开发者的研发成本。

据董晗介绍,实操过程中,通过融云语聊房 SDK,开发者可以在 30 分钟内快速构建出一款语聊房产品,并且可以申请软件著作权实现上架,保证整个产品的运营节奏。

AI、5G将给语音社交广阔“空间”

面对当前的语音社交大热趋势,中小厂商该如何在同类产品中脱颖而出?结合 WICC 广州上的话题探讨,董晗给出自己的答案:

“我个人的建议是,非社交类APP在顺应‘轻量级社交模块标配’趋势的同时,可以关注一下语聊房内交流内容的运营。要让内容更加垂直化,话题更具稀缺性,主题更符合 APP 特性,而不是纯娱乐、发散型的,让这个功能模块在各类APP中焕发出更大的活力。”

董晗表示,对于想要破局的开发者来说,关键在于有更新的玩法以及快于同行的开发速度。要快速形成自己的产品,并投入市场试水。融云场景化 SDK 就是为了满足开发者的这一迫切需求。

从技术的角度出发,关于语音技术的几大发展方向,融云也有自己的洞察:

第一,空间感和沉浸感。这也是最近兴起的元宇宙比较强调的概念。正如视觉上,虚拟场景里正在向三维拓展,语音也在以提升空间感和沉浸感的方式向三维方向发展。

第二,交互中的多语言处理。语音交互最为自然,但全球化语境下多语言不互通是语音社交的壁垒。通过AI的同声传译,这一问题相信在未来5-10年内可以被解决。

第三,未来的人机交互。现在人机交互还停留在指令识别阶段,在不远的将来,我们将可以实现完全的人机语音交流,甚至跟不同类型的机器人聊不同的话题。

“总体来说,语音一方面要解决沟通的问题,一方面要趋向‘身临其境’。未来除了立体声听音乐之外,实时语音交互也会走向空间体验。随着AI、5G甚至6G的未来发展,还会有很多新场景出现。前景很好,技术纯熟,只待时机。”

攻克“通信周边”难题成业务刚需

在国内互联网企业纷纷出海的大趋势下,融云也早早随着服务客户的脚步走上了全球化发展之路。在这个过程中,融云一方面全力帮助客户攻克出海遇到的通信技术难题,另一方面也不断总结各个海外市场的本土特点,进一步强化通信周边服务能力。

“经过几年的努力,我们的通信底层基础设施已经做得非常好,例如‘最后一公里’的质量问题早已被我们攻克,能够确保全球范围内的通信低延迟、高到达率。而除了通信问题,出海业务也必须解决与本土化适应相关的‘周边需求’难题。”


对话融云:从WICC大会百家争鸣,看风口之下音视频社交的三大新机遇

周边需求主要有两个方面:

一是文化国情差异,出海客户面临的是与国内完全不同的市场环境,有更高的复杂性。

“比如,非洲地区有个问题——用户下载及更新APP的成本很高。我们建议非洲市场客户尽量采用H5的方式去更新APP,不要让用户自己重新下载。”这是对通信服务全平台适配度的考验。

“再比如,有些国家习惯于从右往左书写,那我们提供的SDK在UI设计等方面要适应当地这样的习惯。”这是对通信产品丰富度的要求。

二是内容合规难题,由于各个国家政策法规、宗教信仰、风俗文化不同,相应内容审核的要求差别很大。在内容审核上,董晗特别提到了“音频识别”技术。“不同于视频可以抽帧成图片去识别,声纹有众多变化,如何精准识别?一旦用户的行为发生变化后,技术能否实时更新快速跟上?”

董晗表示,针对合规这个线上业务“老大难”问题,融云与业内多家专业内容审核平台达成了合作,为开发者提供多种可以一键配置的选择。无论是图文还是音视频,都能够以SDK集成的方式提供最优解决方案。

类似审核这样的非通信核心但却是业务刚需的周边能力,融云还打通了很多。这正是融云提出的“IM+RTC+X”战略升级内容,在 IM和 RTC 双核心能力之上,把美颜、变声、虚拟背景、审核、推送、聊天机器人、文字翻译、地图、语音转文字、表情、红包、CDN、白板、SIP、版权音乐等多种通信周边能力整合到一个SDK中,且适配 Electron、Mini Program、Windows、Linux、Flutter、React Native、Unity、uni-app 和 H5 等全平台系统,确保多端、多平台的相互兼容。

这将极大减少开发者的工作量,省去开发者自己逐一对接第三方厂商的功能、代码以及价格的过程。“我们会有一线高阶研发人员帮开发者选型:在不同国家和地区,哪家服务商更好,抗压、并发、识别准确度更高,整合各家所长为开发者服务。”

最后,董晗表示,融云希望提供一站式出海解决方案,从底层架构、到安全合规、再到本地化适应的全程技术陪伴,如全球通信网络、全球数据中心、内容安全、隐私与数据合规、多语言支持、文字语音翻译等,助力开发者在海外市场开疆拓土。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

Baidu
map