近日,全国“扫黄打非”办公室为贯彻落实2019年“扫黄打非”专项行动,从3月起开始大力组织开展“净网2019”、“护苗2019”、“秋风2019”等专项行动,持续净化社会文化环境。
值得关注的是,本次线上“扫黄打非”工作,将重点整治对象瞄准了包括自媒体、文学、直播以及学习类APP等场景。丰富大众娱乐生活的直播 APP 快速发展,衍生出了众多全新内容平台,别有用心者嗅到机会,开始散播色情、暴力等“网络垃圾”。此外,互联网流量的不断增加,也使得互联网“扫黄打非”工作难度不断升级。面对此次国家新一轮的净网行动号召,直播 APP 等内容平台何去何从?
梳理互联网“扫黄打非”的历程,不难发现出现了三次显著的技术对抗更迭:
1. 互联网起步阶段,互联网鉴黄主要走“人肉攻略”,人工完成图片鉴定工作;
2. 随着互联网的发展,网络数据量骤增,以肤色识别算法过滤“黄色”图片成为了主流手段,机器鉴黄与人工鉴黄相互配合;
3.如今,到了移动互联网阶段,网络数据再次骤增,人工鉴黄已经很难适应如今的工作量,加上视频、直播等业务的暴涨,纯靠肤色识别算法作为“过滤”的方式,已经过时。
好在人工智能的适时出现,通过 学习匹配处理庞大的数据信息。
特征提取+智能识别,扫荡“音视图文”的黑暗角落
针对藏匿在互联网“音视图文”中的不良内容,腾讯云天御对色情、暴力、敏感等非法内容中提取的特征,配合腾讯多年的内容安全经验,针对不同形式的违规内容,打造了一整套的高效识别引擎模块。
首先,面对图片内容会有相似度识别通过与过往的数据内容相比,判断该图片是否属于违法范围。如果命中将会给予客户拦截的建议,否则将送到后续的智能识别模块识别色情、暴力、敏感等非法内容。
针对视频内容,腾讯云天御会根据一定频率截取视频图片,得到视频按帧记录的图片库。去掉重复的和模糊的,提取关键因素的图片送到产品后台系统。之后对其采用图片识别模块的操作,对其视频内容进行判断。
此外,在面对文本内容信息时,腾讯云天御通过智能模型处理系统,对其包含的内容做检测,识别其中是否包含色情、暴力、敏感等违法要素,给予迅速地拦截。
除了能够检测正常文本之外,还配置了强大的文本预处理系统对抗非法分子创造的恶意文本,有效地打击了非法分子的恶意文本传播行为,建立一个健康的检测模型。
以 AI 正视听,毫秒级识别不良音频
道高一尺,魔高一丈。除了常见的图片、视频、文本等形式外,音频如今也成了垃圾内容的“主战场”。
当下,游戏内语音交流已成常态,无论是手机游戏中的音频传输,还是通过语音及时通讯工具传输的音频内容,都是音频垃圾内容的灾区。此外,在直播平台直播过程中,也有违规音频内容的传播、传递,制造网络垃圾。
音频内容往往时间短或是信道复杂等问题,难以分辨,隐隐成为当下“扫黄打非”的难点。
腾讯云天御语音识别模块能够对语音进行音频分类和种子库匹配等方式来过滤恶意音频,同时还通过音转文技术对样本库进行更新,达到精确识别语音的目的。
在具体技术上,腾讯云天御采用了高效的 i-vector 系统保证较长音频正确快速检出,同时对信息量不足的短音频采用 DNN embedding 系统进行特定检出,两者互为补充,加上多种信道补偿算法的融合,同时保证了系统的识别性能和识别效果。
基于变长统计和 学习混合的鉴黄系统,腾讯云天御可以做到0.02秒能够识别1秒的音频。
权威认证 腾讯云天御守卫您的内容安全
腾讯云天御针对互联网不良内容的体系化识别能力,也获得了国家的认可。2019年1月16日,在由中国信息通信研究院指导,云计算标准和开源推进委员会承办,云计算开源产业联盟支持的"严守红线,共筑安全-内容安全的管与控"的云计算安全沙龙上,中国信息通信研究院发布了国内首批内容安全解决方案评估成果,腾讯云成为首批通过试点评估测试的企业。
目前,腾讯云天御已在多个行业被应用,守护近万家客户的内容安全,保障业务健康开展,守卫互联网的一片净土。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。