对抗仇恨言论,Facebook 推出看得懂表情包的新 AI 系统

Facebook 宣布开发出了一款名为 Rosetta 的新型人工智能(AI)系统,可用于检测图片和视频帧(video frame)中的仇恨性言论。

对于 Facebook 来说,他们面对的是每月 22 亿用户发布的浩如烟海的信息,这其中不仅有文本,还有图片、视频、表情包等等——仇恨言论可能会在其中以任何形式出现。Facebook 称,Rosetta 可以读懂图片和视频帧上的影像和文字,分辨其是否是违反 Facebook 内容审核指南的内容。

Rosetta 检测示例图 来源:Facebook

Facebook 官方展示了一张示例图。在检测一张印着“企鹅会飞”(penguins can fly)的文字的企鹅图片时,Rosetta 将文字与图像区分开来,并使用卷积神经网络来识别和转录两部分的内容,最终判断出这是一张“表情包”(meme)。

对于一直因难以有效控制仇恨言论传播而饱受指责的 Facebook 来说,这一系统的推出将有助于缓解其燃眉之急。

自 2015 年以来,Facebook 一直在使用一种名为光学字符识别(OCR)的检测系统,但 OCR 在检测仇恨言论的能力上稍逊一筹。具体差在哪,从 Facebook 今年 5 月公布的《社区标准实施报告》结果中就能看出。

这份报告公示了 Facebook 今年一季度删帖、封号的记录。在他们删除的所有内容中,“裸体和性”占到了 72.7%,“图片暴力”占到了 11.8%,而“仇恨言论”只有 8.7%。

一季度受到 Facebook 处理的仇恨言论只有 250 万条,是所有类别中数目最小的一个。而且,其中 Facebook 自主检测的内容只占到了所有被标记内容的 38%,有超过 60% 的内容需要靠用户举报来发现,让人怀疑是否有更多的内容还隐在暗处未被揪出。

这其中的原因,一部分是因为“Facebook 的人工智能系统目前仍然难以辨别言论中的仇恨情绪。”Facebook 产品管理副总裁 Guy Rosen 说。另一部分原因是 Facebook 上的仇恨言论本身可能并不那么显而易见。

今年 4 月,Facebook 上的一些不实信息助长了斯里兰卡佛教徒和穆斯林之间的冲突。罪魁祸首其实往往是一些带有煽动性质的谣言,起初可能和仇恨与偏见并无瓜葛。内容本身已经足够具有迷惑性,更不用说 OCR 能够理解的语言还非常有限,在很多小语种地区 Facebook 还需要依赖当地人工审查员来分辨内容。

马克·扎克伯格在国会证词中表达了将来使用 AI 来清除其平台上的仇恨言论的计划:“我乐观地认为,在五到十年的时间里,我们将拥有一些人工智能工具,可以深入了解不同类型内容的语言细微差别,以便更准确。”

Rosetta 就是在此关头临危受命的 AI 系统了。据 Facebook 介绍,这一系统同时适用于 Facebook 和 Instagram,每天可以检测十亿张图片,并识别除了英语和拉丁语系以外的语种,比如阿拉伯语和印度语等。

目前,Facebook 和 Instagram 团队已经开始使用 Rosetta。该公司计划继续增加它可以理解的语言数量,并使其能更好地从视频帧中提取文本。

说到语言,Facebook 最近还为其自动翻译服务增加了 24 种新语言,包括塞尔维亚语,白俄罗斯语,马拉地语,僧伽罗语,泰卢固语,尼泊尔语,卡纳达语,乌尔都语,旁遮普语,柬埔寨语,普什图语,蒙古语,祖鲁语,科萨语和索马里语。Facebook 称,这些语言的翻译尚处早期阶段,可能会包含很多错误,公司正在完善它们,并会在未来加入更多语种。

题图/visualhunt

我们做了一个壁纸应用,给你的手机加点好奇心。去 App 商店搜 好奇怪 下载吧。