因为黄图和喷子太多,这App背后的鉴黄师,精神崩溃了

也不知道从啥时候开始,“杠精”、“键盘侠”、“喷子”等字眼,遍布 络上各个平台。也不知道从啥时候开始,“杠精”、“键盘侠”、“喷子”等字眼,遍布 络上各个平台。

机哥看个 B 站,弹幕里一堆人怼来怼去:nmsl。

刷个微博,评论区也是把别人父母挂在嘴边。

而贴吧里的各位暴躁老哥,会拿 emoji 表情骂人,因为“”、“”跟“妈”同音。

搞得现在整个 络,戾气很重的样子。

所以也难怪很多人经常说,怀念最初的 B 站、最初的微博、最初的贴吧……

甚至有人提倡,把 Bilibili 的入站弹幕礼仪考试,恢复到几年前的难度,以控制整个 B 站的弹幕素质。

可是,像贴吧、微博、豆瓣、知乎等,绝大部分 交平台是连“礼仪考试”都没有的,似乎就更加难以对整个 交环境进行维护?

辣么,总不能放任这种情况,继续发生下去吧。

所以国内外各家互联 公司,都想出自己的招。

屏蔽词

有些 站处理起来的方法很“简单粗暴”,直接把关键词屏蔽掉就好。

比如说,绝大部分论坛、游戏,都会对一些敏感字眼,用“ *** ”(星 )来代替

所以有些骂人的话,会让对方看完之后一脸懵逼,甚至还有点好笑。

净化的效果倒是达到了。

也有像苹果这样的硬件公司,直接从源头过滤掉。

还记得去年机哥说过,iOS 备忘录会把某些脏话“挖空”跳过。

但是吼,“屏蔽词”这一招,虽然看上去管用,但偶尔会出现翻车的情况。

就像之前,有一款游戏把“草”定义为屏蔽词,所以大家都打不出“粮草先行”。

还有哦,有些时候会出现滥用屏蔽词的情况。

《GTA5》游戏虽然充斥着暴力,但它里面会把玩家输入的脏话、歧视性语言,通通给屏蔽掉。

只是有程序猿看代码时发现,《GTA5》的屏蔽词库里居然“夹带私货”,把“索尼”、“微软”、“任天堂”等竞争对手的名字也屏蔽了。

有人说原因是滥用屏蔽词,也有人说它是怕惹上是非……这个咱们就不深入讨论啦。

讲回正事,毕竟翻车的情况不算多,而且“屏蔽词”这一招用起来,简单、粗暴、直接,所以不少互联 公司都会搞自己的屏蔽词库。

甚至有些技术过硬的 友,还自己搞了私人的屏蔽词库,就是工程量有点大。

友做的Bilibili屏蔽词分享平台

除此之外,还有木有别的处理方法呢?

“人工”智能

现在很多 交巨头 App,都会采用 AI 人工智能,去处理用户发出来的脏话,简单来说就是“自动删帖”啦。

But,看见机哥把“人工”打起引 ,别瞎联想,这里不是“ATM机里面有银行员工”类似的意思。

因为要用 AI 去处理脏话的前提,是需要先让 AI 知道什么是脏话,也就是“机器学习”的过程。

所以说,给 AI 建立“语言模型”的过程,离不开人。

但现在 上的暴躁老哥那么多,动不动就“问候别人全家”,更别提还要发一些血腥、不和谐的图片或者视频。

据 The Verge 道,几位在 Facebook 工作的内容审查员,被诊断出 PTSD(创伤后压力心理障碍症)

(翻译:Facebook 将向与开发 PTSD 的内容审查员,支付5200万美元和解金)

究竟他们审查的内容,有多不和谐,甚至搞到患上心理创伤,这个就不得而知了。

But,与此同时,机哥看到一项比较惊人的数据。

根据 Facebook 在 5 月份,刚刚发布的《透明度 告》:2020年第一季度,Facebook 一共处理了 960 万条“脏话”,创下历史新高。

对比上一个季度的 570 万条,脏话的数量涨了接近 70% 。

如果把目光放在最近几年,被处理掉的脏话数量,呈现逐年上升的趋势。听上去就有点怕怕呢~

机哥琢磨后觉得,一方面,可能是现在的 友越来越“暴躁”。

而另一方面,技术总是会进步的。

随着 AI 的更新迭代, 交 App 把用户发的“脏话”,挑出来的速度也会越来越快。

像 Facebook 的《透明度 告》里还提到,以后会把这种主动检测技术,扩展到更多的语言

也许终有一天,无论是用什么语言骂人,甚至是用 emoji 暗示,都会被 AI 识别出来,无所遁形。

机哥倒是很期待,大家平心静气讨论问题,不再怼来怼去的那一天。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年4月20日
下一篇 2020年4月20日

相关推荐