也不知道从啥时候开始,“杠精”、“键盘侠”、“喷子”等字眼,遍布 络上各个平台。也不知道从啥时候开始,“杠精”、“键盘侠”、“喷子”等字眼,遍布 络上各个平台。
机哥看个 B 站,弹幕里一堆人怼来怼去:nmsl。
刷个微博,评论区也是把别人父母挂在嘴边。
而贴吧里的各位暴躁老哥,会拿 emoji 表情骂人,因为“”、“”跟“妈”同音。
搞得现在整个 络,戾气很重的样子。
所以也难怪很多人经常说,怀念最初的 B 站、最初的微博、最初的贴吧……
甚至有人提倡,把 Bilibili 的入站弹幕礼仪考试,恢复到几年前的难度,以控制整个 B 站的弹幕素质。
可是,像贴吧、微博、豆瓣、知乎等,绝大部分 交平台是连“礼仪考试”都没有的,似乎就更加难以对整个 交环境进行维护?
辣么,总不能放任这种情况,继续发生下去吧。
所以国内外各家互联 公司,都想出自己的招。
屏蔽词
有些 站处理起来的方法很“简单粗暴”,直接把关键词屏蔽掉就好。
比如说,绝大部分论坛、游戏,都会对一些敏感字眼,用“ *** ”(星 )来代替。
所以有些骂人的话,会让对方看完之后一脸懵逼,甚至还有点好笑。
净化的效果倒是达到了。
也有像苹果这样的硬件公司,直接从源头过滤掉。
还记得去年机哥说过,iOS 备忘录会把某些脏话“挖空”跳过。
但是吼,“屏蔽词”这一招,虽然看上去管用,但偶尔会出现翻车的情况。
就像之前,有一款游戏把“草”定义为屏蔽词,所以大家都打不出“粮草先行”。
还有哦,有些时候会出现滥用屏蔽词的情况。
《GTA5》游戏虽然充斥着暴力,但它里面会把玩家输入的脏话、歧视性语言,通通给屏蔽掉。
只是有程序猿看代码时发现,《GTA5》的屏蔽词库里居然“夹带私货”,把“索尼”、“微软”、“任天堂”等竞争对手的名字也屏蔽了。
有人说原因是滥用屏蔽词,也有人说它是怕惹上是非……这个咱们就不深入讨论啦。
讲回正事,毕竟翻车的情况不算多,而且“屏蔽词”这一招用起来,简单、粗暴、直接,所以不少互联 公司都会搞自己的屏蔽词库。
甚至有些技术过硬的 友,还自己搞了私人的屏蔽词库,就是工程量有点大。
友做的Bilibili屏蔽词分享平台
除此之外,还有木有别的处理方法呢?
“人工”智能
现在很多 交巨头 App,都会采用 AI 人工智能,去处理用户发出来的脏话,简单来说就是“自动删帖”啦。
But,看见机哥把“人工”打起引 ,别瞎联想,这里不是“ATM机里面有银行员工”类似的意思。
因为要用 AI 去处理脏话的前提,是需要先让 AI 知道什么是脏话,也就是“机器学习”的过程。
所以说,给 AI 建立“语言模型”的过程,离不开人。
但现在 上的暴躁老哥那么多,动不动就“问候别人全家”,更别提还要发一些血腥、不和谐的图片或者视频。
据 The Verge 道,几位在 Facebook 工作的内容审查员,被诊断出 PTSD(创伤后压力心理障碍症)。
(翻译:Facebook 将向与开发 PTSD 的内容审查员,支付5200万美元和解金)
究竟他们审查的内容,有多不和谐,甚至搞到患上心理创伤,这个就不得而知了。
But,与此同时,机哥看到一项比较惊人的数据。
根据 Facebook 在 5 月份,刚刚发布的《透明度 告》:2020年第一季度,Facebook 一共处理了 960 万条“脏话”,创下历史新高。
对比上一个季度的 570 万条,脏话的数量涨了接近 70% 。
如果把目光放在最近几年,被处理掉的脏话数量,呈现逐年上升的趋势。听上去就有点怕怕呢~
机哥琢磨后觉得,一方面,可能是现在的 友越来越“暴躁”。
而另一方面,技术总是会进步的。
随着 AI 的更新迭代, 交 App 把用户发的“脏话”,挑出来的速度也会越来越快。
像 Facebook 的《透明度 告》里还提到,以后会把这种主动检测技术,扩展到更多的语言。
也许终有一天,无论是用什么语言骂人,甚至是用 emoji 暗示,都会被 AI 识别出来,无所遁形。
机哥倒是很期待,大家平心静气讨论问题,不再怼来怼去的那一天。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!