Tumblr全面禁止成人内容,“老司机”头 敌人来了

2018年11月20日前后,微信宣布暂停“漂流瓶”功能,原因是“经用户投诉与媒体 道中,用户仍然有利用漂流瓶发布色情内容和招嫖广告的情况”。2018年12月5日国内最老的漫画平台之一动漫之家也宣布因站内色情内容暂时关站自查。与此同时,地球另一端的轻博客 站Tumblr(汤不热)宣布,自12月17日起全面禁止用户发布成人内容

Tumblr日活用户和流量在美国的大型 站里排50名左右,和Facebook这样的顶级 站还有很大差距,但处于第二阵营的头排。从重要性来说,它大致和豆瓣在中国互联 的地位差不多。在国外运营超过十年,由于它艺术创作的定位,而艺术与色情的界限并不清晰,所以对于成人内容相对宽容。

( 友截然不同的态度)

广泛存在的成人内容和算法推荐为Tumblr带来了源源不断的流量。Tumblr官宣这个决定后立即引起了大规模的批评和反弹,主流媒体大多也持否定态度,几十万人涌入一个名叫 change.org的“知名请愿 站”,希望 Tumblr 公司能撤回决定,继续保留成人内容。截至12月5日下午2点,“请愿”人数已超过30万,仅用了小半天时间。而且一天时间不到,Tumblr 母公司的股票价格不堪 友们的质问,企图跳悬自尽。

请愿人数

(股价下跌)

Tumblr这次颁布新规的行为看来是在主动和「互联 的 30% 流量」说再见。禁黄会造成用户大量的流失,其实Tumblr自己的数据部门比谁都明白,可是没办法。这场禁黄的导火索确切来说点燃在2018年11月20日,也就是在发布禁黄公告的两周前。苹果应用商店忽然下架 Tumblr 应用,理由是发现儿童色情内容

要知道在许多国家,人们对儿童色情的态度是零容忍。不过,Tumblr 遇到一个技术难题,在一堆成人色情内容里完美地筛出涉及儿童色情的部分,技术上几乎不可能。就别说是在成千上万的色情图片、视频里分辨出主角是否成年了,即便在普通艺术作品里筛选出色情图片的难度也不小。

iNn智能鉴黄的工作过程主要分为两步:

第一步是用黄色图片的特点来定义一个机器可以识别的数学模型。

第二步则是用大量满足定义的图片来进行样本数据的收集并将其用于机器训练。

怎样使机器得到充分的训练呢?最直接的方法就是利用大量色情片对AI进行灌输,这样AI可以得到一个更加精准的模型。当机器对图像进行识别以后,这些图像数据会转化为数字化的信息,带入到模型里面进行计算, 根据计算值将图片标注为「色情、性感、非色情」三个类别。

AI鉴黄的技术核心是深度学习理论(Deep Learning)。通俗来讲,可以把深度学习理解为一个空白的大脑,海量数据就是灌输进来的经验。当我们把大量的色情、性感、非色情的样本属性告诉深度学习的引擎,让引擎不断学习,最后空白的脑袋就会学成了一种连接的模型,这种模型就是为了鉴别色情与非色情而生的。

深度学习的一个主要优势在于可以利用海量训练数据(即大数据),在学习的过程中不断提高识别精度,但是仍然对计算量有很高的要求。而近年来,得益于计算机速度的提升、大规模集群技术的兴起、GPU 的应用以及众多优化算法的出现,耗时数月的训练过程可缩短为数天甚至数小时,深度学习才逐渐可用于工业化。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年11月15日
下一篇 2018年11月15日

相关推荐