企鹅”立功” 如何让爱情动作片无所遁形?

近日,360云盘被举 内容涉黄,而举 涉黄立功的这次不是朝阳区群众,而是腾讯!

据央视《焦点访谈》 道,“今年5月,北京市扫黄打非办和警方接到群众举 ,称一些不法分子以微信等 络 交工具为平台,出售一些数字、字母组合而成的密码,这些密码实际是一个个的360云盘账 ,里面存储着大量的淫秽色情内容”,与此同时,“江苏南通警方也根据腾讯公司的举 ,查处了同类案件,被销售的360云盘账 中,同样也有涉及儿童的淫秽色情内容。

作为中国最大的互联 综合服务提供商之一,腾讯不仅将业务拓展到各个领域,更是不忘回(bao) (fu) (dui)会(shou),奋战在扫黄第一线,在2014年带头举 并害死快播后,腾讯这次又将矛头对准360云盘,虽然让人产生“腾讯故意借机 复360”的错觉,但此举的确引起广大云盘或 盘等云存储行业的反思。

云存储是在近几年出现的新兴的存储方式,相比于传统的磁盘存储,云盘没有实体,用户不需要把它带在身上,但却只需要一个账户名和密码,就可以在 络环境下进行上传、读取和下载里面的信息。随时随地访问云盘方便了人们的生活和工作,但这也让不法分子也看到云盘存储量大、传播迅速、分享方便的优点,把云盘变成了一个淫*秽*色*情信息的“隐蔽”聚集地。

执法人员指出,云盘的存储量非常大,观看容易,而且在 络上传播速度非常快,只要有账 和密码,就可以在任何时间和地点,在线观看。所以,相对于其他传播方式,利用云盘进行淫*秽*色*情信息的传播,更隐蔽,危害性也更大。

云存储厂商很多

其实,360云盘跟所有 盘“云存储”服务一样,用户上传了什么内容只有上传者知晓,360云盘自己都未必知晓,目前中国市场上提供云盘服务的厂商还有百度、金山等,而且腾讯也有自己的云存储服务——微云(原QQ 盘),这些企业在发展过程中都曾经面临过这方面的问题挑战,但不幸的是,此次360被……

对于现在的云存储服务商来说,屏蔽掉淫*秽*色*情信息已经是当务之急,但如何才能够让过滤的信息更准确,更高效呢?虽然各大云存储厂商都有着自己的识别手段,但是笔者还是觉得应该从以下四个步骤着手,才能够让淫秽色情在云存储上无所遁形!

步骤一:基本筛选

通过文件名+MD5识别的方式是目前很多 站和云盘经常使用的方式,这个方式应用起来比较简单,而且效果也非常不错,能够识别并删除几乎大多数的淫秽色情信息。

文件名的识别非常简单,即通过专业的爬虫工具,在云盘中扫描,对文件名、文件格式等信息进行扫描,提取出敏感词语,并对可疑的文件进行删除操作。

文件名

这个文件识别用处还是非常大的,中文、日语、英语那些词都太明显了,一抓一个准,所以这个方式能够识别出很多违法信息。

除了通过文件名是被的方式,MD5识别也是一个非常重要的方式。MD5值就像是文件的“数字指纹”。每个文件的MD5值是不同的,当发现一个文件是非法信息后,云盘系统就会将MD5值存入到这个数据库中,这个时候 上所有是这个MD5值的文件都会被删除。

利用MD5算法来进行文件校验的方案被大量应用到软件下载站、论坛数据库、系统文件等方面。

文件名+MD5识别虽然能够识别出大量的淫秽色情信息,但是他们还是有各自缺点的,例如视频文件?通过文件名+MD5的方式可能就会有漏 之鱼,这里面就要提我们的第二种筛选方式——视频筛选!

步骤二:视频分析技术筛选

当然,利用上面的技术可能还会出现一些漏 之鱼,这里就需要我们的视频分析技术来侦查出这些东西来了。

视频分析技术如何来排查呢?首先,视频会对每个片子进行截取图片,然后对这些图片进行分析。

如何分析呢?

当然是有不同个分析结果的。例如:使用颜色特征分析来测量图片中皮肤的面积。。。然后确定是不是爱情动作片。一般情况下爱情动作片中的人物一般都穿的很少甚至不穿*衣服,所以整部片子中皮肤面积会占屏幕比重比较大,特征明显非常容易识别出来。

视频识别

通过皮肤的位置和分布分析是不是黄*片儿。当然这种方式也有可能让一些无辜视频中招,例如,加菲猫的肤色是黄色的,而跳水、游泳运动员一般也穿的很少……

这些数学算法能把图片特征量化,通过这些量化的数据进一步分析做到黄片的筛选。

当然,如果云存储厂商继续丧心病狂的查找视频,那么可以对连续连续多帧里面人数量的变化进行分析。例如人物是否相对固定(一般两个、三个或四个)?移动范围(很少有大范围的移动,更多是小范围的运动)?发生的场景等等来分析识别了。

利用了这两种方式,相信将有很少的视频能够漏 ,但世事无绝对,所以,还会需要第三种方式——人工筛选。

步骤三:人工筛选

虽然机器筛选已经能够做到足够少,但是还是总有一些人能够逃过层层盘查。这个时候就需要专业的人工来识别。

(图片来自暴走)

于是“鉴黄师”这个职位就诞生了。这个最初出现在公安部门,负责甄别、鉴定书籍、影像资料等是否涉黄,随着互联 的哦普及,像阿里巴巴这样的 络平台也在近三四年逐步设立“鉴黄师”岗位,“学名”是信息安全管控团队。

步骤四:举 机制

人人都是小小鉴黄师,就需要各位小鉴黄师们的努力了。

例如,广大的朝阳群众就帮助 会破获了很多次涉黄事件。而腾讯也一直战斗在扫黄第一线,在查找自己内部涉黄信息的同时,还不忘帮助360云盘彻查涉黄事件。

总结:其实这个四个步骤并不是独立完成,而是相互作用的,例如,通过人工查找的违法色情信息,也会添加到机器识别群组中,久而久之,机器的识别越来越强大,将能够更加精准的分辨出什么是违法分子的信息。既满足了效果(靠机器学习模型每隔一段时间的精确判断),也满足了效率(MD5实时校验)。

针对央腾讯等举 360云盘遭涉黄,360官方也在第一时间作出回应,称已根据国家相关法律法规进行管控,并与其他互联 公司建立联动机制,开展联合打击。无论此次举 后续如何,都对当前的云存储服务提供商敲响了警钟,也给我们带来了反思。

云服务提供商监控硬盘是否合法?

对于360来说,被举 也是有口说不出,毕竟, 友将数据上传到云盘中,自己虽然有监察失职,但是一个摆在广大 友面前的问题是,云服务提供商是否有权监控硬盘数据。

云存储

如果是一般性资料,监控与否可能用户并不会很在意,但是在云盘中,也有一部分人存储了可能非常机密的信息,那么云服务提供商是否有权监控,如果出现泄密情况出来负责,监控是否合法?等等,都需要相应的法律法规来保证。

利用传播淫秽信息谁负责?

大家都知道很多不法分子会通过云盘来传播违法信息,通过云盘进行传播的问题尤为严重,因为云盘属于个人隐私,用户上传的文件只有用户知道,监管部门是没有权利去监控,提供云盘服务的企业也没有权利去监控,更不要谈第三方 络监管机构。

所以,最后导致谁来对传播淫秽信息的事情监管呢?是云服务提供商还是第三方机构?谁来为这个负责呢?

如何能让云存储健康的发展?

目前来看,云存储还不那么完善和成熟,处于快速发展阶段。它的完善和成熟,不单单是单纯靠技术层面所能解决的。云存储要想得到类型不同、不同需求群体的共同认可,得到大范围的广泛应用,还有诸多问题亟待解决。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2015年7月17日
下一篇 2015年7月18日

相关推荐