娱加科技大数据精准营销系统页面。
“不需要不需要,以后别再给我打电话了。”说完,代昌(化名)重重地将手机摔在了沙发上。代昌是河北邢台清河县一家民营企业的实际控制人,最近几年来,他接到的骚扰电话数量明显增多。骚扰电话正成为大数据时代的“顽疾”。
在 络空间,数据战场已进入白热化。2019年5月份,国家互联 信息办公室发布的《数据安全管理办法》征求意见稿第十五条也规定了,“ 络运营者以经营为目的收集重要数据或个人敏感信息的,应向所在地 信部门备案。”此外,大多数 站早已对恶意爬虫构建反爬措施并作出声明严厉禁止,有律师直言,“突破、绕开第三方平台的反爬虫策略、协议时,或涉嫌非法获取计算机信息系统数据罪、提供侵入非法控制计算机信息系统程序工具罪。”
卧底“最全”大数据公司
淘宝、京东等多家 站数据被爬取
据其官 显示,“鹰眼智客”系统涵盖QQ营销系列、微信营销系列、综合采集系列、论坛贴吧系列、邮件营销系列五大模块,拥有218个小功能。此外,其还宣传称“已成功为2800多家企业提供互联 营销服务,覆盖120多个行业”。其中综合采集系列 称可精准采集目标客户信息,覆盖全 11大B2B平台,4大搜索引擎,7大地图,准确率达90%。
据极验产品总监程柏(化名)介绍,其核心技术实际上是 络爬虫技术。据其介绍,目前互联 流行的 络爬虫种类比较多,信息采集类的 络爬虫主要是脚本和模拟器类爬虫。
其中,数据采集系列模块包含地图行业采集、综合数据采集、阿里巴巴采集、慧聪 采集、单页名录综合采集、大众点评 采集、淘宝商家信息采集、中国制造 采集、团购外卖商家采集、阿里国际站采集、八方资源平台采集、京东商家采集十二个功能。
附近的人有多近?
软件任意定位,还可“站街”钓鱼营销
该套软件还有一定的反封 机制。视频教程显示,在参数设置中,用户可以自己选择好友验证的次数、间隔时间以及每个位置发送验证申请的个数。“刚刚使用的话少添加一些,比如说添加五六个,逐步增加,最多的话添加十个以内,有一段时间间隔之后再次添加。”
值得一提的是,该软件还有一项名为“站街”的功能。所谓“站街”,即“如果说不想主动添加好友,只想让附近的人看到并添加你,就可以使用站街功能。”在位置一栏的弹出对话框中,用户只需点击“模拟器利用此位置站街”即可“站街”。
此前,新京 曾对外呼机器人进行曝光。所谓外呼机器人,实际上是一条电话机器人系统,一天客户呼出1000通电话。随后,央视3·15晚会也对外呼机器人进行曝光,不法分子和违法科技公司通过探针盒子搜集用户隐私、大数据提供支持、智能机器人提供外呼。
大数据如何“精准营销”
抓取指定任意 站或APP的访客手机
企查查显示,该公司全称为苏州娱加互娱 络科技有限公司,法定代表人为吴辉。该公司成立于2018年4月19日,注册资本200万元人民币,所属行业为软件和信息技术服务业。
据其介绍,该公司的获客系统十分精准。“你可以指定任意 站或者APP,只需要提供 站链接或者APP的名称及下载链接,我们就可以抓取到访客的手机 码。”吴辉说。
不过,其所提供的访客的手机 码只显示真实的前三位以及后四位,所以只能通过他们提供的系统去进行营销。“我们会提供一个外呼系统,可以将这些手机 提供到外呼系统里面去和客户沟通。”吴辉介绍。获取的中间四位被隐藏的手机 也被其称为“脱敏数据”。
此外,访客获取到的手机 也存在一定限制。“现在运营商主要做的是联通和电信的,移动的停掉了。”吴辉说。至于为何停掉移动的,对方给出的答案则是因为“移动用户太庞大了”。
除了运营商,吴辉还表示,如果用户是通过WiFi或者电脑来访问的,也无法抓取到手机 。“它(该系统)是通过流量来访问的,电脑端和无线 是抓取不了的,必须通过手机通信 络。”
8月19日,该公司倚为背书的联通和电信的客服分别对此事进行否认,称“并未提供过这种服务”。
在介绍文件中,该公司提供给某整形美容医院的服务也被做成了一份案例。案例显示,该整形医院以整形医院哪家好、玻尿酸垫下巴、昆明隆鼻、整形医院、美容医院等225个关键词,提交了本地同行等23个推广 址、31个同行座机咨询电话以及两款医美类APP,要求目标客户为来自上海、年龄在16至50岁之间的女性客户。
该公司文件显示,在2019年3月,每日推送100条左右的数据,共推送3053条。其中接通1872个,意向客户873个,转化客户372个。接通率为61.31%,意向率为28.59%,转化率为12.18%,获客成本只有百度竞价推广的六分之一。
充满技巧的“杀单”话术
有业务员日赚近5000元
甜甜是一名新人。1992年出生的她,几个月前来到这个公司转行成为一名销售。因刚入行不久,一些“杀单”的话术她并不熟练,当客户表现得意向较强时,较为资深的业务员便会聚拢过来进行指导。据其描述,她平均每月可以成交四五单。在郑州来讲,收入十分可观。
“这已经是他今天出的第二单。按照每单提成25%的利润来计算的话,算上奖金,他已经赚了快5000块钱了。”甜甜说。
合法爬虫or恶意爬虫
恶意爬虫涉非法获取计算机系统数据罪
爬虫技术是为了互联 本身信息传播而产生的。通过 络爬虫,搜索引擎获悉互联 的内容。在 络安全领域,也有通过爬虫来检测 站漏洞和 站可用性。
“爬虫技术的本质用途仍然存在,像百度、谷歌之类的公司,但是互联 上面的其他黑产眼里只有利益,他们通过 络爬虫做二次数据封装和用户引流,通过数据贩卖和流量牵引牟利。从用户视角来说,危害主要有恶意营销、 络攻击( 络钓鱼);从 站角度来说,危害包括 络攻击、薅羊毛、影响正常的企业服务、信息价值流失、用户流失。”程柏说。
中消协此前发布的《APP个人信息泄露情况调查 告》显示,约86.5%的受访者曾受到推销电话或短信的骚扰,约75.0%的受访者接到诈骗电话,约63.4%的受访者收到垃圾邮件,排名位居前三位。
对于此类爬虫软件,多数 站早已声明严厉禁止。北京炜衡律师事务所周浩律师认为,“ 络爬虫爬取数据需要遵守第三方平台的Robots协议以及获取数据的性质具有公开性,不得包含个人信息数据、商业秘密及国家秘密等信息数据。如果突破、绕开第三方平台的反爬虫策略、协议时,或涉嫌非法获取计算机信息系统数据罪、提供侵入非法控制计算机信息系统程序工具罪。”
Robots协议也称为爬虫协议、机器人协议等,其全称为“ 络爬虫排除标准(Robots Exclusion Protocol)”。
据腾讯发布的《2018上半年安全专题系列研究 告》(以下简称 告)显示,恶意爬虫通过分析并自行构造参数对非公开接口进行数据爬取或提交,获取对方本不愿意被大量获取的数据。
告指出,据统计,出行、 交、电商占恶意爬虫流量目标行业分布前三位,占比分别为20.87%、18.40%、13.38%。
周浩表示,《 络安全法》《个人信息安全规范》都强调了,通信联系方式(电话 码)是重要的个人信息,非经同意不得收集。提供用来收集个人信息的工具,一旦被使用必然存在违规。
技术发展倒逼法律完善
收集重要数据或个人敏感数据需备案
溯其本源,便是逐利。
反爬斗争已悄然进入白热化。不过,“反爬”绝非易事。知道创宇404实验室副总监隋刚介绍,规模较大的公司都会有自己的反爬机制,但“有些爬虫可以绕过这些反爬机制”。
技术的不断发展在倒逼相关法律趋于完善。2019年5月份,国家互联 信息办公室发布了《数据安全管理办法》征求意见稿(以下简称“征求意见稿”)对爬虫技术有明确的定义和规定。其中第十六条规定, 络运营者采取自动化手段访问收集 站数据,不得妨碍 站正常运行;如自动化访问收集流量超过 站日均流量三分之一, 站要求停止自动化访问收集时,应当停止。
“不过,第十六条在实践操作中可能存在一定问题,对造成 络不能正常运行也未有相应的处罚措施,这可能是将来需要完善的地方。”曾多次参与制定企业隐私政策的京师上海国际总部专职律师徐延轩说。
同时征求意见稿第十五条也规定了,“ 络运营者以经营为目的收集重要数据或个人敏感信息的,应向所在地 信部门备案。”徐延轩认为,收集重要数据备案制度可能是未来监管的方向。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!