最近学习了python的requests库,粗略学习了下正则匹配,就想找个项目练练手。很凑巧,连接fiddler测试的过程中,刷了会某 交平台,抓到了不少请求。通过分析,发现该平台用户id是从1开始递增的,请求中的access_token值应该是通过某些规则生成的32位加密编码。切换id,access_token不变的情况可以访问不同用户的个人主页。主页中含有用户信息,包括居住城市、姓名、公司、职位、毕业学校、头像、用户标签、他人评价等等。比较敏感的信息如电话 码,含无疑问做了加密,但是仅靠这些信息也足以定位到一个个具体的用户,算是有价值的信息。先贴张图,看下效果,再具体讲一下实现原理。
现在你只要注册个多个账户,随机拿接口跑循环,抓取几千上万条实际应该不成问题。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!