爬虫抓取58同城 反反爬虫之字库解密
-
- 2019.03.01更新
- 前言
-
- 看不懂的字体
- 解密字库
- 字库自动解密API
2019.03.01更新
定制简历采集软件wechat联系13939147257. 解密没有什么技术含量, 所有环节都写在博文里. 请勿联系我资讯技术问题. API测试地址在最下方.
前言
最近接了个人力资源管理系统的项目, 部分数据需要抓取58的简历数据. 在数据抓取环节踩了很多坑, 所以写个博文分享下心得.
看不懂的字体
抓取的第一步就遇到了难题,浏览器可以显示字体,开发者模式看不到
在html的css部分发现58加载了BASE64编码的WOFF动态字库, 每次刷新 页字库都不同.
因为字库每次都不一样,所以多分析了几个字库文件,找到了字库的共同特征,看下图
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!