爬虫之抓包教程

抓包过程中,一般是 的抓包和 抓包,其中 抓包分为:普通get、带参数get、json抓包,其中 是重中之重。而一般是登陆所用,当然也有可能是传参,这里只讲登陆的,传参的和登陆的情况一致。

软件准备

  1. firefox 32.0 浏览器
  2. firebug 浏览器插件
  3. httpfox 浏览器插件

** 为什么要使用 浏览器,因为它的插件很丰富;为什么要使用 32.0 版本的插件,因为老版本支持的多,很多优秀的插件现在不更新了,不支持新的浏览器版本,所以使用老的版本 **

将插件拖入浏览器就能安装,安装完成后显示:

点击历史记录:

清除时间范围选择全部,清除的项目也全部打勾:

点击 的保持,防止 页重定向跳转,导致上一次的记录被覆盖,也可以打开 点击 ,也能记录所有的请求和返回:

可以看到箭头所指的位置是上一次打开的页面,而下面是新跳转的页面,可以看到我们请求【宏彦获水】首页的头部是很干净的:

而百度是预加载的,所以她真正请求 页的是上一条 址:

头部变成:

现在就是要把这些联想词抓出来。先要看 页请求了哪些信息,然后发现如下 址:

最后点击登陆,可以看到出现了一个 请求:

爬虫之抓包教程

可以看到 请求发送了很多参数,如果登陆成功就可以获取其 ,或者得到它返回的东西,这里就不展开了,百度登陆在 上太多示例。

总结

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年6月5日
下一篇 2019年6月5日

相关推荐