【爬虫】页抓包工具–Fiddler–Request和Response

【爬虫】页抓包工具–Fiddler

Fiddler基础知识

Fiddler是强大的抓包工具，它的原理是以web代理服务器的形式进行工作的，使用的代理地址是：127.0.0.1，端口默认为8888，我们也可以通过设置进行修改。
代理就是在客户端和服务器之间设置一道关卡，客户端先将请求数据发送出去后，代理服务器会将数据包进行拦截，代理服务器再冒充客户端发送数据到服务器；同理，服务器将响应数据返回，代理服务器也会将数据拦截，再返回给客户端。
Fiddler可以抓取支持http代理的任意程序的数据包，如果要抓取https会话，要先安装证书。

HTTP协议

要分析Fiddler抓取的数据包，我们首先要熟悉HTTP协议。HTTP即超文本传输协议，是一个基于请求与响应模式的、无状态的、应用层的协议，绝大多数的Web开发，都是构建在HTTP协议之上的Web应用。
HTTP的工作过程：当我们请求一个超链接时，HTTP就开始工作了，客户端先发送一个请求到服务器，请求内容包括：协议版本、请求地址、请求方式、请求头和请求参数；服务器收到请求后做相应的处理，并将响应数据返回到客户端，响应内容包括：协议版本、状态码和响应数据。前端根据响应数据做相应的处理，就是最终我们看到的内容。这些过程是HTTP自动完成的，我们只是输入或点击请求地址，然后查看前端给我们展示的内容。更多关于HTTP协议的介绍请参考：http://www.cnblogs.com/li0803/archive/2008/11/03/1324746.html
请求方式常用的有：GET、PUT、POST、DELETE。
HTTP状态码主要分为5类：以1开头的代表请求已被接受，需要继续处理；以2开头的代表请求已成功被服务器接收、理解、并接受；以3开头的代表需要客户端采取进一步的操作才能完成请求；以4开头的代表了客户端看起来可能发生了错误，妨碍了服务器的处理；以5开头的代表了服务器在处理请求的过程中有错误或者异常状态发生，也有可能是服务器意识到以当前的软硬件资源无法完成对请求的处理。
常见的主要有：200：服务器成功处理了请求；404：未找到资源；500：内部服务器错误；503：服务器目前无法为请求提供服务；302：请求的URL已临时转移；304：客户端的缓存资源是最新的，要客户端使用缓存。
每个状态码的详细介绍请参考：https://baike.baidu.com/item/HTTP%E7%8A%B6%E6%80%81%E7%A0%81/5053660r=aladdin

Fiddler的使用

Fiddler安装后，设置的端口默认为8888，当Fiddler启动后，默认将IE的代理设为了127.0.0.1:8888，而其他如火狐浏览器需要手动设置代理后才可以抓包。设置内容如图：

2）所以基本上不需要做什么配置，安装后就可以进行抓包了。那么我们怎么分析抓到的这些数据包呢图所示的区域为数据包列表，要分析这些数据包，首先要了解各字段的含义。

4）HTTP Request Header：以百度为例，查看请求百度主页这条数据包的请求数据，从上面的Headers中可以看到如下内容：

协议：HTTP/1.1

状态码：200

Cache头域：
Cache-Control: private ———此响应消息不能被共享缓存处理，对于其他用户的请求无效

Date: Sat, 05 Aug 2017 04:37:43 GMT ———生成消息的具体时间和日期

Expires: Sat, 05 Aug 2017 04:37:42 GMT ———浏览器会在指定过期时间内使用本地缓存

Cookie/Login 头域：

Set-Cookie: BDSVRTM=264; path=/ ———把cookie发送到客户端
Set-Cookie: BD_HOME=1; path=/
Set-Cookie: H_PS_PSSID=1425_21097_22157; path=/; domain=.baidu.com

Entity头域

Content-Length: 202740 ———正文长度
Content-Type: text/html;charset=utf-8 ———告知客户端服务器本身响应的对象的类型和字符集

Miscellaneous 头域：
Bdpagetype: 2

Bdqid: 0x99791efd00036253

Bduserid: 2577220064
Server: BWS/1.1 ———指明HTTP服务器的软件信息

X-Ua-Compatible: IE=Edge,chrome=1
Security头域：
Strict-Transport-Security: max-age=172800 ———基于安全考虑而需要发送的参数，关于这个参数的解释，请参考：http://www.freebuf.com/articles/web/66827.html

Transport头域：

Connection: Keep-Alive

6）TextView：显示请求或响应的数据。

7）WebForms：请求部分以表单形式显示所有的请求参数和参数值；响应部分与TextView内容是一样的。

8）Auth：显示认证信息，如Authorization

9）Cookies：显示所有cookies

10）Raw：显示Headers和Body数据

11）JSON：若请求或响应数据是json格式，以json形式显示请求或响应内容

12）XML：若请求或响应数据是xml格式，以xml形式显示请求或响应内容

13）上面是以百度主页为例，百度主页采用的是GET请求，在TextView中没有请求body，我们再以无忧行站登录接口为例，它是一个POST请求，除了请求头外，在TextView中多了请求数据。这也是GET请求和POST请求的一个区别。GET请求是将请求参数放在url中，而POST请求一般是将请求参数放在请求body中。

总结：通过Fiddler可以抓取请求和响应参数，通过对参数进行分析，可以定位是前端还是后台问题。例如我们在测试登录接口时，输入了正确的手机和密码，但前端提示“请输入正确的用户名和密码”；仅仅通过界面提示我们只能描述bug表象，但不能分析出问题原因。假设通过抓包我们发现是由于前端参数名错误或参数值为空，从而导致后台错。这个时候我们将bug指向前端开发人员，并将参数数据和接口文档中对应的文数据作为附件上传，是不是可以提高bug的解决效率呢iddler在实际的功能测试中有很大的作用，一方面帮助我们更好的了解某个业务中客户端和服务器端是通过哪些接口进行请求的，从而更好的了解代码逻辑；另一方面，我们还可以通过响应数据判断哪里出现了问题，例如可能服务器程序挂了，导致前端 “服务器故障”，这时我们通过抓包发现响应数据返回502，这时我们可以手动去重启服务或是联系运维重启服务，从而提高问题的解决效率。

大体分为Request和Response两部分。

Requests部分

Header	解释	示例
Accept	指定客户端能够接收的内容类型	Accept: text/plain, text/html
Accept-Charset	浏览器可以接受的字符编码集。	Accept-Charset: iso-8859-5
Accept-Encoding	指定浏览器可以支持的web服务器返回内容压缩编码类型。	Accept-Encoding: compress, gzip
Accept-Language	浏览器可接受的语言	Accept-Language: en,zh
Accept-Ranges	可以请求页实体的一个或者多个子范围字段	Accept-Ranges: bytes
Authorization	HTTP授权的授权证书	Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
Cache-Control	指定请求和响应遵循的缓存机制	Cache-Control: no-cache
Connection	表示是否需要持久连接。（HTTP 1.1默认进行持久连接）	Connection: close
Cookie	声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！生成海和数传媒：世界各国对区块链技术态度是怎样的？上一篇 2019年4月5日 ultra软件根据址爬去前端代码的用法下一篇 2019年4月5日相关推荐《PaddlePaddle从入门到炼丹》一——新版本PaddlePaddle的安装 2018年9月25日再见，工资！2020年6月程序员工资统计，平均14404元，友：又跌了！ 2020年5月16日厚基础Linux学习计划——写在年底倒计时一百天 2020年8月22日教学手记：如何让学生重视选修课的学习 2017年3月10日 IT 行业的创新 – 创新的迷思 (一) 2012年4月12日触手可及的AI：2020十大人工智能APP揭榜时刻 2020年4月8日【Windows系统】查看和关闭139、445端口的方法 2022年3月12日基于MVC的JavaScriptWeb富应用开发 2012年5月1日 MES引发信息部门的价值思考 2021年2月1日一本好书:《软件随想录》 2010年7月8日机械加工仿真软件—–三维弯管机仿真系统 Solarwinds如何配置告警短信？（短信发送设置流程）数据库和SpringBoot ubuntu20.04 推荐翻译软件如何使用视频合并分割软件将MP4视频合并分割标签软件 java 软件测试 linux python 人工智能数据库大数据软件工程操作系统络测试 android c++ 经验分享 windows 运维嵌入式单片机其他面试项目管理编程语言软件开发笔记 ubuntu 物联程序员安全算法资讯行业观察企业新闻 CAD 软市超市 Copyright © 2023 软市版权所有 \| 蜀ICP备18029921 首页软件超市企服市场会员中心

【爬虫】 页抓包工具–Fiddler–Request和Response

【爬虫】 页抓包工具–Fiddler–Request和Response

Requests部分

相关推荐

【爬虫】页抓包工具–Fiddler–Request和Response

【爬虫】页抓包工具–Fiddler–Request和Response