freeBuf
主站

分类

漏洞 工具 极客 Web安全 系统安全 网络安全 无线安全 设备/客户端安全 数据安全 安全管理 企业安全 工控安全

特色

头条 人物志 活动 视频 观点 招聘 报告 资讯 区块链安全 标准与合规 容器安全 公开课

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户,每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序

FreeBuf+小程序

HTTP | HTTP报文
2019-05-06 13:05:52

01概述

客户端与服务器端之间的通信,通过HTTP协议,以HTTP报文的形式来实现数据的交互。

HTTP报文是HTTP通信时发送的数据块,本文主要从以下几个方面介绍HTTP报文:HTTP报文结构、方法、状态码、首部。


02 报文结构

HTTP报文由三部分组成:状态行(请求行 | 响应行)、首部主体。也有些书籍说是由首部和主体两部分组成,状态行包含在首部中,但绝大多数的说法是由三部分组成。

1-报文组成.jpg


HTTP报文可以分为请求报文和响应报文;请求报文向服务器传达请求,响应报文将请求的结果返回给客户端。以下两图,分别是请求报文以及响应报文的结构图。

2-请求报文结构图.jpg

3-响应报文结构图.jpg

HTTP报文以状态行开始,跟在后面的是HTTP首部,首部由多个首部字段构成,每行一个首部字段;HTTP首部后是一个空行,然后是报文主体。

可以看到,状态行和首部中的每行都是以回车符(\r,%0d,CR)和换行符(\n,%0a,LF)结束,这是因为HTTP规范中行应该使用CRLF结束。另外,首部和主体之间由一空行隔开,或者可以理解为HTTP首部的最后一个字段有两个CRLF。

与状态行和首部不同的是,主体是可选的,也就是说报文中不一定要有主体;另外状态行和首部是ASCII文本,主体可包含文本或二进制数据。

以上就是HTTP报文的大概结构,下面分别对这三部分进行简要描述。

状态行

HTTP报文以状态行开始,请求报文中的状态行叫请求行,响应报文中的状态行叫响应行。

请求行由请求方法URL协议版本组成,这些字段都由空格分隔。

4-请求行.jpg

请求行表明要对哪个资源执行哪个方法,具体有哪些请求方法,文章后面会详细介绍。


响应行由协议版本状态码原因短语(状态码描述)组成。这些字段同样都由空格分隔。

5-响应行.jpg

响应行表明了服务器对请求的处理结果,由状态码体现。值得注意的是,原因短语是数字状态码的可读版本,描述数字状态码的含义,便于人理解,只对人有意义,因此以下两种响应行都会被当作成功处理。

HTTP/1.0 200 NOT OK    
HTTP/1.0 200 OK

HTTP协议将状态码分成了5类,在下面的章节中会详细介绍。

另外请求行和响应行中都包含HTTP版本号,其格式为

HTTP/<major>.<minor>

major是主版本号,minor是次版本号,使用版本号的目的是规范双方之间通信的格式。

首部

HTTP首部由多个首部字段构成,旨在向报文中添加一些通信过程中所需的重要信息。具体细节文章后面会介绍。

主体

报文主体包含了HTTP所要传输的内容,但并不是所有的报文都有主体。


03 方法


状态行部分讲到请求行中包含请求方法字段,请求方法告诉服务器要做什么。下图是HTTP规范中目前已定义的方法,红框中的是比较常用的方法。

6-方法.jpg

注意,不是所有的服务器都会实现这些方法,一般都会实现GET和POST方法。另外,请求方法需要大写。

GET

GET:获取/查询资源。是最常用的HTTP方法,常用于请求URL指定的资源,服务端经过处理将资源返回给客户端。

比如访问百度首页,请求包如下,百度的服务器收到请求后,将百度首页返回给浏览器。

7-get1.jpg

有时请求会传递一些参数给服务器,在GET方法中,这些参数会被包含在URL中,放在文件路径后面,用“ ? ”分隔,被称为查询字符串。查询字符串以键值对的形式存在,每个参数的键和值用“=”连接,不同参数之间用“&”符号连接。(详情请看URL格式)

百度搜索google,抓包可以发现,google被当成了word参数的参数值,放在请求行的URL字段中。

8-get2.jpg

特意将请求报文全选,大家可以看到,首部字段下方有一空行,然后空行下面有一光标,这再次体现了HTTP报文的结构,也告诉大家,GET请求是不包含请求主体的。

POST

POST:传输实体主体。常用于向指定资源发送数据,指定的资源会对数据进行处理,然后将处理结果返回给客户端。数据被包含在请求主体中,一般用于表单提交、文件上传等。

9-post.jpg

以上是登录时的请求包,请求主体中包含了用户名、密码、验证码、是否记住用户名的参数数据,服务器接收到请求后,会交给index.php文件去处理,然后会返回一个处理结果,可能是登录失败,也可能是跳转到系统内部。

可以看到,这些数据的格式和查询字符串的格式一致,Content-Type字段值为application/x-www-form-urlencoded,这是POST提交数据的几种格式之一,POST提交数据的几种格式会在以后的文章中介绍。

当然,GET方法也可以用来传输数据,但是首先URL的长度受浏览器、服务器、操作系统影响,其次是GET方法提交的参数都会在地址栏中显示出来,不安全,因此涉及到大量数据、敏感数据的时候,一般采用POST方法。

HEAD

HEAD:获取报文首部。HEAD方法和GET方法很像,但服务器接收到HEAD请求时,在响应中只会返回报文首部,不会返回报文主体。常用于测试请求资源是否存在或是否被修改。

10-head1.jpg

GET请求,除了返回报文首部,还返回了主体,经浏览器解析,成为我们眼中的百度首部。

11-head2.jpg

HEAD请求,只返回首部,没有主体。

OPTIONS

OPTIONS:查询资源支持的方法。用于查询URL指定的资源支持哪些方法,资源支持哪些方法,会在响应包的Allow字段中显示。

12-option.jpg

PUT

PUT:传输文件。服务器会将请求主体的内容保存到URL指定的资源位置,包含两种情况:URL指定的资源不存在和URL指定的资源存在。

13-put1.jpg

如果URL指定的资源不存在,服务器会新建一个文件,将请求主体中的内容保存到新建的文件里,响应码为201。

14-put2.jpg

如果URL指定的资源存在,服务器会重置文件内容,用请求主体中的内容覆盖原文件内容,响应码为200或204。

需要注意的是,PUT方法自身不带验证机制,任何人都可以执行,存在安全问题,所以网站一般不会使用PUT方法。

DELETE

DELETE:删除文件,删除URL指定的资源,和PUT相反

15-delete1.jpg

文件删除成功,响应码为204。

16-delete2.jpg

若删除的文件不存在,响应码为404。

和PUT一样,DELETE方法同样不带验证机制,所以网站一般也不使用DELETE方法。

TRACE

TRACE:路径追踪。主要用于诊断,让服务器将收到的请求放在响应主体中,环回给客户端,这样客户端就可以判断发出的请求是否被请求/响应链(在客户端和服务器端之间,请求可能会经过代理、网关、防火墙等应用程序)篡改。

TRACE请求不能带有实体的主体部分,TRACE响应的实体主体包含服务器收到的请求。

17-trace1.jpg

以上都是方法没被禁用时的响应,如果方法被禁用,响应码为405。

18-trace2.jpg


HTTP是可扩展的。除了使用HTTP/1.1规范中定义的方法,有的扩展还定义了一些新的方法,被称为扩展方法。

以下是WebDAV HTTP扩展包含的方法。

19-webdav.jpg


04 状态码


请求方法告诉服务器要做什么,状态码则告诉客户端,服务器对请求的处理结果:是正常处理了请求,还是出现了错误。HTTP状态码被分成了以下5类。

20-状态码.jpg

1xx——信息提示

1xx响应表明服务器端正在处理客户端发过来的请求。

21-1xx.jpg

2xx——成功

2xx响应表明服务器端正常处理了客户端发过来的请求。

22-2xx.jpg

常用的有:

200(成功)、201(已创建)、204(无内容)、206(部分内容)

3xx——重定向

3xx响应表明客户端请求的资源的位置发生了改变,要完成请求,需进一步操作。

23-3xx1.jpg

24-3xx2.jpg

常用的有:301(永久移动)、302(临时移动)

4xx——客户端错误

4xx响应表明客户端发过来的请求有问题,服务器无法处理。

25-4xx1.jpg

26-4xx2.jpg

常用的有:

400(语法错误)、401(未认证)、403(禁止访问)、404(未找到)、405(方法禁用)

5xx——服务器错误

5xx响应表明服务器自身出了问题,处理不了客户端发过来的请求。

27-5xx1.jpg

27-5xx.jpg

常用的有:500(服务器错误)、502(网关错误)


05 首部

HTTP首部由多个首部字段构成,旨在向报文中添加一些通信过程中所需的重要信息。

从本质上来说,首部字段是名/值对,由字段名和字段值组成,中间用冒号“ : ”隔开,字段值前可包含一个空格。每一行一个首部字段,由CRLF结束行。注意,首部应该以空行(单个CRLF)结束,即使没有主体。

首部字段名: 字段值

根据用途,HTTP首部字段被分为4类:通用首部、请求首部、响应首部、实体首部。

首部字段不一定都是HTTP/1.1规范定义的,其中,HTTP/1.1规范中定义的首部字段只有47种。下列表格中的都是HTTP/1.1规范定义的首部字段。

通用首部

请求报文和响应报文都可以使用的首部。

28-通用首部.jpg

请求首部

请求报文使用的首部。

29-请求首部.jpg

响应首部

响应报文使用的首部。

30-响应首部1.jpg

31-响应首部2.jpg

实体首部

实体使用的首部。

32-实体首部.jpg

HTTP首部除了使用HTTP/1.1规范中定义的首部字段,还会使用其他RFC中定义的首部字段,比如Cookie、Set-Cookie等。

大家只需要了解常用的首部字段即可,这些常用的字段我会在以后的文章中介绍。

# HTTP
本文为 独立观点,未经允许不得转载,授权请联系FreeBuf客服小蜜蜂,微信:freebee2022
被以下专辑收录,发现更多精彩内容
+ 收入我的专辑
+ 加入我的收藏
相关推荐
  • 0 文章数
  • 0 关注者