6、跟我一起探索HTTP-HTTP 消息
HTTP 消息是服务器和客户端之间交换数据的方式。有两种类型的消息:请求(request)——由客户端发送用来触发一个服务器上的动作;响应(response)——来自服务器的应答。
HTTP 消息由采用 ASCII 编码的多行文本构成。在 HTTP/1.1 及早期版本中,这些消息通过连接公开地发送。在 HTTP/2 中,为了优化和性能方面的改进,曾经可人工阅读的消息被分到多个 HTTP 帧中。
Web 开发人员或网站管理员,很少自己手工创建这些原始的 HTTP 消息:由软件、浏览器、代理或服务器完成。他们通过配置文件(用于代理服务器或服务器),API(用于浏览器)或其他接口提供 HTTP 消息。
HTTP/2 二进制框架机制被设计为不需要改动任何 API 或配置文件即可应用:它大体上对用户是透明的。
HTTP 请求和响应具有相似的结构,由以下部分组成:
- 一行起始行用于描述要执行的请求,或者是对应的状态,成功或失败。这个起始行总是单行的。
- 一个可选的 HTTP 标头集合指明请求或描述消息主体(body)。
- 一个空行指示所有关于请求的元数据已经发送完毕。
- 一个可选的包含请求相关数据的主体(比如 HTML 表单内容),或者响应相关的文档。主体的大小有起始行的 HTTP 头来指定。
起始行和 HTTP 消息中的 HTTP 头统称为请求头,而其有效负载被称为消息主体。
HTTP 请求
起始行
HTTP 请求是由客户端发出的消息,用来使服务器执行动作。起始行(start-line)包含三个元素:
-
一个 HTTP 方法,一个动词(像
GET
、PUT
或者POST
)或者一个名词(像HEAD
或者OPTIONS
),描述要执行的动作。例如,GET
表示要获取资源,POST
表示向服务器推送数据(创建或修改资源,或者产生要返回的临时文件)。 -
求目标(request target),通常是一个 URL,或者是协议、端口和域名的绝对路径,通常以请求的环境为特征。请求的格式因不同的 HTTP 方法而异。它可以是:
一个绝对路径,末尾跟上一个
'?'
和查询字符串。这是最常见的形式,称为原始形式(origin form),被GET
、POST
、HEAD
和OPTIONS
方法所使用。-
POST / HTTP/1.1
-
GET /background.png HTTP/1.0
-
HEAD /test.html?query=alibaba HTTP/1.1
-
OPTIONS /anypage.html HTTP/1.0
-
一个完整的 URL,被称为绝对形式(absolute form),主要在使用
GET
方法连接到代理时使用。GET http://developer.mozilla.org/en-US/docs/Web/HTTP/Messages HTTP/1.1
-
由域名和可选端口(以
':'
为前缀)组成的 URL 的 authority 部分,称为 authority form。仅在使用CONNECT
建立 HTTP 隧道时才使用。CONNECT developer.mozilla.org:80 HTTP/1.1
-
星号形式(asterisk form),一个简单的星号(
'*'
),配合OPTIONS
方法使用,代表整个服务器。OPTIONS * HTTP/1.1
-
-
HTTP 版本(HTTP version),定义了剩余消息的结构,作为对期望的响应版本的指示符。
标头(Header)
来自请求的 HTTP 标头遵循和 HTTP 标头相同的基本结构:不区分大小写的字符串,紧跟着的冒号(':'
)和一个结构取决于标头的值。整个标头(包括值)由一行组成,这一行可以相当长。
有许多请求标头可用,它们可以分为几组:
- 通用标头(General header),例如
Via
,适用于整个消息。 - 请求标头(Request header),例如
User-Agent
、Accept-Type
,通过进一步的定义(例如Accept-Language
)、给定上下文(例如Referer
)或者进行有条件的限制(例如If-None
)来修改请求。 - 表示标头(Representation header),例如
Content-Type
描述了消息数据的原始格式和应用的任意编码(仅在消息有主体时才存在)。
主体(Body)
请求的最后一部分是它的主体。不是所有的请求都有一个主体:例如获取资源的请求,像 GET
、HEAD
、DELETE
和 OPTIONS
,通常它们不需要主体。有些请求将数据发送到服务器以便更新数据:常见的的情况是 POST 请求(包含 HTML 表单数据)。
主体大致可分为两类:
- 单一资源(Single-resource)主体,由一个单文件组成。该类型的主体由两个标头定义:
Content-Type
和Content-Length
。 - 多资源(Multiple-resource)主体,由多部分主体组成,每一部分包含不同的信息位。通常是和 HTML 表单连系在一起。
HTTP 响应
状态行
HTTP 响应的起始行被称作状态行(status line),包含以下信息:
- 协议版本,通常为
HTTP/1.1
。 - 状态码(status code),表明请求是成功或失败。常见的状态码是
200
、404
或302
。 - 状态文本(status text)。一个简短的,纯粹的信息,通过状态码的文本描述,帮助人们理解该 HTTP 消息。
一个典型的状态行看起来像这样:HTTP/1.1 404 Not Found
。
标头(Header)
响应的 HTTP 标头遵循和任何其他标头相同的结构:不区分大小写的字符串,紧跟着的冒号(':'
)和一个结构取决于标头类型的值。整个标头(包括其值)表现为单行形式。
许多不同的标头可能会出现在响应中。这些可以分为几组:
- 通用标头(General header),例如
Via
,适用于整个消息。 - 响应标头(Response header),例如
Vary
和Accept-Ranges
,提供有关服务器的其他信息,这些信息不适合状态行。 - 表示标头(Representation header),例如
Content-Type
描述了消息数据的原始格式和应用的任意编码(仅在消息有主体时才存在)。
主体(Body)
响应的最后一部分是主体。不是所有的响应都有主体:具有状态码(如 201
或 204
)的响应,通常不会有主体。
主体大致可分为三类:
- 单资源(Single-resource)主体,由已知长度的单个文件组成。该类型主体由两个标头定义:
Content-Type
和Content-Length
。 - 单资源(Single-resource)主体,由未知长度的单个文件组成。通过将
Transfer-Encoding
设置为chunked
来使用分块编码。 - 多资源(Multiple-resource)主体,由多部分 body 组成,每部分包含不同的信息段。但这是比较少见的。
HTTP/2 帧
HTTP/1.x 消息有一些性能上的缺点:
- 与主体不同,标头不会被压缩。
- 两个消息之间的标头通常非常相似,但它们仍然在连接中重复传输。
- 无法多路复用。当在同一个服务器打开几个连接时:TCP 热连接比冷连接更加有效。
HTTP/2 引入了一个额外的步骤:它将 HTTP/1.x 消息分成帧并嵌入到流(stream)中。数据帧和报头帧分离,这将允许报头压缩。将多个流组合,这是一个被称为多路复用(multiplexing)的过程,它允许更有效的底层 TCP 连接。
HTTP 帧现在对 Web 开发人员是透明的。在 HTTP/2 中,这是一个在 HTTP/1.1 和底层传输协议之间附加的步骤。Web 开发人员不需要在其使用的 API 中做任何更改来利用 HTTP 帧;当浏览器和服务器都可用时,HTTP/2 将被打开并使用。
结论
HTTP 消息是使用 HTTP 的关键;它们的结构简单,并且具有高可扩展性。HTTP/2 帧机制是在 HTTP/1.x 语法和底层传输协议之间增加了一个新的中间层,而没有从根本上修改它,即它是建立在经过验证的机制之上。