《HTTP权威指南》读书笔记(二)
HTTP报文
如果说HTTP是因特网的信使,那么HTTP报文就是它用来搬东西的包裹了。
- 报文的组成部分:
- 对报文进行描述的起始行(start line)
- 保护属性的首部(header)块
- 可选的、包含数据的主体(body)部分
每条报文都包含一条来自客户端的请求,或者一条来自服务器的响应。
- 报文的语法
- 请求报文的格式
<method> <request-URL> <version> <headers> <br/><br/> <entity-body>
- 响应报文的格式
<version> <status> <reason-phrase> <headers> <br/><br/> <entity-body>
- 请求报文的格式
-
简要描述各部分含义
-
方法
客户端希望服务器对资源执行的动作。是一个单独的词,比如GET、 HEAD 、POST。
-
请求url
命名了所请求资源,或者URL路径组件的完整URL。如果直接与服务器进行对话,只要URL的路径组件是资源的绝对路径,通常就不会有什么问题——服务器可以假定自己是URL的主机/端口。
-
版本
报文所使用的HTTP版本,其格式看起来是这样的:HTTP/< major>.< minor>其中主要版本号(major) 和次要版本号(minor)都是整数。
-
状态码
这三位数字描述了请求过程中所发生的情况。每个状态码的第一位数字都用于描述状态的一般类别(“ 成功”、“ 出错” 等)。本章稍后提供了HTTP规范定义的状态码及其含义 的完整列表。
-
原因短语
数字状态码的可读版本,包含行终止序列之前的所有文本。原因短语只对人类有意义,因此,比如说,尽管 响应行HTTP/1.0 200 NOT OK 和 HTTP/1.0 200 OK 中原因短语的含义不同,但同样都会被当作成功指示处理。
-
首部
可以有零个或多个首部,每个首部都包含一个名字,后面跟着一个冒号(:),然后 是一个可选的空格,接着是一个值,最后是一个 CRLF。首部是由一个空行(CRLF)结束的,表示了首部列表的结束和实体主体部分的开始。有些HTTP版本,比如 HTTP/1.1,要求有效的请求或响应报文中必须包含特定的首部。
-
实体的主体部分
实体的主体部分包含一个由任意数据组成的数据块。并不是所有的报文都包含实体的主体部分,有时,报文只是以一个CRLF结束。
CRLF就是回车换行的意思
-
使用Telnet来模拟HTTP请求
看到图一这样的情况之后,表示已经连接
现在可以发送请求了:
#请求报文
GET /index.html HTTP/1.1
Host:www.baidu.com #这里输入完之后,要回车两次,然后就能看到响应报文了
#响应报文
HTTP/1.1 200 OK
Date: Wed, 13 Dec 2017 11:52:36 GMT
Content-Type: text/html
Content-Length: 14613
Last-Modified: Wed, 13 Dec 2017 02:25:00 GMT
Connection: Keep-Alive
Vary: Accept-Encoding
Set-Cookie: BAIDUID=DC0DD752AC0FA376EEC132906B96FD4C:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
Set-Cookie: BIDUPSID=DC0DD752AC0FA376EEC132906B96FD4C; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
Set-Cookie: PSTM=1513165956; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
P3P: CP=" OTI DSP COR IVA OUR IND COM "
Server: BWS/1.1
X-UA-Compatible: IE=Edge,chrome=1
Pragma: no-cache
Cache-control: no-cache
Accept-Ranges: bytes
#本文是读书笔记,非正式指导,如有错误,请指正
这篇文章写得真不错啊