HTTP请求模型和头信息

发布于:2021-10-24 20:24:55

HTTP 请求模型和头信息 2009/02/19 下午 05:03 HTTP 请求模型 一、连接至 Web 服务器 一个客户端应用(如 Web 浏览器)打开到 Web 服务器的 HTTP 端口的一个套接字 (缺省为 80)。 例如:http://www.myweb.com:8080/index.html 在 Java 中,这将等同于代码: Soceet socket=new Socket("www.myweb.com",8080); InputStream in=socket.getInputStream(); OutputStream out=socket.getOutputStream(); 二、发送 HTTP 请求 通过连接,客户端写一个 ASCII 文本请求行,后跟 0 或多个 HTTP 头标, 一个空行和实现请求的任意数据。 一个请求由四个部分组成:请求行、请求头标、空行和请求数据 1.请求行:请求行由三个标记组成:请求方法、请求 URI 和 HTTP 版本,它们用 空格分隔。 例如:GET /index.html HTTP/1.1

HTTP 规范定义了 8 种可能的请求方法: GET 检索 URI 中标识资源的一个简单请求 HEAD 与 GET 方法相同,服务器只返回状态行和头标,并不返回 请求文档 POST 服务器接受被写入客户端输出流中的数据的请求 PUT 服务器保存请求数据作为指定 URI 新内容的请求 DELETE 服务器删除 URI 中命名的资源的请求 OPTIONS 关于服务器支持的请求方法信息的请求 TRACE Web 服务器反馈 Http 请求和其头标的请求 CONNECT 已文档化但当前未实现的一个方法,预留做隧道处理 2.请求头标:由关键字/值对组成,每行一对,关键字和值用冒号(:)分隔。 请 求头标通知服务器有关于客户端的功能和标识,典型的请求头标有: User-Agent Accept Content-Length 客户端厂家和版本 客户端可识别的内容类型列表 附加到请求的数据字节数

3.空行:最后一个请求头标之后是一个空行,发送回车符和退行,通知服务器以 下不再有头标。 4.请求数据:使用 POST 传送数据,最常使用的是 Content-Type 和 Content-Length 头标。 三、服务端接受请求并返回 HTTP 响应 Web 服务器解析请求,定位指定资源。服务器将资源副本写至套接字,在此处由 客户端读取。 一个响应由四个部分组成;状态行、响应头标、空行、响应数据 1.状态行:状态行由三个标记组成:HTTP 版本、响应代码和响应描述。 HTTP 版本:向客户端指明其可理解的最高版本。 响应代码:3 位的数字代码,指出请求的成功或失败,如果失败则指出原因。 响应描述:为响应代码的可读性解释。 例如:HTTP/1.1 200 OK HTTP 响应码: 1xx:信息,请求收到,继续处理 2xx:成功,行为被成功地接受、理解和采纳 3xx:重定向,为了完成请求,必须进一步执行的动作 4xx:客户端错误: 2.响应头标: 像请求头标一样, 它们指出服务器的功能, 标识出响应数据的细节。 3.空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以 下不再有头标。 4.响应数据:HTML 文档和图像等,也就是 HTML 本身。 四、服务器关闭连接,浏览器解析响应 1.浏览器首先解析状态行,查看表明请求是否成功的状态代码。 2.然后解析每一个响应头标,头标告知以下为若干字节的 HTML。 3.读取响应数据 HTML,根据 HTML 的语法和语义对其进行格式化,并在浏览器窗 口中显示它。 4.一个 HTML 文档可能包含其它需要被载入的资源引用,浏览器识别这些引用, 对其它的资源再进行额外的请求,此过程循环多次。 五、无状态连接 HTTP 模型是无状态的, 表明在处理一个请求时,Web 服务器并不记住来自同一客 户端的请求。 六、实例 1.浏览器发出请求 GET /index.html HTTP/1.1 服务器返回响应:

HTTP /1.1 200 OK Date: Apr 11 2006 15:32:08 GMT Server: Apache/2.0.46(win32) Content-Length: 119 Content-Type: text/html <HTML> <HEAD> <LINK REL="stylesheet" HREF="index.css"> </HEAD> <BODY> <IMG SRC="image/logo.png"> </BODY> </HTML> 2.浏览器发出请求 GET /index.css HTTP/1.1 服务器返回响应: HTTP /1.1 200 OK Date: Apr 11 2006 15:32:08 GMT Server: Apache/2.0.46(win32) Connection: Keep-alive, close Content-Length: 70 Content-Type: text/plane h3{ font-size:20px; font-weight:bold; color:#005A9C; } 3.浏览器发出请求 GET image/logo.png HTTP/1.1 服务器返回响应: HTTP /1.1 200 OK Date: Apr 11 2006 15:32:08 GMT Server: Apache/2.0.46(win32) Connection: Keep-alive, close Content-Length: 1280 Content-Type: text/plane {Binary image data follows}

(附录) 1.HTTP 规范:Internet 工程制定组织(IETF)发布的 RFC 指定 Internet 标准, 这些 RFC 被 Internet 研究发展机构广泛接受。因为它们是标准文档,故一般用 正规语言编写,如立法文标一样。 2.RFC:RFC 一旦被提出,就被编号且不会再改变,当一个标准被修改时,则给 出一个新的 RFC。作为标准,RFC 在 Internet 上被广泛采用。 3.HTTP 的几个重要 RFC: RFC1945 HTTP 1.0 描述 RFC2068 HTTP 1.1 初步描述 RFC2616 HTTP 1.1 标准 4.资源标识符 URI(Uniform Resource Identifter,URI) HTTP 参考 一、HTTP 码应码 响应码由三位十进制数字组成, 它们出现在由 HTTP 服务器发送的响应的第一行。 响应码分五种类型,由它们的第一位数字表示: 1.1xx:信息,请求收到,继续处理 2.2xx:成功,行为被成功地接受、理解和采纳 3.3xx:重定向,为了完成请求,必须进一步执行的动作 4.4xx:客户端错误,请求包含语法错误或者请求无法实现 5.5xx:服务器错误,服务器不能实现一种明显无效的请求 下表显示每个响应码及其含义: 100 继续 101 分组交换协 200 OK 201 被创建 202 被采纳 203 非授权信息 204 无内容 205 重置内容 206 部分内容 300 多选项 301 永久地传送 302 找到 303 参见其他 304 未改动 305 使用代理

307 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 500 501 502 503 504 505

暂时重定向 错误请求 未授权 要求付费 禁止 未找到 不允许的方法 不被采纳 要求代理授权 请求超时 冲突 过期的 要求的长度 前提不成立 请求实例太大 请求 URI 太大 不支持的媒体类型 无法满足的请求范围 失败的预期 内部服务器错误 未被使用 网关错误 不可用的服务 网关超时 HTTP 版本未被支持

二、HTTP 头标 头标由主键/值对组成。它们描述客户端或者服务器的属性、被传输的资源以及 应该实现连接。 四种不同类型的头标: 1.通用头标:即可用于请求,也可用于响应,是作为一个整体而不是特定资源与 事务相关联。 2.请求头标:允许客户端传递关于自身的信息和希望的响应形式。 3.响应头标:服务器和于传递自身信息的响应。 4.实体头标:定义被传送资源的信息。即可用于请求,也可用于响应。 头标格式:<name>:<value><CRLF> 下表描述在 HTTP/1.1 中用到的头标 Accept 定义客户端可以处理的媒体类型,按优先级排序; 在一个以逗号为分隔的列表中,可以定义多种类型和使用通 配符。例如:Accept: image/jpeg,image/png,*/* Accept-Charset

定义客户端可以处理的字符集,按优先级排序; 在一个以逗号为分隔的列表中, 可以定义多种类型和使用通 配符。例如:Accept-Charset: iso-8859-1,*,utf-8 Accept-Encoding 定义客户端可以理解的编码机制。例如: Accept-Encoding:gzip,compress Accept-Language 定义客户端乐于接受的自然语言列表。例如: Accept-Language: en,de Accept-Ranges 一个响应头标,它允许服务器指明:将在给定的偏移和长度处, 为资源组成部分的接受请求。 该头标的值被理解为请求范围的度量单位。例如 Accept-Ranges: bytes 或 Accept-Ranges: nonea Age 为单位。 允许服务器规定自服务器生成该响应以来所经过的时间长度,以秒 该头标主要用于缓存响应。例如:Age: 30 Allow 一个响应头标, 它定义一个由位于请求 URI 中的次源所支持 的 HTTP 方法列表。例如:Allow: GET,PUT Authorization 一个响应头标,用于定义访问一种资源所必需的授权(域和被编 码的用户 ID 与口令)。 例如:Authorization: Basic YXV0aG9yOnBoaWw= Cache-Control 一个用于定义缓存指令的通用头标。例如: Cache-Control: max-age=30 Connection 一个用于表明是否保存 socket 连接为开放的通用头 标。例如:Connection: close 或 Connection: keep-alive Content-Base 一种定义基本 URI 的实体头标, 为了在实体范围内解析相对 URLs。 如果没有定义 Content-Base 头标解析相对 URLs,使用 Content-Location URI(存在且绝对)或使用 URI 请求。 例如:Content-Base: Http://www.myweb.com Content-Encoding 一种介质类型修饰符,标明一个实体是如何编码的。例 如:Content-Encoding: zip Content-Language 用于指定在输入流中数据的自然语言类型。例如: Content-Language: en Content-Length 指定包含于请求或响应中数据的字节长度。例如: Content-Length:382

Content-Location 指定包含于请求或响应中的资源定位(URI)。 如果是一绝。对 URL 它也作为被解析实体的相对 URL 的出发点。 例如:Content-Location: http://www.myweb.com/news Content-MD5 实体的一种 MD5 摘要,用作校验和。 发送方和接受方都计算 MD5 摘要,接受方将其计算的值与此头标 中传递的值进行比较。 例如:Content-MD5: <base64 of 128 MD5 digest> Content-Range 随部分实体一同发送;标明被插入字节的低位与高位字节偏移, 也标明此实体的总长度。 例如:Content-Range: 1001-2000/5000 Contern-Type 标明发送或者接收的实体的 MIME 类型。例如: Content-Type: text/html Date 发送 HTTP 消息的日期。例如:Date: Mon,10PR 18:42:51 GMT ETag 一种实体头标,它向被发送的资源分派一个唯一的标识符。 对于可以使用多种 URL 请求的资源,ETag 可以用于确定实际被发 送的资源是否为同一资源。 例如:ETag: "208f-419e-30f8dc99" Expires 指定实体的有效期。例如:Expires: Mon,05 Dec 2008 12:00:00 GMT Form 一种请求头标,给定控制用户代理的人工用户的电子邮件地 址。例如:From: webmaster@myweb.com Host 被请求资源的主机名。对于使用 HTTP/1.1 的请求而言,此域 是强制性的。例如:Host: www.myweb.com If-Modified-Since 如果包含了 GET 请求,导致该请求条件性地依赖于资源上次修改 日期。 如果出现了此头标,并且自指定日期以来,此资源已被修改,应 该反回一个 304 响应代码。 例如:If-Modified-Since: Mon,10PR 18:42:51 GMT If-Match 如果包含于一个请求,指定一个或者多个实体标记。只 发送其 ETag 与列表中标记区配的资源。 例如:If-Match: "208f-419e-308dc99"

If-None-Match 如果包含一个请求,指定一个或者多个实体标记。资源的 ETag 不 与列表中的任何一个条件匹配,操作才执行。 例如:If-None-Match: "208f-419e-308dc99" If-Range 指定资源的一个实体标记,客户端已经拥有此资源的一个拷贝。 必须与 Range 头标一同使用。 如果此实体自上次被客户端检索以来,还不曾修改过,那么服务 器只发送指定的范围,否则它将发送整个资源。 例如:Range: byte=0-499<CRLF>If-Range:"208f-419e-30f8dc99" If-Unmodified-Since 只有自指定的日期以来,被请求的实体还不曾被修改过,才会返 回此实体。 例如:If-Unmodified-Since:Mon,10PR 18:42:51 GMT Last-Modified 指定被请求资源上次被修改的日期和时间。例如: Last-Modified: Mon,10PR 18:42:51 GMT Location 对于一个已经移动的资源,用于重定向请求者至另一个位置。 与状态编码 302(暂时移动)或者 301(永久性移动)配合使用。 例如:Location: http://www2.myweb.com/index.jsp Max-Forwards 一个用于 TRACE 方法的请求头标, 以指定代理或网关的最大数目, 该请求通过网关才得以路由。 在通过请求传递之前,代理或网关应该减少此数目。例如: Max-Forwards: 3 Pragma 一个通用头标,它发送实现相关的信息。例如:Pragma: no-cache Proxy-Authenticate 类似于 WWW-Authenticate,便是有意请求只来自请求链(代理) 的下一个服务器的认证。 例如:Proxy-Authenticate: Basic realm-admin Proxy-Proxy-Authorization 类似于授权,但并非有意传递任何比在即时服务器链中更进一步 的内容。 例如:Proxy-Proxy-Authorization: Basic YXV0aG9yOnBoaWw=

Public 列表显示服务器所支持的方法集。例如:Public: OPTIONS,MGET,MHEAD,GET,HEAD Range 指定一种度量单位和一个部分被请求资源的偏移范围。例 如:Range: bytes=206-5513 Refener 一种请求头标域,标明产生请求的初始资源。对于 HTML 表单,它 包含此表单的 Web 页面的地址。 例如:Refener: http://www.myweb.com/news/search.html Retry-After 一种响应头标域,由服务器与状态编码 503(无法提供服务)配合 发送,以标明再次请求之前应该等待多长时间。 此时间即可以是一种日期,也可以是一种秒单位。例如: Retry-After: 18 Server 一种标明 Web 服务器软件及其版本号的头标。 例 如:Server: Apache/2.0.46(Win32) Transfer-Encoding 一种通用头标,标明对应被接受方反向的消息体实施 变换的类型。例如:Transfer-Encoding: chunked Upgrade 允许服务器指定一种新的协议或者新的协议版本,与响应编码 101(切换协议)配合使用。 例如:Upgrade: HTTP/2.0 User-Agent 定义用于产生请求的软件类型(典型的如 Web 浏览器)。 例如: User-Agent: Mozilla/4.0(compatible; MSIE 5.5; Windows NT; DigExt) Vary 一个响应头标,用于表示使用服务器驱动的协商从可用的响应 表示中选择响应实体。例如:Vary: * Via 一个包含所有中间主机和协议的通用头标,用于满足请求。例 如:Via: 1.0 fred.com, 1.1 wilma.com Warning 用于提供关于响应状态补充信息的响应头标。例如:Warning: 99 www.myweb.com Piano needs tuning www-Authenticate 一个提示用户代理提供用户名和口令的响应头标,与状态编码 401(未授权)配合使用。响应一个授权头标。 例如:www-Authenticate: Basic realm=zxm.mgmt


相关推荐

最新更新

猜你喜欢