深入理解 web 协议(三)：http2

本篇将详细介绍 http2 协议的方方面面，知识点如下：

http2 连接的建立
http2 中帧和流的关系
http2 中流量节省的奥秘：HPACK 算法
http2 协议中 server push 的能力
http2 为什么要实现流量控制？
http2 协议遇到的问题

一、http2 连接的建立

和许多人的固有印象不同的是http2协议本身并没有规定必须建立在tls/ssl之上，其实用普通的tcp连接也可以完成http2连接的建立。只不过现在为了安全市面上所有的浏览器都仅默认支持基于tls/ssl的http2协议。简单来说我们可以把构建在tcp连接之上的http2协议称之为h2c，而构建在tls/ssl协议之上的就可以理解为是h2了。

输入命令：

tcpdump -i eth0 port 80 and host nghttp2.org -w h2c.pcap &

然后用curl访问基于tcp连接，也就是port 80端口的 http2站点（这里是没办法用浏览器访问的，因为浏览器不允许）

curl http://nghttp2.org --http2 -v

其实看日志也可以大致了解一下这个连接建立的过程：

UJFVBre.png!mobile

我们将tcpdump出来的pcap文件拷贝到本地，然后用Wireshark打开以后还原一下整个http2连接建立的报文：

首先是 http 1.1 升级到 http2 协议

A3ueMz2.png!mobile

然后客户端还需要发送一个“魔法帧”：

QvEJzqn.png!mobile

最后还需要发送一个设置帧：

ArumIja.png!mobile

之后，我们来看一下，基于tls的http2连接是如何建立的，考虑到加密等因素，我们需要提前做一些准备工作。可以在chrome中下载这个插件。

IBzmIfe.png!mobile

然后打开任意一个网页只要看到这个闪电的图标为蓝色就代表这个站点支持http2；否则不支持。如下图：

aeIRZzI.png!mobile

将chrome浏览器的tls/ssl之类的信息输出到一个日志文件中，需要额外配置系统变量，如图所示：

vUbY7nm.png!mobile

然后将我们的Wireshark中ssl相关的设置也进行配置。

VRriaqR.png!mobile

这样浏览器在进行tls协议交互的时候，相关的加密解密信息都会写入到这个log文件中，我们的Wireshark就会用这个log文件中的信息来解密出我们的tls报文。

有了上述的基础，我们就可以着手分析基于tls连接的http2协议了。比如我们访问tmall的站点 https://www.tmall.com/ 然后打开我们的Wireshark。

3iYn2an.png!mobile

看一下标注的地方可以看出来，是tls连接建立以后然后继续发送魔法帧和设置帧，才代表http2的连接真正建立完毕。我们看一下tls报文的client hello 这个信息：

rQ3aUnr.png!mobile

其中这个alpn协议的信息就代表客户端可以接受哪两种协议。server hello 这个消息就明确的告知我们要使用h2协议。

zQNRV3b.png!mobile

这也是http2相比spdy协议最重要的一个优点：spdy协议强依赖tls/ssl，服务器没有任何选择。而http2协议则会在客户端发起请求的时候携带alpn这个扩展，也就是说客户端发请求的时候会告诉服务端我支持哪些协议。从而可以让服务端来选择，我是否需要走tls/ssl

二、http2 中帧和流的关系

IryUvqR.png!mobile

简单来说，http2就是在应用层上模拟了一下传输层tcp中“流”的概念，从而解决了http1.x协议中的队头拥塞的问题，在1.x协议中，http协议是一个个消息组成的，同一条tcp连接上，前面一个消息的响应没有回来，后续的消息是不可以发送的。在http2中，取消了这个限制，将所谓的“消息”定义成“流”，流跟流之间的顺序可以是错乱的，但是流里面的帧的顺序是不可以错乱的。如图：

RRvUfqI.png!mobile

也就是说在同一条tcp连接上，可以同时存在多个stream流，这些流由一个个frame帧组成，流跟流之间没有顺序关系，但是每一个流内部的帧是有先后顺序的。注意看这张图中的 135 等数字其实就是stream id，websocket中虽然也有帧的概念，但是因为websocket中没有stream id，所以websocket是没有多路复用的功能的。http2因为有了stream id所以就有了多路复用的能力。可以在一条tcp连接上存在n个流，就意味着服务端可以同时并发处理n个请求然后同时将这些请求都响应到同一条tcp连接上。当然这种在同一条tcp连接上传送n个stream的能力也是有限制的，在http2连接建立的时候，setting帧中会包含这个设置信息。例如下图在访问天猫的站点的时候，浏览器携带的setting帧的消息里面就标识了浏览器这个http2的客户端可以支持并发最大的流为1000。

qyIBzu.png!mobile

当天猫服务器返回这个setting帧的响应的时候，就告知了浏览器，我能支持的最大并发stream为128。

YVJzeuA.png!mobile

同时我们也要知道，http2协议中流id为单数就代表是客户端发起的流，偶数代表服务端主动发起的流（可以理解为服务端主动推送）。

三、 http2 中流量节省的奥秘：HPACK 算法

相比与http1.x协议，http2协议还在流量消耗上做了极大改进。主要分为三块：静态字典，动态字典，和哈夫曼编码. 可以安装如下工具探测一下对流量节省的作用：

apt-get install nghttp2-client

然后可以探测一下一些已经开启http2的站点，基本上节约的流量都是百分之25起，如果频繁访问的话会更多：

Mju6zi.png!mobile

对于流量消耗来说，其实http2相比http1.x协议最大的改进就是在http2中我们可以对http的头部进行压缩了，而在以往http 1.x协议中，gzip等是无法对header进行压缩的，尤其对于绝大多数的请求来说，其实header的占比是最大的。

我们首先来了解一下静态字典，如图所示：

VjYbQ37.png!mobile

这个其实不难理解，无非就是将我们那些常用的http头部，用固定的数字来表示，那当然可以起到节约流量的作用.这里要注意的是有些value 情况比较复杂的header，他们的value 是没有做静态字典的。比如cache-control这个缓存控制字段，这后面的值因为太多了就无法用静态字典来解决，而只能靠霍夫曼编码。下图可以表示 HPACK这种压缩算法起到的节约流量的作用：

YfUzUnR.png!mobile

例如，我们看下62这个头部，user-agent 代指浏览器，一般我们请求的时候这个头部信息都是不会变的，所以最终经过hpack算法优化以后后续再传输的时候就只需要传输62这个数字就可以代表其含义了。

又例如下图：

RrEzeuv.png!mobile

也是一样的，多个请求连续发送的时候，多数情况下变化的只有path，其余头部信息是不变的，那么基于此场景，最终传输的时候也就只有path这一个头部信息了。

最后我们来看看hpack算法中的核心:哈夫曼编码。哈弗曼编码核心思想就是出现频率较高的用较短的编码，出现频率较低的用较长的编码（http2协议的前身spdy协议采用的是动态的哈夫曼编码，而http2协议则选择了静态的哈夫曼编码）。

vY7V3er.png!mobile

来看几个例子：

uem2I3f.png!mobile

例如这个header帧，注意看这个method:get的头部信息。因为method:get 在静态索引表中的索引值为2.对于这种key和value都在索引表中的值，我们用一个字节也就是8个bit来标识，其中第一个bit固定为1，剩下7位就用来表示索引表中的值，这里method:get 索引表的值为2，所以这个值就是1000 0010，换算成16进制就是0x82.

qYFzm2y.png!mobile

再看一组，key在索引表中，value 不在索引表中的header例子。

rABZBn7.png!mobile

对于key在索引表中，value 不在索引表中的情况，固定是01开头的字节，后面6个bit（111010 换算成十进制就是58）就是静态索引的值， user-agent在索引中index的值是58 再加上01开头的2个bit 换算成二进制就是01111010,16进制就7a了。然后接着看第二个字节，0xd4,0xd4换算成二进制就是 1 101 0100，其中第一个bit 代表后面采用的是哈夫曼编码，后面的7个bit 这个key-value的value 需要几个字节来表示，这里是101 0100 换算成10进制就是84，也就是说这个user-agent后面的value需要84个字节来表示，我们数一下图中的字节数 16*5+第一排d4后面的4个字节，刚好等于84个字节。

最后再看一个key和value 都不在索引表中的例子。

aQnEn2r.png!mobile

四、http2 协议中 server push 的能力

前文我们提到过，h2相比h1.x协议提升最大的就是h2可以在单条tcp连接的基础上同时传输n个stream。从而避免h1.x协议中队头拥塞的问题。实际上在大部分前端的页面中，我们还可以使用h2协议的server push能力进一步提高页面的加载速度。例如通常我们用浏览器访问一个html页面时，只有当html页面返回到浏览器，浏览器内核解析到这个html页面中有 CSS 或者JS之类的资源时，浏览器才会发送对应的 CSS 或者JS请求，当 CSS 和JS回来以后浏览器才会进一步渲染，这样的流程通常会导致浏览器处于一段时间内的白屏从而降低用户体验。有了h2协议以后，当浏览器访问一个html页面到服务器时，服务器就可以主动推送相应的 CSS 和JS的内容到浏览器，这样就可以省略浏览器之后重新发送 CSS 和JS请求的步骤。

有些人对Server Push存在一定程度上的误解，认为这种技术能够让服务器向浏览器发送“通知”，甚至将其与WebSocket进行比较。事实并非如此，Server Push只是省去了浏览器发送请求的过程。只有当“如果不推送这个资源，浏览器就会请求这个资源”的时候，浏览器才会使用推送过来的内容。否则如果浏览器本身就不会请求某个资源，那么推送这个资源只会白白消耗带宽。当然如果与服务器通信的是客户端而不是浏览器，那么http2协议自然就可以完成 push推送的功能了。所以都使用http2协议的情况下，与服务器通信的是客户端还是浏览器在功能上还是有一定区别的。

6JRzMb2.png!mobile

下面为了演示这个过程，我们写一段代码。考虑到浏览器访问http2站点必须要建立在tls连接之上，我们首先要生成对应的证书和秘钥。

2IjAbe3.png!mobile

然后开启http2，在接收到html请求的时候主动push html中引用的 CSS 文件。

package main


import (
    "fmt"
    "net/http"


    "github.com/labstack/echo"
)




func main() {


    e := echo.New()
    e.Static("/", "html")
    //主要用来验证是否成功开启http2环境
    e.GET("/request", func(c echo.Context) error {
        req := c.Request()
        format := `
          <code>
            Protocol: %s<br>
            Host: %s<br>
            Remote Address: %s<br>
            Method: %s<br>
            Path: %s<br>
          </code>
        `
        return c.HTML(http.StatusOK, fmt.Sprintf(format, req.Proto, req.Host, req.RemoteAddr, req.Method, req.URL.Path))
    })


    //在收到html请求的时候 同时主动push html中引用的css文件，不需要等待浏览器发起请求
    e.GET("/h2.html", func(c echo.Context) (err error) {
        pusher, ok := c.Response().Writer.(http.Pusher)
        if ok {
            if err = pusher.Push("/app.css", nil); err != nil {
                println("error push")
                return
            }


        }


        return c.File("html/h2.html")
    })
    // 
    e.StartTLS(":1323", "cert.pem", "key.pem")
}

然后Chrome访问这个网页的时候，看下network面板：

FneMBb.png!mobile

可以看出来这个 CSS 文件就是我们主动push过来的。再看下Wireshark。

iqaaEfI.png!mobile

可以看出来 stream id为13的是客户端发起的请求，因为id是单数的，在这个stream中，还存在着push_promise帧，这个帧就是由服务器发送给浏览器的，看一下他的具体内容。

QneaMby.png!mobile

可以看出来这个帧就是用来告诉浏览器，我主动push给你的是哪个资源，这个资源的stream-id 是6.图中我们也看到了有一个stream-id 为6的 data在传输了，这个就是服务器主动push出来的CSS文件。到这里，一次完整的server push就交互完毕了。

但在实际线上应用server push的时候挑战远远比我们这个demo中来的复杂。首先就是大部分cdn供应商(除非自建cdn)对server push的支持比较有限。我们不可能让每一次资源的请求都直接打到我们的源服务器上，大部分静态资源都是前置在cdn中。其次，对于静态资源来说，我们还要考虑缓存的影响，如果是浏览器自己发出去的静态资源请求，浏览器是可以根据缓存状态来决定这个资源我是否真的需要去请求，而server push 是服务器主动发起的，服务器多数情况下是不知道这个资源的缓存是否过期的。当然可以在浏览器接收到push promise帧以后，查询自身的缓存状态然后发起RST_STREAM帧，告知服务器这个资源我有缓存，不需要继续发送了，但是你没办法保证这个RST_STREAM在到达服务器的时候，服务器主动push出去的data帧还没发出去。所以还是会存在一定的带宽浪费的现象。总体来说，server push 还是一个提高前端用户体验相当有效的手段，使用了server push以后浏览器的性能指标 idle指标一般可以提高3-5倍（毕竟浏览器不用等待解析html以后再去请求CSS和JS了）。

五、http2 为什么要实现流量控制？

很多人不理解，为什么tcp传输层已经实现了流量控制，我们的应用层http2还要实现流量控制。下面我们看一张图。

jMFviu6.png!mobile

在http2协议中，因为我们支持多路复用，也就是说我们可以同时发送多个stream 在同一条tcp连接中，上图中，每一种颜色就代表一个stream，可以看到我们总共有4种stream，每一个stream又有n个frame，这个就很危险了，假设在应用层中我们使用了多路复用，就会出现n个frame同时不停的发送到目标服务器中，此时流量达到顶峰就会触发tcp的拥塞控制，从而将后续的frame全部阻塞住，造成服务器响应过慢了。http1.x 中因为不支持多路复用自然就不存在这个问题。且我们之前多次提到过，一个请求从客户端到达服务器端要经过很多的代理服务器，这些代理服务器内存大小以及网络情况都可能不一样，所以在应用层上做一次流量控制尽量避开触发tcp的流控是十分有必要的。在http2协议中的流量控制策略，遵循以下几个原则：

客户端和服务端都有流量控制能力。
发送端和接收端可以独立设置流控能力。
只有data帧才需要流控，其他header帧或者push promise帧等都不需要。
流控能力只针对tcp连接的两端，中间即使有代理服务器，也不会透传到源服务器上。

访问知乎的站点看一下抓包。

iYZJZfz.png!mobile

这些标识window_update帧的就是所谓的流控帧了。我们随意点开一个看一下，就可以看到这个流量控制帧告诉我们的帧大小。

yQNNf2b.png!mobile

聪明如你一定能想到，既然http2都能做到流控了，那一定也可以来做优先级。比方说在http1.x协议中，我们访问一个html页面，里面会有JS和 CSS 还有图片等资源，我们同时发送这些请求，但是这些请求并没有优先级的概念，谁先出去谁先回来都是未知的(因为你也不知道这些 CSS 和JS请求是不是在同一条tcp连接上，既然是分散在不同的tcp中，那么哪个快哪个慢是不确定的)，但是从用户体验的角度来说，肯定 CSS 的优先级最高，然后是JS，最后才是图片，这样就可以大大缩小浏览器白屏的时间。在http2中实现了这样的能力。比如我们访问sina的站点，然后抓包就可以看到：

可以看下这个 CSS 帧的的优先级：

umE7Jra.png!mobile

JS的优先级

MFnMvaR.png!mobile

最后是gif图片的优先级，可以看出来这个优先级是最低的。

qYV3AnB.png!mobile

有了weight这个关键字来标识优先级，服务器就知道哪些请求需要优先被响应优先被发送response，哪些请求可以后一点被发送。这样浏览器在整体上提供给用户的体验就会变的更好。

六、http2 协议遇到的问题

基于tcp或者tcp+tls的 http2协议还是遇到了很多问题，比如：握手时间过长问题，如果是基于tcp的http2协议，那么至少要三次握手，如果是tcp+tls的 http2协议，除了tcp的握手还要经历tls的多次握手（tls1.3已经可以做到只有1次握手）。每一次握手都需要发送一个报文然后接收到这个报文的ack才可以进行下一次握手，在弱网环境下可以想象的到这个连接建立的效率是极低的。此外，tcp协议天生的队头拥塞问题也一直在困扰着http1.x协议和http2协议。我们看一下谷歌spdy的宣传图,可以更加精准的理解这个拥塞的本质：

26FZFfE.png!mobile

图一很好理解，我们多路复用支持下同时发了3个stream，然后经过tcp/ip协议发送到服务器端，然后tcp协议把这些数据包再传给我们的应用层，注意这里有个条件是，发送包的顺序要和接收包的顺序一致。上图中可以看到那些方块的图的顺序是一致的，但是如果碰到下图中的情况，比如说这些数据包恰好第一个红色的数据包传丢了，那么后续的数据包即使已经到了服务器的机器里，也无法立刻将数据传递给我们的应用层协议，因为tcp协议规定好了接收的顺序要和发送的顺序保持一致，既然红色的数据包丢失了，那么后续的数据包就只能阻塞在服务器里，一直等到红色的数据包经过重新发送以后成功到达服务器了，再将这些数据包传递给应用层协议。

tcp协议除了有上述的一些缺陷以外，还有一个问题就是tcp协议的实现者是在操作系统层面，我们任何语言，包括java，c，c++，go等等对外暴露的所谓socket编程接口最终实现者其实都是操作系统自己。要让操作系统自己升级tcp协议的实现是非常非常困难的，况且整个互联网中那么多设备想要整体实现tcp协议的升级是一件不现实的事情（ipv6协议升级的过慢也有这方面的原因）。基于上述问题，谷歌就基于udp协议封装了一层quic协议（其实很多基于udp协议的应用层协议，都是在应用层上部分实现了tcp协议的若干功能），来替代http1.x-http2中的tcp协议。

我们打开chrome中的quic协议开关：

ia2myqe.png!mobile

然后访问一下youtube（国内的b站其实也支持）。

FjAZFfA.png!mobile

可以看出来已经支持quic协议了。为什么这个选项在chrome浏览器中默认是关闭的，其实也很好理解，这个quic协议实际上是谷歌自己搞出来的，还没有被正式纳入到http3协议中，一切都还在草案中。所以这个选项默认是关闭的。看下quic协议相比于原来的tcp协议主要做了哪些改进？其实就是将原来队列传输报文改成了无需队列传输，那自然也就不存在队头拥塞的问题了。

RnYFbue.png!mobile

此外在http3中还提供了变更端口号或者ip地址也可以复用之前连接的能力，个人理解这个协议支持的特性可能更多是为了物联网考虑的。物联网中很多设备的ip都可能是一直变化的。能复用之前的连接将会大大提高网络传输的效率。这样就可以避免目前存在的断网以后重新连接到网络需要至少经过1-3个rtt才可以继续传输数据的弊端。

3EvYZnr.png!mobile

最后要提一下，在极端弱网环境中，http2的表现有可能不如http1.x，因为http2下面只有一条tcp连接，弱网下，如果丢包率极高，那么会不断的触发tcp层面的超时重传，造成tcp报文的积压，迟迟无法将报文传递给上面的应用层，但是http1.x中，因为可以使用多条tcp连接，所以在一定程度上，报文积压的情况不会像http2那么严重，这也是我认为的http2协议唯一不如http1.x的地方，当然这个锅是tcp的，并不是http2本身的。

Recommend

揭秘京东城市时空数据引擎—JUST如何助力交通流量预测

Android NativeCrash 捕获与解析

张一鸣怎样跳出“增长的痛苦”？

小米不造车

一人碾压专业机构，27岁MIT毕业生打造美国新冠预测「最准」模型

看完这篇 “原型” & “this”，就两字“通透了”

【漏洞预警】VMware官方通告多个高危漏洞

马斯克「玩火」，特斯拉遭殃

一天刷到5篇「x is All You Need」，当学术论文开始标题党……

从探索到实践，iOS动态库懒加载实录

About Joyk