websocket是如何实现的(系统设计基础知识)
websocket是如何实现的(系统设计基础知识)系统设计基础知识(七)—代理 系统设计基础知识(六)—缓存区系统设计的基础知识(三)吞吐量和延迟 系统设计基础知识(四)—系统可用性 系统设计基础知识(五)—缓存
Websocket 使浏览器具有实时的双向通信能力。它可以打开用户浏览器和服务器之间的交互式通信会话。它提供了一种通过持久连接在客户端和服务器之间交换数据的方法。
系统设计基础知识系列第十一章WebSocket协议。你可以阅读我以前的文章
系统设计基础知识(一) - 网络
系统设计基础知识(二)—数据库
系统设计的基础知识(三)吞吐量和延迟
系统设计基础知识(四)—系统可用性
系统设计基础知识(五)—缓存
系统设计基础知识(六)—缓存区
系统设计基础知识(七)—代理
系统设计基础知识(八)了解IP地址和端口
系统设计基础知识(九)—负载均衡器
系统设计基础知识(十)—DNS
首先我们要明白,WebSocket本质上是一个计算机网络应用层的协议,用来弥补HTTP协议持久通信能力的不足。
HTTP 协议是一种无状态协议。每个新的 HTTP 请求只能由客户端发起。每个 HTTP 请求都已完全结束。虽然HTTP1.1增加了keep-alive请求头,可以通过一个channel进行多次请求,但本质还是一样的。
建立连接->传输数据->传输后断开
WebSocket 是 TCP 传输协议,复用 HTTP 握手通道。可实现全双工和长连接通信。可以在单个 TCP 连接上进行全双工通信,可以更好地节省服务器资源和带宽,实现实时通信。客户端和服务器只需完成一次握手,两者之间就可以建立持久连接。
WebSocket 是一种基于 TCP/IP 协议、独立于 HTTP 协议的通信协议。
HTTP 协议本身并没有持久的通信能力,但是我们在实际应用中需要这种能力。WebSocket 解决了 HTTP 的这些问题。当服务端完成从 HTTP 到 WebSocket 的协议升级后,服务端可以主动向客户端推送信息。2011年被互联网工程任务组(IETF)指定为标准RFC6455 ,并更新为RFC7936 . 于是,在HTML5标准中加入了WebSocket协议的相关API,只要实现了HTML5标准的客户端,就可以与支持WebSocket协议的服务器进行全双工持久通信。由于 WebSocket 只需要一次 HTTP 握手,服务器可以一直与客户端通信,直到连接关闭,解决了服务器重复解析 HTTP 协议的需要,减少了资源开销。
WebSocket 的特点
- 2路通讯
- 有状态的
- 可以在浏览器中使用
WebSocket协议原理
WebSocket 协议需要建立 TCP 连接来传输数据。具体实现是通过HTTP协议建立通道,然后使用WebSocket协议进行通信,所以WebSocket协议和HTTP协议有一定的交叉关系。
WebSocket 协议端口 = 80
WebSocket SSL 协议端口 = 443
Handshake WebSocket 也有一个握手过程,然后就可以正式发送和接收数据了。客户端发送的数据格式如下:
- 客户端请求消息
客户端发起 WebSocket 协议请求。
GET /chat HTTP/1.1
Upgrade: websocket
Connection: Upgrade
Host: server.example.com
Origin: http://example.com
Sec-WebSocket-Key: dGhlIHNhbXBsZSBub25jZQ==
Sec-WebSocket-Protocol: chat superchat
Sec-WebSocket-Version: 13
与传统 HTTP 消息的区别:
Upgrade: websocket
Connection: Upgrade
这两行表示 WebSocket 协议已启动。
Sec-WebSocket-Key:dGhlIHNhbXBsZSBub25jZQ==
Sec-WebSocket-Version:13
Sec-WebSocket-Key它由浏览器随机生成,并针对恶意或无意的连接提供基本保护(Base64 编码值)。
Sec-WebSocket-Version表示 WebSocket 的版本。最初WebSocket协议太多,不同厂商有自己的协议版本,现在已经确定了。如果服务器不支持该版本,则需要返回一个Sec-WebSocket-Versionheader,其中包含服务器支持的版本号。
创建一个 WebSocket 对象:
var ws = new websocket("ws://127.0.0.1:8001");
ws表示使用WebSocket协议,后面是地址和端口
2. 服务器响应消息
HTTP/1.1 101 Switching Protocols
Upgrade: websocket
Connection: Upgrade
Sec-WebSocket-Accept: s3pPLMBiTxaQ9kYGzzhZRbK xOo=
Sec-WebSocket-Protocol: chat
- 101状态码表示服务器已经理解了客户端的请求,会通过Upgrade消息头通知客户端使用不同的协议来完成请求
- 101 Switching Protocols显示HTTP请求完成后响应的状态码,表示协议已经切换,表示WebSocket协议通过HTTP协议建立传输层的TCP连接,然后与HTTP协议无关.
- Sec-WebSocket-Accept由服务器确认并加密Sec-WebSocket-Key
- Sec-WebSocket-Protocol代表最终使用的协议
- Sec-WebSocket-Accept
计算方法:将Sec-WebSocket-Key请求头中的值添加到专用UUID。摘要由 SHA1 计算并转换为 base64 字符串。 - Sec-WebSocket-Key/的转换Sec-WebSocket-Accept只能带来基本的保证,但是连接是否安全,数据是否安全,客户端/服务器是否合法,ws客户端,ws服务器,都没有实际的保证。
WebSocket 数据帧
- WebSocket 以帧为单位传输数据。帧是客户端和服务器之间数据传输的最小单位。
- 当数据过大时,可以将消息拆分成多帧发送。
- 解码是恢复完整的消息
帧头中的操作码字段
- FIN,长度为 1 位,该标志用于指示当前帧是消息的最后一段。FIN字段全部为0,最后一帧的FIN字段为1。如果消息没有被分段,那么一帧包含完整的消息,它的FIN字段值为1。
- RSV 1~3 — 这 3 个字段是保留字段,仅在 WebSocket 扩展中使用。如果接收方接收到 RSV 1~3 不全为 0 的帧,则这 3 个字段应设置为 1。 2 方尚未协商使用 WebSocket 协议扩展,接收方应立即终止 WebSocket 连接
- Opcode,长度为4位,该字段将指示帧的类型
- 0x0 — 延续帧
- 0x1 — 文本框
- 0x2 — 二进制帧
- 0x3~7,目前保留,以后会作为更多的非控制帧使用
- 0x8——连接关闭
- 0x9 — 当前 ping 帧
- 0xA — 当前的乒乓帧
- 0xB ~F——目前保留,未来将用作更多控制帧
- Mask,长度为1位,该字段为标志位,用于指示该帧的数据(有效载荷)是否被屏蔽。
- Payload Len — 帧有效载荷的长度(以字节为单位),该字段的长度是可变的,可能是 7 位,可能是 7 16 位,也可能是 7 64 位。
- Masking-key — 当 Mask 标志为 1 时,表示这是一个被掩码覆盖的帧。此时存在Masking-key字段,长度为32位。发送到服务器的帧必须用掩码覆盖。该字段的值由客户端使用具有足够大熵值的随机数生成器生成。
- Payload——这个字段的长度是任意的,这个字段是帧的数据部分。
WebSocket 控制类框架
主要用于传递一些连接控制信息
- 关闭框架——用于关闭 WebSocket 连接
- Ping Frame——检测帧,主要用于实现WebSocket层的Keep-Alive,或者检测对方是否还处于活跃状态
- Pong Frame — 是 ping Frame 的响应,一方面,接收方在收到 Ping 帧后应立即发回 Pong Frame,并且 Payload 的内容必须与 Ping 帧相同。
连接成功状态码
101 - HTTP 协议切换到 WebSocket 协议
连接关闭状态码
1000:正常断开
1001:服务器断开连接
1002:WebSocket 协议错误
103:客户端接受不支持的数据格式
1006:异常关机
1007:客户端接受了无效的数据格式(短信编码不是utf-8)
1009:传输数据量太大
1010:客户端终止连接
1011:服务器终止连接
1012:服务器正在重新启动
1013:服务器暂时终止
1014:通过网关或代理向服务器请求,服务器无法及时响应
1015:TLS 握手失败
WebSocket断线的原因
- 网络状态不好
- 数据被各种类型(路由器、防火墙、代理服务器)阻止
- 网络服务器故障
WebSocket断开连接的解决方案
- Heartbeat Reconnection — 它是通过 ping/pong(常规帧/控制帧)的服务器端实现来实现的。服务器向客户端发送ping 0x9 消息,客户端自动返回pong 0xA 消息。客户端定期向服务器发送消息。这里的消息是指WebSocket协议的数据帧,不需要通过代码实现。不同客户端发送消息的时间间隔不同。
优势
- 更少的控制开销——数据包头协议更小,不像 HTTP 为每个请求携带一个完整的头
- 更强的实时性——相比HTTP请求需要等待客户端发起请求,服务端可以响应,延迟明显更小
- 保持连接状态——通信创建后,可以省略状态信息。
- 更好的二进制支持——定义了二进制帧,更好地处理二进制内容
- 支持扩展——用户可以扩展WebSocket协议,实现一些自定义的子协议
- 更好的压缩——WebSocket可以继续使用之前内容的上下文,可以显着提高压缩比
如果你发现我的任何文章有帮助或有用,麻烦点赞或者转发。 谢谢!