tcp握手在哪里实现，谈谈TCP协议那点破事

小君 2023-01-24 12:05:41 707

tcp握手在哪里实现，谈谈TCP协议那点破事传输层：定义传输数据的协议端口号，以及流控和差错校验，保证报文能正确传输。协议有TCP、UDP会话层：建立和管理本地主机与远程主机之间的会话。答案：分为7层，从下到上依次是：应用层：计算机用户与网络之间的接口，常见的协议有：HTTP、FTP、 SMTP、TELNET表示层：数据的表示、安全、压缩。将应用处理的信息转换为适合网络传输的格式。

谈谈tcp 协议简述

TCP 提供面向有连接的通信传输，面向有连接是指在传送数据之前必须先建立连接，数据传送完成后要释放连接。

无论哪一方向另一方发送数据之前，都必须先在双方之间建立一条连接。在TCP/IP协议中，TCP协议提供可靠的连接服务，连接是通过三次握手进行初始化的。

同时由于TCP协议是一种面向连接的、可靠的、基于字节流的运输层通信协议，TCP是全双工模式，所以需要四次挥手关闭连接。

tcp握手在哪里实现，谈谈TCP协议那点破事(1)

谈网络的七层模型，简单介绍每层的作用？

答案：分为7层，从下到上依次是：

应用层：计算机用户与网络之间的接口，常见的协议有：HTTP、FTP、 SMTP、TELNET

表示层：数据的表示、安全、压缩。将应用处理的信息转换为适合网络传输的格式。

会话层：建立和管理本地主机与远程主机之间的会话。

传输层：定义传输数据的协议端口号，以及流控和差错校验，保证报文能正确传输。协议有TCP、UDP

网络层：路由选择算法，进行逻辑地址寻址，实现不同网络之间的最佳路径选择。协议有IP、ICMP

数据链路层：接收来自物理层的位流形式的数据，并封装成帧，传送到上一层；同样，也将来自上层的数据帧，拆装为位流形式的数据转发到物理层。这一层的数据叫做帧。

物理层：建立、维护、断开物理连接。传输比特流（将1、0转化为电流强弱来进行传输，到达目的地后再转化为1、0，也就是我们常说的数模转换与模数转换）。这一层的数据叫做比特。

tcp握手在哪里实现，谈谈TCP协议那点破事(2)

谈TCP包首部

网络中传输的数据包由两部分组成：一部分是协议所要用到的首部，另一部分是上一层传过来的数据。首部的结构由协议的具体规范详细定义。在数据包的首部，明确标明了协议应该如何读取数据。反过来说，看到首部，也就能够了解该协议必要的信息以及所要处理的数据。包首部就像协议的脸。

所以我们在学习TCP协议之前，首先要知道TCP在网络传输中处于哪个位置，以及它的协议的规范，下面我们就看看TCP首部的网络传输起到的作用：

tcp握手在哪里实现，谈谈TCP协议那点破事(3)

下面的图是TCP头部的规范定义，它定义了TCP协议如何读取和解析数据：

tcp握手在哪里实现，谈谈TCP协议那点破事(4)

TCP首部承载这TCP协议需要的各项信息，下面我们来分析一下：

tcp握手在哪里实现，谈谈TCP协议那点破事(5)

源端口、目的端口：各占2个字节，表示数据从哪个进程来，去往哪个进程

序号（Sequence number）：占4个字节，TCP连接中传送的数据每一个字节都会有一个序号

确认号（Acknowledgement Number）：占4个字节，另一方发送的tcp报文段的响应

数据偏移：头部长度，占4个字节，表示TCP报文段的数据距离TCP报文段的起始处有多远。

6位标志位：

URG：紧急指针是否有效

ACK：表示确认号是否有效

PSH：提示接收端应用程序立刻将数据从tcp缓冲区读走

RST：表示要求对方重新建立连接

SYN：这是一个连接请求或连接接受的报文

FIN：告知对方本端要关闭连接

窗口大小：占4个字节，用于TCP流量控制。告诉对方本端的TCP接收缓冲区还能容纳多少字节的数据，这样对方就可以控制发送数据的速度。

校验和：占2个字节，由发送端填充，接收端对TCP报文段执行CRC算法以检验TCP报文段在传输过程中是否损坏。检验的范围包括头部、数据两部分，是TCP可靠传输的一个重要保障。

紧急指针：占2个字节，一个正常的偏移量。它和序号字段的值相加表示最后一个紧急数据的下一个字节的序号，用于发送端向接收端发送紧急数据。

TCP的连接是需要四个要素确定唯一一个连接：

（源IP，源端口号）（目地IP，目的端口号）

所以TCP首部预留了两个16位作为端口号的存储，而IP地址由上一层IP协议负责传递

源端口号和目地端口各占16位两个字节，也就是端口的范围是2^16=65535

另外1024以下是系统保留的，从1024-65535是用户使用的端口范围

TCP的序号和确认号：

32位序号 seq：Sequence number 缩写seq ，TCP通信过程中某一个传输方向上的字节流的每个字节的序号，通过这个来确认发送的数据有序，比如现在序列号为1000，发送了1000，下一个序列号就是2000。

32位确认号 ack：Acknowledge number 缩写ack，TCP对上一次seq序号做出的确认号，用来响应TCP报文段，给收到的TCP报文段的序号seq加1。

TCP的标志位

每个TCP段都有一个目的，这是借助于TCP标志位选项来确定的，允许发送方或接收方指定哪些标志应该被使用，以便段被另一端正确处理。

用得最广泛的标志是 SYN，ACK 和 FIN，用于建立连接，确认成功的段传输，最后终止连接。

SYN：简写为S，同步标志位，用于建立会话连接，同步序列号；

ACK：简写为.，确认标志位，对已接收的数据包进行确认；

FIN：简写为F，完成标志位，表示我已经没有数据要发送了，即将关闭连接；

PSH：简写为P，推送标志位，表示该数据包被对方接收后应立即交给上层应用，而不在缓冲区排队；

RST：简写为R，重置标志位，用于连接复位、拒绝错误和非法的数据包；

URG：简写为U，紧急标志位，表示数据包的紧急指针域有效，用来保证连接不被阻断，并督促中间设备尽快处理。

谈TCP 三次握手建立连接

所谓三次握手(Three-way Handshake)，是指建立一个 TCP 连接时，需要客户端和服务器总共发送3个报文。

三次握手的目的是连接服务器指定端口，建立 TCP 连接，并同步连接双方的序列号和确认号，交换 TCP 窗口大小信息。在 SOCKET 编程中，客户端执行 connect() 时。将触发三次握手。

三次握手过程的示意图如下：

tcp握手在哪里实现，谈谈TCP协议那点破事(6)

第一次握手：

客户端将TCP报文标志位SYN置为1，随机产生一个序号值seq=J，保存在TCP首部的序列号(Sequence Number)字段里，指明客户端打算连接的服务器的端口，并将该数据包发送给服务器端，发送完毕后，客户端进入SYN_SENT状态，等待服务器端确认。

第二次握手：

服务器端收到数据包后由标志位SYN=1知道客户端请求建立连接，服务器端将TCP报文标志位SYN和ACK都置为1，ack=J 1，随机产生一个序号值seq=K，并将该数据包发送给客户端以确认连接请求，服务器端进入SYN_RCVD状态。

第三次握手：

客户端收到确认后，检查ack是否为J 1，ACK是否为1，如果正确则将标志位ACK置为1，ack=K 1，并将该数据包发送给服务器端，服务器端检查ack是否为K 1，ACK是否为1，如果正确则连接建立成功，客户端和服务器端进入ESTABLISHED状态，完成三次握手，随后客户端与服务器端之间可以开始传输数据了。

注意:我们上面写的ack和ACK，不是同一个概念：

小写的ack代表的是头部的确认号Acknowledge number，缩写ack，是对上一个包的序号进行确认的号，ack=seq 1。

大写的ACK，则是我们上面说的TCP首部的标志位，用于标志的TCP包是否对上一个包进行了确认操作，如果确认了，则把ACK标志位设置成1。

下面我自己做实验，开一个HTTP服务，监听80端口，然后使用Tcpdump命令抓包，看一下TCP三次握手的过程：

sudo tcpdump -n -t -S -i enp0s3 port 80

第一次握手，标志位Flags=S

IP 10.0.2.2.51323 > 10.0.2.15.80: Flags [S] seq 84689409 win 65535 options [MSS 1460] length 0

第二次握手，标志位Flags=[S.]

IP 10.0.2.15.80 > 10.0.2.2.51323: Flags [S.] seq 1893430205 ack 84689410 win 64240 options [mss 1460] length 0

第三次握手，标志位Flags=[.]

IP 10.0.2.2.51323 > 10.0.2.15.80: Flags [.] ack 1893430206 win 65535 length 0

建立连接后，客户端发送http请求

IP 10.0.2.2.51321 > 10.0.2.15.80: Flags [P.] seq 1:753 ack 1 win 65535 length 752: HTTP: GET / HTTP/1.1

cpdump命令解析一下：
-i : 指定抓包的网卡是enp0s3
-n: 把域名转成IP显示
-t: 不显示时间
-S: 序列号使用绝对数值，不指定-S的话，序列号会使用相对的数值
port: 指定监听端口是80
host:指定监听的主机名我们看下实战中TCP的三次握手过程：

第一次握手，客户端51323端口号向服务器端80号端口发起连接，此时标志位flags=S，即SYN=1标志，表示向服务端发起连接的请求，同时生成序列号seq=84689409

第二次握手，服务端标志位flags=[S.]，即SYN ACK标志位设置为1，表示对上一个请求连接的报文进行确认，同时设置ack=seq 1=184689410，生成序列号seq=1893430205

第三次握手，客户端对服务端的响应进行确认，所以此时标志位是[.]即ACK=1，同时返回对上一个报文的seq的确认号，ack=1893430206

至此，三次握手完成，一个TCP连接建立完成，接下来就是双端传输数据了

为什么需要三次握手？

我们假设client发出的第一个连接请求报文段并没有丢失，而是在某个网络结点长时间的滞留了，以致延误到连接释放以后的某个时间才到达server。

本来这是一个早已失效的报文段。但server收到此失效的连接请求报文段后，就误认为是client再次发出的一个新的连接请求。于是就向client发出确认报文段，同意建立连接。

假设不采用“三次握手”，那么只要server发出确认，新的连接就建立了。由于现在client并没有发出建立连接的请求，因此不会理睬server的确认，也不会向server发送数据。但server却以为新的运输连接已经建立，并一直等待client发来数据。这样，server的很多资源就白白浪费掉了。

所以，采用“三次握手”的办法可以防止上述现象发生。例如刚才那种情况，client不会向server的确认发出确认。server由于收不到确认，就知道client并没有要求建立连接。

什么是拆包？

答案：传输层封包不能太大，基于这个限制，往往以缓冲区大小为单位，将数据拆分成多个 TCP 段（TCP Segment）传输。在接收数据的时候，一个个 TCP 段又被重组成原来的数据。简单来讲分为几个过程：拆分——传输——重组。

什么是粘包？

答案：解决数据太小问题，防止多次发送占用资源。TCP 协议将它们合并成一个 TCP 段发送，在目的地再还原成多个数据。

缓冲区是做什么用？

答案：缓冲区是在内存中开辟的一块区域，目的是缓冲。当应用频繁地通过网卡收、发数据，网卡只能一个一个处理。当网卡忙不过来的时候，数据就需要排队，也就是将数据放入缓冲区。

注意：TCP Segment 的大小不能超过缓冲区大小。

TCP 协议是如何保证数据的顺序？

tcp握手在哪里实现，谈谈TCP协议那点破事(7)

大数据拆包成多个片段，发送可以保证有序，但是由于网络环境复杂，并不能保证它们到达时也是有序的，为了解决这个问题，对每个片段用Sequence Number编号，接收数据的时候，通过 Seq 进行排序。

注意：seq是累计的发送字节数

TCP 三次握手跟现实生活中的人与人打电话是很类似的：

三次握手：

“喂，你听得到吗？”

“我听得到呀，你听得到我吗？”

“我能听到你，今天 balabala……”

经过三次的互相确认，大家就会认为对方对听得到自己说话，并且愿意下一步沟通，否则，对话就不一定能正常下去了。

TCP 四次挥手关闭连接器

四次挥手即终止TCP连接，就是指断开一个TCP连接时，需要客户端和服务端总共发送4个包以确认连接的断开。在socket编程中，这一过程由客户端或服务端任一方执行close来触发。

由于TCP连接是全双工的，因此，每个方向都必须要单独进行关闭，这一原则是当一方完成数据发送任务后，发送一个FIN来终止这一方向的连接，收到一个FIN只是意味着这一方向上没有数据流动了，即不会再收到数据了，但是在这个TCP连接上仍然能够发送数据，直到这一方向也发送了FIN。首先进行关闭的一方将执行主动关闭，而另一方则执行被动关闭。

四次挥手过程的示意图如下：

tcp握手在哪里实现，谈谈TCP协议那点破事(8)

挥手请求可以是Client端，也可以是Server端发起的，我们假设是Client端发起：

第一次挥手： Client端发起挥手请求，向Server端发送标志位是FIN报文段，设置序列号seq，此时，Client端进入FIN_WAIT_1状态，这表示Client端没有数据要发送给Server端了。

第二次分手：Server端收到了Client端发送的FIN报文段，向Client端返回一个标志位是ACK的报文段，ack设为seq加1，Client端进入FIN_WAIT_2状态，Server端告诉Client端，我确认并同意你的关闭请求。

第三次分手： Server端向Client端发送标志位是FIN的报文段，请求关闭连接，同时Client端进入LAST_ACK状态。

第四次分手： Client端收到Server端发送的FIN报文段，向Server端发送标志位是ACK的报文段，然后Client端进入TIME_WAIT状态。Server端收到Client端的ACK报文段以后，就关闭连接。此时，Client端等待2MSL的时间后依然没有收到回复，则证明Server端已正常关闭，那好，Client端也可以关闭连接了。

为什么连接的时候是三次握手，关闭的时候却是四次握手？

建立连接时因为当Server端收到Client端的SYN连接请求报文后，可以直接发送SYN ACK报文。其中ACK报文是用来应答的，SYN报文是用来同步的。所以建立连接只需要三次握手。

由于TCP协议是一种面向连接的、可靠的、基于字节流的运输层通信协议，TCP是全双工模式。

这就意味着，关闭连接时，当Client端发出FIN报文段时，只是表示Client端告诉Server端数据已经发送完毕了。当Server端收到FIN报文并返回ACK报文段，表示它已经知道Client端没有数据发送了，但是Server端还是可以发送数据到Client端的，所以Server很可能并不会立即关闭SOCKET，直到Server端把数据也发送完毕。

当Server端也发送了FIN报文段时，这个时候就表示Server端也没有数据要发送了，就会告诉Client端，我也没有数据要发送了，之后彼此就会愉快的中断这次TCP连接。

为什么要等待2MSL？

MSL：报文段最大生存时间，它是任何报文段被丢弃前在网络内的最长时间。

有以下两个原因：

第一点：保证TCP协议的全双工连接能够可靠关闭：

由于IP协议的不可靠性或者是其它网络原因，导致了Server端没有收到Client端的ACK报文，那么Server端就会在超时之后重新发送FIN，如果此时Client端的连接已经关闭处于CLOESD状态，那么重发的FIN就找不到对应的连接了，从而导致连接错乱，所以，Client端发送完最后的ACK不能直接进入CLOSED状态，而要保持TIME_WAIT，当再次收到FIN的收，能够保证对方收到ACK，最后正确关闭连接。

第二点：保证这次连接的重复数据段从网络中消失

如果Client端发送最后的ACK直接进入CLOSED状态，然后又再向Server端发起一个新连接，这时不能保证新连接的与刚关闭的连接的端口号是不同的，也就是新连接和老连接的端口号可能一样了，那么就可能出现问题：如果前一次的连接某些数据滞留在网络中，这些延迟数据在建立新连接后到达Client端，由于新老连接的端口号和IP都一样，TCP协议就认为延迟数据是属于新连接的，新连接就会接收到脏数据，这样就会导致数据包混乱。所以TCP连接需要在TIME_WAIT状态等待2倍MSL，才能保证本次连接的所有数据在网络中消失。

TCP 协议如何解决丢包？

答案：丢包需要重发，关键是如何判断有没有丢包！

每一个数据包，接收方都会给发送方发响应。每个 TCP 端发送时，接收方已经接收了多少数据，用 Acknowledgement Number（简写ACK）表示。

注意：ack是累计的接收字节数，表示这个包之前的包都已经收到了。

什么是 MSS ?

答案：MSS 全称 Maximun Segment Size。是TCP Header 中的可选项（Options），控制了 TCP 段位的大小，不能由单方决定，需要双方协商。

TCP 协议如何控制流量传输速度？

答案：简单讲通过滑动窗口。发送、接收窗口的大小可以用来控制 TCP 协议的流速。窗口越大，同时可以发送、接收的数据就越多，吞吐量也就越大。但是窗口越大，如果数据发生错误，损失也就越大，因为需要重传越多的数据。

TCP每个请求都要有响应，如果一个请求没有收到响应，发送方就会认为这次发送出现了故障，会触发重发。为了提升吞吐量，一个TCP段再没有收到响应时，可以继续发送下一个段。

tcp握手在哪里实现，谈谈TCP协议那点破事(9)

窗口区域包含两类数据：已发送未确认、未发送（即将发送）
窗口中序号最小的分组如果收到 ACK，窗口就会向右滑动
滑动窗口的size规格可能会变化，需要从ACK数据包实时取最新值
如果最小序号的分组长时间没有收到 ACK，就会触发整个窗口的数据重新发送

HTTP 1.0 、1.1 和 HTTP 2.0 有什么区别？

答案：

1、HTTP 1.0

默认是短连接，每次与服务器交互，都需要新开一个连接。

2、HTTP 1.1

默认持久化连接，建立一次连接，多次请求均由这个连接完成。

3、HTTP 2.0

二进制分帧：在应用层和传输层之间加了一个二进制分帧层，将所有传输的信息分割为更小的消息和帧（frame），并对它们采用二进制格式的编码。减少服务端的压力，内存占用更少，连接吞吐量更大

多路复用：允许同时通过单一的HTTP/2.0连接发起多次的请求-响应消息。

头部压缩：采用了Hpack头部*压缩算法对Header进行压缩，减少重复发送。

服务器推送：服务器主动将一些资源推送给浏览器并缓存起来。

HTTP 与 HTTPS 的区别？

答案：HTTPS = HTTP SSL/TLS

HTTP 采用明文通讯；端口 80
HTTPS 在HTTP的基础上加入了SSL/TLS协议，SSL/TLS依靠证书来验证服务器的身份，并为浏览器和服务器之间的通信加密。端口 443

HTTP 协议为什么要设计成无状态？

答案：HTTP是一种无状态协议，每个请求都是独立执行，请求/响应。这样设计的重要原因是，降低架构设计复杂度，毕竟服务器一旦带上了状态，扩容、缩容、路由都会受到制约。无状态协议不要求服务器在多个请求期间保留每个用户的信息。

但，你可能会问，如果有登录要求的业务怎么办？HTTP协议提供扩展机制，Header中增加了Cookie，存储在客户端，每次请求时自动携带，采用空间换时间机制，满足上下请求关联。虽然浪费了些网络带宽，但是减少了复杂度。当然为了减轻网络负担，浏览器会限制Cookie的大小，不同浏览器的限制标准略有差异，如：Chrome 10，限制最多 180个，每个Cookie大小不能超过 4096 bytes

HTTPS 的访问流程是什么？

答案：

客户端发起一个http请求，告诉服务器自己支持哪些hash算法。

服务端把自己的信息以数字证书的形式返回给客户端（公钥在证书里面，私钥由服务器持有）。

客户端收到服务器的响应后会先验证证书的合法性（证书中包含的地址与正在访问的地址是否一致，证书是否过期）

如果证书验证通过，就会生成一个随机的对称密钥，用证书的公钥加密。

客户端将证书公钥加密后的密钥发送给服务端

服务端用私钥解密，解密之后就得到客户端的密钥

然后，客户端与服务端就靠密钥完成明文加密、安全通信、对称解密

对称加密与非对称加密有什么区别？

答案：