tcp握手在哪里实现,谈谈TCP协议那点破事
tcp握手在哪里实现,谈谈TCP协议那点破事传输层:定义传输数据的协议端口号,以及流控和差错校验,保证报文能正确传输。协议有TCP、UDP会话层:建立和管理本地主机与远程主机之间的会话。答案:分为7层,从下到上依次是:应用层:计算机用户与网络之间的接口,常见的协议有:HTTP、FTP、 SMTP、TELNET表示层:数据的表示、安全、压缩。将应用处理的信息转换为适合网络传输的格式。
谈谈tcp 协议简述
TCP 提供面向有连接的通信传输,面向有连接是指在传送数据之前必须先建立连接,数据传送完成后要释放连接。
无论哪一方向另一方发送数据之前,都必须先在双方之间建立一条连接。在TCP/IP协议中,TCP协议提供可靠的连接服务,连接是通过三次握手进行初始化的。
同时由于TCP协议是一种面向连接的、可靠的、基于字节流的运输层通信协议,TCP是全双工模式,所以需要四次挥手关闭连接。
谈网络的七层模型,简单介绍每层的作用?答案:分为7层,从下到上依次是:
应用层:计算机用户与网络之间的接口,常见的协议有:HTTP、FTP、 SMTP、TELNET
表示层:数据的表示、安全、压缩。将应用处理的信息转换为适合网络传输的格式。
会话层:建立和管理本地主机与远程主机之间的会话。
传输层:定义传输数据的协议端口号,以及流控和差错校验,保证报文能正确传输。协议有TCP、UDP
网络层:路由选择算法,进行逻辑地址寻址,实现不同网络之间的最佳路径选择。协议有IP、ICMP
数据链路层:接收来自物理层的位流形式的数据,并封装成帧,传送到上一层;同样,也将来自上层的数据帧,拆装为位流形式的数据转发到物理层。这一层的数据叫做帧。
物理层:建立、维护、断开物理连接。传输比特流(将1、0转化为电流强弱来进行传输,到达目的地后再转化为1、0,也就是我们常说的数模转换与模数转换)。这一层的数据叫做比特。
谈TCP包首部
网络中传输的数据包由两部分组成:一部分是协议所要用到的首部,另一部分是上一层传过来的数据。首部的结构由协议的具体规范详细定义。在数据包的首部,明确标明了协议应该如何读取数据。反过来说,看到首部,也就能够了解该协议必要的信息以及所要处理的数据。包首部就像协议的脸。
所以我们在学习TCP协议之前,首先要知道TCP在网络传输中处于哪个位置,以及它的协议的规范,下面我们就看看TCP首部的网络传输起到的作用:
下面的图是TCP头部的规范定义,它定义了TCP协议如何读取和解析数据:
TCP首部承载这TCP协议需要的各项信息,下面我们来分析一下:源端口、目的端口:各占2个字节,表示数据从哪个进程来,去往哪个进程
序号(Sequence number):占4个字节,TCP连接中传送的数据每一个字节都会有一个序号
确认号(Acknowledgement Number):占4个字节,另一方发送的tcp报文段的响应
数据偏移:头部长度,占4个字节,表示TCP报文段的数据距离TCP报文段的起始处有多远。
6位标志位:
URG:紧急指针是否有效
ACK:表示确认号是否有效
PSH:提示接收端应用程序立刻将数据从tcp缓冲区读走
RST:表示要求对方重新建立连接
SYN:这是一个连接请求或连接接受的报文
FIN:告知对方本端要关闭连接
窗口大小:占4个字节,用于TCP流量控制。告诉对方本端的TCP接收缓冲区还能容纳多少字节的数据,这样对方就可以控制发送数据的速度。
校验和:占2个字节,由发送端填充,接收端对TCP报文段执行CRC算法以检验TCP报文段在传输过程中是否损坏。检验的范围包括头部、数据两部分,是TCP可靠传输的一个重要保障。
紧急指针:占2个字节,一个正常的偏移量。它和序号字段的值相加表示最后一个紧急数据的下一个字节的序号,用于发送端向接收端发送紧急数据。
TCP的连接是需要四个要素确定唯一一个连接:
(源IP,源端口号) (目地IP,目的端口号)
所以TCP首部预留了两个16位作为端口号的存储,而IP地址由上一层IP协议负责传递
源端口号和目地端口各占16位两个字节,也就是端口的范围是2^16=65535
另外1024以下是系统保留的,从1024-65535是用户使用的端口范围
TCP的序号和确认号:32位序号 seq:Sequence number 缩写seq ,TCP通信过程中某一个传输方向上的字节流的每个字节的序号,通过这个来确认发送的数据有序,比如现在序列号为1000,发送了1000,下一个序列号就是2000。
32位确认号 ack:Acknowledge number 缩写ack,TCP对上一次seq序号做出的确认号,用来响应TCP报文段,给收到的TCP报文段的序号seq加1。
TCP的标志位每个TCP段都有一个目的,这是借助于TCP标志位选项来确定的,允许发送方或接收方指定哪些标志应该被使用,以便段被另一端正确处理。
用得最广泛的标志是 SYN,ACK 和 FIN,用于建立连接,确认成功的段传输,最后终止连接。
SYN:简写为S,同步标志位,用于建立会话连接,同步序列号;
ACK: 简写为.,确认标志位,对已接收的数据包进行确认;
FIN: 简写为F,完成标志位,表示我已经没有数据要发送了,即将关闭连接;
PSH:简写为P,推送标志位,表示该数据包被对方接收后应立即交给上层应用,而不在缓冲区排队;
RST:简写为R,重置标志位,用于连接复位、拒绝错误和非法的数据包;
URG:简写为U,紧急标志位,表示数据包的紧急指针域有效,用来保证连接不被阻断,并督促中间设备尽快处理。
谈TCP 三次握手建立连接所谓三次握手(Three-way Handshake),是指建立一个 TCP 连接时,需要客户端和服务器总共发送3个报文。
三次握手的目的是连接服务器指定端口,建立 TCP 连接,并同步连接双方的序列号和确认号,交换 TCP 窗口大小信息。在 SOCKET 编程中,客户端执行 connect() 时。将触发三次握手。
三次握手过程的示意图如下:
第一次握手:
客户端将TCP报文标志位SYN置为1,随机产生一个序号值seq=J,保存在TCP首部的序列号(Sequence Number)字段里,指明客户端打算连接的服务器的端口,并将该数据包发送给服务器端,发送完毕后,客户端进入SYN_SENT状态,等待服务器端确认。
第二次握手:
服务器端收到数据包后由标志位SYN=1知道客户端请求建立连接,服务器端将TCP报文标志位SYN和ACK都置为1,ack=J 1,随机产生一个序号值seq=K,并将该数据包发送给客户端以确认连接请求,服务器端进入SYN_RCVD状态。
第三次握手:
客户端收到确认后,检查ack是否为J 1,ACK是否为1,如果正确则将标志位ACK置为1,ack=K 1,并将该数据包发送给服务器端,服务器端检查ack是否为K 1,ACK是否为1,如果正确则连接建立成功,客户端和服务器端进入ESTABLISHED状态,完成三次握手,随后客户端与服务器端之间可以开始传输数据了。
注意:我们上面写的ack和ACK,不是同一个概念:小写的ack代表的是头部的确认号Acknowledge number, 缩写ack,是对上一个包的序号进行确认的号,ack=seq 1。
大写的ACK,则是我们上面说的TCP首部的标志位,用于标志的TCP包是否对上一个包进行了确认操作,如果确认了,则把ACK标志位设置成1。
下面我自己做实验,开一个HTTP服务,监听80端口,然后使用Tcpdump命令抓包,看一下TCP三次握手的过程:
sudo tcpdump -n -t -S -i enp0s3 port 80
第一次握手,标志位Flags=S
IP 10.0.2.2.51323 > 10.0.2.15.80: Flags [S] seq 84689409 win 65535 options [MSS 1460] length 0
第二次握手,标志位Flags=[S.]
IP 10.0.2.15.80 > 10.0.2.2.51323: Flags [S.] seq 1893430205 ack 84689410 win 64240 options [mss 1460] length 0
第三次握手,标志位Flags=[.]
IP 10.0.2.2.51323 > 10.0.2.15.80: Flags [.] ack 1893430206 win 65535 length 0
建立连接后,客户端发送http请求
IP 10.0.2.2.51321 > 10.0.2.15.80: Flags [P.] seq 1:753 ack 1 win 65535 length 752: HTTP: GET / HTTP/1.1
cpdump命令解析一下:-i : 指定抓包的网卡是enp0s3
-n: 把域名转成IP显示
-t: 不显示时间
-S: 序列号使用绝对数值,不指定-S的话,序列号会使用相对的数值
port: 指定监听端口是80
host:指定监听的主机名我们看下实战中TCP的三次握手过程:
第一次握手,客户端51323端口号向服务器端80号端口发起连接,此时标志位flags=S,即SYN=1标志,表示向服务端发起连接的请求,同时生成序列号seq=84689409
第二次握手,服务端标志位flags=[S.],即SYN ACK标志位设置为1,表示对上一个请求连接的报文进行确认,同时设置ack=seq 1=184689410,生成序列号seq=1893430205
第三次握手,客户端对服务端的响应进行确认,所以此时标志位是[.]即ACK=1,同时返回对上一个报文的seq的确认号,ack=1893430206
至此,三次握手完成,一个TCP连接建立完成,接下来就是双端传输数据了
为什么需要三次握手?我们假设client发出的第一个连接请求报文段并没有丢失,而是在某个网络结点长时间的滞留了,以致延误到连接释放以后的某个时间才到达server。
本来这是一个早已失效的报文段。但server收到此失效的连接请求报文段后,就误认为是client再次发出的一个新的连接请求。于是就向client发出确认报文段,同意建立连接。
假设不采用“三次握手”,那么只要server发出确认,新的连接就建立了。由于现在client并没有发出建立连接的请求,因此不会理睬server的确认,也不会向server发送数据。但server却以为新的运输连接已经建立,并一直等待client发来数据。这样,server的很多资源就白白浪费掉了。
所以,采用“三次握手”的办法可以防止上述现象发生。例如刚才那种情况,client不会向server的确认发出确认。server由于收不到确认,就知道client并没有要求建立连接。
什么是拆包?答案:传输层封包不能太大,基于这个限制,往往以缓冲区大小为单位,将数据拆分成多个 TCP 段(TCP Segment)传输。在接收数据的时候,一个个 TCP 段又被重组成原来的数据。简单来讲分为几个过程:拆分——传输——重组。
什么是粘包?答案:解决数据太小问题,防止多次发送占用资源。TCP 协议将它们合并成一个 TCP 段发送,在目的地再还原成多个数据。
缓冲区是做什么用?答案:缓冲区是在内存中开辟的一块区域,目的是缓冲。当应用频繁地通过网卡收、发数据,网卡只能一个一个处理。当网卡忙不过来的时候,数据就需要排队,也就是将数据放入缓冲区。
注意:TCP Segment 的大小不能超过缓冲区大小。
TCP 协议是如何保证数据的顺序?
大数据拆包成多个片段,发送可以保证有序,但是由于网络环境复杂,并不能保证它们到达时也是有序的,为了解决这个问题,对每个片段用Sequence Number编号,接收数据的时候,通过 Seq 进行排序。
注意:seq是累计的发送字节数
TCP 三次握手跟现实生活中的人与人打电话是很类似的:
三次握手:
“喂,你听得到吗?”
“我听得到呀,你听得到我吗?”
“我能听到你,今天 balabala……”
经过三次的互相确认,大家就会认为对方对听得到自己说话,并且愿意下一步沟通,否则,对话就不一定能正常下去了。
TCP 四次挥手关闭连接器
四次挥手即终止TCP连接,就是指断开一个TCP连接时,需要客户端和服务端总共发送4个包以确认连接的断开。在socket编程中,这一过程由客户端或服务端任一方执行close来触发。
由于TCP连接是全双工的,因此,每个方向都必须要单独进行关闭,这一原则是当一方完成数据发送任务后,发送一个FIN来终止这一方向的连接,收到一个FIN只是意味着这一方向上没有数据流动了,即不会再收到数据了,但是在这个TCP连接上仍然能够发送数据,直到这一方向也发送了FIN。首先进行关闭的一方将执行主动关闭,而另一方则执行被动关闭。
四次挥手过程的示意图如下:
挥手请求可以是Client端,也可以是Server端发起的,我们假设是Client端发起:
第一次挥手: Client端发起挥手请求,向Server端发送标志位是FIN报文段,设置序列号seq,此时,Client端进入FIN_WAIT_1状态,这表示Client端没有数据要发送给Server端了。
第二次分手:Server端收到了Client端发送的FIN报文段,向Client端返回一个标志位是ACK的报文段,ack设为seq加1,Client端进入FIN_WAIT_2状态,Server端告诉Client端,我确认并同意你的关闭请求。
第三次分手: Server端向Client端发送标志位是FIN的报文段,请求关闭连接,同时Client端进入LAST_ACK状态。
第四次分手 : Client端收到Server端发送的FIN报文段,向Server端发送标志位是ACK的报文段,然后Client端进入TIME_WAIT状态。Server端收到Client端的ACK报文段以后,就关闭连接。此时,Client端等待2MSL的时间后依然没有收到回复,则证明Server端已正常关闭,那好,Client端也可以关闭连接了。
为什么连接的时候是三次握手,关闭的时候却是四次握手?
建立连接时因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN ACK报文。其中ACK报文是用来应答的,SYN报文是用来同步的。所以建立连接只需要三次握手。
由于TCP协议是一种面向连接的、可靠的、基于字节流的运输层通信协议,TCP是全双工模式。
这就意味着,关闭连接时,当Client端发出FIN报文段时,只是表示Client端告诉Server端数据已经发送完毕了。当Server端收到FIN报文并返回ACK报文段,表示它已经知道Client端没有数据发送了,但是Server端还是可以发送数据到Client端的,所以Server很可能并不会立即关闭SOCKET,直到Server端把数据也发送完毕。
当Server端也发送了FIN报文段时,这个时候就表示Server端也没有数据要发送了,就会告诉Client端,我也没有数据要发送了,之后彼此就会愉快的中断这次TCP连接。
为什么要等待2MSL?MSL:报文段最大生存时间,它是任何报文段被丢弃前在网络内的最长时间。
有以下两个原因:第一点:保证TCP协议的全双工连接能够可靠关闭:
由于IP协议的不可靠性或者是其它网络原因,导致了Server端没有收到Client端的ACK报文,那么Server端就会在超时之后重新发送FIN,如果此时Client端的连接已经关闭处于CLOESD状态,那么重发的FIN就找不到对应的连接了,从而导致连接错乱,所以,Client端发送完最后的ACK不能直接进入CLOSED状态,而要保持TIME_WAIT,当再次收到FIN的收,能够保证对方收到ACK,最后正确关闭连接。
第二点:保证这次连接的重复数据段从网络中消失
如果Client端发送最后的ACK直接进入CLOSED状态,然后又再向Server端发起一个新连接,这时不能保证新连接的与刚关闭的连接的端口号是不同的,也就是新连接和老连接的端口号可能一样了,那么就可能出现问题:如果前一次的连接某些数据滞留在网络中,这些延迟数据在建立新连接后到达Client端,由于新老连接的端口号和IP都一样,TCP协议就认为延迟数据是属于新连接的,新连接就会接收到脏数据,这样就会导致数据包混乱。所以TCP连接需要在TIME_WAIT状态等待2倍MSL,才能保证本次连接的所有数据在网络中消失。
TCP 协议如何解决丢包?
答案:丢包需要重发,关键是如何判断有没有丢包!
每一个数据包,接收方都会给发送方发响应。每个 TCP 端发送时,接收方已经接收了多少数据,用 Acknowledgement Number(简写ACK) 表示。
注意:ack是累计的接收字节数,表示这个包之前的包都已经收到了。
什么是 MSS ?答案:MSS 全称 Maximun Segment Size。是TCP Header 中的可选项(Options),控制了 TCP 段位的大小,不能由单方决定,需要双方协商。
TCP 协议如何控制流量传输速度?
答案:简单讲通过滑动窗口。发送、接收窗口的大小可以用来控制 TCP 协议的流速。窗口越大,同时可以发送、接收的数据就越多,吞吐量也就越大。但是窗口越大,如果数据发生错误,损失也就越大,因为需要重传越多的数据。
TCP每个请求都要有响应,如果一个请求没有收到响应,发送方就会认为这次发送出现了故障,会触发重发。为了提升吞吐量,一个TCP段再没有收到响应时,可以继续发送下一个段。
- 窗口区域包含两类数据:已发送未确认、未发送(即将发送)
- 窗口中序号最小的分组如果收到 ACK,窗口就会向右滑动
- 滑动窗口的size规格可能会变化,需要从ACK数据包实时取最新值
- 如果最小序号的分组长时间没有收到 ACK,就会触发整个窗口的数据重新发送
HTTP 1.0 、1.1 和 HTTP 2.0 有什么区别?
答案:
1、HTTP 1.0
默认是短连接,每次与服务器交互,都需要新开一个连接。
2、HTTP 1.1
默认持久化连接,建立一次连接,多次请求均由这个连接完成。
3、HTTP 2.0
二进制分帧:在应用层和传输层之间加了一个二进制分帧层,将所有传输的信息分割为更小的消息和帧(frame),并对它们采用二进制格式的编码。减少服务端的压力,内存占用更少,连接吞吐量更大
多路复用:允许同时通过单一的HTTP/2.0连接发起多次的请求-响应消息。
头部压缩:采用了Hpack头部*压缩算法对Header进行压缩,减少重复发送。
服务器推送:服务器主动将一些资源推送给浏览器并缓存起来。
HTTP 与 HTTPS 的区别?答案:HTTPS = HTTP SSL/TLS
- HTTP 采用明文通讯;端口 80
- HTTPS 在HTTP的基础上加入了SSL/TLS协议,SSL/TLS依靠证书来验证服务器的身份,并为浏览器和服务器之间的通信加密。端口 443
HTTP 协议为什么要设计成无状态?
答案:HTTP是一种无状态协议,每个请求都是独立执行,请求/响应。这样设计的重要原因是,降低架构设计复杂度,毕竟服务器一旦带上了状态,扩容、缩容、路由都会受到制约。无状态协议不要求服务器在多个请求期间保留每个用户的信息。
但,你可能会问,如果有登录要求的业务怎么办?HTTP协议提供扩展机制,Header中增加了Cookie,存储在客户端,每次请求时自动携带,采用空间换时间机制,满足上下请求关联。虽然浪费了些网络带宽,但是减少了复杂度。当然为了减轻网络负担,浏览器会限制Cookie的大小,不同浏览器的限制标准略有差异,如:Chrome 10,限制最多 180个,每个Cookie大小不能超过 4096 bytes
HTTPS 的访问流程是什么?答案:
客户端发起一个http请求,告诉服务器自己支持哪些hash算法。
服务端把自己的信息以数字证书的形式返回给客户端(公钥在证书里面,私钥由服务器持有)。
客户端收到服务器的响应后会先验证证书的合法性(证书中包含的地址与正在访问的地址是否一致,证书是否过期)
如果证书验证通过,就会生成一个随机的对称密钥,用证书的公钥加密。
客户端将证书公钥加密后的密钥发送给服务端
服务端用私钥解密,解密之后就得到客户端的密钥
然后,客户端与服务端就靠密钥完成明文加密、安全通信、对称解密
对称加密与非对称加密有什么区别?答案:
- 对称加密。加密和解密使用同一个密钥。速度快。常用的如:AES、DES
- 非对称加密。公钥与私钥配对出现,公钥对数据加密,私钥对数据解密。常用的如:RSA、DSS
答案:Wireshark,应用最广泛的网络协议分析器。功能非常丰富
支持数百个协议
实时捕获、离线分析
支持 Windows、Linux、macOS、Solaris、FreeBSD、NetBSD等平台;
界面化操作
支持 Gzip
支持 IPSec