快捷搜索:  汽车  科技

鲸云服务器进不去(agent无法通信案例分析)

鲸云服务器进不去(agent无法通信案例分析)排查过程中对比发现异常机器均属于阿里云C7类型实例,进一步验证C7类型实例是否存在问题:怀疑网络层面存在问题。排查过程:确认server和agent服务无问题后,怀疑ssl建立过程中存在问题。抓包分析,问题连接存在”Encrypted Alert” 、“rst”等异常会话连接,正常则不存在。

问题:

部分阿里云机器的蓝鲸agent与蓝鲸server通信报ssl连接错误

Agent端报错:无法发送数据至server

鲸云服务器进不去(agent无法通信案例分析)(1)

Server端报错:decryption failed or bad record mac 的错误是openssl 在对收到的包做完整性校验时发现收到的报数据不对。

鲸云服务器进不去(agent无法通信案例分析)(2)

鲸云服务器进不去(agent无法通信案例分析)(3)

排查过程:

确认server和agent服务无问题后,怀疑ssl建立过程中存在问题。

抓包分析,问题连接存在”Encrypted Alert” 、“rst”等异常会话连接,正常则不存在。

怀疑网络层面存在问题。

鲸云服务器进不去(agent无法通信案例分析)(4)

排查过程中对比发现异常机器均属于阿里云C7类型实例,进一步验证C7类型实例是否存在问题:

10.240.16.0网段C6,对比测试10.240.35.0网段C7

同一镜像生成的虚机

10.240.16.164使用C6类型,agent正常,10.240.35.81的C7类型异常。

鲸云服务器进不去(agent无法通信案例分析)(5)

10.240.16.164升级为C7后agent状态异常

鲸云服务器进不去(agent无法通信案例分析)(6)

鲸云服务器进不去(agent无法通信案例分析)(7)

说明阿里云C7类型实例在不同网段都存在问题,影响了蓝鲸server与蓝鲸agent之间的ssl通信,经阿里云进一步排查,得出如下结论。

蓝鲸软件agent在阿里云c7实例部署异常分析结果如下: 当前蓝鲸5.1.29版本与C7 X86机型CPU兼容性问题,即该版本软件指令和 C7 X86机型CPU存在兼容问题,CPU型号:Intel Xeon(Ice Lake) 系列。经测试,蓝鲸最新的6.0.5版本和C7 X86 CPU是兼容的,5.1.29版本软件与C7 AMD CPU也是兼容的。

解决:

腾讯蓝鲸同学给出GSE相关补丁包后替换原包后解决问题!

猜您喜欢: