快捷搜索:  汽车  科技

怎么做到java不改代码增加功能(替换代码的情况下不停机)

怎么做到java不改代码增加功能(替换代码的情况下不停机)java-jararthas-boot.jar--target-ip172.17.72.201 java-jararthas-boot.jar--telnet-port9999--http-port-1./as.sh--target-ip0.0.0.0 ./as.sh--telnet-port9999--http-port-1访问arthas控制台也有两种方法./as.shPID#进程id指定JAVA进程id ./as.sh-h#h来获取更多参数信息3、远程连接:「要想使用arthas服务的 web console必须对外暴露本机ip」wgethttps://alibaba.github.io/arthas/arthas-boot.jar java-jararthas-boot.jar--target-ip0.0.0.0首先想用arthas调试项目,服务器必须要有运行着的Java服务,d


相信很多人都有这样一种感受,自己写的代码在开发、测试环境跑的稳得一笔,可一到线上就抽风,不是缺这个就是少那个反正就是一顿报错,而线上调试代码又很麻烦,让人头疼得很。不过 阿里巴巴出了一款名叫Arthas的工具,可以在线分析诊断java代码,让人眼前一亮。

Arthas 是什么?

Arthas(阿尔萨斯) 是阿里开源的一个Java在线分析诊断工具。

Arthas 能解决啥问题?

在日常开发上线过程中,我们多多少少都会遇到下边这些问题,苦于无法在线调试,「只能通过老鸟的经验来硬分析bug,效率上不去还总开口问别人答疑解惑,多少有些不好意思」

  • 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
  • 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
  • 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
  • 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
  • 是否有一个全局视角来查看系统的运行状况?
  • 有什么办法可以监控到JVM的实时运行状态?
  • 线上代码有错误,不想重新发布?那能不能改class文件替换一下?

Arthas两种安装、启动方式

1、jar包启动

wgethttps://alibaba.github.io/arthas/arthas-boot.jar java-jararthas-boot.jar--target-ip0.0.0.0

首先想用arthas调试项目,服务器必须要有运行着的Java服务,demo-0.0.1-SNAPSHOT.jar就是我启动的测试项目,启动arthas后它会自动检测本地所有的Java服务列出来,我们只需按照序号输入想要调试的项目即可,选1进入对应进程的arthas交互平台

[root@iz2zehzeir87zi8q99krk1zdata]#java-jararthas-boot.jar--target-ip172.17.72.201 [INFO]arthas-bootversion:3.1.0 [INFO]Foundexistingjavaprocess pleasechooseoneandhitRETURN. *[1]:28679demo-0.0.1-SNAPSHOT.jar

2、在线安装

curl-Lhttps://alibaba.github.io/arthas/install.sh|sh

执行上面的命令会在所在的文件中生成as.sh执行文件

怎么做到java不改代码增加功能(替换代码的情况下不停机)(1)

启动arthas

./as.shPID#进程id指定JAVA进程id ./as.sh-h#h来获取更多参数信息

3、远程连接:

「要想使用arthas服务的 web console必须对外暴露本机ip」

java-jararthas-boot.jar--target-ip172.17.72.201 java-jararthas-boot.jar--telnet-port9999--http-port-1

./as.sh--target-ip0.0.0.0 ./as.sh--telnet-port9999--http-port-1

访问arthas控制台也有两种方法

「(1)、web console 界面」

「重点说明」:--target-ip 的ip 一定要是arthas所在机器对外暴露的ip,「但如果用的是阿里云机器必须要使用私有ip启动arthas服务,但访问必须是公网IP」

怎么做到java不改代码增加功能(替换代码的情况下不停机)(2)

「(2)、telnet方式」

telnet10.0.2.58563

怎么做到java不改代码增加功能(替换代码的情况下不停机)(3)

访问 http://59.110.218.9:8563/ ,进入交互平台

怎么做到java不改代码增加功能(替换代码的情况下不停机)(4)

Arthas 命令使用

1、Dashboard 命令

查看当前系统的实时数据面板,例如:服务器thread信息、内存memory、GC回收等情况

怎么做到java不改代码增加功能(替换代码的情况下不停机)(5)

2、Thread(线程监控)

$thread-n3 "as-command-execute-daemon"Id=57cpuUsage=72%RUNNABLE atsun.management.ThreadImpl.dumpThreads0(NativeMethod) atsun.management.ThreadImpl.getThreadInfo(ThreadImpl.java:448) atcom.taobao.arthas.core.command.monitor200.ThreadCommand.processTopBusyThreads(ThreadCommand.java:133) atcom.taobao.arthas.core.command.monitor200.ThreadCommand.process(ThreadCommand.java:79) atcom.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl.process(AnnotatedCommandImpl.java:82) atcom.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl.access$100(AnnotatedCommandImpl.java:18) atcom.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl$ProcessHandler.handle(AnnotatedCommandImpl.java:111) atcom.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl$ProcessHandler.handle(AnnotatedCommandImpl.java:108) atcom.taobao.arthas.core.shell.system.impl.ProcessImpl$CommandProcessTask.run(ProcessImpl.java:370) atjava.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) atjava.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) atjava.lang.Thread.run(Thread.java:748) Numberoflockedsynchronizers=1 -java.util.concurrent.ThreadPoolExecutor$Worker@a2f70c7

「可以看到这个线程是被synchroned关键字导致的阻塞」 ,目前只支持找出synchronized关键字阻塞住的线程, 如果是java.util.concurrent.Lock, 目前还不支持。

Numberoflockedsynchronizers=1 -java.util.concurrent.ThreadPoolExecutor$Worker@a2f70c7 thread-n3#当前最忙的前N个线程 thread-b ##找出当前阻塞其他线程的线程 thread-n3-i1000#间隔一定时间后展示

「重点学习」:thread -b ##「找出当前阻塞其他线程的线程」

3、JVM (jvm实时运行状态,内存使用情况等)

$jvm RUNTIME -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- MACHINE-NAME28679@iz2zehzeir87zi8q99krk1z JVM-START-TIME2019-03-2817:32:16 MANAGEMENT-SPEC-VERSION1.2 SPEC-NAMEJavaVirtualMachineSpecification SPEC-VENDOROracleCorporation SPEC-VERSION1.8 VM-NAMEJavaHotSpot(TM)64-BitServerVM VM-VENDOROracleCorporation VM-VERSION25.191-b12 INPUT-ARGUMENTS[] CLASS-PATHdemo-0.0.1-SNAPSHOT.jar BOOT-CLASS-PATH/usr/local/jdk/jre/lib/resources.jar:/usr/local/jdk/jre/lib/rt.jar:/usr/local/jdk/jre/lib/sunrsasign.jar:/usr/local/jdk/jre/lib/jsse.jar:/usr/local/jdk/jre/lib/jce.jar :/usr/local/jdk/jre/lib/charsets.jar:/usr/local/jdk/jre/lib/jfr.jar:/usr/local/jdk/jre/classes LIBRARY-PATH/usr/java/packages/lib/amd64:/usr/lib64:/lib64:/lib:/usr/lib

4、trace (当前方法内部调用路径,路径上每个节点的耗时)

$trace#类名#方法名

怎么做到java不改代码增加功能(替换代码的情况下不停机)(6)

对于执行耗时相对较长的方法,调用链路耗时属性会高亮显示方便排查

怎么做到java不改代码增加功能(替换代码的情况下不停机)(7)

参数 -j 可以过滤jdk的函数 trace -j
com.example.demo.controller index2 参数 #cost 可以按执行耗时毫秒ms过滤 trace -j
com.example.demo.controller index2 ’#cost >10‘

5、watch

当前方法执行数据观测,能观察到的范围为:返回值、抛出异常、入参

$trace#类名#方法名"{params target returnObj,throwExp}"

OGNL表达式{params target returnObj,throwExp}

throwExp:异常 params :入参(数组),单个参数params【0】 returnObj:返回值

$watchcom.example.demo.controllerindex2"{params target returnObj}"-x5 PressQorCtrl Ctoabort. Affect(class-cnt:1 method-cnt:1)costin81ms. ts=2019-03-2914:24:14;[cost=1000.746582ms]result=@ArrayList[ @Object[][ @String[辛志富] ] @controller[ ] @String[index2] ]

6、stack

当前方法被调用的路径,显示当前方法被那些方法调用

publicstaticStringuuidOne(){ returnuuidTwo(); } publicstaticStringuuidTwo(){ returnUUID.randomUUID().toString().replaceAll("-" ""); }

$stackcom.example.demo.controlleruuidTwo PressQorCtrl Ctoabort. Affect(class-cnt:1 method-cnt:1)costin58ms. ts=2019-03-2914:38:19;thread_name=http-nio-8888-exec-5;id=13;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@525b461a @com.example.demo.controller.uuidOne() atcom.example.demo.controller.index2(controller.java:31) atsun.reflect.GeneratedMethodAccessor36.invoke(null:-1) atsun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

7、monitor 命令

监控类、方法的调用进行监控,调用次数、成功次数、失败次数、平均响应时长、失败率等

$monitor-c4com.example.demo.controlleruuidTwo PressQorCtrl Ctoabort. Affect(class-cnt:1 method-cnt:1)costin56ms. timestampclassmethodtotalsuccessfailavg-rt(ms)fail-rate -------------------------------------------------------------------------------------------------------- 2019-03-2914:55:40com.example.demo.controlleruuidTwo7700.180.00%

8、classloader 命令

将JVM中所有的类加载器统计出来,树状展示

$classloader#每种classloader加载类的个树 namenumberOfInstancesloadedCountTotal org.springframework.boot.loader.LaunchedURLClassLoader14463 com.taobao.arthas.agent.ArthasClassloader23631 BootstrapClassLoader12961 java.net.FactoryURLClassLoader1835 sun.misc.Launcher$AppClassLoader146 sun.reflect.DelegatingClassLoader4141 sun.misc.Launcher$ExtClassLoader125 Affect(row-cnt:7)costin7ms. $classloader-t#类加载器间的层级关系 -BootstrapClassLoader -sun.misc.Launcher$ExtClassLoader@1959f618 -com.taobao.arthas.agent.ArthasClassloader@5fc476c6 -com.taobao.arthas.agent.ArthasClassloader@5017e14b -sun.misc.Launcher$AppClassLoader@5c647e05 -java.net.FactoryURLClassLoader@4ad317f0 -org.springframework.boot.loader.LaunchedURLClassLoader@20ad9418 Affect(row-cnt:7)costin5ms

线上代码热更新(动态修改上线项目代码)

手动在代码中抛异常,「不停机不重新发包的情况下,修改线上代码」

怎么做到java不改代码增加功能(替换代码的情况下不停机)(8)

启动服务也达到我们预期异常

「替换代码的流程:」

1、jad命令 将需要更改的文件先进行反编译,保存下来 ,编译器修改

$jad--source--onlycom.example.demo.DemoApplication>/data/DemoApplication.java

怎么做到java不改代码增加功能(替换代码的情况下不停机)(9)

在这里插入图片描述

修改完以后需要将类重新加载到JVM

2、SC命令 查找当前类是哪个classLoader加载的

$sc-d*DemoApplication|grepclassLoader classLoaderHash20ad9418#类加载器编号

3、MC命令 用指定的classloader重新将类在内存中编译

$mc-c20ad9418/data/DemoApplication.java-d/data Memorycompileroutput: /data/com/example/demo/DemoApplication.class

4、redefine命令 将编译后的类加载到JVM

上边编译后的.class文件地址

$redefine/data/com/example/demo/DemoApplication.class redefinesuccess size:1

「文件替换后我们再次访问一下程序,发现异常没有了程序已经是我们修改正确后的,class文件替换成功」

怎么做到java不改代码增加功能(替换代码的情况下不停机)(10)

总结

这样我们就用arthas现实了不停机、不发包替换了生产环境的Java代码,功能确实比较强大,本文只揭开了arthas强大功能的冰山一角,后续将出更详细的文章,方便大家一起学习。

越懒越勤快

arthas的整体功能虽然很强大,但命令行的输入方式让我头疼不已,岁数大了记忆力真的下降严重,而且作为一个贼 TM 懒的程序员,让我去记住如此多的命令和参数,简直是要了老命。又一次因为懒让我勤快起来,我决定做个arthas命令可视化平台。

怎么做到java不改代码增加功能(替换代码的情况下不停机)(11)

「设计初衷」:设计这个平台的初衷很简单,就是让程序员们把更多的精力放在问题的排查上,而不是记那么多枯燥无趣的命令。本身我也不是一个愿意死记硬背的人,觉得脑子里还是应该多放一些有趣、有意义的东西。可能在用惯了命令行的大佬眼里,这个功能比较鸡肋,甚至有点多余,但毕竟像我这样平凡的人更多一些,每天还陷入在重复的工作当中,工作量能减一点就多轻松一点嘛。

猜您喜欢: