快捷搜索:  汽车  科技

并发编程知识点讲解(并发编程中的大坑)

并发编程知识点讲解(并发编程中的大坑)int r = data 222;while(!isReady){};int data=0; bool isReady=false;data=666;isReady=true;

引言

并发编程无疑是编程领域中的上甘岭,他的“难”主要体现在两个方面,从宏观上来讲,主要是如何确定最优化的模型,例如Redis是单线程模型,Nginx是多进程单线程模型,而Netty是主从Reactor多线程模型;从微观上来讲,主要是原子性、可见性、有序性等问题的纠缠,这些问题有一个共同点,就是直觉失效。我们大部分情况下都是靠直觉来写程序的,如果直觉失效,会意味着什么呢?意味着直觉在引导我们写bug,引导我们误入歧途。今天我们就重点来聊聊直觉失效的问题之一:有序性问题。相信你看完这篇文章,肯定会大吃一惊:“原来一不小心写了这么多bug!”好在解决方案还是很简单的,只要了解了原理就可能轻松搞定。

01 一个简单的并发程序

在下面的代码中,线程T1执行一个计算任务(简化为data=666),任务完成后通过isReady标识结束了,线程T2等待线程T1完成计算任务(while (!isReady) {}),当线程T2观察到isReady为true时,执行后续任务(简化为r = data 222),那线程T2能得到预期的结果r==888吗?

int data=0; bool isReady=false;

data=666;

isReady=true;

while(!isReady){};

int r = data 222;

直觉告诉我们能看到预期的结果888,我们的直觉源自缜密的逻辑推导:线程T1中,首先对data进行了赋值操作,后对isReady进行了赋值操作,所以线程T2中观察到 isReady==true 时,data一定等于666,然后就会得到 r==888。

仅有理论推导还不够,最好跑个程序测试一下,理论联系实践,双保险。于是我们又写了下面这个验证程序,执行数次,并没有发现打印出异常数据。于是我们终于可以得出结论:一切OK!

boolean isReady=false;int data = 0;int r;public void main(String[] args) throws InterruptedException { for (int i=0; i<10000; i ) { Thread t1=new Thread(->{ data = 666; isReady = true; }); Thread t2=new Thread(->{ while (!isReady) {}; r = data 222; }); t2.start; t1.start; t2.join; if (r != 888) { System.out.println(r); } }}

当然了,这一起都是假象,理论推导,其过程没有错,但是假设条件有问题;实践代码也没有问题,但是不够全面。我们先从实践代码开始剖析。

02 用jcstress测试并发程

Java程序是依赖JVM解释执行,内部还有复杂的JIT优化,这些优化和JVM参数、 版本、以及CPU架构都有关系,和热点代码也有关系,JIT优化对并发测试的影响往往是颠覆式的;另外并发问题往往需要真实竞争,真实竞争指的是多个线程同一时刻在访问共享变量。上面我们的写的测试程序,并不能很好的解决JIT优化、真实竞争的问题。

好在现在已经有了不少并发测试的工具,jcstress是OpenJDK团队开源的并发测试工具,下面我们用jcstress来重写一下上面的测试程序。

@JCStressTest@Outcome(id = "888" expect=Expect.ACCEPTABLE desc="符合预期.")@Outcome(id = "0" expect=Expect.ACCEPTABLE desc="符合预期.")@Outcome( expect=Expect.ACCEPTABLE_INTERESTING desc="异常结果.")@Statepublic class IsReadyTest { int data = 0; boolean isReady = false; @Actor void actor1 { data = 666; isReady = true; } @Actor void actor2(I_Result r) { if (!isReady) { r.r1 = 0; } else { r.r1 = data 222; } }}

上面的测试程序,每个用 @Actor 注解的方法都会在一个独立的线程中执行,如果需要获得线程执行后的结果,可以将结果回写到 I_Result 中, @Outcome 注解用来验证 I_Result 中的结果是否符合预期。

在actor2中,我们没有使用while循环来检查isReady,而是用了if语句,其验证效果都是一样,如果actor1没有准备好计算结果,r.r1设置为0;反之,如果actor1准备好了计算结果,则设置r.r1=data 222,此时r.r1的预期结果是888,所以888和0都符合我们的预期,而其他值则属于异常。

在Java11版本的JVM上执行上面的测试程序,最终的结果如下图所示。

并发编程知识点讲解(并发编程中的大坑)(1)

我们发现有一个异常结果是222,出现222的唯一可能就是 isReady==true 并且 data==0,这怎么可能呢?这不就意味以下代码中的惊天大谎吗?

data = 666;isReady = true;

if (isReady) { //测试结果说明此处data等于0!!!}

actor1中,首先设置的data=666,然后才设置的isReady=true,直觉以及多年程序员的经验都告诉我们:后续代码如果能读到isReady==true,那么一定能读到data==666。

03 指令重排导致直觉失效

我们的直觉以及多年程序员的经验,在单线程场景中是正确的,在多线程场景中是不适用的。出于性能的考虑,Java编译器(含JIT)、CPU并没有忠实地按照我们代码的书写顺序执行代码,而是自以为是改变了执行顺序,我们一般把编译器、CPU的这种行为称为指令重排。

例如 我们书写的顺序是:

data=666; isReady=true;

而真实的执行顺序可能是:

isReady=true; data=666;

调整顺序后,在单线程上执行没有任何后遗症,例如单线程执行:

isReady = true;data = 666;

if (isReady) { //单线程中此处data仍然等于666!!!}

但是在多线程场景中,就不一定了,例如当actor1在执行完 isReady=true 后(尚没有执行data=666),actor2执行以下代码:

if (isReady) { r.r1 = data 222;}

由于此时data==0,所以就会得到r.r1 == 222。

04 更匪夷所思的编译器优化

前面我们基于jcstress的测试程序没有使用while循环来检查isReady,而是用了if语句,为什么要做这种替换呢?直接用while循环来验证并发问题不是更直接吗?于是我们得到如下的测试程序:

@JCStressTest@Outcome(id = "888" expect=Expect.ACCEPTABLE desc="符合预期.")@Outcome( expect=Expect.ACCEPTABLE_INTERESTING desc="异常结果.")@Statepublic class IsReadyTestError { int data = 0; boolean isReady = false; @Actor void actor1 { data = 666; isReady = true; } @Actor void actor2(I_Result r){ while (!isReady) {}; r.r1 = data 222; }}

你可以放心地执行上面的测试程序,放心吧无毒,但是在执行上面这个测试程序的时候,你将渐渐听到轰鸣的风扇的声音,然后一直轰鸣下去,我想你应该猜到发生什么了,死循环发生了。上面的代码在 while (!isReady) {}; 上死循环,再没机会跳出了。

怎么会这样?actor1可能会慢于actor2的执行,但也定也慢不过1秒,那为什么会发生死循环呢?这其实也是编译优化惹的祸。我们直觉总是以为每次while循环都会重新在内存中读取isReady这个变量,但是实际上,编译优化后的代码,仅仅在第一次循环时读了一次,之后所有的循环都没重新再去内存中读取isReady这个变量,从而导致while循环死在此处,再也无法跳出。

05 利用volatile解决有序性问题

上面提到的问题我们该如何解决呢?方案很简单,只要将isReady声明为volatile变量就可以了。

int data=0;

volatilebool isReady=false;

data=666;

isReady=true;

while(!isReady){};

int r=data 222;

对于volatile变量,JVM会禁用指令重排,例如代码的书写顺序是这样:

data=666; isReady=true;

由于isReady是volatile变量,所以JVM会禁止 data=666 重排到 isReady=true 的后面。

同样的道理,以下面顺序书写的代码:

var1=isReady; var2=data;

由于isReady是volatile变量,JVM会禁止 var2=data 重排到var1=isReady的前面。

同时volatile变量还会禁用CPU缓存,不会因为CPU缓存导致可见性问题。

06总结

在Java领域,编写线程安全的并发程序并不容易,首先我们需要解决的就是直觉失效的问题。有人把我们的认知分为四个境界:知道自己知道,知道自己不知道,不知道自己知道,不知道自己不知道,而最大悲剧在于不知道自己不知道,却以为自己知道,直觉失效就是属于此类,它会引导我们误入歧途。好在这些直觉失效的问题以及解决方案都有迹可循,极客时间我的专栏《Java并发编程实战》相对全面地解释了这些问题以及方案,如果你感兴趣,可以参考一下。

本文由高可用架构翻译。技术原创及架构实践文章,欢迎通过公众号菜单「联系我们」进行投稿。

高可用架构

改变互联网的构建方式

猜您喜欢: