1

深刻理解JAVA并发中的有序性问题和解决之道 - JAVA旭阳

 1 year ago
source link: https://www.cnblogs.com/alvinscript/p/16953848.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

深刻理解JAVA并发中的有序性问题和解决之道

Java并发情况下总是会遇到各种意向不到的问题,比如下面的代码:

int num = 0;

boolean ready = false;
// 线程1 执行此方法
public void actor1(I_Result r) {
 if(ready) {
 	r.r1 = num + num;
 } else {
 	r.r1 = 1;
 }
}
// 线程2 执行此方法
public void actor2(I_Result r) { 
 num = 2;
 ready = true; 
}
  • 线程1中如果发现ready=true,那么r1的值等于num + num,否则等于1,然后将结果保存到I_Result对象中
  • 线程2中先修改num=2,然后设置ready=true

那大家觉得I_Result中的r1值可能是多少呢?

  1. r1值等于4, 这个大家都能想到, CPU先执行了线程2,然后执行线程1
  2. r1值等于1,这个也容易理解,CPU先执行了线程1,然后执行线程2
  3. 那我如果说r1值有可能等于0,大家可能觉得离谱,不信的话,我们验证下。

压测验证结果

由于并发问题出现的概率比较低,我们可以使用openjdk提供的jcstress框架进行压测,就能够出现各种可能的情况。

jcstress:全名The Java Concurrency Stress tests,是一个实验工具和一套测试工具,用于帮助研究JVM、类库和硬件中并发支持的正确性。详细使用可以参考文章:https://www.cnblogs.com/wwjj4811/p/14310930.html

  1. 生成压测工程
mvn archetype:generate -DinteractiveMode=false -DarchetypeGroupId=org.openjdk.jcstress -DarchetypeArtifactId=jcstress-java-test-archetype -DarchetypeVersion=0.5 -DgroupId=com.alvin -DartifactId=juc-order -Dversion=1.0

316099403570453abe0981a1f4dee314~tplv-k3u1fbpfcp-zoom-1.image

生成的工程代码如下图:

5c543a8750964242bb8d97308da1072f~tplv-k3u1fbpfcp-zoom-1.image
  1. 填充测试内容
7dda490e4f504c5eb6531b379004df69~tplv-k3u1fbpfcp-zoom-1.image
  • 方法actor1是压测第一个线程干的活,将结果保存到I_Result中。
  • 方法actor2是压测第二个线程干的活
  • 类前面的@Outcome注解用来展示验证结果,特别是id="0"这个是我们感兴趣的结果
  1. 运行压测工程
mvn clean install 
java -jar target/jcstress.jar
  1. 查看运行结果

运行结果如下图所示:

f19d6425a78241e9aa756c382f74a47b~tplv-k3u1fbpfcp-zoom-1.image
  • 有4000多次出现了0的结果
  • 大部分情况的结果还是1和4

你是不是还是很困惑,其实这就是并发执行的一些坑,我们下面来解释下原因。

如果先要出现r1的值等于0,那么有一个可能0+0=0,那么也就是num=0

你可能想num怎么可能等于0,代码逻辑明明是先设置num=2,然后才修改ready=true, 最后才会走到num+num 的逻辑啊....

在并发的世界里,我们千万不要被固有的思维限制了,那是不是有可能num=2ready=true的执行顺序发生了变化呢。如果你想到这里,也基本接近真相了。

原因: JAVA中在指令不存在依赖的情况下,会进行顺序的调整,这种现象叫做指令重排序,是 JIT 编译器在运行时的一些优化。这也是为什么出现0的根本原因。

指令重排不会影响单线程执行的结果,但是在多线程的情况下,会有个可能出现问题。

理解指令重排序

前面提到出现问题的原因是因为指令重排序,你可能还是不大理解指令重排序究竟是什么,以及它的作用,那我这边用一个鱼罐头的故事带大家理解下。

我们可以把工人当做CPU,鱼当做指令,工人加工一条鱼需要 50 分钟,如果一条鱼、一条鱼顺序加工,这样是不是比较慢?

cce2e87bb7834b9cb25b91170a6d6764~tplv-k3u1fbpfcp-zoom-1.image

没办法得优化下,不然要喝西北风了,发现每个鱼罐头的加工流程有 5 个步骤:

  • 去鳞清洗 10分钟
  • 蒸煮沥水 10分钟
  • 加注汤料 10分钟
  • 杀菌出锅 10分钟
  • 真空封罐 10分钟

每个步骤中也是用到不同的工具,那能否可以并行呢?如下图所示:

cf3a8b15df85451c882ea35352f75cf9~tplv-k3u1fbpfcp-zoom-1.image

我们发现中间用很多步骤是并行做的,大大的提高了效率。但是在并行加工鱼的过程中,就会出现顺序的调整,比如先做第二条的鱼的某个步骤,然后在做第一条鱼的步骤。

现代 CPU 支持多级指令流水线,几乎所有的冯•诺伊曼型计算机的 CPU,其工作都可以分为 5 个阶段:取指令、指令译码、执行指令、访存取数和结果写回,可以称之为五级指令流水线。CPU 可以在一个时钟周期内,同时运行五条指令的不同阶段(每个线程不同的阶段),本质上流水线技术并不能缩短单条指令的执行时间,但变相地提高了指令地吞吐率。

c7123b1f3e7f4bd593a86c6e90b1d3fa~tplv-k3u1fbpfcp-zoom-1.image

处理器在进行重排序时,必须要考虑指令之间的数据依赖性

  • 单线程环境也存在指令重排,由于存在依赖性,最终执行结果和代码顺序的结果一致
  • 多线程环境中线程交替执行,由于编译器优化重排,会获取其他线程处在不同阶段的指令同时执行

volatile关键字

那么对于上面的问题,如何解决呢?

使用volatile关键字。

b8c1cbe0dd8e41368f6e9e5d0dc78747~tplv-k3u1fbpfcp-zoom-1.image

volatile 的底层实现原理是内存屏障,Memory Barrier(Memory Fence)

  • volatile 变量的写指令后会加入写屏障
  • volatile 变量的读指令前会加入读屏障

内存屏障本质上是一个CPU指令,形象点理解就是一个栅栏,拦在那里,无法跨越。

内存屏障分为写屏障和读屏障,有什么有呢?

  1. 保证可见性
  • 写屏障保证在该屏障之前的,对共享变量的改动,都同步到主存当中
  • 读屏障保证在该屏障之后,对共享变量的读取,加载的是主存中最新数据
  1. 保证有序性
  • 写屏障会确保指令重排序时,不会将写屏障之前的代码排在写屏障之后
  • 读屏障会确保指令重排序时,不会将读屏障之后的代码排在读屏障之前
278f8450804d41c59cf4ccf721704213~tplv-k3u1fbpfcp-zoom-1.image

回到前面的问题,如果对ready加了volatile以后,那么num=2就无法到后面去了,同样读取也是,如上图所示。

final底层也是通过内存屏障实现的,它与volatile一样。

  • 对final变量的写指令加入写屏障。也就是类初始化的赋值的时候会加上写屏障。
  • 对final变量的读指令加入读屏障。加载内存中final变量的最新值。

JAVA并发中的有序性问题其实比较难理解,本文通过一个例子验证了并发情况下会出现有序性的问题,从而引发意想不到的结果。这个主要的原因是为了提高性能,指令会发生重排序导致的。为了解决这样的问题,我们可以使用volatile这个关键字修饰变量,它能够保证有序性和可见性,但是无法保证原子性。如果以后遇到一些成员变量或者静态变量就要特别注意了,需要分析并发情况下会有哪些问题。

如果本文对你有帮助的话,请留下一个赞吧

更多技术干活和学习资料尽在个人公众号——JAVA旭阳
2603267-20221204155009240-490562729.png


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK