看了synchronized源码，请别和我说它慢

原标题：看了synchronized源码，请别和我说它慢

作者：think123（本文来自作者投稿）

作者：think123（本文来自作者投稿）

我们都知道 Java 之所以可以一次编译到处运行，完全是因为字节码的原因，字节码就相当于中间层屏蔽了底层细节。但是想要在机器执行，最终还是要翻译成机器指令。

而 JVM 是通过 C/C++ 来编写的。Java 程序编译后，会产生很多字节码指令，每一个字节码指令在 JVM 底层执行的时候又会编程一堆 C 代码，这一堆 C 代码在编译之后又会编程很多的机器指令。这样我们的 Java 代码到最终执行的机器指令那一层，所产生的机器指令时指数级的。这也就导致了 Java 执行效率低下。

早期的 JVM 是因为解释执行慢而被人诟病，那么有没有办法优化这个问题呢？我们发现，之所以慢是因为 Java 和机器指令之间隔了一层 C/C++，而 GCC 之类的编译器又不能做到绝对的智能编译，其产生的机器码效率就不是很高。因此我们只要跳过 C/C++ 这个层次，直接将 Java 字节码和本地机器码进行一个对应就可以了。

因此 HotSpot 的工程师们废弃了早期的解释执行器，而采用了模板执行器。所谓的模板就是将一个 Java 字节码通过人工手动的方式编写为固定模式的机器指令，这部分不在需要 GCC 的帮助。这样就可以大大减少最终需要执行的机器指令，所以才能提高效率。

在 OpenJDK12 源码中，JVM 所有的解释器都在 src/hotspot/share/interpreter 目录下，templateInterpreter.cpp 就是模板解释器的代码位置。分析这里的 initialize 方法，我们可以在 templateTable.cpp 中找到和 synchronized 相关的两个指令（monitorenter、monitorexit）的实现方式。当然这里面还有其他我们熟悉的指令，比如 invokedynamic、newarray 等指令。

monitorenter 执行逻辑

这里倒数第二个参数的 monitorenter 函数和 monitorexit 函数是对应字节码的机器码模板的位置。这里我们看下 monitorenter 的实现。因为机器码的实现和 CPU 相关，这里我们看下 x86 的实现（templateTable_x86.cpp）。当然也可以在 src/hotspot/cpu 下看到其他的实现，比如 PPC、ARM、S390等。

void InterpreterMacroAssembler::lock_object(Register lock_reg) {

// 如果使用重量级锁，则直接进入 monitorenter 执行if(UseHeavyMonitors) { call_VM(noreg,CAST_FROM_FN_PTR(address, InterpreterRuntime::monitorenter),lock_reg);} else{ …

// 对象指针存入 obj_regmovptr(obj_reg, Address(lock_reg, obj_offset));

展开全文

// 关于偏向锁的处理if(UseBiasedLocking) { // lock_reg : 存储指向 BasicObjectLock 的指针// obj_reg : 存储锁对象的指针// slow_case : 标记，类似于 goto, 这里指的是 InterpreterRuntime::monitorenter// done: 标记，标志着获取锁成功。// slow_case 和 done 也被传入，这样在 biased_locking_enter 中，就可以根据情况跳到这两处了。biased_locking_enter(lock_reg, obj_reg, swap_reg, tmp_reg, false, done, &slow_case); }…

// slow_case逻辑,需要进入 InterpreterRuntime::monitorenter 中获取锁。bind(slow_case);// 为 slow_case 调用运行时方法call_VM(noreg,CAST_FROM_FN_PTR(address, InterpreterRuntime::monitorenter),lock_reg);

// 这里的 done 和上面传入到偏向锁的 done 是一样的。直接跳到这表明获取锁成功，接下来就会返回进行字节码的执行了。bind(done);}}

从代码可以看出，如果启用了重量级锁，那么就直接走重量级锁的逻辑（monitorenter）；不然会先处理偏向锁的逻辑，然后不满足会再回到 monitorenter 中。

偏向锁：-XX:+UseBiasedLocking，

JDK1.6 之后默认启用重量级锁：-XX:+UseHeavyMonitors

偏向锁：-XX:+UseBiasedLocking，

JDK1.6 之后默认启用重量级锁：-XX:+UseHeavyMonitors

偏向锁、轻量级锁以及重量级锁

我们提到了重量级锁和偏向锁，这两个是什么意思呢？

我们都知道 Java 的线程是映射到操作系统的原生线程之上的。无论是是阻塞还是唤醒一个线程，都需要操作系统的帮助，这就需要从用户态转换到核心态中。而很多人说 synchronized 慢也正是由于这个原因。之前的文章也说过 synchronized 实际上是通过操作系统的互斥量来实现的，而这也被称为重量级锁。

相对于重量级锁，还有一个叫做轻量级锁。它的加锁不是通过操作系统来实现的，而是通过 CAS 配合 Mark Word 一起实现的，后面我会通过源码来展示它的实现方式。

而偏向锁相对于轻量级锁更加轻量，这里的偏向指的是偏向某一个线程。如果只有一个线程来获取锁，那么锁对象就会偏向这个线程，如果在接下来的执行过程中，该锁没有被其他的线程获取，则持有偏向锁的线程将永远不需要再进行同步。

接下来，我们沿着源码从 偏向锁 -> 轻量级锁 -> 重量级锁 这样来分析 JVM 是如何进行优化的。

内存布局

在分析锁实现之前，你可能要先去看看上一篇文章，看看对象在内存中的布局。这里我贴一张图让你再重温下。

锁状态转化及对象 Mark Word 的关系

实际上，锁的优化逻辑在 JDK 中的 Wiki 中已经有一个提纲挈领的图了。这里我先贴出来，后面的代码分析也会跟着这张图走。

偏向锁

偏向锁的启动

偏向锁会在虚拟机启动后的4秒之后才会生效，我们可以从 hotspot/share/runtime/biasedLocking.cpp 看到这样的设定。

// 上面的 task 最终会调用这个方法，将锁对象的类的 mark word 的后三位设置为 101staticvoidenable_biased_locking(InstanceKlass* k){ k->set_prototype_header(markOopDesc::biased_locking_prototype);}

BiasedLockingStartupDelay 默认时间是4000毫秒，所以会在启动4秒之后启动一个定时任务来设置开启偏向锁的设定。

我们可以通过 -XX:BiasedLockingStartupDelay=0 来设置马上启动偏向锁。这里也填了上一篇的一个坑。

java -XX:+PrintFlagsFinal | grep BiasedLockingStartupDelay

java -XX:+PrintFlagsFinal | grep BiasedLockingStartupDelay

定时任务会调用 enable_biased_locking 方法，将锁对象的类的 Mark Word 的后三个字节设置为101。 锁对象类的 Mark Word 被称为 prototype_header，记住这个下面分析偏向锁的时候会用到。

上面 Java 代码中锁对象是 obj，其所属类型是 MyObject（obj 是 MyObject 的一个实例）。而 prototype header 实际上就是 MyObject 的 Mark Word。

偏向锁申请

biased_locking_enter 方法比较长，所以我们一段一段来分析。以下代码片段均来自于 hotspot/cpu/x86/macroAssembler_x86.cpp::biased_locking_enter 中。

1. 首先判断 Mark Word 中的后三位（是否偏向锁+锁标志位）的值是否为5，即是否为偏向锁状态。如果是则执行后面 fast_enter 的逻辑，如果不是则执行第2步。

// … 省略部分代码 …

Label cas_label;int null_check_offset = -1;

// 如果 swap_reg 中没存 mark_addr，那么就先将 mark_addr 存入 swap_reg 中if(!swap_reg_contains_mark) { null_check_offset = offset;movptr(swap_reg, mark_addr);}// 将对象的 mark_addr，即 markOop 指针移入 tmp_reg 中movptr(tmp_reg, swap_reg);

// 将 tmp_reg 和 biased_lock_mask_in_place(111) 进行与操作,// 取出 markOop 中后三位，即(是否偏向锁+锁标志位)andptr(tmp_reg, markOopDesc::biased_lock_mask_in_place);

// 查看 Mark Word 后三位是否为5(biased_lock_pattern 为5, 即101）,// 如果不相等，则表明不为偏向锁状态,跳往 cas_label. 否则即为偏向锁状态cmpptr(tmp_reg, markOopDesc::biased_lock_pattern);jcc(Assembler::notEqual, cas_label);

2. 判断锁对象 Mark Word 中是否包含当前线程地址，最后三位标志位是否相同，且 epoch 值和类的 epoch 值是否相等？如果都相同，那么当前线程持有该偏向锁，可以直接返回。不然执行第3步。

// 将当前线程地址和类的的 prototype_header 相或,// 这样得到的结果为// (当前线程 id + prototype_header 中的 (epoch + 分代年龄 + 偏向锁标志 + 锁标志位))orptr(tmp_reg, r15_thread);

// 将上面计算得到的结果与锁对象的 markOop 进行异或,// 得到一个结果 diff (相等的位被置为0)xorptr(tmp_reg, swap_reg);Register header_reg = tmp_reg;

// 将 header_reg 中除了分代年龄之外的其他位取了出来，// 即将上面异或得到的结果中分代年龄给忽略掉。andptr(header_reg, ~((int) markOopDesc::age_mask_in_place));

// 如果除了分代年龄，对象的 markOop 和 (当前线程地址+其他位)相等，// 那么上面与操作的结果应该为 0.// 表明对象之前已经偏向当前线程, 那么跳到 done 处，执行同步代码块中的代码,// 否则表明当前线程还不是偏向锁的持有者，会接着往下走.jcc(Assembler::equal, done);

需要注意的是这里会得到一个异或结果 header_reg，会在后面的步骤中使用到。

3. 判断类对象是否支持偏向锁。如果不支持，则跳转到第6步执行移除偏向锁的逻辑。如果支持则跳转到第4步执行。

header_reg 中存储的是 (当前线程 id + prototype_header 中的 (epoch + 分代年龄 + 偏向锁标志 + 锁标志位))和锁对象 Mark Word 异或的结果。我们要查看后三位 (biased_lock_mask_in_place 的值是111)的结果是否为0？如果不为0，表示之前异或时锁对象的 Mark Word 后三位和对象所属类的后三位不一致，所以对象所属类不再支持偏向锁，此时需要跳转到 try_revoke_bias 进行移除偏向锁操作。

这个 testptr 的实现实际上是获取第一个参数多少位的值。多少位是根据第二个参数的二进制长度来决定的。

这个 testptr 的实现实际上是获取第一个参数多少位的值。多少位是根据第二个参数的二进制长度来决定的。

执行到这里，表示锁对象以及类对象都支持偏向锁，但是并不是偏向的当前线程。所以，接下来会判断异或结果中的 epoch 是否为0？如果为0，则跳转到第5步执行；如果不为0，则证明锁过期了，跳转到第7步执行重新偏向逻辑。

5. 表明锁对象还未偏向任何线程，则可以尝试去获取锁，使得对象偏向当前线程。

// 将其他位移动至 tmp_regmovptr(tmp_reg, swap_reg);

// 将其他位和当前线程进行或，构造成一个新的完整的 Mark Word, 存入 tmp_reg 中.// 新的 Mark Word 因为保存了当前线程地址，所以会偏向当前线程.orptr(tmp_reg, r15_thread);

// 尝试利用 CAS 操作将新构成的 Mark Word 存入锁对象的 mark_addr(Mark Word)，// 如果设置成功，则获取偏向锁成功. cmpxchgptr 操作会强制将 rax寄存器（swap_reg）中内容作为老数据，// 与第二个参数，在这里即 mark_addr 处的内容进行比较。// 如果相等，则将第一个参数的内容，即 tmp_reg 中的新数据，存入 mark_addrcmpxchgptr(tmp_reg, mark_addr); // 比较 tmp_reg 和 swap_reg

// 上面 CAS 操作失败的情况下，表明对象头中的 markOop 数据已经被篡改，即有其他线程已经获取到偏向锁.// 因为偏向锁不容许多个线程访问同一个锁对象，所以需要跳到 slow_case(InterpreterRuntime::monitorenter)处，去撤销该对象的偏向锁，并进行锁升级。if(slow_case != NULL) { jcc(Assembler::notZero, *slow_case);}

// 上面 CAS 成功的情况下，直接就跳往 done 处，回去执行方法的字节码了.jmp(done);

6. try_revoke_bias 使用 CAS 操作，重置 Mark Word。撤销偏向锁后后续所有操作都走轻量级锁的加锁过程。try_revoke_bias 和 try_rebias 的代码定义也在 biased_locking_enter 中。

// 类的 prototype_header 中已经支持偏向锁的位了，即这个类的所有对象都不再支持偏向锁了.// 但是当前对象仍为偏向锁状态，所以我们需要重置下当前对象的 markOop 为无锁态.// 将锁对象所属类的 prototype_header送入 tmp_reg.load_prototype_header(tmp_reg, obj_reg);

// 尝试用 CAS 操作，使对象的 markOop 重置为无锁态.// 这里是否失败无所谓，即使失败了，也表明其他线程已经移除了对象的偏向锁标志.cmpxchgptr(tmp_reg, mark_addr);

7. try_rebias 就是将使得锁对象重新偏向当前线程，如果失败则走 slow_case(InterpreterRuntime::monitorenter) 进行偏向锁撤销逻辑。

// 将锁对象所属类的 prototype_header 送入 tmp_regload_prototype_header(tmp_reg, obj_reg);

// 将当前线程地址和类的的 prototype header(Mark Word) 相或，这样得到的结果为// (当前线程 id + prototype_header 中的 (epoch + 分代年龄 + 偏向锁标志 + 锁标志位))orptr(tmp_reg, r15_thread);

// 尝试用 CAS 操作，成功表示重偏向加锁成功cmpxchgptr(tmp_reg, mark_addr);

// 如果 CAS 失败，则表明 Mark Word 已经被其他线程更改，// 需要跳往 slow_case 进行撤销偏向锁，否则跳往 done 处，执行字节码.if(slow_case != NULL) { jcc(Assembler::notZero, *slow_case);}

jmp(done);

偏向锁的撤销

slow_case（偏向锁的撤销）的逻辑是在 InterpreterRuntime::monitorenter 中。

void ObjectSynchronizer::fast_enter(Handle obj, BasicLock* lock,bool attempt_rebias, TRAPS) {if(UseBiasedLocking) { if(!SafepointSynchronize::is_at_safepoint) { BiasedLocking::Condition cond = BiasedLocking::revoke_and_rebias(obj, attempt_rebias, THREAD);if(cond == BiasedLocking::BIAS_REVOKED_AND_REBIASED) { return; }} else{ assert(!attempt_rebias, “can not rebias toward VM thread”); // 移除偏向锁BiasedLocking::revoke_at_safepoint(obj);}assert(!obj->mark->has_bias_pattern, “biases should be revoked by now”); }

slow_enter(obj, lock, THREAD);}

BiasedLocking::revoke_and_rebias 也会再重试下看能否使用偏向锁，逻辑基本和上面分析的一致。你要是看了这里面的代码你还会发现如果你调用了 System.identityHashCode 是会移除偏向锁的。

由于偏向锁的移除需要在全局安全点的时候执行，所以如果当有大量线程竞争同一个锁资源时，我们可以通过关闭偏向锁来调优系统性能。

接下来，我们来看 revoke_at_safepoint 会做哪些事情。

1. update_heuristics 方法会将类对象上 revoke 次数加1。

// 如果 revoke 次数等于 BiasedLockingBulkRevokeThreshold (默认40)if(revocation_count == BiasedLockingBulkRevokeThreshold) { returnHR_BULK_REVOKE; }

// 如果 revoke 次数等于 BiasedLockingBulkRebiasThreshold(默认20)if(revocation_count == BiasedLockingBulkRebiasThreshold) { returnHR_BULK_REBIAS; }

returnHR_SINGLE_REVOKE;

2. 如果撤销次数等于 BiasedLockingBulkRebiasThreshold (默认20)，则认为类对象还可以重偏向，因此要做以下操作（bulk rebias）。

// 将类对象的 prototype_header 中的 epoch 值加1klass->set_prototype_header(klass->prototype_header->incr_bias_epoch);int cur_epoch = klass->prototype_header->bias_epoch;

// 遍历所有线程的栈，找到所有类对象的实例，将它们 Mark Word 中的 epoch 值加1for(; JavaThread *thr = jtiwh.next; ) { GrowableArray<MonitorInfo*>* cached_monitor_info = get_or_compute_monitor_info(thr);for(int i = 0; i < cached_monitor_info->length; i++) { MonitorInfo* mon_info = cached_monitor_info->at(i);oop owner = mon_info->owner;markOop mark = owner->mark;if((owner->klass == k_o) && mark->has_bias_pattern) { assert(mark->bias_epoch == prev_epoch || mark->bias_epoch == cur_epoch, “error in bias epoch adjustment”); owner->set_mark(mark->set_bias_epoch(cur_epoch));}}}}

// 到此位置，已经完成调给定对象地 header 以调用其偏向锁revoke_bias(o, attempt_rebias_of_object && klass->prototype_header->has_bias_pattern, true, requesting_thread, NULL);

在 bulk rebias 过程中，首先会将类对象的 epoch 值加1，然后遍历所有线程的栈。找到所有该类对象的实例，将它们的 epoch 值加1。最后会移除掉锁对象的偏向信息。

如果想查看 bulk revoke bias 的过程以及结果，你可以使用这个回答

3. 如果类对象的撤销次数等于 BiasedLockingBulkRevokeThreshold，则认为类对象不合适使用偏向锁。因此要做 bulk revoke代码和上面的类似，我就不贴出来了。主要做下面两件事情：

将类对象的 prototype header 设置为不可偏向状态；
遍历所有线程的栈,找到所有类的实例，修改 Mark word 的状态位为001以及对应的 Lock Record 并将偏向锁修改为轻量级锁。

轻量级锁

轻量级锁的代码实现是在 slow_enter 方法里面。

// 省略其他代码。。。

// 判断是否是无锁状态if(mark->is_neutral) {

// 直接把 mark 保存到 BasicLock 对象的 _displaced_header 字段lock->set_displaced_header(mark);// 通过 CAS 将 mark word 更新为指向 BasicLock 对象的指针，更新成功表示获得了轻量级锁if(mark == obj->cas_set_mark((markOop) lock, mark)) { return; }}

…}

classBasicLock{ privatevolatile markOop _displaced_header; }

首先判断 Mark Word 是否是中立的，即 Mark Word 的最后三个字节的值是否为1(001)。如果是中立的，则表示此时处于未锁定且不可偏向。

因此，首先会将锁对象的 Mark Word 放入到 lock 对象（这就是我们常说的 Lock Record）的 displaced_header 属性中，然后使用 CAS 将对象的 Mark Word 更新为指向 Lock Record 的指针。如果更新成功，表示这个线程就拥有了该对象的锁并且 Mark Word 的锁标志位（Mark Word 的最后2bit）将转变为00，即表示此对象处于轻量级锁定状态。

重量级锁

如果 CAS 更新失败，就会膨胀称为重量级锁了。锁标志的状态值也变成10，Mark Word 中存储的就是指向重量级锁的指针，后面等待锁的线程也要进入阻塞状态。

inflate 主要是一些状态的判断，看注释还是比较容易理解的。我们重点看下 enter 函数中的执行逻辑。

在重量级锁的判定中，不会马上去申请锁。而是会先自适应自旋几次看能否获取到锁，如果不能再去申请锁。

自适应的自旋锁会由前一次在同一个锁上的自旋时间，以及锁的拥有者状态来决定。如果同一个锁上自旋刚获得，那么就认为这次也有很大几率获取到就多自旋几次。如果对于某个锁说自旋很少获取到，就认为没戏，不自旋直接去挂起了。

自适应的自旋锁会由前一次在同一个锁上的自旋时间，以及锁的拥有者状态来决定。如果同一个锁上自旋刚获得，那么就认为这次也有很大几率获取到就多自旋几次。如果对于某个锁说自旋很少获取到，就认为没戏，不自旋直接去挂起了。

然后，再去申请锁之前还要自旋（贼心不死），最后没成功才会 park 当前线程。而 park 的实现就是我们之前文章提到过的 pthread 的实现。

自旋状态还带来另外一个副作用，那便是不公平的锁机制。处于阻塞状态的线程，并没有办法立刻竞争被释放的锁。然而，处于自旋状态的线程则很有可能优先获得这把锁。

当线程获取到重量级锁之后，就可以执行方法了。但是，即使锁被释放之后也不会被恢复到最初的那种无锁状态了。

好消息和坏消息

我们可以看到偏向锁非常之负责，为了支持偏向锁整个代码复杂度大幅度提升，而许多受益于偏向锁的应用程序都是早期 Java 集合 API，比如 HashTable、Vector 等。

所以好消息是，在 JDK15 就把偏向锁禁用了并在以后删除它。坏消息是，现在大部分应用使用的都是 JDK8 并且还会使用很多年。

巨人的肩膀

Java synchronized 中的 while 和 notifyAll

Java 并发编程：Synchronized 及其实现原理

死磕 Java 并发：深入分析 synchronized 的实现原理

责任编辑：

Thenews.cc

每日头条

时事新闻兴趣百科

看了synchronized源码，请别和我说它慢