JVM Code Cache刷新策略分层编译阈值再平衡：TieredCompilation与CompileThreshold - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

JVM Code Cache 刷新策略、分层编译阈值再平衡：TieredCompilation 与 CompileThreshold

大家好，今天我们来深入探讨 JVM 中的 Code Cache 刷新策略，以及分层编译中与 CompileThreshold 相关的再平衡机制。这部分内容对于理解 JVM 性能优化至关重要，尤其是在处理长时间运行的应用时。

1. Code Cache 的作用与挑战

首先，我们需要明确 Code Cache 的作用。Code Cache 是 JVM 用于存储 JIT (Just-In-Time) 编译后的本地机器码的区域。当 JVM 执行 Java 代码时，解释器会逐步执行字节码。然而，对于频繁执行的热点代码，JIT 编译器会将其编译成更高效的本地机器码，并存储在 Code Cache 中。下次再执行相同的代码时，JVM 就可以直接从 Code Cache 中加载并执行，从而显著提高性能。

然而，Code Cache 的大小是有限的。随着应用运行时间的增长，越来越多的代码会被编译，Code Cache 可能会被填满。当 Code Cache 满了之后，JVM 就需要采取一些策略来释放空间，这就是 Code Cache 刷新。

Code Cache 刷新带来的问题：

性能下降： 如果频繁刷新的代码正好是热点代码，那么会导致性能抖动，因为每次都需要重新编译。
Stop-The-World (STW) 暂停： 一些 Code Cache 刷新策略可能会导致 STW 暂停，影响应用的响应时间。

因此，我们需要理解 JVM 的 Code Cache 刷新策略，并合理配置相关参数，以避免不必要的性能损失。

2. Code Cache 的结构

在深入 Code Cache 刷新策略之前，先了解 Code Cache 的结构有助于我们更好地理解相关概念。Code Cache 通常被划分为三个区域：

区域名称	描述
Non-Method	存储非方法相关的编译代码，例如：JNI 桩代码，锁膨胀代码等。
Profiled Methods	存储经过 profiling 的方法编译后的代码。Profiling 指的是 JVM 在运行时收集方法执行频率、分支预测等信息，以便 JIT 编译器更好地优化代码。
Non-Profiled Methods	存储未经过 profiling 的方法编译后的代码。这些方法通常是启动阶段或者执行频率较低的方法。

这种划分允许 JVM 更精细地管理 Code Cache，例如，可以优先清除 Non-Profiled Methods 区域的代码，因为它们对性能的影响相对较小。

3. Code Cache 刷新策略

JVM 提供多种 Code Cache 刷新策略，主要目标是在 Code Cache 满了之后，选择哪些代码进行清除。常见的策略包括：

无策略： JVM 不会主动清除 Code Cache 中的代码，直到 Code Cache 彻底满了，导致 OOM (OutOfMemoryError)。这种策略通常不推荐使用。
基于年龄的策略： JVM 维护一个代码年龄的概念，年龄越大的代码越早被清除。JVM 会记录代码上次被使用的时间，并根据这个时间计算代码的年龄。这种策略相对简单，但可能误删热点代码。
基于使用频率的策略： JVM 跟踪代码的使用频率，优先清除使用频率较低的代码。这种策略更加智能，可以更好地保留热点代码，但需要额外的开销来跟踪使用频率。
分层编译结合的策略： 这是最常用的策略，它与 JVM 的分层编译机制紧密相关。

我们重点关注分层编译结合的策略。

4. 分层编译 (TieredCompilation)

分层编译是 JVM 优化代码执行效率的核心技术之一。它将代码编译过程分为多个层次，不同的层次采用不同的编译器和优化策略。HotSpot JVM 默认开启分层编译（可以通过 -XX:-TieredCompilation 关闭）。

分层编译通常包括以下几个层次：

层次名称	编译器	优化程度	编译速度	描述
0 (Interpreter)	解释器	无	非常快	解释执行字节码。
1 (C1)	客户端编译器	基本优化	很快	也被称为 client compiler，主要关注编译速度，执行一些简单的优化，例如方法内联、消除冗余代码等。适用于 GUI 应用或者启动时间敏感的应用。
2				保留层，有些JVM版本可能使用，但通常不用。
3				保留层，有些JVM版本可能使用，但通常不用。
4 (C2)	服务端编译器	高级优化	相对较慢	也被称为 server compiler，主要关注编译质量，执行更复杂的优化，例如全局代码优化、循环展开等。适用于长时间运行的服务器端应用。

分层编译的工作原理：

解释执行： 最初，所有代码都由解释器执行。
Profiling： JVM 在解释执行的过程中，会收集代码的执行频率、分支预测等信息。
C1 编译： 当某些代码的执行频率达到 C1 编译的阈值时，JVM 会使用 C1 编译器将其编译成本地机器码，并存储在 Code Cache 中。
C2 编译： 随着代码执行时间的增长，JVM 会继续收集代码的 Profiling 信息。当某些代码的 Profiling 信息足够丰富，并且执行频率达到 C2 编译的阈值时，JVM 会使用 C2 编译器将其编译成本地机器码，并替换 Code Cache 中 C1 编译的代码。

通过分层编译，JVM 可以在启动阶段快速编译代码，保证应用的快速启动，同时在运行过程中逐渐优化代码，提高应用的整体性能。

分层编译与 Code Cache 刷新：

分层编译与 Code Cache 刷新策略紧密相关。当 Code Cache 满了之后，JVM 通常会优先清除 C1 编译的代码，因为 C2 编译的代码经过了更高级的优化，对性能的影响更大。此外，如果 C2 编译的代码长时间没有被使用，JVM 也可能会将其清除，以便为新的代码腾出空间。

5. CompileThreshold 与再平衡

CompileThreshold 是一个非常重要的参数，它控制着代码从解释执行到被 C1 编译，以及从 C1 编译到被 C2 编译的阈值。CompileThreshold 的值越高，代码需要执行的次数越多才能被编译，反之亦然。

CompileThreshold 的影响：

较高的 CompileThreshold： 可以减少编译次数，降低编译带来的开销，但可能会导致代码长时间运行在解释器或者 C1 编译的状态，影响性能。
较低的 CompileThreshold： 可以更快地将代码编译成更高效的本地机器码，提高性能，但会增加编译次数，消耗更多的 CPU 资源，并可能导致 Code Cache 更快地被填满。

再平衡 (Rebalancing)：

在分层编译过程中，JVM 会根据应用的实际运行情况，动态调整 CompileThreshold 的值，这就是再平衡。再平衡的目标是在编译开销和性能提升之间找到一个平衡点。

再平衡的触发条件：

Code Cache 使用率过高： 当 Code Cache 的使用率超过某个阈值时，JVM 可能会降低 CompileThreshold 的值，以便更快地将代码编译成更高效的本地机器码，从而提高性能，缓解 Code Cache 压力。
编译开销过高： 当编译开销超过某个阈值时，JVM 可能会提高 CompileThreshold 的值，以减少编译次数，降低编译带来的开销。
应用启动阶段： 在应用启动阶段，JVM 可能会暂时提高 CompileThreshold 的值，以减少编译次数，加快启动速度。

如何观察再平衡：

可以通过 JVM 的日志来观察再平衡的过程。需要开启相关的日志选项，例如：

-XX:+UnlockDiagnosticVMOptions -XX:+PrintCompilation -XX:+PrintCodeCache

在日志中，可以观察到 CompileThreshold 值的变化，以及编译事件的信息。

案例分析：

假设我们有一个长时间运行的服务器端应用，并且发现 Code Cache 经常被填满，导致性能抖动。我们可以尝试以下步骤来优化：

观察 Code Cache 使用情况： 通过 JConsole、VisualVM 等工具，或者通过 JVM 的日志，观察 Code Cache 的使用情况。如果发现 Code Cache 经常被填满，说明需要调整 Code Cache 的大小或者编译策略。
调整 Code Cache 大小： 可以通过 -XX:ReservedCodeCacheSize 参数来调整 Code Cache 的大小。适当增加 Code Cache 的大小可以缓解 Code Cache 压力。
调整 CompileThreshold： 可以尝试降低 CompileThreshold 的值，以便更快地将热点代码编译成更高效的本地机器码。但是，需要注意不要过度降低 CompileThreshold 的值，以免增加编译开销。可以使用 -XX:CompileThreshold=xxxx 来调整，具体的值需要根据实际情况测试。
观察再平衡情况： 开启 JVM 的日志，观察再平衡的过程，看 JVM 是否会自动调整 CompileThreshold 的值。
分析编译事件： 分析 JVM 的编译事件，看哪些代码被频繁编译，哪些代码被清除。如果发现某些热点代码被频繁清除，说明需要进一步优化编译策略。

代码示例：

虽然我们不能直接控制 JVM 的再平衡过程，但是可以通过调整 JVM 的参数来影响再平衡的结果。以下是一些常用的参数：

-XX:ReservedCodeCacheSize=256m：设置 Code Cache 的大小为 256MB。
-XX:InitialCodeCacheSize=32m：设置 Code Cache 的初始大小为 32MB。
-XX:CompileThreshold=10000：设置 C1 编译的阈值为 10000 次。
-XX:TieredStopAtLevel=1：设置分层编译停止的层级为 C1。这个参数可以用来禁用 C2 编译，适用于某些特定场景。

一个简单的示例代码，用于模拟热点代码：

public class HotspotExample {

    public static void main(String[] args) {
        long startTime = System.currentTimeMillis();
        for (int i = 0; i < 100000000; i++) {
            add(i, i + 1);
        }
        long endTime = System.currentTimeMillis();
        System.out.println("执行时间：" + (endTime - startTime) + "ms");
    }

    public static int add(int a, int b) {
        return a + b;
    }
}

这段代码会执行大量的加法运算，add 方法会成为热点代码，JVM 会对其进行编译优化。可以通过调整 CompileThreshold 的值，观察编译时间和执行时间的变化。

表格总结常用参数：

参数名称	描述	默认值
`-XX:ReservedCodeCacheSize`	Code Cache 的最大大小。	240MB (Java 8)；根据系统内存动态调整 (Java 9+)
`-XX:InitialCodeCacheSize`	Code Cache 的初始大小。	动态调整
`-XX:CompileThreshold`	方法被编译为 C1 编译代码的调用次数阈值。	10000
`-XX:TieredStopAtLevel`	分层编译停止的层级。	4 (完全分层编译)
`-XX:+PrintCompilation`	开启编译日志，可以观察到编译事件。	关闭
`-XX:+PrintCodeCache`	开启 Code Cache 日志，可以观察 Code Cache 的使用情况。	关闭
`-XX:+UseCodeCacheFlushing`	是否启用 Code Cache 刷新。	启用

6. 最佳实践与注意事项

监控 Code Cache 使用情况： 定期监控 Code Cache 的使用情况，及时发现问题。
合理配置 Code Cache 大小： 根据应用的实际情况，合理配置 Code Cache 的大小。
谨慎调整 CompileThreshold： 不要随意调整 CompileThreshold 的值，需要经过充分的测试才能确定最佳值。
关注 JVM 版本更新： 新版本的 JVM 可能会引入新的 Code Cache 刷新策略和优化算法，及时关注 JVM 版本更新，可以获得更好的性能。
理解应用的特性： 不同的应用有不同的特性，例如，启动时间敏感的应用应该优先考虑 C1 编译，长时间运行的应用应该优先考虑 C2 编译。

7. 总结

总而言之，JVM Code Cache 刷新策略和分层编译阈值再平衡是 JVM 性能优化的重要组成部分。理解这些概念，可以帮助我们更好地配置 JVM 参数，优化应用的性能，避免不必要的性能损失。理解 Code Cache 的作用、结构和刷新策略，以及分层编译的工作原理，可以帮助我们更好地理解 JVM 的性能优化机制，并根据应用的实际情况进行优化。调整 CompileThreshold 和 Code Cache 大小可以优化性能，但需要谨慎并根据实际测试结果决定。