Dubbo使用异步化后出现线程上下文丢失的性能排障与优化方案 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Dubbo 异步化后线程上下文丢失的性能排障与优化方案

大家好，今天我们来聊聊 Dubbo 异步化后线程上下文丢失的问题，以及如何排障和优化。Dubbo 异步化能显著提升系统吞吐量，但引入异步后，原本简单的同步调用链路被打破，线程上下文的传递变得复杂，很容易出现上下文丢失，导致各种诡异的 Bug 和性能问题。

1. 异步化带来的挑战

Dubbo 异步化本质是将调用从主线程卸载到另一个线程执行，这带来了几个关键挑战：

线程切换： 请求的处理线程不再是最初接收请求的线程，这会导致线程上下文的传递问题。
上下文传递： 原本在主线程中存在的 ThreadLocal 变量、MDC 日志上下文等，在异步线程中可能无法访问。
追踪困难： 异步调用链的追踪变得困难，难以定位问题根源。
异常处理： 异步调用的异常需要在合适的线程中捕获和处理，否则可能丢失或被忽略。

2. 常见的线程上下文丢失场景

以下是一些常见的 Dubbo 异步化后线程上下文丢失的场景：

ThreadLocal 变量丢失： 依赖 ThreadLocal 存储用户身份、配置信息等，异步线程无法访问。
MDC 日志上下文丢失： 无法在异步线程中正确打印日志，导致日志追踪困难。
Spring Security 上下文丢失： 异步线程无法访问 Spring Security 的认证信息，导致权限校验失败。
事务上下文丢失： 分布式事务需要在多个服务之间传递事务上下文，异步调用可能导致事务失效。
自定义上下文信息丢失： 应用自定义的上下文信息，如链路追踪 ID，在异步线程中无法获取。

3. 排障方法：如何定位线程上下文丢失的问题

在解决问题之前，首先要能够定位问题。以下是一些常用的排障方法：

日志分析： 仔细检查日志，特别是异步调用相关的日志，看是否有上下文信息丢失的迹象。比如，MDC 信息是否缺失，请求 ID 是否一致等。
链路追踪： 使用 SkyWalking、Jaeger 等链路追踪工具，可以清晰地看到异步调用的整个链路，更容易发现上下文丢失的位置。
线程Dump分析： 通过 jstack 命令获取线程 Dump，查看异步线程的堆栈信息，看是否有异常发生，以及线程上下文是否正确传递。
代码审查： 仔细审查异步调用的代码，看是否有遗漏的上下文传递逻辑。
单元测试： 编写单元测试，模拟异步调用场景，验证上下文传递是否正确。

案例: 假设用户反馈在异步处理订单时，出现了权限校验失败的情况。

日志分析： 检查订单处理相关的日志，发现异步线程中的用户 ID 为 null。
链路追踪： 查看订单处理链路，发现用户 ID 在异步调用之前就已经丢失。
代码审查： 审查订单处理的代码，发现异步调用时没有传递用户身份信息。

4. 解决线程上下文丢失的方案

针对不同的上下文丢失场景，需要采用不同的解决方案。以下是一些常用的解决方案：

4.1 TransmittableThreadLocal (TTL)

TTL 是阿里巴巴开源的一个库，专门用于解决线程上下文传递问题。它通过在线程池提交任务时，将父线程的 ThreadLocal 变量复制到子线程中，从而保证了上下文的传递。

使用方法：

引入 TTL 的 Maven 依赖：

<dependency>
    <groupId>com.alibaba</groupId>
    <artifactId>transmittable-thread-local</artifactId>
    <version>2.14.2</version>
</dependency>

将普通的 ThreadLocal 替换为 TransmittableThreadLocal：

// 原来的 ThreadLocal
// private static final ThreadLocal<String> userId = new ThreadLocal<>();

// 使用 TransmittableThreadLocal
private static final TransmittableThreadLocal<String> userId = new TransmittableThreadLocal<>();

在线程池提交任务时，使用 TtlRunnable 或 TtlCallable 包装任务：

ExecutorService executorService = Executors.newFixedThreadPool(10);

// 使用 TtlRunnable 包装 Runnable
Runnable task = TtlRunnable.get(() -> {
    String currentUserId = userId.get();
    System.out.println("Current user id: " + currentUserId);
});

executorService.submit(task);

// 使用 TtlCallable 包装 Callable
Callable<String> callableTask = TtlCallable.get(() -> {
    String currentUserId = userId.get();
    System.out.println("Current user id: " + currentUserId);
    return "success";
});

Future<String> future = executorService.submit(callableTask);

代码示例：

import com.alibaba.ttl.TransmittableThreadLocal;
import com.alibaba.ttl.TtlRunnable;

import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class TtlExample {

    private static final TransmittableThreadLocal<String> userId = new TransmittableThreadLocal<>();

    public static void main(String[] args) throws InterruptedException {
        ExecutorService executorService = Executors.newFixedThreadPool(1);

        userId.set("123");

        Runnable task = TtlRunnable.get(() -> {
            String currentUserId = userId.get();
            System.out.println("Current user id in async thread: " + currentUserId); // 输出：Current user id in async thread: 123
        });

        executorService.submit(task);

        Thread.sleep(100);
        executorService.shutdown();

        // 验证父线程的 ThreadLocal 值是否被修改
        System.out.println("Current user id in main thread: " + userId.get()); // 输出：Current user id in main thread: 123
    }
}

原理：

TTL 的核心原理是在线程池提交任务时，通过 TtlRunnable 和 TtlCallable 包装任务，在任务执行前，将父线程的 ThreadLocal 变量复制到子线程中。任务执行完毕后，再将子线程的 ThreadLocal 变量还原到父线程中，从而保证了上下文的传递，并且避免了 ThreadLocal 变量的污染。

优点：

使用简单，只需替换 ThreadLocal 并包装任务。
对现有代码的侵入性小。
支持多种线程池类型。

缺点：

需要引入额外的依赖。
对于复杂的上下文传递场景，可能需要手动处理。

4.2 MDC (Mapped Diagnostic Context)

MDC 是 Logback 和 Log4j 等日志框架提供的一种机制，用于在日志中添加上下文信息，方便日志的追踪和分析。

使用方法：

在主线程中，将需要传递的上下文信息放入 MDC 中：

import org.slf4j.MDC;

public class MainThread {
    public void processRequest(String requestId) {
        MDC.put("requestId", requestId);
        // ... 其他业务逻辑
    }
}

在异步线程中，从 MDC 中获取上下文信息：

import org.slf4j.MDC;

public class AsyncThread implements Runnable {
    @Override
    public void run() {
        String requestId = MDC.get("requestId");
        System.out.println("Request id in async thread: " + requestId);
    }
}

在日志配置文件中，配置 MDC 信息的输出格式：

<configuration>
    <appender name="STDOUT" class="ch.qos.logback.core.ConsoleAppender">
        <encoder>
            <pattern>%d{HH:mm:ss.SSS} [%thread] %-5level %logger{36} - %msg [%X{requestId}]%n</pattern>
        </encoder>
    </appender>

    <root level="info">
        <appender-ref ref="STDOUT" />
    </root>
</configuration>

代码示例：

import org.slf4j.MDC;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class MdcExample {

    public static void main(String[] args) throws InterruptedException {
        ExecutorService executorService = Executors.newFixedThreadPool(1);

        MDC.put("requestId", "12345");

        Runnable task = () -> {
            String requestId = MDC.get("requestId");
            System.out.println("Request id in async thread: " + requestId); // 输出：Request id in async thread: 12345
            MDC.remove("requestId"); // 移除 MDC，避免污染
        };

        executorService.submit(task);

        Thread.sleep(100);
        executorService.shutdown();

        MDC.remove("requestId"); // 移除 MDC，避免污染
    }
}

原理：

MDC 本质是一个 ThreadLocal Map，用于存储上下文信息。在主线程中，将上下文信息放入 MDC 中，然后在异步线程中，从 MDC 中获取上下文信息。

优点：

使用简单，只需在代码中添加 MDC 的操作。
与日志框架集成，方便日志的追踪和分析。

缺点：

需要手动管理 MDC 的生命周期，避免内存泄漏。
只能传递字符串类型的上下文信息。
需要确保异步线程能访问到 MDC，例如通过 InheritableThreadLocal 或 TTL。

4.3 手动传递上下文

对于一些简单的上下文信息，可以直接手动传递。例如，将用户 ID 作为参数传递给异步方法。

代码示例：

public class OrderService {

    public void processOrderAsync(String orderId, String userId) {
        // ... 其他业务逻辑
        asyncProcess(orderId, userId);
    }

    private void asyncProcess(String orderId, String userId) {
        // ... 异步处理订单
        System.out.println("Processing order " + orderId + " for user " + userId);
    }
}

优点：

简单直接，易于理解。
不需要引入额外的依赖。

缺点：

需要修改方法签名，增加参数。
对于复杂的上下文信息，传递起来比较麻烦。
容易遗漏上下文信息。

4.4 Dubbo Filter

Dubbo Filter 是一种拦截器，可以在 Dubbo 调用前后执行自定义的逻辑。可以利用 Dubbo Filter 来传递上下文信息。

使用方法：

编写 Dubbo Filter，在 Filter 中获取上下文信息，并将其放入 Dubbo 的 Invocation 上下文中：

import org.apache.dubbo.common.constants.CommonConstants;
import org.apache.dubbo.common.extension.Activate;
import org.apache.dubbo.rpc.*;
import org.slf4j.MDC;

@Activate(group = {CommonConstants.PROVIDER, CommonConstants.CONSUMER})
public class ContextTransferFilter implements Filter {

    @Override
    public Result invoke(Invoker<?> invoker, Invocation invocation) throws RpcException {
        // Provider 端：从 MDC 中获取上下文信息，并将其放入 Invocation 上下文中
        if (RpcContext.getContext().isProviderSide()) {
            String requestId = MDC.get("requestId");
            if (requestId != null) {
                invocation.setAttachment("requestId", requestId);
            }
        }

        // Consumer 端：从 Invocation 上下文中获取上下文信息，并将其放入 MDC 中
        if (RpcContext.getContext().isConsumerSide()) {
            String requestId = invocation.getAttachment("requestId");
            if (requestId != null) {
                MDC.put("requestId", requestId);
            }
        }

        try {
            return invoker.invoke(invocation);
        } finally {
            // 清理 MDC，避免污染
            if (RpcContext.getContext().isConsumerSide()) {
                MDC.remove("requestId");
            }
        }
    }
}

在 Dubbo 的配置文件中，配置 Filter：

<dubbo:provider filter="contextTransferFilter"/>
<dubbo:consumer filter="contextTransferFilter"/>

原理：

Dubbo Filter 在 Dubbo 调用前后执行，可以拦截 Dubbo 的请求和响应。通过在 Filter 中获取上下文信息，并将其放入 Dubbo 的 Invocation 上下文中，可以实现上下文的传递。

优点：

对现有代码的侵入性小。
可以传递任意类型的上下文信息。
可以灵活地控制上下文传递的时机和范围。

缺点：

需要编写 Dubbo Filter。
需要了解 Dubbo 的 Filter 机制。

4.5 其他方案

InheritableThreadLocal： InheritableThreadLocal 是 Java 提供的一种 ThreadLocal 变量，它可以在父子线程之间传递上下文信息。但是，InheritableThreadLocal 只能传递一次，而且可能会导致内存泄漏。
Spring Cloud Sleuth： Spring Cloud Sleuth 是一种链路追踪工具，它可以自动传递上下文信息，无需手动处理。但是，Spring Cloud Sleuth 只能用于 Spring Cloud 项目。

5. 优化方案：提升异步化的性能

除了解决线程上下文丢失的问题，还需要关注异步化的性能。以下是一些优化方案：

选择合适的线程池： 不同的线程池适用于不同的场景。例如，CPU 密集型任务适合使用固定大小的线程池，IO 密集型任务适合使用可伸缩的线程池。
控制线程池的大小： 线程池的大小需要根据系统的负载和资源情况进行调整。过大的线程池会浪费资源，过小的线程池会导致请求排队。
使用异步编程模型： 使用 CompletableFuture、RxJava 等异步编程模型，可以更好地利用多核 CPU，提高系统的吞吐量。
避免阻塞操作： 在异步线程中，尽量避免阻塞操作，例如 IO 操作、锁等待等。可以使用非阻塞 IO、异步锁等技术来提高性能。
监控和调优： 对异步化的系统进行监控和调优，及时发现和解决性能问题。

方案	适用场景	优点	缺点
TTL	解决 ThreadLocal 上下文丢失	使用简单，侵入性小，支持多种线程池类型	需要引入额外的依赖，对于复杂的上下文传递场景，可能需要手动处理
MDC	解决日志上下文丢失	使用简单，与日志框架集成，方便日志的追踪和分析	需要手动管理 MDC 的生命周期，只能传递字符串类型的上下文信息，需要确保异步线程能访问到 MDC
手动传递上下文	简单的上下文信息	简单直接，易于理解，不需要引入额外的依赖	需要修改方法签名，增加参数，对于复杂的上下文信息，传递起来比较麻烦，容易遗漏上下文信息
Dubbo Filter	复杂的上下文信息，需要灵活控制上下文传递的时机和范围	对现有代码的侵入性小，可以传递任意类型的上下文信息，可以灵活地控制上下文传递的时机和范围	需要编写 Dubbo Filter，需要了解 Dubbo 的 Filter 机制
线程池调优	提升异步处理性能	根据任务类型选择合适的线程池，合理控制线程池大小，充分利用多核 CPU	需要根据实际情况进行调整，可能需要进行性能测试
异步编程模型	提升异步处理性能，避免阻塞操作	更好地利用多核 CPU，提高系统的吞吐量，避免阻塞操作	学习成本较高，需要修改代码结构
链路追踪（SkyWalking等）	全链路性能监控，定位性能瓶颈，排查上下文丢失问题	可以清晰地看到异步调用的整个链路，更容易发现上下文丢失的位置，方便性能分析和问题定位	需要引入额外的依赖，对系统有一定的性能影响

6. 代码示例：整合 TTL 和 MDC

以下是一个整合 TTL 和 MDC 的代码示例：

import com.alibaba.ttl.TransmittableThreadLocal;
import com.alibaba.ttl.TtlRunnable;
import org.slf4j.MDC;

import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class TtlMdcExample {

    private static final TransmittableThreadLocal<String> userId = new TransmittableThreadLocal<>();

    public static void main(String[] args) throws InterruptedException {
        ExecutorService executorService = Executors.newFixedThreadPool(1);

        userId.set("123");
        MDC.put("requestId", "12345");

        Runnable task = TtlRunnable.get(() -> {
            String currentUserId = userId.get();
            String requestId = MDC.get("requestId");

            System.out.println("Current user id in async thread: " + currentUserId); // 输出：Current user id in async thread: 123
            System.out.println("Request id in async thread: " + requestId); // 输出：Request id in async thread: 12345

            MDC.remove("requestId"); // 移除 MDC，避免污染
        });

        executorService.submit(task);

        Thread.sleep(100);
        executorService.shutdown();

        MDC.remove("requestId"); // 移除 MDC，避免污染
    }
}

7. 记住这些要点

Dubbo 异步化带来的线程上下文丢失问题是性能优化的常见挑战。通过 TTL、MDC、Dubbo Filter 等方案可以解决大部分上下文传递问题，并要始终关注线程池的配置和监控，选择合适的异步编程模型，才能实现高性能的异步化系统。

Dubbo 异步化后线程上下文丢失的性能排障与优化方案

1. 异步化带来的挑战

2. 常见的线程上下文丢失场景

3. 排障方法：如何定位线程上下文丢失的问题

4. 解决线程上下文丢失的方案

4.1 TransmittableThreadLocal (TTL)

4.2 MDC (Mapped Diagnostic Context)

4.3 手动传递上下文

4.4 Dubbo Filter

4.5 其他方案

5. 优化方案：提升异步化的性能

6. 代码示例：整合 TTL 和 MDC

7. 记住这些要点

发表回复 取消回复

发表回复取消回复