Java异步编程进阶：CompletableFuture、ForkJoinPool与线程池调优

大家好，今天我们来深入探讨Java中的异步编程，主要聚焦于CompletableFuture、ForkJoinPool以及线程池的调优。异步编程在构建高并发、响应迅速的应用中至关重要。它能有效利用系统资源，避免线程阻塞，从而提升整体性能。

一、异步编程的基础概念回顾

在深入CompletableFuture之前，我们先简单回顾一下异步编程的核心概念：

同步与异步： 同步操作是指调用者发出调用后，必须等待被调用者完成才能继续执行。异步操作则不同，调用者发出调用后不必等待结果，可以继续执行后续代码，结果会在稍后通过某种机制通知调用者。
阻塞与非阻塞： 阻塞是指线程在等待某个资源或事件时被挂起，无法执行其他任务。非阻塞是指线程即使在资源不可用时也不会被挂起，而是立即返回一个状态。

异步编程通常与非阻塞I/O结合使用，以实现更高的并发能力。

二、CompletableFuture：异步编程的利器

CompletableFuture是Java 8引入的一个强大的异步编程工具，它实现了Future和CompletionStage接口。Future接口提供了获取异步操作结果的方法，但其功能相对有限，例如无法链式调用、无法处理异常等。CompletionStage接口则定义了一组丰富的函数式编程方法，可以方便地组合、转换和处理异步操作的结果。

1. 创建CompletableFuture对象

CompletableFuture提供了多种静态方法来创建对象：

CompletableFuture.runAsync(Runnable runnable): 在默认的ForkJoinPool.commonPool()中异步执行一个Runnable任务，没有返回值。
CompletableFuture.supplyAsync(Supplier<U> supplier): 在默认的ForkJoinPool.commonPool()中异步执行一个Supplier任务，返回Supplier的结果。
CompletableFuture.runAsync(Runnable runnable, Executor executor): 在指定的Executor中异步执行一个Runnable任务，没有返回值。
CompletableFuture.supplyAsync(Supplier<U> supplier, Executor executor): 在指定的Executor中异步执行一个Supplier任务，返回Supplier的结果。

示例代码：

import java.util.concurrent.CompletableFuture;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class CompletableFutureExample {

    public static void main(String[] args) throws Exception {
        // 使用默认线程池执行Runnable任务
        CompletableFuture<Void> future1 = CompletableFuture.runAsync(() -> {
            System.out.println("Task 1 running in thread: " + Thread.currentThread().getName());
        });

        // 使用自定义线程池执行Supplier任务
        ExecutorService executor = Executors.newFixedThreadPool(5);
        CompletableFuture<String> future2 = CompletableFuture.supplyAsync(() -> {
            System.out.println("Task 2 running in thread: " + Thread.currentThread().getName());
            return "Result from Task 2";
        }, executor);

        // 获取结果 (阻塞，直到future完成)
        String result = future2.get();
        System.out.println("Result: " + result);

        executor.shutdown();
    }
}

2. 组合CompletableFuture对象

CompletableFuture提供了丰富的组合方法，可以将多个异步操作链接在一起，形成一个处理流程。

thenApply(Function<T, U> fn): 对结果进行转换，返回一个新的CompletableFuture，其结果是fn应用于前一个CompletableFuture的结果。
thenAccept(Consumer<T> consumer): 消费前一个CompletableFuture的结果，返回一个新的CompletableFuture<Void>。
thenRun(Runnable action): 在前一个CompletableFuture完成后执行一个Runnable，返回一个新的CompletableFuture<Void>。
thenCombine(CompletionStage<U> other, BiFunction<T, U, V> fn): 将两个CompletableFuture的结果合并，返回一个新的CompletableFuture，其结果是fn应用于两个CompletableFuture的结果。
thenCompose(Function<T, CompletionStage<U>> fn): 将前一个CompletableFuture的结果传递给一个返回CompletionStage的函数，返回一个新的CompletableFuture，它代表了函数返回的CompletionStage。这是用于依赖性异步操作的关键方法。
applyToEither(CompletionStage<T> other, Function<T, U> fn): 当两个CompletableFuture中的任何一个完成时，将结果应用于fn，返回一个新的CompletableFuture。
acceptEither(CompletionStage<T> other, Consumer<T> consumer): 当两个CompletableFuture中的任何一个完成时，将结果传递给consumer，返回一个新的CompletableFuture<Void>。
runAfterEither(CompletionStage<?> other, Runnable action): 当两个CompletableFuture中的任何一个完成时，执行action，返回一个新的CompletableFuture<Void>。
allOf(CompletableFuture<?>... cfs): 等待所有提供的CompletableFuture完成，返回一个新的CompletableFuture<Void>。如果任何一个完成时抛出异常，则返回的CompletableFuture也将抛出异常。
anyOf(CompletableFuture<?>... cfs): 当任何一个提供的CompletableFuture完成时，返回一个新的CompletableFuture<Object>，其结果是第一个完成的CompletableFuture的结果。

示例代码：

import java.util.concurrent.CompletableFuture;

public class CompletableFutureCompositionExample {

    public static void main(String[] args) throws Exception {
        CompletableFuture<String> future = CompletableFuture.supplyAsync(() -> {
            System.out.println("Fetching data...");
            return "Data from source";
        }).thenApply(data -> {
            System.out.println("Processing data...");
            return data.toUpperCase();
        }).thenAccept(processedData -> {
            System.out.println("Processed data: " + processedData);
        });

        future.get(); // 等待future完成
    }
}

3. 异常处理

CompletableFuture提供了多种方法来处理异步操作中的异常。

exceptionally(Function<Throwable, ? extends T> fn): 如果CompletableFuture完成时抛出异常，则将异常传递给fn，并返回一个包含fn结果的新的CompletableFuture。
handle(BiFunction<T, Throwable, ? extends U> fn): 无论CompletableFuture是否完成成功，都将结果或异常传递给fn，并返回一个包含fn结果的新的CompletableFuture。
whenComplete(BiConsumer<T, Throwable> action): 无论CompletableFuture是否完成成功，都将结果或异常传递给action，返回一个新的CompletableFuture，其结果与原始CompletableFuture相同。

示例代码：

import java.util.concurrent.CompletableFuture;

public class CompletableFutureExceptionHandlingExample {

    public static void main(String[] args) throws Exception {
        CompletableFuture<String> future = CompletableFuture.supplyAsync(() -> {
            if (true) {
                throw new RuntimeException("Something went wrong!");
            }
            return "Success";
        }).exceptionally(ex -> {
            System.err.println("Exception occurred: " + ex.getMessage());
            return "Fallback value";
        }).handle((result, ex) -> {
            if (ex != null) {
                System.err.println("Handling exception again: " + ex.getMessage());
                return "Another fallback value";
            } else {
                return result;
            }
        });

        String result = future.get();
        System.out.println("Result: " + result);
    }
}

三、ForkJoinPool：分而治之的并行框架

ForkJoinPool是Java 7引入的一个用于执行ForkJoinTask的线程池。它采用“分而治之”的思想，将一个大任务分解成多个小任务，并行执行这些小任务，最后将结果合并。ForkJoinPool特别适合于计算密集型的任务，例如排序、搜索等。

1. ForkJoinTask

ForkJoinTask是ForkJoinPool中执行的任务的基类。它有两个主要的子类：

RecursiveAction: 用于执行没有返回值的任务。
RecursiveTask<V>: 用于执行有返回值的任务。

2. 使用ForkJoinPool

要使用ForkJoinPool，需要创建一个ForkJoinTask，然后将其提交给ForkJoinPool执行。

示例代码：

import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveTask;

class SummingTask extends RecursiveTask<Long> {
    private static final int THRESHOLD = 1000;
    private final long[] array;
    private final int start;
    private final int end;

    public SummingTask(long[] array, int start, int end) {
        this.array = array;
        this.start = start;
        this.end = end;
    }

    @Override
    protected Long compute() {
        int length = end - start;
        if (length <= THRESHOLD) {
            long sum = 0;
            for (int i = start; i < end; i++) {
                sum += array[i];
            }
            return sum;
        } else {
            int middle = (start + end) / 2;
            SummingTask leftTask = new SummingTask(array, start, middle);
            SummingTask rightTask = new SummingTask(array, middle, end);
            leftTask.fork();
            rightTask.fork();
            return leftTask.join() + rightTask.join();
        }
    }
}

public class ForkJoinPoolExample {

    public static void main(String[] args) {
        long[] array = new long[10000];
        for (int i = 0; i < array.length; i++) {
            array[i] = i + 1;
        }

        ForkJoinPool pool = new ForkJoinPool();
        SummingTask task = new SummingTask(array, 0, array.length);
        long sum = pool.invoke(task);
        System.out.println("Sum: " + sum);

        pool.shutdown();
    }
}

3. ForkJoinPool的优势

工作窃取（Work-Stealing）： 当一个线程完成自己的任务后，它可以“窃取”其他线程尚未完成的任务来执行，从而提高线程的利用率。
自动线程管理： ForkJoinPool会自动根据任务的负载和系统的资源来调整线程的数量，无需手动管理线程。

四、线程池调优

线程池是管理和复用线程的有效机制。合理配置线程池的大小和参数可以显著提高应用的性能。

1. 线程池的核心参数

corePoolSize： 核心线程数，即线程池中始终保持的线程数量。
maximumPoolSize： 最大线程数，即线程池中允许的最大线程数量。
keepAliveTime： 空闲线程的存活时间，超过这个时间的空闲线程会被回收。
unit： keepAliveTime的时间单位。
workQueue： 任务队列，用于存储等待执行的任务。
threadFactory： 线程工厂，用于创建新的线程。
rejectedExecutionHandler： 拒绝策略，当任务队列已满且线程池中的线程数已达到最大值时，用于处理新提交的任务。

2. 任务队列的选择

不同的任务队列适用于不同的场景。

队列类型	特点	适用场景
`ArrayBlockingQueue`	基于数组的有界队列，性能较高，但容量有限。	适用于任务数量可预测，且对延迟要求较高的场景。
`LinkedBlockingQueue`	基于链表的无界队列（实际上可以指定最大容量），吞吐量较高，但可能导致OOM。	适用于任务数量不可预测，但系统资源充足的场景。
`PriorityBlockingQueue`	具有优先级的无界队列，可以根据任务的优先级来执行任务。	适用于需要根据任务的优先级来执行任务的场景。
`SynchronousQueue`	不存储元素的阻塞队列，每个插入操作必须等待一个相应的移除操作，反之亦然。	适用于任务提交速率和任务执行速率相近的场景，例如生产者-消费者模式。
`DelayQueue`	延迟队列，队列中的元素只有在延迟时间到达后才能被取出。	适用于需要延迟执行任务的场景，例如定时任务。

3. 拒绝策略的选择

当任务队列已满且线程池中的线程数已达到最大值时，线程池会使用拒绝策略来处理新提交的任务。

拒绝策略	描述	适用场景
`AbortPolicy`	抛出`RejectedExecutionException`异常，这是默认的拒绝策略。	适用于对任务丢失不敏感的场景，例如某些后台任务。
`CallerRunsPolicy`	由提交任务的线程来执行该任务。	适用于任务量较小，且希望避免任务丢失的场景。
`DiscardPolicy`	直接丢弃任务，不抛出异常。	适用于对任务丢失不敏感，且希望避免抛出异常的场景。
`DiscardOldestPolicy`	丢弃队列中最老的任务，然后尝试提交新任务。	适用于希望保持队列中任务的新鲜度，且对任务丢失不敏感的场景。
`自定义RejectedExecutionHandler`	可以自定义拒绝策略，例如将任务保存到数据库或消息队列中。	适用于需要根据业务需求来处理被拒绝的任务的场景。

4. 线程池大小的确定

线程池大小的确定是一个复杂的问题，需要综合考虑系统的CPU核心数、I/O密集程度、任务的类型等因素。

CPU密集型任务： 对于CPU密集型任务，线程池的大小可以设置为CPU核心数+1。
I/O密集型任务： 对于I/O密集型任务，线程池的大小可以设置为CPU核心数的2倍甚至更高。这是因为线程的大部分时间都在等待I/O操作完成，而不是在执行计算。
混合型任务： 对于混合型任务，需要根据CPU密集型和I/O密集型任务的比例来调整线程池的大小。

可以使用以下公式来估算线程池的大小：

Nthreads = Ncpu * Ucpu * (1 + W/C)

其中：

Nthreads：线程池的大小
Ncpu：CPU核心数
Ucpu：CPU的利用率（0 <= Ucpu <= 1）
W/C：等待时间与计算时间的比率

5. 线程池监控

监控线程池的运行状态对于及时发现和解决问题至关重要。可以通过以下方式来监控线程池：

JConsole： Java自带的监控工具，可以查看线程池的各种参数，例如活跃线程数、队列长度等。
VisualVM： 功能更强大的监控工具，可以查看线程池的CPU使用率、内存使用率等。
自定义监控： 可以通过编程的方式来监控线程池的状态，例如使用ThreadPoolExecutor提供的getActiveCount()、getQueue().size()等方法。
Prometheus + Grafana: 使用Prometheus收集线程池的指标，然后使用Grafana进行可视化展示。

示例代码：

import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

public class ThreadPoolTuningExample {

    public static void main(String[] args) throws InterruptedException {
        // 获取CPU核心数
        int cpuCores = Runtime.getRuntime().availableProcessors();
        System.out.println("CPU Cores: " + cpuCores);

        // 创建线程池
        ExecutorService executor = Executors.newFixedThreadPool(cpuCores * 2);
        // 或者，更灵活地创建ThreadPoolExecutor
        ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(
                cpuCores,            // corePoolSize
                cpuCores * 2,        // maximumPoolSize
                60L,                 // keepAliveTime
                TimeUnit.SECONDS,    // unit
                new java.util.concurrent.LinkedBlockingQueue<>(100), // workQueue
                Executors.defaultThreadFactory(),
                new java.util.concurrent.ThreadPoolExecutor.CallerRunsPolicy() // rejectedExecutionHandler
        );

        // 提交任务
        for (int i = 0; i < 100; i++) {
            final int taskNumber = i;
            executor.submit(() -> {
                System.out.println("Task " + taskNumber + " running in thread: " + Thread.currentThread().getName());
                try {
                    Thread.sleep(100); // 模拟I/O操作
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
            });
        }

        // 监控线程池状态
        while (((ThreadPoolExecutor) executor).getActiveCount() > 0 || ((ThreadPoolExecutor) executor).getQueue().size() > 0) {
            System.out.println("Active threads: " + ((ThreadPoolExecutor) executor).getActiveCount());
            System.out.println("Queue size: " + ((ThreadPoolExecutor) executor).getQueue().size());
            Thread.sleep(1000);
        }

        // 关闭线程池
        executor.shutdown();
        executor.awaitTermination(60, TimeUnit.SECONDS);
    }
}

五、实际案例分析

假设我们有一个电商网站，需要处理大量的用户请求，包括查询商品信息、下单、支付等。为了提高网站的响应速度和并发能力，我们可以使用异步编程来优化这些操作。

查询商品信息： 可以使用CompletableFuture异步地从数据库或缓存中查询商品信息，并将结果返回给客户端。
下单： 可以将下单操作分解成多个异步任务，例如验证库存、生成订单、扣减库存等，并行执行这些任务，提高下单速度。
支付： 可以使用CompletableFuture异步地调用支付接口，并将支付结果通知给用户。
日志记录： 使用异步线程池记录日志，避免阻塞主线程。

六、一些建议和最佳实践

避免阻塞操作： 在异步任务中尽量避免执行阻塞操作，例如同步I/O、锁等待等，否则会降低异步编程的效率。
合理选择线程池： 根据任务的类型和特点选择合适的线程池，例如对于CPU密集型任务可以选择ForkJoinPool，对于I/O密集型任务可以选择ThreadPoolExecutor。
监控线程池状态： 及时监控线程池的状态，例如活跃线程数、队列长度等，以便及时发现和解决问题。
使用响应式编程： 可以考虑使用响应式编程框架，例如RxJava或Project Reactor，来简化异步编程的复杂性。
测试： 编写单元测试和集成测试来验证异步代码的正确性。

七、总结

我们讨论了CompletableFuture异步编程，利用ForkJoinPool进行并行计算以及线程池调优，这些技术是构建高性能Java应用的关键。合理应用这些技术，可以显著提高应用的响应速度和并发能力，从而提升用户体验。异步编程和线程池调优是一个持续学习和实践的过程，希望今天的分享能对大家有所帮助。

异步编程的关键技术点总结

CompletableFuture提供了一种更强大和灵活的方式来处理异步任务，ForkJoinPool适用于计算密集型任务，而线程池调优则能充分利用系统资源，最终提升Java应用的性能和可伸缩性。掌握这些技术是成为一名优秀的Java开发者的必要条件。

Java异步编程进阶：CompletableFuture、ForkJoinPool与线程池调优

发表回复 取消回复

发表回复取消回复