JAVA ThreadPoolExecutor 拒绝策略触发过早？线程池尺寸与队列调优技巧

大家好，今天我们来深入探讨一个在Java并发编程中经常遇到的问题：ThreadPoolExecutor的拒绝策略触发过早。很多开发者在使用线程池时，会发现配置看似合理的线程池，仍然会频繁触发拒绝策略，导致任务丢失或系统性能下降。这往往不是因为线程池本身的问题，而是对线程池的尺寸、队列以及拒绝策略的理解不够深入。本次讲座，我们将系统地分析这个问题，并提供一套完整的调优策略。

线程池的基本概念与工作原理

首先，我们来回顾一下ThreadPoolExecutor的核心概念。一个ThreadPoolExecutor主要由以下几个部分组成：

核心线程数（corePoolSize）: 线程池中始终保持活动的线程数量，即使它们是空闲的。
最大线程数（maximumPoolSize）: 线程池允许创建的最大线程数量。
线程空闲时间（keepAliveTime）: 当线程池中的线程数量超过核心线程数时，多余的空闲线程在终止前等待新任务的最长时间。
时间单位（TimeUnit）: keepAliveTime的时间单位，例如秒、分钟等。
工作队列（BlockingQueue）: 用于存放等待执行的任务。
线程工厂（ThreadFactory）: 用于创建新的线程。
拒绝策略（RejectedExecutionHandler）: 当线程池已满且工作队列也满时，用于处理新提交的任务。

ThreadPoolExecutor的工作流程大致如下：

当有新任务提交时，线程池会首先检查当前运行的线程数是否小于corePoolSize。如果是，则创建一个新的线程来执行任务。
如果当前运行的线程数等于或大于corePoolSize，线程池会将任务放入工作队列中等待执行。
如果工作队列已满，并且当前运行的线程数小于maximumPoolSize，线程池会创建一个新的线程来执行任务。
如果工作队列已满，并且当前运行的线程数等于或大于maximumPoolSize，线程池会根据配置的拒绝策略来处理任务。

常见的拒绝策略

Java提供了四种内置的拒绝策略：

AbortPolicy (默认策略): 抛出RejectedExecutionException异常。
CallerRunsPolicy: 由提交任务的线程来执行任务。
DiscardPolicy: 直接丢弃任务，不抛出任何异常。
DiscardOldestPolicy: 丢弃工作队列中最旧的任务，然后尝试重新提交新任务。

当然，我们也可以自定义拒绝策略，实现RejectedExecutionHandler接口即可。

拒绝策略触发过早的原因分析

现在，我们来分析一下拒绝策略触发过早的常见原因：

核心线程数设置过小: 如果corePoolSize设置得太小，导致大量任务堆积在工作队列中，而线程池无法及时创建新的线程来处理任务。
工作队列容量设置过小: 如果工作队列的容量设置得太小，导致队列很快被填满，即使线程池还有创建新线程的能力，也会触发拒绝策略。
任务提交速度远大于处理速度: 如果任务的提交速度远大于线程池的处理速度，即使线程池的配置看起来合理，也可能会因为队列被迅速填满而触发拒绝策略。
任务类型不一致: 如果提交到线程池的任务类型差异很大，某些任务执行时间很长，而其他任务执行时间很短，可能会导致线程池的利用率不高，进而触发拒绝策略。
误解了线程池的扩容机制: 很多人认为只要设置了maximumPoolSize，线程池就会尽可能地创建线程。实际上，线程池只有在工作队列已满的情况下才会尝试创建新的线程。

线程池尺寸与队列的调优技巧

针对以上原因，我们可以采取以下调优技巧：

1. 合理设置核心线程数（corePoolSize）

corePoolSize的设置至关重要。一个常用的经验法则是：对于CPU密集型任务，可以将corePoolSize设置为CPU核心数+1；对于IO密集型任务，可以将corePoolSize设置为CPU核心数的两倍或更多。

但是，这仅仅是一个起点。最佳的corePoolSize需要根据实际的业务场景进行调整。我们可以通过监控线程池的运行状态，例如活跃线程数、队列长度等指标，来判断corePoolSize是否合适。

代码示例：监控线程池状态

import java.util.concurrent.*;

public class ThreadPoolMonitor {

    public static void main(String[] args) throws InterruptedException {
        ThreadPoolExecutor executor = new ThreadPoolExecutor(
                5,  // corePoolSize
                10, // maximumPoolSize
                60, TimeUnit.SECONDS,
                new LinkedBlockingQueue<>(100), // workQueue
                Executors.defaultThreadFactory(),
                new ThreadPoolExecutor.AbortPolicy()
        );

        // 提交一些任务
        for (int i = 0; i < 200; i++) {
            final int taskId = i;
            executor.execute(() -> {
                try {
                    Thread.sleep(100); // 模拟耗时操作
                } catch (InterruptedException e) {
                    Thread.currentThread().interrupt();
                }
                System.out.println("Task " + taskId + " executed by " + Thread.currentThread().getName());
            });
        }

        // 每隔一段时间监控线程池状态
        while (executor.getActiveCount() > 0 || executor.getQueue().size() > 0) {
            System.out.println("=======================================");
            System.out.println("Active Threads: " + executor.getActiveCount());
            System.out.println("Queue Size: " + executor.getQueue().size());
            System.out.println("Completed Tasks: " + executor.getCompletedTaskCount());
            System.out.println("Total Tasks: " + executor.getTaskCount());
            System.out.println("=======================================");
            Thread.sleep(1000);
        }

        executor.shutdown();
    }
}

通过运行以上代码，我们可以观察到线程池的活跃线程数、队列长度等指标的变化，从而判断corePoolSize是否需要调整。

2. 选择合适的工作队列（BlockingQueue）

不同的工作队列对线程池的性能有很大的影响。Java提供了多种BlockingQueue的实现，常见的有：

LinkedBlockingQueue: 基于链表的无界队列（默认大小为Integer.MAX_VALUE）或有界队列。吞吐量通常高于ArrayBlockingQueue。
ArrayBlockingQueue: 基于数组的有界队列。性能通常高于LinkedBlockingQueue，但吞吐量较低。
SynchronousQueue: 不存储元素的队列。每个插入操作必须等待一个相应的移除操作，反之亦然。适用于任务提交速度和处理速度基本一致的场景。
PriorityBlockingQueue: 支持优先级排序的无界队列。
DelayQueue: 支持延时获取元素的无界队列。

选择工作队列时，需要根据实际的业务场景进行权衡。如果任务的提交速度远大于处理速度，并且对任务丢失不敏感，可以选择LinkedBlockingQueue，并设置一个合理的容量。如果对任务的顺序有要求，可以使用PriorityBlockingQueue。如果任务的提交速度和处理速度基本一致，可以使用SynchronousQueue。

表格：BlockingQueue的比较

队列类型	特点	适用场景
`LinkedBlockingQueue`	无界（默认）或有界，基于链表，吞吐量高	任务提交速度远大于处理速度，对任务丢失不敏感，可接受一定的延迟
`ArrayBlockingQueue`	有界，基于数组，性能高，吞吐量低	需要控制队列大小，对性能有较高要求，任务提交速度相对稳定
`SynchronousQueue`	不存储元素，每个插入操作必须等待一个移除操作	任务提交速度和处理速度基本一致，适用于生产者-消费者模式
`PriorityBlockingQueue`	无界，支持优先级排序	需要对任务进行优先级排序
`DelayQueue`	无界，支持延时获取元素	需要延迟执行任务

代码示例：使用不同的BlockingQueue

import java.util.concurrent.*;

public class BlockingQueueExample {

    public static void main(String[] args) {
        // 使用LinkedBlockingQueue
        ThreadPoolExecutor executor1 = new ThreadPoolExecutor(
                5, 10, 60, TimeUnit.SECONDS,
                new LinkedBlockingQueue<>(100)
        );

        // 使用ArrayBlockingQueue
        ThreadPoolExecutor executor2 = new ThreadPoolExecutor(
                5, 10, 60, TimeUnit.SECONDS,
                new ArrayBlockingQueue<>(100)
        );

        // 使用SynchronousQueue
        ThreadPoolExecutor executor3 = new ThreadPoolExecutor(
                5, 10, 60, TimeUnit.SECONDS,
                new SynchronousQueue<>()
        );

        // 提交一些任务到不同的线程池
        for (int i = 0; i < 200; i++) {
            final int taskId = i;
            Runnable task = () -> {
                try {
                    Thread.sleep(100); // 模拟耗时操作
                } catch (InterruptedException e) {
                    Thread.currentThread().interrupt();
                }
                System.out.println("Task " + taskId + " executed by " + Thread.currentThread().getName());
            };

            if (i % 3 == 0) {
                executor1.execute(task);
            } else if (i % 3 == 1) {
                executor2.execute(task);
            } else {
                executor3.execute(task);
            }
        }

        // 关闭线程池
        executor1.shutdown();
        executor2.shutdown();
        executor3.shutdown();
    }
}

3. 调整最大线程数（maximumPoolSize）

maximumPoolSize的设置需要根据实际的业务场景进行调整。如果任务的提交速度远大于处理速度，并且希望线程池能够尽可能地处理更多的任务，可以将maximumPoolSize设置得更大一些。但是，过大的maximumPoolSize可能会导致系统资源耗尽，反而降低性能。

一个常用的策略是：先设置一个初始的maximumPoolSize，然后通过监控线程池的运行状态，例如活跃线程数、CPU利用率等指标，来判断maximumPoolSize是否需要调整。

4. 自定义拒绝策略

如果内置的拒绝策略无法满足需求，可以自定义拒绝策略。例如，可以将任务放入一个持久化的队列中，稍后重新提交。或者，可以记录被拒绝的任务，以便后续分析。

代码示例：自定义拒绝策略

import java.util.concurrent.*;

public class CustomRejectedExecutionHandler implements RejectedExecutionHandler {

    @Override
    public void rejectedExecution(Runnable r, ThreadPoolExecutor executor) {
        System.err.println("Task " + r.toString() + " rejected from " + executor.toString());
        // 可以将任务放入持久化队列，或者记录日志
    }
}

// 使用自定义拒绝策略
ThreadPoolExecutor executor = new ThreadPoolExecutor(
        5, 10, 60, TimeUnit.SECONDS,
        new LinkedBlockingQueue<>(100),
        new CustomRejectedExecutionHandler()
);

5. 任务分解与异步化

如果单个任务的执行时间过长，可以考虑将任务分解成多个子任务，并行执行。或者，可以将一些非核心的任务异步化处理，减少对线程池的压力。

6. 监控与调优循环

线程池的调优是一个持续的过程。我们需要不断地监控线程池的运行状态，并根据实际情况进行调整。常用的监控指标包括：

活跃线程数
队列长度
已完成的任务数
总任务数
拒绝的任务数
CPU利用率
内存使用率

通过分析这些指标，我们可以找到线程池的瓶颈，并采取相应的措施进行优化。

避免线程池配置的常见误区

误区一：无脑增大线程池。并非线程越多越好。过多的线程会导致上下文切换开销增加，反而降低性能。
误区二：使用无界队列而不设置最大线程数。这会导致OOM风险。
误区三：忽略拒绝策略。不设置拒绝策略或者使用默认的AbortPolicy，会导致任务丢失或者异常。
误区四：缺乏监控。不监控线程池的运行状态，无法及时发现问题并进行优化。

代码示例：完整的线程池调优示例

import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicInteger;

public class ThreadPoolTuningExample {

    private static final int CORE_POOL_SIZE = Runtime.getRuntime().availableProcessors() + 1;
    private static final int MAX_POOL_SIZE = CORE_POOL_SIZE * 2;
    private static final int QUEUE_CAPACITY = 1000;
    private static final long KEEP_ALIVE_TIME = 60L;

    public static void main(String[] args) throws InterruptedException {

        // 使用自定义线程工厂，方便调试
        ThreadFactory threadFactory = new ThreadFactory() {
            private final AtomicInteger counter = new AtomicInteger(0);

            @Override
            public Thread newThread(Runnable r) {
                Thread thread = new Thread(r, "CustomThreadPool-Thread-" + counter.incrementAndGet());
                thread.setDaemon(false); // 设置为非守护线程，防止程序提前退出
                return thread;
            }
        };

        // 使用自定义拒绝策略，记录被拒绝的任务
        RejectedExecutionHandler rejectedExecutionHandler = (r, executor) -> {
            System.err.println("Task " + r.toString() + " rejected from " + executor.toString());
            // 可以将任务放入持久化队列，或者记录日志
        };

        ThreadPoolExecutor executor = new ThreadPoolExecutor(
                CORE_POOL_SIZE,
                MAX_POOL_SIZE,
                KEEP_ALIVE_TIME,
                TimeUnit.SECONDS,
                new LinkedBlockingQueue<>(QUEUE_CAPACITY),
                threadFactory,
                rejectedExecutionHandler
        );

        // 预热核心线程
        executor.prestartAllCoreThreads();

        // 提交大量任务
        for (int i = 0; i < 5000; i++) {
            final int taskId = i;
            executor.execute(() -> {
                try {
                    Thread.sleep(10); // 模拟耗时操作
                } catch (InterruptedException e) {
                    Thread.currentThread().interrupt();
                }
                System.out.println("Task " + taskId + " executed by " + Thread.currentThread().getName());
            });
        }

        // 监控线程池状态
        while (executor.getActiveCount() > 0 || executor.getQueue().size() > 0) {
            System.out.println("=======================================");
            System.out.println("Active Threads: " + executor.getActiveCount());
            System.out.println("Queue Size: " + executor.getQueue().size());
            System.out.println("Completed Tasks: " + executor.getCompletedTaskCount());
            System.out.println("Total Tasks: " + executor.getTaskCount());
            System.out.println("Largest Pool Size: " + executor.getLargestPoolSize());
            System.out.println("=======================================");
            Thread.sleep(1000);
        }

        executor.shutdown();
        executor.awaitTermination(60, TimeUnit.SECONDS);
        System.out.println("ThreadPool completed.");
    }
}

总结

通过本次讲座，我们深入了解了ThreadPoolExecutor的工作原理，分析了拒绝策略触发过早的常见原因，并提供了一套完整的调优策略。记住，线程池的调优是一个持续的过程，需要根据实际的业务场景进行权衡和调整。要选择合适的线程池参数与队列类型，并且持续监控，优化配置。希望本次讲座能够帮助大家更好地使用ThreadPoolExecutor，提高系统的并发性能。