JAVA 定时任务重复执行？分析 Quartz 与分布式调度中心的正确配置 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Java 定时任务重复执行？Quartz 与分布式调度中心的正确配置

大家好，今天我们来探讨一个在Java开发中经常遇到的问题：定时任务的重复执行。我们将深入分析导致这个问题的原因，并着重讲解如何使用Quartz框架以及分布式调度中心来正确配置定时任务，以避免重复执行的情况。

一、定时任务重复执行的常见原因

定时任务重复执行是一个令人头疼的问题，它可能导致数据不一致、资源浪费，甚至系统崩溃。导致重复执行的原因有很多，主要可以归纳为以下几类：

单机环境下的并发问题： 在单机环境下，如果定时任务的执行时间超过了设定的间隔时间，或者任务的执行逻辑没有进行并发控制，就可能导致任务在上次执行尚未完成时，又启动了新的执行。
分布式环境下的重复触发： 在分布式环境下，同一个定时任务可能会被部署在多个节点上，如果没有进行有效的协调和控制，每个节点都会触发任务的执行，从而导致重复执行。
时钟同步问题： 在分布式系统中，如果各个节点的时间不同步，可能会导致定时任务的触发时间不一致，从而出现重复执行的情况。
任务调度框架的配置问题： 例如，Cron表达式配置错误、任务的并发策略设置不当、任务的重试机制配置不合理等，都可能导致任务重复执行。
网络抖动或数据库连接问题： 在分布式系统中，由于网络不稳定或数据库连接中断，可能会导致任务调度中心无法准确地记录任务的执行状态，从而导致重复触发。

二、Quartz 框架：单机环境下的定时任务解决方案

Quartz是一个强大的开源作业调度框架，可以用于在Java应用程序中创建和管理定时任务。它提供了丰富的功能，包括：

灵活的调度策略： 支持Cron表达式、SimpleTrigger等多种调度策略，可以满足各种复杂的定时需求。
任务持久化： 可以将任务和触发器信息持久化到数据库中，即使应用程序重启，任务也不会丢失。
任务并发控制： 提供了多种并发控制机制，可以避免任务的并发执行。
任务监听器： 可以监听任务的执行状态，并在任务执行前后执行自定义的逻辑。

2.1 Quartz 的基本概念

在使用 Quartz 之前，我们需要了解几个核心概念：

Scheduler： 调度器，负责管理和调度任务。
Job： 任务，需要执行的业务逻辑。Job需要实现 org.quartz.Job 接口。
JobDetail： 任务详情，包含任务的描述信息和Job的实例。
Trigger： 触发器，定义任务的触发时间和触发规则。
CronTrigger： 基于Cron表达式的触发器，可以定义复杂的定时规则。
SimpleTrigger： 简单的触发器，可以定义任务的执行次数和间隔时间。

2.2 Quartz 的使用示例

以下是一个使用 Quartz 实现定时任务的示例：

import org.quartz.*;
import org.quartz.impl.StdSchedulerFactory;

import java.util.Date;

public class MyJob implements Job {

    @Override
    public void execute(JobExecutionContext context) throws JobExecutionException {
        System.out.println("MyJob is running at " + new Date());
    }
}

public class QuartzExample {

    public static void main(String[] args) throws SchedulerException {
        // 1. 创建 SchedulerFactory
        SchedulerFactory schedulerFactory = new StdSchedulerFactory();

        // 2. 获取 Scheduler 实例
        Scheduler scheduler = schedulerFactory.getScheduler();

        // 3. 定义 JobDetail
        JobDetail jobDetail = JobBuilder.newJob(MyJob.class)
                .withIdentity("myJob", "group1")
                .build();

        // 4. 定义 Trigger
        Trigger trigger = TriggerBuilder.newTrigger()
                .withIdentity("myTrigger", "group1")
                .startNow()
                .withSchedule(CronScheduleBuilder.cronSchedule("0/5 * * * * ?")) // 每5秒执行一次
                .build();

        // 5. 将 JobDetail 和 Trigger 关联
        scheduler.scheduleJob(jobDetail, trigger);

        // 6. 启动 Scheduler
        scheduler.start();

        // 等待一段时间，让任务执行
        try {
            Thread.sleep(60000); // 60秒
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

        // 7. 关闭 Scheduler
        scheduler.shutdown();
    }
}

代码解释：

MyJob 类实现了 Job 接口，定义了任务的执行逻辑。
QuartzExample 类创建了一个 Scheduler 实例，并定义了一个 JobDetail 和一个 CronTrigger。
JobDetail 指定了要执行的 Job 类为 MyJob，并设置了任务的名称和分组。
CronTrigger 指定了任务的触发规则为每5秒执行一次。
scheduler.scheduleJob(jobDetail, trigger) 将 JobDetail 和 Trigger 关联，并将任务添加到调度器中。
scheduler.start() 启动调度器，开始执行任务。
scheduler.shutdown() 关闭调度器，停止执行任务。

2.3 如何避免单机环境下的并发问题

在单机环境下，为了避免定时任务的并发执行，可以使用以下方法：

@DisallowConcurrentExecution 注解： 在 Job 类上添加 @DisallowConcurrentExecution 注解，可以防止同一个 Job 的多个实例并发执行。

import org.quartz.*;

@DisallowConcurrentExecution
public class MyJob implements Job {

    @Override
    public void execute(JobExecutionContext context) throws JobExecutionException {
        // ...
    }
}

数据库锁： 在任务执行前，尝试获取数据库锁，如果获取成功，则执行任务；否则，放弃执行。

import org.quartz.*;
import java.sql.*;

public class MyJob implements Job {

    @Override
    public void execute(JobExecutionContext context) throws JobExecutionException {
        Connection connection = null;
        try {
            // 1. 获取数据库连接
            connection = DriverManager.getConnection("jdbc:mysql://localhost:3306/mydb", "user", "password");

            // 2. 尝试获取数据库锁
            PreparedStatement statement = connection.prepareStatement("SELECT GET_LOCK('my_job_lock', 10)"); // 尝试获取锁10秒
            ResultSet resultSet = statement.executeQuery();
            resultSet.next();
            int lockResult = resultSet.getInt(1);

            // 3. 如果获取锁成功，则执行任务
            if (lockResult == 1) {
                System.out.println("MyJob is running at " + new Date());
                // ... 执行任务的业务逻辑 ...
            } else {
                System.out.println("MyJob is skipped because another instance is running.");
            }

            // 4. 释放锁
            statement = connection.prepareStatement("SELECT RELEASE_LOCK('my_job_lock')");
            statement.executeQuery();

        } catch (SQLException e) {
            e.printStackTrace();
        } finally {
            // 关闭连接
            if (connection != null) {
                try {
                    connection.close();
                } catch (SQLException e) {
                    e.printStackTrace();
                }
            }
        }
    }
}

三、分布式调度中心：分布式环境下的定时任务解决方案

在分布式环境下，单靠 Quartz 无法解决定时任务的重复执行问题。我们需要使用分布式调度中心来统一管理和调度定时任务。常见的分布式调度中心包括：

XXL-JOB： 一个轻量级的分布式任务调度平台，支持可视化管理界面、丰富的任务类型和灵活的调度策略。
Elastic-Job： 一个基于 Apache ZooKeeper 的分布式调度解决方案，提供弹性扩容、高可用性和容错能力。
TBSchedule： 淘宝开源的分布式调度框架，支持海量任务调度和高并发处理。

3.1 XXL-JOB 的配置和使用

这里以 XXL-JOB 为例，介绍如何在分布式环境下配置和使用定时任务。

3.1.1 XXL-JOB 的部署

下载 XXL-JOB： 从 XXL-JOB 的官方网站（https://www.xuxueli.com/xxl-job/）下载最新版本的安装包。
部署调度中心： 解压安装包，找到 xxl-job-admin 目录，这是一个 Spring Boot 项目，可以直接运行。你需要配置数据库连接信息，并启动该项目。
部署执行器： 解压安装包，找到 xxl-job-executor-samples 目录，这是一个示例项目，你可以将其改造为自己的任务执行器。你需要配置执行器的注册中心地址和端口，并启动该项目。

3.1.2 XXL-JOB 的配置

在调度中心添加执行器： 登录 XXL-JOB 的管理界面，添加一个新的执行器，填写执行器的名称、注册方式和地址。
创建任务： 在调度中心创建一个新的任务，填写任务的描述信息、Cron表达式、执行器和执行参数。
配置任务的路由策略： 选择合适的路由策略，例如 "第一个"、"轮询"、"随机" 等。路由策略决定了当有多个执行器可用时，任务应该分配给哪个执行器执行。
配置任务的阻塞处理策略： 选择合适的阻塞处理策略，例如 "单机串行"、"丢弃后续调度"、"覆盖之前调度" 等。"单机串行" 可以保证同一个任务在同一个执行器上不会并发执行。

3.1.3 XXL-JOB 的使用示例

以下是一个使用 XXL-JOB 实现定时任务的示例：

创建 JobHandler： 在执行器项目中，创建一个类，实现 com.xxl.job.core.handler.IJobHandler 接口，并使用 @JobHandler 注解标记该类。

import com.xxl.job.core.handler.IJobHandler;
import com.xxl.job.core.handler.annotation.JobHandler;
import org.springframework.stereotype.Component;

import java.util.Date;

@JobHandler("myJobHandler")
@Component
public class MyJobHandler implements IJobHandler {

    @Override
    public void execute() throws Exception {
        System.out.println("MyJobHandler is running at " + new Date());
    }
}

配置 application.properties： 在执行器项目的 application.properties 文件中，配置 XXL-JOB 的相关信息。

xxl.job.admin.addresses=http://localhost:8080/xxl-job-admin  # 调度中心地址
xxl.job.executor.appname=xxl-job-executor-sample  # 执行器名称
xxl.job.executor.ip=  # 执行器IP，不配置则自动获取
xxl.job.executor.port=9999  # 执行器端口
xxl.job.executor.logpath=/data/applogs/xxl-job/jobhandler  # 执行器日志路径
xxl.job.executor.logretentiondays=30  # 执行器日志保留天数

在调度中心创建任务： 登录 XXL-JOB 的管理界面，创建一个新的任务，配置任务的 JobHandler 为 myJobHandler，并设置合适的 Cron 表达式。

3.2 分布式环境下避免重复执行的关键点

在分布式环境下，要避免定时任务的重复执行，需要注意以下几个关键点：

统一的任务调度中心： 必须使用统一的任务调度中心来管理和调度定时任务，避免多个节点各自触发任务的执行。
合理的路由策略： 选择合适的路由策略，确保同一个任务只会被分配给一个执行器执行。
阻塞处理策略： 配置合适的阻塞处理策略，例如 "单机串行"，可以防止同一个任务在同一个执行器上并发执行。
任务幂等性： 保证任务的执行逻辑是幂等的，即使任务被重复执行多次，最终的结果也是一致的。
分布式锁： 在任务执行前，尝试获取分布式锁，如果获取成功，则执行任务；否则，放弃执行。可以使用 Redis、ZooKeeper 等分布式锁来实现。

四、任务幂等性的重要性

任务幂等性是指，无论任务被执行多少次，其结果都应该与执行一次的结果相同。保证任务幂等性是避免数据不一致的关键。

4.1 如何实现任务幂等性

实现任务幂等性的方法有很多，常见的包括：

唯一ID： 为每个任务分配一个唯一的ID，在执行任务前，先检查该ID是否已经存在，如果存在，则说明任务已经被执行过，直接返回成功；否则，执行任务，并将ID保存起来。
版本号： 在更新数据时，使用版本号机制，每次更新数据时，都将版本号加1，并在更新语句中添加版本号的判断条件，例如 UPDATE table SET value = 'new_value', version = version + 1 WHERE id = 1 AND version = current_version。
状态机： 使用状态机来管理任务的状态，只有在特定的状态下才能执行任务，例如只有在 "待执行" 状态下才能执行任务。
数据库唯一约束： 利用数据库的唯一约束来保证数据的唯一性，如果插入重复的数据，则会抛出异常，从而避免重复执行。

五、时钟同步问题

在分布式系统中，时钟同步是一个非常重要的问题。如果各个节点的时间不同步，可能会导致定时任务的触发时间不一致，从而出现重复执行的情况。

5.1 如何解决时钟同步问题

解决时钟同步问题的方法有很多，常见的包括：

NTP (Network Time Protocol)： 使用 NTP 协议来同步各个节点的时间。
Chrony： 一个比 NTP 更精确的时钟同步工具。
使用统一的时间服务器： 在分布式系统中，配置统一的时间服务器，所有节点都从该服务器获取时间。

代码示例：使用 Redis 实现分布式锁

import redis.clients.jedis.Jedis;
import redis.clients.jedis.JedisPool;
import redis.clients.jedis.JedisPoolConfig;

import java.util.Collections;
import java.util.UUID;

public class RedisDistributedLock {

    private static final String LOCK_SUCCESS = "OK";
    private static final Long RELEASE_SUCCESS = 1L;
    private static final String SET_IF_NOT_EXIST = "NX";
    private static final String SET_WITH_EXPIRE_TIME = "PX"; // milliseconds

    private static JedisPool jedisPool;

    static {
        JedisPoolConfig config = new JedisPoolConfig();
        config.setMaxTotal(100);
        config.setMaxIdle(50);
        config.setMinIdle(10);
        config.setTestOnBorrow(true);
        config.setTestOnReturn(true);
        jedisPool = new JedisPool(config, "localhost", 6379);
    }

    /**
     * 尝试获取分布式锁
     * @param lockKey 锁的key
     * @param requestId 锁的value，用于标识持有者
     * @param expireTime 超时时间，单位毫秒
     * @return 是否获取成功
     */
    public static boolean tryGetLock(String lockKey, String requestId, int expireTime) {

        Jedis jedis = null;
        try {
            jedis = jedisPool.getResource();
            String result = jedis.set(lockKey, requestId, SET_IF_NOT_EXIST, SET_WITH_EXPIRE_TIME, expireTime);

            if (LOCK_SUCCESS.equals(result)) {
                return true;
            }
            return false;
        } finally {
            if (jedis != null) {
                jedis.close();
            }
        }

    }

    /**
     * 释放分布式锁
     * @param lockKey 锁的key
     * @param requestId 锁的value，用于标识持有者
     * @return 是否释放成功
     */
    public static boolean releaseLock(String lockKey, String requestId) {

        Jedis jedis = null;
        try {
            jedis = jedisPool.getResource();
            String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
            Object result = jedis.eval(script, Collections.singletonList(lockKey), Collections.singletonList(requestId));

            if (RELEASE_SUCCESS.equals(result)) {
                return true;
            }
            return false;
        } finally {
            if (jedis != null) {
                jedis.close();
            }
        }

    }

    public static void main(String[] args) {
        String lockKey = "my_task_lock";
        String requestId = UUID.randomUUID().toString();
        int expireTime = 5000; // 5秒

        if (RedisDistributedLock.tryGetLock(lockKey, requestId, expireTime)) {
            try {
                System.out.println("获取锁成功，执行任务...");
                Thread.sleep(3000); // 模拟任务执行
            } catch (InterruptedException e) {
                e.printStackTrace();
            } finally {
                if (RedisDistributedLock.releaseLock(lockKey, requestId)) {
                    System.out.println("释放锁成功");
                } else {
                    System.out.println("释放锁失败");
                }
            }
        } else {
            System.out.println("获取锁失败，任务被跳过");
        }
    }
}

代码解释：

RedisDistributedLock 类封装了 Redis 分布式锁的获取和释放操作。
tryGetLock 方法尝试获取锁，使用 SETNX 命令（如果 key 不存在则设置 key 的值）和 EXPIRE 命令（设置 key 的过期时间）来实现原子性操作。
releaseLock 方法释放锁，使用 Lua 脚本来保证删除 key 的操作是原子性的。
main 方法演示了如何使用 Redis 分布式锁来保护定时任务的执行。

六、配置总结

配置项	描述	建议值
调度中心选择	在分布式环境下，选择合适的调度中心至关重要，例如 XXL-JOB、Elastic-Job 等。	根据业务规模和需求选择，小型项目可以选择 XXL-JOB，大型项目可以选择 Elastic-Job。
路由策略	路由策略决定了当有多个执行器可用时，任务应该分配给哪个执行器执行。	如果任务只需要执行一次，可以选择 "第一个" 策略；如果需要负载均衡，可以选择 "轮询" 或 "随机" 策略。
阻塞处理策略	阻塞处理策略决定了当任务正在执行时，新的调度请求应该如何处理。	如果需要避免并发执行，可以选择 "单机串行" 策略；如果可以丢弃后续调度，可以选择 "丢弃后续调度" 策略；如果需要覆盖之前调度，可以选择 "覆盖之前调度" 策略。
任务幂等性	保证任务的执行逻辑是幂等的，即使任务被重复执行多次，最终的结果也是一致的。	必须保证，可以使用唯一ID、版本号、状态机等方法来实现。
分布式锁	在任务执行前，尝试获取分布式锁，如果获取成功，则执行任务；否则，放弃执行。	强烈建议使用，可以使用 Redis、ZooKeeper 等分布式锁来实现。
时钟同步	保证各个节点的时间同步，避免定时任务的触发时间不一致。	建议使用 NTP 或 Chrony 来同步时间。

通过以上配置，可以有效地避免 Java 定时任务的重复执行问题，保证系统的稳定性和可靠性。

七、总结一下

本文详细介绍了 Java 定时任务重复执行的常见原因，并分别讲解了如何使用 Quartz 框架和分布式调度中心来解决这个问题。重点强调了任务幂等性的重要性，以及如何使用分布式锁和时钟同步来保证定时任务的正确执行。希望本文能够帮助大家更好地理解和解决 Java 定时任务重复执行的问题。

Java 定时任务重复执行？Quartz 与分布式调度中心的正确配置

发表回复 取消回复

发表回复取消回复