JAVA高并发订单系统中锁粒度设计不当导致性能崩溃案例 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Java 高并发订单系统锁粒度设计不当导致性能崩溃案例分析

各位，今天我们来聊聊在高并发订单系统中，锁粒度设计不当导致性能崩溃的案例。这是一个非常现实且常见的问题，很多系统在初期设计时，往往忽略了高并发场景下的锁竞争，导致系统在高负载下出现性能瓶颈，甚至直接崩溃。

1. 订单系统核心流程与锁的应用场景

首先，我们需要了解一个典型的电商订单系统的核心流程。简单来说，用户下单通常会经历以下几个步骤：

步骤	描述	涉及资源
1. 用户提交订单	用户在前端提交订单，包含商品信息、数量、收货地址等。	订单数据结构
2. 库存检查	系统检查用户购买的商品是否有足够的库存。	商品库存数据
3. 扣减库存	如果库存足够，系统扣减相应商品的库存。	商品库存数据
4. 生成订单	系统生成订单记录，包含订单号、用户信息、商品信息等。	订单数据结构
5. 支付	用户选择支付方式并完成支付。	支付相关服务、用户账户
6. 更新订单状态	支付成功后，系统更新订单状态为“已支付”。	订单数据结构
7. 消息通知	系统发送消息通知给用户和商家。	消息队列

在高并发场景下，上述流程中的多个环节都可能成为性能瓶颈。而锁，作为解决并发问题的常用手段，自然会出现在这些环节中。我们需要对共享资源进行保护，防止并发修改导致数据不一致。例如：

库存扣减： 多个用户同时购买同一商品，需要保证库存扣减的原子性，防止超卖。
订单生成： 需要保证订单号的唯一性，防止生成重复订单。
账户操作： 支付、退款等操作需要保证用户账户余额的正确性。

2. 锁粒度过粗：全局锁的噩梦

最简单粗暴的加锁方式就是使用全局锁。例如，直接对整个订单服务加锁。

public class OrderService {

    private final Object lock = new Object();

    public String createOrder(String userId, String productId, int quantity) {
        synchronized (lock) {
            // 1. 检查库存
            if (!checkStock(productId, quantity)) {
                return "库存不足";
            }

            // 2. 扣减库存
            deductStock(productId, quantity);

            // 3. 生成订单
            String orderId = generateOrderId(userId, productId);

            // 4. 保存订单
            saveOrder(orderId, userId, productId, quantity);

            return orderId;
        }
    }

    private boolean checkStock(String productId, int quantity) {
        // 模拟库存检查
        // 实际应用中应该从数据库或缓存中读取
        int stock = 100; // 假设初始库存为 100
        return stock >= quantity;
    }

    private void deductStock(String productId, int quantity) {
        // 模拟库存扣减
        // 实际应用中应该更新数据库或缓存
        System.out.println("扣减库存: " + productId + ", 数量: " + quantity);
        try {
            Thread.sleep(100); // 模拟数据库操作
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }

    private String generateOrderId(String userId, String productId) {
        // 模拟生成订单号
        return "ORDER_" + System.currentTimeMillis() + "_" + userId + "_" + productId;
    }

    private void saveOrder(String orderId, String userId, String productId, int quantity) {
        // 模拟保存订单
        System.out.println("保存订单: " + orderId + ", 用户: " + userId + ", 商品: " + productId + ", 数量: " + quantity);
        try {
            Thread.sleep(50); // 模拟数据库操作
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

这段代码使用 synchronized 关键字对 createOrder 方法进行了同步，这意味着同一时刻只有一个线程能够执行创建订单的流程。在高并发场景下，大量的请求会阻塞在 synchronized 块外，等待锁的释放。其他的线程只能等待，导致整体吞吐量大幅下降，响应时间变长，用户体验极差。

问题分析：

锁的范围过大： 全局锁将整个订单创建流程都保护起来，即使某些步骤（例如，生成订单号）并不需要同步，也会被阻塞。
并发度低： 同一时刻只能有一个线程执行订单创建流程，无法充分利用多核 CPU 的优势。
阻塞时间长： 由于订单创建流程包含多个步骤，每个步骤都需要一定的时间，导致线程阻塞时间较长，进一步降低了并发度。

3. 锁粒度过细：死锁的陷阱

有些人认为锁的粒度越细越好，于是将锁分解到非常小的范围。比如，对每个商品的库存都加一个锁。

import java.util.HashMap;
import java.util.Map;
import java.util.concurrent.locks.Lock;
import java.util.concurrent.locks.ReentrantLock;

public class OrderService {

    private final Map<String, Lock> productLocks = new HashMap<>();

    public String createOrder(String userId, String productId, int quantity) {
        Lock productLock = getLock(productId);

        productLock.lock();
        try {
            // 1. 检查库存
            if (!checkStock(productId, quantity)) {
                return "库存不足";
            }

            // 2. 扣减库存
            deductStock(productId, quantity);

            // 3. 生成订单
            String orderId = generateOrderId(userId, productId);

            // 4. 保存订单
            saveOrder(orderId, userId, productId, quantity);

            return orderId;
        } finally {
            productLock.unlock();
        }
    }

    private Lock getLock(String productId) {
        synchronized (productLocks) {
            if (!productLocks.containsKey(productId)) {
                productLocks.put(productId, new ReentrantLock());
            }
            return productLocks.get(productId);
        }
    }

    private boolean checkStock(String productId, int quantity) {
        // 模拟库存检查
        int stock = 100; // 假设初始库存为 100
        return stock >= quantity;
    }

    private void deductStock(String productId, int quantity) {
        // 模拟库存扣减
        System.out.println("扣减库存: " + productId + ", 数量: " + quantity);
        try {
            Thread.sleep(100); // 模拟数据库操作
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }

    private String generateOrderId(String userId, String productId) {
        // 模拟生成订单号
        return "ORDER_" + System.currentTimeMillis() + "_" + userId + "_" + productId;
    }

    private void saveOrder(String orderId, String userId, String productId, int quantity) {
        // 模拟保存订单
        System.out.println("保存订单: " + orderId + ", 用户: " + userId + ", 商品: " + productId + ", 数量: " + quantity);
        try {
            Thread.sleep(50); // 模拟数据库操作
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

这段代码为每个 productId 创建一个 ReentrantLock。虽然提高了并发度，但也引入了死锁的风险。考虑以下场景：

线程 A 尝试购买商品 1，获取了商品 1 的锁。
线程 B 尝试购买商品 2，获取了商品 2 的锁。
线程 A 随后尝试购买商品 2，需要等待线程 B 释放商品 2 的锁。
线程 B 随后尝试购买商品 1，需要等待线程 A 释放商品 1 的锁。

此时，线程 A 和线程 B 互相等待对方释放锁，导致死锁。系统会卡住，无法响应新的请求。

问题分析：

死锁风险： 过细的锁粒度可能导致多个线程持有不同的锁，并互相等待对方释放锁，从而导致死锁。
锁管理复杂： 需要维护大量的锁对象，增加了锁管理的复杂性。
性能开销： 频繁的加锁和解锁操作会带来额外的性能开销。

4. 合适的锁粒度设计：平衡并发与安全

那么，如何设计合适的锁粒度呢？我们需要在并发度和安全性之间找到一个平衡点。以下是一些常用的策略：

分段锁： 将数据分成多个段，每个段使用一个锁。例如，可以将商品库存数据分成多个段，每个段对应一个锁。这样，不同段的商品可以并发地进行库存扣减。

import java.util.concurrent.locks.Lock;
import java.util.concurrent.locks.ReentrantLock;

public class SegmentedStock {

    private final int segmentCount;
    private final StockSegment[] segments;

    public SegmentedStock(int segmentCount) {
        this.segmentCount = segmentCount;
        this.segments = new StockSegment[segmentCount];
        for (int i = 0; i < segmentCount; i++) {
            segments[i] = new StockSegment();
        }
    }

    public void deductStock(String productId, int quantity) {
        int segmentIndex = getSegmentIndex(productId);
        segments[segmentIndex].deductStock(productId, quantity);
    }

    private int getSegmentIndex(String productId) {
        return Math.abs(productId.hashCode()) % segmentCount;
    }

    private static class StockSegment {
        private final Lock lock = new ReentrantLock();
        private int stock = 100; // 假设初始库存为 100

        public void deductStock(String productId, int quantity) {
            lock.lock();
            try {
                if (stock >= quantity) {
                    stock -= quantity;
                    System.out.println("扣减库存: " + productId + ", 数量: " + quantity + ", 剩余库存: " + stock);
                    try {
                        Thread.sleep(50); // 模拟数据库操作
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                } else {
                    System.out.println("库存不足: " + productId);
                }
            } finally {
                lock.unlock();
            }
        }
    }

    public static void main(String[] args) throws InterruptedException {
        SegmentedStock segmentedStock = new SegmentedStock(16); // 将库存分成 16 段

        // 模拟并发扣减库存
        Thread[] threads = new Thread[100];
        for (int i = 0; i < 100; i++) {
            String productId = "PRODUCT_" + (i % 10); // 10 个不同的商品
            int quantity = 1;
            threads[i] = new Thread(() -> segmentedStock.deductStock(productId, quantity));
            threads[i].start();
        }

        for (Thread thread : threads) {
            thread.join();
        }
    }
}

乐观锁： 基于版本号或时间戳的乐观锁，适用于读多写少的场景。在更新数据时，检查版本号或时间戳是否与读取时一致，如果一致则更新，否则重试。

public class OptimisticLockExample {

    private int stock = 100;
    private int version = 0;

    public boolean deductStock(int quantity) {
        int currentStock = stock;
        int currentVersion = version;

        if (currentStock >= quantity) {
            // 模拟更新库存
            if (updateStock(currentStock - quantity, currentVersion)) {
                System.out.println("扣减库存成功，剩余库存: " + stock);
                return true;
            } else {
                System.out.println("扣减库存失败，版本冲突");
                return false;
            }
        } else {
            System.out.println("库存不足");
            return false;
        }
    }

    private synchronized boolean updateStock(int newStock, int expectedVersion) {
        if (version == expectedVersion) {
            stock = newStock;
            version++;
            return true;
        } else {
            return false;
        }
    }

    public static void main(String[] args) throws InterruptedException {
        OptimisticLockExample example = new OptimisticLockExample();

        // 模拟并发扣减库存
        Thread[] threads = new Thread[100];
        for (int i = 0; i < 100; i++) {
            int quantity = 1;
            threads[i] = new Thread(() -> {
                boolean success = false;
                while (!success) {
                    success = example.deductStock(quantity);
                    if (!success) {
                        // 重试
                        try {
                            Thread.sleep(10);
                        } catch (InterruptedException e) {
                            e.printStackTrace();
                        }
                    }
                }
            });
            threads[i].start();
        }

        for (Thread thread : threads) {
            thread.join();
        }
    }
}

RedLock（分布式锁）： 在分布式环境下，使用 RedLock 来保证锁的全局唯一性。RedLock 是一种基于 Redis 的分布式锁算法，可以防止单点故障导致的锁失效。
避免长事务： 尽量避免在事务中持有锁的时间过长，可以将一些非关键的操作移到事务之外。

5. 代码示例：基于 Redis 的分布式锁

import redis.clients.jedis.Jedis;
import redis.clients.jedis.params.SetParams;

import java.util.Collections;

public class RedisDistributedLock {

    private final String lockKey;
    private final String lockValue; // 建议使用UUID
    private final int expireTime; // 锁的过期时间，单位：毫秒
    private final Jedis jedis;

    public RedisDistributedLock(String lockKey, String lockValue, int expireTime, Jedis jedis) {
        this.lockKey = lockKey;
        this.lockValue = lockValue;
        this.expireTime = expireTime;
        this.jedis = jedis;
    }

    /**
     * 尝试获取锁
     * @return true：获取锁成功，false：获取锁失败
     */
    public boolean tryLock() {
        SetParams params = new SetParams().ex(expireTime / 1000).nx(); // NX表示只有key不存在时才设置，EX表示设置过期时间(秒)
        String result = jedis.set(lockKey, lockValue, params.toString());
        return "OK".equals(result);
    }

    /**
     * 释放锁
     */
    public void unlock() {
        String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
        Object result = jedis.eval(script, Collections.singletonList(lockKey), Collections.singletonList(lockValue));
        if ("1".equals(result.toString())) {
            System.out.println("释放锁成功");
        } else {
            System.out.println("释放锁失败，可能锁已过期或被其他线程持有");
        }
    }

    public static void main(String[] args) throws InterruptedException {
        String lockKey = "my_lock";
        String lockValue = "unique_value_" + System.currentTimeMillis(); // 建议使用UUID
        int expireTime = 5000; // 5秒过期时间

        // 实际应用中，这里应该从连接池获取 Jedis 实例
        Jedis jedis = new Jedis("localhost", 6379);

        RedisDistributedLock lock = new RedisDistributedLock(lockKey, lockValue, expireTime, jedis);

        if (lock.tryLock()) {
            System.out.println("获取锁成功，执行业务逻辑...");
            try {
                Thread.sleep(3000); // 模拟业务逻辑执行时间
            } catch (InterruptedException e) {
                e.printStackTrace();
            } finally {
                lock.unlock();
                jedis.close();
            }
        } else {
            System.out.println("获取锁失败，稍后重试...");
            jedis.close();
        }
    }
}

注意事项：

锁的超时时间： 需要设置合理的锁超时时间，防止死锁。如果业务逻辑执行时间过长，可以考虑延长锁的超时时间。
锁的重试机制： 如果获取锁失败，可以进行重试，但需要避免无限重试，防止 CPU 占用过高。
锁的续租： 如果业务逻辑执行时间可能超过锁的超时时间，可以考虑使用锁的续租机制，定期延长锁的超时时间。

6. 性能测试与监控

锁粒度设计完成后，需要进行充分的性能测试，验证锁的性能是否满足需求。可以使用 JMeter、LoadRunner 等工具进行压力测试，模拟高并发场景。同时，需要对锁的竞争情况进行监控，例如，可以使用 JConsole、VisualVM 等工具监控线程的阻塞情况。

监控指标：

吞吐量： 每秒处理的订单数量。
响应时间： 创建订单的平均时间。
锁竞争率： 线程等待锁的比例。
CPU 利用率： CPU 的使用情况。

通过性能测试和监控，可以发现锁的瓶颈，并进行优化。

应对高并发，优化设计需要考虑更多

在高并发订单系统中，锁粒度设计是一个非常重要的环节。锁粒度过粗会导致并发度低，锁粒度过细会导致死锁。我们需要根据实际情况，选择合适的锁粒度，并在并发度和安全性之间找到一个平衡点。同时，需要进行充分的性能测试和监控，及时发现和解决锁的瓶颈。除了锁优化，缓存策略、异步处理、数据库优化等都是高并发系统设计的重要组成部分。

Java 高并发订单系统锁粒度设计不当导致性能崩溃案例分析

发表回复 取消回复

发表回复取消回复