分布式锁在高并发秒杀场景下导致争用严重的架构级优化方案 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

高并发秒杀场景下分布式锁争用优化：架构级方案

大家好，今天我们来聊聊高并发秒杀场景下，分布式锁争用严重的问题，以及如何通过架构级的优化方案来解决它。秒杀场景的特点是：瞬时高并发、资源有限、竞争激烈。如果使用不当的分布式锁，很容易导致系统性能瓶颈，影响用户体验，甚至造成超卖等严重问题。

1. 分布式锁的常见问题

在深入优化方案之前，我们先回顾一下分布式锁，以及它在高并发秒杀场景下可能遇到的问题。

1.1 什么是分布式锁？

分布式锁是为了解决分布式环境下，多个服务节点对共享资源进行并发访问时的数据一致性问题而产生的。它保证在同一时刻，只有一个服务节点能够获得锁，从而独占资源。

1.2 常见的分布式锁实现方式

基于数据库: 利用数据库的唯一索引或乐观锁实现。
基于Redis: 利用Redis的SETNX命令实现。
基于ZooKeeper: 利用ZooKeeper的临时顺序节点实现。

1.3 高并发秒杀场景下分布式锁的问题

性能瓶颈： 频繁的加锁和解锁操作会带来额外的网络开销和Redis/ZooKeeper的压力，在高并发场景下会迅速成为性能瓶颈。
锁竞争激烈： 大量请求争抢同一把锁，导致大部分请求阻塞或等待，降低了系统的吞吐量。
锁粒度过大： 如果锁的粒度太大，会导致即使操作的资源不冲突，也需要等待锁的释放，降低了并发度。
锁超时问题： 如果持有锁的节点发生故障，未能及时释放锁，会导致其他节点长时间等待，甚至发生死锁。

2. 架构级优化方案

针对以上问题，我们可以从架构层面入手，通过一系列优化手段来缓解分布式锁的压力，提高秒杀系统的性能和稳定性。

2.1 减少锁的使用：动静分离 + 异步处理

减少锁的使用，从根本上降低锁的竞争。可以通过动静分离和异步处理来实现。

动静分离： 将秒杀商品的静态信息（如商品名称、图片、描述等）缓存在CDN或静态资源服务器上，减少对后端服务的直接访问。秒杀请求只需要访问后端服务来验证资格、扣减库存即可。
异步处理： 将秒杀成功的订单处理逻辑（如生成订单、支付、发货等）放到异步队列中处理，避免阻塞秒杀主流程。

代码示例 (Redis + RabbitMQ):

# 秒杀接口
def seckill(user_id, product_id):
    # 1. 验证用户资格 (例如：是否已抢购过)
    if is_user_qualified(user_id, product_id):
        return "已经抢购过"

    # 2. 尝试扣减库存 (使用Redis原子操作)
    stock = redis_client.decr(f"product:{product_id}:stock")
    if stock < 0:
        redis_client.incr(f"product:{product_id}:stock") # 恢复库存
        return "已售罄"

    # 3. 秒杀成功，发送消息到消息队列
    message = {"user_id": user_id, "product_id": product_id}
    rabbitmq_client.publish(exchange="order_exchange", routing_key="order.create", message=json.dumps(message))

    return "秒杀成功，请稍后查看订单"

# 异步订单处理服务
def order_processor(message):
    user_id = message["user_id"]
    product_id = message["product_id"]

    # 1. 创建订单
    order = create_order(user_id, product_id)

    # 2. 支付
    payment = process_payment(order)

    # 3. 发货
    delivery = process_delivery(order)

    return "订单处理完成"

2.2 优化锁的粒度：分段锁

如果必须使用锁，则尽可能减小锁的粒度，避免不必要的锁竞争。可以使用分段锁技术。

分段锁： 将共享资源分成多个段，每个段对应一把锁。不同的请求可以访问不同的段，从而实现并发访问。

代码示例 (Java ConcurrentHashMap的分段锁思想):

import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.locks.ReentrantLock;

public class SegmentedLock {

    private final int segmentSize;
    private final ReentrantLock[] locks;
    private final ConcurrentHashMap<String, Object> dataMap = new ConcurrentHashMap<>();

    public SegmentedLock(int segmentSize) {
        this.segmentSize = segmentSize;
        this.locks = new ReentrantLock[segmentSize];
        for (int i = 0; i < segmentSize; i++) {
            locks[i] = new ReentrantLock();
        }
    }

    private int getSegmentIndex(String key) {
        return Math.abs(key.hashCode()) % segmentSize;
    }

    public Object get(String key) {
        return dataMap.get(key);
    }

    public void put(String key, Object value) {
        int segmentIndex = getSegmentIndex(key);
        ReentrantLock lock = locks[segmentIndex];
        lock.lock();
        try {
            dataMap.put(key, value);
        } finally {
            lock.unlock();
        }
    }

    public void remove(String key) {
        int segmentIndex = getSegmentIndex(key);
        ReentrantLock lock = locks[segmentIndex];
        lock.lock();
        try {
            dataMap.remove(key);
        } finally {
            lock.unlock();
        }
    }

    public static void main(String[] args) {
        SegmentedLock segmentedLock = new SegmentedLock(16);
        segmentedLock.put("product1", "商品A");
        segmentedLock.put("product2", "商品B");
        System.out.println(segmentedLock.get("product1"));
        segmentedLock.remove("product2");
    }
}

应用到秒杀场景： 假设我们有1000个商品，可以将这1000个商品分成10个段，每个段对应一把锁。当用户抢购不同段的商品时，就可以并发执行，而无需等待同一把锁的释放。

2.3 替代锁的方案：CAS + Token机制

在高并发场景下，可以考虑使用CAS（Compare and Swap）操作来替代锁。CAS是一种无锁算法，它通过原子性地比较和交换内存中的值来实现并发控制。结合Token机制可以进一步优化。

CAS扣减库存： 直接使用Redis的INCRBY命令原子性地减少库存，如果返回值小于0，则说明库存不足，需要回滚。
Token机制： 在秒杀开始前，预先生成一定数量的Token，用户只有获取到Token才能参与秒杀。Token可以存储在Redis中，使用DECR命令原子性地获取Token。

代码示例 (Redis + Lua脚本):

-- Lua脚本，原子性地扣减库存和获取Token
local product_id = KEYS[1]
local user_id = KEYS[2]
local stock_key = "product:" .. product_id .. ":stock"
local token_key = "product:" .. product_id .. ":token"
local user_key = "product:" .. product_id .. ":user:" .. user_id

-- 1. 检查用户是否已经抢购过
if redis.call("EXISTS", user_key) == 1 then
    return -1 -- 已经抢购过
end

-- 2. 尝试获取Token
local token = redis.call("DECR", token_key)
if token < 0 then
    redis.call("INCR", token_key) -- 恢复Token
    return -2 -- Token不足
end

-- 3. 扣减库存
local stock = redis.call("DECR", stock_key)
if stock < 0 then
    redis.call("INCR", stock_key) -- 恢复库存
    redis.call("INCR", token_key) -- 恢复Token
    return -3 -- 库存不足
end

-- 4. 标记用户已抢购
redis.call("SET", user_key, 1)
redis.call("EXPIRE", user_key, 86400) -- 24小时过期

return 1 -- 抢购成功

Java代码调用Lua脚本:

import redis.clients.jedis.Jedis;
import redis.clients.jedis.JedisPool;
import redis.clients.jedis.JedisPoolConfig;

import java.util.Collections;

public class SeckillWithLua {

    private static final String LUA_SCRIPT = "-- Lua脚本，原子性地扣减库存和获取Tokenn" +
            "local product_id = KEYS[1]n" +
            "local user_id = KEYS[2]n" +
            "local stock_key = "product:" .. product_id .. ":stock"n" +
            "local token_key = "product:" .. product_id .. ":token"n" +
            "local user_key = "product:" .. product_id .. ":user:" .. user_id + "123"n" +
            "n" +
            "-- 1. 检查用户是否已经抢购过n" +
            "if redis.call("EXISTS", user_key) == 1 thenn" +
            "    return -1 -- 已经抢购过n" +
            "endn" +
            "n" +
            "-- 2. 尝试获取Tokenn" +
            "local token = redis.call("DECR", token_key)n" +
            "if token < 0 thenn" +
            "    redis.call("INCR", token_key) -- 恢复Tokenn" +
            "    return -2 -- Token不足n" +
            "endn" +
            "n" +
            "-- 3. 扣减库存n" +
            "local stock = redis.call("DECR", stock_key)n" +
            "if stock < 0 thenn" +
            "    redis.call("INCR", stock_key) -- 恢复库存n" +
            "    redis.call("INCR", token_key) -- 恢复Tokenn" +
            "    return -3 -- 库存不足n" +
            "endn" +
            "n" +
            "-- 4. 标记用户已抢购n" +
            "redis.call("SET", user_key, 1)n" +
            "redis.call("EXPIRE", user_key, 86400) -- 24小时过期n" +
            "n" +
            "return 1 -- 抢购成功";

    private static final JedisPool jedisPool;
    private static final String PRODUCT_ID = "1001";

    static {
        JedisPoolConfig config = new JedisPoolConfig();
        config.setMaxTotal(100);
        config.setMaxIdle(20);
        config.setMinIdle(10);
        jedisPool = new JedisPool(config, "localhost", 6379);
    }

    public static int seckill(String userId) {
        try (Jedis jedis = jedisPool.getResource()) {
            Object result = jedis.eval(LUA_SCRIPT, Collections.unmodifiableList(Collections.asList(PRODUCT_ID, userId)), Collections.emptyList());
            return ((Long) result).intValue();
        }
    }

    public static void main(String[] args) {
        // 初始化库存和Token
        try (Jedis jedis = jedisPool.getResource()) {
            jedis.set("product:" + PRODUCT_ID + ":stock", "100");
            jedis.set("product:" + PRODUCT_ID + ":token", "100");
        }

        // 模拟并发抢购
        for (int i = 0; i < 200; i++) {
            final String userId = "user_" + i;
            new Thread(() -> {
                int result = seckill(userId);
                switch (result) {
                    case 1:
                        System.out.println(userId + " 抢购成功");
                        break;
                    case -1:
                        System.out.println(userId + " 已经抢购过");
                        break;
                    case -2:
                        System.out.println(userId + " Token不足");
                        break;
                    case -3:
                        System.out.println(userId + " 库存不足");
                        break;
                    default:
                        System.out.println(userId + " 未知错误");
                }
            }).start();
        }
    }
}

说明：

Lua脚本保证了扣减库存和获取Token的原子性。
EXISTS命令判断用户是否已经抢购过，防止重复抢购。
DECR命令原子性地减少库存和Token。
SET命令标记用户已抢购，并设置过期时间。

2.4 流量削峰：限流 + 熔断 + 降级

即使做了上述优化，在高并发场景下，系统仍然可能面临过载的风险。因此，需要采取流量削峰的措施来保护系统。

限流： 限制单位时间内请求的数量，防止系统被过多的请求压垮。
- 常用的限流算法： 令牌桶算法、漏桶算法。
- 限流方式： 基于Nginx的限流、基于Redis的限流、基于Guava RateLimiter的限流。
熔断： 当系统出现故障时，立即停止接受新的请求，防止故障蔓延。
- 常用的熔断器： Hystrix、Sentinel。
降级： 当系统资源不足时，牺牲部分功能，保证核心功能的可用性。
- 降级策略： 关闭非核心服务、返回默认值、使用缓存数据。

2.5 最终一致性方案：TCC (Try-Confirm-Cancel)

在高并发秒杀场景下，对数据一致性要求极高，但又不能过度依赖强一致性的分布式事务，因为性能损耗太大。可以考虑使用TCC事务模型，实现最终一致性。

Try阶段： 尝试执行业务，预留所需的资源。
Confirm阶段： 确认执行业务，真正扣减资源。
Cancel阶段： 取消执行业务，释放预留的资源。

TCC事务模型的优点：

性能较高，允许一定的最终一致性延迟。
适用于跨服务、跨数据库的分布式事务场景。

TCC事务模型的缺点：

实现复杂度较高，需要编写大量的Try、Confirm、Cancel逻辑。
需要考虑幂等性问题，保证Confirm和Cancel操作可以重复执行。

3. 架构图

将上述优化方案整合起来，可以得到以下架构图：

[用户] --> [CDN/静态资源服务器] (静态资源)
       |
       --> [API Gateway] (限流、认证)
           |
           --> [秒杀服务] (CAS扣减库存、Token机制)
               |
               --> [消息队列 (RabbitMQ/Kafka)]
                   |
                   --> [订单处理服务] (TCC事务、数据库操作)

4. 总结与思考

在高并发秒杀场景下，分布式锁的争用是一个常见的问题。通过动静分离、异步处理、分段锁、CAS + Token机制、流量削峰、TCC事务等一系列架构级优化方案，可以有效地缓解分布式锁的压力，提高系统的性能和稳定性。

在实际应用中，需要根据具体的业务场景和系统架构，选择合适的优化方案。没有银弹，只有最适合的方案。需要不断地进行性能测试和优化，才能打造出稳定、高效的秒杀系统。

5. 持续优化方向

预热： 提前将秒杀商品的数据加载到缓存中，避免冷启动时的性能问题。
灰度发布： 将新的优化方案逐步发布到线上，观察系统的性能表现。
监控和报警： 实时监控系统的各项指标，及时发现和解决问题。
压测： 定期进行压力测试，评估系统的承载能力。

希望今天的分享对大家有所帮助，谢谢！