Java并发容器：ConcurrentSkipListMap的查找、插入、删除操作的无锁实现 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，我们开始。

Java并发容器：ConcurrentSkipListMap的无锁实现

大家好，今天我们来深入探讨Java并发容器ConcurrentSkipListMap的实现原理，重点关注其查找、插入和删除操作的无锁实现。ConcurrentSkipListMap是Java并发包java.util.concurrent中的一个线程安全的有序Map，它使用跳表（Skip List）数据结构来实现。相比于传统的基于锁的并发Map，ConcurrentSkipListMap通过精心设计的算法，在大多数情况下能够实现无锁并发访问，从而提供更高的性能。

1. 跳表的基本概念

在深入了解ConcurrentSkipListMap之前，我们先回顾一下跳表的基本概念。跳表是一种概率型数据结构，它在链表的基础上增加了多层索引，从而实现了近似于平衡树的查找效率。

基本链表： 跳表的最底层是一个有序链表，包含所有元素。
多层索引： 在基本链表之上，跳表构建多层索引。每一层索引都是其下一层链表的一个子集，并且元素按照相同的顺序排列。
概率晋升： 一个元素是否会被添加到上一层索引，由一个概率值决定。通常，这个概率值是1/2或1/4。

跳表的查找过程类似于二分查找。从顶层索引开始，沿着索引找到小于目标值的最大节点，然后下降到下一层索引继续查找，直到找到目标值或到达底层链表。

2. ConcurrentSkipListMap的数据结构

ConcurrentSkipListMap的内部数据结构是基于跳表的并发实现。它主要包含以下几个关键组成部分：

Node： 表示跳表中的节点，存储键值对。Node类包含key、value和next字段。value字段可以为null，表示该节点已被逻辑删除。
Index： 表示跳表中的索引节点，用于加速查找。Index类包含node和down、right字段。node指向对应的Node节点，down指向下一层索引节点，right指向同一层级的下一个索引节点。
head： 指向跳表的头节点，头节点不存储任何键值对，只是作为跳表的入口。

ConcurrentSkipListMap使用CAS（Compare and Swap）操作来实现对节点和索引的原子更新，从而避免了显式锁的使用。

3. 查找操作（get(Object key)）

ConcurrentSkipListMap的查找操作从头节点开始，逐层向下查找，直到找到目标键值对或确定键不存在。

public V get(Object key) {
    if (key == null)
        throw new NullPointerException();
    Comparable<? super K> k = comparable(key);
    Node<K,V> b = findNode(k);
    if (b != null) {
        Object v = b.value;
        if (v != null)
            return (V)v;
    }
    return null;
}

private Node<K,V> findNode(Comparable<? super K> key) {
    for (;;) {
        Node<K,V> b = head;
        Node<K,V> n = b.next;
        for (;;) {
            if (n == null)
                return b;
            Node<K,V> f = n.next;
            if (n != b.next)               // inconsistent read
                break;
            Object v = n.value;
            if (v == null) {                // n is deleted
                n = (f != null) ? f : b.next;
                break;
            }
            if (v != n.value)               // inconsistent read
                break;
            int c = key.compareTo(n.key);
            if (c > 0) {
                b = n;
                n = f;
            } else if (c == 0) {
                return n;
            } else {
                return b;
            }
        }
    }
}

findNode(Comparable<? super K> key)： 这个方法是查找的核心。它从head节点开始遍历跳表。
循环查找： 使用两层循环，外层循环处理并发修改导致的不一致性，内层循环在同一层级上查找。
n != b.next： 检查当前节点的next指针是否被修改，如果被修改，说明有其他线程正在修改链表结构，需要重新开始查找。
v == null： 检查当前节点的value是否为null，如果为null，说明该节点已被逻辑删除，需要跳过该节点。
key.compareTo(n.key)： 比较目标键和当前节点的键，如果目标键大于当前节点的键，则继续向后查找；如果目标键等于当前节点的键，则找到目标节点；如果目标键小于当前节点的键，则返回前一个节点。

4. 插入操作（put(K key, V value)）

ConcurrentSkipListMap的插入操作相对复杂，需要处理多层索引的更新。

public V put(K key, V value) {
    if (value == null)
        throw new NullPointerException();
    return doPut(key, value, false);
}

private V doPut(K key, V value, boolean onlyIfAbsent) {
    Node<K,V> z;       // added node
    if (key == null)
        throw new NullPointerException();
    Comparable<? super K> k = comparable(key);
    for (;;) {
        Node<K,V> b = findNode(k);
        Node<K,V> n = b.next;
        for (;;) {
            if (n != null) {
                Node<K,V> f = n.next;
                if (n != b.next)               // inconsistent read
                    break;
                Object v = n.value;
                if (v == null) {                // n is deleted
                    n = (f != null) ? f : b.next;
                    break;
                }
                if (v != n.value)               // inconsistent read
                    break;
                int c = k.compareTo(n.key);
                if (c > 0) {
                    b = n;
                    n = f;
                } else if (c == 0) {
                    if (onlyIfAbsent || n.casValue(v, value)) {
                        return (V)v;
                    } else {
                        break;       // restart if lost race to set value
                    }
                } else {
                    break;       // key not found
                }
            } else {
                z = new Node<K,V>(key, value, n);
                if (!b.casNext(n, z))
                    break;         // restart if lost race to append to b
                randomLevel();
                if (level > 0) {
                    insertIndex(z, level);
                }
                return null;
            }
        }
    }
}

private void insertIndex(Node<K,V> z, int level) {
    HeadIndex<K,V> h = head;
    int max = h.level;

    if (level <= max) {
        Index<K,V> idx = null;
        for (int i = 1; i <= level; ++i)
            idx = new Index<K,V>(z, idx, null);

        addIndex(idx, h, level);

    } else { // Add a new level

        /*
         * To reduce interference by other threads, new levels are added
         * one by one.  We re-check the topmost level to avoid adding
         * duplicate towers.
         */

        level = max + 1;
        Index<K,V> idx = null;
        for (int i = 1; i <= level; ++i)
            idx = new Index<K,V>(z, idx, null);

        HeadIndex<K,V> newh = new HeadIndex<K,V>(z, idx, h, level);
        // Use CAS to install the new head.
        HeadIndex<K,V> oldh;
        while (((oldh = head) != h) ||
               !casHead(oldh, newh))
            h = head;       // re-read head
        if (oldh == h) {   // lost race to add level
            // Need to remove this level.
        }
    }
}

private void addIndex(Index<K,V> idx, HeadIndex<K,V> h, int level) {
    // Track down the right place to insert.
    int j = 1;
    for (;;) {
        Node<K,V> b = findNode(idx.node.key);
        if (j == level) {
            Index<K,V> index = null;
            for (int i = 0; i < j; i++) {
              index = new Index<K,V>(idx.node, index, null);
            }

            if (!b.casNext(idx.node, index.node))
                break;         // restart if lost race to append to b
            return;
        }
        j++;
    }
}

private int randomLevel() {
    int x = this.randomSeed;
    x ^= (x << 13);
    x ^= (x >>> 17);
    this.randomSeed = x ^= (x << 5);
    if ((x & 0x80000001) != 0) // test highest and lowest bit
        return 0;
    int level = 1;
    while (((randomSeed >>>= 1) & 1) != 0)
        ++level;
    return level;
}

doPut(K key, V value, boolean onlyIfAbsent)： 这个方法是插入的核心。
查找插入位置： 首先使用findNode(k)找到合适的插入位置。
CAS插入节点： 使用b.casNext(n, z)尝试原子地将新节点z插入到链表中。如果CAS操作失败，说明有其他线程正在修改链表结构，需要重新开始插入。
randomLevel()： 随机生成新节点的层级。
insertIndex(z, level)： 将新节点添加到相应的索引层级中。这个过程也使用了CAS操作来保证并发安全。
添加新层级： 如果随机生成的层级大于当前跳表的最高层级，需要添加新的层级。

5. 删除操作（remove(Object key)）

ConcurrentSkipListMap的删除操作也需要处理多层索引的更新。

public V remove(Object key) {
    if (key == null)
        throw new NullPointerException();
    return doRemove(key, null);
}

final V doRemove(Object key, Object value) {
    if (key == null)
        throw new NullPointerException();
    Comparable<? super K> k = comparable(key);
    for (;;) {
        Node<K,V> b = findNode(k);
        Node<K,V> n = b.next;
        for (;;) {
            if (n == null)
                return null;
            Node<K,V> f = n.next;
            if (n != b.next)               // inconsistent read
                break;
            Object v = n.value;
            if (v == null)                  // n is deleted
                break;
            if (v != n.value)               // inconsistent read
                break;
            int c = k.compareTo(n.key);
            if (c > 0) {
                b = n;
                n = f;
            } else if (c < 0) {
                return null;
            } else {
                if (value != null && !value.equals(v))
                    return null;
                if (n.casValue(v, null)) {
                    findNode(k);               // clean index
                    return (V)v;
                } else
                    break;
            }
        }
    }
}

doRemove(Object key, Object value)： 这个方法是删除的核心。
查找删除位置： 首先使用findNode(k)找到需要删除的节点。
CAS删除节点： 使用n.casValue(v, null)尝试原子地将节点的value设置为null，表示逻辑删除。如果CAS操作失败，说明有其他线程正在修改该节点，需要重新开始删除。
findNode(k) (Clean Index): 在逻辑删除后，调用 findNode(k) 可以帮助清理索引。虽然 ConcurrentSkipListMap 没有显式的索引维护线程，但是 findNode 方法在遍历过程中会检查并清理过时的索引项。当一个节点被逻辑删除后，其对应的索引项可能仍然存在。后续的 findNode 操作会检测到这些过时的索引项，并尝试将其移除，从而保持索引的有效性。这是一种延迟清理策略，避免了在删除操作中进行昂贵的索引维护。

6. 无锁实现的原理

ConcurrentSkipListMap的无锁实现主要依赖于以下几个关键技术：

CAS操作： 使用CAS操作来实现对节点和索引的原子更新。CAS操作可以在不加锁的情况下，原子地比较并交换变量的值。
版本号： 通过在节点中维护版本号，可以检测到并发修改，并进行重试。
延迟删除： 采用延迟删除策略，先将节点逻辑删除，然后在后续操作中再进行物理删除。

7. 性能分析

ConcurrentSkipListMap的性能主要取决于跳表的层级。理想情况下，跳表的层级应该保持在O(log n)级别，其中n是元素的数量。在这种情况下，ConcurrentSkipListMap的查找、插入和删除操作的时间复杂度都是O(log n)。

相比于传统的基于锁的并发Map，ConcurrentSkipListMap在大多数情况下能够提供更高的性能，因为它避免了锁的竞争。但是，在并发非常高的情况下，CAS操作的重试可能会导致性能下降。

8. 适用场景

ConcurrentSkipListMap适用于以下场景：

需要线程安全的有序Map。
读多写少的场景。
对性能要求较高的场景。

9. 总结

ConcurrentSkipListMap通过跳表数据结构和CAS操作实现了无锁并发访问，提供了高效的并发性能。其查找、插入和删除操作都经过精心设计，能够在并发环境下保证数据的一致性。ConcurrentSkipListMap是Java并发包中一个重要的组件，在需要线程安全的有序Map时，是一个不错的选择。

10. 关于ConcurrentSkipListMap的要点

ConcurrentSkipListMap 使用跳表，提供有序键值对存储。
它通过 CAS 操作实现无锁并发，提升性能。
查找、插入、删除等操作的时间复杂度为 O(log n)。

Java并发容器：ConcurrentSkipListMap的无锁实现

发表回复 取消回复

发表回复取消回复