解析 `std::priority_queue`：如何在原始数组上构建并维护一个高性能的堆？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位同学，大家下午好！

今天，我们将深入探讨C++标准库中一个非常实用且性能卓越的容器适配器——std::priority_queue。它在很多算法和实际问题中都扮演着关键角色，例如任务调度、Dijkstra最短路径算法、Huffman编码等等。我们将从其底层数据结构——堆（Heap）的原理出发，详细解析std::priority_queue是如何在原始数组（通常是std::vector）上构建并高效维护一个堆的，以及它如何实现高性能的插入、删除和查找最大（或最小）元素操作。

1. `std::priority_queue` 简介：一个基于堆的容器适配器

std::priority_queue 并不是一个独立的数据结构，而是一个“容器适配器”（Container Adapter）。这意味着它不直接存储数据，而是封装了（或“适配”了）一个已有的序列容器（如std::vector或std::deque），并提供了一组特定的接口，使其行为类似于一个优先级队列。

优先级队列的核心特性是：无论何时，你总能高效地访问到队列中优先级最高的元素（默认是最大的元素）。当元素被移除时，下一个优先级最高的元素会自动浮到队首。

默认情况下，std::priority_queue 实现的是一个最大堆（max-heap），即队首元素总是所有元素中最大的。当然，我们也可以通过定制比较器使其成为一个最小堆（min-heap）。

它提供的主要操作包括：

push(value): 插入一个元素到队列中。
pop(): 移除优先级最高的元素。
top(): 返回优先级最高的元素的引用。
empty(): 检查队列是否为空。
size(): 返回队列中元素的数量。

这些操作的性能是其吸引人的关键。top() 操作通常是O(1)时间复杂度，而push() 和 pop() 操作则通常是O(log N)时间复杂度，其中N是队列中的元素数量。这得益于其底层数据结构——二叉堆。

2. 堆的基础：概念与数组表示

理解std::priority_queue的关键在于理解它所依赖的底层数据结构——二叉堆（Binary Heap）。

2.1 什么是二叉堆？

二叉堆是一种特殊的完全二叉树（Complete Binary Tree）。它满足两个关键属性：

完全二叉树属性（Shape Property）：除了最后一层外，其他所有层都被完全填充，并且最后一层的节点都尽可能地靠左排列。这意味着树的形状是固定的，没有“空洞”。
堆属性（Heap Property）：
- 最大堆（Max-Heap）：每个父节点的值都大于或等于其所有子节点的值。因此，根节点总是整个堆中最大的元素。
- 最小堆（Min-Heap）：每个父节点的值都小于或等于其所有子节点的值。因此，根节点总是整个堆中最小的元素。

由于完全二叉树的特性，二叉堆非常适合用数组来表示，这避免了使用指针，带来了更好的缓存局部性和更低的内存开销。

2.2 堆的数组表示

将完全二叉树存储在数组中是一种非常巧妙且高效的方式。其映射规则如下（假设数组从索引0开始）：

根节点：始终位于数组的第一个位置，即 array[0]。
节点 i 的左子节点：位于 array[2 * i + 1]。
节点 i 的右子节点：位于 array[2 * i + 2]。
节点 i 的父节点：位于 array[(i - 1) / 2]（这里整数除法会自动向下取整）。

示例：

假设我们有一个最大堆，包含元素 [100, 80, 90, 40, 50, 70, 60]。
在数组中的表示即为 [100, 80, 90, 40, 50, 70, 60]。

让我们验证一下索引关系：

节点100 (索引0)：
- 左子节点：2*0 + 1 = 1，即 array[1] (80)。
- 右子节点：2*0 + 2 = 2，即 array[2] (90)。
节点80 (索引1)：
- 父节点：(1 - 1) / 2 = 0，即 array[0] (100)。
- 左子节点：2*1 + 1 = 3，即 array[3] (40)。
- 右子节点：2*1 + 2 = 4，即 array[4] (50)。

这种数组表示的优势在于：

空间效率：不需要额外的指针存储父子关系，节省内存。
时间效率：通过简单的算术运算即可快速定位父子节点，且数据在内存中是连续的，有利于CPU缓存命中。

3. 核心操作：堆的构建与维护

std::priority_queue 的高性能得益于其底层堆操作的效率。这些操作主要包括元素的插入（push）、元素的删除（pop）以及从一个无序数组构建堆（初始构造）。这些操作的核心是维护堆属性，通常通过“上浮”（sift-up）和“下沉”（sift-down）两种操作实现。

C++标准库提供了std::make_heap、std::push_heap和std::pop_heap这三个算法，它们直接操作一个范围（通常是std::vector），正是std::priority_queue内部所依赖的。

3.1 插入元素：`push()` 操作（等价于 `std::push_heap`）

当我们将一个新元素插入到堆中时，我们需要确保插入后堆属性仍然保持。这个过程通常分为两步，并涉及“上浮”（sift-up）操作：

将新元素添加到数组的末尾：由于堆是一个完全二叉树，新元素总是被放置在数组的最后一个位置，以保持完全二叉树的形状属性。
上浮（Sift-Up / Bubble-Up）：将新添加的元素与其父节点进行比较。如果新元素比父节点优先级更高（例如，在最大堆中更大），则交换它们。重复这个过程，直到新元素不再比其父节点优先级高，或者它已经到达了堆的根部。

上浮操作的伪代码（最大堆为例）：

void sift_up(std::vector<T>& heap, int index) {
    // 当前节点索引为 index
    // 父节点索引为 (index - 1) / 2
    int parent_index = (index - 1) / 2;

    // 只要当前节点不是根节点，并且当前节点的值大于父节点的值
    while (index > 0 && heap[index] > heap[parent_index]) {
        std::swap(heap[index], heap[parent_index]); // 交换当前节点与父节点
        index = parent_index;                        // 更新当前节点索引为父节点索引
        parent_index = (index - 1) / 2;              // 更新父节点索引
    }
}

// 模拟 push 操作
void push(std::vector<T>& heap, const T& value) {
    heap.push_back(value); // 添加到末尾
    sift_up(heap, heap.size() - 1); // 对新添加的元素执行上浮操作
}

std::push_heap 算法正是执行这个逻辑。它假定除最后一个元素外，[first, last-1) 范围内的元素已经构成了一个堆，然后将 *(last-1) 元素上浮到正确的位置。

时间复杂度：在最坏情况下，新元素可能从叶子节点一直上浮到根节点，这需要进行 log N 次比较和交换操作。因此，push() 操作的时间复杂度是 O(log N)。

3.2 移除优先级最高的元素：`pop()` 操作（等价于 `std::pop_heap`）

移除堆中优先级最高的元素（总是根节点）的过程比插入稍微复杂一些，涉及“下沉”（sift-down）操作：

交换根节点与最后一个元素：将堆的根元素（array[0]）与数组的最后一个元素进行交换。
移除最后一个元素：现在原先的根元素位于数组末尾，可以直接将其从数组中移除（或者逻辑上缩小堆的大小）。
下沉（Sift-Down / Bubble-Down）：现在新的根元素（原先的最后一个元素）可能不满足堆属性。我们需要对其进行“下沉”操作。将其与其子节点进行比较，如果它比子节点优先级低（例如，在最大堆中更小），则与优先级更高的那个子节点交换。重复这个过程，直到当前元素不再比其子节点优先级低，或者它已经到达了堆的叶子节点。

下沉操作的伪代码（最大堆为例）：

void sift_down(std::vector<T>& heap, int index, int heap_size) {
    // 当前节点索引为 index
    // 左子节点索引为 2*index + 1
    // 右子节点索引为 2*index + 2
    int largest_child_index;

    while (true) {
        int left_child_index = 2 * index + 1;
        int right_child_index = 2 * index + 2;
        largest_child_index = index; // 假设当前节点是最大的

        // 检查左子节点是否存在且是否比当前节点大
        if (left_child_index < heap_size && heap[left_child_index] > heap[largest_child_index]) {
            largest_child_index = left_child_index;
        }

        // 检查右子节点是否存在且是否比当前节点大，并与 largest_child_index 比较
        if (right_child_index < heap_size && heap[right_child_index] > heap[largest_child_index]) {
            largest_child_index = right_child_index;
        }

        // 如果最大的不是当前节点，说明需要交换
        if (largest_child_index != index) {
            std::swap(heap[index], heap[largest_child_index]); // 交换
            index = largest_child_index;                        // 更新当前节点索引
        } else {
            // 如果当前节点就是最大的，则堆属性已满足，停止下沉
            break;
        }
    }
}

// 模拟 pop 操作
void pop(std::vector<T>& heap) {
    if (heap.empty()) return;

    std::swap(heap[0], heap[heap.size() - 1]); // 根节点与最后一个元素交换
    heap.pop_back();                           // 移除原根节点（现在在末尾）
    if (!heap.empty()) {
        sift_down(heap, 0, heap.size()); // 对新的根节点执行下沉操作
    }
}

std::pop_heap 算法实际上执行了交换根元素和最后一个元素，然后对新的根元素执行下沉操作，但它并不会真正pop_back容器，只是将最大的元素放在了容器的末尾，并收缩了堆的逻辑大小。容器的实际pop_back通常由调用者自行完成。

时间复杂度：在最坏情况下，新根元素可能从根节点一直下沉到叶子节点，这需要进行 log N 次比较和交换操作。因此，pop() 操作的时间复杂度是 O(log N)。

3.3 初始构建堆：`std::priority_queue` 的构造函数（等价于 `std::make_heap`）

当std::priority_queue 使用一个范围的元素进行初始化时（例如，从一个std::vector），它需要将这些无序的元素组织成一个堆。最直观的方式是逐个插入N个元素，这将是 N * O(log N)，即 O(N log N)。然而，有一种更高效的“自底向上”构建堆的方法，其时间复杂度为 O(N)。

自底向上构建堆的原理：

找到第一个非叶子节点：在数组表示的堆中，所有索引大于或等于 N/2 的节点都是叶子节点（N是元素数量）。叶子节点本身就满足堆属性（因为它们没有子节点）。因此，我们从最后一个非叶子节点开始处理，其索引是 (N / 2) - 1。
对每个非叶子节点执行下沉操作：从 (N / 2) - 1 索引的节点开始，向前遍历到根节点（索引0）。对每个节点，都执行一次 sift_down 操作。
- 当对一个节点执行 sift_down 时，它会确保以该节点为根的子树满足堆属性。
- 由于我们是从下往上、从右往左处理的，当我们处理到某个节点时，它的所有子树都已经被处理并满足堆属性了。因此，只需对其自身执行下沉操作即可。

构建堆的伪代码：

void make_heap(std::vector<T>& heap) {
    int heap_size = heap.size();
    // 从第一个非叶子节点开始，向前遍历到根节点
    for (int i = (heap_size / 2) - 1; i >= 0; --i) {
        sift_down(heap, i, heap_size); // 对每个节点执行下沉操作
    }
}

std::make_heap 算法就是执行这个 O(N) 过程来将一个范围的元素组织成一个堆。

时间复杂度：虽然每个 sift_down 操作的复杂度是 O(log N)，但并非所有节点都在同一深度。叶子节点无需操作，靠近叶子节点的节点只需下沉很短的距离。仔细分析可知，所有这些 sift_down 操作的总和是 O(N)。这是一个非常重要的优化，使得从无序数据构建堆比逐个插入更高效。

4. `std::priority_queue` 的内部机制与定制

了解了堆的核心操作后，我们再回过头来看 std::priority_queue 如何利用这些机制。

4.1 容器适配器模式

std::priority_queue 的类模板定义通常如下：

template<
    class T,
    class Container = std::vector<T>,
    class Compare = std::less<typename Container::value_type>
> class priority_queue;

T: 存储在队列中的元素类型。
Container: 底层使用的序列容器类型。默认是 std::vector<T>。
Compare: 一个二元谓词（binary predicate），用于定义元素的优先级。默认是 std::less<T>，它使得 a < b 为真时 a 的优先级低于 b，从而实现最大堆（最大的元素优先级最高）。

这意味着 std::priority_queue 内部会持有一个 Container 类型的成员变量，所有的堆操作（push_heap, pop_heap, make_heap）都会作用于这个底层容器。

4.2 底层容器的选择

std::priority_queue 要求底层容器必须支持以下操作：

front(): 获取第一个元素（即堆的根）。
push_back(): 在末尾添加元素。
pop_back(): 移除末尾元素。
size(): 获取元素数量。
随机访问迭代器：以便能够通过索引访问元素，这是 std::make_heap、std::push_heap 和 std::pop_heap 所必需的。

std::vector<T> 和 std::deque<T> 都满足这些要求。然而，std::vector<T> 通常是更好的选择，原因如下：

内存连续性：std::vector 的元素在内存中是连续存储的，这极大地提高了缓存局部性，使得访问和遍历更加高效。对于堆的数组表示，这意味着父子节点通常在内存中距离较近，减少了缓存未命中的可能性。
push_back 性能：虽然 std::vector 在扩容时可能需要重新分配和拷贝，但在平均情况下，push_back 的时间复杂度是 O(1)。
简洁性与效率：对于堆这种需要频繁随机访问和在末尾增删的结构，std::vector 是天作之合。

4.3 比较器的定制

std::priority_queue 默认是一个最大堆，这是因为默认的 Compare 类型是 std::less<T>。std::less<T>(a, b) 返回 true 表示 a < b。在堆的内部，它会根据这个比较器来决定哪个元素的优先级更高。如果 cmp(a, b) 为 true，则表示 b 的优先级高于 a（或者说 b 应该在 a 的前面）。因此，std::less<T> 会使得“更大”的元素优先级更高，从而形成最大堆。

要实现一个最小堆，我们需要让“更小”的元素优先级更高。这可以通过提供 std::greater<T> 作为 Compare 类型来实现：

#include <queue>
#include <vector>
#include <functional> // For std::greater

// 最小堆：
// 使用 std::greater<int> 作为比较器
std::priority_queue<int, std::vector<int>, std::greater<int>> min_pq;

对于自定义类型，我们也可以提供自己的比较器：

struct MyObject {
    int value;
    std::string name;

    // 自定义比较函数，例如按 value 降序排列（最大堆）
    // 或者按 value 升序排列（最小堆）
    // 这里的 operator< 是为了让 std::priority_queue 默认行为工作
    // 如果要定制，可以直接传入 lambda 或 functor
    bool operator<(const MyObject& other) const {
        return value < other.value; // 默认行为，value越大优先级越高
    }
};

// 使用默认比较器（MyObject::operator<），得到一个基于 value 的最大堆
std::priority_queue<MyObject> pq_max_obj;

// 自定义比较器实现最小堆 (value 越小优先级越高)
struct CompareMyObjectMin {
    bool operator()(const MyObject& a, const MyObject& b) const {
        return a.value > b.value; // 如果 a.value > b.value 为真，则 a 的优先级低于 b (a 应该在 b 后面)
    }
};
std::priority_queue<MyObject, std::vector<MyObject>, CompareMyObjectMin> pq_min_obj;

// 或者使用 Lambda 表达式实现最小堆
auto lambda_compare_min = [](const MyObject& a, const MyObject& b) {
    return a.value > b.value;
};
std::priority_queue<MyObject, std::vector<MyObject>, decltype(lambda_compare_min)> pq_min_obj_lambda(lambda_compare_min);

关键在于，Compare 对象 comp 在判断两个元素 a 和 b 谁的优先级更高时，如果 comp(a, b) 返回 true，则意味着 a 的优先级低于 b，b 应该排在 a 前面。

5. 性能分析

下表总结了 std::priority_queue 各项操作的理论时间复杂度：

操作	时间复杂度	备注
`top()`	O(1)	仅返回根元素
`push()`	O(log N)	元素上浮操作
`pop()`	O(log N)	元素下沉操作
`empty()`	O(1)	检查底层容器是否为空
`size()`	O(1)	返回底层容器的尺寸
构造函数 (空)	O(1)	初始化底层容器
构造函数 (范围)	O(N)	`std::make_heap` 的效率，而非 `N * log N`

空间复杂度：std::priority_queue 需要存储 N 个元素，因此空间复杂度为 O(N)。

缓存友好性：由于堆的数组表示使得元素在内存中是连续存储的，这带来了良好的缓存局部性。当进行上浮或下沉操作时，访问的父子节点往往在物理内存上是相邻的，这有助于减少CPU缓存未命中，从而提高实际运行性能。相较于基于指针的树结构（如std::map或std::set），这种内存布局优势在处理大量数据时尤为明显。

6. 代码实践

让我们通过几个代码示例来演示 std::priority_queue 的使用：

6.1 基本的最大堆用法

#include <iostream>
#include <queue> // 包含 priority_queue
#include <vector>

void demo_max_heap() {
    std::cout << "--- 默认最大堆示例 ---" << std::endl;
    std::priority_queue<int> pq; // 默认是 std::vector<int> 和 std::less<int> (最大堆)

    pq.push(30);
    pq.push(10);
    pq.push(50);
    pq.push(20);
    pq.push(40);

    std::cout << "队列大小: " << pq.size() << std::endl; // 输出 5

    while (!pq.empty()) {
        std::cout << pq.top() << " "; // 访问最大元素
        pq.pop();                     // 移除最大元素
    }
    std::cout << std::endl; // 输出: 50 40 30 20 10
}

6.2 最小堆用法

#include <iostream>
#include <queue>
#include <vector>
#include <functional> // 用于 std::greater

void demo_min_heap() {
    std::cout << "--- 最小堆示例 ---" << std::endl;
    // 第一个模板参数是元素类型
    // 第二个模板参数是底层容器类型 (通常是 std::vector)
    // 第三个模板参数是比较器 (std::greater<int> 实现最小堆)
    std::priority_queue<int, std::vector<int>, std::greater<int>> min_pq;

    min_pq.push(30);
    min_pq.push(10);
    min_pq.push(50);
    min_pq.push(20);
    min_pq.push(40);

    std::cout << "队列大小: " << min_pq.size() << std::endl; // 输出 5

    while (!min_pq.empty()) {
        std::cout << min_pq.top() << " "; // 访问最小元素
        min_pq.pop();                      // 移除最小元素
    }
    std::cout << std::endl; // 输出: 10 20 30 40 50
}

6.3 使用自定义类型和比较器

#include <iostream>
#include <queue>
#include <vector>
#include <string>

// 自定义结构体
struct Task {
    std::string name;
    int priority; // 优先级，数字越大优先级越高

    // 为了在 priority_queue 中作为最大堆工作，需要重载 operator<
    // 使得 priority 越大的 Task 被认为是“更大”的
    bool operator<(const Task& other) const {
        return priority < other.priority;
    }
};

// 另一种方式：自定义比较器（Functor）
struct TaskComparatorMin {
    bool operator()(const Task& a, const Task& b) const {
        // 如果 a.priority > b.priority，则 a 的优先级低于 b
        // 从而实现 priority 越小，优先级越高的最小堆
        return a.priority > b.priority;
    }
};

void demo_custom_type() {
    std::cout << "--- 自定义类型最大堆示例 ---" << std::endl;
    // 使用默认的 operator< (高优先级数字的 Task 优先)
    std::priority_queue<Task> task_pq;

    task_pq.push({"Task A", 3});
    task_pq.push({"Task B", 1});
    task_pq.push({"Task C", 5});
    task_pq.push({"Task D", 2});

    while (!task_pq.empty()) {
        Task t = task_pq.top();
        std::cout << "执行任务: " << t.name << " (优先级: " << t.priority << ")" << std::endl;
        task_pq.pop();
    }
    // 输出: Task C, Task A, Task D, Task B

    std::cout << "n--- 自定义类型最小堆示例 (使用 Functor) ---" << std::endl;
    std::priority_queue<Task, std::vector<Task>, TaskComparatorMin> min_task_pq;

    min_task_pq.push({"Task A", 3});
    min_task_pq.push({"Task B", 1});
    min_task_pq.push({"Task C", 5});
    min_task_pq.push({"Task D", 2});

    while (!min_task_pq.empty()) {
        Task t = min_task_pq.top();
        std::cout << "执行任务: " << t.name << " (优先级: " << t.priority << ")" << std::endl;
        min_task_pq.pop();
    }
    // 输出: Task B, Task D, Task A, Task C
}

int main() {
    demo_max_heap();
    std::cout << std::endl;
    demo_min_heap();
    std::cout << std::endl;
    demo_custom_type();
    return 0;
}

6.4 从现有数据构建 `priority_queue`

#include <iostream>
#include <queue>
#include <vector>
#include <numeric> // For std::iota (optional, just for generating data)
#include <algorithm> // For std::random_shuffle (optional)

void demo_initial_construction() {
    std::cout << "--- 从现有数据构建 priority_queue 示例 ---" << std::endl;
    std::vector<int> data(10);
    std::iota(data.begin(), data.end(), 1); // data: [1, 2, ..., 10]
    std::random_shuffle(data.begin(), data.end()); // 打乱数据

    std::cout << "原始数据: ";
    for (int x : data) {
        std::cout << x << " ";
    }
    std::cout << std::endl;

    // 直接从一个迭代器范围构建 priority_queue
    // 内部会调用 std::make_heap，以 O(N) 复杂度构建
    std::priority_queue<int> pq_from_data(data.begin(), data.end());

    std::cout << "构建后的队列 (最大堆): ";
    while (!pq_from_data.empty()) {
        std::cout << pq_from_data.top() << " ";
        pq_from_data.pop();
    }
    std::cout << std::endl; // 输出: 10 9 8 7 6 5 4 3 2 1

    // 也可以通过 std::make_heap, std::push_heap, std::pop_heap 手动操作 vector
    std::vector<int> my_heap_vec = {1, 5, 2, 8, 3, 9, 4, 7, 6};
    std::cout << "手动操作堆的原始 vector: ";
    for (int x : my_heap_vec) {
        std::cout << x << " ";
    }
    std::cout << std::endl;

    std::make_heap(my_heap_vec.begin(), my_heap_vec.end()); // O(N) 构建最大堆
    std::cout << "make_heap 后 (根在最前): " << my_heap_vec[0] << std::endl; // 输出 9

    my_heap_vec.push_back(10);
    std::push_heap(my_heap_vec.begin(), my_heap_vec.end()); // 将 10 上浮
    std::cout << "push_heap 后 (根在最前): " << my_heap_vec[0] << std::endl; // 输出 10

    std::pop_heap(my_heap_vec.begin(), my_heap_vec.end()); // 10 移动到末尾，新的根是 9
    std::cout << "pop_heap 后 (根在最前): " << my_heap_vec[0] << ", 移除的元素: " << my_heap_vec.back() << std::endl; // 输出 9, 移除的元素 10
    my_heap_vec.pop_back(); // 真正移除元素
}
// main 函数中调用 demo_initial_construction();

7. 进一步思考

std::priority_queue 是一个非常强大的工具，适用于需要频繁访问和移除最大（或最小）元素的场景。

Dijkstra’s Algorithm 和 Prim’s Algorithm：在图算法中，std::priority_queue 可以用来高效地选取下一个要处理的、距离最小的顶点。
Top K 问题：例如，找出数组中最大的 K 个元素，或者数据流中最小的 K 个元素。
任务调度：根据任务的优先级来安排执行顺序。
事件驱动模拟：按时间顺序处理事件。

虽然 std::priority_queue 提供了高效的 top, push, pop 操作，但它并不支持随机访问任意元素，也不支持修改或删除非顶部的元素。如果需要这些功能，可能需要考虑其他数据结构，如 std::set（基于红黑树，提供有序存储和 O(log N) 的插入、删除和查找，但空间开销更大）或自定义的基于堆的结构。

std::priority_queue 内部依赖的 std::make_heap, std::push_heap, std::pop_heap 算法可以直接操作 std::vector，提供了一种更灵活的方式来管理堆，当你需要对堆的底层数组有更多控制时（例如，在堆中删除一个非根元素，虽然复杂，但并非不可能），这些算法会非常有用。

总结

std::priority_queue 是C++标准库中一个基于二叉堆实现的容器适配器，它在底层std::vector上通过高效的“上浮”和“下沉”操作维护堆属性，从而提供了O(1)的top操作和O(log N)的push/pop操作。其O(N)的构造算法和良好的缓存局部性使其成为处理优先级相关问题的优选工具。

1. std::priority_queue 简介：一个基于堆的容器适配器