C++ `std::span`：C++20 视图而非拥有数据的高效容器 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，让我们来一场关于 C++20 std::span 的脱口秀，标题就叫 "C++ std::span: 你瞅啥？瞅你妹的数据啊！"。

(开场音乐：一段欢快的电子乐)

大家好！欢迎来到今天的 “C++ 冷知识大放送” 节目。今天我们要聊的是一个 C++20 引入的，既强大又有点让人摸不着头脑的东西：std::span。

(停顿，喝一口水)

各位观众，有没有经历过这样的场景：你辛辛苦苦写了一个函数，希望它能处理数组，结果发现，这数组可以是 int[]，可以是 std::vector，可以是 std::array，甚至是 C 风格的指针。为了兼容所有这些，你写了一堆重载，代码膨胀得像吃了酵母的面包。

(模仿面包膨胀的声音)

别担心，std::span 就是来拯救你的！它可以让你用一种统一的方式，来观察（注意，是观察，不是拥有）一块连续的内存区域。

(语气严肃)

std::span 是什么？

简单来说，std::span 是一个 视图 (view)。它不拥有数据，只是提供了一种安全、高效的方式来访问一段连续的内存。你可以把它想象成一个望远镜，你拿着望远镜（std::span），可以看到远处的风景（数据），但风景不是你的，你也不能用望远镜去改变风景。

(举起一个想象中的望远镜)

std::span 的好处

零开销: std::span 非常轻量级。创建、复制 std::span 对象通常没有任何额外的性能开销，因为它只是存储了指向数据的指针和大小。
类型安全: 使用 std::span 可以避免一些常见的 C 风格数组的错误，比如数组越界。std::span 会记录数据的大小，并在访问时进行检查（或者在编译时，如果大小是已知的）。
统一的接口: 无论你处理的是 C 风格数组、std::vector、std::array，还是其他任何连续内存区域，都可以使用 std::span 来访问它们，而不需要编写大量的重载函数。
可以用于常量和非常量数据: std::span 可以指向常量数据（const int[]）和非常量数据（int[]），这使得它非常灵活。
支持子范围: 可以从一个 std::span 创建一个新的 std::span，指向原始 std::span 的一部分。这使得处理数组的子集非常方便。

(语气变得兴奋)

std::span 的基本用法

首先，你需要包含头文件 <span>。

#include <span>
#include <iostream>
#include <vector>
#include <array>

现在，让我们看一些例子：

1. 从 C 风格数组创建 std::span

int arr[] = {1, 2, 3, 4, 5};
std::span<int> span_arr(arr); // span_arr 指向 arr
std::span<int> span_arr2(arr, 3); // span_arr2 指向 arr 的前 3 个元素
std::span<int> span_arr3(arr, std::size(arr)); // C++17 及更高版本

这里，span_arr 指向整个 arr 数组，span_arr2 指向 arr 的前 3 个元素。注意，使用 std::size(arr) 可以安全地获取数组的大小，避免手动计算出错。

2. 从 std::vector 创建 std::span

std::vector<int> vec = {6, 7, 8, 9, 10};
std::span<int> span_vec(vec); // span_vec 指向 vec 的所有元素

非常简单，不是吗？span_vec 现在可以像一个指向 vec 的视图一样使用。

3. 从 std::array 创建 std::span

std::array<int, 5> arr_std = {11, 12, 13, 14, 15};
std::span<int> span_array(arr_std); // span_array 指向 arr_std

同样，span_array 指向 arr_std 的所有元素。

4. 使用 std::span 的函数

现在，让我们创建一个函数，它接受一个 std::span<int> 作为参数，并计算所有元素的和：

int sum(std::span<int> data) {
  int result = 0;
  for (int value : data) {
    result += value;
  }
  return result;
}

int main() {
  int arr[] = {1, 2, 3, 4, 5};
  std::vector<int> vec = {6, 7, 8, 9, 10};
  std::array<int, 5> arr_std = {11, 12, 13, 14, 15};

  std::cout << "Sum of arr: " << sum(arr) << std::endl;
  std::cout << "Sum of vec: " << sum(vec) << std::endl;
  std::cout << "Sum of arr_std: " << sum(arr_std) << std::endl;

  return 0;
}

看到了吗？无论我们传递的是 C 风格数组、std::vector 还是 std::array，sum 函数都可以正常工作。这简直太棒了！

(语气神秘)

std::span 的高级用法

std::span 还有一些更高级的用法，可以让你更灵活地处理数据。

1. std::span 的 subspan 方法

subspan 方法可以创建一个新的 std::span，指向原始 std::span 的一部分。

int arr[] = {1, 2, 3, 4, 5};
std::span<int> span_arr(arr);

std::span<int> sub_span = span_arr.subspan(1, 3); // 从索引 1 开始，长度为 3
// sub_span 现在指向 {2, 3, 4}

for (int value : sub_span) {
  std::cout << value << " "; // 输出：2 3 4
}
std::cout << std::endl;

subspan(offset, count) 方法会创建一个新的 std::span，从原始 std::span 的 offset 位置开始，包含 count 个元素。

2. std::span 的 first 和 last 方法

first(count) 方法返回一个包含原始 std::span 前 count 个元素的新 std::span。last(count) 方法返回一个包含原始 std::span 后 count 个元素的新 std::span。

int arr[] = {1, 2, 3, 4, 5};
std::span<int> span_arr(arr);

std::span<int> first_span = span_arr.first(2); // 包含前 2 个元素
std::span<int> last_span = span_arr.last(2); // 包含后 2 个元素

std::cout << "First two elements: ";
for (int value : first_span) {
  std::cout << value << " "; // 输出：1 2
}
std::cout << std::endl;

std::cout << "Last two elements: ";
for (int value : last_span) {
  std::cout << value << " "; // 输出：4 5
}
std::cout << std::endl;

3. std::span 和常量性

std::span 可以指向常量数据和非常量数据。如果你想确保你的函数不会修改数据，可以使用 std::span<const int>。

void print_data(std::span<const int> data) {
  for (int value : data) {
    std::cout << value << " ";
  }
  std::cout << std::endl;
}

int main() {
  int arr[] = {1, 2, 3, 4, 5};
  const int const_arr[] = {6, 7, 8, 9, 10};

  print_data(arr); // 可以传递非常量数组
  print_data(const_arr); // 也可以传递常量数组

  return 0;
}

std::span 与 gsl::span

如果你在 C++20 之前就听说过 span，那很可能你接触的是 Guidelines Support Library (GSL) 中的 gsl::span。std::span 的设计很大程度上受到了 gsl::span 的影响。它们的功能基本相同，但 std::span 是 C++ 标准库的一部分，因此使用起来更方便，也更安全。不需要额外引入库。

(语气严肃)

std::span 的注意事项

生命周期: std::span 只是一个视图，它不拥有数据。因此，你需要确保 std::span 指向的数据在 std::span 的生命周期内仍然有效。换句话说，别指望 std::span 帮你管理内存。
不要存储 std::span: 通常情况下，不建议在类中存储 std::span 对象。因为 std::span 只是一个视图，如果它指向的数据被销毁了，std::span 就会变成一个悬挂指针，导致未定义行为。如果需要在类中存储数据，应该使用 std::vector 或 std::array 等容器。
dynamic_extent: std::span 可以是静态大小的，也可以是动态大小的。静态大小的 std::span 在编译时就知道它指向的数据的大小。动态大小的 std::span 则需要在运行时才能确定大小。你可以使用 std::dynamic_extent 来表示动态大小。例如：std::span<int, 5> 表示一个静态大小为 5 的 std::span，而 std::span<int, std::dynamic_extent> 表示一个动态大小的 std::span。通常，我们更倾向于使用动态大小的 std::span，因为它更灵活。

(展示一个表格，用幽默的语言总结 std::span 的特点)

特性	描述	备注
本质	一个望远镜，只能看，不能摸！	别指望它帮你盖房子（分配内存）！
开销	几乎没有！轻如鸿毛！	比 C 风格数组强多了，安全又高效！
类型安全	妈妈再也不用担心我数组越界了！	前提是你正确使用它！
统一接口	各种数组、容器，统统拿下！	写更少的代码，做更多的事情！
常量性	可盐可甜，能指向常量数据，也能指向非常量数据！	灵活得像一条蛇！
生命周期	寄生虫！依赖于它指向的数据的生命周期！	数据没了，它也就废了！
应用场景	函数参数，算法实现，各种需要访问连续内存的场合！	只要你想看数据，它就能帮你！
替代方案（部分）	C 风格数组 + 大小，`std::vector`，`std::array`，`gsl::span`	但 `std::span` 更加现代化，更加安全！
存储建议	别存！除非你确定它指向的数据永远有效！	否则你会后悔的！

(语气总结)

总而言之，std::span 是一个非常强大的工具，可以让你更安全、更高效地处理连续的内存区域。只要你理解了它的本质，掌握了它的用法，就可以在你的 C++ 代码中发挥它的威力。

(停顿，看向观众)

那么，今天关于 std::span 的讲解就到这里。希望大家以后看到 std::span 的时候，不再是 “你瞅啥？” 而是 “嘿，老朋友，又见面了！”

(鞠躬，结束)

(结尾音乐：一段轻松的电子乐)

代码示例合集

为了方便大家学习，这里再提供一些更完整的代码示例：

示例 1：使用 std::span 实现一个简单的排序算法

#include <span>
#include <iostream>
#include <algorithm>

void bubble_sort(std::span<int> data) {
  bool swapped;
  do {
    swapped = false;
    for (size_t i = 1; i < data.size(); ++i) {
      if (data[i - 1] > data[i]) {
        std::swap(data[i - 1], data[i]);
        swapped = true;
      }
    }
  } while (swapped);
}

int main() {
  int arr[] = {5, 2, 8, 1, 9, 4};
  std::span<int> span_arr(arr);

  std::cout << "Before sorting: ";
  for (int value : span_arr) {
    std::cout << value << " ";
  }
  std::cout << std::endl;

  bubble_sort(span_arr);

  std::cout << "After sorting: ";
  for (int value : span_arr) {
    std::cout << value << " ";
  }
  std::cout << std::endl;

  return 0;
}

示例 2：使用 std::span 处理图像数据

#include <span>
#include <iostream>
#include <vector>

// 假设图像数据是 RGB 格式，每个像素占用 3 个字节
struct Pixel {
  unsigned char r;
  unsigned char g;
  unsigned char b;
};

void process_image(std::span<Pixel> image_data, int width, int height) {
  // 假设我们要将所有像素的红色分量设置为 255
  for (auto& pixel : image_data) {
    pixel.r = 255;
  }
}

int main() {
  int width = 100;
  int height = 50;
  std::vector<Pixel> image(width * height);

  // 初始化图像数据（这里省略）

  std::span<Pixel> image_span(image);
  process_image(image_span, width, height);

  // 现在，image 中的所有像素的红色分量都变成了 255

  return 0;
}

示例 3：使用 std::span 和 std::mdspan (C++23) 处理多维数组

虽然 std::span 本身是用来处理一维连续内存的，但结合 C++23 的 std::mdspan，可以更方便地处理多维数组。

#include <span>
#include <iostream>
#include <vector>

// C++23 才引入 std::mdspan，这里为了演示，假设我们自己实现一个简单的类似功能
template <typename T, size_t Rows, size_t Cols>
class SimpleMDSpan {
public:
    SimpleMDSpan(T* data) : data_(data) {}

    T& operator()(size_t row, size_t col) {
        return data_[row * Cols + col];
    }

private:
    T* data_;
};

int main() {
    std::vector<int> data = {
        1, 2, 3,
        4, 5, 6,
        7, 8, 9
    };

    // 将 vector 的数据视为 3x3 的矩阵
    SimpleMDSpan<int, 3, 3> matrix(data.data());

    // 打印矩阵
    for (size_t i = 0; i < 3; ++i) {
        for (size_t j = 0; j < 3; ++j) {
            std::cout << matrix(i, j) << " ";
        }
        std::cout << std::endl;
    }

    return 0;
}

(特别声明)

请注意，std::mdspan 是 C++23 的新特性，目前 (2024年) 还没有被所有编译器完全支持。上面的 SimpleMDSpan 只是一个简化的示例，用于演示 std::mdspan 的概念。如果你想在 C++23 之前使用类似的功能，可以考虑使用其他库，例如 Eigen 或 Armadillo。

希望这些例子能帮助你更好地理解和使用 std::span。祝你编程愉快！

发表回复 取消回复

发表回复取消回复