C++ 属性 `[[no_unique_address]]` (C++20)：结构体成员零开销优化 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

哈喽，各位好！今天咱们来聊聊C++20中一个挺有意思的属性：[[no_unique_address]]。这玩意儿听起来可能有点高深，但实际上，它能帮咱们在不增加任何运行成本的情况下，优化结构体和类的大小。简单来说，就是让编译器更聪明地安排结构体成员的内存布局，从而节省空间。

咱们先从为什么要关心结构体大小说起。

为什么结构体大小很重要？

想象一下，你正在开发一个游戏，其中每个游戏对象都有很多属性：位置、速度、生命值等等。如果每个对象的结构体都很大，那么存储大量对象就需要大量的内存。这不仅会影响性能，还可能导致缓存未命中，进一步降低游戏速度。

在嵌入式系统中，内存资源通常非常有限。因此，优化结构体大小就显得尤为重要。

即使在桌面应用中，更小的结构体也能提高缓存效率，减少内存占用，从而提升整体性能。

传统的结构体内存布局

在C++中，结构体成员通常按照声明的顺序依次排列在内存中。为了满足对齐要求（alignment requirement），编译器可能会在成员之间插入填充字节（padding bytes）。

举个例子：

struct Example {
  char c;
  int i;
  char d;
};

int main() {
  Example ex;
  std::cout << "Size of Example: " << sizeof(Example) << std::endl; // 可能输出 12 或 8 (取决于编译器和对齐方式)
  std::cout << "Address of c: " << &ex.c << std::endl;
  std::cout << "Address of i: " << &ex.i << std::endl;
  std::cout << "Address of d: " << &ex.d << std::endl;
  return 0;
}

在这个例子中，char c 占用1个字节，int i 占用4个字节，char d 占用1个字节。如果没有对齐要求，结构体的大小应该是6个字节。但实际上，由于int通常需要4字节对齐，编译器会在char c后面插入3个填充字节，使得int i的地址是4的倍数。同样，为了保证整个结构体大小也是对齐值的倍数，可能在char d后面也会有填充。最终结构体的大小可能是8个字节，甚至12个字节。

这种填充虽然保证了内存访问的效率，但同时也浪费了空间。

[[no_unique_address]] 的作用

[[no_unique_address]] 属性告诉编译器，被修饰的成员变量可以与其他成员变量共享地址，只要它们不是同类型的，并且没有其他限制（比如基类子对象的要求）。换句话说，编译器可以更灵活地安排内存布局，尽可能地减少填充字节。

[[no_unique_address]] 的语法

[[no_unique_address]] 属性可以用于非静态数据成员的声明。语法如下：

struct MyStruct {
  [[no_unique_address]] Empty empty_member;
  int data;
};

在这个例子中，empty_member 是一个 Empty 类型的成员变量，并且使用了 [[no_unique_address]] 属性。Empty 类型是一个大小为零的类型，比如一个空的结构体或者类。

[[no_unique_address]] 的使用场景

[[no_unique_address]] 最常见的用法是与空类型一起使用。当结构体中包含空类型的成员变量时，编译器通常会为其分配一个字节的空间，以保证每个成员都有唯一的地址。但是，使用 [[no_unique_address]] 属性后，编译器可以将空类型成员变量与其他成员变量共享地址，从而节省空间。

示例：优化空类型成员

struct Empty {};

struct Data {
  [[no_unique_address]] Empty e1;
  int i;
  [[no_unique_address]] Empty e2;
};

int main() {
  std::cout << "Size of Empty: " << sizeof(Empty) << std::endl; // 输出 1 (至少为1)
  std::cout << "Size of Data: " << sizeof(Data) << std::endl;   // 可能输出 4，如果没有 [[no_unique_address]] 可能会输出 6 或 8
  return 0;
}

在这个例子中，Empty 是一个空结构体，大小至少为1个字节。如果没有 [[no_unique_address]] 属性，Data 结构体的大小可能会大于 int 的大小。但使用了 [[no_unique_address]] 属性后，e1 和 e2 可以与其他成员变量共享地址，从而使 Data 结构体的大小等于 int 的大小。

示例：优化函数对象

[[no_unique_address]] 还可以用于存储函数对象，尤其是在函数对象的大小很小或者为空的情况下。

#include <iostream>
#include <functional>

struct MyFunctor {
  void operator()() {
    std::cout << "Hello from MyFunctor!" << std::endl;
  }
};

struct DataWithFunctor {
  [[no_unique_address]] MyFunctor func;
  int data;
};

int main() {
  std::cout << "Size of MyFunctor: " << sizeof(MyFunctor) << std::endl; // 输出 1 (至少为1)
  std::cout << "Size of DataWithFunctor: " << sizeof(DataWithFunctor) << std::endl; // 可能输出 4，如果没有 [[no_unique_address]] 可能会输出 8
  return 0;
}

在这个例子中，MyFunctor 是一个函数对象，它的大小可能很小。使用 [[no_unique_address]] 属性后，func 可以与其他成员变量共享地址，从而减小 DataWithFunctor 结构体的大小。

[[no_unique_address]] 的限制

虽然 [[no_unique_address]] 属性可以有效地优化结构体大小，但它也有一些限制：

不能用于位域（bit-field）成员。 位域成员的内存布局非常特殊，编译器无法保证 [[no_unique_address]] 属性的正确性。
不能用于静态成员。 静态成员不属于类的对象，因此无法使用 [[no_unique_address]] 属性。
不能用于引用成员。 引用必须绑定到有效的对象，并且不能更改绑定对象。使用 [[no_unique_address]] 属性可能会破坏引用的语义。
不能用于 union 的成员。 union 的成员共享同一块内存区域，因此无法使用 [[no_unique_address]] 属性。
如果两个 [[no_unique_address]] 成员的类型相同，它们仍然需要不同的地址。 编译器无法将两个相同类型的 [[no_unique_address]] 成员共享地址，因为这会违反类型安全。
基类子对象也有类似的要求。 如果一个类继承了多个空类，编译器可能会尝试共享这些空基类的地址。但是，如果这些基类类型相同，它们仍然需要不同的地址。

与其他优化技术的比较

除了 [[no_unique_address]] 属性，还有其他一些优化结构体大小的技术：

重新排列成员变量的顺序。 通过将大小相近的成员变量放在一起，可以减少填充字节。例如，将所有的 char 类型的成员变量放在一起，然后是 int 类型的成员变量，等等。
使用位域。 如果某些成员变量只需要存储少量的信息，可以使用位域来节省空间。例如，可以使用一个 int 类型的位域来存储多个布尔值。
使用 pragma pack 指令。 pragma pack 指令可以强制编译器按照指定的对齐方式进行内存布局。但是，过度使用 pragma pack 指令可能会降低性能，因为未对齐的内存访问可能会更慢。

下表总结了这些技术的优缺点：

技术	优点	缺点
`[[no_unique_address]]`	零开销，自动优化空类型成员和函数对象，无需手动调整内存布局。	仅适用于特定场景，例如空类型成员和函数对象。
重新排列成员变量顺序	简单易用，可以减少填充字节。	需要手动调整成员变量的顺序，可能会影响代码的可读性。
使用位域	可以有效地减少内存占用，尤其是在存储多个布尔值时。	可能会降低代码的可读性，并且位域的访问效率可能不如普通成员变量。
`pragma pack`	可以强制编译器按照指定的对齐方式进行内存布局，从而最大限度地减少填充字节。	可能会降低性能，因为未对齐的内存访问可能会更慢。过度使用可能会导致程序崩溃。

[[no_unique_address]] 的实际应用

[[no_unique_address]] 属性在很多实际应用中都非常有用。例如：

状态机。 在实现状态机时，可以使用 [[no_unique_address]] 属性来存储状态对象。如果状态对象的大小很小或者为空，可以使用 [[no_unique_address]] 属性来减小状态机的大小。
事件处理系统。 在实现事件处理系统时，可以使用 [[no_unique_address]] 属性来存储事件处理函数对象。如果事件处理函数对象的大小很小或者为空，可以使用 [[no_unique_address]] 属性来减小事件处理系统的大小。
资源管理。 在实现资源管理类时，可以使用 [[no_unique_address]] 属性来存储资源释放函数对象。如果资源释放函数对象的大小很小或者为空，可以使用 [[no_unique_address]] 属性来减小资源管理类的大小。

总结

[[no_unique_address]] 属性是C++20中一个非常有用的特性，它可以帮助咱们在不增加任何运行成本的情况下，优化结构体和类的大小。通过合理地使用 [[no_unique_address]] 属性，可以提高代码的性能，减少内存占用，并提升整体系统的效率。

总而言之，[[no_unique_address]] 是个好东西，用好了能让你的代码更苗条、更高效。希望今天的讲解能让大家对这个属性有更深入的了解！记住，代码写得好，BUG 自然少！下次见！

发表回复 取消回复

发表回复取消回复