什么是 ‘Copy Elision’ 与 ‘RVO/NRVO’？编译器如何在返回对象时直接在调用者栈帧构造？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位编程爱好者，欢迎来到我们今天的技术讲座。今天，我们将深入探讨C++中一个既基础又高级，同时对程序性能有着深远影响的优化机制——’Copy Elision’，以及与之紧密相关的’RVO’（Return Value Optimization）和’NRVO’（Named Return Value Optimization）。我们将揭示编译器如何在幕后“变魔术”，将看似昂贵的对象复制操作，悄无声息地消除，甚至在调用者的栈帧上直接构造返回对象。

1. 拷贝的代价：C++对象返回的性能陷阱

在C++中，当你从一个函数返回一个对象时，最直观的理解是该对象会被复制或移动到调用者期望的位置。例如，考虑一个简单的类 MyObject，它可能管理着一些资源（如动态分配的内存），或者仅仅是一个包含大量成员变量的复杂结构。

#include <iostream>
#include <vector>
#include <string>

// 一个用于演示拷贝和移动行为的类
class MyObject {
public:
    std::string name;
    std::vector<int> data;

    // 默认构造函数
    MyObject(const std::string& n = "default") : name(n), data(1000, 0) {
        std::cout << "MyObject Constructor: " << name << std::endl;
    }

    // 拷贝构造函数
    MyObject(const MyObject& other) : name(other.name + "_copy"), data(other.data) {
        std::cout << "MyObject Copy Constructor: " << name << " from " << other.name << std::endl;
    }

    // 移动构造函数
    MyObject(MyObject&& other) noexcept : name(std::move(other.name)), data(std::move(other.data)) {
        std::cout << "MyObject Move Constructor: " << name << " from " << other.name << std::endl;
    }

    // 拷贝赋值运算符
    MyObject& operator=(const MyObject& other) {
        if (this != &other) {
            name = other.name + "_assign_copy";
            data = other.data;
            std::cout << "MyObject Copy Assignment: " << name << " from " << other.name << std::endl;
        }
        return *this;
    }

    // 移动赋值运算符
    MyObject& operator=(MyObject&& other) noexcept {
        if (this != &other) {
            name = std::move(other.name);
            data = std::move(other.data);
            std::cout << "MyObject Move Assignment: " << name << " from " << other.name << std::endl;
        }
        return *this;
    }

    // 析构函数
    ~MyObject() {
        std::cout << "MyObject Destructor: " << name << std::endl;
    }

    // 打印对象信息
    void print_info() const {
        std::cout << "  Info: " << name << ", data size: " << data.size() << std::endl;
    }
};

// 演示函数，返回一个MyObject对象
MyObject create_object_by_value() {
    MyObject local_obj("local_in_func");
    std::cout << "  Inside create_object_by_value, about to return local_obj." << std::endl;
    return local_obj;
}

int main() {
    std::cout << "--- Start main ---" << std::endl;
    MyObject obj = create_object_by_value();
    obj.print_info();
    std::cout << "--- End main ---" << std::endl;
    return 0;
}

在没有优化的情况下（或者在某些特定场景下，即使有优化也无法完全消除拷贝），create_object_by_value 函数的执行流程可能如下：

MyObject local_obj("local_in_func")：在 create_object_by_value 函数的栈帧上构造一个 MyObject 对象。
return local_obj：
- 在调用者的栈帧上为返回对象分配一块内存。
- 将 local_obj 的内容拷贝（或移动）到这块内存中。
- local_obj 在函数退出时被析构。
MyObject obj = ...：调用者的对象 obj 被这块内存中的内容初始化。

对于像 MyObject 这样包含 std::string 和 std::vector 的类，拷贝操作意味着：

深拷贝：std::string 和 std::vector 内部的数据（字符数组和整数数组）需要被完整复制。这通常涉及新的内存分配（new），然后逐字节或逐元素复制数据，最后释放旧内存（delete）。
CPU周期：内存分配、数据复制都是CPU密集型操作。
内存带宽：大量数据的复制会占用宝贵的内存带宽。
缓存污染：复制操作可能会将大量数据加载到CPU缓存中，从而驱逐其他更可能被访问的数据，导致缓存未命中率上升。

所有这些开销，在对象频繁创建和返回的场景下，可能会对程序性能造成显著影响。因此，C++引入了一种强大的优化机制来缓解这个问题：拷贝消除 (Copy Elision)。

2. 拷贝消除 (Copy Elision) 的概念与分类

拷贝消除是C++标准允许编译器进行的一种优化，它允许编译器在某些特定情况下，完全省略掉对象的拷贝（或移动）构造函数调用。这意味着对象会被直接构造在它最终应该出现的位置，从而消除了中间的临时对象以及与之相关的拷贝/移动开销。

拷贝消除主要分为两大类：

返回局部值优化 (Return Value Optimization, RVO)：当函数返回一个匿名临时对象时发生的优化。
具名返回局部值优化 (Named Return Value Optimization, NRVO)：当函数返回一个具名的局部对象时发生的优化。

在C++17之前，这两种优化是可选的，即编译器可以选择执行，也可以选择不执行。但在C++17及以后，某些形式的拷贝消除被强制执行。

2.1 返回局部值优化 (RVO)

RVO发生在函数返回一个匿名临时对象时。最典型的例子就是直接在 return 语句中构造一个对象。

// 演示RVO的函数
MyObject create_rvo_object() {
    std::cout << "  Inside create_rvo_object, about to return a temporary MyObject." << std::endl;
    return MyObject("temporary_rvo"); // 返回一个匿名临时对象
}

int main_rvo() {
    std::cout << "n--- Start main_rvo (RVO) ---" << std::endl;
    MyObject obj = create_rvo_object();
    obj.print_info();
    std::cout << "--- End main_rvo ---" << std::endl;
    return 0;
}

预期输出（C++17及以后，通常编译器都会执行RVO）：

--- Start main_rvo (RVO) ---
  Inside create_rvo_object, about to return a temporary MyObject.
MyObject Constructor: temporary_rvo
  Info: temporary_rvo, data size: 1000
MyObject Destructor: temporary_rvo
--- End main_rvo ---

注意观察，我们只看到了一个构造函数调用 (MyObject Constructor: temporary_rvo)。没有拷贝构造函数，也没有移动构造函数。这表明 MyObject("temporary_rvo") 这个临时对象被直接构造到了 main_rvo 函数中 obj 变量所占据的内存位置。这就是RVO的魔力。

2.2 具名返回局部值优化 (NRVO)

NRVO发生在函数返回一个具名的局部对象时。这是我们在第一个例子中尝试的情况。

// 演示NRVO的函数
MyObject create_nrvo_object() {
    MyObject local_obj("named_nrvo"); // 具名局部对象
    std::cout << "  Inside create_nrvo_object, about to return local_obj." << std::endl;
    return local_obj; // 返回具名局部对象
}

int main_nrvo() {
    std::cout << "n--- Start main_nrvo (NRVO) ---" << std::endl;
    MyObject obj = create_nrvo_object();
    obj.print_info();
    std::cout << "--- End main_nrvo ---" << std::endl;
    return 0;
}

预期输出（现代编译器通常会执行NRVO，但C++17之前不是强制的）：

--- Start main_nrvo (NRVO) ---
MyObject Constructor: named_nrvo
  Inside create_nrvo_object, about to return local_obj.
  Info: named_nrvo, data size: 1000
MyObject Destructor: named_nrvo
--- End main_nrvo ---

与RVO类似，这里也只看到了一个构造函数调用。local_obj 被直接构造在 main_nrvo 函数中 obj 变量的内存位置，避免了任何拷贝或移动。

RVO与NRVO的区别：

特性	RVO (Return Value Optimization)	NRVO (Named Return Value Optimization)
返回对象	匿名临时对象 (prvalue)	具名局部对象 (lvalue)
发生场景	`return MyObject(...)`	`MyObject obj; return obj;`
强制性	C++17起在特定情况下强制（prvalue转换为prvalue）	C++标准一直允许但并非强制，取决于编译器实现和优化级别
实现复杂性	相对简单	相对复杂，因为编译器需要分析局部变量的生命周期和使用

3. C++17 后的强制拷贝消除

在C++17标准中，对于某些特定的拷贝消除场景，标准将其从“允许（可选）”提升为“强制”。这极大地简化了程序员的推理，并使得代码在不同编译器和优化级别下具有更一致的行为。

强制拷贝消除主要针对以下两种情况：

初始化一个对象时，源是一个纯右值 (prvalue) 表达式。
```
MyObject obj = MyObject("direct_init_prvalue"); // MyObject("direct_init_prvalue") 是一个prvalue
```
在这种情况下，MyObject("direct_init_prvalue") 这个临时对象不会被创建，然后通过拷贝/移动构造函数初始化 obj。而是 obj 会被直接构造，就好像你写了 MyObject obj("direct_init_prvalue"); 一样。这本质上就是RVO的一种扩展，适用于直接初始化。
函数返回一个纯右值 (prvalue) 表达式。
```
MyObject create_prvalue() {
    return MyObject("return_prvalue"); // MyObject("return_prvalue") 是一个prvalue
}
// ...
MyObject obj = create_prvalue();
```
这正是我们前面RVO的例子。在C++17及以后，这种优化是强制的。这意味着，即使你关闭了编译器优化（如 -O0），这种形式的拷贝消除也应该发生。

让我们用代码验证一下C++17的强制拷贝消除：

// C++17 强制拷贝消除示例
MyObject create_prvalue_obj() {
    std::cout << "  Inside create_prvalue_obj." << std::endl;
    return MyObject("prvalue_returned"); // prvalue
}

int main_cpp17_guaranteed() {
    std::cout << "n--- Start main_cpp17_guaranteed ---" << std::endl;

    // 1. 初始化时源是prvalue
    std::cout << "  Scenario 1: Initializing from prvalue." << std::endl;
    MyObject obj1 = MyObject("init_from_prvalue"); // 强制拷贝消除
    obj1.print_info();

    std::cout << "n  Scenario 2: Returning a prvalue from a function." << std::endl;
    MyObject obj2 = create_prvalue_obj(); // 强制拷贝消除 (RVO)
    obj2.print_info();

    std::cout << "--- End main_cpp17_guaranteed ---" << std::endl;
    return 0;
}

预期输出（C++17及以后，即使 -O0 也应如此）：

--- Start main_cpp17_guaranteed ---
  Scenario 1: Initializing from prvalue.
MyObject Constructor: init_from_prvalue
  Info: init_from_prvalue, data size: 1000

  Scenario 2: Returning a prvalue from a function.
  Inside create_prvalue_obj.
MyObject Constructor: prvalue_returned
  Info: prvalue_returned, data size: 1000
MyObject Destructor: init_from_prvalue
MyObject Destructor: prvalue_returned
--- End main_cpp17_guaranteed ---

可以看到，在两种强制拷贝消除的场景中，都只发生了一次构造函数调用，完美地避免了拷贝或移动。

注意： 强制拷贝消除并不适用于所有情况。特别是NRVO，它仍然是可选的。这意味着，如果你返回一个具名局部变量，编译器仍然可以选择执行NRVO，或者退而求其次执行移动构造，甚至在没有移动构造函数的情况下执行拷贝构造。因此，设计类时，提供移动构造函数仍然是良好的实践。

4. 编译器如何在调用者栈帧直接构造对象？

理解拷贝消除的工作原理，需要我们深入到函数调用和栈帧的底层机制。当编译器执行拷贝消除时，它实际上改变了函数返回值的处理方式。

4.1 函数调用约定与隐藏参数

在没有拷贝消除的情况下，函数返回对象通常需要经过以下步骤（简化）：

调用者准备空间：调用者在自己的栈帧上预留一块内存，用于存放返回的对象。
函数被调用：控制权转移到被调用函数。
被调用函数创建局部对象：在被调用函数自己的栈帧上创建局部对象。
拷贝/移动返回：在 return 语句处，将局部对象的内容拷贝/移动到调用者预留的内存中。
局部对象析构：局部对象在被调用函数退出时析构。
函数返回：控制权返回给调用者，调用者可以访问预留内存中的对象。

当编译器决定执行拷贝消除时，它会做一些更巧妙的事情：

核心思想：将被调用函数需要返回的对象，直接构造到调用者预留的内存中。

这通常通过以下机制实现：

隐藏的参数 (Implicit Pointer/Reference)：
当一个函数被标记为需要返回一个对象（并且编译器决定进行拷贝消除）时，编译器会在函数调用时，偷偷地向被调用函数传递一个额外的、隐藏的参数。这个参数通常是一个指向调用者栈帧上预留内存的指针或引用。我们称这块预留内存为“返回对象的目标地址”。

例如，对于 MyObject obj = create_nrvo_object();，编译后的函数签名可能在内部被修改为类似：
void create_nrvo_object(MyObject* __return_ptr); (伪代码)
或者在某些约定中，通过特定的寄存器传递这个地址。
被调用函数直接构造：
在被调用函数内部，当它创建局部对象（例如 MyObject local_obj("named_nrvo");）时，它不再在自己的栈帧上为 local_obj 分配完整的空间。而是利用那个隐藏的 __return_ptr 参数，将 local_obj 的构造函数的目标地址，直接设置为 __return_ptr 所指向的内存位置。
换句话说，MyObject local_obj("named_nrvo"); 这一行代码，在优化后，变成了：
new (__return_ptr) MyObject("named_nrvo"); (伪代码，使用了 placement new 的概念)
这实现了原地构造 (in-place construction)。
省略拷贝/移动和局部对象析构：
由于 local_obj 从一开始就被构造在调用者预留的内存中，函数结束时就不再需要执行额外的拷贝/移动操作。同时，因为 local_obj 实际上并没有在函数自己的栈帧上创建，所以也不需要为它调用析构函数（它的生命周期和最终的 obj 变量一致）。

4.2 内存布局与栈帧变化的示意

我们可以概念性地想象一下栈帧的变化：

没有拷贝消除时：

main() 栈帧:
+-------------------+
| ...               |
| obj 的内存空间 (未初始化) | <--- main() 预留给返回对象的空间
| ...               |
+-------------------+
  | 调用 create_nrvo_object()
  V
create_nrvo_object() 栈帧:
+-------------------+
| ...               |
| local_obj 的内存空间 (MyObject 构造) | <--- 函数内部创建的局部对象
| ...               |
+-------------------+
  | return local_obj;
  |  1. 将 local_obj 拷贝/移动到 main() 栈帧的 obj 内存空间
  |  2. 析构 local_obj
  V
main() 栈帧:
+-------------------+
| ...               |
| obj 的内存空间 (MyObject 拷贝/移动构造) |
| ...               |
+-------------------+

启用拷贝消除时：

main() 栈帧:
+-------------------+
| ...               |
| obj 的内存空间 (未初始化) | <--- main() 预留给返回对象的空间
| ...               |
+-------------------+
  | 调用 create_nrvo_object(), 隐式传递 &obj 作为参数
  V
create_nrvo_object() 栈帧:
+-------------------+
| ...               |
| (隐藏参数: __return_ptr = &obj) |
| ...               |
+-------------------+
  | MyObject local_obj("named_nrvo");
  |  实际是 new (__return_ptr) MyObject("named_nrvo");
  |  对象直接在 main() 栈帧的 obj 内存空间构造
  V
create_nrvo_object() 栈帧:
+-------------------+
| ...               |
| (隐藏参数: __return_ptr = &obj) |
| ...               |
+-------------------+
  | return local_obj;
  |  什么都不做，因为对象已经构造在正确的位置
  V
main() 栈帧:
+-------------------+
| ...               |
| obj 的内存空间 (MyObject 构造) |
| ...               |
+-------------------+

这种机制使得函数返回对象成为零成本的操作，因为对象从出生就位于它最终的归宿。

5. 何时拷贝消除可能不发生？

尽管拷贝消除非常强大，但它并非万能。在某些情况下，编译器无法安全地执行拷贝消除，或者即使可以，也可能选择不执行（尤其是NRVO）。理解这些限制对于编写高效且可预测的代码至关重要。

5.1 条件返回不同的具名对象

这是NRVO最常见的失效场景。如果一个函数根据条件返回不同的具名局部对象，编译器通常无法确定哪个对象应该被直接构造到调用者的内存中。

// 演示NRVO失效的条件返回
MyObject create_conditional_object(bool flag) {
    MyObject obj1("conditional_obj1");
    MyObject obj2("conditional_obj2");
    std::cout << "  Inside create_conditional_object, about to return." << std::endl;
    if (flag) {
        return obj1; // 可能触发移动构造
    } else {
        return obj2; // 可能触发移动构造
    }
}

int main_conditional() {
    std::cout << "n--- Start main_conditional ---" << std::endl;
    MyObject res1 = create_conditional_object(true);
    res1.print_info();
    std::cout << "n";
    MyObject res2 = create_conditional_object(false);
    res2.print_info();
    std::cout << "--- End main_conditional ---" << std::endl;
    return 0;
}

预期输出（假设编译器无法进行NRVO，但会执行移动构造）：

--- Start main_conditional ---
MyObject Constructor: conditional_obj1
MyObject Constructor: conditional_obj2
  Inside create_conditional_object, about to return.
MyObject Move Constructor: conditional_obj1_copy from conditional_obj1 // 移动构造
MyObject Destructor: conditional_obj2
MyObject Destructor: conditional_obj1
  Info: conditional_obj1_copy, data size: 1000

MyObject Constructor: conditional_obj1
MyObject Constructor: conditional_obj2
  Inside create_conditional_object, about to return.
MyObject Move Constructor: conditional_obj2_copy from conditional_obj2 // 移动构造
MyObject Destructor: conditional_obj1
MyObject Destructor: conditional_obj2
  Info: conditional_obj2_copy, data size: 1000
--- End main_conditional ---

在这里，由于编译器无法预测将返回哪个具名对象，它无法将调用者提供的内存地址绑定到特定的局部变量。因此，它会退回到：在函数内部构造两个局部对象，然后根据条件将其中一个移动到返回位置（如果没有移动构造函数，则会是拷贝构造）。

5.2 对局部变量使用 `std::move`

在某些情况下，程序员可能会错误地认为使用 std::move 可以强制进行移动优化，但对于可以进行NRVO的场景，这实际上是阻止了NRVO，反而强制进行了一次移动构造。

// 演示std::move阻止NRVO
MyObject create_with_std_move() {
    MyObject local_obj("local_with_move");
    std::cout << "  Inside create_with_std_move, about to return std::move(local_obj)." << std::endl;
    return std::move(local_obj); // 强制将lvalue转换为xvalue
}

int main_std_move() {
    std::cout << "n--- Start main_std_move ---" << std::endl;
    MyObject obj = create_with_std_move();
    obj.print_info();
    std::cout << "--- End main_std_move ---" << std::endl;
    return 0;
}

预期输出（会触发移动构造）：

--- Start main_std_move ---
MyObject Constructor: local_with_move
  Inside create_with_std_move, about to return std::move(local_obj).
MyObject Move Constructor: local_with_move_copy from local_with_move // 移动构造
MyObject Destructor: local_with_move
  Info: local_with_move_copy, data size: 1000
MyObject Destructor: local_with_move_copy
--- End main_std_move ---

std::move(local_obj) 将 local_obj （一个左值）转换为一个右值引用（xvalue）。这告诉编译器“我不再需要 local_obj 的内容了，你可以安全地将其移动出去”。虽然这在某些情况下是好事（例如，当NRVO不可能时，移动总比拷贝好），但在NRVO本来可以发生的地方，它会阻止NRVO。因为 std::move 明确地创建了一个右值，编译器必须遵循这个指示，执行移动构造，而不是完全消除构造。

结论： 对于可能发生NRVO的具名局部变量，不要使用 std::move。让编译器自行决定是否执行NRVO。如果NRVO不发生，编译器会智能地退化为移动构造（如果可用）。

5.3 返回函数参数、类成员或全局/静态变量

这些都不是局部对象，因此不能被NRVO优化。它们需要被拷贝或移动。

// 返回函数参数
MyObject return_param(MyObject p_obj) {
    std::cout << "  Inside return_param, about to return p_obj." << std::endl;
    return p_obj; // 参数是lvalue，需要拷贝/移动
}

class MyClassContainer {
public:
    MyObject member_obj;
    MyClassContainer(const std::string& n) : member_obj(n) {
        std::cout << "MyClassContainer Constructor: " << n << std::endl;
    }
    MyObject get_member() {
        std::cout << "  Inside get_member, about to return member_obj." << std::endl;
        return member_obj; // 成员是lvalue，需要拷贝/移动
    }
    ~MyClassContainer() {
        std::cout << "MyClassContainer Destructor." << std::endl;
    }
};

MyObject global_obj("global"); // 全局对象

MyObject return_global() {
    std::cout << "  Inside return_global, about to return global_obj." << std::endl;
    return global_obj; // 全局对象是lvalue，需要拷贝/移动
}

int main_no_elision() {
    std::cout << "n--- Start main_no_elision ---" << std::endl;

    // 返回函数参数
    std::cout << "n  Scenario: Returning function parameter." << std::endl;
    MyObject arg_to_pass("arg");
    MyObject res_param = return_param(arg_to_pass); // 传入时可能拷贝/移动，返回时再次拷贝/移动
    res_param.print_info();

    // 返回类成员
    std::cout << "n  Scenario: Returning class member." << std::endl;
    MyClassContainer container("container_member");
    MyObject res_member = container.get_member();
    res_member.print_info();

    // 返回全局变量
    std::cout << "n  Scenario: Returning global variable." << std::endl;
    MyObject res_global = return_global();
    res_global.print_info();

    std::cout << "--- End main_no_elision ---" << std::endl;
    return 0;
}

预期输出（会触发拷贝/移动构造）：

--- Start main_no_elision ---
MyObject Constructor: global

  Scenario: Returning function parameter.
MyObject Constructor: arg
MyObject Copy Constructor: arg_copy from arg   // 传入参数时，arg_to_pass 拷贝到 p_obj
  Inside return_param, about to return p_obj.
MyObject Move Constructor: arg_copy_copy from arg_copy // 返回 p_obj 时移动
MyObject Destructor: arg_copy
  Info: arg_copy_copy, data size: 1000
MyObject Destructor: arg

  Scenario: Returning class member.
MyObject Constructor: container_member // 成员对象构造
MyClassContainer Constructor: container_member
  Inside get_member, about to return member_obj.
MyObject Move Constructor: container_member_copy from container_member // 返回成员时移动
  Info: container_member_copy, data size: 1000
MyClassContainer Destructor.
MyObject Destructor: container_member

  Scenario: Returning global variable.
  Inside return_global, about to return global_obj.
MyObject Move Constructor: global_copy from global // 返回全局对象时移动
  Info: global_copy, data size: 1000
MyObject Destructor: global
MyObject Destructor: arg_copy_copy
MyObject Destructor: container_member_copy
MyObject Destructor: global_copy
--- End main_no_elision ---

这些场景都不会触发拷贝消除，因为被返回的对象不是一个在当前函数作用域内刚刚构造的临时对象或具名局部对象，而是已经存在的对象。编译器会退而求其次，尝试执行移动构造（如果可用），否则执行拷贝构造。

6. 拷贝消除与移动语义的交互

拷贝消除和移动语义（C++11引入）都是为了优化C++中对象的传递效率。它们是互补的，而非互斥。

拷贝消除： 零成本优化。它完全消除了拷贝或移动操作，直接在目标位置构造对象。这是最高效的方案。
移动语义： 低成本优化。当拷贝消除不可能时，移动语义提供了一个替代方案。它通过“窃取”资源（如指针、文件句柄、内存块）而不是深拷贝来转移对象的所有权，通常比深拷贝快得多。

优先级：

强制拷贝消除 (C++17+)： 如果一个场景符合C++17的强制拷贝消除规则（例如 return MyObject(); 或 MyObject obj = MyObject();），那么它将发生，且优先级最高。
可选拷贝消除 (RVO/NRVO)： 如果强制拷贝消除不适用，但编译器判断可以执行RVO或NRVO（例如 MyObject obj; return obj;），它可能会选择执行。
移动构造： 如果拷贝消除不可能（例如条件返回不同的具名对象，或者你显式使用了 std::move），编译器会尝试使用对象的移动构造函数。
拷贝构造： 如果连移动构造函数也不可用（因为你没有提供，或者被删除），编译器将退回到使用拷贝构造函数。

这形成了一个从最优到次优的优化链条：零成本 -> 低成本 -> 高成本。

因此，编写高效C++代码的最佳实践是：

设计具有移动语义的类： 总是为你的类提供移动构造函数和移动赋值运算符（遵循“三/五/零法则”），这样即使拷贝消除不发生，也能获得移动语义的性能优势。
依赖编译器进行拷贝消除： 在函数中返回局部对象时，尽量以最自然的方式编写代码：
- return MyObject(); (触发RVO，C++17强制)
- MyObject obj; ...; return obj; (触发NRVO，可选但常见)
- 不要在可以进行NRVO的局部变量上使用 std::move，因为它会阻止NRVO，并强制进行移动构造（除非你确实有特定原因要阻止NRVO）。

7. 实践意义与最佳实践

理解拷贝消除对于编写高性能的C++代码至关重要。

简化设计决策： 过去，程序员可能会为了避免拷贝而使用输出参数（void func(MyObject& output_obj)）或返回智能指针。现在，对于大多数情况，直接返回对象值是安全且高效的，代码也更清晰。
提高代码可读性： 返回值语义更自然，尤其是在函数式编程风格中。
避免不必要的复杂性： 不再需要手动管理生命周期或担心性能损失，让编译器处理这些细节。
充分利用现代C++特性： 结合移动语义，拷贝消除使得C++在处理大对象时能够达到接近C语言的效率，同时保持了高级语言的抽象能力。

总结一下最佳实践：

返回对象时，优先通过值返回。 无论是返回一个匿名临时对象 (return T();) 还是一个具名局部对象 (T t; return t;)，都让编译器有机会进行拷贝消除。
为你的类提供移动构造函数和移动赋值运算符。 这是在拷贝消除不发生时的“Plan B”，它能确保至少获得移动语义的性能优势，而不是昂贵的深拷贝。
避免对具名局部变量使用 std::move。 除非你明确知道NRVO不会发生，并且希望强制移动语义。在大多数情况下，让编译器自行判断是最好的策略。
了解你的编译器和优化级别。 虽然C++17强制了部分拷贝消除，但NRVO仍然是可选的。不同的编译器（GCC, Clang, MSVC）在实现NRVO的激进程度上可能有所不同，并且优化级别（如 -O0, -O1, -O2, -O3）也会影响这些可选的优化。如果你对性能极致追求，请务必进行基准测试。

结语

拷贝消除和RVO/NRVO是C++编译器背后强大的优化力量，它们将看似昂贵的按值返回操作转变为零成本的直接构造。通过理解这些机制，我们能够编写出更简洁、更高效、更符合现代C++范式的代码，充分发挥语言的性能潜力。让编译器为我们工作，专注于业务逻辑，而非底层的对象生命周期管理。