C++中的`std::variant`与Visitor Pattern：实现无虚函数的多态派发与内存优化 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

C++ `std::variant` 与 Visitor Pattern：无虚函数的多态派发与内存优化

各位朋友，大家好！今天我们来聊聊 C++ 中实现多态的一种高效方式：std::variant 结合 Visitor Pattern。这种方式可以避免使用虚函数，从而在某些情况下带来性能提升和内存优化。

1. 多态的传统方式：虚函数

在 C++ 中，实现多态最常用的方式就是通过虚函数。基类声明虚函数，派生类重写这些虚函数，通过基类指针或引用调用这些函数时，会根据实际对象的类型来决定调用哪个版本的函数。

#include <iostream>

class Shape {
public:
  virtual void draw() {
    std::cout << "Drawing a shapen";
  }
};

class Circle : public Shape {
public:
  void draw() override {
    std::cout << "Drawing a circlen";
  }
};

class Square : public Shape {
public:
  void draw() override {
    std::cout << "Drawing a squaren";
  }
};

int main() {
  Shape* shape1 = new Circle();
  Shape* shape2 = new Square();

  shape1->draw(); // 输出: Drawing a circle
  shape2->draw(); // 输出: Drawing a square

  delete shape1;
  delete shape2;

  return 0;
}

这种方式简单直观，但也有一些缺点：

虚函数表的开销： 每个包含虚函数的类都需要维护一个虚函数表 (vtable)，这会增加类的内存占用。
虚函数调用的开销： 虚函数调用需要通过 vtable 查找函数地址，相比普通函数调用会有一定的性能损失。
对象模型复杂性： 虚函数机制增加了对象模型的复杂性，可能影响编译器的优化。

2. std::variant：类型安全的联合体

std::variant 是 C++17 引入的一个模板类，它允许我们存储一组预先定义的类型中的任何一个。可以把它看作是一个类型安全的联合体。

#include <variant>
#include <string>
#include <iostream>

int main() {
  std::variant<int, double, std::string> v;

  v = 10;
  std::cout << "Value: " << std::get<int>(v) << std::endl;

  v = 3.14;
  std::cout << "Value: " << std::get<double>(v) << std::endl;

  v = "Hello";
  std::cout << "Value: " << std::get<std::string>(v) << std::endl;

  return 0;
}

std::variant 提供以下几个关键特性：

类型安全： 访问 std::variant 必须明确指定要访问的类型，如果类型不匹配，会抛出 std::bad_variant_access 异常。
存储空间优化： std::variant 只分配能够容纳所有可能类型中最大类型所需的内存空间。
默认构造： 如果 std::variant 的类型列表中包含一个默认可构造的类型，那么 std::variant 也会是默认可构造的。否则，它是不可默认构造的，直到被赋予一个值。
访问方式： 可以使用 std::get<T>(v)， std::get_if<T>(v)， std::visit(visitor, v) 等方式访问 std::variant 中存储的值。

3. Visitor Pattern：解耦操作与数据结构

Visitor Pattern 是一种行为型设计模式，它允许我们在不修改数据结构的前提下，定义作用于该数据结构的操作。它通过将操作（Visitor）与数据结构（Element）分离来实现解耦。

Visitor Pattern 的基本组成部分包括：

Visitor (访问者): 定义对数据结构中每个元素执行的操作的接口。
ConcreteVisitor (具体访问者): 实现 Visitor 接口，定义对特定元素类型执行的具体操作。
Element (元素): 定义接受访问者的方法 (accept)。
ConcreteElement (具体元素): 实现 Element 接口，并在 accept 方法中调用访问者的 visit 方法，将自身传递给访问者。
ObjectStructure (对象结构): 包含元素的集合，并提供遍历元素的方法。

4. std::variant + Visitor Pattern：实现无虚函数的多态

现在，我们将 std::variant 和 Visitor Pattern 结合起来，实现无虚函数的多态派发。

首先，我们定义一些表示不同形状的结构体：

#include <iostream>
#include <variant>

struct Circle {
  double radius;
};

struct Square {
  double side;
};

struct Triangle {
  double base;
  double height;
};

然后，我们定义一个 Shape 类型，它是一个 std::variant，可以存储 Circle、Square 或 Triangle：

using Shape = std::variant<Circle, Square, Triangle>;

接下来，我们定义一个 Visitor，它包含针对每种形状的操作：

struct ShapeVisitor {
  void operator()(const Circle& circle) {
    std::cout << "Circle area: " << 3.14159 * circle.radius * circle.radius << std::endl;
  }

  void operator()(const Square& square) {
    std::cout << "Square area: " << square.side * square.side << std::endl;
  }

  void operator()(const Triangle& triangle) {
    std::cout << "Triangle area: " << 0.5 * triangle.base * triangle.height << std::endl;
  }
};

最后，我们可以使用 std::visit 函数来应用 Visitor：

#include <vector>

int main() {
  std::vector<Shape> shapes;
  shapes.push_back(Circle{5.0});
  shapes.push_back(Square{4.0});
  shapes.push_back(Triangle{3.0, 6.0});

  ShapeVisitor visitor;

  for (const auto& shape : shapes) {
    std::visit(visitor, shape);
  }

  return 0;
}

在这个例子中，我们没有使用任何虚函数。std::visit 函数会根据 Shape 中存储的实际类型，自动调用 Visitor 中对应的 operator() 重载。

5. 优势与劣势

std::variant + Visitor Pattern 相比虚函数，具有以下优势：

避免虚函数开销： 没有虚函数表，没有虚函数调用，性能更高。
内存占用更小： std::variant 只分配最大类型所需的内存空间，避免了虚函数表的额外开销。
编译时类型检查： 所有可能的类型都必须在 std::variant 中声明，编译器可以进行更严格的类型检查。

但也存在一些劣势：

代码冗余： 如果有很多种类型，Visitor 的代码会比较冗长。
可扩展性较差： 如果需要添加新的类型，需要修改 std::variant 和 Visitor，违反了开闭原则。
编译时已知类型： std::variant 的类型列表必须在编译时确定，无法处理运行时动态添加的类型。

6. 选择合适的方案

选择虚函数还是 std::variant + Visitor Pattern，取决于具体的应用场景：

特性	虚函数	`std::variant` + Visitor Pattern
性能	较低 (虚函数表查找)	较高 (无虚函数表)
内存占用	较高 (虚函数表)	较低 (仅最大类型所需内存)
类型安全性	运行时类型检查	编译时类型检查
可扩展性	较好 (易于添加新的派生类)	较差 (需要修改 `std::variant` 和 Visitor)
类型已知性	运行时未知类型	编译时已知类型
复杂性	较低	较高 (需要理解 Visitor Pattern)
适用场景	类型需要在运行时确定，并且需要频繁地添加新的类型。	类型在编译时已知，并且性能是关键因素，类型数量相对固定。

7. 代码示例：更复杂的应用

让我们看一个更复杂的例子，假设我们有一个表达式树，树的节点可以是数字、加法或乘法。

#include <iostream>
#include <variant>

struct Number {
  double value;
};

struct Addition {
  std::variant<Number, Addition, Multiplication> left;
  std::variant<Number, Addition, Multiplication> right;
};

struct Multiplication {
  std::variant<Number, Addition, Multiplication> left;
  std::variant<Number, Addition, Multiplication> right;
};

using Expression = std::variant<Number, Addition, Multiplication>;

struct Evaluator {
  double operator()(const Number& number) {
    return number.value;
  }

  double operator()(const Addition& addition) {
    return std::visit(*this, addition.left) + std::visit(*this, addition.right);
  }

  double operator()(const Multiplication& multiplication) {
    return std::visit(*this, multiplication.left) * std::visit(*this, multiplication.right);
  }
};

int main() {
  // 表达式: (2 + 3) * 4
  Expression expression = Multiplication{
      Addition{Number{2.0}, Number{3.0}},
      Number{4.0}
  };

  Evaluator evaluator;
  double result = std::visit(evaluator, expression);

  std::cout << "Result: " << result << std::endl; // 输出: Result: 20

  return 0;
}

在这个例子中，Expression 是一个 std::variant，可以存储 Number、Addition 或 Multiplication。Evaluator Visitor 用于计算表达式的值。通过递归地调用 std::visit，我们可以遍历整个表达式树并计算结果。

8. 实际应用中的注意事项

错误处理： 使用 std::get<T>(v) 访问 std::variant 时，如果类型不匹配，会抛出 std::bad_variant_access 异常。可以使用 std::get_if<T>(v) 来安全地访问 std::variant，如果类型匹配，返回指向值的指针，否则返回 nullptr。
性能优化： std::visit 的性能很大程度上取决于 Visitor 的实现。避免在 Visitor 中进行复杂的计算或内存分配，可以提高性能。
代码可读性： Visitor Pattern 可能会导致代码比较分散。可以使用一些技巧，例如 Lambda 表达式，来提高代码的可读性。

9. 总结：权衡利弊，选择最合适的方案

std::variant 结合 Visitor Pattern 是一种强大的技术，可以在某些情况下替代虚函数，从而提高性能和优化内存。但是，它也有一些缺点，例如代码冗余和可扩展性较差。在选择方案时，需要权衡利弊，根据具体的应用场景选择最合适的方案。理解两者的优缺点，结合场景选择最佳方案。

10. std::visit的本质及其他访问方式

std::visit 本质上是一个函数模板，它接受一个 Visitor 和一个 std::variant 作为参数。它会根据 std::variant 中存储的实际类型，调用 Visitor 中对应的 operator() 重载。这是一种静态分发，在编译时确定调用的函数。

除了 std::visit，我们还可以使用其他方式访问 std::variant：

std::get<T>(v): 如果 std::variant 中存储的类型是 T，返回对该值的引用。否则，抛出 std::bad_variant_access 异常。
std::get_if<T>(v): 如果 std::variant 中存储的类型是 T，返回指向该值的指针。否则，返回 nullptr。
v.index(): 返回 std::variant 中存储的类型的索引。

这些访问方式各有优缺点，可以根据具体的需求选择合适的访问方式。

11. std::monostate：处理空的 variant

当 std::variant 的所有可能类型都不可默认构造时，该 std::variant 也是不可默认构造的。为了解决这个问题，C++17 引入了 std::monostate。可以将 std::monostate 添加到 std::variant 的类型列表中，使得该 std::variant 变为可默认构造的。当 std::variant 默认构造时，它将存储 std::monostate。

#include <variant>
#include <iostream>

struct NonDefaultConstructible {
  NonDefaultConstructible(int) {}
};

int main() {
  // std::variant<NonDefaultConstructible> v; // 编译错误，NonDefaultConstructible 不可默认构造
  std::variant<std::monostate, NonDefaultConstructible> v; // OK, 可以默认构造
  std::cout << "Variant is default constructed." << std::endl;
  return 0;
}

12. 进一步的思考与拓展

std::variant 和 Visitor Pattern 可以结合其他技术，例如函数式编程，来构建更灵活和可维护的代码。考虑使用 Lambda 表达式来简化 Visitor 的定义，或使用 std::function 来存储 Visitor，可以进一步提高代码的灵活性。
希望今天的讲座对大家有所帮助！谢谢大家！

更多IT精英技术系列讲座，到智猿学院

C++ std::variant 与 Visitor Pattern：无虚函数的多态派发与内存优化

发表回复 取消回复

C++ `std::variant` 与 Visitor Pattern：无虚函数的多态派发与内存优化

发表回复取消回复