C++ 基于类型擦除的编译期多态：不依赖虚函数表的泛型设计 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位观众老爷们，晚上好！今天咱们来聊点高级货，关于C++中一种叫做“基于类型擦除的编译期多态”的玩意儿。放心，听起来唬人，其实没那么可怕，我尽量用大白话给各位讲明白。

啥是多态？为啥需要类型擦除？

首先，咱们得搞清楚“多态”是啥意思。简单来说，多态就是“多种形态”，同一个操作，作用在不同的对象上，可以产生不同的结果。

C++实现多态，最常见的方式就是用虚函数和虚函数表。这玩意儿很强大，但也有缺点，那就是运行时决议，需要查虚函数表，性能上会有损耗。而且，你得继承一个基类，这在某些场景下并不方便。

那有没有一种办法，既能实现多态，又不用虚函数表，还能在编译期就确定下来？这就是类型擦除要解决的问题。

类型擦除，顾名思义，就是把类型信息给“擦”掉一部分。但别慌，不是全部擦掉，而是擦掉那些不必要的细节，保留必要的接口。这样，我们就可以用统一的方式来处理不同的类型，而不需要事先知道它们的具体类型。

类型擦除的原理：一个快递的例子

想象一下，你要寄快递，不管你寄的是衣服、鞋子还是砖头，你都只需要告诉快递员两件事：

我要寄东西： 这是一个统一的操作（接口）。
收件地址： 这是必要的信息，快递员需要知道送到哪里。

快递员不需要知道你的包裹里到底是什么，只需要知道怎么处理它（比如贴标签、扫描条码、装车）。这就是一个简单的类型擦除的例子。你把包裹的具体类型给“擦”掉了，只保留了必要的接口和信息。

C++代码实现：any类型的简易版

咱们用C++代码来演示一下类型擦除的原理。先来一个最简单的any类型，它可以存储任何类型的值。

#include <iostream>
#include <memory>

class any {
public:
  // 构造函数，接受任意类型的值
  template <typename T>
  any(T value) : impl_(std::make_unique<model<T>>(std::move(value))) {}

  // 析构函数
  ~any() = default;

  // 赋值操作
  template <typename T>
  any& operator=(T value) {
    impl_ = std::make_unique<model<T>>(std::move(value));
    return *this;
  }

  // 获取存储的值（需要显式指定类型）
  template <typename T>
  T& as() {
    return static_cast<model<T>&>(*impl_).value_;
  }

  template <typename T>
  const T& as() const {
    return static_cast<const model<T>&>(*impl_).value_;
  }

private:
  // 接口类，定义了存储和访问值的接口
  class concept {
  public:
    virtual ~concept() = default;
    virtual any* clone() const = 0;
  };

  // 模型类，实现了接口类，存储了具体的值
  template <typename T>
  class model : public concept {
  public:
    model(T value) : value_(std::move(value)) {}
    any* clone() const override { return new model(value_); }
    T value_;
  };

  std::unique_ptr<concept> impl_;
};

int main() {
  any a = 10;
  any b = std::string("hello");

  std::cout << a.as<int>() << std::endl;
  std::cout << b.as<std::string>() << std::endl;

  return 0;
}

这个any类型，内部使用了一个concept接口类和一个model模板类。

concept接口类定义了存储和访问值的抽象接口。
model模板类实现了concept接口，并且存储了具体类型的值。

当我们创建一个any对象时，实际上创建了一个model对象，并且将它存储在impl_指针中。这个impl_指针指向的是concept接口类，而不知道具体的类型。

当我们想要获取存储的值时，需要使用as<T>()方法，显式地指定类型。这个方法会将impl_指针强制转换为model<T>*类型，然后返回存储的值。

类型擦除的进阶：实现编译期多态

any类型只是类型擦除的一个简单应用。更高级的应用是实现编译期多态。

假设我们有一个需求：需要对不同类型的对象进行排序，但是这些对象没有共同的基类。

传统的做法是定义一个虚函数compare，然后在每个类中实现这个虚函数。但是，这样做需要修改每个类的定义，并且会引入虚函数表。

使用类型擦除，我们可以避免这些问题。

#include <iostream>
#include <vector>
#include <algorithm>
#include <memory>
#include <functional>

// 比较器的概念
class comparable_concept {
public:
    virtual ~comparable_concept() = default;
    virtual bool compare(const void* a, const void* b) const = 0;
    virtual comparable_concept* clone() const = 0; // 添加clone函数
};

// 比较器的模型
template <typename T, typename Compare = std::less<T>>
class comparable_model : public comparable_concept {
public:
    comparable_model(Compare comp = Compare()) : comp_(comp) {}
    bool compare(const void* a, const void* b) const override {
        const T* ta = static_cast<const T*>(a);
        const T* tb = static_cast<const T*>(b);
        return comp_(*ta, *tb);
    }
    comparable_concept* clone() const override { return new comparable_model(comp_); }
private:
    Compare comp_;
};

// 类型擦除的比较器
class any_comparable {
public:
    template <typename T, typename Compare = std::less<T>>
    any_comparable(Compare comp = Compare()) :
        impl_(std::make_unique<comparable_model<T, Compare>>(comp)),
        type_size_(sizeof(T)),
        alignment_(alignof(T)) // 添加alignment_成员
    {}

    bool compare(const void* a, const void* b) const {
        return impl_->compare(a, b);
    }

    size_t type_size() const { return type_size_; }
    size_t alignment() const { return alignment_; }

    // 添加拷贝构造函数
    any_comparable(const any_comparable& other) :
        impl_(other.impl_->clone()),
        type_size_(other.type_size_),
        alignment_(other.alignment_)
    {}

    // 添加赋值运算符
    any_comparable& operator=(const any_comparable& other) {
        if (this != &other) {
            impl_.reset(other.impl_->clone());
            type_size_ = other.type_size_;
            alignment_ = other.alignment_;
        }
        return *this;
    }

private:
    std::unique_ptr<comparable_concept> impl_;
    size_t type_size_;
    size_t alignment_;
};

// 通用的排序函数
void sort(void* begin, void* end, size_t element_size, const any_comparable& comp) {
    if (begin == end) return; // 避免除以零

    // 简化版，仅用于演示
    char* p = static_cast<char*>(begin);
    char* q = static_cast<char*>(begin);
    char* r = static_cast<char*>(end);
    r = r - element_size;

    while(q <= r){
        char* min = q;
        char* s = q + element_size;
        for(;s <=r;s+=element_size){
            if(comp.compare(s,min)){
                min = s;
            }
        }
        if(min != q){
            std::vector<char> temp(element_size);
            std::memcpy(temp.data(),q,element_size);
            std::memcpy(q,min,element_size);
            std::memcpy(min,temp.data(),element_size);
        }
        q += element_size;
    }
}

struct Point {
    int x, y;
};

std::ostream& operator<<(std::ostream& os, const Point& p) {
    os << "(" << p.x << ", " << p.y << ")";
    return os;
}

int main() {
    std::vector<int> numbers = {3, 1, 4, 1, 5, 9, 2, 6};
    std::vector<Point> points = {{1, 2}, {3, 4}, {0, 0}, {5, 1}};

    // 使用默认的std::less<int>比较器
    any_comparable int_comp;
    sort(numbers.data(), numbers.data() + numbers.size(), sizeof(int), int_comp);

    std::cout << "Sorted numbers: ";
    for (int num : numbers) {
        std::cout << num << " ";
    }
    std::cout << std::endl;

    // 使用自定义的Point比较器
    auto point_comp = [](const Point& a, const Point& b) {
        return a.x * a.x + a.y * a.y < b.x * b.x + b.y * b.y;
    };
    any_comparable point_any_comp(point_comp);
    sort(points.data(), points.data() + points.size(), sizeof(Point), point_any_comp);

    std::cout << "Sorted points: ";
    for (const Point& p : points) {
        std::cout << p << " ";
    }
    std::cout << std::endl;

    return 0;
}

在这个例子中，我们定义了一个any_comparable类，它可以存储任意类型的比较器。any_comparable内部使用了一个comparable_concept接口类和一个comparable_model模板类，类似于any类型。

sort函数接受一个any_comparable对象作为参数，并且使用它来比较不同类型的对象。

关键点：

comparable_concept: 定义了比较操作的接口。
comparable_model: 模板类，实现了comparable_concept接口，存储了具体的比较器对象（例如std::less<int>或自定义的lambda表达式）。
any_comparable: 类型擦除类，隐藏了具体的比较器类型，只暴露了compare接口。
sort函数: 通用排序函数，可以对任意类型的数组进行排序，只要提供一个any_comparable对象即可。

类型擦除的优点和缺点

优点：

编译期多态： 类型在编译期确定，避免了虚函数表的开销。
灵活性： 可以处理没有共同基类的类型。
解耦： 排序算法和具体类型解耦，提高了代码的可重用性。

缺点：

代码复杂性： 实现类型擦除的代码通常比较复杂。
类型安全： 需要显式地指定类型，可能会导致类型错误。
运行时开销： 虽然避免了虚函数表，但仍然有一些运行时开销，例如动态内存分配和类型转换。
需要拷贝构造函数和赋值运算符： 类型擦除类通常需要手动实现拷贝构造函数和赋值运算符，以确保正确地复制内部状态。

类型擦除的应用场景

类型擦除在以下场景中非常有用：

泛型算法： 例如std::sort、std::find等算法，可以使用类型擦除来实现对任意类型的操作。
事件处理： 可以使用类型擦除来实现事件的注册和分发，而不需要事先知道事件的具体类型。
插件系统： 可以使用类型擦除来实现插件的加载和调用，而不需要事先知道插件的具体类型。
函数式编程： 例如std::function，可以使用类型擦除来存储任意类型的可调用对象。

总结

类型擦除是一种强大的技术，可以实现编译期多态，并且提高代码的灵活性和可重用性。但是，它也有一些缺点，例如代码复杂性和类型安全问题。在实际应用中，需要根据具体的需求来权衡利弊，选择合适的技术。

表格总结：虚函数 vs 类型擦除

特性	虚函数	类型擦除
多态性	运行时多态	编译期多态
性能	运行时开销（虚函数表查找）	运行时开销（动态内存分配、类型转换），但无虚函数表查找
灵活性	需要继承共同基类	可以处理没有共同基类的类型
代码复杂性	相对简单	相对复杂
类型安全	相对安全（编译器可以进行类型检查）	需要显式指定类型，可能导致类型错误
应用场景	需要运行时多态，且有共同基类的场景	需要编译期多态，或者需要处理没有共同基类的类型的场景

最后，强调几点注意事项：

内存管理： 使用类型擦除时，务必注意内存管理，避免内存泄漏。std::unique_ptr是一个不错的选择。
异常安全： 确保类型擦除的代码是异常安全的，避免在异常情况下出现资源泄漏或者状态不一致。
性能测试： 在实际应用中，需要进行性能测试，评估类型擦除带来的性能提升或者损耗。
理解原理： 理解类型擦除的原理非常重要，只有理解了原理，才能更好地使用它。

好了，今天的讲座就到这里。希望各位观众老爷们有所收获！如果有什么疑问，欢迎提问。谢谢大家！

发表回复 取消回复

发表回复取消回复