C++ 虚函数表（vtable）深入：运行时多态的基石与安全隐患 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位听众，欢迎来到今天的C++虚函数表（vtable）深度剖析讲座！今天咱们不搞那些虚头巴脑的理论，直接上干货，把这个vtable扒个底朝天，看看它到底是运行时多态的基石，还是隐藏着安全隐患的定时炸弹。

开场白：什么是虚函数？

首先，咱们得搞清楚，啥是虚函数？简单来说，虚函数就是用 virtual 关键字修饰的成员函数。它的意义在于，允许你通过基类的指针或引用来调用派生类中重写的函数，实现运行时多态。

class Base {
public:
    virtual void foo() {
        std::cout << "Base::foo()" << std::endl;
    }
};

class Derived : public Base {
public:
    void foo() override { // override 关键字建议使用，增加代码可读性
        std::cout << "Derived::foo()" << std::endl;
    }
};

int main() {
    Base* basePtr = new Derived();
    basePtr->foo(); // 输出 "Derived::foo()"  -- 这就是运行时多态！
    delete basePtr;
    return 0;
}

如果没有 virtual 关键字，basePtr->foo() 就会调用 Base::foo()，而不是 Derived::foo()。

正题：虚函数表（vtable）是个啥玩意？

好了，关键来了，virtual 关键字背后到底发生了什么魔法？答案就是：虚函数表（vtable）。

想象一下，编译器需要知道，当通过基类指针调用虚函数时，具体应该调用哪个派生类的函数。总不能每次都遍历所有派生类吧？那效率也太低了。

所以，编译器为每个包含虚函数的类（以及它的派生类，如果派生类重写了虚函数）创建一个虚函数表（vtable）。这个表其实就是一个函数指针数组，每个指针都指向一个虚函数的地址。

每个包含虚函数的类的对象，都会有一个隐藏的指针（通常称为 vptr），指向该类的 vtable。

vtable 的结构

我们可以用一个表格来表示 vtable 的结构：

索引	函数指针
0	指向第一个虚函数的地址，例如 `Base::foo()` 的地址
1	指向第二个虚函数的地址，例如 `Base::bar()` 的地址
2	指向第三个虚函数的地址，…
…	…

代码演示：窥探 vtable

虽然我们不能直接访问 vtable，但我们可以通过一些“黑科技”来窥探它的结构。注意：以下代码具有一定的风险，可能会导致未定义行为。请谨慎使用！

#include <iostream>

class Base {
public:
    virtual void foo() {
        std::cout << "Base::foo()" << std::endl;
    }
    virtual void bar() {
        std::cout << "Base::bar()" << std::endl;
    }
    virtual ~Base() { std::cout << "Base::~Base()" << std::endl;} // 必须是虚析构函数！
};

class Derived : public Base {
public:
    void foo() override {
        std::cout << "Derived::foo()" << std::endl;
    }
    void baz() {
        std::cout << "Derived::baz()" << std::endl;
    }
     ~Derived() override { std::cout << "Derived::~Derived()" << std::endl;}

};

int main() {
    Derived d;
    // 获取对象的 vptr
    void** vptr = (void**)(&d);

    // 获取 vtable 的首地址
    void** vtable = (void**)(*vptr);

    // 打印 vtable 中的函数地址
    std::cout << "Vtable of Derived:" << std::endl;
    std::cout << "foo: " << vtable[0] << std::endl;
    std::cout << "bar: " << vtable[1] << std::endl;
    std::cout << "~Derived: " << vtable[2] << std::endl;

    Base* b = new Derived();
    void** vptr_b = (void**)(b);

    // 获取 vtable 的首地址
    void** vtable_b = (void**)(*vptr_b);

    // 打印 vtable 中的函数地址
    std::cout << "Vtable of Base* to Derived:" << std::endl;
    std::cout << "foo: " << vtable_b[0] << std::endl;
    std::cout << "bar: " << vtable_b[1] << std::endl;
    std::cout << "~Derived: " << vtable_b[2] << std::endl;
    delete b;

    return 0;
}

这段代码首先创建一个 Derived 类的对象 d。然后，我们通过指针操作，获取对象 d 的 vptr，进而获取 vtable 的首地址。最后，我们打印 vtable 中前几个函数的地址。

注意：

这段代码依赖于编译器的实现细节，不同的编译器可能会有不同的结果。
直接访问 vtable 是不安全的，可能会导致程序崩溃。

vtable 的继承

如果派生类重写了基类的虚函数，那么派生类的 vtable 中对应的函数指针就会指向派生类的函数。如果没有重写，那么派生类的 vtable 中对应的函数指针就会指向基类的函数。

例如，在上面的例子中，Derived 类重写了 foo() 函数，所以 Derived 类的 vtable 中 foo 的指针指向 Derived::foo()，而 bar() 函数没有被重写，所以 Derived 类的 vtable 中 bar 的指针指向 Base::bar()。

虚析构函数的重要性

在上面的代码中，你可能注意到了，我把 Base 类的析构函数声明为 virtual。这是非常重要的！

如果你的基类有虚函数，那么一定要把析构函数声明为 virtual。否则，当你通过基类指针删除派生类对象时，只会调用基类的析构函数，而不会调用派生类的析构函数，导致内存泄漏。

// 错误示例：没有虚析构函数
class Base {
public:
    virtual void foo() {}
    ~Base() { std::cout << "Base::~Base()" << std::endl; } // 不是虚函数！
};

class Derived : public Base {
public:
    ~Derived() { std::cout << "Derived::~Derived()" << std::endl; }
};

int main() {
    Base* basePtr = new Derived();
    delete basePtr; // 只会调用 Base::~Base()，Derived::~Derived() 不会被调用！
    return 0;
}

运行时多态的实现原理

现在，我们来总结一下运行时多态的实现原理：

编译器创建 vtable： 为每个包含虚函数的类创建一个 vtable，其中包含指向虚函数的指针。
对象包含 vptr： 每个包含虚函数的类的对象都包含一个 vptr，指向该类的 vtable。
通过 vptr 调用虚函数： 当通过基类指针或引用调用虚函数时，编译器会生成代码，通过 vptr 找到 vtable，然后根据函数在 vtable 中的索引，调用相应的函数。

用表格来总结：

步骤	描述
1	编译器为包含虚函数的类创建 vtable。
2	每个对象包含 vptr，指向所属类的 vtable。
3	通过基类指针调用虚函数时，使用 vptr 找到 vtable，然后根据函数索引调用实际的函数。

vtable 的安全隐患

vtable 虽然是实现运行时多态的关键，但也带来了一些安全隐患。

vtable 污染： 如果攻击者能够修改对象的 vptr，使其指向一个恶意的 vtable，那么当程序调用虚函数时，就会执行攻击者指定的代码。这被称为 vtable 污染攻击。

例如，攻击者可以覆盖对象的 vptr，使其指向一个包含恶意代码的 vtable。当程序调用虚函数时，实际上会执行恶意代码，从而控制程序。
信息泄露： vtable 中包含了函数地址，攻击者可以通过分析 vtable，获取程序的内部结构信息，为进一步的攻击做准备。

攻击者可以读取 vtable 的内容，从而获得程序中各个虚函数的地址。这些地址可以用来分析程序的代码结构，甚至用来进行代码注入攻击。

防御 vtable 污染

为了防御 vtable 污染攻击，可以采取以下措施：

代码完整性保护： 使用代码完整性保护技术，防止攻击者修改程序的代码和数据。
数据执行保护 (DEP)： 启用 DEP，防止在数据区域执行代码。
地址空间布局随机化 (ASLR)： 启用 ASLR，使程序的内存地址随机化，增加攻击难度。
使用更安全的编程语言： 一些编程语言（例如 Rust）提供了更强的内存安全保证，可以有效地防止 vtable 污染攻击。

总结

虚函数表（vtable）是 C++ 实现运行时多态的关键机制。它通过在每个对象中存储一个指向 vtable 的指针（vptr），实现了在运行时根据对象的实际类型调用相应的函数。

然而，vtable 也带来了一些安全隐患，例如 vtable 污染和信息泄露。为了防御这些攻击，需要采取相应的安全措施。

Q&A 环节

好了，讲了这么多，大家有没有什么问题？现在是 Q&A 环节，欢迎提问！

(等待观众提问并解答)

结束语

希望今天的讲座对大家有所帮助。vtable 是 C++ 中一个非常重要的概念，理解它的原理对于编写安全、高效的 C++ 代码至关重要。感谢大家的聆听！

补充说明（防止杠精）

编译器优化： 编译器可能会对 vtable 进行优化，例如内联虚函数调用，或者使用 devirtualization 技术，消除虚函数调用带来的开销。
多重继承： 在多重继承的情况下，对象的 vptr 数量可能会不止一个。
抽象类： 包含纯虚函数的类是抽象类，不能创建对象。

希望这些补充说明能够帮助大家更全面地理解 vtable。记住，理解底层原理才能写出更健壮的代码！

发表回复 取消回复

发表回复取消回复