C++实现内存泄漏检测：利用自定义分配器与堆栈追踪进行事后分析 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

C++内存泄漏检测：利用自定义分配器与堆栈追踪进行事后分析

大家好，今天我们来深入探讨一个C++开发中非常重要但又常常令人头疼的问题：内存泄漏。我们将重点讲解如何利用自定义分配器和堆栈追踪技术，进行事后分析，定位和解决内存泄漏。

内存泄漏的危害与检测方法

内存泄漏是指程序在动态分配内存后，由于某种原因未能及时释放，导致这部分内存无法再次使用。长期积累会导致系统资源耗尽，程序性能下降，甚至崩溃。

检测内存泄漏的方法有很多，大致可以分为两大类：

动态检测： 在程序运行过程中进行检测，例如使用Valgrind、AddressSanitizer (ASan) 等工具。这类工具可以实时监控内存分配和释放，并报告潜在的泄漏。优点是准确性高，缺点是会显著降低程序运行速度。
静态检测： 在程序编译或构建时进行检测，例如使用静态代码分析工具。这类工具通过分析代码的结构和逻辑，找出可能导致内存泄漏的代码模式。优点是速度快，缺点是可能存在误报或漏报。
事后分析： 在程序崩溃或结束运行后，分析dump文件或者日志文件，找出可能导致内存泄漏的内存块。优点是不影响程序运行速度，缺点是需要程序记录内存分配信息。

今天我们聚焦于第三种，事后分析方法，它在某些特定场景下非常有效，例如线上环境，我们不希望开启动态检测工具影响性能，但又需要检测内存泄漏。

自定义分配器：记录内存分配信息

事后分析的关键在于我们需要记录每次内存分配的信息，包括分配的地址、大小、分配的时间、以及分配时的堆栈信息。C++允许我们自定义内存分配器，从而可以方便地实现这些记录功能。

首先，我们定义一个简单的内存分配器基类：

#include <iostream>
#include <new>
#include <vector>
#include <map>
#include <mutex>
#include <execinfo.h> // for backtrace
#include <cstdlib>   // for malloc, free

class BaseAllocator {
public:
    virtual void* allocate(size_t size) = 0;
    virtual void deallocate(void* ptr) = 0;
    virtual ~BaseAllocator() = default;
};

接下来，我们实现一个自定义的分配器，它继承自BaseAllocator，并记录内存分配信息。

class LeakTrackingAllocator : public BaseAllocator {
public:
    LeakTrackingAllocator() : totalAllocated(0) {}
    ~LeakTrackingAllocator() {
        std::lock_guard<std::mutex> lock(mutex_);
        if (!allocations_.empty()) {
            std::cerr << "Memory leaks detected!" << std::endl;
            for (const auto& [ptr, allocInfo] : allocations_) {
                std::cerr << "  Address: " << ptr << ", Size: " << allocInfo.size << " bytes" << std::endl;
                printStacktrace(allocInfo.stacktrace);
            }
        } else {
            std::cout << "No memory leaks detected." << std::endl;
        }
    }

    void* allocate(size_t size) override {
        void* ptr = malloc(size); // Use malloc for actual allocation
        if (ptr) {
            std::lock_guard<std::mutex> lock(mutex_);
            totalAllocated += size;
            AllocationInfo allocInfo;
            allocInfo.size = size;
            captureStacktrace(allocInfo.stacktrace);
            allocations_[ptr] = allocInfo;
            return ptr;
        }
        throw std::bad_alloc();
    }

    void deallocate(void* ptr) override {
        if (ptr) {
            std::lock_guard<std::mutex> lock(mutex_);
            auto it = allocations_.find(ptr);
            if (it != allocations_.end()) {
                totalAllocated -= it->second.size;
                allocations_.erase(it);
                free(ptr); // Use free for actual deallocation
            } else {
                std::cerr << "Attempting to deallocate unknown pointer: " << ptr << std::endl;
                free(ptr); // Still free the memory to avoid double free issues
            }
        }
    }

    size_t getTotalAllocated() const {
        std::lock_guard<std::mutex> lock(mutex_);
        return totalAllocated;
    }

private:
    struct AllocationInfo {
        size_t size;
        std::vector<void*> stacktrace;
    };

    std::map<void*, AllocationInfo> allocations_;
    std::mutex mutex_;
    size_t totalAllocated;

    static const int STACKTRACE_DEPTH = 20;

    void captureStacktrace(std::vector<void*>& stacktrace) {
        stacktrace.resize(STACKTRACE_DEPTH);
        int frames = backtrace(stacktrace.data(), STACKTRACE_DEPTH);
        stacktrace.resize(frames);
    }

    void printStacktrace(const std::vector<void*>& stacktrace) {
        char** symbols = backtrace_symbols(stacktrace.data(), stacktrace.size());
        if (symbols) {
            std::cerr << "  Stacktrace:" << std::endl;
            for (size_t i = 0; i < stacktrace.size(); ++i) {
                std::cerr << "    " << symbols[i] << std::endl;
            }
            free(symbols);
        } else {
            std::cerr << "  Failed to retrieve stacktrace symbols." << std::endl;
        }
    }
};

这个LeakTrackingAllocator类做了以下几件事：

记录分配信息： allocations_ 是一个 std::map，用于存储每次分配的地址和大小。
堆栈追踪： captureStacktrace 函数使用 backtrace 函数获取当前堆栈信息，并保存到 stacktrace。
析构函数检测： 在析构函数中，检查 allocations_ 是否为空。如果不为空，则表示存在内存泄漏，并打印泄漏的地址、大小以及堆栈信息。
线程安全： 使用 std::mutex 保证线程安全。
使用malloc和free: 避免递归调用分配器导致栈溢出。在allocate和deallocate中，实际的内存分配和释放使用的是标准的malloc和free函数。

使用自定义分配器

有了自定义分配器，我们就可以在程序中使用它来分配内存，从而追踪内存泄漏。

一种方法是直接使用分配器分配内存：

#include <iostream>

int main() {
    LeakTrackingAllocator allocator;
    int* ptr = static_cast<int*>(allocator.allocate(sizeof(int)));
    *ptr = 10;

    // 故意注释掉 deallocate，造成内存泄漏
    //allocator.deallocate(ptr);

    return 0;
}

另一种更常用的方法是重载 new 和 delete 操作符。我们可以针对特定的类，或者全局地重载 new 和 delete。

1. 针对特定类重载 new 和 delete：

class MyClass {
public:
    MyClass() : data(0) {}
    ~MyClass() {}

    void* operator new(size_t size) {
        return allocator.allocate(size);
    }

    void operator delete(void* ptr) {
        allocator.deallocate(ptr);
    }

private:
    int data;
    static LeakTrackingAllocator allocator;
};

LeakTrackingAllocator MyClass::allocator; // 必须初始化静态成员变量

int main() {
    MyClass* obj = new MyClass();
    // 故意注释掉 delete，造成内存泄漏
    //delete obj;

    return 0;
}

2. 全局重载 new 和 delete：

这种方法会影响程序中所有 new 和 delete 的行为，需要谨慎使用。

#include <iostream>

static LeakTrackingAllocator globalAllocator;

void* operator new(size_t size) {
    return globalAllocator.allocate(size);
}

void operator delete(void* ptr) noexcept {
    globalAllocator.deallocate(ptr);
}

int main() {
    int* ptr = new int(20);
    // 故意注释掉 delete，造成内存泄漏
    //delete ptr;
    return 0;
}

当程序结束运行时，如果存在内存泄漏，LeakTrackingAllocator 的析构函数会打印出泄漏的内存地址和堆栈信息。

分析堆栈信息

堆栈信息是定位内存泄漏的关键。它告诉我们内存是在哪个函数、哪个文件中分配的。

堆栈信息通常是这样的：

  Stacktrace:
    ./leak_example(_Z14captureStacktraceSt6vectorIPvmSt10allocatorIS1_EE+0x2d) [0x5555555552ed]
    ./leak_example(_ZN21LeakTrackingAllocator8allocateEm+0x79) [0x555555555449]
    ./leak_example(_Znwm+0x11) [0x555555555571]
    ./leak_example(main+0x19) [0x5555555555b9]
    /lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf3) [0x7ffff7c5d083]
    ./leak_example(_start+0x2e) [0x5555555551fe]

这些地址需要经过符号化才能转换成可读的函数名和文件名。可以使用addr2line工具进行符号化：

addr2line -e leak_example 0x5555555555b9

其中，leak_example是可执行文件名，0x5555555555b9是堆栈信息中的地址。

符号化后的结果可能是这样的：

main
/path/to/leak_example.cpp:20

这表示内存泄漏发生在leak_example.cpp文件的第20行，也就是main函数中。

进一步优化：记录更多信息

除了地址和大小，我们还可以记录更多信息，例如分配时间、分配器类型等，以便更方便地进行分析。

#include <chrono>
#include <iomanip>

class LeakTrackingAllocator : public BaseAllocator {
    // ... (之前的代码)

private:
    struct AllocationInfo {
        size_t size;
        std::vector<void*> stacktrace;
        std::chrono::system_clock::time_point allocationTime; // 记录分配时间
    };

    // ... (之前的代码)

public:
    void* allocate(size_t size) override {
        void* ptr = malloc(size); // Use malloc for actual allocation
        if (ptr) {
            std::lock_guard<std::mutex> lock(mutex_);
            totalAllocated += size;
            AllocationInfo allocInfo;
            allocInfo.size = size;
            captureStacktrace(allocInfo.stacktrace);
            allocInfo.allocationTime = std::chrono::system_clock::now();
            allocations_[ptr] = allocInfo;
            return ptr;
        }
        throw std::bad_alloc();
    }

     ~LeakTrackingAllocator() {
        std::lock_guard<std::mutex> lock(mutex_);
        if (!allocations_.empty()) {
            std::cerr << "Memory leaks detected!" << std::endl;
            for (const auto& [ptr, allocInfo] : allocations_) {
                std::cerr << "  Address: " << ptr << ", Size: " << allocInfo.size << " bytes, Allocation Time: " << formatTime(allocInfo.allocationTime) << std::endl;
                printStacktrace(allocInfo.stacktrace);
            }
        } else {
            std::cout << "No memory leaks detected." << std::endl;
        }
    }

private:
    std::string formatTime(const std::chrono::system_clock::time_point& timePoint) {
        std::time_t tt = std::chrono::system_clock::to_time_t(timePoint);
        std::tm tm = *std::localtime(&tt);
        std::stringstream ss;
        ss << std::put_time(&tm, "%Y-%m-%d %H:%M:%S");
        return ss.str();
    }
};

我们添加了allocationTime字段，用于记录分配时间。在析构函数中，我们将分配时间也打印出来。

注意事项与限制

性能影响： 自定义分配器会带来一定的性能开销，因为我们需要记录分配信息。在生产环境中，可以考虑使用条件编译，只在调试版本中启用自定义分配器。
第三方库： 如果程序使用了第三方库，而这些库使用了标准的 new 和 delete，那么自定义分配器可能无法追踪这些库的内存泄漏。
复杂性： 对于复杂的程序，内存泄漏的原因可能非常复杂，需要结合其他工具和技术进行分析。
malloc和free的使用: 自定义分配器内部使用malloc和free，可以避免递归调用new和delete导致栈溢出。
线程安全: std::mutex保证了分配器在多线程环境下的线程安全。

一个更完整的例子

下面是一个更完整的例子，演示了如何使用自定义分配器来检测内存泄漏：

#include <iostream>
#include <vector>

class MyClass {
public:
    MyClass(int value) : data(value) {}
    ~MyClass() {
        std::cout << "MyClass destructor called." << std::endl;
    }

    void* operator new(size_t size) {
        return allocator.allocate(size);
    }

    void operator delete(void* ptr) {
        allocator.deallocate(ptr);
    }

private:
    int data;
    static LeakTrackingAllocator allocator;
};

LeakTrackingAllocator MyClass::allocator;

int main() {
    std::vector<MyClass*> objects;
    for (int i = 0; i < 10; ++i) {
        MyClass* obj = new MyClass(i);
        objects.push_back(obj);
    }

    // 模拟某些情况下忘记释放内存
    //for (MyClass* obj : objects) {
    //    delete obj;
    //}

    return 0;
}

在这个例子中，我们创建了一个MyClass类，并重载了new和delete操作符，使用自定义分配器进行内存管理。在main函数中，我们创建了一个std::vector，存储了10个MyClass对象。我们故意注释掉了释放内存的代码，从而造成内存泄漏。当程序结束运行时，LeakTrackingAllocator的析构函数会检测到内存泄漏，并打印出泄漏的内存地址和堆栈信息。

总结：利用自定义分配器辅助定位内存泄漏

我们讨论了如何利用自定义分配器和堆栈追踪技术，进行事后分析，定位和解决C++程序中的内存泄漏问题。通过自定义分配器，我们可以记录每次内存分配的信息，包括地址、大小、堆栈信息等。这些信息可以帮助我们快速定位内存泄漏的位置，并采取相应的措施进行修复。记住，选择合适的内存泄漏检测方法取决于你的具体需求和环境。事后分析方法在某些情况下非常有效，特别是当你不希望在线上环境中使用动态检测工具时。

希望这次讲座能帮助你更好地理解C++内存泄漏检测，并在实际开发中应用这些技术。

更多IT精英技术系列讲座，到智猿学院