C++ 性能分析工具：`perf`, `Valgrind`, `gprof` 的深度应用 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

C++ 性能分析：三剑客在手，Bug 无处遁形

话说程序员的世界，就是一个不断和 Bug 作斗争的世界。但有时候，Bug 就像躲猫猫的小孩，藏得特别深，让你抓耳挠腮，恨不得把电脑砸了。更可怕的是，有些 Bug 不是功能上的错误，而是性能上的瓶颈，程序跑是能跑，但慢得像蜗牛，CPU 呼呼作响，硬盘嗡嗡乱转，用户体验简直糟糕透顶！

这时候，我们就需要祭出我们的秘密武器——C++ 性能分析工具！今天，就让我们一起深入了解一下 C++ 性能分析界的三位大神：perf、Valgrind 和 gprof，看看它们如何帮助我们揪出那些隐藏在代码深处的性能恶魔。

一、perf：系统级的侦察兵

perf，全称 Performance Counters for Linux，是 Linux 系统自带的性能分析工具。它就像一位经验丰富的侦察兵，可以深入到系统的各个角落，收集各种性能指标，比如 CPU 周期、缓存命中率、指令数等等。有了这些信息，我们就能对程序的运行状况有一个全局的了解。

perf 的优势：

系统级监控： perf 不仅能分析用户空间的程序，还能监控内核空间的活动，让你对程序的整体性能有一个更全面的了解。
低开销： perf 使用硬件性能计数器，对程序的性能影响很小，所以可以在生产环境中使用，不会对程序的正常运行造成太大的干扰。
强大的分析能力： perf 提供了丰富的命令和选项，可以进行各种复杂的性能分析，比如火焰图生成、热点函数定位等等。

perf 的使用方法：

perf 的使用稍微复杂一些，需要一些 Linux 基础知识。但不用担心，只要掌握几个常用的命令，就能轻松上手。

perf record： 用于记录程序的性能数据。
```
perf record ./my_program
```
这条命令会运行 my_program，并在后台记录其性能数据。
perf report： 用于生成性能报告。
```
perf report
```
这条命令会读取 perf record 生成的数据文件，并生成一个交互式的性能报告，你可以通过上下键来浏览不同的函数，查看它们的性能指标。
perf top： 实时显示系统中各个进程的 CPU 使用情况。
```
perf top
```
这条命令会实时更新 CPU 使用率最高的进程和函数，方便你快速定位性能瓶颈。
perf annotate： 查看汇编级别的性能数据。
```
perf annotate -l --source ./my_program
```
这个命令会把性能数据和源代码结合起来，让你看到每一行代码的执行次数和 CPU 占用率。

举个栗子：

假设我们有一个计算斐波那契数列的程序 fibonacci，我们怀疑它的性能有问题。我们可以使用 perf 来分析它：

perf record ./fibonacci 30  # 计算斐波那契数列的第 30 项
perf report

通过 perf report 生成的报告，我们可以看到哪个函数占用了最多的 CPU 时间。如果发现是递归计算斐波那契数列的函数 fib 占用了大量的 CPU 时间，我们就可以考虑优化这个函数，比如使用迭代的方式来计算斐波那契数列，或者使用缓存来避免重复计算。

二、Valgrind：内存问题的终结者

Valgrind 是一套强大的调试和性能分析工具，它包含多个工具，其中最常用的就是 Memcheck，用于检测内存错误，比如内存泄漏、非法访问等等。Valgrind 就像一位经验丰富的侦探，可以追踪程序中的每一个内存操作，一旦发现可疑的行为，就会立即发出警报。

Valgrind 的优势：

精确的内存错误检测： Valgrind 可以检测各种各样的内存错误，包括内存泄漏、使用未初始化的内存、非法写入内存等等。
详细的错误报告： Valgrind 会提供详细的错误报告，包括错误发生的地点、错误类型等等，方便你快速定位和修复问题。
支持多种平台： Valgrind 支持多种平台，包括 Linux、macOS 等等。

Valgrind 的使用方法：

Valgrind 的使用非常简单，只需要在运行程序时加上 valgrind 命令即可。

valgrind --leak-check=full ./my_program

这条命令会运行 my_program，并使用 Memcheck 工具来检测内存错误。如果程序中存在内存错误，Valgrind 会在控制台上输出详细的错误报告。

举个栗子：

假设我们有一个程序 memory_leak，其中存在内存泄漏：

#include <iostream>

int main() {
  int* ptr = new int[10];
  // ... 一些操作
  // delete[] ptr; // 忘记释放内存
  return 0;
}

我们可以使用 Valgrind 来检测这个内存泄漏：

valgrind --leak-check=full ./memory_leak

Valgrind 会输出如下的错误报告：

==12345== Memcheck, a memory error detector
==12345== Copyright (C) 2002-2017, and GNU GPL'd, by Julian Seward et al.
==12345== Using Valgrind-3.15.0 and LibVEX; rerun with -h for copyright info
==12345== Command: ./memory_leak
==12345==
==12345== HEAP SUMMARY:
==12345==     in use at exit: 40 bytes in 1 blocks
==12345==   total heap usage: 1 allocs, 0 frees, 40 bytes allocated
==12345==
==12345== 40 bytes in 1 blocks are definitely lost in loss record 1 of 1
==12345==    at 0x4C2FB0F: operator new[](unsigned long) (in /usr/lib/valgrind/vgpreload_memcheck-amd64-linux.so)
==12345==    by 0x10917D: main (memory_leak.cpp:4)
==12345==
==12345== LEAK SUMMARY:
==12345==    definitely lost: 40 bytes in 1 blocks
==12345==    indirectly lost: 0 bytes in 0 blocks
==12345==      possibly lost: 0 bytes in 0 blocks
==12345==    still reachable: 0 bytes in 0 blocks
==12345==         suppressed: 0 bytes in 0 blocks
==12345==
==12345== For lists of detected and suppressed errors, rerun with: -s
==12345== ERROR SUMMARY: 1 errors from 1 contexts (suppressed: 0 from 0)

从错误报告中，我们可以看到程序中存在 40 字节的内存泄漏，发生在 memory_leak.cpp 的第 4 行，也就是 new int[10] 这一行。有了这个信息，我们就可以很容易地找到并修复这个内存泄漏。

三、gprof：函数调用关系的解密者

gprof 是一款老牌的性能分析工具，它可以分析程序的函数调用关系，并统计每个函数的执行时间和调用次数。gprof 就像一位细心的记录员，可以记录程序中每一个函数的调用情况，让你对程序的整体结构有一个更清晰的了解。

gprof 的优势：

函数调用关系分析： gprof 可以生成函数调用图，让你看到程序中各个函数之间的调用关系。
函数执行时间统计： gprof 可以统计每个函数的执行时间和调用次数，方便你找到性能瓶颈。
使用简单： gprof 的使用相对简单，只需要在编译时加上 -pg 选项，然后在运行程序后使用 gprof 命令即可。

gprof 的使用方法：

编译程序时加上 -pg 选项：
```
g++ -pg -o my_program my_program.cpp
```
运行程序：
```
./my_program
```
运行程序后，会生成一个 gmon.out 文件，其中包含了程序的性能数据。
使用 gprof 命令生成性能报告：
```
gprof my_program gmon.out > report.txt
```
这条命令会读取 gmon.out 文件，并生成一个性能报告 report.txt。

举个栗子：

假设我们有一个程序 function_call，其中包含多个函数：

#include <iostream>

void functionA() {
  // ... 一些操作
}

void functionB() {
  for (int i = 0; i < 1000000; ++i) {
    // 一些耗时的操作
  }
}

void functionC() {
  functionB();
}

int main() {
  functionA();
  functionC();
  return 0;
}

我们可以使用 gprof 来分析这个程序的函数调用关系和执行时间：

g++ -pg -o function_call function_call.cpp
./function_call
gprof function_call gmon.out > report.txt

打开 report.txt 文件，我们可以看到各个函数的执行时间和调用次数。如果发现 functionB 占用了大量的 CPU 时间，我们就可以考虑优化这个函数。

总结：

perf、Valgrind 和 gprof 是 C++ 性能分析的三大利器，它们各有侧重，可以帮助我们从不同的角度分析程序的性能问题。perf 擅长系统级的性能监控，Valgrind 擅长内存错误的检测，gprof 擅长函数调用关系的分析。掌握了这三把剑，你就能像一位经验丰富的猎人，轻松地揪出那些隐藏在代码深处的性能恶魔，让你的程序跑得更快、更稳！

当然，性能分析是一个复杂的过程，需要不断学习和实践。希望这篇文章能够帮助你入门 C++ 性能分析，并激发你对性能优化的兴趣。记住，优秀的程序员不仅要会写代码，还要会调试代码，更要会优化代码！祝你在编程的道路上越走越远，Bug 越来越少，代码越来越优雅！

C++ 性能分析：三剑客在手，Bug 无处遁形

发表回复 取消回复

发表回复取消回复