C++ `dlopen` / `dlsym`：动态加载共享库与运行时符号解析 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

哈喽，各位好！今天咱们聊聊C++里一个相当酷炫，但又稍微有点“野”的特性：动态加载共享库和运行时符号解析，也就是 dlopen 和 dlsym。

一、什么是动态加载？为什么要用它？

想象一下，你正在开发一个图像处理软件。这软件功能很多，比如有模糊、锐化、色彩调整等等。如果把所有功能都编译进一个巨大的可执行文件，那会怎么样？

体积庞大： 即使你只用到了模糊功能，其他锐化和色彩调整的代码也得跟着你一起“旅行”，浪费磁盘空间。
编译缓慢： 每次修改一个小的功能，都要重新编译整个程序，耗时耗力。
扩展困难： 如果你想添加一个新的滤镜，必须重新编译整个程序，然后重新发布。

这时候，动态加载就派上用场了！它可以让你把一些功能模块（比如模糊、锐化）编译成独立的共享库（.so 文件在 Linux/Unix 系统中，.dll 文件在 Windows 系统中）。只有在程序运行的时候，需要某个功能时，才动态地加载相应的共享库，并使用其中的函数。

动态加载的优点：

优点	解释
模块化	将程序分解成独立的模块，每个模块负责特定的功能。
减小体积	只有在需要时才加载模块，减小了程序的初始体积。
快速编译	修改一个模块只需要重新编译该模块，而不需要重新编译整个程序。
易于扩展	可以通过添加新的模块来扩展程序的功能，而不需要修改或重新编译核心代码。
热更新	在程序运行过程中，可以动态地替换模块，实现热更新，而不需要停止程序。
插件机制	允许第三方开发者编写插件，扩展程序的功能。例如，浏览器插件、游戏插件等。

二、dlopen 和 dlsym 登场！

dlopen 和 dlsym 是 POSIX 标准提供的两个函数，它们是实现动态加载的核心。

dlopen：打开一个共享库

它的作用就像打开一扇通往共享库的大门。你需要告诉它共享库的文件路径，以及一些打开模式的标志。
```
#include <dlfcn.h>

void* dlopen(const char *filename, int flags);
```
- filename：共享库的文件路径。可以是绝对路径，也可以是相对路径。如果设置为 NULL，则表示加载主程序自身。
- flags：打开模式的标志。常用的标志有：
  - RTLD_LAZY：延迟绑定。只有在第一次使用共享库中的符号时才进行符号解析。这可以加快程序的启动速度。
  - RTLD_NOW：立即绑定。在 dlopen 返回之前，解析共享库中的所有未定义符号。如果解析失败，dlopen 会返回 NULL。
  - RTLD_GLOBAL：将共享库中的符号添加到全局符号表中。这样，其他共享库也可以访问这些符号。
  - RTLD_LOCAL：不将共享库中的符号添加到全局符号表中。这是默认行为。
- 返回值：如果成功打开共享库，返回一个句柄（void* 类型），用于后续的 dlsym 操作。如果打开失败，返回 NULL。
dlsym：获取共享库中的符号地址

有了 dlopen 返回的句柄，就可以用 dlsym 在共享库中查找特定的函数或变量的地址。
```
#include <dlfcn.h>

void* dlsym(void *handle, const char *symbol);
```
- handle：dlopen 返回的共享库句柄。
- symbol：要查找的符号的名称（字符串）。
- 返回值：如果找到符号，返回符号的地址（void* 类型）。如果找不到符号，返回 NULL。
dlclose：关闭共享库

当你不再需要使用共享库时，应该调用 dlclose 关闭它，释放资源。
```
#include <dlfcn.h>

int dlclose(void *handle);
```
- handle：dlopen 返回的共享库句柄。
- 返回值：如果成功关闭共享库，返回 0。如果关闭失败，返回 -1。
dlerror：获取错误信息

如果 dlopen 或 dlsym 调用失败，你可以使用 dlerror 函数获取详细的错误信息。
```
#include <dlfcn.h>

char* dlerror(void);
```
- 返回值：返回一个描述错误的字符串。如果没有错误发生，返回 NULL。注意，dlerror 函数返回的是一个静态分配的字符串，每次调用都会覆盖之前的内容。

三、一个简单的例子：动态加载计算器

咱们来创建一个简单的例子，演示如何动态加载一个包含加法和减法函数的共享库。

1. 创建共享库 libcalculator.so (或 calculator.dll 在 Windows 上)：

// calculator.h
#ifndef CALCULATOR_H
#define CALCULATOR_H

#ifdef __cplusplus
extern "C" {
#endif

int add(int a, int b);
int subtract(int a, int b);

#ifdef __cplusplus
}
#endif

#endif

// calculator.cpp
#include "calculator.h"

int add(int a, int b) {
  return a + b;
}

int subtract(int a, int b) {
  return a - b;
}

编译成共享库 (Linux):

g++ -fPIC -shared calculator.cpp -o libcalculator.so

编译成共享库 (Windows, using MinGW):

g++ -shared calculator.cpp -o calculator.dll -Wl,--output-def,calculator.def,--out-implib,libcalculator.a

2. 创建主程序 main.cpp：

#include <iostream>
#include <dlfcn.h> // For dlopen, dlsym, dlclose, dlerror

int main() {
  // 1. 打开共享库
  void* handle = dlopen("./libcalculator.so", RTLD_LAZY); // 或者 "calculator.dll" 在 Windows 上

  if (!handle) {
    std::cerr << "Cannot open library: " << dlerror() << std::endl;
    return 1;
  }

  // 2. 获取函数地址
  typedef int (*add_func)(int, int); // 定义函数指针类型
  typedef int (*subtract_func)(int, int);

  add_func add = (add_func)dlsym(handle, "add");
  subtract_func subtract = (subtract_func)dlsym(handle, "subtract");

  if (!add || !subtract) {
    std::cerr << "Cannot find symbol: " << dlerror() << std::endl;
    dlclose(handle);
    return 1;
  }

  // 3. 调用函数
  int a = 10;
  int b = 5;

  int sum = add(a, b);
  int difference = subtract(a, b);

  std::cout << "Sum: " << sum << std::endl;
  std::cout << "Difference: " << difference << std::endl;

  // 4. 关闭共享库
  dlclose(handle);

  return 0;
}

编译主程序：

g++ main.cpp -ldl -o main  // Linux
g++ main.cpp -o main  // Windows (MinGW usually handles linking automatically)

3. 运行程序：

./main

输出：

Sum: 15
Difference: 5

代码解释：

dlopen("./libcalculator.so", RTLD_LAZY): 打开位于当前目录下的 libcalculator.so 共享库。RTLD_LAZY 表示延迟绑定。
*`typedef int (add_func)(int, int);:** 定义了一个函数指针类型add_func，它指向一个接受两个int参数并返回int` 的函数。这样做是为了方便类型转换。
add_func add = (add_func)dlsym(handle, "add");: 使用 dlsym 查找共享库中名为 "add" 的符号的地址，并将返回的 void* 指针强制转换为 add_func 类型的函数指针。
if (!add || !subtract): 检查 dlsym 是否成功找到符号。如果找不到，dlsym 会返回 NULL，程序应该处理这种情况，避免崩溃。
add(a, b); subtract(a, b);: 通过函数指针调用动态加载的函数。
dlclose(handle);: 关闭共享库，释放资源。不关闭共享库可能会导致内存泄漏或其他问题。

四、注意事项和常见问题

符号可见性： 默认情况下，共享库中的符号是局部可见的。如果你希望其他共享库或主程序可以访问你的共享库中的符号，需要在编译共享库时使用 -fvisibility=default 标志，或者在代码中使用 __attribute__((visibility("default"))) 声明符号。
命名冲突： 如果不同的共享库中定义了相同名称的符号，可能会导致命名冲突。为了避免这种情况，可以使用命名空间，或者使用更长的、更独特的符号名称。
依赖关系： 如果你的共享库依赖于其他共享库，需要在加载你的共享库之前先加载它所依赖的共享库。可以使用 dlopen 的返回值来控制加载顺序。
路径问题： dlopen 查找共享库的路径依赖于操作系统的设置。你可以使用绝对路径来避免路径问题，或者设置 LD_LIBRARY_PATH (Linux) 或 PATH (Windows) 环境变量。
内存管理： 动态加载的共享库也需要进行内存管理。确保在不再需要使用共享库时，调用 dlclose 关闭它。如果共享库中使用了动态分配的内存，需要在关闭共享库之前释放这些内存。
异常处理： 如果动态加载的函数抛出异常，并且主程序没有捕获这个异常，程序可能会崩溃。需要在主程序中进行适当的异常处理。
线程安全： 如果你的程序是多线程的，需要确保动态加载的代码是线程安全的。可以使用互斥锁或其他同步机制来保护共享资源。
调试： 调试动态加载的代码可能会比较困难。可以使用调试器来单步执行代码，或者使用日志输出语句来跟踪程序的执行流程。
平台差异： 动态加载的实现细节在不同的操作系统上可能会有所不同。需要注意平台差异，并编写可移植的代码。

五、更高级的应用

动态加载不仅仅可以用来加载简单的函数库，还可以用于实现更复杂的功能，比如：

插件系统： 允许第三方开发者编写插件，扩展程序的功能。例如，浏览器插件、游戏插件等。
脚本引擎： 动态加载脚本文件，执行脚本代码。例如，Lua、Python 等。
驱动程序： 动态加载设备驱动程序。例如，显卡驱动程序、打印机驱动程序等。
热更新： 在程序运行过程中，动态地替换模块，实现热更新，而不需要停止程序。例如，游戏更新、服务器更新等。
A/B 测试： 动态加载不同的功能模块，进行 A/B 测试，评估不同方案的效果。

六、总结

dlopen 和 dlsym 是 C++ 中非常强大的工具，可以让你实现动态加载和运行时符号解析。它们可以用于构建模块化、可扩展的应用程序，并实现热更新、插件系统等高级功能。但是，动态加载也带来了一些复杂性，需要注意符号可见性、命名冲突、依赖关系、内存管理、异常处理、线程安全等问题。希望今天的讲解能够帮助你更好地理解和使用 dlopen 和 dlsym。下次再见！

发表回复 取消回复

发表回复取消回复