C++中的信号处理机制：实现异步、线程安全的信号处理与资源恢复

大家好，今天我们将深入探讨C++中的信号处理机制，重点关注如何实现异步、线程安全的信号处理以及资源恢复。信号处理是Unix/Linux系统编程中的一个重要组成部分，它允许程序响应异步事件，例如用户中断、定时器到期或硬件故障。正确处理信号对于构建健壮、可靠的应用程序至关重要。

1. 信号的基本概念

在Unix/Linux系统中，信号是由操作系统发出的一个软中断，用于通知进程发生了某个特定的事件。每个信号都有一个唯一的整数值，并且与一个特定的事件相关联。常见的信号包括：

SIGINT (2): 用户中断（通常由Ctrl+C产生）
SIGTERM (15): 终止信号（通常由kill命令发送）
SIGKILL (9): 强制终止信号（无法被捕获或忽略）
SIGSEGV (11): 段错误（访问非法内存地址）
SIGALRM (14): 定时器到期

当进程收到一个信号时，它可以选择执行以下操作：

忽略信号： 进程可以忽略某些信号，但这并不适用于所有信号（例如，SIGKILL无法被忽略）。
执行默认操作： 每个信号都有一个默认操作，例如终止进程或忽略信号。
捕获信号： 进程可以安装一个信号处理程序（也称为信号处理函数或信号处理例程），当收到信号时，操作系统会调用该处理程序。

2. C++中的信号处理函数：signal() 和 sigaction()

C++提供了两种主要的机制来处理信号：signal() 和 sigaction()。

signal() 函数：

signal() 函数是C标准库中的一个函数，用于设置信号处理程序。它的原型如下：
```
#include <csignal>

typedef void (*sighandler_t)(int);

sighandler_t signal(int signum, sighandler_t handler);
```
- signum：要处理的信号的编号。
- handler：指向信号处理函数的指针。它可以是以下值之一：
  - SIG_DFL：执行信号的默认操作。
  - SIG_IGN：忽略信号。
  - 指向一个用户定义的信号处理函数。
signal() 函数的返回值是指向前一个信号处理函数的指针，如果发生错误，则返回 SIG_ERR。

示例：使用 signal() 函数捕获 SIGINT 信号。
```
#include <iostream>
#include <csignal>
#include <unistd.h>

void signal_handler(int signum) {
    std::cout << "Received signal " << signum << std::endl;
    exit(signum); // 优雅地退出程序
}

int main() {
    // 注册信号处理程序
    signal(SIGINT, signal_handler);

    std::cout << "Program running. Press Ctrl+C to terminate." << std::endl;

    while (true) {
        sleep(1);
    }

    return 0;
}
```
signal() 函数的缺点：

signal() 函数在多线程环境中不是线程安全的。这是因为它使用全局变量来存储信号处理程序，这可能导致竞争条件。此外，signal() 函数的行为在不同的Unix系统上可能有所不同，因此不具有很强的可移植性。
sigaction() 函数：

sigaction() 函数是 POSIX 标准中定义的，用于更安全、更灵活地处理信号。它的原型如下：
```
#include <signal.h>

int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);
```
- signum：要处理的信号的编号。
- act：指向 sigaction 结构体的指针，该结构体指定了信号处理程序的行为。
- oldact：指向 sigaction 结构体的指针，用于保存先前的信号处理程序的信息（如果不需要，可以传递 NULL）。
sigaction() 函数返回 0 表示成功，返回 -1 表示失败。

sigaction 结构体定义如下：
```
struct sigaction {
    void     (*sa_handler)(int);      // 信号处理函数 (或 SIG_DFL, SIG_IGN)
    void     (*sa_sigaction)(int, siginfo_t *, void *); // 替代信号处理函数
    sigset_t   sa_mask;         // 信号屏蔽字
    int        sa_flags;        // 标志位
};
```
- sa_handler：指向信号处理函数的指针，类似于 signal() 函数。
- sa_sigaction：指向替代信号处理函数的指针，可以提供更多关于信号的信息（例如，发送信号的进程ID）。如果设置了 SA_SIGINFO 标志，则使用此字段。
- sa_mask：一个信号集，指定在执行信号处理程序期间应该被阻塞的信号。
- sa_flags：一组标志位，用于控制信号处理程序的行为。一些常用的标志位包括：
  - SA_SIGINFO：使用 sa_sigaction 字段指定的替代信号处理函数。
  - SA_RESTART：如果信号中断了系统调用，则在信号处理程序返回后自动重启该系统调用。
  - SA_NODEFER：允许在信号处理程序中接收相同的信号（默认情况下，在信号处理程序执行期间，该信号会被阻塞）。
  - SA_RESETHAND：在执行信号处理程序后，将信号处理程序重置为默认操作（SIG_DFL）。
示例：使用 sigaction() 函数捕获 SIGINT 信号，并使用 sa_sigaction 提供更多信息。
```
#include <iostream>
#include <signal.h>
#include <unistd.h>

void signal_handler(int signum, siginfo_t *info, void *context) {
    std::cout << "Received signal " << signum << std::endl;
    std::cout << "Signal sent by process ID: " << info->si_pid << std::endl;
    exit(signum);
}

int main() {
    struct sigaction sa;
    sa.sa_sigaction = signal_handler;
    sa.sa_flags = SA_SIGINFO;
    sigemptyset(&sa.sa_mask); // 清空信号屏蔽字

    if (sigaction(SIGINT, &sa, NULL) == -1) {
        perror("sigaction");
        return 1;
    }

    std::cout << "Program running. Press Ctrl+C to terminate." << std::endl;

    while (true) {
        sleep(1);
    }

    return 0;
}
```
sigaction() 函数的优点：

sigaction() 函数比 signal() 函数更安全、更灵活，并且具有更好的可移植性。它允许你指定信号处理程序的行为，例如阻塞其他信号或自动重启系统调用。此外，sigaction() 函数在多线程环境中是线程安全的。

3. 异步信号安全（Async-Signal-Safe）函数

信号处理函数在被调用时，可能会中断程序正在执行的任何代码。因此，在信号处理函数中只能调用异步信号安全的函数。异步信号安全函数是指那些可以在信号处理程序中安全调用的函数，而不会导致死锁、数据损坏或其他未定义的行为。

POSIX 标准定义了一组异步信号安全函数。这些函数通常是简单的、原子操作，例如设置或读取全局变量。

常见的异步信号安全函数包括：

_exit()
write()
read()
kill()
signal() (但最好使用 sigaction())
pthread_kill()
atomic_load() 和 atomic_store() （C++11 及更高版本）

不安全的函数：

大多数标准库函数，例如 printf()、malloc()、free()、std::cout 等，都不是异步信号安全的。在信号处理程序中调用这些函数可能会导致严重的问题。

示例：在信号处理程序中使用 write() 函数输出信息。

#include <iostream>
#include <csignal>
#include <unistd.h>
#include <cstring>

void signal_handler(int signum) {
    const char* message = "Received signal!n";
    write(STDOUT_FILENO, message, strlen(message));
    _exit(signum);
}

int main() {
    signal(SIGINT, signal_handler);

    std::cout << "Program running. Press Ctrl+C to terminate." << std::endl;

    while (true) {
        sleep(1);
    }

    return 0;
}

4. 线程安全的信号处理

在多线程程序中，信号处理需要特别小心，以避免竞争条件和数据损坏。以下是一些实现线程安全的信号处理的技巧：

使用 pthread_sigmask() 函数：

pthread_sigmask() 函数允许你控制线程的信号屏蔽字。每个线程都有自己的信号屏蔽字，用于指定哪些信号应该被阻塞。你可以使用 pthread_sigmask() 函数来阻塞某些信号，以防止它们在关键代码段中中断线程。
```
#include <pthread.h>
#include <signal.h>

int pthread_sigmask(int how, const sigset_t *set, sigset_t *oldset);
```
- how：指定如何修改信号屏蔽字。它可以是以下值之一：
  - SIG_BLOCK：将 set 中的信号添加到信号屏蔽字中。
  - SIG_UNBLOCK：从信号屏蔽字中移除 set 中的信号。
  - SIG_SETMASK：将信号屏蔽字设置为 set。
- set：指向包含要修改的信号的信号集的指针。
- oldset：指向用于保存先前的信号屏蔽字的信号集的指针（如果不需要，可以传递 NULL）。

使用专门的信号处理线程：

一种常见的模式是创建一个专门的线程来处理信号。该线程负责接收信号并执行相应的处理逻辑。这种方法可以避免在其他线程中中断关键代码段。

示例：创建一个信号处理线程。

#include <iostream>
#include <pthread.h>
#include <signal.h>
#include <unistd.h>

pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
bool running = true;

void* signal_handler_thread(void* arg) {
    sigset_t set;
    sigemptyset(&set);
    sigaddset(&set, SIGINT); // 处理 SIGINT 信号

    int sig;
    while (running) {
        if (sigwait(&set, &sig) == 0) {
            std::cout << "Signal handler thread received signal " << sig << std::endl;

            pthread_mutex_lock(&mutex);
            running = false;
            pthread_mutex_unlock(&mutex);

            exit(sig); // 优雅地退出程序
        } else {
            perror("sigwait");
        }
    }
    return NULL;
}

void* worker_thread(void* arg) {
    while (true) {
        pthread_mutex_lock(&mutex);
        if (!running) {
            pthread_mutex_unlock(&mutex);
            break;
        }
        pthread_mutex_unlock(&mutex);
        std::cout << "Worker thread running..." << std::endl;
        sleep(1);
    }
    std::cout << "Worker thread exiting." << std::endl;
    return NULL;
}

int main() {
    pthread_t signal_thread, worker_thread1, worker_thread2;
    sigset_t mask;

    // 阻塞主线程中的 SIGINT 信号
    sigemptyset(&mask);
    sigaddset(&mask, SIGINT);
    if (pthread_sigmask(SIG_BLOCK, &mask, NULL) != 0) {
        perror("pthread_sigmask");
        return 1;
    }

    // 创建信号处理线程
    if (pthread_create(&signal_thread, NULL, signal_handler_thread, NULL) != 0) {
        perror("pthread_create");
        return 1;
    }

    // 创建两个工作线程
    if (pthread_create(&worker_thread1, NULL, worker_thread, NULL) != 0) {
        perror("pthread_create");
        return 1;
    }

    if (pthread_create(&worker_thread2, NULL, worker_thread, NULL) != 0) {
        perror("pthread_create");
        return 1;
    }

    // 等待线程结束
    pthread_join(signal_thread, NULL);
    pthread_join(worker_thread1, NULL);
    pthread_join(worker_thread2, NULL);

    return 0;
}

在这个例子中，主线程阻塞了 SIGINT 信号，然后创建了一个专门的 signal_handler_thread 来处理该信号。工作线程在运行过程中会检查 running 变量，如果 signal_handler_thread 收到了信号，running 变量会被设置为 false，导致工作线程退出。

使用原子操作：

如果需要在信号处理程序中修改共享数据，请使用原子操作来确保数据的一致性。C++11 提供了 std::atomic 类，可以用于实现原子操作。

5. 资源恢复

当进程收到信号时，它可能会中断正在执行的任何代码，包括正在进行的资源分配或释放。因此，在信号处理程序中需要特别小心地处理资源，以避免资源泄漏或死锁。

以下是一些资源恢复的技巧：

避免在信号处理程序中分配或释放内存：

malloc() 和 free() 等内存分配函数不是异步信号安全的。在信号处理程序中调用这些函数可能会导致堆损坏或死锁。如果需要在信号处理程序中分配或释放内存，请使用专门的内存池或预先分配的缓冲区。
使用 RAII (Resource Acquisition Is Initialization)：

RAII 是一种 C++ 编程技术，它将资源的生命周期与对象的生命周期绑定在一起。当对象被创建时，资源被获取；当对象被销毁时，资源被释放。使用 RAII 可以确保即使在信号处理程序中中断了代码，资源也会被正确释放。
使用互斥锁或原子操作保护共享资源：

如果需要在信号处理程序中访问共享资源，请使用互斥锁或原子操作来保护这些资源。这可以防止竞争条件和数据损坏。

在信号处理程序中设置一个标志，并在主程序中处理资源恢复：

一种常见的模式是在信号处理程序中设置一个标志，指示需要进行资源恢复。然后在主程序中定期检查该标志，并执行相应的资源恢复逻辑。

示例：使用标志进行资源恢复

#include <iostream>
#include <csignal>
#include <unistd.h>
#include <atomic>

std::atomic<bool> signal_received(false);

void signal_handler(int signum) {
    signal_received.store(true);
    const char* message = "Signal received, will exit gracefully.n";
    write(STDOUT_FILENO, message, strlen(message)); // 异步信号安全
}

// 模拟一个需要清理的资源
class Resource {
public:
    Resource() {
        std::cout << "Resource acquired." << std::endl;
        acquired = true;
    }
    ~Resource() {
        if (acquired) {
            std::cout << "Resource released." << std::endl;
        }
    }

    void use() {
        std::cout << "Using resource." << std::endl;
        sleep(1); // 模拟资源使用
    }

private:
    bool acquired;
};

int main() {
    signal(SIGINT, signal_handler);

    Resource my_resource;

    std::cout << "Program running. Press Ctrl+C to terminate." << std::endl;

    while (true) {
        my_resource.use();

        if (signal_received.load()) {
            std::cout << "Exiting gracefully..." << std::endl;
            break; // 退出循环，允许析构函数释放资源
        }
    }

    std::cout << "Program terminated." << std::endl; // 确保打印终止消息
    return 0;
}

6. 总结：让信号处理更安全、更可靠

今天我们讨论了C++中的信号处理机制，重点关注了如何实现异步、线程安全的信号处理以及资源恢复。关键在于理解信号的基本概念，选择合适的信号处理函数(sigaction优于signal)，只使用异步信号安全的函数，并采取适当的措施来保护共享资源和进行资源恢复。通过遵循这些原则，我们可以构建更健壮、更可靠的C++应用程序。

更多IT精英技术系列讲座，到智猿学院

C++中的信号处理机制：实现异步、线程安全的信号处理与资源恢复

发表回复 取消回复

发表回复取消回复