JS `Node.js Cluster` 模块：多核 CPU 利用与负载均衡 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位靓仔靓女，大家好！今天咱们来聊聊 Node.js 的 Cluster 模块，一个能让你的 CPU 不再闲着，服务器负载均衡的小帮手。说白了，就是让你的 Node.js 程序能同时用上你电脑里所有的 CPU 核心，不再只靠一根筋干活。

一、啥是 Cluster 模块？为啥要用它？

想象一下，你开了一家小卖部，生意好的时候，门口挤满了人，只有一个收银员忙得焦头烂额。这时候，你是不是得再招几个收银员，一起收款，才能更快地服务顾客？

Node.js 的 Cluster 模块就扮演着“多招收银员”的角色。Node.js 本身是单线程的，也就是说，默认情况下，它只能用一个 CPU 核心。如果你的服务器是多核 CPU，那其他核心就只能眼巴巴地看着，啥也不干，这简直是资源浪费啊！

Cluster 模块的作用就是把你的 Node.js 程序复制成多个进程（相当于多个收银员），每个进程都能独立处理请求。这样，多个 CPU 核心就能同时工作，大大提高程序的并发处理能力。

为什么要用它呢？

提高性能： 充分利用多核 CPU，提高程序处理请求的速度。
负载均衡： 将请求均匀地分配到不同的进程，避免某个进程负担过重。
提高可用性： 如果某个进程崩溃了，其他进程仍然可以继续工作，保证服务的可用性。

二、Cluster 模块的基本用法

Cluster 模块的使用其实很简单，主要分为两个部分：主进程（Master Process） 和 工作进程（Worker Process）。

主进程： 负责管理工作进程，包括创建、销毁、监听工作进程的状态等。
工作进程： 负责实际处理请求。

const cluster = require('cluster');
const os = require('os');
const http = require('http');

const numCPUs = os.cpus().length; // 获取 CPU 核心数

if (cluster.isMaster) {
  // 主进程

  console.log(`主进程 ${process.pid} 正在运行`);

  // 衍生工作进程
  for (let i = 0; i < numCPUs; i++) {
    cluster.fork();
  }

  cluster.on('exit', (worker, code, signal) => {
    console.log(`工作进程 ${worker.process.pid} 退出`);
    console.log('Let's start another worker process!');
    cluster.fork(); //如果工作进程崩溃了，自动重启一个
  });
} else {
  // 工作进程

  // 创建 HTTP 服务器
  http.createServer((req, res) => {
    res.writeHead(200);
    res.end(`你好世界！ 来自进程 ${process.pid}`);
  }).listen(8000);

  console.log(`工作进程 ${process.pid} 已启动`);
}

代码解释：

引入模块： 首先，我们需要引入 cluster、os 和 http 模块。os 模块用于获取 CPU 核心数，http 模块用于创建 HTTP 服务器。
判断进程类型： cluster.isMaster 用于判断当前进程是否为主进程。
主进程逻辑：
- 获取 CPU 核心数，并循环创建对应数量的工作进程。cluster.fork() 会创建一个新的工作进程。
- 监听 exit 事件，当工作进程退出时，会自动重启一个新的工作进程，保证服务的可用性。
工作进程逻辑：
- 创建 HTTP 服务器，监听 8000 端口。
- 当收到请求时，返回 "你好世界！来自进程 ${process.pid}"，用于标识请求是由哪个进程处理的。

运行这段代码，你会发现控制台输出了类似这样的信息：

主进程 1234 正在运行
工作进程 5678 已启动
工作进程 9012 已启动
工作进程 3456 已启动
工作进程 7890 已启动

其中，1234 是主进程的 PID，5678、9012、3456、7890 是工作进程的 PID。如果你用浏览器访问 http://localhost:8000，你会看到页面上显示 "你好世界！来自进程 [某个PID]"，每次刷新页面，PID 可能会不一样，因为请求被分配到了不同的工作进程处理。

三、Cluster 模块的负载均衡策略

Cluster 模块默认使用 循环调度（Round-Robin） 算法进行负载均衡。也就是说，请求会依次分配到不同的工作进程。

除了循环调度，Cluster 模块还支持 操作系统的负载均衡。当 cluster.schedulingPolicy 设置为 cluster.SCHED_NONE 时，主进程不再负责请求的分配，而是由操作系统来决定哪个工作进程处理请求。这种方式的性能通常更好，因为它避免了主进程的额外开销。

cluster.schedulingPolicy = cluster.SCHED_NONE; // 使用操作系统负载均衡

四、Cluster 模块的进程间通信

有时候，工作进程之间需要进行通信，比如共享一些数据，或者通知其他进程执行某些操作。Cluster 模块提供了 worker.send() 方法用于进程间通信。

// 主进程
if (cluster.isMaster) {
  // ... (省略主进程的创建和管理逻辑)

  cluster.on('message', (worker, message, handle) => {
    console.log(`主进程收到来自工作进程 ${worker.process.pid} 的消息：`, message);
  });
} else {
  // 工作进程

  process.on('message', (message) => {
    console.log(`工作进程 ${process.pid} 收到消息：`, message);
  });

  // 每隔 5 秒，向主进程发送消息
  setInterval(() => {
    process.send({ type: 'ping', pid: process.pid });
  }, 5000);
}

代码解释：

主进程监听 message 事件： 当工作进程发送消息时，主进程会触发 message 事件，我们可以在事件处理函数中处理消息。
工作进程监听 process.on('message') 事件： 工作进程通过监听 process.on('message')事件来接收消息。
工作进程使用 process.send() 发送消息： process.send() 方法用于向主进程或其他工作进程发送消息。消息可以是任何可以被序列化的 JavaScript 对象。

五、Cluster 模块的注意事项

状态共享问题： 由于每个工作进程都是独立的，它们之间不能直接共享状态。如果需要共享状态，可以使用外部存储（如 Redis、数据库）或者进程间通信。
端口监听问题： 通常情况下，只需要一个进程监听端口。在 Cluster 模式下，主进程负责监听端口，然后将连接分发给工作进程。
代码更新问题： 当代码更新时，需要重启所有工作进程才能生效。可以使用 cluster.disconnect() 方法优雅地关闭所有工作进程，然后重新启动它们。
调试问题： 调试 Cluster 模式下的程序可能会比较麻烦，因为你需要分别调试每个工作进程。可以使用 Node.js 的调试工具，或者使用一些第三方工具来简化调试过程。

六、高级用法：优雅重启和零停机部署

在生产环境中，我们希望在更新代码时，尽量减少服务的停机时间。Cluster 模块可以帮助我们实现优雅重启和零停机部署。

优雅重启： 指在重启服务时，先停止接收新的请求，等待当前正在处理的请求完成后，再关闭进程。这样可以避免丢失请求或导致数据不一致。

零停机部署： 指在更新代码时，不停止任何服务。通过滚动更新的方式，逐步替换旧版本的进程，保证服务的持续可用性。

下面是一个简单的优雅重启的例子：

const cluster = require('cluster');
const os = require('os');
const http = require('http');

const numCPUs = os.cpus().length;

if (cluster.isMaster) {
  console.log(`主进程 ${process.pid} 正在运行`);

  for (let i = 0; i < numCPUs; i++) {
    cluster.fork();
  }

  cluster.on('exit', (worker, code, signal) => {
    console.log(`工作进程 ${worker.process.pid} 退出`);
    cluster.fork(); // 自动重启
  });

  // 监听 SIGUSR2 信号，用于重启所有工作进程
  process.on('SIGUSR2', () => {
    console.log('收到 SIGUSR2 信号，开始重启所有工作进程');

    Object.values(cluster.workers).forEach(worker => {
      worker.disconnect(); // 停止接收新的连接

      worker.on('exit', () => {
        console.log(`工作进程 ${worker.process.pid} 已退出，重启一个新的进程`);
        if (!Object.keys(cluster.workers).length) {
          for (let i = 0; i < numCPUs; i++) {
            cluster.fork();
          }
        }
      });
    });
  });
} else {
  let requests = 0;
  const server = http.createServer((req, res) => {
    requests++;
    res.writeHead(200);
    res.end(`你好世界！ 来自进程 ${process.pid}，已处理 ${requests} 个请求`);
  });

  server.listen(8000, () => {
    console.log(`工作进程 ${process.pid} 已启动`);
  });

  process.on('disconnect', () => {
    console.log(`工作进程 ${process.pid} 正在关闭...`);
    server.close(() => {
      console.log(`工作进程 ${process.pid} 已关闭`);
      process.exit(0);
    });
  });
}

代码解释：

监听 SIGUSR2 信号： 在主进程中，我们监听 SIGUSR2 信号。这个信号通常用于通知程序进行重启。
断开所有工作进程： 当收到 SIGUSR2 信号时，我们遍历所有工作进程，调用 worker.disconnect() 方法，停止接收新的连接。
监听 exit 事件： 当工作进程退出时，我们重启一个新的工作进程。
工作进程监听 disconnect 事件： 在工作进程中，我们监听 disconnect 事件。当收到 disconnect 事件时，我们关闭 HTTP 服务器，并退出进程。

如何测试优雅重启？

运行上面的代码。
使用 kill -USR2 [主进程PID] 命令发送 SIGUSR2 信号给主进程。
观察控制台输出，可以看到工作进程依次退出并重启。
在重启过程中，继续访问 http://localhost:8000，可以看到服务仍然可用，只是处理请求的进程 PID 发生了变化。

零停机部署的实现更加复杂，需要借助一些工具，如 PM2、Docker 等。 这些工具可以帮助我们自动化部署过程，实现滚动更新和负载均衡。

七、总结

Cluster 模块是 Node.js 中一个非常强大的工具，可以帮助我们充分利用多核 CPU，提高程序的性能和可用性。虽然使用 Cluster 模块会增加一些复杂性，但它带来的好处是显而易见的。

简单总结一下今天的内容：

主题	内容
什么是 Cluster	一个 Node.js 模块，用于创建多个工作进程，利用多核 CPU 提高性能。
核心概念	主进程 (Master Process)：管理工作进程，监听端口，分发请求。工作进程 (Worker Process)：实际处理请求。
负载均衡	默认使用循环调度 (Round-Robin)。可以使用 `cluster.schedulingPolicy = cluster.SCHED_NONE` 使用操作系统负载均衡。
进程间通信	使用 `worker.send()` 和 `process.on('message')` 进行进程间通信。
注意事项	状态共享问题：使用外部存储或进程间通信。端口监听问题：主进程监听端口。代码更新问题：需要重启所有工作进程。调试问题：分别调试每个工作进程。
高级用法	优雅重启：停止接收新请求，等待当前请求完成后再关闭进程。零停机部署：使用滚动更新的方式，逐步替换旧版本的进程。

希望今天的讲座能帮助大家更好地理解和使用 Cluster 模块。下次有机会，咱们再聊聊 Node.js 的其他有趣话题！谢谢大家！

发表回复 取消回复

发表回复取消回复