Web Workers API：实现HTML页面后台线程运行的通信机制与数据传递限制 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Web Workers API：HTML页面后台线程运行的通信机制与数据传递限制

大家好，今天我们来深入探讨 Web Workers API，这是一个强大的工具，它允许我们在 HTML 页面的后台线程中运行 JavaScript 代码，从而避免阻塞主线程，提升用户体验。我们将重点关注 Web Workers 的通信机制以及数据传递的限制。

1. 为什么需要 Web Workers？

Web 浏览器是单线程的，这意味着 JavaScript 代码通常在主线程中执行。主线程负责处理用户界面更新、事件处理和 JavaScript 代码的执行。如果主线程被长时间阻塞，例如执行复杂的计算或网络请求，用户界面将会变得无响应，导致糟糕的用户体验。

Web Workers 的出现就是为了解决这个问题。它们允许我们将一些耗时的任务放到后台线程中执行，从而保持主线程的响应性。

场景举例：

图像处理： 对大量图像进行滤镜处理或压缩。
数据分析： 执行复杂的数学运算或数据挖掘算法。
网络请求： 处理大量并发的网络请求，例如从多个 API 获取数据。
游戏： 进行游戏逻辑计算，例如 AI 或物理模拟。

2. Web Worker 的基本概念

Worker 对象： 代表一个后台线程，通过 new Worker(scriptURL) 创建。 scriptURL 是一个 JavaScript 文件的 URL，该文件包含了 Worker 线程要执行的代码。
Message Passing (消息传递): 主线程和 Worker 线程之间通过消息传递进行通信。使用 postMessage() 方法发送消息，使用 onmessage 事件监听接收到的消息。
Dedicated Worker: 这是最常见的 Worker 类型。它只能被创建它的页面访问。
Shared Worker: 可以被同一域下的多个页面共享。
Service Worker: 一种特殊的 Worker，用于实现离线缓存、推送通知等功能。它与特定的域相关联，可以拦截和处理该域下的网络请求。

3. 创建和使用 Web Worker

3.1 创建 Worker 文件 (worker.js)

首先，我们需要创建一个 JavaScript 文件，其中包含 Worker 线程要执行的代码。

// worker.js
self.addEventListener('message', function(e) {
  const data = e.data;
  console.log('Worker 收到消息:', data);

  // 模拟耗时计算
  let result = 0;
  for (let i = 0; i < 1000000000; i++) {
    result += i;
  }

  // 将结果发送回主线程
  self.postMessage({ result: result, originalData: data });
}, false);

在上面的代码中：

self 指的是 Worker 线程的全局对象，类似于浏览器环境中的 window。
addEventListener('message', ...) 监听来自主线程的消息。
e.data 包含了主线程发送的数据。
self.postMessage() 将消息发送回主线程。

3.2 在主线程中创建和使用 Worker

<!DOCTYPE html>
<html>
<head>
  <title>Web Worker Example</title>
</head>
<body>
  <h1>Web Worker Example</h1>
  <button id="startWorker">Start Worker</button>
  <p id="result"></p>

  <script>
    const startWorkerButton = document.getElementById('startWorker');
    const resultElement = document.getElementById('result');

    startWorkerButton.addEventListener('click', function() {
      // 创建 Worker 对象
      const worker = new Worker('worker.js');

      // 监听 Worker 发送的消息
      worker.onmessage = function(e) {
        const result = e.data.result;
        const originalData = e.data.originalData;
        resultElement.textContent = '计算结果: ' + result + ', 原始数据: ' + JSON.stringify(originalData);
        console.log('主线程收到消息:', result, originalData);
      };

      // 发送消息给 Worker
      worker.postMessage({ message: 'Hello from main thread!', timestamp: Date.now() });

      // 处理 Worker 错误
      worker.onerror = function(error) {
        console.error('Worker 发生错误:', error);
      };
    });
  </script>
</body>
</html>

在上面的代码中：

new Worker('worker.js') 创建了一个新的 Worker 对象，并指定了 Worker 线程要执行的 JavaScript 文件。
worker.onmessage 监听来自 Worker 线程的消息。
worker.postMessage() 将消息发送给 Worker 线程。
worker.onerror 处理 Worker 线程中发生的错误。

4. 消息传递机制 (Message Passing)

Web Workers 使用消息传递机制进行通信。主线程和 Worker 线程之间不能直接共享内存。这种方式确保了 Worker 线程不会意外地修改主线程的数据，从而保证了程序的稳定性。

4.1 postMessage() 方法

postMessage() 方法用于发送消息。它可以接受一个参数，即要发送的数据。

// 主线程发送消息给 Worker
worker.postMessage({ data: 'Some data' });

// Worker 线程发送消息给主线程
self.postMessage({ result: 123 });

postMessage() 方法还接受一个可选的第二个参数，用于指定传输的可转移对象 (Transferable Objects)。

4.2 onmessage 事件

onmessage 事件用于监听接收到的消息。

// 主线程监听 Worker 发送的消息
worker.onmessage = function(e) {
  const data = e.data;
  console.log('主线程收到消息:', data);
};

// Worker 线程监听主线程发送的消息
self.addEventListener('message', function(e) {
  const data = e.data;
  console.log('Worker 收到消息:', data);
});

4.3 消息的序列化和反序列化

通过 postMessage() 方法发送的消息会被自动序列化和反序列化。这意味着数据会被转换为字符串格式，然后通过消息通道发送。接收方收到消息后，会将字符串格式的数据转换回原始的数据类型。

这种序列化和反序列化的过程可能会影响性能，特别是对于大型数据对象。

5. 数据传递的限制

由于 Web Workers 使用消息传递机制进行通信，因此存在一些数据传递的限制。

5.1 拷贝 (Copy) vs. 转移 (Transfer)

默认情况下，通过 postMessage() 发送的数据会被拷贝。这意味着发送方的数据会被复制一份，然后发送给接收方。这种方式可以保证发送方的数据不会被修改，但是会增加内存占用和性能开销。

对于某些类型的数据，例如 ArrayBuffer、MessagePort 和 ImageBitmap，可以使用转移模式。在转移模式下，数据的所有权会从发送方转移到接收方。发送方在转移后将无法再访问该数据。

5.2 可序列化 (Serializable) 的数据类型

只有可序列化的数据类型才能通过 postMessage() 方法发送。可序列化的数据类型包括：

基本数据类型：null, undefined, boolean, number, string, symbol
JavaScript 对象：Object, Array
可序列化的内置对象：Date, RegExp
ArrayBuffer
TypedArray (例如 Int8Array, Uint8Array, Float32Array)
DataView
Blob
ImageData
Map
Set

5.3 不可序列化 (Non-Serializable) 的数据类型

以下数据类型不能通过 postMessage() 方法发送：

函数：function
DOM 节点：HTMLElement, Node
Error 对象
部分浏览器特定的对象

如果尝试发送不可序列化的数据，将会抛出一个 DataCloneError 异常。

6. Transferable Objects (可转移对象)

Transferable Objects 是一种特殊的数据类型，允许我们将数据的所有权从一个上下文转移到另一个上下文，而无需进行拷贝。这可以显著提高性能，特别是对于大型数据对象。

6.1 支持的 Transferable Objects

ArrayBuffer
MessagePort
ImageBitmap

6.2 使用 Transferable Objects 的示例

// 创建一个 ArrayBuffer
const buffer = new ArrayBuffer(1024 * 1024 * 100); // 100MB

// 将 ArrayBuffer 发送给 Worker，并指定为 Transferable Object
worker.postMessage(buffer, [buffer]);

// 在主线程中，buffer 已经不再可用
console.log(buffer.byteLength); // 0

在上面的代码中，我们将一个 ArrayBuffer 对象发送给 Worker 线程，并使用 [buffer] 将其指定为 Transferable Object。发送后，主线程中的 buffer 对象将不再可用，其 byteLength 属性将变为 0。

6.3 Transferable Objects 的优点

零拷贝： 避免了数据拷贝的开销，提高了性能。
减少内存占用： 只有一个数据副本存在，减少了内存占用。

7. Shared Worker

Shared Worker 是一种可以被同一域下的多个页面共享的 Worker。

7.1 创建 Shared Worker

const sharedWorker = new SharedWorker('shared_worker.js');

7.2 与 Shared Worker 通信

与 Shared Worker 通信需要通过 port 对象。

// 连接到 Shared Worker
sharedWorker.port.start();

// 监听来自 Shared Worker 的消息
sharedWorker.port.onmessage = function(e) {
  const data = e.data;
  console.log('主线程收到来自 Shared Worker 的消息:', data);
};

// 发送消息给 Shared Worker
sharedWorker.port.postMessage({ message: 'Hello from main thread!' });

7.3 Shared Worker 的示例 (shared_worker.js)

// shared_worker.js
let connections = 0;

self.addEventListener('connect', function(e) {
  const port = e.ports[0];
  connections++;
  console.log('Shared Worker 连接数:', connections);

  port.addEventListener('message', function(e) {
    const data = e.data;
    console.log('Shared Worker 收到消息:', data);

    // 将消息发送回连接的页面
    port.postMessage({ message: 'Hello from Shared Worker!', connections: connections });
  });

  port.start();
});

8. Web Worker 的适用场景

场景	优点	缺点
大量计算	避免阻塞主线程，提高用户体验	需要序列化/反序列化数据，不能直接访问 DOM
图像/视频处理	将耗时的图像/视频处理操作放到后台线程执行，提高页面响应速度	需要处理数据传递和同步问题
网络请求	并行处理多个网络请求，提高数据加载速度	需要处理跨域问题，不能直接访问 DOM
游戏逻辑	将游戏逻辑计算放到后台线程执行，提高游戏性能	需要处理线程同步和数据一致性问题，不能直接访问 DOM
数据分析/挖掘	在后台线程执行复杂的数据分析/挖掘算法，避免阻塞主线程	需要处理数据传递和同步问题，不能直接访问 DOM
离线缓存 (Service Worker)	实现离线访问，提高用户体验	Service Worker 的生命周期管理较为复杂，需要处理缓存更新和版本控制问题

9. 一些需要考虑的点

调试： Web Workers 的调试可能比较困难。大多数浏览器都提供了专门的调试工具，可以帮助我们调试 Web Workers。
错误处理： 需要妥善处理 Web Workers 中发生的错误。可以使用 worker.onerror 事件监听 Worker 线程中发生的错误。
安全性： Web Workers 运行在独立的上下文中，因此可以避免一些安全问题。但是，仍然需要注意防止跨站脚本攻击 (XSS)。
浏览器兼容性： Web Workers API 在现代浏览器中都有很好的支持。但是，在旧版本的浏览器中可能不支持。

10. 实践代码例子

<!DOCTYPE html>
<html>
<head>
    <title>Web Worker Example</title>
</head>
<body>
    <h1>Web Worker Example</h1>
    <input type="number" id="numberInput" placeholder="Enter a number">
    <button id="calculateButton">Calculate Factorial</button>
    <p id="result"></p>

    <script>
        const numberInput = document.getElementById('numberInput');
        const calculateButton = document.getElementById('calculateButton');
        const resultElement = document.getElementById('result');
        let worker = null; // 定义 worker 变量，初始值为 null

        calculateButton.addEventListener('click', () => {
            const number = parseInt(numberInput.value);

            if (isNaN(number)) {
                resultElement.textContent = 'Please enter a valid number.';
                return;
            }

            if (worker) {
                worker.terminate(); // 如果worker已经存在，先终止它
            }

            // 创建一个新的 Worker
            worker = new Worker('factorialWorker.js');

            worker.onmessage = (event) => {
                resultElement.textContent = `Factorial of ${number} is ${event.data}`;
                worker.terminate(); // 计算完成后终止 worker
                worker = null; // 重置 worker 变量
            };

            worker.onerror = (error) => {
                resultElement.textContent = `An error occurred: ${error.message}`;
                worker.terminate(); // 发生错误时终止 worker
                worker = null; // 重置 worker 变量
            };

            worker.postMessage(number);
            resultElement.textContent = 'Calculating...';
        });

        // 页面卸载时终止 worker
        window.addEventListener('beforeunload', () => {
            if (worker) {
                worker.terminate();
            }
        });

    </script>
</body>
</html>

// factorialWorker.js
self.addEventListener('message', (event) => {
    const number = event.data;
    let result = 1;

    if (number < 0) {
        self.postMessage("Factorial is not defined for negative numbers.");
    } else {
        for (let i = 1; i <= number; i++) {
            result *= i;
        }
        self.postMessage(result);
    }
});

上面的代码展示了一个计算阶乘的例子。用户在输入框中输入一个数字，然后点击 "Calculate Factorial" 按钮。主线程创建一个新的 Web Worker，并将输入的数字发送给 Worker 线程。Worker 线程计算阶乘，然后将结果发送回主线程。主线程将结果显示在页面上。最后，terminate() worker。
在beforeunload 事件中，如果worker存在，则终止worker。

Worker 对象复用

在实际应用中，频繁创建和销毁 Web Worker 可能会带来性能开销。为了优化性能，我们可以尝试复用 Web Worker 对象。

// 定义一个全局变量来存储 Worker 对象
let worker = null;

function calculate(number) {
  if (!worker) {
    // 如果 Worker 对象不存在，则创建一个新的 Worker 对象
    worker = new Worker('worker.js');

    worker.onmessage = function(e) {
      const result = e.data;
      console.log('计算结果:', result);
    };

    worker.onerror = function(error) {
      console.error('Worker 发生错误:', error);
    };
  }

  // 发送消息给 Worker
  worker.postMessage(number);
}

// 调用 calculate 函数来启动计算
calculate(10);
calculate(20);

在这个例子中，我们使用一个全局变量 worker 来存储 Worker 对象。如果 worker 对象不存在，则创建一个新的 Worker 对象。否则，直接使用已存在的 Worker 对象。这样可以避免频繁创建和销毁 Worker 对象带来的性能开销。

关于Web Worker运行和数据传递的讨论

Web Workers API 是一种强大的工具，可以帮助我们构建更具响应性的 Web 应用程序。理解 Web Workers 的通信机制和数据传递限制对于有效地使用它们至关重要。通过合理地使用 Web Workers，我们可以将耗时的任务放到后台线程中执行，从而避免阻塞主线程，提高用户体验。同时，需要注意数据传递的限制，选择合适的数据传递方式，例如使用 Transferable Objects 来提高性能。

Web Workers API：HTML页面后台线程运行的通信机制与数据传递限制

发表回复 取消回复

发表回复取消回复