Python的GIL（全局解释器锁）：深入理解其对多线程和多进程的影响与应对策略。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Python GIL（全局解释器锁）：深入理解其对多线程和多进程的影响与应对策略

大家好，今天我们来深入探讨Python中一个备受争议的特性：全局解释器锁，也就是 GIL。GIL 对于 Python 的多线程编程有着显著的影响，理解它的工作方式以及如何规避它的限制，对于编写高性能的 Python 代码至关重要。

1. 什么是 GIL？

GIL，全称 Global Interpreter Lock，即全局解释器锁。它是 CPython 解释器中的一个互斥锁，用于保护解释器状态。它的核心作用是：在任意时刻，只允许一个线程持有 Python 解释器的控制权。这意味着，即使你的 Python 程序运行在多核 CPU 上，同一时刻也只有一个线程能够真正执行 Python 字节码。

为什么需要 GIL？

GIL 的存在并非毫无理由。早期 Python 的设计目标是易用性和快速开发，而不是极致的并发性能。GIL 的引入简化了 CPython 解释器的内存管理，特别是针对引用计数这种垃圾回收机制。

简化内存管理: CPython 使用引用计数来跟踪对象的生命周期。当一个对象的引用计数降为 0 时，该对象就会被释放。在多线程环境下，如果没有 GIL，多个线程同时修改对象的引用计数可能会导致竞态条件，从而引发内存错误。GIL 通过确保同一时刻只有一个线程可以访问和修改解释器状态，避免了这种竞态条件，简化了内存管理。
与 C 扩展的兼容性: 很多 Python 的 C 扩展并不是线程安全的。GIL 确保了这些 C 扩展在多线程环境下能够安全运行。

2. GIL 的工作原理

当一个线程想要执行 Python 字节码时，它必须首先获取 GIL。一旦线程获得了 GIL，它就可以执行自己的代码。在以下情况下，线程会释放 GIL：

I/O 操作: 当线程执行 I/O 操作（例如，读取文件、网络请求）时，它会主动释放 GIL，允许其他线程执行。这是因为 I/O 操作通常比较耗时，线程在等待 I/O 完成时，不需要占用 CPU 资源。
时间片到期: 线程执行一段时间后，会释放 GIL，让其他线程有机会执行。默认情况下，CPython 会每隔 100 个字节码指令释放一次 GIL。
显式释放: 线程可以显式地释放 GIL，通过调用 Py_BEGIN_ALLOW_THREADS 和 Py_END_ALLOW_THREADS 宏（通常在 C 扩展中使用）。

3. GIL 对多线程的影响

GIL 对 CPU 密集型（CPU-bound）的多线程程序影响最大。由于 GIL 的存在，即使你的程序运行在多核 CPU 上，也无法真正实现并行执行。多个线程会争夺 GIL，导致线程切换的开销增加，从而降低程序的整体性能。

示例：CPU 密集型任务

import threading
import time

def cpu_bound_task(n):
    count = 0
    for i in range(n):
        count += 1
    return count

def run_threads(num_threads, n):
    threads = []
    start_time = time.time()
    for i in range(num_threads):
        thread = threading.Thread(target=cpu_bound_task, args=(n,))
        threads.append(thread)
        thread.start()

    for thread in threads:
        thread.join()

    end_time = time.time()
    print(f"使用 {num_threads} 个线程，耗时: {end_time - start_time:.4f} 秒")

if __name__ == "__main__":
    n = 10000000  # 大量的计算
    run_threads(1, n)  # 单线程
    run_threads(2, n)  # 双线程
    run_threads(4, n)  # 四线程

运行结果（大致）：

使用 1 个线程，耗时: 1.2345 秒
使用 2 个线程，耗时: 2.4690 秒
使用 4 个线程，耗时: 4.9380 秒

可以看到，随着线程数量的增加，执行时间也几乎线性增加。这是 GIL 限制了多线程的并行执行。

I/O 密集型任务

对于 I/O 密集型（I/O-bound）的任务，GIL 的影响相对较小。因为线程在等待 I/O 操作完成时，会释放 GIL，允许其他线程执行。因此，多线程可以提高 I/O 密集型程序的效率。

示例：I/O 密集型任务

import threading
import time
import requests

def io_bound_task(url):
    try:
        response = requests.get(url)
        # 处理响应
        return response.status_code
    except Exception as e:
        print(f"Error fetching {url}: {e}")
        return None

def run_threads_io(num_threads, urls):
    threads = []
    start_time = time.time()
    for url in urls:
        thread = threading.Thread(target=io_bound_task, args=(url,))
        threads.append(thread)
        thread.start()

    for thread in threads:
        thread.join()

    end_time = time.time()
    print(f"使用 {num_threads} 个线程，耗时: {end_time - start_time:.4f} 秒")

if __name__ == "__main__":
    urls = ["https://www.google.com" for _ in range(10)]  # 10 个网络请求
    run_threads_io(1, urls)  # 单线程
    run_threads_io(4, urls)  # 四线程
    run_threads_io(10, urls) # 十线程

运行结果（大致）：

使用 1 个线程，耗时: 2.5000 秒
使用 4 个线程，耗时: 0.8000 秒
使用 10 个线程，耗时: 0.7000 秒

可以看到，使用多线程可以显著减少 I/O 密集型任务的执行时间。

总结：GIL 对不同类型任务的影响

任务类型	GIL 的影响	效果
CPU 密集型	显著	多线程无法真正并行执行，性能提升有限
I/O 密集型	较小	多线程可以有效提高程序的并发性能

4. 绕过 GIL 的方法

虽然 GIL 限制了 Python 多线程的并行性，但我们仍然有多种方法可以绕过 GIL，实现真正的并发执行。

多进程 (Multiprocessing):

multiprocessing 模块允许你创建多个独立的 Python 进程。每个进程都有自己的 Python 解释器和内存空间，因此不受 GIL 的限制。多进程是解决 CPU 密集型任务并发问题的常用方法。

示例：使用多进程解决 CPU 密集型任务

import multiprocessing
import time

def cpu_bound_task(n):
   count = 0
   for i in range(n):
       count += 1
   return count

def run_processes(num_processes, n):
   processes = []
   start_time = time.time()
   for i in range(num_processes):
       process = multiprocessing.Process(target=cpu_bound_task, args=(n,))
       processes.append(process)
       process.start()

   for process in processes:
       process.join()

   end_time = time.time()
   print(f"使用 {num_processes} 个进程，耗时: {end_time - start_time:.4f} 秒")

if __name__ == "__main__":
   n = 10000000  # 大量的计算
   run_processes(1, n)  # 单进程
   run_processes(2, n)  # 双进程
   run_processes(4, n)  # 四进程

运行结果（大致）：

使用 1 个进程，耗时: 1.2345 秒
使用 2 个进程，耗时: 0.6172 秒
使用 4 个进程，耗时: 0.3086 秒

可以看到，随着进程数量的增加，执行时间显著减少，实现了真正的并行执行。

多进程的优缺点：

优点:
- 绕过 GIL，实现真正的并行执行。
- 可以充分利用多核 CPU 的性能。
缺点:
- 进程间通信开销较大（例如，使用 Queue 或 Pipe）。
- 内存占用较高，因为每个进程都有自己的内存空间。
- 进程的创建和销毁开销较大。

使用 C 扩展:

可以将 CPU 密集型任务交给 C 扩展来执行。C 扩展可以绕过 GIL，实现真正的并行执行。例如，可以使用 NumPy、SciPy 等库来执行数值计算。这些库通常使用 C 或 Fortran 编写，可以在没有 GIL 的情况下执行。

示例：使用 NumPy 进行并行计算

import numpy as np
import threading
import time

def numpy_task(n):
   a = np.random.rand(n, n)
   b = np.random.rand(n, n)
   c = np.dot(a, b) # 矩阵乘法，在 C 扩展中执行
   return c

def run_threads_numpy(num_threads, n):
   threads = []
   start_time = time.time()
   for i in range(num_threads):
       thread = threading.Thread(target=numpy_task, args=(n,))
       threads.append(thread)
       thread.start()

   for thread in threads:
       thread.join()

   end_time = time.time()
   print(f"使用 {num_threads} 个线程，耗时: {end_time - start_time:.4f} 秒")

if __name__ == "__main__":
   n = 1000
   run_threads_numpy(1, n)
   run_threads_numpy(4, n)

注意: NumPy 在进行矩阵运算时，会释放 GIL，允许其他线程执行。这使得多线程可以提高 NumPy 计算的性能。

异步 I/O (Asynchronous I/O):

对于 I/O 密集型任务，可以使用异步 I/O 来提高程序的并发性能。异步 I/O 允许程序在等待 I/O 操作完成时，继续执行其他任务。asyncio 模块是 Python 中用于实现异步 I/O 的标准库。

示例：使用 asyncio 进行异步网络请求

import asyncio
import aiohttp
import time

async def fetch_url(session, url):
   try:
       async with session.get(url) as response:
           return response.status
   except Exception as e:
       print(f"Error fetching {url}: {e}")
       return None

async def main(urls):
   async with aiohttp.ClientSession() as session:
       tasks = [fetch_url(session, url) for url in urls]
       results = await asyncio.gather(*tasks)
       return results

if __name__ == "__main__":
   urls = ["https://www.google.com" for _ in range(10)]
   start_time = time.time()
   asyncio.run(main(urls))
   end_time = time.time()
   print(f"使用 asyncio，耗时: {end_time - start_time:.4f} 秒")

asyncio 使用单线程和事件循环来实现并发。当一个任务等待 I/O 操作完成时，事件循环会切换到其他任务，从而避免了线程阻塞。

线程级别的并行库:

有些库，如concurrent.futures，提供了线程池Executor和进程池Executor，允许你方便地管理线程或进程，并将任务提交给它们执行。虽然线程池仍然受到GIL的限制，但在I/O密集型任务中仍然有用。

import concurrent.futures
import time

def task(n):
    time.sleep(n)  # 模拟耗时操作
    return f"Task completed after {n} seconds"

def run_tasks_concurrently(tasks):
    start_time = time.time()
    with concurrent.futures.ThreadPoolExecutor(max_workers=4) as executor: # 创建一个线程池
        futures = [executor.submit(task, n) for n in tasks]
        for future in concurrent.futures.as_completed(futures):
            print(future.result())

    end_time = time.time()
    print(f"总耗时: {end_time - start_time:.4f} 秒")

if __name__ == "__main__":
    tasks = [1, 2, 1.5, 0.5] # 一系列耗时任务
    run_tasks_concurrently(tasks)

这个例子使用了ThreadPoolExecutor，它创建了一个线程池来并发执行任务。

5. GIL 的未来

关于移除 GIL 的讨论一直存在。虽然移除 GIL 可以提高 Python 的并发性能，但也可能会带来一些问题，例如：

性能下降: 在某些情况下，移除 GIL 可能会导致单线程程序的性能下降。
代码兼容性: 移除 GIL 可能会导致一些 C 扩展无法正常工作。

目前，CPython 核心开发团队正在积极探索移除 GIL 的可行性方案。有一个名为 "nogil" 的分支，致力于移除 GIL 并优化 Python 的并发性能。但是，移除 GIL 是一个非常复杂的问题，需要权衡各种因素。

6. 如何选择合适的并发策略

选择哪种并发策略取决于你的应用程序的特点：

CPU 密集型任务: 优先选择多进程或使用 C 扩展。
I/O 密集型任务: 可以选择多线程或异步 I/O。
混合型任务: 可以将 CPU 密集型任务交给多进程或 C 扩展处理，将 I/O 密集型任务交给多线程或异步 I/O 处理。

在选择并发策略时，需要综合考虑程序的性能、复杂度和可维护性。

GIL 对多线程的限制，多进程是有效的解决方案

GIL 限制了 Python 多线程的并行执行，但多进程提供了一种有效的解决方案，它通过创建独立的进程来绕过 GIL 的限制，实现真正的并行计算。

不同的并发策略，针对不同的任务类型

选择合适的并发策略取决于任务的类型：CPU 密集型任务适合多进程或 C 扩展，I/O 密集型任务适合多线程或异步 I/O。

GIL 的未来，可能的演进方向

GIL 的移除是一个复杂的问题，需要权衡各种因素。CPython 核心开发团队正在积极探索移除 GIL 的可行性方案。

Python GIL（全局解释器锁）：深入理解其对多线程和多进程的影响与应对策略

发表回复 取消回复

发表回复取消回复