并行计算：`joblib` 与 `multiprocessing` 在 NumPy 中的应用 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位听众老爷，欢迎来到今天的“并行计算那点事儿”讲堂！我是你们的老朋友，人称“代码界的段子手”的AI君。今天咱们不聊风花雪月，只谈并行计算，尤其是joblib和multiprocessing这两位在NumPy世界里呼风唤雨的大佬。

开场白：单挑BOSS太慢？组队刷怪才是王道！

话说，咱们程序员每天的工作，就像游戏里的勇者，面对各种各样的Bug和需求，一路披荆斩棘。但有些任务，比如处理海量数据、训练复杂模型，简直就是史诗级BOSS，单枪匹马硬刚，耗时耗力，头发都掉光了也未必能搞定。

这个时候，就需要我们的秘密武器——并行计算！想象一下，你不再是一个人孤军奋战，而是召唤了一群小伙伴，大家齐心协力，分工合作，一起刷BOSS，效率自然蹭蹭蹭往上涨！🚀

而joblib和multiprocessing，就是咱们组队刷怪的强力工具。它们能让你轻松地将任务分解成多个子任务，分配给多个CPU核心并行执行，从而大幅提升计算速度。

第一幕：multiprocessing——自带光环的“亲儿子”

multiprocessing是Python自带的模块，就像是Python的“亲儿子”，血统纯正，功能强大。它基于操作系统级别的进程来实现并行，每个进程都有独立的内存空间，互不干扰，稳定性极佳。

1. multiprocessing的优势：

真·并行： 每个进程都运行在独立的CPU核心上，真正实现了并行计算，能够充分利用多核CPU的性能。
稳定性高： 进程之间互不干扰，一个进程崩溃不会影响其他进程，保证了程序的整体稳定性。
适用性广： 适用于各种类型的计算任务，尤其是CPU密集型任务。

2. multiprocessing的基本用法：

multiprocessing的核心是Process类，我们可以创建多个Process对象，每个对象代表一个独立的进程，然后通过start()方法启动进程，通过join()方法等待进程结束。

import multiprocessing
import time

def worker(num):
  """工作进程函数"""
  print(f"进程 {num} 开始工作...")
  time.sleep(2)  # 模拟耗时操作
  print(f"进程 {num} 完成工作!")

if __name__ == '__main__':
  processes = []
  for i in range(3):
    p = multiprocessing.Process(target=worker, args=(i,))
    processes.append(p)
    p.start()

  for p in processes:
    p.join()

  print("所有进程完成!")

这段代码创建了3个进程，每个进程都执行worker函数，模拟耗时操作。可以看到，3个进程几乎同时开始执行，大大缩短了总的执行时间。

3. multiprocessing的进阶技巧：

进程池 (Pool): 如果需要创建大量的进程，手动创建和管理进程非常繁琐。Pool类可以帮助我们创建一个进程池，自动管理进程的创建和销毁，简化了代码。

from multiprocessing import Pool
import time

def square(x):
  """计算平方的函数"""
  time.sleep(1)  # 模拟耗时操作
  return x * x

if __name__ == '__main__':
  with Pool(processes=4) as pool:
    results = pool.map(square, range(10))  # 将square函数应用于range(10)的每个元素
    print(results)

进程间通信 (Queue, Pipe): 进程之间是独立的，无法直接共享数据。multiprocessing提供了Queue和Pipe等机制，用于进程间的数据传递。

表格 1: multiprocessing常用类和方法

类/方法	描述
`Process`	创建一个进程对象
`Pool`	创建一个进程池，管理进程的创建和销毁
`Queue`	创建一个进程安全的队列，用于进程间的数据传递
`Pipe`	创建一个管道，用于两个进程之间的双向通信
`start()`	启动进程
`join()`	等待进程结束
`map(func, iterable)`	将函数`func`应用于`iterable`的每个元素，返回结果列表 (并行执行)
`apply_async(func, args)`	异步地将函数`func`应用于参数`args`，返回一个`AsyncResult`对象，可以通过`get()`方法获取结果 (非阻塞)

第二幕：joblib——NumPy的贴心小棉袄

joblib是一个专门为Python科学计算而生的库，它对NumPy数组的处理进行了优化，特别适合于并行化NumPy相关的计算任务。

1. joblib的优势：

NumPy友好： 专门针对NumPy数组进行了优化，能够高效地处理大型数组。
易于使用： 提供了简洁的API，使用起来非常方便。
结果缓存： 可以缓存函数的计算结果，避免重复计算，提高效率。

2. joblib的核心——Parallel和delayed：

joblib的核心是Parallel类和delayed函数。Parallel类用于并行执行任务，delayed函数用于将一个函数及其参数包装成一个可并行执行的任务。

from joblib import Parallel, delayed
import numpy as np
import time

def square(x):
  """计算平方的函数"""
  time.sleep(1)  # 模拟耗时操作
  return x * x

if __name__ == '__main__':
  numbers = np.arange(10)
  results = Parallel(n_jobs=4)(delayed(square)(x) for x in numbers) # n_jobs指定使用的CPU核心数
  print(results)

这段代码使用Parallel和delayed并行计算了numbers数组中每个元素的平方。n_jobs=4表示使用4个CPU核心并行执行。

3. joblib的进阶技巧：

结果缓存 (Memory): 对于一些计算量大的函数，可以使用Memory类缓存计算结果，避免重复计算。

from joblib import Memory
import numpy as np
import time

location = './cachedir' #缓存目录
memory = Memory(location, verbose=0)

@memory.cache
def expensive_function(data):
  """计算量很大的函数"""
  print("执行耗时计算...")
  time.sleep(2) #模拟耗时计算
  return np.mean(data)

if __name__ == '__main__':
  data = np.random.rand(1000000)
  result1 = expensive_function(data)
  result2 = expensive_function(data) # 第二次调用直接从缓存中读取结果，无需重新计算
  print(result1, result2)

大规模数组处理： joblib对大型NumPy数组的处理进行了优化，能够高效地进行并行计算。

表格 2: joblib常用类和函数

类/函数	描述
`Parallel`	并行执行任务
`delayed`	将一个函数及其参数包装成一个可并行执行的任务
`Memory`	缓存函数的计算结果
`dump(obj, filename)`	将对象`obj`保存到文件`filename`
`load(filename)`	从文件`filename`加载对象

第三幕：multiprocessing vs joblib——谁是你的菜？

multiprocessing和joblib都是强大的并行计算工具，但它们各有优缺点，适用于不同的场景。

1. 适用场景：

multiprocessing:
- CPU密集型任务，例如图像处理、视频编码等。
- 需要高度稳定性的任务，例如服务器后台程序。
- 需要进程间通信的任务。
joblib:
- NumPy相关的计算任务，例如机器学习、数据分析等。
- 需要结果缓存的任务。
- 需要快速开发和部署的任务。

2. 优缺点对比：

特性	`multiprocessing`	`joblib`
并行级别	进程	线程 (默认)
NumPy支持	一般	优秀
易用性	较复杂	简单
稳定性	高	较高
内存占用	高	较低
适用场景	通用	NumPy相关

总结：选择合适的工具，事半功倍！

就像武侠小说里的高手，选择合适的武器才能发挥出最大的威力。在并行计算的世界里，multiprocessing和joblib就是你的两把利剑，选择哪一把，取决于你的任务类型和需求。

如果你需要处理CPU密集型任务，并且对稳定性要求很高，那么multiprocessing是你的首选。如果你需要处理NumPy相关的计算任务，并且希望代码简洁易懂，那么joblib更适合你。

当然，你也可以将两者结合起来使用，例如使用multiprocessing创建进程池，然后使用joblib并行处理每个进程中的NumPy数组。

结尾：并行计算，让你的代码飞起来！

好了，今天的“并行计算那点事儿”就讲到这里。希望通过今天的讲解，你能对joblib和multiprocessing有更深入的了解，并在实际工作中灵活运用它们，让你的代码飞起来！🚀

记住，单打独斗的时代已经过去，组队刷怪才是王道！💪

感谢各位听众老爷的捧场，咱们下期再见！👋

发表回复 取消回复

发表回复取消回复