并行算法 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年11月28日

C++中的并行算法库（PPL）：TBB/HPX的任务图调度与负载均衡策略

C++并行算法库（PPL）：TBB/HPX的任务图调度与负载均衡策略大家好，今天我们来深入探讨C++并行算法库中的两个重要成员：Intel Threading Building Blocks (TBB) 和 High Performance ParalleX (HPX)，重点关注它们在任务图调度和负载均衡方面的策略。任务图是一种强大的工具，可以用来表达复杂的并行计算依赖关系，而高效的调度和负载均衡是保证并行程序性能的关键。 1. 任务图的概念在深入了解TBB和HPX之前，我们先来明确任务图的概念。任务图是一个有向无环图 (DAG)，其中：节点 (Nodes) 代表计算任务。每个节点对应一段可以并行执行的代码。边 (Edges) 代表任务之间的依赖关系。如果从节点A到节点B有一条边，则表示任务B必须在任务A完成后才能开始执行。任务图允许我们将复杂的计算分解为一系列小的、独立的任务，并明确它们之间的依赖关系。这使得并行执行变得更容易管理和优化。示例：考虑一个简单的图像处理流程：读取图像 (Read Image) 调整大小 (Resize) 应用滤镜 (Apply Filte …

继续阅读“C++中的并行算法库（PPL）：TBB/HPX的任务图调度与负载均衡策略”

2025年11月28日

C++ Thrust库的并行算法实现：后端（CUDA/TBB）切换与内存访问模式优化

C++ Thrust库的并行算法实现：后端（CUDA/TBB）切换与内存访问模式优化大家好，今天我们深入探讨C++ Thrust库在并行算法实现中的两个关键方面：后端切换以及内存访问模式的优化。Thrust作为NVIDIA推出的一个强大的并行算法库，提供了类似于STL的接口，极大简化了CUDA编程，同时也支持多种后端，允许我们在不同硬件平台上灵活部署。 Thrust后端选择与切换 Thrust的核心优势之一就是其抽象性，它允许开发者编写通用的并行算法，而无需关心底层硬件的细节。通过选择不同的后端，Thrust可以自动将算法映射到不同的执行环境，例如CUDA GPU或多核CPU。 Thrust主要支持以下几种后端： CUDA后端: 利用CUDA GPU进行加速。这是Thrust最常用的后端，也是其性能优势的主要来源。 TBB后端: 基于Intel Threading Building Blocks (TBB) 实现多线程并行。适用于CPU环境，可以在没有NVIDIA GPU的情况下利用多核处理器的能力。 OpenMP后端: 使用OpenMP指令实现并行。同样适用于CPU环境，提供了另一 …

继续阅读“C++ Thrust库的并行算法实现：后端（CUDA/TBB）切换与内存访问模式优化”

2025年7月15日

C++ `std::execution` (C++17) 与并行算法策略的定制化

哈喽，各位好！今天咱们聊聊C++17标准中std::execution这玩意儿，以及它如何玩转并行算法策略的定制化。这可是个好东西，能让你的代码飞起来，前提是你得知道怎么用。第一部分：std::execution是个啥？简单来说，std::execution就是C++17引入的一套机制，用于控制标准库算法的执行方式。它允许你指定算法是顺序执行、并行执行还是向量化执行，甚至可以自定义执行策略。以前，你可能需要自己写线程池，或者用OpenMP之类外部库，现在标准库直接给你安排上了，岂不美哉？ std::execution主要涉及以下几个执行策略：执行策略描述 std::execution::seq 顺序执行，老老实实一个一个来。别指望它能提速，但保证安全，不会有数据竞争。 std::execution::par 并行执行，能用多少线程用多少线程。速度是上去了，但要注意数据竞争，别让你的程序崩了。 std::execution::par_unseq 并行且向量化执行，充分利用CPU的SIMD指令集。速度最快，但对数据对齐有要求，而且不是所有算法都支持。 std::execution: …

继续阅读“C++ `std::execution` (C++17) 与并行算法策略的定制化”

2025年7月7日

C++ 并行算法的调试技巧：死锁、竞态条件与活锁分析

好的，各位朋友们，今天咱们来聊聊C++并行算法的调试，这个话题听起来就让人头大，简直是程序员的噩梦！死锁、竞态条件、活锁，这三个家伙就像三座大山，压得我们喘不过气。不过别怕，今天我就来带大家翻过这三座大山，让并行算法调试不再是难事。开场白：并行，美丽的陷阱并行算法，听起来多美好！多线程齐头并进，CPU火力全开，程序运行速度蹭蹭往上涨，感觉自己瞬间变成了火箭科学家。但现实往往是残酷的，一旦涉及到共享资源，各种问题就会像雨后春笋一样冒出来，让你欲哭无泪。为什么会这样？因为并发的世界充满了不确定性。多个线程就像一群熊孩子，谁都想抢玩具，谁都想先玩，一不小心就乱套了。第一座大山：死锁（Deadlock）死锁，顾名思义，就是大家互相僵持，谁也不让谁，谁也动不了，整个程序就卡在那里，像一潭死水。死锁的四个必要条件：条件描述互斥（Mutual Exclusion）资源只能被一个线程占用，不能同时被多个线程共享。占有且等待（Hold and Wait）线程占有了一些资源，同时又在等待其他线程释放资源。不可剥夺（No Preemption）线程已经获得的资源，在没有主动释放之 …

继续阅读“C++ 并行算法的调试技巧：死锁、竞态条件与活锁分析”

2025年7月7日

C++ `std::execution` 策略：C++17 并行算法的执行模型

好的，各位观众，欢迎来到今天的“C++并行算法的执行策略：让你的代码飞起来”讲座！我是你们的老朋友，Bug终结者，代码魔法师（称号随便起，关键是逗大家开心）。今天咱们不聊虚的，直接上干货，聊聊C++17引入的std::execution策略，也就是并行算法的执行模型。开场白：告别单线程，拥抱多核世界话说，各位程序员大佬们，你们有没有觉得现在的CPU核心越来越多，但是咱们的代码跑起来还是慢吞吞的？这就像开着F1赛车在村里小路上跑，速度根本提不起来啊！原因很简单，咱们的代码还在单线程里苦苦挣扎，没有充分利用多核CPU的潜力。 C++17的并行算法就是来拯救我们的！它提供了一种简单而强大的方式，让我们可以轻松地将算法并行化，让代码跑得更快，效率更高。而std::execution策略，就是控制这些并行算法如何执行的关键。什么是std::execution策略？简单来说，std::execution策略就是告诉编译器和运行时环境，你希望你的并行算法怎么跑。是单线程跑，还是多线程跑，还是允许运行时自己选择？这些都由std::execution策略说了算。 C++标准库提供了以下几种标准的 …

继续阅读“C++ `std::execution` 策略：C++17 并行算法的执行模型”