并行 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2026年1月5日

深入‘逻辑分支状态隔离’：如何在一个主图中并行运行 5 个互不干扰的实验性思维链？

各位来宾，各位技术同仁，下午好！今天，我们齐聚一堂，共同探讨一个在复杂系统设计中至关重要的话题：如何在单一的主图中，高效且互不干扰地并行运行多个“实验性思维链”，特别聚焦于“逻辑分支状态隔离”这一核心挑战。想象一下，我们正在构建一个智能决策系统，它需要同时探索五种不同的策略或假设，每种策略都可能涉及一系列复杂的推理步骤和数据处理，并且它们之间必须保持严格的独立性，互不影响。这正是我们今天要解决的问题。 1. 概念界定：什么是“主图”、“思维链”与“逻辑分支”？在深入技术细节之前，我们首先需要对几个核心概念达成共识。主图 (Main Graph)：在这里，主图可以被理解为一个高层级的执行协调器或工作流引擎。它不一定是一个图形数据库或严格意义上的DAG（有向无环图）执行器，但它承担着启动、管理、监控和收集结果的责任。它定义了可以并行执行的多个逻辑路径或任务的容器。实验性思维链 (Experimental Thought Chain)：思维链，可以想象为一系列相互关联的计算、决策、数据转换或AI推理步骤。它是一个有状态的、线性的或分支的执行序列。例如，一个思维链可能包括：接收输入 …

继续阅读“深入‘逻辑分支状态隔离’：如何在一个主图中并行运行 5 个互不干扰的实验性思维链？”

2025年11月27日

Python中的模型并行与流水线（Pipeline）并行：在多加速器系统上的实现

Python中的模型并行与流水线（Pipeline）并行：在多加速器系统上的实现大家好，今天我们来深入探讨Python中模型并行和流水线并行这两种技术，以及如何在多加速器系统上利用它们来训练大型深度学习模型。随着模型规模的不断增长，单块GPU的内存容量和计算能力已经无法满足需求。模型并行和流水线并行应运而生，它们将模型拆分到多个加速器上，从而解决了这个问题。 1. 模型并行：数据并行之外的选择传统的数据并行将整个模型复制到每个加速器上，然后将数据分成多个批次，每个加速器处理一个批次。虽然简单有效，但当模型本身太大，无法装入单个加速器的内存时，数据并行就无能为力了。这时，我们就需要模型并行。模型并行是指将模型本身拆分到多个加速器上。每个加速器只负责模型的一部分，并通过通信来协调彼此的计算。模型并行有两种主要类型：张量并行和层并行。张量并行 (Tensor Parallelism)：将单个张量（例如，权重矩阵）拆分到多个加速器上。每个加速器持有张量的一部分，并负责计算该部分对应的输出。例如，假设我们有一个巨大的权重矩阵 W，可以将其沿行或列方向拆分到多个加速器上。层并行 (Lay …

继续阅读“Python中的模型并行与流水线（Pipeline）并行：在多加速器系统上的实现”

2025年11月18日

分布式事务协调器成为瓶颈的高可用设计与并行调度优化

分布式事务协调器成为瓶颈的高可用设计与并行调度优化大家好！今天我们来聊聊分布式事务中一个非常关键，但也容易成为瓶颈的组件：事务协调器。我们将会深入探讨当事务协调器成为性能瓶颈时，如何进行高可用设计以及并行调度优化，力求让大家对这个问题有更清晰的理解。一、分布式事务的挑战与事务协调器的角色在单体应用中，事务的ACID特性通常由数据库本身来保证。但在分布式系统中，一个业务操作可能需要跨多个服务，涉及多个数据库，这时候就需要引入分布式事务来保证数据的一致性。常见的分布式事务协议包括两阶段提交（2PC）、三阶段提交（3PC）、TCC（Try-Confirm-Cancel）、Saga等。无论采用哪种协议，通常都需要一个协调器（Coordinator）来协调各个参与者（Participant）的事务执行。事务协调器的核心职责如下：事务的发起与管理：接收事务请求，生成全局事务ID，并负责事务的整个生命周期管理。参与者的协调：向各个参与者发送prepare、commit、rollback等指令，并收集参与者的响应。决议的最终执行：根据所有参与者的响应，决定事务的最终提交或回滚，并 …

继续阅读“分布式事务协调器成为瓶颈的高可用设计与并行调度优化”

2025年8月31日

MySQL优化器与执行计划之：`MySQL`的`并行查询`：`MySQL`在`8.0`版本中如何支持部分并行查询。

好的，下面是一篇关于MySQL 8.0并行查询的文章，以讲座模式呈现： MySQL 8.0 并行查询：释放多核 CPU 的潜力大家好！今天我们来聊聊 MySQL 8.0 中引入的并行查询功能。长期以来，MySQL 在很大程度上依赖于单线程执行查询，这意味着即使你的服务器拥有多个 CPU 核心，一个复杂的查询也可能只能利用其中的一个核心。这显然是一种资源的浪费，尤其是在当今多核处理器普遍存在的环境下。 MySQL 8.0 通过引入并行查询，试图解决这个问题，让我们可以更好地利用服务器的计算能力，从而显著提升查询性能。 1. 并行查询的背景与动机在 MySQL 8.0 之前，虽然也有一些并行执行的特性（比如复制中的并行应用），但对于单个查询来说，主要的执行流程还是串行的。这导致了以下几个问题： CPU 利用率低：在执行 CPU 密集型的查询时，只有一个核心在工作，其他核心处于空闲状态。查询响应时间长：复杂的查询需要更长的时间才能完成，影响用户体验。资源瓶颈：单线程执行容易成为性能瓶颈，限制了 MySQL 的扩展能力。为了解决这些问题，MySQL 团队在 8.0 版本中 …

继续阅读“MySQL优化器与执行计划之：`MySQL`的`并行查询`：`MySQL`在`8.0`版本中如何支持部分并行查询。”