sequence - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Python中的序列标注：CRF/HMM模型的底层实现与推理优化大家好！今天我们来深入探讨Python中序列标注问题，重点剖析两种经典模型：隐马尔可夫模型（HMM）和条件随机场（CRF）。我们不仅会了解它们的理论基础，更会着重于底层实现和推理优化，力求让大家对序列标注问题有更深刻的理解。一、序列标注问题概述序列标注是指给定一个输入序列，为序列中的每一个元素贴上一个标签。这是一个广泛应用于自然语言处理（NLP）领域的任务，例如：词性标注（POS Tagging）：给句子中的每个词语标注词性，如名词、动词、形容词等。命名实体识别（NER）：识别文本中具有特定意义的实体，如人名、地名、组织机构名等。分词（Word Segmentation）：将连续的文本序列切分成独立的词语。更形式化地讲，给定一个观测序列 X = (x1, x2, …, xn)，序列标注的目标是找到一个对应的标签序列 Y = (y1, y2, …, yn)。二、隐马尔可夫模型 (HMM) HMM 是一种生成模型，它假设观测序列是由一个隐藏的马尔可夫链生成的。它包含以下几个关键要素 …

继续阅读“Python中的序列标注（Sequence Labeling）：CRF/HMM模型的底层实现与推理优化”

张量并行中的通信量优化：Sequence Parallelism与LayerNorm的拆分策略大家好！今天我们来深入探讨张量并行（Tensor Parallelism，TP）中一个重要的通信量优化策略，特别是在处理序列数据时如何通过 Sequence Parallelism (SP) 以及 LayerNorm 的拆分来减少冗余通信。张量并行是大型模型训练中常用的并行策略之一，其核心思想是将模型中的张量（例如权重矩阵）分割到多个设备上，每个设备只负责计算张量的一部分。这样可以显著降低单个设备的内存需求，从而允许我们训练更大的模型。然而，张量并行引入了一个新的挑战，即设备之间的通信开销。模型的前向和反向传播过程中，需要在不同的设备之间交换数据，这些数据传输会占用大量的带宽，影响训练效率。 Sequence Parallelism 是一种专门针对序列数据（例如文本）设计的张量并行策略。它将输入序列分割到多个设备上，每个设备只处理序列的一部分。这种方法在处理长序列时尤其有效，因为它可以显著降低单个设备的内存需求。但是，直接应用 Sequence Parallelism 会引入额外的通信开销 …

继续阅读“张量并行（TP）中的通信量优化：Sequence Parallelism如何通过拆分LayerNorm减少冗余”