pd - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年11月23日

分离式推理架构（PD-Separation）：利用异构集群解耦Prefill与Decode阶段的资源争用

分离式推理架构（PD-Separation）：利用异构集群解耦Prefill与Decode阶段的资源争用大家好，今天我们要讨论的是一个针对大规模语言模型（LLM）推理优化的重要技术——分离式推理架构，也称PD-Separation。具体来说，我们会探讨如何利用异构集群来解耦LLM推理过程中Prefill和Decode这两个阶段的资源争用，从而提升整体的推理效率和吞吐量。 1. LLM推理的挑战：资源争用与性能瓶颈 LLM的推理过程通常可以分为两个主要阶段： Prefill（预填充）阶段：这个阶段处理输入的prompt，模型根据prompt生成初始状态。这一阶段的特点是计算密集型，需要大量的矩阵乘法和激活函数计算。由于prompt的长度通常较长，Prefill阶段会占用大量的计算资源（如GPU）。 Decode（解码）阶段：这个阶段基于Prefill阶段生成的初始状态，逐个token生成后续文本。Decode阶段的特点是迭代次数多，每次迭代的计算量相对较小，但对延迟非常敏感。每次迭代都需要从模型中读取权重，并进行少量的计算。这两个阶段对资源的需求存在显著差异：Prefill阶段更 …

继续阅读“分离式推理架构（PD-Separation）：利用异构集群解耦Prefill与Decode阶段的资源争用”

2025年6月13日

数据类型强制转换与错误处理：`pd.to_numeric`, `pd.to_datetime`

好的，各位观众老爷们，欢迎来到今天的《数据类型强制转换与错误处理奇遇记》！我是你们的老朋友，数据界的老司机，今天就带大家一起闯荡一下 pd.to_numeric 和 pd.to_datetime 这两个数据转换界的“变形金刚”。开场白：数据类型，你搞清楚了吗？在数据分析的世界里，数据类型就像人的性格，千奇百怪，各有所长。有憨厚的整数型（int），有精打细算的浮点型（float），还有能说会道的字符串型（str）。但有时候，数据就像个叛逆期的孩子，明明应该是个数字，非要伪装成字符串，让我们头疼不已。举个栗子 🌰：你从一个CSV文件中读取了一列数据，本以为是价格，结果打印出来一看，全是字符串！这就像你满怀期待地打开一个礼物盒，结果发现里面装的是袜子一样令人失望。 import pandas as pd data = {‘价格’: [‘100’, ‘200’, ‘300.5’, ‘400.25’]} df = pd.DataFrame(data) print(df[‘价格’].dtype) # 输出：object (在Pandas中，object 通常代表字符串) 这时候，我们就需要 …

继续阅读“数据类型强制转换与错误处理：`pd.to_numeric`, `pd.to_datetime`”

2025年6月13日

配置选项：`pd.set_option` 提升开发体验

驾驭Pandas的“变形金刚”：pd.set_option 让开发体验如丝般顺滑 🚀 各位探险家们，欢迎来到Pandas的奇幻世界！今天，我们将聚焦一个看似不起眼，实则威力无穷的工具：pd.set_option。别被它的名字迷惑，它可不是什么枯燥的配置函数，而是Pandas这艘巨轮上的一块精巧舵盘，能让你掌控数据展示的方方面面，让你的开发体验像德芙巧克力般丝滑！ 🍫 想象一下，你是一位英勇的探险家，手持Pandas这把锋利的宝剑，在数据丛林中披荆斩棘。然而，当面对庞大的DataFrame时，你却发现屏幕上挤满了省略号，关键信息被无情地隐藏，简直像是戴着一副磨砂眼镜观察世界，让人抓狂！ 🤯 别担心，pd.set_option就是你的“变形金刚”，能根据你的需求，调整Pandas的显示方式，让数据以你期望的方式呈现，助你拨开迷雾，洞悉真相！一、 pd.set_option：Pandas世界的幕后英雄 pd.set_option是Pandas库中用于设置各种选项的函数。它的作用范围非常广泛，可以控制DataFrame的显示格式、精度、最大行数、最大列数等等。简单来说，它就像一个万能遥控器 …

继续阅读“配置选项：`pd.set_option` 提升开发体验”