context - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年11月23日

Context Compression（上下文压缩）：利用LLMLingua通过困惑度筛选关键Token

Context Compression：利用LLMLingua通过困惑度筛选关键Token 各位朋友，大家好。今天我们来深入探讨一个在大型语言模型（LLM）应用中至关重要的问题：上下文压缩。随着LLM处理能力的不断提升，我们能够输入的上下文长度也随之增加。然而，并非所有上下文信息都同等重要。冗余或无关的信息不仅会增加计算成本，还可能降低模型的性能，这就是所谓的“Lost in the Middle”现象。因此，如何有效地压缩上下文，保留关键信息，就变得至关重要。今天，我们将重点介绍一种基于困惑度的上下文压缩方法，并使用LLMLingua框架来实现它。我们将从背景知识入手，逐步深入到代码实现和实验分析，希望能够帮助大家更好地理解和应用这一技术。 1. 上下文压缩的必要性与挑战在深入技术细节之前，我们首先要理解上下文压缩为什么如此重要。想象一下，你正在使用一个LLM来回答关于某个文档的问题。这个文档可能长达数百页，包含了大量的信息。如果我们将整个文档都作为上下文输入到LLM中，可能会遇到以下问题：计算成本高昂：LLM的处理时间和内存消耗与输入长度成正比。处理长文本会显著增加计算成本， …

继续阅读“Context Compression（上下文压缩）：利用LLMLingua通过困惑度筛选关键Token”

2025年11月22日

上下文学习（In-Context Learning）的贝叶斯解释：隐式推断预训练任务分布的机制

上下文学习的贝叶斯解释：隐式推断预训练任务分布的机制各位好，今天我们来深入探讨一个当前大型语言模型（LLM）领域的核心概念：上下文学习（In-Context Learning）。更具体地说，我们将从贝叶斯的角度来审视上下文学习，试图理解它是如何隐式地推断预训练任务的分布，并以此实现零样本或少样本的泛化能力。 1. 上下文学习：LLM涌现能力的基石在传统的机器学习范式中，模型需要经过显式的训练过程，即在大量标注数据上优化模型参数，才能执行特定任务。然而，大型语言模型展现出一种令人惊叹的能力：上下文学习。这意味着，LLM无需更新自身参数，仅仅通过在输入中提供一些示例（上下文），就能学会执行新的任务。例如，我们可以向LLM提供以下上下文：翻译成法语： English: The cat sat on the mat. French: Le chat était assis sur le tapis. English: The dog chased the ball. French: Le chien a poursuivi la balle. English: The bird fle …

继续阅读“上下文学习（In-Context Learning）的贝叶斯解释：隐式推断预训练任务分布的机制”

2025年11月22日

上下文压缩（Context Compression）：利用AutoCompressor等模型学习压缩Token表征

上下文压缩：利用AutoCompressor等模型学习压缩Token表征大家好，今天我们来深入探讨一个在大型语言模型（LLM）领域越来越重要的课题：上下文压缩，特别是利用AutoCompressor等模型学习压缩Token表征。随着LLM处理的上下文窗口不断增大，如何高效地利用有限的计算资源，同时保证模型性能，成为了一个关键挑战。上下文压缩正是在解决这个问题。 1. 上下文压缩的必要性在深入技术细节之前，我们首先要理解为什么需要上下文压缩。现代LLM，比如GPT-4、Claude等，都拥有非常大的上下文窗口，可以处理成千上万个Token。这为模型带来了强大的能力，例如可以理解更长的文档、进行多轮对话、处理复杂的推理任务等。然而，更大的上下文窗口也意味着更高的计算成本和内存需求。处理更长的序列需要更多的计算资源，而且并非所有的Token都同等重要。很多Token可能包含冗余信息，或者与当前任务无关。因此，上下文压缩的目标就是在不显著降低模型性能的前提下，减少需要处理的Token数量，从而降低计算成本、提高推理速度。 2. 上下文压缩的几种主要方法上下文压缩的方法多种多样，可以大 …

继续阅读“上下文压缩（Context Compression）：利用AutoCompressor等模型学习压缩Token表征”

2025年10月19日

Java应用的全链路追踪与分布式Context传递的实现细节

Java 应用全链路追踪与分布式 Context 传递大家好，今天我们来聊聊 Java 应用的全链路追踪与分布式 Context 传递。随着微服务架构的普及，一个请求往往需要经过多个服务才能完成，这使得问题排查变得异常困难。全链路追踪和 Context 传递就是解决这个问题的关键技术。 1. 全链路追踪的必要性与基本概念在单体应用时代，一个请求的执行路径通常比较简单，我们可以通过日志、调试等手段快速定位问题。但在微服务架构下，一个请求可能需要经过多个服务，每个服务又可能调用多个数据库、缓存等组件。如果某个环节出现问题，很难快速定位到具体是哪个服务或组件导致的。全链路追踪的核心思想是将一个请求的处理过程串联起来，形成一条完整的链路。通过对链路上的每个节点进行监控和记录，我们可以清晰地了解请求的执行路径、耗时、状态等信息，从而快速定位问题。全链路追踪涉及以下几个关键概念： Trace ID: 全局唯一的 ID，用于标识一次完整的请求链路。 Span ID: 用于标识链路中的一个单元，例如一个服务调用、一个数据库查询等。 Parent Span ID: 用于标识当前 Span 的父 …

继续阅读“Java应用的全链路追踪与分布式Context传递的实现细节”

2025年9月20日

如何使用`Context Managers`（`with`语句）来`管理`资源，并实现`enter`和`exit`方法。

好的，下面是一篇关于Python中Context Managers以及__enter__和__exit__方法的讲座式文章，内容详尽，包含代码示例，逻辑严谨，以正常人类的语言表述。 Python Context Managers：优雅的资源管理大家好，今天我们要深入探讨Python中的Context Managers，以及它们如何通过with语句优雅地管理资源。Context Managers是Python中一个强大的特性，它允许我们定义代码块，在代码块执行前后自动执行特定的操作，例如资源的分配和释放。这在处理文件、网络连接、锁等需要手动管理的资源时非常有用，可以避免资源泄露，提高代码的健壮性和可读性。什么是Context Managers？ Context Managers的核心思想是定义一个对象，该对象负责管理资源的生命周期。当进入with语句块时，Context Manager会执行一些初始化操作（例如打开文件），当退出with语句块时，它会执行清理操作（例如关闭文件），无论代码块是否正常执行完毕。这种机制基于两个关键方法：__enter__和__exit__。 __ent …

继续阅读“如何使用`Context Managers`（`with`语句）来`管理`资源，并实现`__enter__`和`__exit__`方法。”

2025年8月20日

Python高级技术之：`Flask`的上下文（`Context`）管理：`request context`和`application context`的生命周期。

大家好，我是你们今天的导游，将带领大家穿梭于Flask的上下文世界！准备好了吗？我们要开始一段奇妙的上下文之旅了！今天我们要聊的是Flask里两个非常重要的概念：请求上下文（request context）和应用上下文（application context）。它们就像Flask这座城市里流动的空气和坚固的地基，虽然看不见摸不着，但却支撑着整个应用的运行。一、为什么我们需要上下文？想象一下，你是一家咖啡店的服务员。当顾客来点餐时，你需要知道：是谁点的餐？（用户信息）他们点了什么？（请求数据）这家店叫什么名字？（应用配置）有什么优惠活动？（应用资源）在Flask的世界里，这些信息也需要被访问。但是，如果在每个函数里都传递这些信息，代码会变得非常臃肿难看。这时候，上下文就派上用场了！它就像一个“全局变量”，让你可以随时随地访问这些信息，而不用显式地传递。二、应用上下文（Application Context）应用上下文，顾名思义，就是与Flask应用本身相关的上下文。它存储了关于整个应用的信息，比如应用的配置、扩展等等。 2.1 应用上下文的生命周期应 …

继续阅读“Python高级技术之：`Flask`的上下文（`Context`）管理：`request context`和`application context`的生命周期。”

2025年8月18日

Python高级技术之：`Python`的`context manager`：`enter`和`exit`方法在资源管理中的作用。

各位观众老爷，大家好！今天给大家伙儿聊聊Python里一个非常有意思，但又经常被忽略的小秘密——Context Manager，也就是咱们常说的“上下文管理器”。这玩意儿，说白了，就是来帮你优雅地搞定资源管理的，让你的代码更干净、更安全，也更Pythonic。啥是资源管理？为啥要优雅地搞？咱们先来说说资源管理。在编程的世界里，资源可不是指你在游戏里攒的金币。这里的资源，指的是那些用了就得还回去的东西，比如：文件: 打开了总得关掉吧？网络连接: 连接建立了，不用了总得断开吧？数据库连接: 连上了数据库，操作完了总得释放连接吧？锁: 拿到了锁，用完了总得释放吧？要是你打开了文件，用完了忘了关，或者拿到了锁，用完了忘了放，那可就惨了。轻则程序运行效率下降，重则系统崩溃、数据丢失，甚至被黑客攻击，后果不堪设想。所以，资源管理非常重要。那为啥要优雅地搞呢？因为直接用try…finally虽然能保证资源被释放，但是代码看起来比较冗余，尤其是嵌套使用的时候，简直就是噩梦。 Context Manager闪亮登场！ Context Manager就是来拯救你的。它可以让你用一种 …

继续阅读“Python高级技术之：`Python`的`context manager`：`__enter__`和`__exit__`方法在资源管理中的作用。”

2025年7月22日

JS `Async Context` (提案) `Call Stack` `Capture` 与 `Propagation` 机制

各位观众老爷，大家好！今天咱们来聊聊 JavaScript 里那些“玄学”但又非常重要的东西：Async Context (异步上下文)，以及它背后的 Call Stack (调用栈) 、Capture (捕获) 和 Propagation (传播) 机制。准备好了吗？咱们开始！第一幕：什么是 Async Context? 别慌，先来点概念热身想象一下，你在一家繁忙的咖啡馆里点了一杯咖啡。你（context）告诉服务员（function call）你要一杯拿铁（data），然后你就去别的地方溜达了（asynchronous operation）。过了五分钟，你的咖啡做好了，服务员大声喊：“您的拿铁好了！”。问题来了：服务员怎么知道这杯咖啡是你的，而不是别人的？他们肯定记住了某种 "上下文"，例如你的脸、你的桌号等等。在 JavaScript 的世界里，Async Context 就像咖啡馆的服务员记住的那些信息。它允许异步操作（比如 setTimeout、fetch）在稍后执行时，仍然能够访问到它被调用时的 “上下文”。为啥我们需要 Asyn …

继续阅读“JS `Async Context` (提案) `Call Stack` `Capture` 与 `Propagation` 机制”

2025年7月20日

JS `Async Context` (提案) `Cancellation Token Propagation`：跨异步操作取消

各位观众，晚上好！今天给大家带来一场关于 JavaScript Async Context 提案中 Cancellation Token Propagation 的讲座，主题是：跨异步操作取消。别担心，听起来高大上，其实原理简单易懂，保证让各位听完之后，感觉自己也能参与到 TC39 的提案讨论中去了。 (开场白：先聊点儿“取消”的家常) 在开始正题之前，咱们先来聊聊生活中的“取消”。比如，你点了份外卖，结果半小时过去了还没送到，你可能想取消订单。或者，你下载一个大型游戏，眼看进度条走了 99%，突然发现流量不够了，你也想取消下载。在编程世界里，“取消”同样重要。比如，一个用户在搜索框输入关键词，你发起了一个网络请求去获取搜索结果。如果用户手速飞快，立马又修改了关键词，那你之前发起的请求就变得毫无意义，应该立即取消，释放资源。（进入正题：异步操作的取消难题）在同步的世界里，取消操作相对简单。就像你正在执行一个循环，突然想停止，直接 break 就行了。但是，在异步的世界里，事情就变得复杂起来。因为异步操作通常涉及多个函数调用，甚至跨越多个模块。那么，如何才能优雅地取消一个 …

继续阅读“JS `Async Context` (提案) `Cancellation Token Propagation`：跨异步操作取消”

2025年7月17日

JS `AsyncContext` (提案) `Context Propagation` 在 `Promise Chains` 中的行为

咳咳，大家好！今天咱们聊聊 JavaScript 里一个挺有意思，但又有点绕的概念：AsyncContext (提案) 和 Context Propagation 在 Promise Chains 里的表现。准备好，系好安全带，咱们要开始一场“异步上下文穿越之旅”了！啥是 AsyncContext？别慌，先喝口水首先，得明白 AsyncContext 是个啥玩意儿。简单来说，它就像一个“异步小书包”，可以让你在异步操作之间传递一些数据。想象一下，你写了一个复杂的异步程序，里面涉及各种 setTimeout、Promise、async/await。在这些异步操作中，你可能需要共享一些信息，比如用户 ID、请求 ID、或者一些配置信息。以前，你可能得靠全局变量，或者一层层地把这些信息作为参数传递下去。这样代码写起来不仅丑陋，而且容易出错，维护起来更是噩梦。 AsyncContext 就是为了解决这个问题而生的。 Context Propagation：让书包跟着 Promise 跑 Context Propagation 顾名思义，就是让这个“异步小书包”能够自动地在 …

继续阅读“JS `AsyncContext` (提案) `Context Propagation` 在 `Promise Chains` 中的行为”