缩放 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年11月23日

Diffusion-Transformer (DiT) 缩放定律：视频生成模型的计算量与生成质量的Scaling Law

Diffusion-Transformer (DiT) 缩放定律：视频生成模型的计算量与生成质量的Scaling Law 大家好，今天我们来深入探讨一下Diffusion-Transformer (DiT) 架构在视频生成领域中的缩放定律。缩放定律，简单来说，描述了模型的性能（例如生成视频的质量）如何随着计算资源的增加而变化。理解这些定律对于高效地训练和部署视频生成模型至关重要。我们将从Diffusion模型的基础概念开始，逐步深入到DiT架构，最终探讨其缩放定律以及如何在实践中应用这些定律。 1. Diffusion模型：从噪声到清晰 Diffusion模型是一类生成模型，其核心思想是将数据生成过程模拟为一个逐步去噪的过程。它分为两个主要阶段：前向扩散过程 (Forward Diffusion Process) 和反向扩散过程 (Reverse Diffusion Process)。 1.1 前向扩散过程: 在前向扩散过程中，我们逐渐向数据中添加高斯噪声，直到数据完全变成随机噪声。这个过程通常被建模为一个马尔可夫链： import torch import torch.nn.fun …

继续阅读“Diffusion-Transformer (DiT) 缩放定律：视频生成模型的计算量与生成质量的Scaling Law”

2025年11月23日

VeRA（Vector-based Random Matrix Adaptation）：冻结随机投影矩阵仅训练缩放向量

VeRA (Vector-based Random Matrix Adaptation): 冻结随机投影矩阵仅训练缩放向量大家好，今天我们要探讨一种高效的参数化技术，名为VeRA，全称Vector-based Random Matrix Adaptation。VeRA的核心思想是利用随机投影矩阵来降低模型的计算成本，同时只训练一个小的缩放向量，从而实现高效的模型微调和迁移学习。 1. 背景：参数化方法与效率挑战在深度学习领域，参数化方法是构建模型、进行训练和部署的关键。随着模型规模的不断扩大，参数量也随之增加，这给计算资源和存储带来了巨大的挑战。例如，大型语言模型（LLM）拥有数十亿甚至数万亿的参数，训练和部署这些模型需要大量的GPU资源和时间。传统的微调（Fine-tuning）方法需要更新所有模型参数，这在资源受限的环境下变得不可行。因此，近年来涌现出许多参数高效的微调方法，旨在只更新模型中的一小部分参数，同时保持甚至提高模型性能。常见的参数高效微调方法包括： Adapter Layers: 在预训练模型中插入少量的可训练层（Adapter），只更新这些Adapter的参数 …

继续阅读“VeRA（Vector-based Random Matrix Adaptation）：冻结随机投影矩阵仅训练缩放向量”

2025年11月23日

DARE（Drop And REscale）：通过随机丢弃Delta参数并重新缩放实现无损模型合并

DARE (Drop And REscale): 无损模型合并的技术解析大家好，今天我们来深入探讨一种新兴的模型合并技术：DARE (Drop And REscale)。这个方法的核心思想是通过随机丢弃Delta参数并重新缩放，来实现模型的无损合并。听起来有点抽象，但实际上它的原理并不复杂，而且在实践中展现出了强大的性能。模型合并的背景与挑战在深度学习领域，我们经常需要将多个模型的能力融合在一起。例如，我们可能想合并多个在不同数据集上训练的模型，或者将一个模型的不同版本进行合并，以提高模型的泛化能力和鲁棒性。传统模型合并方法，例如简单的权重平均（Weight Averaging），虽然简单易行，但往往会导致性能下降。这是因为不同的模型可能学到了不同的特征表示，直接平均它们的权重可能会破坏这些表示，导致模型性能受损。更高级的模型合并方法，例如知识蒸馏（Knowledge Distillation），虽然能取得更好的效果，但需要额外的训练过程，增加了计算成本。因此，我们需要一种更高效、更有效的模型合并方法，能够在不引入额外训练的情况下，尽可能地保留每个模型的知识，并最终提升合并后 …

继续阅读“DARE（Drop And REscale）：通过随机丢弃Delta参数并重新缩放实现无损模型合并”

2025年11月22日

Vera（Vector-based Random Matrix Adaptation）：冻结随机投影矩阵仅训练缩放因子的极致参数压缩

Vera：冻结随机投影矩阵仅训练缩放因子的极致参数压缩大家好，今天我们来探讨一种名为Vera（Vector-based Random Matrix Adaptation）的参数压缩技术。这个技术的核心思想是利用随机投影矩阵进行降维，并且冻结这个随机矩阵，仅训练一个缩放因子，从而实现极致的参数压缩。我们将深入了解Vera的原理、实现方法，以及它在实际应用中的优势和局限性。 1. 参数压缩的必要性与挑战在深度学习模型日益庞大的今天，参数压缩变得越来越重要。巨大的模型带来了一系列问题：存储空间需求高昂：存储大型模型需要大量的磁盘空间，尤其是在移动设备或嵌入式设备上，存储空间往往非常有限。计算资源消耗巨大：训练和推理大型模型需要大量的计算资源，这不仅增加了成本，也限制了模型在资源受限环境中的应用。部署难度增加：大型模型的部署更加复杂，需要更高的带宽和更快的网络连接。为了解决这些问题，研究人员提出了各种参数压缩技术，例如：剪枝 (Pruning)：移除模型中不重要的连接或神经元。量化 (Quantization)：使用更低精度的数据类型来表示模型参数。知识蒸馏 (Kn …

继续阅读“Vera（Vector-based Random Matrix Adaptation）：冻结随机投影矩阵仅训练缩放因子的极致参数压缩”

2025年11月22日

神经正切核（NTK）视角的缩放定律：无限宽网络极限下的学习动力学推导

神经正切核（NTK）视角的缩放定律：无限宽网络极限下的学习动力学推导大家好，今天我们来深入探讨一个深度学习领域的核心概念：神经正切核 (Neural Tangent Kernel, NTK)。我们将从 NTK 的基本原理出发，逐步推导出无限宽网络极限下的学习动力学，并最终解释缩放定律 (Scaling Laws) 如何在 NTK 框架下体现。 1. 神经网络与函数空间首先，我们需要明确神经网络的本质：它是一个参数化的函数。给定输入 x 和网络参数 θ，神经网络 f(x; θ) 输出一个预测值。深度学习的目标是找到一组最优参数 θ，使得 f(x; θ)* 尽可能接近真实函数。例如，一个简单的两层全连接神经网络可以表示为： import numpy as np def relu(x): return np.maximum(0, x) def neural_network(x, W1, b1, W2, b2): “”” 两层全连接神经网络。 Args: x: 输入向量 (shape: (input_dim,)). W1: 第一层权重矩阵 (shape: (hidden_dim, in …

继续阅读“神经正切核（NTK）视角的缩放定律：无限宽网络极限下的学习动力学推导”

2025年11月22日

YaRN（Yet another RoPE extension）：利用温度缩放修正熵变实现长上下文微调

YaRN：利用温度缩放修正熵变实现长上下文微调大家好，今天我们来深入探讨一个在长上下文语言模型微调中非常重要的技术——YaRN（Yet Another RoPE extension），它通过温度缩放来修正因 RoPE (Rotary Position Embedding) 外推而导致的熵变，从而提升长序列模型的性能。 1. 长上下文语言模型的挑战近年来，大型语言模型（LLMs）在各种自然语言处理任务中表现出色。然而，大多数LLMs的训练数据都限制在相对较短的上下文长度（例如，2048或4096个token）。当模型应用于超出训练范围的长序列时，性能往往会显著下降。这主要是因为：位置编码的外推问题：现有的位置编码方法，如绝对位置编码、相对位置编码，在超出训练长度时，要么失去意义，要么导致性能下降。RoPE作为一种流行的相对位置编码，在一定程度上缓解了这个问题，但外推到远大于训练长度的序列时，仍然面临性能衰退。注意力机制的复杂性：注意力机制的计算复杂度与序列长度呈平方关系，导致长序列推理的计算成本显著增加。信息丢失：当序列过长时，模型可能会丢失早期token的信息，导致长程 …

继续阅读“YaRN（Yet another RoPE extension）：利用温度缩放修正熵变实现长上下文微调”

2025年10月15日

探讨 CSS transform-origin 如何影响旋转与缩放的坐标基准

CSS Transform-Origin：旋转与缩放的坐标基准大家好！今天我们来深入探讨CSS transform-origin 属性，它在CSS变换中扮演着至关重要的角色。理解 transform-origin 对于精确控制元素旋转、缩放等变形效果至关重要。我们将通过代码示例、逻辑分析，详细剖析 transform-origin 如何影响坐标基准，从而更好地运用CSS变换。 1. 变换坐标系统的基础在理解 transform-origin 之前，我们首先要了解CSS变换的坐标系统。默认情况下，元素的变换中心点位于元素的中心。这意味着，当我们进行旋转、缩放等操作时，元素会围绕其中心点进行变形。transform-origin 的作用就是允许我们改变这个默认的变换中心点，从而改变变换的基准。考虑一个简单的例子：一个正方形。如果没有设置 transform-origin，旋转将围绕正方形的中心点进行。如果我们想让正方形围绕其左上角旋转，就需要使用 transform-origin 将变换中心点设置为左上角。 2. transform-origin 的语法与取值 transform-o …

继续阅读“探讨 CSS transform-origin 如何影响旋转与缩放的坐标基准”

2025年8月2日

如何在一个 Vue 应用中，实现一个可拖拽、可缩放的自由布局容器，并处理元素的吸附对齐和层级管理？

Vue 自由布局容器：拖拽、缩放、吸附对齐、层级管理，一个都不能少！各位观众老爷，大家好！欢迎来到今天的“手把手教你撸一个 Vue 自由布局容器” 特别节目。我是你们的老朋友，BUG制造机兼代码搬运工 —— 码农张三。今天咱们要解决一个相当有意思的问题：如何在 Vue 应用中，实现一个可拖拽、可缩放，还能吸附对齐，并且支持层级管理的自由布局容器？听起来是不是有点小激动？别怕，跟着我，保证你能从入门到入土… 哦不，是入行！ 1. 需求分析：我们要实现什么？在开始写代码之前，咱们先明确一下目标。想象一下，你需要做一个在线海报编辑器、或者一个酷炫的仪表盘，或者一个复杂的表单设计器。那么，你需要一个容器，可以让你在里面自由地摆放元素，调整大小，并且让它们像磁铁一样，自动对齐。还要能控制元素的上下层叠关系。具体来说，我们要实现以下功能：拖拽 (Draggable)：元素可以随意拖动到容器的任何位置。缩放 (Resizable)：元素可以调整大小。吸附对齐 (Snap to Grid/Elements)：元素在拖动或缩放时，可以自动吸附到网格线或其他元素边缘。层 …

继续阅读“如何在一个 Vue 应用中，实现一个可拖拽、可缩放的自由布局容器，并处理元素的吸附对齐和层级管理？”

2025年8月2日

如何设计并实现一个 Vue 组件，用于处理超大型图片的平移、缩放和标注功能，同时保证性能和流畅度？

各位观众老爷，大家好！我是今天的主讲人，专门负责让大家在Vue里头愉快地摆弄那些巨无霸图片，让它们乖乖听话，平移、缩放、标注，而且还得流畅得像丝绸一样。今天咱们就来聊聊怎么设计和实现这样一个Vue组件。一、需求分析：先摸清老板的需求在开始写代码之前，咱们得先把需求搞清楚，不然写出来的东西老板不喜欢，那可就白忙活了。所以，咱们先来分析一下这个组件应该具备哪些功能：图片加载：支持加载各种格式的图片（JPG, PNG, GIF, TIFF 等），并且要能处理超大型图片（比如几百 MB 甚至几个 GB）。平移：用户可以用鼠标拖拽图片，实现图片的平移。缩放：支持鼠标滚轮缩放和按钮缩放两种方式。标注：允许用户在图片上添加各种标注，比如矩形、圆形、文字等。性能：保证在超大型图片下，平移、缩放和标注操作的流畅性。交互：提供良好的用户交互体验。二、技术选型：选对工具事半功倍选对了技术，就等于成功了一半。对于这个超大型图片组件，我们需要考虑以下几个方面：图片渲染：由于是超大型图片，直接使用 <img> 标签肯定不行，性能会爆炸。我们需要使用 Canvas 来 …

继续阅读“如何设计并实现一个 Vue 组件，用于处理超大型图片的平移、缩放和标注功能，同时保证性能和流畅度？”

2025年7月31日

如何在一个 Vue 应用中，实现一个可拖拽、可缩放的自由布局容器，并处理元素的吸附对齐和层级管理？

各位观众，大家好！我是今天的主讲人，咱们今天来聊聊如何在 Vue 应用中打造一个炫酷的、自由拖拽缩放布局容器。这玩意儿可不是简单的 div 就能搞定的，我们需要一些巧劲儿和心思。准备好了吗？咱们这就开始！第一幕：舞台搭建——基础结构与 Vue 组件首先，我们需要一个 Vue 组件，作为我们自由布局容器的载体。这个组件负责管理所有可拖拽、可缩放的元素，以及处理吸附对齐和层级关系。 <template> <div class=”free-layout-container” @mousedown=”startDragContainer” @mouseup=”stopDragContainer” @mousemove=”dragContainer” :style=”{ width: containerWidth + ‘px’, height: containerHeight + ‘px’ }”> <draggable-item v-for=”item in items” :key=”item.id” :item=”item” @item-updated=”up …

继续阅读“如何在一个 Vue 应用中，实现一个可拖拽、可缩放的自由布局容器，并处理元素的吸附对齐和层级管理？”