hard - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

pnpm 的内容寻址存储（CAS）：硬链接如何节省磁盘空间各位开发者朋友，大家好！今天我们要深入探讨一个在现代包管理器中越来越重要的概念——内容寻址存储（Content-Addressable Storage, CAS），以及它如何通过硬链接（Hard Link）机制显著节省磁盘空间。我们将以 pnpm 为例，一步步揭开它的底层原理，并用代码和实际场景来说明为什么这个设计如此高效。一、什么是内容寻址存储（CAS）？传统包管理器如 npm 和 yarn 使用的是“依赖树式”安装策略，也就是说：每个项目都会独立地把所有依赖下载到自己的 node_modules 中；即使多个项目使用了同一个版本的包（比如 [email protected]），也会重复下载并占用磁盘空间；这种方式简单直观，但效率低下，尤其在大型团队或 CI/CD 环境中会浪费大量硬盘资源。而 pnpm 使用的内容寻址存储（CAS）模型则完全不同：每个文件内容唯一标识，只要内容一样，就只存储一份副本。这就像我们给每本书贴上唯一的 ISBN 编号，无论有多少人借阅这本书，物理上只需要一本即可。 CAS 的核心思想： …

继续阅读“Pnpm 的内容寻址存储（CAS）：硬链接（Hard Link）如何节省磁盘空间”

深度学习中的损失函数设计：硬性负样本挖掘（Hard Negative Mining）的实现策略大家好，今天我们来深入探讨深度学习中一个非常重要的概念：硬性负样本挖掘 (Hard Negative Mining)。在很多场景下，尤其是在目标检测、人脸识别等领域，数据的类别不平衡问题非常突出，即正样本数量远少于负样本数量。这会导致模型训练时，大部分负样本对损失函数的贡献微乎其微，而模型却被大量的简单负样本所淹没，无法有效地学习到区分正负样本的关键特征。硬性负样本挖掘就是为了解决这个问题而生。 1. 类别不平衡问题与传统损失函数的局限性在二分类问题中，我们通常使用交叉熵损失函数： import torch import torch.nn.functional as F def binary_cross_entropy(logits, labels): “”” 计算二元交叉熵损失。 logits: 模型输出的logits (未经过sigmoid)。 labels: 真实标签 (0或1)。 “”” return F.binary_cross_entropy_with_logits(logit …

继续阅读“深度学习中的损失函数设计：硬性负样本挖掘（Hard Negative Mining）的实现策略”