复现 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年11月16日

JAVA并发算法中伪共享导致性能崩溃的问题复现与优化

JAVA并发算法中伪共享导致性能崩溃的问题复现与优化大家好，今天我们来聊聊一个在并发编程中经常被忽视，但威力巨大的性能杀手：伪共享。它就像隐藏在代码深处的幽灵，悄无声息地吞噬着程序的性能，尤其是在高并发、多核 CPU 的环境下。什么是伪共享？要理解伪共享，首先要了解 CPU 的缓存体系。现代 CPU 为了提高数据访问速度，引入了多级缓存（L1、L2、L3 Cache）。这些缓存以缓存行（Cache Line）为单位进行管理，通常大小是 64 字节（这个值会因 CPU 架构而异，可以通过 sysconf(_SC_LEVEL1_DCACHE_LINESIZE) 获取）。伪共享指的是多个线程修改不同的变量，但这些变量却位于同一个缓存行中，导致缓存一致性协议（例如 MESI 协议）频繁生效，使得缓存行在多个 CPU 核心之间来回传递，从而降低性能。为了更好地理解，我们先看一个简单的例子： public class FalseSharing { private static final int NUM_THREADS = 4; private static final long ITE …

继续阅读“JAVA并发算法中伪共享导致性能崩溃的问题复现与优化”

2025年11月16日

JAVA ReentrantReadWriteLock出现写饥饿问题的复现与修复方式

JAVA ReentrantReadWriteLock 写饥饿问题：复现、分析与修复大家好，今天我们来深入探讨 ReentrantReadWriteLock 中一个常见却又容易被忽视的问题：写饥饿。ReentrantReadWriteLock 是一种允许并发读但只允许独占写的锁，在读多写少的场景下能显著提升性能。然而，如果不正确地使用它，就可能导致写线程长时间等待，甚至永远无法获得写锁，这就是所谓的写饥饿。一、ReentrantReadWriteLock 机制回顾首先，我们简单回顾一下 ReentrantReadWriteLock 的基本工作原理。读锁（Read Lock）：允许多个线程同时持有。只有在没有写锁被持有的情况下，读锁才能被获取。写锁（Write Lock）：是一种独占锁，一次只能被一个线程持有。在有读锁或写锁被持有的情况下，写锁不能被获取。重入性（Reentrancy）：读锁和写锁都支持重入。同一个线程可以多次获取读锁或写锁，而不需要释放之前的锁。这避免了死锁的发生。锁降级（Lock Downgrading）：持有写锁的线程可以降级为读锁，但反过来不 …

继续阅读“JAVA ReentrantReadWriteLock出现写饥饿问题的复现与修复方式”

2025年9月20日

如何使用`DVC`进行`数据`和`模型`的`版本控制`，实现`可复现`的`机器学习`。

使用 DVC 进行数据和模型版本控制，实现可复现的机器学习大家好！今天我们来聊聊如何使用 DVC (Data Version Control) 来进行数据和模型版本控制，从而实现可复现的机器学习流程。在机器学习项目中，保证实验的可复现性至关重要。这意味着我们不仅需要追踪代码的版本，还需要追踪数据、模型以及模型训练过程的配置。当其他人（或者未来的自己）尝试复现你的实验时，他们应该能够使用相同的数据、相同的模型和相同的训练参数，得到相同的结果。这听起来简单，但在实际操作中，却充满挑战。机器学习可复现性面临的挑战传统的版本控制系统，如 Git，非常适合代码的版本控制，但对于大型数据集和模型，却显得力不从心。主要体现在以下几个方面：存储限制: 大型数据集和模型会迅速膨胀 Git 仓库的大小，降低性能。版本追踪困难: Git 只能追踪文件的变化，无法理解文件内容的语义。例如，如果一个数据集中的某个样本被修改了，Git 只能告诉你文件被修改了，但无法告诉你哪个样本被修改了，以及修改了什么。依赖管理复杂: 机器学习项目通常依赖于各种各样的库和工具。手动管理这些依赖关系非常繁琐，容易 …

继续阅读“如何使用`DVC`进行`数据`和`模型`的`版本控制`，实现`可复现`的`机器学习`。”