DOM 里的忍者：React 虚拟滚动与 GPU 内存优化艺术

各位好！

欢迎来到今天的“前端性能修炼课”。我是你们的讲师，一个在浏览器渲染管道里摸爬滚打多年的老兵。

今天，我们要聊的话题有点硬核，但极其重要。想象一下，你正在给老板演示一个“未来派”的电商后台，列表里展示着 100,000 条用户数据。你自信满满地点击了“加载全部”，然后……你的浏览器开始像得了帕金森一样疯狂抖动，CPU 占用率瞬间飙升至 100%，风扇转得像直升机起飞，最后，屏幕一黑，给你展示了一个充满哲理的“白屏”。

别慌，这并不是因为你的代码写得烂，而是因为你的 DOM 树里塞进了一头大象。今天，我们要学的这门绝技，就是——React 虚拟滚动。我们要用这招，把那头大象塞进冰箱，只给浏览器留个缝隙。

准备好了吗？让我们把那些无用的 DOM 节点统统扔进垃圾桶，开始这场关于“只渲染你看得见的东西”的技术之旅。

第一章：DOM 的噩梦——为什么渲染 10,000 个列表项就是犯罪？

首先，我们要搞清楚浏览器是个什么脾气。浏览器不是魔法师，它是个勤奋但笨拙的泥瓦匠。当你写下一行 <div>Item</div>，浏览器就要干三件事：

Layout（重排）：计算这个 div 在屏幕上的位置。就像你要在房间里摆放家具，你得先量尺寸，算好位置。
Paint（重绘）：根据计算好的位置，把颜色和背景涂上去。
Composite（合成）：把所有层拼起来，交给 GPU 处理，显示到屏幕上。

如果你有 10,000 个列表项，浏览器就得做 10,000 次布局计算，10,000 次重绘。这就像你要给 10,000 个客人发请柬，每一个都要重新排版、重新印刷，最后堆在桌子上，不仅浪费纸张（内存），还得让邮递员累死。

更糟糕的是，DOM 节点在内存里可是实打实的“肥肉”。每个节点都有属性、引用、事件监听器。当你渲染 10,000 个节点时，你的内存占用可能直接爆炸。对于移动端用户来说，这简直就是一场灾难——直接导致页面卡死，甚至被系统杀掉进程。

这时候，我们的主角登场了：虚拟滚动。

第二章：虚拟滚动的哲学——“懒”是一种美德

虚拟滚动的核心思想非常简单，简单到有点“流氓”：
“既然用户只能看到屏幕上的一小部分，那我为什么要把剩下的都渲染出来？”

这就好比你去逛一个巨大的博物馆。如果你真的把博物馆里所有的展品都拿出来摆在你面前，那你肯定走不动路，而且博物馆门口会被展品堵死。聪明的做法是：你只看眼前的几个展品，其他的展品都关在仓库里，等你走到下一个房间，再拿出来。

在代码里，这叫“按需渲染”。我们不再渲染整个 data 数组，而是只渲染 visibleStartIndex 到 visibleEndIndex 之间的那一小撮节点。

但是，这仅仅是第一步。如果只是简单地渲染几个节点，当你滚动时，列表会“闪烁”或者“跳动”，因为新节点插入的位置和旧节点不一样。所以，虚拟滚动必须配合一个核心技巧：DOM 复用。

第三章：DOM 复用与位移的艺术

这是虚拟滚动最迷人的地方。我们不需要为每个数据创建一个新的 <div>。相反，我们维护一个固定数量的容器（比如 20 个），然后通过 CSS 的 transform: translateY(-offset) 来移动它们。

这就好比我们手里只有 20 个快递员，但是有 100,000 个包裹要送。我们让快递员站在原地不动，通过移动包裹的位置来模拟他们“送货”的过程。对于浏览器来说，这 20 个快递员的位置没变，只有包裹动了，这大大降低了 GPU 的计算压力。

现在，让我们开始动手写代码。我们要不依赖任何第三方库，从零实现一个能跑的虚拟滚动组件。

3.1 基础版：静态高度列表

假设我们有一个超长的数组，每个列表项的高度都是固定的（比如 50px）。

import React, { useState, useEffect, useRef } from 'react';

// 模拟一个巨大的数据源
const generateData = (count) => {
  return Array.from({ length: count }, (_, i) => ({
    id: i,
    content: `Item ${i} - 这是一个非常长的内容，用来测试渲染性能`
  }));
};

const StaticHeightVirtualList = ({ itemHeight = 50, dataCount = 10000 }) => {
  const [data] = useState(() => generateData(dataCount));
  const [scrollTop, setScrollTop] = useState(0);
  const listContainerRef = useRef(null);

  // 1. 计算可视区域能容纳多少个元素
  const visibleCount = Math.ceil(listContainerRef.current?.clientHeight || 600 / itemHeight) || 10;

  // 2. 根据滚动位置，计算出应该渲染哪些元素
  const startIndex = Math.floor(scrollTop / itemHeight);
  const endIndex = Math.min(startIndex + visibleCount + 2, data.length); // +2 是为了缓冲区，防止滚动时闪烁

  // 3. 计算偏移量，让容器整体下移
  const offsetY = startIndex * itemHeight;

  // 4. 截取需要渲染的数据
  const visibleData = data.slice(startIndex, endIndex);

  return (
    <div 
      style={{ height: '600px', border: '1px solid #ccc', overflowY: 'auto', position: 'relative' }}
      ref={listContainerRef}
      onScroll={(e) => setScrollTop(e.target.scrollTop)}
    >
      {/* 遮罩层：用来遮挡不可见区域，保持背景色一致，防止出现空白 */}
      <div style={{ position: 'absolute', top: 0, left: 0, right: 0, height: offsetY, background: '#fff' }} />

      {/* 
        关键点：这里我们只渲染 visibleData，数量很少。
        但是容器的高度必须撑满，否则无法滚动。
      */}
      <div 
        style={{ 
          height: data.length * itemHeight, // 总高度必须设为真实总高度，保证滚动条位置正确
          width: '100%',
          position: 'relative',
          transform: `translateY(-${offsetY}px)` // 核心！利用 GPU 加速移动
        }}
      >
        {visibleData.map((item) => (
          <div key={item.id} style={{ height: itemHeight, borderBottom: '1px solid #eee' }}>
            {item.content}
          </div>
        ))}
      </div>
    </div>
  );
};

export default StaticHeightVirtualList;

代码深度解析（讲师划重点）：

listContainerRef: 我们通过 ref 拿到了那个“窗口”。我们需要知道窗口的高度，才能算出里面能装多少个 item。
offsetY: 这是魔法数字。它告诉浏览器：“嘿，虽然我只渲染了第 100 到 120 个元素，但请把它们在视觉上移动到第 100 到 120 的位置上”。
transform: translateY: 注意这里没用 top 属性！为什么？因为 top 会触发浏览器的 Layout（重排），这需要 CPU 大量参与计算位置。而 transform 只会触发 Composite（合成），这是在 GPU 层面做的。这就是我们降低 GPU 内存占用和提升性能的核心秘诀。
遮罩层: 这是一个小技巧。如果不加这个 div，当列表滚动到一半时，你会看到下面的空白区域，或者背景色不对，非常影响体验。遮罩层就像一个盖子，盖住了那些还没渲染出来的“乱码”。

第四章：进阶版——可变高度列表（这才是真实世界）

现实生活没那么美好。有的列表项是短文本，有的是长图，高度各不相同。这就难办了，我们没法用 itemHeight * index 来算位置了。

这时候，我们需要一个“累加器”。

4.1 核心算法：如何找到起始索引？

我们需要知道每个 item 到底有多高。假设我们有一个函数 getItemSize(index) 返回高度。

当滚动发生时，scrollTop 变了。我们要找到一个 startIndex，使得这个 startIndex 之前的所有 item 的总高度小于等于 scrollTop，而加上第 startIndex 个 item 之后的高度大于 scrollTop。

这听起来像是在找二叉树，或者二分查找。但为了性能，我们在 React 中通常用“线性扫描”或者“二分查找”。如果数据量极大（比如 10 万），线性扫描太慢，必须用二分查找。

让我们来实现一个支持可变高度的版本。

import React, { useState, useEffect, useRef, useMemo } from 'react';

// 假装我们有一个获取高度的函数
const getItemSize = (index) => {
  // 模拟：偶数项短，奇数项长
  return index % 2 === 0 ? 50 : Math.floor(Math.random() * 100) + 50;
};

const VariableHeightVirtualList = ({ dataCount = 10000 }) => {
  const [data] = useState(() => Array.from({ length: dataCount }, (_, i) => ({ id: i })));
  const [scrollTop, setScrollTop] = useState(0);
  const listContainerRef = useRef(null);

  // 1. 预计算所有项的高度，或者存储在一个 Map 里
  // 为了演示方便，我们这里直接用 useMemo 计算一个 sizes 数组
  const sizes = useMemo(() => data.map((_, i) => getItemSize(i)), [data.length]);

  // 2. 计算总高度
  const totalHeight = useMemo(() => sizes.reduce((acc, cur) => acc + cur, 0), [sizes]);

  // 3. 计算可视区域能容纳多少个元素
  const visibleCount = useRef(0);
  const [start, setStart] = useState(0);
  const [end, setEnd] = useState(0);
  const [offsetY, setOffsetY] = useState(0);

  // 核心算法：二分查找起始索引
  const calculateRange = (scrollTop, heights) => {
    let left = 0;
    let right = heights.length - 1;
    let startIndex = 0;

    // 这里的逻辑是找到第一个高度累加和超过 scrollTop 的索引
    // 这有点像“猜数字游戏”
    while (left <= right) {
      const mid = Math.floor((left + right) / 2);
      const midTop = heights.slice(0, mid).reduce((a, b) => a + b, 0);

      if (midTop < scrollTop) {
        left = mid + 1;
        startIndex = mid;
      } else {
        right = mid - 1;
      }
    }

    // 计算结束索引
    let currentTop = heights.slice(0, startIndex).reduce((a, b) => a + b, 0);
    let count = 0;

    while (currentTop < scrollTop + listContainerRef.current?.clientHeight && startIndex + count < heights.length) {
      currentTop += heights[startIndex + count];
      count++;
    }

    return { start: startIndex, end: startIndex + count, offsetY: heights.slice(0, startIndex).reduce((a, b) => a + b, 0) };
  };

  useEffect(() => {
    if (!listContainerRef.current) return;
    visibleCount.current = Math.ceil(listContainerRef.current.clientHeight / 50); // 估算值，用于二分查找的边界

    const { start: s, end: e, offsetY: o } = calculateRange(scrollTop, sizes);
    setStart(s);
    setEnd(e);
    setOffsetY(o);
  }, [scrollTop, sizes]);

  const visibleData = data.slice(start, end);

  return (
    <div 
      style={{ height: '600px', border: '1px solid #ccc', overflowY: 'auto', background: '#f5f5f5' }}
      ref={listContainerRef}
      onScroll={(e) => setScrollTop(e.target.scrollTop)}
    >
      <div 
        style={{ 
          height: totalHeight, 
          width: '100%',
          position: 'relative',
          transform: `translate3d(0, -${offsetY}px, 0)` // 使用 translate3d 开启硬件加速
        }}
      >
        {visibleData.map((item) => (
          <div key={item.id} style={{ height: getItemSize(item.id), borderBottom: '1px solid #ddd' }}>
            Item {item.id}
          </div>
        ))}
      </div>
    </div>
  );
};

export default VariableHeightVirtualList;

4.2 讲师点评：二分查找的威力

在 10 万条数据的情况下，线性扫描需要遍历 10 万次。而二分查找，每次只需要遍历 log2(100,000) ≈ 17 次！这不仅仅是性能的差距，这是“降维打击”。

但是，注意看代码里的 calculateRange 函数。每次滚动，我们都要重新计算。如果滚动事件触发频率很高（比如每秒 60 次），大量的数学计算会拖垮 CPU。

优化策略：我们可以把计算结果缓存起来。比如，记录上一次的 startIndex。如果当前的 scrollTop 还在上一次的范围内，就直接复用。只有当 scrollTop 跨越了一个 item 的边界时，才重新计算。这就叫“增量更新”。

第五章：GPU 内存与合成层

我们一直在强调性能，但到底什么是 GPU 内存占用？

当你使用 transform: translateY 时，浏览器会创建一个新的“合成层”。这就像是给这个元素单独开了一张显卡显存卡。对于少量的元素，这没问题。但如果你有 1000 个列表项，每个都开了合成层，显存就炸了。

如何优雅地管理 GPU？

不要滥用 will-change：虽然我们用了 transform，但不要在所有子元素上都写 will-change: transform，除非你确定它真的会动。
限制合成层数量：如果一个元素在屏幕上停留不动，就不要把它放在合成层里。
transform vs top：再次重申，永远用 transform。top 会导致浏览器重排，重排是 CPU 的活，会占用大量内存去计算布局树。

代码优化：防抖与节流

滚动事件是高频事件。如果你在 onScroll 里直接做 setState，可能会导致渲染过于频繁。

// 简单的防抖示例
const handleScroll = useDebounceFn((e) => {
  setScrollTop(e.target.scrollTop);
}, { wait: 100 });

通过节流，我们将每秒 60 次的触发降低到每秒 10 次，大大减轻了计算压力。

第六章：状态管理的陷阱——不要在渲染循环里创建函数

很多新手在实现虚拟列表时，喜欢在 map 循环里写 onClick={() => handleDelete(id)}。

// ❌ 错误示范：每次渲染都会创建 100 个新函数
{visibleData.map((item) => (
  <div onClick={() => deleteItem(item.id)}>...</div>
))}

在虚拟列表中，虽然我们只渲染了 20 个元素，但每次滚动，React 都会重新渲染这 20 个元素。这意味着，每次滚动，你都在创建 20 个新的箭头函数。对于 100,000 条数据，这简直是内存泄漏的温床。

正确做法：将函数提取到组件外部，或者使用 useCallback。

// ✅ 正确示范
const handleDelete = useCallback((id) => {
  console.log('Deleting', id);
}, []);

{visibleData.map((item) => (
  <div onClick={() => handleDelete(item.id)}>...</div>
))}

这能确保只有当 handleDelete 的依赖项变化时，函数才会更新，而不是每次滚动都更新。

第七章：实战演练——打造一个完美的 `react-window`

虽然我们手写了基础版，但在生产环境中，我们通常使用成熟的库，比如 react-window。它不仅处理了上述所有数学问题，还处理了动态高度、固定宽度、溢出隐藏等边缘情况。

安装：npm install react-window

import React from 'react';
import { FixedSizeList as List } from 'react-window';

const Row = ({ index, style }) => (
  <div style={style}>Item {index}</div>
);

const InfiniteScrollList = () => (
  <div style={{ height: 400, width: 300 }}>
    <List
      height={400}
      itemCount={100000} // 超大数量
      itemSize={35}
      width={300}
    >
      {Row}
    </List>
  </div>
);

export default InfiniteScrollList;

看，代码量少得可怜，但性能极其强悍。react-window 内部就是使用了我们刚才讲的 transform 技巧。

第八章：总结与终极心法

好了，各位听众，今天我们深入浅出地探讨了 React 虚拟滚动。

核心思想：只渲染可视区域，DOM 复用。
性能关键：使用 transform: translateY 触发 GPU 合成，避免 top 触发 CPU 重排。
算法难点：处理可变高度需要二分查找或累加器。
内存管理：防抖滚动事件，使用 useCallback 避免内存泄漏。

最后，我想送给大家一句话：

“在 Web 开发中，克制比激进更重要。不要把所有东西都塞进 DOM 里，学会‘懒’一点，只渲染你需要看到的。这才是通往高性能前端工程师的必经之路。”

现在，去优化你的那个卡顿的列表吧！让你的浏览器重新变得飞快，让你的用户为你鼓掌！下课！

React 虚拟滚动实现：在大规模列表渲染中通过 DOM 复用降低 GPU 内存占用的策略

DOM 里的忍者：React 虚拟滚动与 GPU 内存优化艺术

第一章：DOM 的噩梦——为什么渲染 10,000 个列表项就是犯罪？

第二章：虚拟滚动的哲学——“懒”是一种美德

第三章：DOM 复用与位移的艺术

3.1 基础版：静态高度列表

代码深度解析（讲师划重点）：

第四章：进阶版——可变高度列表（这才是真实世界）

4.1 核心算法：如何找到起始索引？

4.2 讲师点评：二分查找的威力

第五章：GPU 内存与合成层

代码优化：防抖与节流

第六章：状态管理的陷阱——不要在渲染循环里创建函数

第七章：实战演练——打造一个完美的 `react-window`

第八章：总结与终极心法

发表回复取消回复

DOM 里的忍者：React 虚拟滚动与 GPU 内存优化艺术

第一章：DOM 的噩梦——为什么渲染 10,000 个列表项就是犯罪？

第二章：虚拟滚动的哲学——“懒”是一种美德

第三章：DOM 复用与位移的艺术

3.1 基础版：静态高度列表

代码深度解析（讲师划重点）：

第四章：进阶版——可变高度列表（这才是真实世界）

4.1 核心算法：如何找到起始索引？

4.2 讲师点评：二分查找的威力

第五章：GPU 内存与合成层

代码优化：防抖与节流

第六章：状态管理的陷阱——不要在渲染循环里创建函数

第七章：实战演练——打造一个完美的 react-window

第八章：总结与终极心法

发表回复 取消回复

第七章：实战演练——打造一个完美的 `react-window`

发表回复取消回复