JS Three.js / WebGL 渲染优化：高性能 3D 图形编程 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

嘿，大家好！我是你们今天的WebGL性能优化讲师。今天咱们就来聊聊Three.js里那些让你又爱又恨，但又不得不面对的性能问题。毕竟，谁也不想自己的3D应用卡成PPT，对吧？准备好了吗？Let’s dive in!

第一部分：WebGL渲染流水线速览（知己知彼，百战不殆）

想要优化性能，首先得知道性能瓶颈在哪儿。WebGL渲染流水线就像一条繁忙的生产线，每个环节都可能成为瓶颈。咱们先简单回顾一下这条流水线：

JavaScript代码： 这是你的大脑，负责组织场景、更新数据、控制动画。
顶点数据准备： 把你的3D模型的顶点位置、颜色、法线等等数据，打包成WebGL可以理解的格式（ArrayBuffer）。
顶点着色器（Vertex Shader）： 运行在GPU上，负责处理每个顶点的数据。通常用来做模型变换（移动、旋转、缩放），把顶点坐标转换到屏幕空间。
图元装配（Primitive Assembly）： 把顶点按照指定的顺序（三角形、线段等等）组装成图元。
光栅化（Rasterization）： 把图元转换成屏幕上的像素片段（Fragments）。
片段着色器（Fragment Shader）： 运行在GPU上，负责处理每个像素片段的颜色。光照、纹理、阴影等等都在这里计算。
像素操作： 把片段着色器的输出颜色写入帧缓冲区（Framebuffer）。这里会进行深度测试、混合等等操作。
显示： 把帧缓冲区的内容显示到屏幕上。

第二部分：性能瓶颈分析与优化策略（对症下药，药到病除）

现在咱们来逐个分析这些环节，看看哪里最容易出问题，以及如何解决。

1. JavaScript代码优化

问题： JavaScript代码执行慢，导致CPU占用过高，影响渲染帧率。
原因：
- 频繁创建和销毁对象。
- 复杂的逻辑计算。
- 不必要的循环。
- 内存泄漏。

优化策略：

对象池（Object Pooling）： 重用对象，避免频繁的new和delete操作。

// 创建一个对象池
const objectPool = {
    pool: [],
    create: function() {
        return this.pool.length > 0 ? this.pool.pop() : {}; // 替换为你的对象创建逻辑
    },
    release: function(obj) {
        this.pool.push(obj);
    }
};

// 使用对象池
let obj = objectPool.create();
// ... 使用 obj ...
objectPool.release(obj);

减少计算量： 尽量使用预计算的结果，避免重复计算。
Web Workers： 把耗时的计算任务放到Web Workers中，避免阻塞主线程。

// 创建一个 Web Worker
const worker = new Worker('worker.js');

// 发送数据给 Worker
worker.postMessage({ data: 'some data' });

// 接收 Worker 的消息
worker.onmessage = function(event) {
    console.log('Worker said: ', event.data);
};

// worker.js (Web Worker 代码)
self.onmessage = function(event) {
    const data = event.data;
    // 执行耗时计算
    const result = doSomeHeavyComputation(data);
    // 发送结果回主线程
    self.postMessage(result);
};

内存管理： 注意及时释放不再使用的对象，避免内存泄漏。使用 Chrome DevTools 的 Memory 选项卡来检查内存使用情况。
使用requestAnimationFrame优化动画： 确保动画更新与浏览器的刷新频率同步。

2. 顶点数据优化

问题： 传输大量的顶点数据到GPU会占用带宽，降低性能。
原因：
- 模型顶点数量过多。
- 顶点数据精度过高。
- 不必要的顶点属性。
优化策略：
- 模型简化： 减少模型顶点数量。可以使用 Blender、MeshLab等工具进行模型简化。
- 顶点数据压缩： 使用更低精度的数据类型，比如Float32Array代替Float64Array，Uint16Array代替Uint32Array。当然，精度降低可能导致视觉效果略微下降，需要权衡。
- 删除不必要的顶点属性： 如果你的着色器不需要某些顶点属性（比如颜色、法线），就不要传递它们。
- 使用索引缓冲（Index Buffer）： 对于共享顶点的模型，使用索引缓冲可以减少顶点数据的重复存储。
```
// 创建顶点缓冲
const geometry = new THREE.BufferGeometry();
const vertices = new Float32Array([
    // 第一个三角形
    -1.0, -1.0,  0.0,
     1.0, -1.0,  0.0,
     1.0,  1.0,  0.0,
    // 第二个三角形 (共享顶点)
    -1.0, -1.0,  0.0,
     1.0,  1.0,  0.0,
    -1.0,  1.0,  0.0
]);
geometry.setAttribute('position', new THREE.BufferAttribute(vertices, 3));

// 创建索引缓冲 (避免重复顶点)
const indices = new Uint16Array([
    0, 1, 2,  // 第一个三角形
    3, 4, 5   // 第二个三角形
]);
geometry.setIndex(new THREE.BufferAttribute(indices, 1));

const material = new THREE.MeshBasicMaterial({ color: 0xff0000 });
const mesh = new THREE.Mesh(geometry, material);
scene.add(mesh);
```
- 静态几何体批处理 (Static Batching)： 对于静态（不移动、不旋转、不缩放）的几何体，可以将它们合并成一个大的几何体，减少draw call。 Three.js 中可以使用 THREE.BufferGeometryUtils.mergeBufferGeometries 来合并几何体。

3. 顶点着色器优化

问题： 复杂的顶点着色器会增加GPU的负担，降低性能。
原因：
- 复杂的数学计算。
- 过多的纹理采样。
- 不必要的变量。
优化策略：
- 简化计算： 尽量使用简单的数学公式，避免复杂的计算。
- 预计算： 把一些可以在CPU上预计算的值，传递给顶点着色器。
- 减少纹理采样： 尽量避免在顶点着色器中进行纹理采样。
- 精简代码： 删除不必要的变量和计算。
- 使用#ifdef来编译不同版本的着色器： 根据不同的设备或性能需求，编译不同的着色器版本。
```
// 顶点着色器
#version 300 es
in vec3 position;
uniform mat4 modelViewMatrix;
uniform mat4 projectionMatrix;

void main() {
    gl_Position = projectionMatrix * modelViewMatrix * vec4(position, 1.0);

}
```

4. 片段着色器优化

问题： 片段着色器是渲染流水线中最耗时的环节之一，因为它需要处理每个像素片段。
原因：
- 复杂的光照计算。
- 大量的纹理采样。
- 过多的分支语句。

优化策略：

简化光照模型： 使用简单的光照模型，比如Lambert光照或Phong光照，代替复杂的PBR光照。

// 片段着色器
#version 300 es
precision highp float;

in vec3 vNormal;
in vec3 vPosition;

uniform vec3 lightPosition;
uniform vec3 lightColor;
uniform vec3 ambientColor;

out vec4 fragColor;

void main() {
    vec3 normal = normalize(vNormal);
    vec3 lightDir = normalize(lightPosition - vPosition);
    float diffuse = max(dot(normal, lightDir), 0.0);

    vec3 ambient = ambientColor;
    vec3 diffuseColor = lightColor * diffuse;
    vec3 finalColor = ambient + diffuseColor;

    fragColor = vec4(finalColor, 1.0);
}

减少纹理采样： 尽量使用低分辨率的纹理，或者使用纹理压缩技术（比如ASTC、ETC）。
烘焙光照贴图（Lightmap）： 把光照信息预先计算好，存储到纹理中，减少实时光照计算。
使用LOD（Level of Detail）： 对于距离较远的物体，使用低精度的模型和纹理。 Three.js 中可以使用 THREE.LOD 类来实现。

// 创建不同 LOD 级别的模型
const lod = new THREE.LOD();

const mesh1 = new THREE.Mesh(geometry1, material); // 高精度模型
const mesh2 = new THREE.Mesh(geometry2, material); // 中精度模型
const mesh3 = new THREE.Mesh(geometry3, material); // 低精度模型

// 添加 LOD 级别，并指定距离
lod.addLevel(mesh1, 0);   // 0距离开始显示高精度模型
lod.addLevel(mesh2, 20);  // 20距离开始显示中精度模型
lod.addLevel(mesh3, 50);  // 50距离开始显示低精度模型

scene.add(lod);

避免分支语句： 分支语句会导致GPU流水线停顿，尽量使用step()函数或mix()函数来代替。
后期处理优化： 后期处理效果（比如Bloom、Blur）会消耗大量的GPU资源，尽量减少后期处理效果的使用。
使用discard关键字要谨慎： discard会直接丢弃像素，如果大量使用会影响性能。尽量使用透明度来实现类似的效果。

5. 渲染设置优化

问题： 不合理的渲染设置会导致性能下降。
原因：
- 过高的分辨率。
- 开启不必要的特效（比如阴影、抗锯齿）。
- 过多的draw call。

优化策略：

降低分辨率： 在保证视觉效果的前提下，尽量降低分辨率。
关闭不必要的特效： 如果你的应用不需要阴影或抗锯齿，就不要开启它们。
控制draw call数量： 尽量减少draw call数量。可以使用THREE.InstancedMesh来绘制大量的相同模型，或者使用THREE.GeometryUtils.merge()来合并几何体。
Frustum Culling： 只渲染摄像机视野内的物体。Three.js 默认开启了 Frustum Culling，但你需要确保你的物体 bounding sphere 设置正确。
排序渲染： 先渲染不透明物体，再渲染透明物体。可以减少overdraw。

// 创建 InstancedMesh
const geometry = new THREE.BoxGeometry(1, 1, 1);
const material = new THREE.MeshBasicMaterial({ color: 0x00ff00 });
const count = 1000; // 实例数量
const mesh = new THREE.InstancedMesh(geometry, material, count);

// 设置每个实例的位置
const dummy = new THREE.Object3D();
for (let i = 0; i < count; i++) {
    dummy.position.set(Math.random() * 10, Math.random() * 10, Math.random() * 10);
    dummy.updateMatrix();
    mesh.setMatrixAt(i, dummy.matrix);
}

scene.add(mesh);

WebGLRenderer参数优化： 在创建WebGLRenderer时，可以设置一些参数来优化性能。

const renderer = new THREE.WebGLRenderer({
    antialias: false, // 关闭抗锯齿
    alpha: false,     // 关闭透明背景
    premultipliedAlpha: false, // 关闭预乘Alpha
    stencil: false,   // 关闭模板缓冲
    depth: true,      // 开启深度缓冲
    powerPreference: 'high-performance' // 尝试使用高性能GPU
});

第三部分：性能分析工具（工欲善其事，必先利其器）

光说不练假把式，咱们还得学会使用一些工具来分析性能瓶颈。

Chrome DevTools： Chrome DevTools 提供了强大的性能分析工具，可以用来分析 JavaScript 代码的执行时间、内存使用情况、渲染帧率等等。
- Performance 选项卡： 可以录制一段时间的性能数据，然后分析每一帧的耗时。
- Memory 选项卡： 可以用来检查内存使用情况，查找内存泄漏。
Spector.js： Spector.js 是一个 WebGL 调试工具，可以用来查看 WebGL 的状态、着色器代码、纹理等等。

Three.js Stats： Three.js Stats 是一个简单的性能监控工具，可以显示渲染帧率、内存使用情况等等。

// 引入 Stats
import Stats from 'three/examples/jsm/libs/stats.module.js';

// 创建 Stats 对象
const stats = new Stats();
document.body.appendChild(stats.dom);

// 在渲染循环中更新 Stats
function animate() {
    requestAnimationFrame(animate);
    renderer.render(scene, camera);
    stats.update();
}
animate();

第四部分：一些经验之谈（过来人的经验，少走弯路）

Early Optimization is the Root of All Evil： 不要过早优化，先确保你的应用功能正常，然后再进行性能优化。
Profile Before You Optimize： 在优化之前，先使用性能分析工具找到性能瓶颈。
Keep It Simple, Stupid (KISS)： 尽量使用简单的代码和模型，避免过度设计。
Mobile First： 如果你的应用需要在移动设备上运行，要特别注意性能优化。
持续监控： 性能优化是一个持续的过程，要定期监控应用的性能，及时发现和解决问题。

第五部分：优化案例分享（实践出真知）

优化策略	优化前帧率	优化后帧率	效果描述
模型简化	30	60	减少了模型顶点数量，降低了GPU的负担。
纹理压缩	45	60	使用了纹理压缩技术，减少了纹理占用的内存，提高了纹理采样速度。
InstancedMesh	20	60	使用InstancedMesh绘制了大量的相同模型，减少了draw call数量。
关闭阴影效果	40	60	关闭了阴影效果，减少了光照计算的复杂度。
使用LOD	35	60	使用LOD技术，对于距离较远的物体，使用低精度的模型，降低了GPU的负担。
使用对象池	50	60	避免了频繁创建和销毁对象，减少了垃圾回收的压力。
简化光照计算	48	60	使用了简单的光照模型，减少了光照计算的复杂度。
减少纹理采样	42	60	优化了Shader，减少了纹理采样次数。

总结：

WebGL性能优化是一个复杂的课题，需要不断学习和实践。希望今天的讲座能给你带来一些启发。记住，优化没有终点，只有更好！希望大家都能做出流畅丝滑的3D应用！

好了，今天的分享就到这里。大家有什么问题可以提问。下次有机会再见！

发表回复 取消回复

发表回复取消回复