JS `WebRTC` `AV1/VP9` 视频编解码器优化与实时通信质量 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷，大家好！今天咱们来聊聊WebRTC里AV1/VP9这对“好基友”视频编解码器，以及怎么让它们在实时通信里表现得更好，让你的视频通话更流畅，就像丝般顺滑，而不是卡成PPT。

WebRTC与视频编解码：它们之间的爱恨情仇

WebRTC，全名Web Real-Time Communication，简单说就是让浏览器拥有实时通信能力的技术。想象一下，以前你要视频聊天，得装个QQ、微信啥的，现在有了WebRTC，直接在浏览器里就能搞定，多方便！

但是，浏览器怎么知道该怎么处理视频数据呢？这就得靠视频编解码器了。视频编解码器就像翻译官，把摄像头捕捉到的原始视频数据（体积巨大，像个胖子）压缩成适合网络传输的格式（瘦身成功，变型男），然后在接收端再把压缩后的数据还原成视频画面。

WebRTC支持多种视频编解码器，比如H.264，VP8，VP9，AV1等等。今天咱们重点关注VP9和AV1。

VP9和AV1：后起之秀的逆袭之路

H.264曾经是视频编码界的扛把子，但VP9和AV1这两位后起之秀，凭借着更高的压缩率和更好的图像质量，正在逐渐取代H.264的地位。

VP9：谷歌出品，必属精品？

VP9是谷歌开发的开放且免版税的视频编解码器。它的优点是：
- 压缩率高： 相同画质下，VP9比H.264能节省更多的带宽。
- 免版税： 用起来不用担心被收专利费。
- 支持多种分辨率和帧率： 适应各种场景。
AV1：更胜一筹的后来者

AV1是Alliance for Open Media（AOMedia）联盟开发的，成员包括谷歌、苹果、微软、亚马逊、Netflix等等。AV1的目标是取代VP9，成为下一代开放免版税的视频编解码标准。它的优点是：
- 压缩率更高： 相同画质下，AV1比VP9能节省更多的带宽。
- 图像质量更好： 细节更丰富，画面更清晰。
- 免版税： 这是必须的。
但是，AV1的缺点也很明显：
- 编码复杂度高： 需要更强大的计算资源。这意味着编码和解码都需要消耗更多的CPU。

为什么要在WebRTC里用VP9和AV1？

说了这么多，那么为什么要在WebRTC里用VP9和AV1呢？答案很简单：为了省带宽和提高用户体验。

省带宽： 在网络条件不好的情况下，使用VP9或AV1可以降低视频码率，保证视频通话的流畅性。
提高用户体验： 在网络条件好的情况下，使用VP9或AV1可以提供更高质量的视频画面，让用户看得更爽。

WebRTC中的VP9/AV1配置与优化

接下来，我们来聊聊如何在WebRTC里配置和优化VP9和AV1，让它们发挥出最大的威力。

启用VP9/AV1编解码器

在WebRTC中，默认情况下可能没有启用VP9/AV1编解码器。你需要手动启用它们。这可以通过修改SDP（Session Description Protocol）来实现。

SDP是描述多媒体会话的协议。它包含了编解码器、网络地址、端口号等信息。在WebRTC协商过程中，双方会交换SDP信息，以确定使用哪些编解码器。

以下是一个简单的JavaScript代码示例，演示如何设置VP9编解码器：

// 获取 PeerConnection 对象
const pc = new RTCPeerConnection();

// 创建 Offer (或者 Answer)
pc.createOffer()
  .then(offer => {
    // 修改 SDP
    const sdp = offer.sdp;
    const vp9PayloadType = findVP9PayloadType(sdp);

    if (vp9PayloadType) {
      const newSdp = forceCodecPreference(sdp, 'VP9', vp9PayloadType);
      offer.sdp = newSdp;
    }

    pc.setLocalDescription(offer);
  })
  .catch(error => {
    console.error('Failed to create offer:', error);
  });

//辅助函数
function findVP9PayloadType(sdp) {
    const lines = sdp.split('rn');
    for (const line of lines) {
        if (line.startsWith('a=rtpmap:') && line.includes('VP9/')) {
            return line.substring(9, line.indexOf(' '));
        }
    }
    return null;
}

function forceCodecPreference(sdp, codec, payloadType) {
    const lines = sdp.split('rn');
    let mLineIndex = -1;
    for (let i = 0; i < lines.length; i++) {
        if (lines[i].startsWith('m=video')) {
            mLineIndex = i;
            break;
        }
    }
    if (mLineIndex === -1) {
        return sdp;
    }

    let payloadTypes = lines[mLineIndex].split(' ').slice(3);
    if (payloadTypes.includes(payloadType)) {
        payloadTypes = [payloadType].concat(payloadTypes.filter(pt => pt !== payloadType));
        lines[mLineIndex] = lines[mLineIndex].split(' ').slice(0, 3).concat(payloadTypes).join(' ');
    }

    return lines.join('rn');
}

这段代码的主要作用是：

找到SDP中VP9的Payload Type。
将VP9的Payload Type移动到m=video行的最前面，以强制WebRTC优先使用VP9编解码器。

对于AV1，代码类似，只需要把VP9换成AV1即可。

调整编码参数

VP9和AV1都提供了很多编码参数，可以根据实际情况进行调整，以获得最佳的性能。常用的参数包括：
- 码率（Bitrate）： 码率越高，视频质量越好，但需要的带宽也越高。可以根据网络状况动态调整码率。
- 帧率（Framerate）： 帧率越高，视频越流畅，但需要的计算资源也越多。一般来说，30fps就足够了。
- 分辨率（Resolution）： 分辨率越高，视频越清晰，但需要的带宽和计算资源也越多。
- 编码器预设（Encoder Preset）： 编码器预设决定了编码的速度和质量之间的平衡。不同的预设会影响CPU的占用率。例如，veryfast预设编码速度快，但质量稍差；veryslow预设编码速度慢，但质量最好。
- 丢包恢复（Packet Loss Resilience）： 开启丢包恢复功能可以提高在网络状况不佳时的视频质量，但会增加带宽消耗。
WebRTC提供了一些API来设置这些参数。例如：
```
const pc = new RTCPeerConnection();

pc.addTransceiver('video', { direction: 'sendrecv' });

pc.onnegotiationneeded = async () => {
    try {
        const offer = await pc.createOffer();
        await pc.setLocalDescription(offer);

        // 获取视频 track
        const videoTrack = pc.getTransceivers()[0].sender.track;
        const sender = pc.getSenders().find(s => s.track === videoTrack);

        if (sender) {
            const parameters = sender.getParameters();
            parameters.encodings[0].maxBitrate = 1000000; // 设置最大码率为 1Mbps
            parameters.encodings[0].maxFramerate = 30; // 设置最大帧率为 30fps
            await sender.setParameters(parameters);
        }

        // 将 offer 发送给对方
    } catch (e) {
        console.error(e);
    }
};
```
这段代码设置了视频的最大码率和最大帧率。
码率控制

码率控制是保证视频通话质量的关键。在网络状况良好的情况下，可以提高码率，提供更高质量的视频画面。在网络状况不佳的情况下，应该降低码率，以保证视频通话的流畅性。

WebRTC提供了一些码率控制算法，例如：
- GCC (Google Congestion Control)： WebRTC默认的码率控制算法。
- NADA (Network-Assisted Dynamic Adaptation)： 一种基于网络的码率控制算法。
你可以根据实际情况选择合适的码率控制算法。
硬件加速

VP9和AV1的编码复杂度都很高，如果使用纯软件编码，会消耗大量的CPU资源。如果你的设备支持硬件加速，可以启用硬件加速，以减轻CPU的负担。

WebRTC会自动检测设备是否支持硬件加速，并尽可能使用硬件加速。你也可以手动配置硬件加速。

例如，在Chrome浏览器中，你可以通过以下方式启用硬件加速：
- 打开 chrome://flags
- 搜索 "Hardware-accelerated video decode" 和 "Hardware-accelerated video encode"
- 将它们设置为 "Enabled"
- 重启浏览器

实时通信质量优化策略

除了配置和优化VP9/AV1编解码器之外，还有一些其他的策略可以提高实时通信质量。

网络优化

网络是实时通信的基础。优化网络可以显著提高视频通话质量。一些常用的网络优化策略包括：
- 使用有线网络： 有线网络比无线网络更稳定。
- 避免使用公共Wi-Fi： 公共Wi-Fi通常比较拥堵，容易出现丢包和延迟。
- 优化Wi-Fi配置： 确保Wi-Fi路由器的固件是最新的，并使用WPA3加密。
- 使用QoS (Quality of Service)： QoS可以为实时通信数据分配更高的优先级，保证其传输质量。
拥塞控制

拥塞是指网络中的数据包过多，导致延迟和丢包。拥塞控制是指采取一些措施来缓解拥塞，提高网络利用率。

WebRTC内置了一些拥塞控制算法，例如：
- AIMD (Additive Increase Multiplicative Decrease)： 一种常用的拥塞控制算法。
- BBR (Bottleneck Bandwidth and RTT)： 谷歌开发的拥塞控制算法，可以更好地利用带宽。
丢包恢复

丢包是指数据包在传输过程中丢失。丢包会导致视频画面出现马赛克和卡顿。丢包恢复是指采取一些措施来恢复丢失的数据包，提高视频质量。

常用的丢包恢复技术包括：
- FEC (Forward Error Correction)： 发送冗余数据，以便在接收端恢复丢失的数据包。
- ARQ (Automatic Repeat Request)： 接收端请求发送端重新发送丢失的数据包。
WebRTC支持FEC。
Jitter Buffer

Jitter是指数据包到达时间的波动。 Jitter会导致视频画面出现卡顿。 Jitter Buffer是指在接收端缓存一定数量的数据包，以平滑Jitter。

WebRTC会自动调整Jitter Buffer的大小。
自适应码率调整

根据网络状况动态调整码率，可以在保证视频通话流畅性的前提下，提供尽可能高的视频质量。

WebRTC内置了自适应码率调整算法。

总结

WebRTC里的VP9和AV1编解码器是提高实时通信质量的利器。通过合理的配置和优化，可以充分发挥它们的优势，让你的视频通话更流畅，更清晰。当然，除了编解码器之外，网络、拥塞控制、丢包恢复等因素也会影响实时通信质量。综合考虑这些因素，才能打造出最佳的实时通信体验。

代码示例补充

为了更清晰地展示如何调整编码参数，这里提供一个更完整的代码示例，包括如何获取 RTCRtpSender 对象，以及如何设置 scalabilityMode （只针对AV1）：

async function setVideoEncodingParameters(pc, bitrate, framerate, scalabilityMode) {
    const videoTrack = pc.getTransceivers().find(t => t.mid === 'video').sender.track;
    const sender = pc.getSenders().find(s => s.track === videoTrack);

    if (!sender) {
        console.warn("Video sender not found.");
        return;
    }

    const parameters = sender.getParameters();

    // 设置码率和帧率
    if (parameters.encodings && parameters.encodings.length > 0) {
        parameters.encodings[0].maxBitrate = bitrate;
        parameters.encodings[0].maxFramerate = framerate;
    } else {
        console.warn("Encoding parameters not found or empty.");
        return;
    }

    // 设置 scalabilityMode (仅适用于 AV1)
    if (scalabilityMode && parameters.codecs) {
        const av1Codec = parameters.codecs.find(codec => codec.mimeType === 'video/AV1');
        if (av1Codec) {
            av1Codec.scalabilityMode = scalabilityMode;  // 例如: 'L1T2', 'L1T3'
        } else {
            console.warn("AV1 codec not found. Scalability mode not set.");
        }
    }

    try {
        await sender.setParameters(parameters);
        console.log("Video encoding parameters updated successfully.");
    } catch (e) {
        console.error("Failed to set video encoding parameters:", e);
    }
}

// 如何调用这个函数：
// 假设 pc 是你的 RTCPeerConnection 对象
// 1. 设置码率 1Mbps， 帧率 30fps
// await setVideoEncodingParameters(pc, 1000000, 30);
// 2. 设置码率 1Mbps, 帧率 30fps,  AV1 scalabilityMode 为 L1T2
// await setVideoEncodingParameters(pc, 1000000, 30, 'L1T2');

这个例子更完整地展示了如何找到 RTCRtpSender 对象，然后设置编码参数。注意 scalabilityMode 是AV1特有的参数，用于控制空间和时间可伸缩性。 L1T2表示一个空间层和两个时间层，L1T3表示一个空间层和三个时间层。选择合适的scalabilityMode可以提高AV1在不同网络条件下的适应性。

最后的提醒

兼容性： VP9和AV1的兼容性不如H.264，在一些老旧设备上可能不支持。
测试： 在实际部署之前，一定要进行充分的测试，以确保VP9/AV1能够正常工作。
持续优化： 实时通信技术在不断发展，要持续关注最新的技术动态，并不断优化你的WebRTC应用。

好了，今天的讲座就到这里。希望大家都能用好VP9和AV1，打造出更流畅、更清晰的实时通信体验！谢谢大家！

发表回复 取消回复

发表回复取消回复