解释 `Chromium DevTools Protocol` (`CDP`) 如何实现对浏览器行为的编程控制和自动化测试。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷们，大家好！今天咱就来聊聊这个听起来高大上，用起来真香的Chromium DevTools Protocol，也就是CDP。这玩意儿啊，就好比你给你的浏览器装了个遥控器，想让它干啥就干啥，简直不要太方便。咱们今天就好好扒一扒，看看这遥控器是怎么工作的，又能干些啥。

开场白：浏览器，你好骚啊！

说起浏览器，大家每天都在用。点点鼠标，看看网页，感觉一切尽在掌握。但实际上呢？浏览器内部运行着各种复杂的逻辑，渲染引擎、JS引擎、网络请求…… 简直就是一个黑盒子。

那我们能不能打开这个黑盒子，直接操控它呢？答案是：必须能！这就是CDP的意义所在。

啥是CDP？协议才是王道！

CDP，全称Chromium DevTools Protocol，直译过来就是“Chromium开发者工具协议”。简单来说，它就是一套通信协议，允许你通过编程的方式，控制基于Chromium内核的浏览器，比如Chrome、Edge等等。

你可以把它想象成一个翻译器，把你想要浏览器执行的命令，翻译成浏览器能听懂的语言，然后再把浏览器执行的结果，翻译成你能看懂的格式。

CDP能干啥？简直是万能的！

有了CDP，你就可以做很多之前想都不敢想的事情：

自动化测试：模拟用户行为，自动点击、输入、滚动，验证页面功能是否正常。这可是测试工程师的福音啊！
性能分析：监控页面加载速度、JS执行时间、内存使用情况，找出性能瓶颈。
爬虫：获取网页内容，提取关键信息。比传统的爬虫更强大，可以处理动态渲染的页面。
远程调试：在远程设备上调试网页，方便移动端开发。
各种骚操作：模拟地理位置、修改User-Agent、拦截网络请求，等等等等。只有你想不到，没有CDP做不到。

CDP的工作原理：请求-响应的艺术

CDP基于WebSocket协议进行通信。你需要先建立一个到浏览器的WebSocket连接，然后通过发送JSON格式的请求，来控制浏览器。浏览器收到请求后，会执行相应的操作，然后通过WebSocket连接，把结果以JSON格式返回给你。

简单来说，就是一个请求-响应的循环：

你： “浏览器，你给我打开https://www.example.com！” (发送JSON请求)
浏览器： “收到！正在打开……”
浏览器： “https://www.example.com已经打开了！” (发送JSON响应)

CDP的核心概念： Domains和Commands

CDP的功能被组织成一个个的Domain（域）。每个Domain都负责一部分功能，比如Page域负责页面操作，Network域负责网络请求，Runtime域负责JS执行等等。

每个Domain都包含一系列的Command（命令），你可以通过发送这些Command，来控制浏览器。比如，Page.navigate命令可以用来打开一个网页，Network.enable命令可以用来启用网络监控。

Domain	功能	常用Commands
`Page`	页面操作，比如打开网页、刷新页面、截图等等。	`Page.enable`, `Page.navigate`, `Page.reload`, `Page.captureScreenshot`, `Page.printToPDF`, `Page.getResourceTree`
`Network`	网络请求监控和拦截，比如查看请求头、修改请求内容、模拟网络延迟等等。	`Network.enable`, `Network.disable`, `Network.setRequestInterception`, `Network.getResponseBody`, `Network.emulateNetworkConditions`
`Runtime`	JS执行，比如执行JS代码、获取JS变量、调用JS函数等等。	`Runtime.enable`, `Runtime.disable`, `Runtime.evaluate`, `Runtime.callFunctionOn`, `Runtime.getProperties`
`DOM`	DOM操作，比如获取元素、修改元素属性、插入元素等等。	`DOM.enable`, `DOM.disable`, `DOM.getDocument`, `DOM.querySelector`, `DOM.querySelectorAll`, `DOM.setAttributeValue`, `DOM.getOuterHTML`, `DOM.removeNode`
`Emulation`	模拟各种环境，比如模拟设备、模拟地理位置、模拟屏幕大小等等。	`Emulation.setDeviceMetricsOverride`, `Emulation.clearDeviceMetricsOverride`, `Emulation.setGeolocationOverride`, `Emulation.clearGeolocationOverride`, `Emulation.setUserAgentOverride`
`Debugger`	JS调试，比如设置断点、单步执行、查看变量值等等。	`Debugger.enable`, `Debugger.disable`, `Debugger.setBreakpointByUrl`, `Debugger.pause`, `Debugger.resume`, `Debugger.stepOver`, `Debugger.stepInto`, `Debugger.stepOut`, `Debugger.getStackTrace`, `Debugger.getScriptSource`
`Console`	监听控制台输出，比如获取`console.log`、`console.error`等等。	`Console.enable`, `Console.disable`
`Target`	管理浏览器目标（Targets），比如页面、worker、扩展等等。	`Target.setDiscoverTargets`, `Target.attachToTarget`, `Target.detachFromTarget`, `Target.getTargetInfo`
`Log`	记录浏览器日志，比如网络请求日志、控制台日志等等。	`Log.enable`, `Log.disable`, `Log.startViolationsReport`, `Log.stopViolationsReport`
`Storage`	操作浏览器存储，比如Cookie、LocalStorage、SessionStorage等等。	`Storage.getCookies`, `Storage.setCookies`, `Storage.clearCookies`, `Storage.getLocalStorage`, `Storage.setLocalStorageItem`, `Storage.removeLocalStorageItem`, `Storage.clearLocalStorage`

代码实战： Hello CDP!

光说不练假把式，咱们来写个简单的例子，用CDP打开一个网页，然后截个图。

这里我们用Node.js来演示，需要安装两个包：

chrome-remote-interface：一个方便的CDP客户端库。
ws： WebSocket库。

npm install chrome-remote-interface ws

代码如下：

const CDP = require('chrome-remote-interface');
const fs = require('fs');

async function main() {
  let client;
  try {
    // 连接到Chrome
    client = await CDP({ port: 9222 }); // 确保Chrome是以调试模式启动的 (chrome --remote-debugging-port=9222)
    const { Network, Page } = client;

    // 启用Network和Page域
    await Network.enable();
    await Page.enable();

    // 监听页面加载完成事件
    Page.loadEventFired(async () => {
      console.log('Page loaded!');

      // 截图
      const screenshot = await Page.captureScreenshot({ format: 'png' });
      const buffer = Buffer.from(screenshot.data, 'base64');
      fs.writeFileSync('screenshot.png', buffer);

      console.log('Screenshot saved!');

      // 关闭连接
      await client.close();
    });

    // 打开网页
    await Page.navigate({ url: 'https://www.example.com' });

  } catch (err) {
    console.error('Error:', err);
    if (client) {
      await client.close();
    }
  }
}

main();

代码解释：

CDP.connect({port: 9222})：连接到Chrome的调试端口。默认是9222，如果你的Chrome不是用这个端口启动的，需要修改。
const {Network, Page} = client;：获取Network和Page域的接口。
await Network.enable(); 和 await Page.enable();：启用这两个域。
Page.loadEventFired(async () => { ... });：监听Page.loadEventFired事件，这个事件会在页面加载完成后触发。
await Page.captureScreenshot({format: 'png'});：截取屏幕截图，格式为PNG。
fs.writeFileSync('screenshot.png', buffer);：将截图保存到文件。
await Page.navigate({url: 'https://www.example.com'});：打开https://www.example.com。
await client.close();：关闭连接。

运行代码：

确保你的Chrome浏览器是以调试模式启动的：

chrome --remote-debugging-port=9222

或者你也可以在启动Chrome的时候加上这个参数：

/Applications/Google Chrome.app/Contents/MacOS/Google Chrome --remote-debugging-port=9222

运行上面的Node.js代码：
```
node your_script_name.js
```
运行成功后，你会在当前目录下看到一个名为screenshot.png的图片，这就是https://www.example.com的截图。

进阶用法：自动化测试的利器

CDP在自动化测试方面有着强大的应用。你可以用它来模拟用户行为，比如点击按钮、输入文本、滚动页面等等，然后验证页面功能是否正常。

这里我们用CDP来模拟一个简单的登录流程：

const CDP = require('chrome-remote-interface');

async function main() {
  let client;
  try {
    client = await CDP({ port: 9222 });
    const { Network, Page, Runtime, DOM } = client;

    await Network.enable();
    await Page.enable();
    await Runtime.enable();
    await DOM.enable();

    // 打开登录页面
    await Page.navigate({ url: 'your_login_page_url' });
    await Page.loadEventFired();

    // 找到用户名输入框
    const usernameSelector = '#username'; // 替换成你的用户名输入框的CSS选择器
    const usernameNodeId = await DOM.querySelector({ selector: usernameSelector, nodeId: 1 }); //nodeId:1 代表根节点，即整个document

    // 输入用户名
    const usernameValue = 'your_username';
    await Runtime.evaluate({
      expression: `document.querySelector('${usernameSelector}').value = '${usernameValue}'`
    });

    // 找到密码输入框
    const passwordSelector = '#password'; // 替换成你的密码输入框的CSS选择器
    const passwordNodeId = await DOM.querySelector({ selector: passwordSelector, nodeId: 1 });

    // 输入密码
    const passwordValue = 'your_password';
    await Runtime.evaluate({
      expression: `document.querySelector('${passwordSelector}').value = '${passwordValue}'`
    });

    // 找到登录按钮
    const loginButtonSelector = '#login-button'; // 替换成你的登录按钮的CSS选择器
    const loginButtonNodeId = await DOM.querySelector({ selector: loginButtonSelector, nodeId: 1 });

    // 点击登录按钮
    await Runtime.evaluate({
      expression: `document.querySelector('${loginButtonSelector}').click()`
    });

    // 等待页面跳转
    await new Promise(resolve => setTimeout(resolve, 2000)); // 等待2秒，根据实际情况调整

    // 获取当前页面URL
    const { result } = await Runtime.evaluate({ expression: 'window.location.href' });
    const currentURL = result.value;

    // 验证是否登录成功
    if (currentURL === 'your_success_page_url') { // 替换成你的登录成功后的页面URL
      console.log('Login successful!');
    } else {
      console.log('Login failed!');
    }

    await client.close();

  } catch (err) {
    console.error('Error:', err);
    if (client) {
      await client.close();
    }
  }
}

main();

代码解释：

DOM.querySelector({selector: '#username', nodeId: 1})：通过CSS选择器找到用户名输入框的DOM节点。 nodeId: 1 表示从根节点开始查找。
Runtime.evaluate({expression: 'document.querySelector("#username").value = "your_username"'})：执行JS代码，设置用户名输入框的值。
Runtime.evaluate({expression: 'document.querySelector("#login-button").click()'})：执行JS代码，点击登录按钮。
await new Promise(resolve => setTimeout(resolve, 2000));：等待2秒，给页面跳转留出时间。
Runtime.evaluate({expression: 'window.location.href'})：获取当前页面的URL。
if (currentURL === 'your_success_page_url') { ... }：验证是否登录成功。

注意事项：

CSS选择器：确保你的CSS选择器是正确的，能够唯一地找到目标元素。
等待时间：页面跳转需要时间，你需要根据实际情况调整等待时间。
错误处理：在实际项目中，需要加入更完善的错误处理机制。

CDP的局限性：并不是万能的

虽然CDP很强大，但它也不是万能的。

依赖Chromium内核：只能控制基于Chromium内核的浏览器。
协议复杂： CDP协议比较复杂，学习曲线比较陡峭。
兼容性问题：不同版本的Chrome可能有不同的CDP协议，需要注意兼容性。
性能损耗：通过CDP控制浏览器，会带来一定的性能损耗。

总结：拥抱CDP，开启自动化新世界！

总而言之，Chromium DevTools Protocol是一个非常强大的工具，可以让你以编程的方式控制浏览器，实现各种自动化操作。无论是自动化测试、性能分析、爬虫还是其他骚操作，CDP都能帮你轻松搞定。

当然，学习CDP需要一定的成本，需要你了解CDP协议，熟悉各个Domain和Command的用法。但一旦你掌握了它，你就会发现，它真的是一个非常值得学习的工具。

好了，今天的讲座就到这里。希望大家能够拥抱CDP，开启自动化新世界！谢谢大家！

发表回复 取消回复

发表回复取消回复