JS `JavaScript Obfuscation` (代码混淆) 技术：字符串加密、控制流平坦化、死代码注入 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷，大家好！我是你们的老朋友，今天咱们不聊风花雪月，就来聊聊让代码“面目全非”的——JavaScript代码混淆技术。

开场白：代码安全，攻防博弈的永恒主题

话说江湖险恶，程序猿的世界也不太平。辛辛苦苦写的代码，一不小心就被别人“扒光了衣服”，心里肯定不是滋味。为了保护我们的劳动成果，各种代码保护技术应运而生，而JavaScript混淆就是其中一种常用的手段。

想象一下，你写了一段精妙绝伦的JavaScript代码，功能强大，逻辑复杂。但是，这段代码直接暴露在浏览器端，任何人都可以通过开发者工具轻松查看、复制甚至修改。这简直就像把你的秘密武器放在了敌人的眼皮底下，太危险了！

所以，我们需要给代码穿上“迷彩服”，让它变得难以理解，增加破解的难度。这就是代码混淆的意义。

第一节：字符串加密——让你的文字变成“乱码”

字符串是代码中最常见的数据类型，也是最容易被识别的信息之一。比如，API接口地址、版权信息、提示语等等，这些字符串如果直接暴露在代码中，很容易被攻击者利用。所以，字符串加密是混淆的第一步。

Base64编码：最基础的“加密”

Base64严格来说不算加密，只是一种编码方式，但它可以作为混淆的入门手段。

// 原始字符串
let originalString = "Hello, World!";

// Base64编码
let encodedString = btoa(originalString); // "SGVsbG8sIFdvcmxkIQ=="

// Base64解码
let decodedString = atob(encodedString); // "Hello, World!"

console.log("原始字符串:", originalString);
console.log("Base64编码:", encodedString);
console.log("Base64解码:", decodedString);

Base64的优势在于简单易用，但安全性很低，很容易被破解。

自定义编码：升级版的“加密”

我们可以自定义编码表，对字符串进行编码。例如：

let key = "abcdefghijklmnopqrstuvwxyz";

function encodeString(str) {
  let encoded = "";
  for (let i = 0; i < str.length; i++) {
    let char = str[i];
    let index = key.indexOf(char.toLowerCase()); // 转换为小写
    if (index !== -1) {
      encoded += key[(index + 5) % key.length]; // 简单的凯撒密码
    } else {
      encoded += char; // 非字母字符保持不变
    }
  }
  return encoded;
}

function decodeString(str) {
  let decoded = "";
  for (let i = 0; i < str.length; i++) {
    let char = str[i];
    let index = key.indexOf(char.toLowerCase());
    if (index !== -1) {
      decoded += key[(index - 5 + key.length) % key.length]; // 简单的凯撒密码
    } else {
      decoded += char;
    }
  }
  return decoded;
}

let originalString = "hello";
let encodedString = encodeString(originalString); // "mjqqt"
let decodedString = decodeString(encodedString); // "hello"

console.log("原始字符串:", originalString);
console.log("编码后的字符串:", encodedString);
console.log("解码后的字符串:", decodedString);

这种方式比Base64稍微复杂一些，但仍然不够安全，破解者可以通过分析编码表来破解。

AES、DES等对称加密算法：更安全的“加密”

对称加密算法使用相同的密钥进行加密和解密，安全性较高。但是，密钥必须安全地存储在客户端，这是个难题。

注意：在浏览器端直接使用AES、DES等加密算法需要引入相应的JavaScript库，例如crypto-js。

// 引入crypto-js库

function encryptString(str, key) {
  return CryptoJS.AES.encrypt(str, key).toString();
}

function decryptString(str, key) {
  const bytes = CryptoJS.AES.decrypt(str, key);
  return bytes.toString(CryptoJS.enc.Utf8);
}

let originalString = "This is a secret message.";
let key = "MySecretKey";

let encryptedString = encryptString(originalString, key);
let decryptedString = decryptString(encryptedString, key);

console.log("原始字符串:", originalString);
console.log("加密后的字符串:", encryptedString);
console.log("解密后的字符串:", decryptedString);

使用对称加密算法可以有效地保护字符串，但是密钥的管理非常重要。

eval/Function 混淆

将字符串放入eval或者Function中，让其动态执行，增加阅读难度。
```
let originalString = "console.log('Hello, World!');";

// eval混淆
eval(originalString);

// Function 混淆
let func = new Function(originalString);
func();
```
这种方式虽然简单，但是安全性很低，很容易被破解。而且eval有一定的安全风险，使用时需要谨慎。

第二节：控制流平坦化——让你的代码“弯弯绕绕”

控制流平坦化是一种更高级的混淆技术，它的目的是将代码的控制流程变得复杂，让攻击者难以理解代码的逻辑。

基本原理：状态机模式

控制流平坦化的核心思想是将代码拆分成多个小的代码块，然后使用一个状态机来控制代码块的执行顺序。

function obfuscatedFunction() {
  let state = "1";

  while (true) {
    switch (state) {
      case "1":
        // 代码块1
        console.log("开始执行...");
        state = "2";
        break;
      case "2":
        // 代码块2
        let x = 10;
        let y = 20;
        state = "3";
        break;
      case "3":
        // 代码块3
        let result = x + y;
        console.log("结果:", result);
        state = "4";
        break;
      case "4":
        // 代码块4
        console.log("执行结束.");
        return;
      default:
        return;
    }
  }
}

obfuscatedFunction();

在这个例子中，代码被拆分成了四个代码块，分别对应状态"1"、"2"、"3"和"4"。状态机通过switch语句来控制代码块的执行顺序。

增加复杂度：随机跳转

为了增加混淆的程度，我们可以引入随机性，让状态机的跳转变得更加复杂。

function obfuscatedFunction() {
  let state = "1";
  let random;

  while (true) {
    random = Math.random(); // 生成随机数

    switch (state) {
      case "1":
        console.log("开始执行...");
        state = random > 0.5 ? "2" : "3"; // 随机跳转
        break;
      case "2":
        let x = 10;
        let y = 20;
        state = "4";
        break;
      case "3":
        let a = 5;
        let b = 15;
        state = "4";
        break;
      case "4":
        let result = x ? x + y : a + b;
        console.log("结果:", result);
        state = "5";
        break;
      case "5":
        console.log("执行结束.");
        return;
      default:
        return;
    }
  }
}

obfuscatedFunction();

在这个例子中，状态"1"会根据随机数的结果跳转到状态"2"或"3"。这样一来，代码的执行路径就变得不确定了，增加了攻击者分析代码的难度。

更高级的技巧：混淆状态值

为了进一步增加混淆的程度，我们可以对状态值进行编码，让攻击者难以识别状态之间的关系。

function obfuscatedFunction() {
  let state = "abc"; // 混淆的状态值

  while (true) {
    switch (state) {
      case "abc":
        console.log("开始执行...");
        state = "def";
        break;
      case "def":
        let x = 10;
        let y = 20;
        state = "ghi";
        break;
      case "ghi":
        let result = x + y;
        console.log("结果:", result);
        state = "jkl";
        break;
      case "jkl":
        console.log("执行结束.");
        return;
      default:
        return;
    }
  }
}

obfuscatedFunction();

在这个例子中，状态值被替换成了字符串"abc"、"def"、"ghi"和"jkl"。攻击者需要分析代码才能确定状态之间的跳转关系。

第三节：死代码注入——让你的代码“鱼目混珠”

死代码是指永远不会被执行的代码。在代码中插入大量的死代码可以迷惑攻击者，让他们难以找到真正的逻辑。

简单的死代码：永远为假的条件语句

function obfuscatedFunction() {
  if (false) {
    // 这段代码永远不会被执行
    console.log("This will never be printed.");
  }

  console.log("Hello, World!");
}

obfuscatedFunction();

这种方式很简单，但也很容易被识别。

稍微高级的死代码：复杂的条件判断

function obfuscatedFunction() {
  let x = Math.random();
  if (x > 1) {
    // 这段代码几乎不可能被执行
    console.log("This is unlikely to be printed.");
  }

  console.log("Hello, World!");
}

obfuscatedFunction();

这种方式稍微复杂一些，但仍然比较容易被识别。

更高级的死代码：与真实代码混合

function obfuscatedFunction(input) {
  let result = 0;

  // 真实代码
  if (typeof input === "number") {
    result = input * 2;
  }

  // 死代码
  let y = Math.random();
  if (y < 0) {
    result = y * 3; // 永远不会被执行
  }

  return result;
}

console.log(obfuscatedFunction(10));

这种方式将死代码与真实代码混合在一起，增加了攻击者分析代码的难度。

利用try…catch 制造死代码

function obfuscatedFunction() {
  try {
    undefined.property; // 制造一个错误
  } catch (e) {
    // 这段代码只会在发生错误时执行
    console.log("Error occurred.");
    return;
  }

  // 如果没有发生错误，这段代码也会执行
  console.log("Hello, World!");
}

obfuscatedFunction();

由于undefined.property 肯定会报错，catch 块里的代码会被执行，try块后面的代码则不会被执行。

第四节：综合应用：打造你的专属“迷彩服”

单独使用任何一种混淆技术都可能被破解，因此，我们需要将多种技术结合起来，才能达到更好的效果。

function obfuscatedFunction(input) {
  // 1. 字符串加密
  let message = "This is a secret message.";
  let key = "MySecretKey";
  let encryptedMessage = encryptString(message, key);

  // 2. 控制流平坦化
  let state = "1";
  let result = 0;

  while (true) {
    switch (state) {
      case "1":
        // 3. 死代码注入
        if (Math.random() > 1) {
          console.log("This will never be printed.");
        }
        if (typeof input === "number") {
          state = "2";
        } else {
          state = "3";
        }
        break;
      case "2":
        result = input * 2;
        state = "4";
        break;
      case "3":
        result = -1;
        state = "4";
        break;
      case "4":
        // 解密字符串
        let decryptedMessage = decryptString(encryptedMessage, key);
        console.log(decryptedMessage);
        return result;
      default:
        return;
    }
  }
}

// 加密和解密函数（使用crypto-js库）
function encryptString(str, key) {
  return CryptoJS.AES.encrypt(str, key).toString();
}

function decryptString(str, key) {
  const bytes = CryptoJS.AES.decrypt(str, key);
  return bytes.toString(CryptoJS.enc.Utf8);
}

console.log(obfuscatedFunction(10));

在这个例子中，我们同时使用了字符串加密、控制流平坦化和死代码注入三种技术，大大增加了代码的复杂性。

第五节：混淆工具：事半功倍的利器

手动进行代码混淆非常繁琐，而且容易出错。幸运的是，有很多优秀的JavaScript混淆工具可以帮助我们完成这项工作。

工具名称	优点	缺点
JavaScript Obfuscator	开源免费，功能强大，支持多种混淆选项，包括变量重命名、字符串加密、控制流平坦化、死代码注入等。	某些高级功能可能需要付费使用。
UglifyJS	压缩代码，删除注释和空格，可以进行简单的变量重命名。	混淆能力较弱，容易被破解。
Jscrambler	功能非常强大，提供多层保护，包括代码变形、控制流平坦化、自卫代码等。	商业软件，价格较高。
Babel Minify	基于Babel，可以进行代码转换和压缩，支持一些混淆选项。	混淆能力有限，不如专业的混淆工具。

这些工具可以帮助我们自动化代码混淆的过程，大大提高效率。

结语：混淆不是万能的，但它是必要的

代码混淆并不是万能的，它不能完全阻止代码被破解。但是，它可以增加破解的难度，延长破解的时间，从而保护我们的代码。

混淆就像给房子装上防盗门和窗户，虽然不能保证小偷绝对进不来，但至少可以让他们多费一些功夫，增加被发现的风险。

在实际开发中，我们需要根据代码的重要性和安全性要求，选择合适的混淆策略和工具。

最后，记住一句至理名言：没有绝对的安全，只有相对的安全。

今天的讲座就到这里，谢谢大家！希望大家的代码都能穿上厚厚的“迷彩服”，安全无忧！

发表回复 取消回复

发表回复取消回复