JS `Object Spread` / `Destructuring` `Obfuscation` 与 `AST` 还原 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

嘿，大家好！今天咱们来聊点有意思的，关于 JavaScript 里 Object Spread 和 Destructuring 的 Obfuscation (混淆) 以及 AST (抽象语法树) 还原。这听起来像魔法，但其实都是技巧。

开场白：代码变形计

想象一下，你辛辛苦苦写了一段代码，想保护起来不让人轻易看懂。这就好比给代码穿上了一层迷彩服，让它看起来不像原来的样子。而混淆就是这件迷彩服的设计师。

Object Spread 和 Destructuring 是 JavaScript 里很方便的语法糖，用得多了，别人一眼就能看出你的代码逻辑。所以，混淆它们就显得很有必要了。

第一幕：Object Spread 的混淆术

Object Spread 允许你把一个对象的属性复制到另一个对象里，简洁明了。

const obj1 = { a: 1, b: 2 };
const obj2 = { ...obj1, c: 3 }; // obj2: { a: 1, b: 2, c: 3 }

那么，怎么混淆呢？我们可以用一些奇奇怪怪的方式来模拟 Object Spread 的效果，让代码看起来更复杂。

1. Object.assign() 大法

Object.assign() 也能实现类似的功能，但稍微冗长一点。

const obj1 = { a: 1, b: 2 };
const obj2 = Object.assign({}, obj1, { c: 3 }); // obj2: { a: 1, b: 2, c: 3 }

虽然只是换了个函数，但至少让代码看起来不那么“现代”了。

2. 手动复制，累死算求

最笨，但也是最有效的：手动复制每个属性。

const obj1 = { a: 1, b: 2 };
const obj2 = { a: obj1.a, b: obj1.b, c: 3 }; // obj2: { a: 1, b: 2, c: 3 }

这种方式简直是反人类，但对于混淆来说，绝对有效。代码量瞬间增加，可读性降到冰点。

3. 结合 reduce 的骚操作

这个方法需要用到 reduce，把一个对象变成另一个对象。

const obj1 = { a: 1, b: 2 };
const extraProps = { c: 3 };
const obj2 = Object.entries(obj1).reduce((acc, [key, value]) => {
  acc[key] = value;
  return acc;
}, extraProps); // obj2: { c: 3, a: 1, b: 2 }  注意顺序！

这种方式的优点是可以灵活地添加额外的属性，并且可以控制属性的顺序。

表格总结：Object Spread 混淆方案

方案	代码复杂度	可读性	效果	备注
`Object.assign()`	中等	较低	中等	稍微降低了代码的现代感
手动复制	高	非常低	高	代码量大幅增加，可读性极差
`reduce`	高	较低	高	灵活，可以控制属性顺序，但需要理解 `reduce`

第二幕：Destructuring 的障眼法

Destructuring 允许你从对象或数组中提取值，并赋给变量。

const obj = { x: 10, y: 20 };
const { x, y } = obj; // x: 10, y: 20

混淆 Destructuring 的目标是让提取值的过程变得不那么直观。

1. 直接访问属性

最简单的办法就是直接访问对象的属性。

const obj = { x: 10, y: 20 };
const x = obj.x;
const y = obj.y; // x: 10, y: 20

代码变得冗长，但混淆效果明显。

2. 借助临时变量

可以引入一些临时的、意义不明的变量来迷惑视线。

const obj = { x: 10, y: 20 };
const temp = obj;
const x = temp.x;
const y = temp.y; // x: 10, y: 20

temp 变量的作用是啥？鬼知道！

3. 嵌套访问，真假难辨

如果对象是嵌套的，可以故意增加嵌套的层级。

const obj = { nested: { x: 10, y: 20 } };
const temp = obj.nested;
const x = temp.x;
const y = temp.y; // x: 10, y: 20

这种方式可以制造出一种代码很复杂的假象。

4. 结合 eval 的黑魔法

eval 可以执行字符串形式的 JavaScript 代码，所以我们可以用它来动态地创建变量。

const obj = { x: 10, y: 20 };
eval(`var x = obj.x; var y = obj.y;`); // x: 10, y: 20

eval 慎用！它会带来安全风险，并且影响性能。但在混淆方面，它的效果确实很强大。

表格总结：Destructuring 混淆方案

方案	代码复杂度	可读性	效果	备注
直接访问属性	中等	较低	中等	代码冗长，可读性下降
临时变量	中等	较低	中等	引入了无意义的变量，增加理解难度
嵌套访问	高	非常低	高	制造代码复杂的假象
`eval`	高	非常低	非常高	慎用！存在安全风险，影响性能，但混淆效果极佳

第三幕：AST 还原术：拨开迷雾见真章

混淆的目的是让代码难以理解，但如果你想破解混淆，就需要用到 AST (抽象语法树) 还原技术。

AST 是代码的结构化表示，它把代码分解成一个个节点，每个节点代表一个语法单元。通过分析 AST，你可以理解代码的逻辑，并把混淆后的代码还原成原始的代码。

1. AST 简介

假设有这么一段简单的代码：

const x = 1 + 2;

它的 AST 可能是这样的 (简化版):

{
  "type": "Program",
  "body": [
    {
      "type": "VariableDeclaration",
      "declarations": [
        {
          "type": "VariableDeclarator",
          "id": {
            "type": "Identifier",
            "name": "x"
          },
          "init": {
            "type": "BinaryExpression",
            "operator": "+",
            "left": {
              "type": "Literal",
              "value": 1
            },
            "right": {
              "type": "Literal",
              "value": 2
            }
          }
        }
      ],
      "kind": "const"
    }
  ]
}

可以看到，AST 把代码分解成了 Program (程序), VariableDeclaration (变量声明), VariableDeclarator (变量声明符), Identifier (标识符), BinaryExpression (二元表达式), Literal (字面量) 等节点。

2. AST 工具

要操作 AST，你需要用到一些工具。常用的有：

acorn: 一个快速的 JavaScript 解析器，可以将 JavaScript 代码解析成 AST。
babel-parser: Babel 的解析器，功能更强大，支持最新的 JavaScript 语法。
estraverse: 一个 AST 遍历器，可以让你访问 AST 中的每个节点。
escodegen: 一个 AST 生成器，可以将 AST 转换成 JavaScript 代码。
recast: 一个 AST 转换工具，可以让你在修改 AST 的同时，保持代码的格式和注释。

3. 还原 Object Spread 的 AST

假设我们有这样一段混淆后的代码：

const obj1 = { a: 1, b: 2 };
const obj2 = Object.assign({}, obj1, { c: 3 });

我们的目标是把它还原成：

const obj1 = { a: 1, b: 2 };
const obj2 = { ...obj1, c: 3 };

步骤如下：

解析代码: 使用 acorn 或 babel-parser 将代码解析成 AST。
遍历 AST: 使用 estraverse 遍历 AST，找到 Object.assign 的调用。
替换节点: 将 Object.assign 的调用替换成 Object Spread 的语法。
生成代码: 使用 escodegen 或 recast 将 AST 转换成 JavaScript 代码。

代码示例 (使用 babel-parser, estraverse, escodegen):

const parser = require("@babel/parser");
const traverse = require("@babel/traverse").default;
const generate = require("escodegen").generate;
const t = require("@babel/types"); // 引入 types 模块

const code = `
const obj1 = { a: 1, b: 2 };
const obj2 = Object.assign({}, obj1, { c: 3 });
`;

const ast = parser.parse(code);

traverse(ast, {
  CallExpression(path) {
    if (path.node.callee.type === 'MemberExpression' &&
        path.node.callee.object.name === 'Object' &&
        path.node.callee.property.name === 'assign') {

      // 检查参数是否符合 Object.assign({}, obj1, { c: 3 }) 的模式
      if (path.node.arguments.length >= 2 && path.node.arguments[0].type === 'ObjectExpression' && path.node.arguments[0].properties.length === 0) {
        const properties = [];
        for (let i = 1; i < path.node.arguments.length; i++) {
          if (path.node.arguments[i].type === 'Identifier') {
            // 处理 { ...obj1 } 的情况
            properties.push(t.spreadElement(path.node.arguments[i]));
          } else if (path.node.arguments[i].type === 'ObjectExpression') {
            // 处理 { c: 3 } 的情况
            properties.push(...path.node.arguments[i].properties);
          }
        }

        // 创建 ObjectExpression 节点
        const newObjectExpression = t.objectExpression(properties);

        // 替换节点
        path.replaceWith(newObjectExpression);
      }
    }
  }
});

const output = generate(ast);
console.log(output);

4. 还原 Destructuring 的 AST

假设我们有这样一段混淆后的代码：

const obj = { x: 10, y: 20 };
const temp = obj;
const x = temp.x;
const y = temp.y;

我们的目标是把它还原成：

const obj = { x: 10, y: 20 };
const { x, y } = obj;

步骤类似：

解析代码: 使用 acorn 或 babel-parser 将代码解析成 AST。
遍历 AST: 使用 estraverse 遍历 AST，找到连续的变量声明和属性访问。
替换节点: 将变量声明和属性访问替换成 Destructuring 的语法。
生成代码: 使用 escodegen 或 recast 将 AST 转换成 JavaScript 代码。

代码示例 (使用 babel-parser, estraverse, escodegen):

const parser = require("@babel/parser");
const traverse = require("@babel/traverse").default;
const generate = require("escodegen").generate;
const t = require("@babel/types");

const code = `
const obj = { x: 10, y: 20 };
const temp = obj;
const x = temp.x;
const y = temp.y;
`;

const ast = parser.parse(code);

traverse(ast, {
  VariableDeclaration(path) {
    if (path.node.declarations.length === 1 &&
        path.node.declarations[0].init &&
        path.node.declarations[0].init.type === 'Identifier') {

      const tempVarName = path.node.declarations[0].id.name;
      const objVarName = path.node.declarations[0].init.name;

      // 查找后续的属性访问
      const nextStatements = [];
      let currentPath = path.parentPath.getNextSibling();
      while (currentPath) {
        if (currentPath.node.type === 'VariableDeclaration' &&
            currentPath.node.declarations.length === 1 &&
            currentPath.node.declarations[0].init &&
            currentPath.node.declarations[0].init.type === 'MemberExpression' &&
            currentPath.node.declarations[0].init.object.name === tempVarName) {
          nextStatements.push(currentPath);
        } else {
          break;
        }
        currentPath = currentPath.getNextSibling();
      }

      if (nextStatements.length > 0) {
        const properties = nextStatements.map(statement => {
          const propertyName = statement.node.declarations[0].init.property.name;
          const variableName = statement.node.declarations[0].id.name;
          return t.objectProperty(t.identifier(propertyName), t.identifier(variableName), false, true); // shorthand: true
        });

        // 创建 Destructuring 节点
        const pattern = t.objectPattern(properties);
        const newDeclaration = t.variableDeclaration('const', [t.variableDeclarator(pattern, t.identifier(objVarName))]);

        // 替换节点
        path.replaceWith(newDeclaration);

        // 删除后续的属性访问语句
        nextStatements.forEach(statement => statement.remove());
      }
    }
  }
});

const output = generate(ast);
console.log(output);

重要提示: AST 还原是一个复杂的过程，需要根据具体的混淆方式进行分析和处理。上面的代码只是简单的示例，实际情况可能会更加复杂。

第四幕：攻防之间的平衡

混淆和还原是一场永无止境的猫鼠游戏。混淆技术不断发展，还原技术也在不断进步。

混淆的目的是增加代码的复杂度，降低可读性。
还原的目的是理解代码的逻辑，恢复代码的可读性。

在实际应用中，需要根据具体的需求来选择合适的混淆方案，并采取相应的还原措施。

结尾：授人以渔不如授人以渔网

今天我们聊了 Object Spread 和 Destructuring 的混淆和 AST 还原。希望这些知识能帮助你在代码安全的道路上更进一步。记住，最重要的不是记住这些具体的技巧，而是理解其中的原理，这样才能在面对新的挑战时，灵活应对。

代码安全是一个持续学习的过程，需要不断探索和实践。祝大家编码愉快！

发表回复 取消回复

发表回复取消回复