llvm - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2026年4月16日

C++ 静态单赋值（SSA）转换：探究 C++ 变量在 LLVM IR 阶段如何通过 Phi 节点实现路径汇聚优化

编译器心理治疗课：C++ 变量如何在 LLVM IR 里“分身”并通过 Phi 节点实现路径汇聚各位同学，大家晚上好！欢迎来到今天的编译器心理治疗课。我是你们的辅导员，一名在这个满是 0 和 1 的世界里摸爬滚打多年的资深编程专家。今天我们不谈代码怎么跑，我们谈谈代码的“心”。你们有没有过这种感觉？当你写 C++ 的时候，变量 x 就像是一个反复无常的情人。早上它叫 x，中午你给它赋值 5，下午你把它改成 10，晚上你又把它改成 20。在 C++ 的世界里，这叫“赋值”，叫“修改变量”。但在编译器的眼里，这叫“精神分裂”。编译器是个强迫症，它受不了 x 今天是 5，明天是 10。它想要的是“静态单赋值”（Static Single Assignment，简称 SSA）。在 SSA 的世界里，每个变量只能被定义一次。如果 x 被赋值了两次，它就必须改个名字，变成 x.1 和 x.2。这就像是你必须给每个情人起个独一无二的昵称，不能重复。但是，问题来了。如果你的程序像迷宫一样，有两个不同的路径通向同一个终点，一个路径里 x 变成了 5，另一个路径里 x 变成了 10。到了终点，那 …

继续阅读“C++ 静态单赋值（SSA）转换：探究 C++ 变量在 LLVM IR 阶段如何通过 Phi 节点实现路径汇聚优化”

2026年4月6日

C++ 静态单赋值（SSA）转换：探究 C++ 变量在 LLVM IR 阶段如何通过 Phi 节点实现路径汇聚优化

各位同仁、编程爱好者们，大家好！今天，我们将深入探讨一个在现代编译器优化领域至关重要的概念：静态单赋值（Static Single Assignment, SSA）形式。特别地，我们将聚焦于C++变量在LLVM中间表示（IR）阶段是如何被转换为SSA形式，以及Phi节点在其中扮演的关键角色，实现路径汇聚优化。这不仅是理解编译器如何将我们编写的高级C++代码转化为高效机器码的基石，也是深入掌握代码优化原理的必经之路。 1. 静态单赋值（SSA）形式：编译器优化的基石 1.1 什么是SSA？静态单赋值（SSA）是一种程序中间表示的特性，要求每个变量在程序文本中只被赋值一次。这与我们日常编程中常见的变量可以被多次赋值的模式截然不同。例如，在C++中，int x = 0; x = 1; x = x + 2; 这样的代码是完全合法的，变量 x 被赋值了三次。但在SSA形式中，这会被表示为： x_1 = 0; x_2 = 1; x_3 = x_2 + 2; 在这里，x_1, x_2, x_3 被视为不同的“版本”或“定义”的变量。每个版本只被赋值一次。 1.2 为什么需要SSA？ SSA形式的 …

继续阅读“C++ 静态单赋值（SSA）转换：探究 C++ 变量在 LLVM IR 阶段如何通过 Phi 节点实现路径汇聚优化”

2026年4月3日

C++ 抽象语法树（AST）重写：利用 LLVM LibTooling 实现 C++ 遗留代码中不安全类型转换的自动修复

尊敬的各位技术同仁：今天，我们将深入探讨一个在C++遗留代码维护中普遍存在的痛点：不安全类型转换。这些转换不仅是潜在的bug源头，也常常导致难以追踪的未定义行为，甚至安全漏洞。我们将一起探索如何利用强大的LLVM LibTooling框架，实现C++抽象语法树（AST）的自动重写，从而智能地识别并修复这些不安全的类型转换。 C++ 类型转换的挑战与风险 C++ 提供多种类型转换机制，从隐式转换到显式转换，每种都有其特定的用途和风险。在遗留代码中，由于历史原因、开发人员经验差异或对语言特性理解不足，不安全的类型转换常常被滥用，成为代码质量的隐患。 1. C风格类型转换（C-style Casts） C风格转换，如 (Type)expression，是C++中最灵活但也最危险的显式转换形式。它的危险性在于其多义性：一个C风格转换可能被编译器解释为 static_cast、const_cast、reinterpret_cast，甚至它们的组合，具体取决于上下文和涉及的类型。这种不明确性使得代码意图模糊，难以维护，并且极易引入错误。示例： // 示例1：C风格转换的歧义 struct Ba …

继续阅读“C++ 抽象语法树（AST）重写：利用 LLVM LibTooling 实现 C++ 遗留代码中不安全类型转换的自动修复”

2025年11月24日

JIT生成的汇编代码安全：利用LLVM的Control Flow Integrity (CFI) 保护机制

JIT 生成的汇编代码安全：利用 LLVM 的控制流完整性 (CFI) 保护机制各位听众，大家好。今天我们来探讨一个重要的安全课题：如何保护即时编译 (JIT) 生成的汇编代码，特别是利用 LLVM 的控制流完整性 (CFI) 保护机制。 JIT 编译技术在许多领域都有着广泛的应用，例如：动态语言的运行时优化： JavaScript、Python 等动态语言通常会在运行时进行代码优化，以提高执行效率。游戏引擎：游戏引擎会根据硬件配置和游戏场景动态生成渲染代码，以达到最佳性能。数据库系统：数据库系统可以根据查询语句动态生成执行计划，提高查询效率。机器学习框架：机器学习框架可以根据模型结构和数据特点动态生成计算代码，加速模型训练和推理。然而，JIT 编译也引入了新的安全风险。由于 JIT 编译器在运行时生成代码，这些代码可能会受到恶意攻击者的篡改，导致程序执行意外的行为，甚至造成安全漏洞。 JIT 编译带来的安全风险传统的安全防护手段，例如静态代码分析，对于 JIT 生成的代码往往失效，因为这些代码是在运行时动态生成的，无法提前进行分析。攻击者可以通过多种方式篡改 JI …

继续阅读“JIT生成的汇编代码安全：利用LLVM的Control Flow Integrity (CFI) 保护机制”