CTE（Common Table Expressions）的使用与查询简化 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

CTE：查询界的瑞士军刀，代码界的诗和远方 🚀

各位观众老爷们，大家好！我是你们的老朋友，SQL界的段子手，代码世界的探险家。今天，咱们不聊高深的理论，也不谈复杂的算法，咱们来聊聊一个SQL里的小可爱，一个能让你的查询起飞，代码优雅的瑞士军刀——CTE (Common Table Expression)，也就是咱们常说的公用表表达式。

如果你觉得SQL写起来像裹脚布，一长串代码让人头晕眼花；如果你觉得复杂的查询逻辑像迷宫，绕来绕去找不到北；那么，请收好这份CTE秘籍，它将带你走出泥潭，走向诗和远方！

一、什么是CTE？它凭什么这么牛？🤔

简单来说，CTE就像SQL查询中的一个临时表或者视图，但它比临时表更轻量级，比视图更灵活。它只存在于当前的查询语句中，查询结束后就会自动消失，不会污染你的数据库。

想象一下，你在做饭，需要先把蔬菜切好，肉腌制一下，再开始炒菜。CTE就相当于你预处理食材的案板，切好的蔬菜和腌制好的肉就是CTE，它们只在这次做饭的过程中有用，做完饭就可以收起来了。

官方解释太枯燥？咱们换个接地气的说法：

CTE = 一次性的临时视图 = 简化复杂查询的秘密武器 = 代码可读性的救星

它之所以牛，是因为它拥有以下几个超能力：

化繁为简，让代码更易读： 复杂的查询逻辑可以分解成多个小的CTE，每个CTE负责一部分功能，就像搭积木一样，最终拼成一个完整的查询。这大大提高了代码的可读性和可维护性。
避免重复计算，提高性能： 如果某个计算逻辑在查询中多次使用，可以将其定义为一个CTE，然后在查询中多次引用，避免重复计算，提高查询效率。
实现递归查询，解决树形结构问题： CTE最强大的功能之一就是递归查询，它可以轻松解决诸如组织架构、目录结构等树形结构数据的查询问题。
支持自引用，实现更复杂的逻辑： CTE可以引用自身，这使得它可以实现一些更复杂的逻辑，比如计算累计值、排名等。

二、CTE的基本语法：简单到令人发指 😂

CTE的语法非常简单，核心就是 WITH 关键字：

WITH CTE_NAME AS (
    -- CTE的查询语句，就像一个普通的SELECT语句
    SELECT column1, column2, ...
    FROM table_name
    WHERE condition
)
-- 主查询，可以使用CTE_NAME作为表名来引用CTE
SELECT column1, column2, ...
FROM CTE_NAME
WHERE condition;

结构分析：

WITH CTE_NAME AS (...)：定义一个名为 CTE_NAME 的CTE，括号里面是CTE的查询语句。
SELECT ... FROM CTE_NAME ...：在主查询中，可以直接使用 CTE_NAME 作为表名来引用CTE的结果集。

简单示例：

假设我们有一个 employees 表，包含员工的姓名、部门和薪水，我们想找出薪水高于平均薪水的员工：

WITH AvgSalary AS (
    SELECT AVG(salary) AS avg_salary
    FROM employees
)
SELECT name, department, salary
FROM employees, AvgSalary
WHERE salary > AvgSalary.avg_salary;

在这个例子中，我们首先定义了一个名为 AvgSalary 的CTE，用于计算平均薪水。然后在主查询中，我们直接引用 AvgSalary 的结果，找出薪水高于平均薪水的员工。

三、CTE的实际应用：从入门到精通 💪

光说不练假把式，接下来，咱们通过几个实际的例子，来深入了解CTE的强大功能：

1. 化繁为简：分解复杂查询

假设我们需要查询每个部门薪水最高的员工姓名和薪水。如果没有CTE，我们可能需要使用子查询或者连接查询，代码会比较复杂：

-- 不使用CTE的实现（可能比较复杂）
SELECT e.name, e.salary, d.department_name
FROM employees e
JOIN departments d ON e.department_id = d.department_id
WHERE e.salary = (SELECT MAX(salary) FROM employees WHERE department_id = e.department_id);

使用CTE，我们可以将查询分解成两个步骤：

计算每个部门的最高薪水。
找出薪水等于该部门最高薪水的员工。

WITH DepartmentMaxSalary AS (
    SELECT department_id, MAX(salary) AS max_salary
    FROM employees
    GROUP BY department_id
)
SELECT e.name, e.salary, d.department_name
FROM employees e
JOIN departments d ON e.department_id = d.department_id
JOIN DepartmentMaxSalary dms ON e.department_id = dms.department_id AND e.salary = dms.max_salary;

看到了吗？使用了CTE之后，代码结构更加清晰，逻辑更加易懂。就像把一个复杂的问题分解成几个简单的小问题，逐个解决。

2. 避免重复计算：提高性能

假设我们需要查询每个部门薪水高于平均薪水的员工数量，并且还要显示平均薪水。如果没有CTE，我们可能需要在查询中多次计算平均薪水：

-- 不使用CTE的实现（可能存在重复计算）
SELECT d.department_name,
       (SELECT COUNT(*) FROM employees WHERE department_id = d.department_id AND salary > (SELECT AVG(salary) FROM employees WHERE department_id = d.department_id)) AS high_salary_count,
       (SELECT AVG(salary) FROM employees WHERE department_id = d.department_id) AS avg_salary
FROM departments d;

使用CTE，我们可以将平均薪水的计算放在CTE中，然后在查询中直接引用：

WITH DepartmentAvgSalary AS (
    SELECT department_id, AVG(salary) AS avg_salary
    FROM employees
    GROUP BY department_id
)
SELECT d.department_name,
       (SELECT COUNT(*) FROM employees WHERE department_id = d.department_id AND salary > das.avg_salary) AS high_salary_count,
       das.avg_salary
FROM departments d
JOIN DepartmentAvgSalary das ON d.department_id = das.department_id;

这样可以避免重复计算，提高查询效率。尤其是当平均薪水的计算逻辑非常复杂时，这种优势更加明显。

3. 实现递归查询：解决树形结构问题 🌳

这是CTE最强大的功能之一。假设我们有一个 categories 表，包含分类的ID、名称和父ID，我们需要查询某个分类的所有子分类：

CREATE TABLE categories (
    id INT PRIMARY KEY,
    name VARCHAR(255),
    parent_id INT NULL
);

INSERT INTO categories (id, name, parent_id) VALUES
(1, 'Electronics', NULL),
(2, 'Computers', 1),
(3, 'Laptops', 2),
(4, 'Desktops', 2),
(5, 'Smartphones', 1),
(6, 'Tablets', 1),
(7, 'Accessories', 1);

使用递归CTE，我们可以轻松实现这个功能：

WITH RECURSIVE SubCategories AS (
    -- 初始查询，选择根分类
    SELECT id, name, parent_id
    FROM categories
    WHERE id = 1  -- 假设要查询ID为1的分类的所有子分类
    UNION ALL
    -- 递归查询，选择根分类的子分类
    SELECT c.id, c.name, c.parent_id
    FROM categories c
    JOIN SubCategories sc ON c.parent_id = sc.id
)
SELECT id, name, parent_id
FROM SubCategories;

代码解析：

WITH RECURSIVE SubCategories AS (...)：定义一个名为 SubCategories 的递归CTE。
SELECT ... FROM categories WHERE id = 1：初始查询，选择根分类。
UNION ALL：将初始查询的结果和递归查询的结果合并。
SELECT ... FROM categories c JOIN SubCategories sc ON c.parent_id = sc.id：递归查询，选择根分类的子分类。sc 是 CTE 自身，通过 c.parent_id = sc.id 建立父子关系。

递归CTE的执行过程就像剥洋葱一样，一层一层地找到子分类，直到没有子分类为止。

4. 支持自引用：实现更复杂的逻辑

假设我们需要计算每个月的累计销售额。我们有一个 sales 表，包含销售日期和销售额：

CREATE TABLE sales (
    sale_date DATE,
    amount DECIMAL(10, 2)
);

INSERT INTO sales (sale_date, amount) VALUES
('2023-01-01', 100.00),
('2023-01-15', 150.00),
('2023-02-01', 200.00),
('2023-02-15', 250.00),
('2023-03-01', 300.00),
('2023-03-15', 350.00);

使用CTE，我们可以轻松实现这个功能：

WITH MonthlySales AS (
    SELECT
        DATE_TRUNC('month', sale_date) AS month,
        SUM(amount) AS monthly_amount
    FROM sales
    GROUP BY DATE_TRUNC('month', sale_date)
    ORDER BY month
),
CumulativeSales AS (
    SELECT
        month,
        monthly_amount,
        SUM(monthly_amount) OVER (ORDER BY month) AS cumulative_amount
    FROM MonthlySales
)
SELECT * FROM CumulativeSales;

在这个例子中，我们首先定义了一个 MonthlySales CTE，用于计算每个月的销售额。然后，我们定义了一个 CumulativeSales CTE，使用窗口函数 SUM(monthly_amount) OVER (ORDER BY month) 来计算累计销售额。

四、CTE的注意事项：小细节，大影响 🧐

虽然CTE很强大，但在使用时也需要注意一些细节：

CTE只能在当前查询中使用： CTE的作用域仅限于当前的查询语句，查询结束后就会自动消失。
CTE必须紧跟在 WITH 关键字之后： WITH 关键字必须是查询语句的第一个非注释语句。
CTE不能包含 ORDER BY 子句： 除非在CTE的最后使用 ORDER BY 子句，否则CTE内部不能包含 ORDER BY 子句。
CTE可以嵌套使用： 一个CTE可以引用另一个CTE，这使得我们可以构建更复杂的查询逻辑。
不同的数据库对CTE的支持程度可能不同： 有些数据库可能不支持递归CTE，或者对CTE的语法有所限制。

五、CTE的优势与劣势：理性看待，扬长避短 ⚖️

优势：

提高代码可读性： 将复杂的查询逻辑分解成多个小的CTE，使代码结构更加清晰，逻辑更加易懂。
避免重复计算： 可以将某个计算逻辑定义为一个CTE，然后在查询中多次引用，避免重复计算，提高查询效率。
实现递归查询： 可以轻松解决树形结构数据的查询问题。

劣势：

CTE是临时的： CTE只存在于当前的查询语句中，查询结束后就会自动消失。如果需要在多个查询中使用相同的逻辑，需要重复定义CTE。
性能问题： 在某些情况下，CTE可能会导致性能问题。特别是当CTE的查询逻辑非常复杂时，可能会影响查询效率。需要根据实际情况进行优化。
不同的数据库支持程度不同： 不同的数据库对CTE的支持程度可能不同。

六、总结：CTE，你值得拥有！ 🎉

总而言之，CTE是一个非常强大的SQL工具，它可以简化复杂查询，提高代码可读性，避免重复计算，实现递归查询。虽然在使用时需要注意一些细节，但只要掌握了CTE的精髓，你就可以在SQL的世界里自由翱翔，写出优雅高效的代码。

希望今天的分享能帮助大家更好地理解和使用CTE。记住，代码不仅仅是机器执行的指令，更是人与人沟通的桥梁。使用CTE，让你的代码更易读，更易懂，更具艺术性！

最后，送给大家一句代码界的至理名言：代码写的像诗一样，Bug也躲的远远的！ 😉

感谢大家的观看，咱们下期再见！

CTE：查询界的瑞士军刀，代码界的诗和远方 🚀

发表回复 取消回复

发表回复取消回复