CTE（Common Table Expressions）的使用与查询简化 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

CTE，查询界的瑞士军刀：化繁为简，优雅查询的葵花宝典

各位亲爱的码农、数据工匠们，晚上好！我是你们的老朋友，今天咱们来聊聊SQL查询界的一位神秘人物——CTE（Common Table Expressions），中文名叫“公共表表达式”。

各位先别打哈欠，虽然名字听起来有点学术范儿，但它可不是那种只会出现在教科书里的花架子。CTE就像一把瑞士军刀，在复杂查询中能化繁为简，让你的SQL语句变得更易读、更易维护，还能让你在同事面前装X成功，简直是居家旅行、提升逼格的必备良品！😎

为什么要用CTE？难道我已经写的SQL不够“精妙”了吗？

咳咳，我先声明，没有说你的SQL不够精妙的意思哈。但是，想象一下，你正在解决一个非常复杂的问题，需要从多个表中提取数据，进行各种复杂的计算，最终得到你想要的结果。你写啊写，写了一大堆嵌套的子查询，代码如同缠绕在一起的意大利面，自己过两天都看不懂了。

这时候，CTE就能派上用场了！

传统的子查询的痛点：

可读性差： 嵌套层次深，逻辑分散，让人头昏眼花，阅读体验极差。
维护性差： 修改其中一部分逻辑，可能需要牵一发而动全身，改起来胆战心惊。
性能问题： 有些数据库优化器对嵌套子查询的优化效果不佳，可能导致性能下降。

CTE的优势：

提高可读性： 将复杂的查询分解成多个逻辑清晰的小块，每个CTE就像一个独立的“模块”，方便理解和维护。
增强代码复用性： CTE可以在同一个查询中多次引用，避免重复编写相同的逻辑。
简化递归查询： CTE可以用于递归查询，解决诸如组织结构、树形结构等问题。
潜在的性能优化： 虽然不是绝对的，但有些情况下，CTE可以帮助数据库优化器更好地执行查询。

用一句话概括：CTE让复杂的SQL查询变得更像是一篇结构清晰的文章，而不是一堆乱七八糟的草稿。

CTE的基本语法：一点都不难，比泡咖啡简单多了！☕

CTE的语法非常简单，只需要掌握几个关键词就OK了：

WITH CTE_Name AS (
    -- CTE的查询语句，可以是一个SELECT，也可以是其他查询语句
)
SELECT ... FROM CTE_Name ...; -- 在主查询中使用CTE

WITH CTE_Name AS (…): 这是CTE的定义部分。WITH关键字表示我们要定义一个或多个CTE。CTE_Name是CTE的名字，你可以随便起，但最好起一个有意义的名字，方便理解。AS (...)括号里就是CTE的查询语句，它定义了CTE的数据集。
SELECT … FROM CTE_Name …: 这是主查询部分。你可以在主查询中像使用普通表一样使用CTE。

举个栗子：

假设我们有两个表：

Customers (CustomerID, CustomerName, City): 存储客户信息。
Orders (OrderID, CustomerID, OrderDate, TotalAmount): 存储订单信息。

我们想要查询每个城市订单总金额超过1000元的客户数量。

没有CTE的做法 (嵌套子查询)：

SELECT COUNT(*)
FROM (
    SELECT c.City
    FROM Customers c
    JOIN Orders o ON c.CustomerID = o.CustomerID
    GROUP BY c.City
    HAVING SUM(o.TotalAmount) > 1000
) AS CityOrders;

使用CTE的做法：

WITH CityOrders AS (
    SELECT c.City, SUM(o.TotalAmount) AS TotalAmount
    FROM Customers c
    JOIN Orders o ON c.CustomerID = o.CustomerID
    GROUP BY c.City
)
SELECT COUNT(*)
FROM CityOrders
WHERE TotalAmount > 1000;

对比一下，是不是觉得使用CTE的代码更加清晰易懂？我们将计算每个城市订单总金额的逻辑封装在CityOrders CTE中，然后在主查询中直接使用这个CTE，代码结构一目了然。

CTE的进阶用法：解锁更多姿势，让你在数据世界里自由飞翔！🚀

CTE不仅仅可以用于简单的查询，还可以用于更复杂的场景，例如：

1. 多个CTE：像搭积木一样构建复杂的查询

你可以同时定义多个CTE，每个CTE负责不同的逻辑，然后在主查询中将它们组合起来，就像搭积木一样，构建出复杂的查询。

WITH
    HighValueCustomers AS (
        SELECT CustomerID
        FROM Orders
        GROUP BY CustomerID
        HAVING SUM(TotalAmount) > 5000
    ),
    RecentOrders AS (
        SELECT CustomerID, MAX(OrderDate) AS LastOrderDate
        FROM Orders
        GROUP BY CustomerID
        HAVING MAX(OrderDate) > DATE('now', '-3 months')
    )
SELECT c.CustomerID, c.CustomerName
FROM Customers c
JOIN HighValueCustomers hvc ON c.CustomerID = hvc.CustomerID
JOIN RecentOrders ro ON c.CustomerID = ro.CustomerID;

这个例子中，我们定义了两个CTE：HighValueCustomers用于筛选高价值客户，RecentOrders用于筛选最近有订单的客户。然后在主查询中，我们将这两个CTE与Customers表连接起来，查询出既是高价值客户，又是最近有订单的客户。

2. 递归CTE：挑战无限层级，解锁树形结构的秘密

递归CTE是一种特殊的CTE，它可以在自己的定义中引用自身，用于处理具有层级关系的数据，例如组织结构、树形结构等。

语法：

WITH RECURSIVE CTE_Name AS (
    -- 初始查询 (anchor member)
    UNION ALL
    -- 递归查询 (recursive member)
    -- 必须包含对CTE_Name的引用
)
SELECT ... FROM CTE_Name ...;

WITH RECURSIVE: 声明这是一个递归CTE。
初始查询 (anchor member): 定义递归的起始点，通常是一些根节点。
UNION ALL: 将初始查询和递归查询的结果合并。
递归查询 (recursive member): 在查询中引用CTE自身，用于迭代地扩展结果集。

举个栗子：

假设我们有一个Employees表，存储员工的组织结构信息：

Employees (EmployeeID, EmployeeName, ManagerID): ManagerID表示该员工的直属经理的EmployeeID。

我们想要查询某个员工的所有下属（包括直接下属和间接下属）。

WITH RECURSIVE EmployeeHierarchy AS (
    SELECT EmployeeID, EmployeeName, ManagerID, 0 AS Level
    FROM Employees
    WHERE EmployeeID = 1 -- 假设EmployeeID为1的员工是根节点

    UNION ALL

    SELECT e.EmployeeID, e.EmployeeName, e.ManagerID, eh.Level + 1
    FROM Employees e
    JOIN EmployeeHierarchy eh ON e.ManagerID = eh.EmployeeID
)
SELECT EmployeeID, EmployeeName, Level
FROM EmployeeHierarchy
WHERE Level > 0; -- 排除根节点

这个例子中，我们定义了一个名为EmployeeHierarchy的递归CTE。

初始查询: 选择EmployeeID为1的员工作为根节点，Level设置为0。
递归查询: 将Employees表与EmployeeHierarchy连接，找到所有经理是EmployeeHierarchy中员工的员工，并将Level加1。

递归查询会不断迭代，直到找不到新的下属为止。最终，我们可以查询EmployeeHierarchy CTE，得到EmployeeID为1的员工的所有下属及其层级关系。

注意： 递归CTE必须包含一个递归终止条件，否则可能会导致无限循环。在上面的例子中，当找不到新的下属时，递归就会终止。

3. 在INSERT、UPDATE、DELETE语句中使用CTE：高效的数据操作

CTE不仅可以用于SELECT语句，还可以用于INSERT、UPDATE、DELETE语句，简化复杂的数据操作。

举个栗子：

假设我们想要删除所有订单总金额低于100元的客户。

WITH LowValueCustomers AS (
    SELECT c.CustomerID
    FROM Customers c
    JOIN Orders o ON c.CustomerID = o.CustomerID
    GROUP BY c.CustomerID
    HAVING SUM(o.TotalAmount) < 100
)
DELETE FROM Customers
WHERE CustomerID IN (SELECT CustomerID FROM LowValueCustomers);

这个例子中，我们定义了一个名为LowValueCustomers的CTE，用于筛选订单总金额低于100元的客户。然后在DELETE语句中，我们使用这个CTE来删除这些客户。

4. 窗口函数与CTE的完美结合：数据分析的利器

窗口函数是一种特殊的SQL函数，可以对一组相关的行进行计算，例如排名、累计求和等。将窗口函数与CTE结合使用，可以实现更复杂的数据分析。

举个栗子：

假设我们想要查询每个城市订单总金额最高的客户。

WITH CityOrderRank AS (
    SELECT
        c.City,
        c.CustomerID,
        SUM(o.TotalAmount) AS TotalAmount,
        RANK() OVER (PARTITION BY c.City ORDER BY SUM(o.TotalAmount) DESC) AS OrderRank
    FROM Customers c
    JOIN Orders o ON c.CustomerID = o.CustomerID
    GROUP BY c.City, c.CustomerID
)
SELECT City, CustomerID, TotalAmount
FROM CityOrderRank
WHERE OrderRank = 1;

这个例子中，我们定义了一个名为CityOrderRank的CTE。在这个CTE中，我们使用了RANK()窗口函数，根据每个城市订单总金额对客户进行排名。然后在主查询中，我们筛选出OrderRank为1的客户，即每个城市订单总金额最高的客户。

CTE的性能优化：避免踩坑，让你的查询飞起来！✈️

虽然CTE可以提高查询的可读性和维护性，但在某些情况下，可能会影响查询的性能。以下是一些CTE性能优化的建议：

避免过度使用CTE： CTE不是万能的，过度使用CTE可能会导致查询计划变得复杂，影响性能。只在真正需要的时候使用CTE。
考虑物化CTE： 有些数据库支持物化CTE，即将CTE的结果集存储到临时表中，以便后续重复使用。这可以避免重复计算CTE，提高性能。具体语法取决于数据库类型，例如在PostgreSQL中可以使用MATERIALIZED关键字。
注意索引的使用： 确保CTE中使用的表都有合适的索引，以便数据库优化器能够高效地执行查询。
分析查询计划： 使用数据库提供的查询计划分析工具，分析CTE的执行情况，找出潜在的性能瓶颈。

CTE的局限性：了解它的边界，才能更好地使用它

CTE虽然强大，但也存在一些局限性：

作用域限制： CTE只能在定义它的查询中使用，不能在其他查询中使用。
不能创建索引： 你不能直接在CTE上创建索引，因为它不是一个真正的表。
某些数据库的限制： 有些数据库可能对CTE的语法和功能有一些限制，例如不支持递归CTE。

总结：CTE，你值得拥有！💖

总而言之，CTE是一种非常实用的SQL工具，可以帮助你化繁为简，编写更易读、更易维护的查询语句。无论是处理复杂的业务逻辑，还是进行数据分析，CTE都能让你事半功倍。

希望今天的分享能让你对CTE有一个更深入的了解。记住，熟练掌握CTE，你就能在数据世界里自由飞翔，成为真正的SQL大师！

现在，拿起你的键盘，开始尝试使用CTE吧！相信你会爱上它的！

如果大家还有什么问题，欢迎随时提问。下次再见！👋

CTE，查询界的瑞士军刀：化繁为简，优雅查询的葵花宝典

为什么要用CTE？难道我已经写的SQL不够“精妙”了吗？

CTE的基本语法：一点都不难，比泡咖啡简单多了！☕

CTE的进阶用法：解锁更多姿势，让你在数据世界里自由飞翔！🚀

CTE的性能优化：避免踩坑，让你的查询飞起来！✈️

CTE的局限性：了解它的边界，才能更好地使用它

总结：CTE，你值得拥有！💖

发表回复 取消回复

发表回复取消回复