GROUP BY 与 HAVING 子句的高级用法与优化 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位观众老爷们，欢迎来到今天的“SQL玄学之夜”！我是你们的老朋友，人称“Bug终结者”的程序猿老王。今天咱们不聊人生理想，就聊聊SQL里面两个让人又爱又恨的小妖精：GROUP BY 和 HAVING。

别看它们长得挺朴实，但用不好，那可是会让你半夜惊醒，冷汗直冒的罪魁祸首！今天，老王就带你们深入了解一下这两个家伙的高级用法，顺便传授一些独家秘笈，让你们在SQL的世界里，也能像吕布一样，所向披靡！

第一幕：GROUP BY 的风花雪月

首先，咱们来聊聊 GROUP BY。这家伙的作用很简单，就是把你的数据按照指定的列进行分组。想象一下，你有一堆水果，苹果、香蕉、梨子混在一起。GROUP BY 就像一个勤劳的小蜜蜂，把它们按照种类，分门别类地放好。

基础用法：简单粗暴的分组

最简单的用法，就是按照单个列进行分组。比如，你想统计一下每个城市有多少个用户：

SELECT city, COUNT(*) AS user_count
FROM users
GROUP BY city;

这条SQL语句就像一个喇叭，对着数据库喊：“喂！把用户们按照城市分一下组，然后告诉我每个城市有多少人！”

进阶用法：多列分组，花样百出

当然，GROUP BY 并不满足于只按照一个列分组。它可以同时按照多个列进行分组，让你的数据更加精细。

比如，你想统计一下每个城市，不同性别的用户数量：

SELECT city, gender, COUNT(*) AS user_count
FROM users
GROUP BY city, gender;

这条语句就像一个更高级的喇叭，喊道：“喂！把用户们先按照城市分组，然后在每个城市里，再按照性别分组，最后告诉我每个城市，每种性别有多少人！”

第二幕：HAVING 的爱恨情仇

GROUP BY 负责分组，那 HAVING 又是干什么的呢？HAVING 的作用，就是对分组后的结果进行筛选。注意，它只能用在 GROUP BY 之后，专门针对分组后的结果进行过滤。

你可以把 HAVING 想象成一个严厉的考官，它只允许符合条件的分组通过。

WHERE 和 HAVING 的恩怨情仇：剪不断，理还乱

很多新手都会搞混 WHERE 和 HAVING。它们都是用来进行筛选的，但它们的作用对象不同。

WHERE 是在分组之前进行筛选，针对的是原始数据。
HAVING 是在分组之后进行筛选，针对的是分组后的结果。

举个例子，你想找出用户数量超过100的城市：

SELECT city, COUNT(*) AS user_count
FROM users
GROUP BY city
HAVING COUNT(*) > 100;

这条语句的意思是：“先按照城市分组，然后统计每个城市的用户数量，最后只保留用户数量超过100的城市。”

如果你用 WHERE 来实现这个需求，那可就麻烦了，因为 WHERE 不能直接使用聚合函数（比如 COUNT()）。

高级用法：HAVING 结合子查询，威力无穷

HAVING 还可以结合子查询，实现更复杂的筛选逻辑。

比如，你想找出平均年龄大于所有城市平均年龄的城市：

SELECT city, AVG(age) AS avg_age
FROM users
GROUP BY city
HAVING AVG(age) > (SELECT AVG(age) FROM users);

这条语句的意思是：“先按照城市分组，然后计算每个城市的平均年龄，最后只保留平均年龄大于所有城市平均年龄的城市。”

第三幕：优化秘笈，决胜千里

掌握了 GROUP BY 和 HAVING 的基本用法，还远远不够。想要在SQL的世界里叱咤风云，还需要掌握一些优化秘笈。

秘笈一：能用 WHERE 就不用 HAVING

记住，WHERE 的效率通常比 HAVING 高。所以，如果你的筛选条件可以在分组之前进行，那就尽量使用 WHERE。

秘笈二：索引是王道

在 GROUP BY 和 HAVING 中使用的列，最好建立索引。这样可以大大提高查询效率。

秘笈三：避免不必要的计算

尽量避免在 GROUP BY 和 HAVING 中进行复杂的计算。如果可以，先把计算结果存储到一个临时表中，然后再进行分组和筛选。

秘笈四：合理使用子查询

子查询虽然强大，但也会影响查询效率。所以，要尽量避免使用复杂的子查询。如果可以，可以使用连接（JOIN）来代替子查询。

第四幕：实战演练，手到擒来

光说不练假把式，接下来咱们来做一些实战演练，巩固一下今天所学的知识。

案例一：找出每个月销售额最高的商品

假设你有一个销售记录表 sales，包含以下字段：

product_id：商品ID
sale_date：销售日期
sale_amount：销售额

现在，你想找出每个月销售额最高的商品。

SELECT
    DATE_FORMAT(sale_date, '%Y-%m') AS sale_month,
    product_id,
    MAX(sale_amount) AS max_sale_amount
FROM sales
GROUP BY sale_month
HAVING max_sale_amount = (
    SELECT MAX(sale_amount)
    FROM sales AS s2
    WHERE DATE_FORMAT(s2.sale_date, '%Y-%m') = sale_month
);

案例二：找出购买了所有商品的客户

假设你有一个客户表 customers，包含以下字段：

customer_id：客户ID

还有一个订单表 orders，包含以下字段：

customer_id：客户ID
product_id：商品ID

现在，你想找出购买了所有商品的客户。

SELECT c.customer_id
FROM customers c
JOIN orders o ON c.customer_id = o.customer_id
GROUP BY c.customer_id
HAVING COUNT(DISTINCT o.product_id) = (SELECT COUNT(*) FROM (SELECT DISTINCT product_id FROM orders) AS distinct_products);

第五幕：总结与升华

好了，各位观众老爷们，今天的“SQL玄学之夜”就到这里告一段落了。希望通过今天的讲解，你们对 GROUP BY 和 HAVING 有了更深入的了解。

记住，GROUP BY 和 HAVING 就像一对双胞胎，它们总是形影不离。掌握了它们，你就可以在SQL的世界里，自由驰骋，无所不能！

最后，送给大家一句老王的心得：SQL之路，漫漫修远兮，吾将上下而求索！

希望大家多多练习，早日成为SQL大神！咱们下期再见！👋

表格总结：WHERE vs HAVING

特性	`WHERE`	`HAVING`
作用对象	原始数据	分组后的结果
使用位置	`GROUP BY` 之前	`GROUP BY` 之后
能否使用聚合函数	不能	可以
效率	通常更高	通常较低
适用场景	在分组之前进行筛选，过滤原始数据。	在分组之后进行筛选，过滤分组后的结果。
举例	筛选年龄大于18岁的用户。	筛选平均年龄大于25岁的城市。

表情包时间：

当你写出一条完美的SQL语句时：😎
当你遇到复杂的 GROUP BY 和 HAVING 时：🤯
当你成功优化了SQL查询时：🥳
当你发现SQL语句跑了半天还没结果时：😫

希望这些能帮助大家更好地理解和应用 GROUP BY 和 HAVING。记住，实践是检验真理的唯一标准！多写多练，才能真正掌握SQL的精髓。祝大家编程愉快！

发表回复 取消回复

发表回复取消回复