MySQL的查询改写：如何利用内部函数实现复杂的业务逻辑？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

MySQL 查询改写：内部函数赋能复杂业务逻辑

大家好，今天我们来聊聊MySQL查询改写，以及如何巧妙地利用MySQL的内部函数来实现复杂的业务逻辑。很多时候，我们面对的需求不仅仅是简单的CRUD，而是涉及到复杂的计算、转换、分析等。如果把这些逻辑全部放在应用程序中处理，不仅增加了应用程序的负担，还可能导致性能瓶颈。好的做法是将一部分逻辑下推到数据库层，利用MySQL自身的强大能力来完成。

什么是查询改写？

查询改写，简单来说，就是在执行SQL查询之前，对SQL语句进行优化和转换，使其能够更高效地执行。这种优化可以包括：

逻辑优化： 改变SQL语句的逻辑结构，例如子查询优化、连接顺序优化等。
物理优化： 选择更合适的索引、选择更高效的算法等。
函数优化： 利用内部函数简化SQL语句，提升执行效率。

今天我们重点关注的是函数优化，即如何利用MySQL的内部函数来实现原本需要在应用程序中完成的业务逻辑。

为什么要利用内部函数？

将业务逻辑下推到数据库层，利用内部函数，有以下几个优点：

减少数据传输： 应用程序只需要发送SQL语句和接收结果，减少了大量的数据传输，尤其是在数据量大的情况下，效果非常明显。
降低应用程序负担： 将计算密集型的任务交给数据库处理，可以减轻应用程序的CPU和内存压力。
提升性能： MySQL的内部函数通常经过高度优化，执行效率比应用程序中的代码更高。
代码简洁： 复杂的业务逻辑用SQL语句实现，代码更简洁、易于维护。

常见的MySQL内部函数及应用场景

MySQL提供了丰富的内部函数，涵盖了字符串处理、日期时间处理、数学计算、条件判断等各个方面。下面我们来看一些常用的函数以及它们在实际业务场景中的应用。

1. 字符串函数

函数名	功能	示例	应用场景
`CONCAT(str1, str2, ...)`	连接多个字符串	`SELECT CONCAT('Hello', ' ', 'World');` — 输出 ‘Hello World’	拼接用户姓名、地址等
`SUBSTRING(str, pos, len)`	从字符串中提取子字符串	`SELECT SUBSTRING('abcdefg', 2, 3);` — 输出 ‘bcd’	获取用户名的首字母、提取订单号中的部分信息
`REPLACE(str, from_str, to_str)`	将字符串中的指定子字符串替换为另一个字符串	`SELECT REPLACE('Hello World', 'World', 'MySQL');` — 输出 ‘Hello MySQL’	替换敏感信息、修复错误数据
`UPPER(str)`	将字符串转换为大写	`SELECT UPPER('hello');` — 输出 ‘HELLO’	将用户名转换为大写进行比较、统一数据格式
`LOWER(str)`	将字符串转换为小写	`SELECT LOWER('HELLO');` — 输出 ‘hello’	将用户名转换为小写进行比较、统一数据格式
`LENGTH(str)`	获取字符串的长度	`SELECT LENGTH('hello');` — 输出 5	校验用户输入的长度限制、统计字符串长度
`TRIM(str)`	去除字符串首尾的空格	`SELECT TRIM(' hello ');` — 输出 ‘hello’	清理用户输入的数据、保证数据一致性
`LIKE`	模糊匹配字符串	`SELECT * FROM users WHERE username LIKE '%john%';` — 查找用户名包含 ‘john’ 的用户	实现搜索功能、查找特定模式的数据
`REGEXP`	正则表达式匹配字符串	`SELECT * FROM users WHERE email REGEXP '^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$';` — 验证邮箱格式	数据校验、复杂模式匹配
`FIND_IN_SET(str, strlist)`	在逗号分隔的字符串列表中查找指定字符串的位置	`SELECT FIND_IN_SET('b', 'a,b,c,d');` — 输出 2	判断用户是否拥有某个权限、查询属于某个分类的数据
`JSON_EXTRACT(json_doc, path)`	从 JSON 文档中提取指定路径的值	`SELECT JSON_EXTRACT('{"name": "John", "age": 30}', '$.name');` — 输出 ‘John’	处理 JSON 数据、提取关键信息

示例：根据用户名生成唯一的邀请码

假设我们需要根据用户的用户名生成一个唯一的邀请码。我们可以利用MD5函数和SUBSTRING函数来实现。

SELECT SUBSTRING(MD5(username), 1, 8) AS invite_code
FROM users;

这个SQL语句首先使用MD5函数对用户名进行哈希，然后使用SUBSTRING函数提取哈希值的前8位作为邀请码。

2. 日期时间函数

函数名	功能	示例	应用场景
`NOW()`	获取当前日期和时间	`SELECT NOW();` — 输出当前日期和时间	记录创建时间、更新时间
`CURDATE()`	获取当前日期	`SELECT CURDATE();` — 输出当前日期	查询今天的订单、统计今天的用户注册量
`CURTIME()`	获取当前时间	`SELECT CURTIME();` — 输出当前时间	记录登录时间、分析用户活跃时间
`DATE(datetime)`	从日期时间值中提取日期部分	`SELECT DATE('2023-10-27 10:00:00');` — 输出 ‘2023-10-27’	按日期分组统计数据、比较日期大小
`TIME(datetime)`	从日期时间值中提取时间部分	`SELECT TIME('2023-10-27 10:00:00');` — 输出 ’10:00:00′	按时间段分组统计数据、分析用户行为习惯
`YEAR(date)`	从日期值中提取年份	`SELECT YEAR('2023-10-27');` — 输出 2023	按年份统计数据、生成年度报告
`MONTH(date)`	从日期值中提取月份	`SELECT MONTH('2023-10-27');` — 输出 10	按月份统计数据、生成月度报告
`DAY(date)`	从日期值中提取日	`SELECT DAY('2023-10-27');` — 输出 27	按天统计数据、生成日报
`DATE_ADD(date, INTERVAL expr unit)`	在日期上添加指定的时间间隔	`SELECT DATE_ADD('2023-10-27', INTERVAL 1 DAY);` — 输出 ‘2023-10-28’	计算未来日期、设置过期时间
`DATE_SUB(date, INTERVAL expr unit)`	在日期上减去指定的时间间隔	`SELECT DATE_SUB('2023-10-27', INTERVAL 1 DAY);` — 输出 ‘2023-10-26’	计算过去日期、计算时间差
`DATEDIFF(date1, date2)`	计算两个日期之间的天数差	`SELECT DATEDIFF('2023-10-27', '2023-10-20');` — 输出 7	计算用户注册时长、计算活动持续时间
`DATE_FORMAT(date, format)`	将日期格式化为指定的字符串	`SELECT DATE_FORMAT('2023-10-27', '%Y-%m-%d');` — 输出 ‘2023-10-27’	自定义日期显示格式、生成报表

示例：统计过去7天的用户注册量

SELECT DATE(created_at) AS register_date, COUNT(*) AS register_count
FROM users
WHERE created_at >= DATE_SUB(CURDATE(), INTERVAL 7 DAY)
GROUP BY register_date
ORDER BY register_date;

这个SQL语句使用DATE函数提取注册日期，使用DATE_SUB函数计算过去7天的起始日期，然后按注册日期分组统计用户注册量。

3. 数学函数

函数名	功能	示例	应用场景
`ROUND(x, d)`	将数值 x 四舍五入到 d 位小数	`SELECT ROUND(3.14159, 2);` — 输出 3.14	价格计算、统计平均值
`CEIL(x)`	返回大于或等于 x 的最小整数	`SELECT CEIL(3.14);` — 输出 4	分页计算、向上取整
`FLOOR(x)`	返回小于或等于 x 的最大整数	`SELECT FLOOR(3.14);` — 输出 3	分页计算、向下取整
`ABS(x)`	返回 x 的绝对值	`SELECT ABS(-5);` — 输出 5	计算差值、处理负数
`RAND()`	返回一个 0 到 1 之间的随机数	`SELECT RAND();` — 输出一个随机数	生成随机数据、实现抽奖功能
`MOD(n, m)`	返回 n 除以 m 的余数	`SELECT MOD(10, 3);` — 输出 1	分组计算、判断奇偶数
`POW(x, y)`	返回 x 的 y 次方	`SELECT POW(2, 3);` — 输出 8	计算指数、科学计算
`SQRT(x)`	返回 x 的平方根	`SELECT SQRT(9);` — 输出 3	科学计算、距离计算
`TRUNCATE(x, d)`	将数字 x 截断为 d 位小数	`SELECT TRUNCATE(3.14159, 2);` — 输出 3.14	精确计算、舍弃小数部分
`CRC32(expr)`	计算表达式的 CRC32 校验和值	`SELECT CRC32('hello');` — 输出一个整数	数据校验、唯一标识生成
`LN(x)`	返回 x 的自然对数	`SELECT LN(10);` — 输出 10 的自然对数	科学计算、数据分析
`LOG(base, x)`	返回以 base 为底 x 的对数	`SELECT LOG(2, 8);` — 输出 3 (以2为底8的对数)	科学计算、数据分析

示例：计算商品的折扣价格

假设商品表 products 包含 price (原价) 和 discount (折扣率) 字段，我们需要计算商品的折扣价格。

SELECT price, discount, ROUND(price * (1 - discount), 2) AS discounted_price
FROM products;

这个SQL语句使用ROUND函数将折扣价格四舍五入到两位小数。

4. 条件判断函数

函数名	功能	示例	应用场景
`IF(expr, v1, v2)`	如果表达式 expr 为真，则返回 v1，否则返回 v2	`SELECT IF(1 > 0, 'True', 'False');` — 输出 ‘True’	根据条件显示不同的值、实现简单的业务逻辑
`IFNULL(v1, v2)`	如果 v1 为 NULL，则返回 v2，否则返回 v1	`SELECT IFNULL(NULL, 'Default Value');` — 输出 ‘Default Value’	处理 NULL 值、设置默认值
`CASE WHEN ... THEN ... ELSE ... END`	实现复杂的条件判断	`sql SELECT CASE WHEN score >= 90 THEN 'A' WHEN score >= 80 THEN 'B' ELSE 'C' END AS grade FROM scores;` — 根据分数评定等级	实现复杂的业务逻辑、根据不同的条件进行不同的处理
`NULLIF(expr1, expr2)`	如果 expr1 等于 expr2，则返回 NULL，否则返回 expr1	`SELECT NULLIF('a', 'a');` — 输出 NULL	避免除数为零错误、处理特殊情况
`COALESCE(v1, v2, ...)`	返回参数列表中第一个非 NULL 的值	`SELECT COALESCE(NULL, NULL, 'Value');` — 输出 ‘Value’	设置默认值、查找第一个有效值

示例：根据用户积分等级显示不同的会员称号

假设用户表 users 包含 points (积分) 字段，我们需要根据用户的积分等级显示不同的会员称号。

SELECT
    username,
    CASE
        WHEN points >= 1000 THEN '钻石会员'
        WHEN points >= 500 THEN '黄金会员'
        WHEN points >= 100 THEN '白银会员'
        ELSE '普通会员'
    END AS membership_level
FROM users;

这个SQL语句使用CASE WHEN语句根据积分等级判断会员称号。

5. 其他函数

除了以上几种常见的函数之外，MySQL还提供了许多其他有用的函数，例如：

加密函数： MD5, SHA1, SHA2等，用于对数据进行加密。
JSON函数： JSON_EXTRACT, JSON_ARRAY, JSON_OBJECT等，用于处理JSON数据。
空间函数： ST_Distance, ST_Contains等，用于处理地理空间数据。
窗口函数： ROW_NUMBER, RANK, DENSE_RANK等，用于进行复杂的排名和统计分析。

高级应用：自定义函数

除了使用MySQL提供的内置函数外，我们还可以自定义函数，以满足更复杂的需求。自定义函数使用CREATE FUNCTION语句创建，可以使用SQL语句和存储过程语法来实现。

示例：自定义函数计算两个日期之间的工作日天数

DELIMITER //

CREATE FUNCTION workday_diff(start_date DATE, end_date DATE)
RETURNS INT
BEGIN
    DECLARE workday_count INT DEFAULT 0;
    DECLARE current_date DATE DEFAULT start_date;

    WHILE current_date <= end_date DO
        -- 排除周六和周日
        IF DAYOFWEEK(current_date) BETWEEN 2 AND 6 THEN
            SET workday_count = workday_count + 1;
        END IF;
        SET current_date = DATE_ADD(current_date, INTERVAL 1 DAY);
    END WHILE;

    RETURN workday_count;
END //

DELIMITER ;

-- 使用示例
SELECT workday_diff('2023-10-20', '2023-10-27'); -- 输出 5

这个自定义函数workday_diff计算两个日期之间的工作日天数，排除了周六和周日。

注意事项

性能： 虽然将业务逻辑下推到数据库层可以提升性能，但过度使用复杂函数可能会导致性能下降。需要根据实际情况进行权衡。
可维护性： 复杂的SQL语句可能会降低代码的可维护性。需要编写清晰、易懂的SQL语句，并添加必要的注释。
安全性： 在使用用户输入作为函数参数时，需要注意SQL注入风险。可以使用参数化查询来避免SQL注入。
测试： 对包含复杂函数的SQL语句进行充分的测试，确保其正确性和可靠性。

数据库层面的逻辑下推是提升性能的关键

今天我们学习了如何利用MySQL的内部函数来实现复杂的业务逻辑，减少数据传输，降低应用程序负担，提升性能。通过合理利用内部函数，我们可以编写更简洁、更高效的SQL语句，将一部分业务逻辑下推到数据库层，从而提升整个系统的性能和可维护性。希望今天的分享能对大家有所帮助，谢谢！