正则表达式查询：REGEXP 与 RLIKE 操作符的应用 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位观众老爷们，大家好！我是你们的老朋友，人称“正则小王子”的程序猿一枚。今天，咱们不聊枯燥的架构，不谈深奥的算法，就来轻松愉快地聊聊正则表达式，特别是 MySQL 中两个非常实用的操作符：REGEXP 和 RLIKE。

开场白：生活就像正则表达式，充满未知与惊喜

话说，咱们程序员的生活，就像写正则表达式一样，充满了各种各样的模式，需要我们不断地去匹配、去探索、去优化。有时候，一个简单的需求，就能让你抓耳挠腮；有时候，一个看似复杂的正则表达式，却能帮你解决燃眉之急。

就像你喜欢的女神，她的爱好、习惯、三观就像一个复杂的正则表达式，你必须不断地去了解、去匹配，才能最终抱得美人归！?

好了，废话不多说，咱们进入正题！

第一幕：REGEXP 与 RLIKE 的前世今生

在 MySQL 的世界里，REGEXP 和 RLIKE 这两个操作符，就如同武林中的一对孪生兄弟，长得几乎一模一样，功能也极其相似。它们都用于在 WHERE 子句中进行模式匹配，从数据表中检索符合特定规则的数据。

简单来说，它们的作用就是：

告诉我，哪些数据符合我设定的规则！

那么，它们到底有什么区别呢？其实，在 MySQL 中，REGEXP 和 RLIKE 是完全等价的。也就是说，无论你使用哪个操作符，得到的结果都是一样的。

你可以把它们想象成一对双胞胎，名字不一样，但基因完全相同。

第二幕：正则表达式的基础语法：武功秘籍

想要熟练掌握 REGEXP 和 RLIKE，就必须先了解正则表达式的基础语法。这就像学习武功一样，必须先打好基础，才能练成绝世神功。

下面，咱们来学习一些常用的正则表达式元字符：

元字符	含义	示例
`.`	匹配任意单个字符（除了换行符 `n`）	`a.c` 可以匹配 `abc`, `adc`, `aec` 等
`*`	匹配前面的字符零次或多次	`ab*c` 可以匹配 `ac`, `abc`, `abbc`, `abbbc` 等
`+`	匹配前面的字符一次或多次	`ab+c` 可以匹配 `abc`, `abbc`, `abbbc` 等，但不能匹配 `ac`
`?`	匹配前面的字符零次或一次	`ab?c` 可以匹配 `ac`, `abc`
`^`	匹配字符串的开头	`^abc` 匹配以 `abc` 开头的字符串
`$`	匹配字符串的结尾	`abc$` 匹配以 `abc` 结尾的字符串
`[ ]`	匹配方括号内的任意一个字符	`[abc]` 匹配 `a`, `b`, `c` 中的任意一个字符
`[^ ]`	匹配不在方括号内的任意一个字符	`[^abc]` 匹配除了 `a`, `b`, `c` 之外的任意一个字符
`\|`	或，匹配 `\|` 两侧的任意一个模式	`a\|b` 匹配 `a` 或 `b`
`( )`	分组，将多个字符组合成一个单元	`(ab)+` 匹配 `ab`, `abab`, `ababab` 等
`d`	匹配任意数字字符（等价于 `[0-9]`）	`ddd` 匹配三个连续的数字
`D`	匹配任意非数字字符（等价于 `[^0-9]`）	`DDD` 匹配三个连续的非数字字符
`w`	匹配任意字母数字字符（等价于 `[a-zA-Z0-9_]`）	`w+` 匹配一个或多个字母数字字符
`W`	匹配任意非字母数字字符（等价于 `[^a-zA-Z0-9_]`）	`W+` 匹配一个或多个非字母数字字符
`{n}`	匹配前面的字符恰好 `n` 次	`a{3}` 匹配 `aaa`
`{n,}`	匹配前面的字符至少 `n` 次	`a{3,}` 匹配 `aaa`, `aaaa`, `aaaaa` 等
`{n,m}`	匹配前面的字符至少 `n` 次，但不超过 `m` 次	`a{3,5}` 匹配 `aaa`, `aaaa`, `aaaaa`
	转义字符，用于匹配特殊字符本身。例如，要匹配 `.` 字符，需要使用 `.`	`.` 匹配 `.` 字符

第三幕：实战演练：英雄有用武之地

光说不练假把式，接下来，咱们通过一些实际的例子，来演示 REGEXP 和 RLIKE 的用法。

假设我们有一个名为 users 的表，包含以下字段：

id：用户 ID (INT)
username：用户名 (VARCHAR)
email：邮箱 (VARCHAR)
phone：电话号码 (VARCHAR)

场景一：查找用户名以 "a" 开头的用户

SELECT * FROM users WHERE username REGEXP '^a';
-- 或者
SELECT * FROM users WHERE username RLIKE '^a';

这个查询会返回所有用户名以字母 "a" 开头的用户。

场景二：查找邮箱包含 "gmail.com" 的用户

SELECT * FROM users WHERE email REGEXP 'gmail.com$';
-- 或者
SELECT * FROM users WHERE email RLIKE 'gmail.com$';

注意这里需要用 .来转义.，因为.在正则表达式中代表任意字符。
这个查询会返回所有邮箱以 "gmail.com" 结尾的用户。

场景三：查找电话号码以 "13" 开头，且第二位是 3 或 5 的用户

SELECT * FROM users WHERE phone REGEXP '^1[35]d{9}$';
-- 或者
SELECT * FROM users WHERE phone RLIKE '^1[35]d{9}$';

这个查询使用了字符集 [35] 来匹配第二位数字，并使用 d{9} 来匹配剩余的 9 位数字。

场景四：查找用户名包含数字的用户

SELECT * FROM users WHERE username REGEXP '[0-9]';
-- 或者
SELECT * FROM users WHERE username RLIKE '[0-9]';

这个查询会返回所有用户名包含数字的用户。

场景五：查找用户名长度在 5 到 10 个字符之间的用户

SELECT * FROM users WHERE username REGEXP '^.{5,10}$';
-- 或者
SELECT * FROM users WHERE username RLIKE '^.{5,10}$';

这个查询使用了 .{5,10} 来匹配 5 到 10 个任意字符。

第四幕：高级技巧：让你的正则表达式更上一层楼

掌握了基础语法，咱们再来学习一些高级技巧，让你的正则表达式更加强大。

使用字符类简化表达式

MySQL 支持一些预定义的字符类，可以简化正则表达式的书写。例如：
- [:alnum:]：字母数字字符（等价于 [a-zA-Z0-9]）
- [:alpha:]：字母字符（等价于 [a-zA-Z]）
- [:digit:]：数字字符（等价于 [0-9]）
- [:space:]：空白字符（包括空格、制表符、换行符等）
例如，要查找用户名包含字母数字字符的用户，可以使用以下查询：
```
SELECT * FROM users WHERE username REGEXP '[[:alnum:]]';
-- 或者
SELECT * FROM users WHERE username RLIKE '[[:alnum:]]';
```
使用分组和反向引用

分组可以将多个字符组合成一个单元，并可以使用反向引用来引用分组匹配的内容。

例如，要查找用户名和邮箱前缀相同的用户，可以使用以下查询：
```
SELECT * FROM users WHERE username REGEXP '^(.*)@1';
-- 或者
SELECT * FROM users WHERE username RLIKE '^(.*)@1';
```
这个查询使用了分组 (.*) 来匹配邮箱前缀，并使用反向引用 1 来引用第一个分组匹配的内容。
注意大小写敏感问题

MySQL 的正则表达式默认是大小写不敏感的。如果需要进行大小写敏感的匹配，可以使用 BINARY 关键字。

例如，要查找用户名以 "A" 开头的用户（区分大小写），可以使用以下查询：
```
SELECT * FROM users WHERE BINARY username REGEXP '^A';
-- 或者
SELECT * FROM users WHERE BINARY username RLIKE '^A';
```

第五幕：性能优化：磨刀不误砍柴工

正则表达式功能强大，但也可能影响查询性能。因此，在使用 REGEXP 和 RLIKE 时，需要注意以下几点：

尽量避免在大型表中使用正则表达式

正则表达式的匹配过程比较复杂，在大表中使用可能会导致查询速度变慢。如果可以，尽量使用其他更高效的查询方式。
优化正则表达式的书写

编写高效的正则表达式可以提高查询性能。例如，尽量避免使用复杂的表达式，可以使用字符类来简化表达式，可以使用锚点来限制匹配范围。
考虑使用索引

如果经常需要使用正则表达式进行查询，可以考虑在相关字段上创建索引。但需要注意的是，正则表达式可能会导致索引失效，因此需要仔细评估索引的效果。

总结：正则表达式，程序员的瑞士军刀

总而言之，REGEXP 和 RLIKE 是 MySQL 中两个非常实用的操作符，可以帮助我们进行灵活的模式匹配。熟练掌握正则表达式的语法和技巧，可以让我们更加高效地处理各种数据查询需求。

正则表达式就像程序员的瑞士军刀，虽然不是万能的，但关键时刻总能派上用场。希望通过今天的分享，大家能够对正则表达式有更深入的了解，并在实际工作中灵活运用！

最后，祝大家编码愉快，Bug 远离！?

发表回复 取消回复

发表回复取消回复