正则表达式查询：REGEXP 与 RLIKE 操作符的应用 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位尊敬的程序猿、攻城狮、代码侠，以及所有热爱编程的小伙伴们，欢迎来到今天的“正则表达式奇妙夜”。🌙

今天，咱们不谈高深的算法，不聊复杂的架构，就轻松愉快地聊聊正则表达式的两位好兄弟：REGEXP 和 RLIKE。它们就像一对双胞胎，长得几乎一样，功能也高度重合，常常让人傻傻分不清楚。但别担心，今天我就要用最通俗易懂、最幽默风趣的方式，带大家彻底搞懂它们，让它们成为你SQL武器库中最锋利的宝剑！🗡️

一、开场白：正则表达式，程序员的瑞士军刀

首先，容我先给正则表达式（Regular Expression，简称Regex）来个小小的赞美。它就像程序员的瑞士军刀，小巧玲珑，却功能强大，能帮你解决各种文本处理的难题。无论是验证邮箱格式、提取网页链接、还是替换敏感词汇，Regex都能轻松搞定。

想象一下，你是一位侦探，面对一堆杂乱无章的线索，Regex就是你的放大镜和指纹识别器，能帮你快速找到关键信息，锁定真凶！ 🕵️‍♀️ 是不是瞬间感觉自己化身福尔摩斯，充满了智慧的光芒？✨

二、主角登场：REGEXP 与 RLIKE，傻傻分不清？

好了，铺垫了这么多，终于要进入正题了。在MySQL中，REGEXP 和 RLIKE 都是用来进行正则表达式匹配的操作符。它们的作用是一样的，都是判断一个字符串是否符合某个正则表达式的模式。

简单来说，它们就像一对孪生兄弟，你叫哥哥REGEXP，我叫弟弟RLIKE，虽然名字不一样，但干的活儿一模一样！ 👬

三、语法结构：简单明了，一看就懂

它们的语法结构非常简单，就像一句顺口溜，朗朗上口：

SELECT column_name FROM table_name WHERE column_name REGEXP 'pattern';
SELECT column_name FROM table_name WHERE column_name RLIKE 'pattern';

其中：

column_name：你要查询的列名。
table_name：你要查询的表名。
pattern：你的正则表达式模式。

是不是感觉很简单？😎 别急，好戏还在后头呢！

四、实战演练：案例教学，深入浅出

光说不练假把式，接下来，咱们通过几个实际的案例，来深入了解 REGEXP 和 RLIKE 的用法。

案例一：查找包含特定字符串的记录

假设我们有一个名为 users 的表，其中有一个 email 列，我们想查找所有包含 "gmail.com" 的邮箱地址。

-- 使用 REGEXP
SELECT email FROM users WHERE email REGEXP 'gmail.com';

-- 使用 RLIKE
SELECT email FROM users WHERE email RLIKE 'gmail.com';

这两条SQL语句的效果完全一样，都会返回 email 列中包含 "gmail.com" 的所有记录。

案例二：使用字符类匹配

假设我们想查找所有以数字开头的用户名。

-- 使用 REGEXP
SELECT username FROM users WHERE username REGEXP '^[0-9]';

-- 使用 RLIKE
SELECT username FROM users WHERE username RLIKE '^[0-9]';

这里的 ^[0-9] 是一个正则表达式，其中：

^ 表示字符串的开头。
[0-9] 表示匹配任意一个数字（0到9）。

案例三：使用量词匹配

假设我们想查找所有包含至少三个连续数字的电话号码。

-- 使用 REGEXP
SELECT phone_number FROM users WHERE phone_number REGEXP '[0-9]{3,}';

-- 使用 RLIKE
SELECT phone_number FROM users WHERE phone_number RLIKE '[0-9]{3,}';

这里的 [0-9]{3,} 是一个正则表达式，其中：

[0-9] 表示匹配任意一个数字。
{3,} 表示匹配前面的字符至少3次。

案例四：忽略大小写匹配

默认情况下，REGEXP 和 RLIKE 是区分大小写的。如果想忽略大小写，可以使用 BINARY 关键字来强制区分大小写，或者使用MySQL的配置来设置默认的collation。但是，通常更好的做法是在正则表达式中，使用 (?i) 标志。

-- 使用 REGEXP 忽略大小写
SELECT username FROM users WHERE username REGEXP '(?i)admin';

-- 使用 RLIKE 忽略大小写
SELECT username FROM users WHERE username RLIKE '(?i)admin';

这里的 (?i) 是一个正则表达式标志，表示忽略大小写。

五、常用正则表达式模式：拿来即用，事半功倍

为了方便大家使用，我整理了一些常用的正则表达式模式，可以直接拿来使用，省时省力！💪

模式	描述	示例
`.`	匹配任意单个字符（除了换行符）	`a.c` 可以匹配 "abc", "adc", "aec" 等
`^`	匹配字符串的开头	`^hello` 匹配以 "hello" 开头的字符串
`$`	匹配字符串的结尾	`world$` 匹配以 "world" 结尾的字符串
`*`	匹配前面的字符零次或多次	`ab*c` 可以匹配 "ac", "abc", "abbc" 等
`+`	匹配前面的字符一次或多次	`ab+c` 可以匹配 "abc", "abbc", "abbbc" 等
`?`	匹配前面的字符零次或一次	`ab?c` 可以匹配 "ac", "abc"
`[abc]`	匹配方括号中的任意一个字符	`[abc]` 可以匹配 "a", "b", "c"
`[^abc]`	匹配除了方括号中的字符以外的任意一个字符	`[^abc]` 可以匹配 "d", "e", "f" 等
`[a-z]`	匹配a到z之间的任意一个小写字母	`[a-z]` 可以匹配 "a", "b", …, "z"
`[0-9]`	匹配0到9之间的任意一个数字	`[0-9]` 可以匹配 "0", "1", …, "9"
`d`	匹配一个数字字符，等价于 `[0-9]`	`d` 可以匹配 "0", "1", …, "9"
`w`	匹配一个单词字符（字母、数字或下划线），等价于 `[a-zA-Z0-9_]`	`w` 可以匹配 "a", "1", "_"
`s`	匹配一个空白字符（空格、制表符、换行符等）	`s` 可以匹配 " ", "t", "n"
`{n}`	匹配前面的字符恰好 n 次	`a{3}` 可以匹配 "aaa"
`{n,}`	匹配前面的字符至少 n 次	`a{3,}` 可以匹配 "aaa", "aaaa", …
`{n,m}`	匹配前面的字符至少 n 次，但不超过 m 次	`a{3,5}` 可以匹配 "aaa", "aaaa", "aaaaa"
`\|`	或操作符，匹配两边的任意一个模式	`a\|b` 可以匹配 "a" 或 "b"
`()`	分组，将多个字符组合成一个单元	`(ab)+` 可以匹配 "ab", "abab", "ababab"
`(?i)`	忽略大小写标志	`(?i)abc` 可以匹配 "abc", "Abc", "ABC"
`b`	匹配单词边界	`bwordb` 匹配独立的单词 "word"

六、REGEXP 与 LIKE 的区别：一字之差，天壤之别

很多小伙伴可能会问，REGEXP 和 LIKE 都是用来进行模式匹配的，它们有什么区别呢？🤔

其实，它们最大的区别在于：

LIKE：用于简单的模式匹配，支持通配符 %（匹配任意多个字符）和 _（匹配任意单个字符）。
REGEXP 和 RLIKE：用于更复杂的正则表达式匹配，支持各种正则表达式模式。

简单来说，LIKE 就像一把小刀，只能切一些简单的东西；而 REGEXP 和 RLIKE 就像一把瑞士军刀，能处理各种复杂的任务。

七、注意事项：细节决定成败

在使用 REGEXP 和 RLIKE 时，还需要注意以下几点：

正则表达式的性能可能不如简单的字符串匹配，所以在性能要求较高的场景下，需要谨慎使用。
不同的数据库系统对正则表达式的支持程度可能有所不同，需要查阅相关文档。
编写正则表达式时，要尽量简洁明了，避免出现歧义。
可以使用在线正则表达式测试工具，来验证你的正则表达式是否正确。

八、总结：掌握利器，事半功倍

好了，今天的“正则表达式奇妙夜”就到这里了。希望通过今天的讲解，大家对 REGEXP 和 RLIKE 有了更深入的了解。

记住，正则表达式是程序员的瑞士军刀，掌握它，能让你在文本处理的世界里游刃有余，事半功倍！🚀

下次再遇到需要进行复杂模式匹配的场景，不要犹豫，拿起你的 REGEXP 或 RLIKE，像一位勇敢的骑士一样，冲锋陷阵吧！ ⚔️

最后，祝大家编程愉快，bug 退散！ 🙏

发表回复 取消回复

发表回复取消回复