regexp - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年12月17日

手写深拷贝（Deep Clone）：如何优雅处理 RegExp、Date 和循环引用（Circular Ref）？

手写深拷贝（Deep Clone）：优雅处理 RegExp、Date 和循环引用（Circular Ref）大家好，欢迎来到今天的编程技术讲座。今天我们要深入探讨一个看似简单但实则非常复杂的主题——手写深拷贝（Deep Clone）。你可能已经用过 JSON.parse(JSON.stringify(obj)) 来做深拷贝，但它有明显的局限性：无法处理 Date、RegExp、函数、undefined、Symbol 等类型，更别说循环引用了。而我们今天的目标是写出一个真正健壮、优雅且能处理边界情况的深拷贝函数。一、为什么需要深拷贝？在 JavaScript 中，对象和数组都是引用类型。如果你直接赋值： const obj1 = { a: 1, b: [2, 3] }; const obj2 = obj1; obj2.b.push(4); console.log(obj1.b); // [2, 3, 4] 你会发现 obj1 也被改变了。这就是浅拷贝的问题。深拷贝的核心目标是：创建一个新的对象或数组，其内部结构完全独立于原对象，修改新对象不会影响原对象。二、常见深拷贝方法对比 …

继续阅读“手写深拷贝（Deep Clone）：如何优雅处理 RegExp、Date 和循环引用（Circular Ref）？”

2025年12月13日

JavaScript 中的‘规格违规’检测：通过 Fuzzing 技术发现浏览器引擎在处理复杂 RegExp 时的边界崩溃

各位编程专家、安全研究员以及对JavaScript引擎内部机制充满好奇的朋友们，大家好。今天，我们将深入探讨一个既基础又极其复杂的领域：JavaScript引擎对正则表达式（RegExp）的处理，以及如何利用Fuzzing技术来发现其中潜藏的“规格违规”或“边界崩溃”。正则表达式作为字符串处理的强大工具，其语法和行为由ECMAScript标准严格定义。然而，在现实世界的浏览器引擎中，将这些复杂规则转化为高效且无缺陷的实现，是一项巨大的挑战。当引擎未能完全遵循规范，或在处理极端、复杂输入时出现预期之外的行为，就可能导致从性能下降到安全漏洞的各种问题。 JavaScript 引擎与 RegExp 的复杂性：一个未被充分认识的战场 JavaScript引擎，如V8（Chrome/Node.js）、SpiderMonkey（Firefox）和JavaScriptCore（Safari），是现代Web应用的心脏。它们负责解析、编译并执行我们编写的JavaScript代码。其中，正则表达式的处理是引擎内部一项高度优化的、但又异常复杂的任务。 1.1 RegExp：表象下的深渊表面上看，RegE …

继续阅读“JavaScript 中的‘规格违规’检测：通过 Fuzzing 技术发现浏览器引擎在处理复杂 RegExp 时的边界崩溃”

2025年9月14日

MySQL函数：使用`REGEXP_REPLACE()`进行复杂字符串替换的高级用法。

MySQL REGEXP_REPLACE() 高级用法：复杂字符串替换的艺术大家好！今天我们深入探讨 MySQL 中 REGEXP_REPLACE() 函数的高级用法，重点是如何利用它进行复杂的字符串替换。 REGEXP_REPLACE() 是一个强大的函数，它允许我们使用正则表达式来查找并替换字符串中的特定模式。虽然基本的用法相对简单，但通过掌握一些高级技巧，我们可以解决许多复杂的字符串处理问题。 1. REGEXP_REPLACE() 的基本语法回顾在深入高级用法之前，我们先快速回顾一下 REGEXP_REPLACE() 的基本语法： REGEXP_REPLACE(string, pattern, replacement) string: 要进行替换操作的原始字符串。 pattern: 用于匹配字符串中要替换部分的正则表达式。 replacement: 用于替换匹配部分的字符串。例如，要将字符串 "Hello World" 中的 "World" 替换为 "MySQL"，可以使用以下语句： SELECT REGEXP …

继续阅读“MySQL函数：使用`REGEXP_REPLACE()`进行复杂字符串替换的高级用法。”

2025年9月9日

如何利用`REGEXP`与`RLIKE`进行正则表达式匹配？

好的，我们开始今天的讲座，主题是利用 REGEXP 与 RLIKE 进行正则表达式匹配。在 MySQL 中，REGEXP 和 RLIKE 运算符都用于执行正则表达式匹配。它们本质上是同义词，可以互换使用。本讲座将深入探讨如何有效地利用这两个运算符，包括正则表达式的语法、常用模式、以及在实际查询中的应用。一、正则表达式基础正则表达式是一种强大的文本模式匹配工具，它允许我们使用特定的语法来描述要查找的字符模式。掌握正则表达式的语法是使用 REGEXP 和 RLIKE 的前提。字符匹配 . (点号): 匹配任意单个字符，除了换行符 (在某些配置下可能匹配换行符)。 [abc]: 匹配方括号中的任意一个字符（在本例中是 a、b 或 c）。 [^abc]: 匹配除了方括号中的字符之外的任意字符。 [a-z]: 匹配从 a 到 z 的任意小写字母。 [A-Z]: 匹配从 A 到 Z 的任意大写字母。 [0-9]: 匹配从 0 到 9 的任意数字。 d: 匹配任意数字，等价于 [0-9]。 D: 匹配任意非数字字符，等价于 [^0-9]。 w: 匹配任意字母数字字符或下划线，等价于 [a-z …

继续阅读“如何利用`REGEXP`与`RLIKE`进行正则表达式匹配？”

2025年9月1日

MySQL高级函数之：`REGEXP_INSTR()`：其在正则查找中的应用。

MySQL 高级函数 REGEXP_INSTR()：正则查找中的应用大家好，今天我们来深入探讨 MySQL 中的一个高级函数：REGEXP_INSTR()。这个函数在进行正则匹配查找时非常有用，它能够帮助我们定位匹配字符串的位置，从而实现更精细的数据处理和分析。 REGEXP_INSTR() 函数的基本语法 REGEXP_INSTR() 函数的基本语法如下： REGEXP_INSTR(expr, pat[, pos[, occurrence[, return_option[, match_type]]]]) 让我们逐一解释这些参数的含义： expr: 这是要搜索的字符串。可以是列名、字符串常量或任何可以解析为字符串的表达式。 pat: 这是用于匹配的正则表达式模式。 pos (可选): 这是搜索起始的位置。如果省略，默认值为 1，表示从字符串的第一个字符开始搜索。 occurrence (可选): 指定要查找的匹配项的出现次数。如果省略，默认值为 1，表示查找第一个匹配项。 return_option (可选): 指定返回值的类型。 0 (默认值): 返回匹配字符串的第一个字符的位置 …

继续阅读“MySQL高级函数之：`REGEXP_INSTR()`：其在正则查找中的应用。”

2025年8月28日

MySQL高级函数之：`REGEXP_SUBSTR()`：其在正则子串提取中的应用。

MySQL高级函数之：REGEXP_SUBSTR()：其在正则子串提取中的应用大家好，今天我们来深入探讨MySQL中的高级函数REGEXP_SUBSTR()，重点讲解它在正则子串提取中的应用。在日常的数据库操作中，我们经常需要从复杂的字符串中提取特定模式的数据。虽然MySQL提供了SUBSTRING()等函数，但面对更复杂的模式匹配需求时，正则表达式无疑是更强大的工具。REGEXP_SUBSTR()函数正是为了满足这种需求而生的。 1. REGEXP_SUBSTR()函数简介 REGEXP_SUBSTR()函数是MySQL 8.0版本及以上提供的，用于从字符串中提取与正则表达式匹配的子字符串。它的基本语法如下： REGEXP_SUBSTR(string, pattern[, position[, occurrence[, match_type]]]) 各个参数的含义如下： string: 要搜索的字符串。 pattern: 用于匹配的正则表达式。 position (可选): 搜索的起始位置，默认为1。 occurrence (可选): 指定返回第几次匹配到的子字符串，默认为1。 …

继续阅读“MySQL高级函数之：`REGEXP_SUBSTR()`：其在正则子串提取中的应用。”

2025年8月28日

MySQL高级函数之：`REGEXP_REPLACE()`：其在正则替换中的高级应用。

MySQL 高级函数 REGEXP_REPLACE()：正则替换的高级应用大家好，今天我们来深入探讨 MySQL 中一个非常强大的正则表达式函数：REGEXP_REPLACE()。相比于简单的字符串替换，REGEXP_REPLACE() 允许我们使用正则表达式进行模式匹配，并用指定的字符串替换匹配到的部分。这使得它在数据清洗、格式化、以及更复杂的文本处理场景中非常有用。 1. REGEXP_REPLACE() 函数的基本语法 REGEXP_REPLACE() 函数的基本语法如下： REGEXP_REPLACE(expr, pat, repl[, pos[, occurrence]]) expr: 要进行替换的原始字符串。 pat: 一个正则表达式模式，用于匹配 expr 中的子字符串。 repl: 用于替换匹配到的子字符串的字符串。 pos (可选): 指定从 expr 的哪个位置开始搜索匹配。默认为 1 （字符串的起始位置）。 occurrence (可选): 指定替换哪个匹配项。如果不指定，则替换所有匹配项。如果指定一个正整数 n，则只替换第 n 个匹配项。可以使用 …

继续阅读“MySQL高级函数之：`REGEXP_REPLACE()`：其在正则替换中的高级应用。”

2025年8月26日

JavaScript内核与高级编程之：`RegExp set notation` 提案：其在 `JavaScript` 正则表达式中的新语法和匹配能力。

嘿，大家好！今天咱们聊聊正则表达式的“集合表示法”！先打个招呼，我是老码农，今天给大家带来一个正则表达式的新玩意儿，叫做“RegExp Set Notation”，也就是“集合表示法”。别被这名字吓跑，其实它相当实用，能让你的正则功力更上一层楼。什么是“集合表示法”？简单来说，就是给你的正则表达式加上了“集合”的概念，让你可以更方便地表示字符的范围和组合。这就像给你手里的乐高积木添了更多种类，能拼出更复杂的模型。在传统的正则表达式中，我们已经有一些字符类，比如 d 代表数字，w 代表单词字符（字母、数字和下划线），s 代表空白字符。但是，如果我们要表达“既是数字又是偶数”呢？或者 “既不是字母也不是数字” 呢？以前可能需要用一些比较复杂的技巧，但有了“集合表示法”，这些都变得小菜一碟。语法速览 “集合表示法” 使用方括号 [] 来定义字符集合，并在方括号内部使用一些特殊的符号来表示集合的运算。主要包括以下几种：并集 (Union): 直接把字符或字符类放在一起，例如 [abc] 表示 a 或 b 或 c。这和传统的字符类语法是一样的。交集 (Interse …

继续阅读“JavaScript内核与高级编程之：`RegExp set notation` 提案：其在 `JavaScript` 正则表达式中的新语法和匹配能力。”

2025年7月27日

深入理解 JavaScript 中的 RegExp V flag (Unicode Property Escapes in regular expressions) 如何增强正则表达式的 Unicode 处理能力。

大家好，我是老码农，今天咱们来聊聊 JavaScript 正则表达式中的一个“V”字仇杀队的“V”—— v flag，也叫 Unicode Property Escapes。这玩意儿听起来高大上，但其实是个帮你更好地处理 Unicode 字符的小助手。开场白：Unicode 的那些事儿在说v flag 之前，咱们得先简单回顾一下 Unicode。早些年，ASCII 那128个字符还能勉强应付一下英语，但随着互联网全球化，各种语言都冒出来了，ASCII 就歇菜了。Unicode 就是来拯救世界的，它给每个字符都分配了一个唯一的数字，也就是码点（code point）。但是，Unicode 字符集实在太大了，什么奇奇怪怪的符号都有。光靠 w、d、s 这些简化的字符类，你根本没法精确匹配。比如，你想匹配所有的中文字符，用 w 肯定不行，因为它还会包含英文、数字和下划线。进入正题：v flag 的闪亮登场这个时候，v flag 就派上用场了。它允许你在正则表达式中使用 Unicode Property Escapes，也就是用 p{} 和 P{} 这样的语法来匹配具有特定 Unico …

继续阅读“深入理解 JavaScript 中的 RegExp V flag (Unicode Property Escapes in regular expressions) 如何增强正则表达式的 Unicode 处理能力。”

2025年7月22日

JS `RegExp Set Notation` (提案) `Intersection`, `Difference`, `Complement` 的效率考量

各位靓仔靓女，大家好！我是你们的老朋友，今天咱们来聊聊JS正则表达式的新玩具——集合运算（Set Notation），也就是交集、差集和补集。这玩意儿听起来高大上，但实际上用起来也挺有意思的。当然，咱们也不能只顾着玩，还得考虑一下效率问题，毕竟谁也不想写出跑得比蜗牛还慢的代码。一、啥是JS RegExp Set Notation？简单来说，这个提案允许我们在正则表达式里像操作集合一样操作字符集。以前我们只能用[…]定义一个字符集，比如[abc]表示a、b、c中的任意一个字符。现在我们可以用一些特殊的符号来表示字符集的交集、差集和补集。运算符号含义交集 && 两个字符集共同包含的字符。例如[a-z&&[aeiou]]表示所有的小写元音字母。差集 — 从一个字符集中移除另一个字符集中的字符。例如[a-z–[aeiou]]表示所有的小写辅音字母。补集 ^ 表示字符集的补集。注意，这个^的位置很重要，放在[]里面开头表示补集，放在[]里面其他位置表示普通字符^。例如[^abc]表示除了a、b、c以外的任何字符。二、基本用法示例先来几 …

继续阅读“JS `RegExp Set Notation` (提案) `Intersection`, `Difference`, `Complement` 的效率考量”