智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座 -

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Resource Groups`：其在多租户环境下的`CPU/IO`隔离。

各位老铁，早上好/下午好/晚上好！今天咱们来聊聊MySQL里一个听起来有点高大上，但实际上很接地气的功能：Resource Groups。这玩意儿，就像你家里的电闸开关，可以控制不同房间的用电量，避免一个房间电器开太多把整个家都给搞停电了。在MySQL里，它能控制不同用户的CPU和IO资源，尤其是在多租户环境下，简直是救命稻草。咱们先来了解一下，啥是多租户环境？简单来说，就是一台MySQL服务器上跑着好几个不同的应用，每个应用都相当于一个“租户”。如果其中一个租户突然发疯，执行了一个超慢的查询，或者疯狂写入数据，那就会把整个服务器的资源都占满了，导致其他租户的应用也跟着卡顿，甚至直接崩掉。这可就麻烦大了！所以，Resource Groups就派上用场了。它可以把不同的租户分配到不同的资源组里，然后限制每个资源组可以使用的CPU和IO资源，这样就能保证每个租户都能分到一定的资源，避免一个租户把所有资源都抢走。接下来，咱们就来一步一步地看看怎么使用Resource Groups。第一步：创建Resource Group 创建Resource Group的语法很简单： CREA …

继续阅读“MySQL高阶讲座之：`MySQL`的`Resource Groups`：其在多租户环境下的`CPU/IO`隔离。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Sharding`：其在`TDSQL`、`DRDS`中的实现。

各位观众老爷，大家好！我是今天的主讲人，很高兴和大家一起聊聊MySQL Sharding这个话题。今天咱们要深入到MySQL Sharding的腹地，看看它在TDSQL和DRDS这两个重量级选手里的实现，保证让大家听得懂，学得会，还能拿去吹牛皮！开胃小菜：Sharding是啥？为啥要搞它？先来个简单的开胃菜：啥是Sharding？简单来说，就是把一个很大的数据库或者表，切成很多小块，分散到不同的服务器上去。就像把一头大象切成很多块，分别放进不同的冰箱里，这样每个冰箱的压力就小了。那么，为啥要这么折腾呢？数据量太大：单个数据库搞不定了，查询慢如蜗牛，插入直接卡死。并发太高：太多人同时访问数据库，服务器直接崩溃。存储瓶颈：硬盘不够用了，买再多也放不下。 Sharding 就是解决这些问题的良药！它可以水平扩展数据库的容量和并发能力，让你的数据库飞起来！正餐：Sharding的姿势 Sharding 可不是随便切一切就完事了，它有很多种姿势，我们来逐一了解一下。垂直Sharding（Vertical Sharding）：也叫纵向拆分，就是按照业务来拆分。比如把用 …

继续阅读“MySQL高阶讲座之：`MySQL`的`Sharding`：其在`TDSQL`、`DRDS`中的实现。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Federated`存储引擎：跨数据库查询的性能与局限。

各位观众老爷，大家好！今天给大家带来一场关于MySQL Federated存储引擎的盛宴，主题是：“跨数据库查询的性能与局限”。保证让大家吃饱喝足，扶墙而出！开场白：跨库查询的那些事儿在数据库的世界里，数据往往分散在不同的地方，就像你家的袜子，总是不成双成对地出现在不同的角落。有时候，我们需要把这些数据整合起来，进行分析或者生成报表。最直接的办法当然是把数据复制一份到同一个数据库，但这就像把所有袜子都塞进一个抽屉，迟早会爆炸的！这时候，跨库查询就派上用场了。它可以让我们直接从不同的数据库读取数据，而不需要复制数据。就像你可以直接走到不同的房间去拿袜子，而不用把所有袜子都搬到客厅。 MySQL提供了多种跨库查询的方式，例如使用FEDERATED存储引擎、使用mysqldump导出数据再导入、编写自定义的ETL脚本等等。今天我们重点聊聊FEDERATED存储引擎，这个家伙就像一个“传送门”，能让你直接访问其他MySQL服务器上的表。什么是Federated存储引擎？ FEDERATED存储引擎允许你访问位于远程MySQL服务器上的表，就像访问本地表一样。它实际上并不存储任何数据，只 …

继续阅读“MySQL高阶讲座之：`MySQL`的`Federated`存储引擎：跨数据库查询的性能与局限。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Query Cache`：其在`MySQL` 8.0中被移除的深层原因。

各位朋友，大家好！我是今天的主讲人，咱们今天聊聊MySQL里曾经风光无限，但最终黯然退场的 Query Cache。这玩意儿啊，就像你辛辛苦苦做的缓存，结果发现不仅没加速，还拖慢了速度，最后只能忍痛割爱。一、Query Cache：曾经的“加速神器” 话说在MySQL 5.7及之前的版本里，Query Cache 绝对是明星功能。它的作用简单粗暴：把 SELECT 查询的结果缓存起来。下次再执行同样的查询，直接从缓存里拿结果，省去了分析SQL、访问数据、计算结果的步骤，速度提升那是杠杠的。想象一下，你是个饭店老板。每天都有很多顾客点相同的菜，比如“宫保鸡丁”。如果每次都重新炒一遍，那得多费劲？Query Cache 就相当于你提前炒好一大锅“宫保鸡丁”，有人点就直接盛一份，大大提高了出菜效率。举个例子，假设我们有这么一张表： CREATE TABLE articles ( id INT PRIMARY KEY AUTO_INCREMENT, title VARCHAR(255) NOT NULL, content TEXT, created_at TIMESTAMP DEFAUL …

继续阅读“MySQL高阶讲座之：`MySQL`的`Query Cache`：其在`MySQL` 8.0中被移除的深层原因。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Wasm`支持：其在边缘计算和`Serverless`中的应用。

各位观众老爷们，大家好！我是老码，今天咱们聊点刺激的——MySQL的Wasm支持，以及它在边缘计算和Serverless中的骚操作。准备好了吗？系好安全带，发车！第一部分：Wasm是个啥玩意？为什么要跟MySQL搞在一起？ Wasm，全称WebAssembly，可不是网页组装的意思啊！它是一种新型的二进制指令集，设计初衷是为了在浏览器里跑高性能应用，比如游戏、音视频编辑等等。但现在，Wasm已经冲出浏览器，在服务器端、嵌入式设备、甚至区块链领域都混得风生水起。那它为啥这么受欢迎呢？总结起来就三个字：快、小、安全。快： Wasm是编译成二进制的，执行效率接近原生代码，比JavaScript快N倍（具体多少倍取决于应用场景，反正就是快）。小： Wasm文件体积小，加载速度快，节省带宽。安全： Wasm运行在一个沙箱环境里，隔离性好，可以有效防止恶意代码攻击。 OK，Wasm的优点说完了，那它跟MySQL有啥关系？以前，咱们想在边缘计算设备或者Serverless函数里访问MySQL数据库，通常需要通过API接口，或者直接连接数据库。但这样做有几个缺点：网络延迟高：边缘设备 …

继续阅读“MySQL高阶讲座之：`MySQL`的`Wasm`支持：其在边缘计算和`Serverless`中的应用。”

2025年8月20日

MySQL高阶讲座之：`MySQL`与`GitOps`：如何利用`Git`管理数据库`Schema`的变更。

各位观众老爷，大家好！我是今天的主讲人，咱们今天来聊聊一个略显“性感”的话题：MySQL 和 GitOps，以及如何用 Git 来管理数据库 Schema 的变更。这年头，代码都用 Git 管理了，数据库 Schema 变更还手动改？这简直就像开着火箭送外卖，效率低不说，还容易翻车。所以，今天咱们就来聊聊如何把数据库 Schema 变更也纳入 Git 的怀抱，让数据库也玩一把“版本控制”。一、为什么要用 Git 管理数据库 Schema 变更？先来说说为什么要这么干，好处嘛，那可是杠杠的：版本控制：谁改了什么，什么时候改的，一目了然。再也不用担心“是谁动了我的表结构？”这种灵魂拷问了。可追溯性：出了问题，可以轻松回滚到之前的版本。简直就是数据库的“后悔药”。协作：团队成员可以协同开发数据库 Schema，避免冲突和覆盖。自动化：可以将数据库 Schema 变更集成到 CI/CD 流程中，实现自动化部署。审计：所有的变更都有记录，方便审计和合规。简而言之，就是让数据库 Schema 变更变得更安全、更高效、更可控。二、 GitOps 的基本概念 GitOp …

继续阅读“MySQL高阶讲座之：`MySQL`与`GitOps`：如何利用`Git`管理数据库`Schema`的变更。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Data Lake`集成：`MySQL`与`Delta Lake`、`Iceberg`的协同。

各位观众老爷们，大家好！我是你们的老朋友，今天咱们来聊聊一个听起来很高大上，但其实也没那么难的东西：MySQL 的 Data Lake 集成。具体点说，就是让 MySQL 和 Delta Lake、Iceberg 这些 Data Lake 界的扛把子们，一起愉快地玩耍。为什么要把 MySQL 和 Data Lake 搞到一起？简单来说，就是让专业的归专业，干该干的事儿。 MySQL: 身手敏捷，擅长处理事务性操作（增删改查），查询速度快，适合在线事务处理 (OLTP)。 Data Lake: 容量巨大，擅长存储海量数据，支持复杂的分析查询，适合在线分析处理 (OLAP)。把它们结合起来，就可以发挥各自的优势：实时数据分析: 将 MySQL 中的实时数据同步到 Data Lake，进行更深入的分析，挖掘潜在价值。历史数据查询: 将 MySQL 中的历史数据归档到 Data Lake，释放 MySQL 的存储压力，同时支持对历史数据的查询。数据治理: 利用 Data Lake 的数据治理能力，对 MySQL 中的数据进行清洗、转换，提高数据质量。主角登场：Delta Lake …

继续阅读“MySQL高阶讲座之：`MySQL`的`Data Lake`集成：`MySQL`与`Delta Lake`、`Iceberg`的协同。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Serverless`架构：`AWS Aurora`和`Alibaba PolarDB`的实现原理。

各位观众老爷们，大家好！今天咱们聊点儿高级的，关于MySQL的Serverless架构，主要聚焦在AWS Aurora和Alibaba PolarDB这两位大佬的实现原理上。准备好瓜子板凳，咱们开讲啦！一、啥是Serverless，跟MySQL有啥关系？首先，得搞清楚Serverless是个啥玩意儿。简单来说，Serverless不是真的“没有服务器”，而是说你不用操心服务器的运维、扩容、打补丁这些破事儿了。云厂商帮你全搞定了，你只需要关注你的代码逻辑，按需付费就行。那跟MySQL有啥关系呢？传统的MySQL，你得自己部署服务器、安装MySQL、配置参数、监控性能，还得担心机器宕机、数据丢失。Serverless MySQL就是把这些脏活累活都交给云厂商，你只需要创建数据库、写SQL，其他的都交给云平台，按你的实际使用量付费。想象一下，你只需要专注于写CRUD，不用半夜被告警吵醒，是不是很爽？二、 AWS Aurora：MySQL Serverless的领头羊 AWS Aurora是亚马逊搞出来的一个高性能、高可用、与MySQL兼容的数据库服务。它有标准版和Serverles …

继续阅读“MySQL高阶讲座之：`MySQL`的`Serverless`架构：`AWS Aurora`和`Alibaba PolarDB`的实现原理。”

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Vector Search`：其在`AI`和相似性搜索中的应用。

各位老铁，双击666！今天咱们不聊八卦，来点硬核的！咱们来扒一扒MySQL的Vector Search，看看这玩意儿到底怎么在AI和相似性搜索里搅风搅雨。开场白：啥是Vector Search？想象一下，你面前摆着一堆照片，让你找出最像“一只可爱的小猫咪”的那张。你怎么找？大概就是凭感觉，看颜色、形状、姿势，然后在脑子里给每张照片打个分。 Vector Search 干的就是类似的事儿。它先把你的数据（比如那些照片、文本、甚至音乐）变成一堆叫做“向量”的数字。这些向量在空间里排兵布阵，距离越近的向量，就代表着数据越相似。这样，你再想找“最像小猫咪”的照片，就变成了在向量空间里找距离最近的向量了。这比传统数据库的精确匹配可灵活多了！传统的数据库只能告诉你“有没有完全一样的猫”，而Vector Search能告诉你“哪个最像”。第一回合：向量化你的数据要玩Vector Search，第一步就是把你的数据变成向量。这步叫做“向量化（Embedding）”。文本向量化：如果你的数据是文本，可以用各种牛逼的模型来向量化，比如： Word2Vec：这老哥比较经典，但 …

继续阅读“MySQL高阶讲座之：`MySQL`的`Vector Search`：其在`AI`和相似性搜索中的应用。”

2025年8月20日

MySQL高阶讲座之：`MySQL`与`Kafka`的`CDC`：`Debezium`的`Binlog`解析与事件驱动架构。

各位观众老爷，大家好！今天咱们聊点硬核的，关于 MySQL 和 Kafka 勾搭成奸…哦不，是强强联合的秘密武器：Debezium！开场白：数据这厮，太不老实了！在互联网世界里，数据就是金钱，谁掌握了数据，谁就掌握了财富密码（误）。但是，数据这玩意儿它不老实啊，它总是在不停地变化，就像你女朋友的心情一样。特别是对于 MySQL 这种关系型数据库来说，数据变更简直是家常便饭。增删改查，一刻不停。那问题来了，其他系统怎么实时感知到这些变化呢？难道要不停地轮询 MySQL，问它：“你变了吗？你变了吗？” 这也太傻了吧！不仅浪费资源，还延迟贼高。所以，我们需要一种更优雅的方式，让 MySQL 主动告诉我们：“老子变了！快来看！” 这就是 CDC (Change Data Capture) 的魅力所在。第一幕：Binlog 的秘密花园要实现 CDC，首先得找到数据变化的源头。在 MySQL 里面，这个源头就是 Binlog (Binary Log)。 Binlog 记录了所有对 MySQL 数据库的修改操作，包括 INSERT、UPDATE、DELETE 等等。它就像一个 …

继续阅读“MySQL高阶讲座之：`MySQL`与`Kafka`的`CDC`：`Debezium`的`Binlog`解析与事件驱动架构。”