分布式 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年8月28日

MySQL高可用与集群之：`MySQL“Cluster`：其在内存数据库和分布式架构中的应用。

好的，让我们开始吧。 MySQL Cluster：内存数据库与分布式架构的深度剖析大家好，今天我们来深入探讨MySQL Cluster，一个在内存数据库和分布式架构领域扮演重要角色的技术。我们将从它的架构、配置、使用，以及在实际场景中的应用等方面进行详细讲解，并穿插代码示例，力求让大家对MySQL Cluster有一个全面而深入的理解。 1. MySQL Cluster 架构概述 MySQL Cluster是一个分布式、高可用、高吞吐的数据库解决方案，它使用NDB（Network Database）存储引擎，数据存储在多个数据节点上，并通过MySQL服务器节点提供SQL接口。这种架构允许数据在多个节点间进行共享和复制，从而实现高可用性和可扩展性。核心组件包括：管理节点 (MGM): 负责整个集群的管理和配置，存储集群的配置文件，并监控各个节点的状态。数据节点 (NDBD): 实际存储数据的地方，采用内存数据库的架构，数据可以持久化到磁盘。 SQL节点 (MySQL Server): 提供SQL接口，客户端通过SQL节点访问集群中的数据，可以有多个SQL节点，实现读写分离和负载均 …

继续阅读“MySQL高可用与集群之：`MySQL“Cluster`：其在内存数据库和分布式架构中的应用。”

2025年8月17日

MySQL高级讲座篇之：MySQL的分布式锁：`GET_LOCK()`和`Redis`分布式锁的对比。

各位观众老爷们，大家好！今天咱来聊聊分布式锁这档子事儿。锁这玩意儿，单机玩得溜溜的，synchronized、ReentrantLock，哪个不是信手拈来？可一旦到了分布式环境，就没那么简单了。想象一下，好几个服务器同时抢着修改同一条数据，那场面，简直比双十一零点抢购还激烈！所以，今天就来掰扯掰扯MySQL自带的GET_LOCK()和咱们常用的Redis分布式锁，看看它们各自的优缺点，以及在什么场景下该用哪个更合适。开场白：锁，你这磨人的小妖精！要说锁的重要性，那就好比高速公路上的收费站。没有收费站，大家一窝蜂往前冲，最后的结果就是堵成一锅粥。锁的作用就是保证在同一时刻，只有一个线程（或者服务器节点）能够访问共享资源，避免数据错乱，保证数据一致性。第一部分：MySQL的GET_LOCK()：简单粗暴，但也够用！先来说说MySQL自带的GET_LOCK()函数。这玩意儿用起来非常简单，只需要执行一个SQL语句，就能尝试获取一个锁。获取锁: SELECT GET_LOCK(‘my_lock_name’, 10); 这条语句的意思是：尝试获取名为my_lock_name的锁， …

继续阅读“MySQL高级讲座篇之：MySQL的分布式锁：`GET_LOCK()`和`Redis`分布式锁的对比。”

2025年8月16日

MySQL高级讲座篇之：构建可扩展的数据库架构：从单机到分布式集群的演进之路。

大家好，我是老码，今天咱们聊聊MySQL的升级打怪之路：从单机小弟到分布式集群大佬的演进。咱们的目标是，让你的数据库能扛得住双十一，也能陪你一起慢慢变老（数据安全第一！）。第一关：单机MySQL的甜蜜与忧伤一开始，咱们都是从单机MySQL开始的。安装简单，配置方便，运行飞快（数据量小的时候）。但这就像初恋，美好但脆弱。优点：部署简单，维护方便，成本低廉。缺点：性能瓶颈明显，容量有限，单点故障风险高。咱们先来个简单的MySQL配置（my.cnf/my.ini）： [mysqld] port = 3306 datadir = /var/lib/mysql # 数据目录，重要！ socket = /var/lib/mysql/mysql.sock character-set-server=utf8mb4 # 字符集，防止乱码 collation-server=utf8mb4_unicode_ci innodb_buffer_pool_size = 128M # 重要的缓存！根据内存调整 max_connections = 100 # 最大连接数，别太小 log-error=/ …

继续阅读“MySQL高级讲座篇之：构建可扩展的数据库架构：从单机到分布式集群的演进之路。”

2025年7月10日

Redis 作为分布式缓存：缓存穿透、雪崩、击穿的解决方案

好的，各位听众，欢迎来到今天的“Redis缓存那些事儿”讲座。今天咱们要聊的是Redis作为分布式缓存时，那些让人头疼的“穿透”、“雪崩”和“击穿”，以及怎么用各种姿势优雅地解决它们。开场白：缓存，你又爱又恨的小妖精缓存，这玩意儿就像你家冰箱，放点常用的东西进去，拿的时候嗖嗖快，但用不好，它也能变成细菌滋生的温床。在分布式系统中，Redis就是这个冰箱，它能加速你的数据访问，减轻数据库压力，但如果姿势不对，就会引发各种奇奇怪怪的问题。第一幕：缓存穿透，查无此人的尴尬啥是缓存穿透？简单来说，就是用户请求的数据，Redis里没有，数据库里也没有。每次请求都直奔数据库，就像你每次都饿着肚子去超市买菜，冰箱永远是空的！问题描述：恶意攻击：黑客故意请求大量不存在的数据，让数据库不堪重负。数据异常：程序bug导致请求的数据ID永远不存在。解决方案：布隆过滤器 (Bloom Filter)：事前过滤，防止坏人进门这玩意儿就像你家门口的保安，能快速告诉你这个人是不是“可疑人员”（可能存在于数据库）。它是一种概率型数据结构，能告诉你某个元素“可能存在”或“绝对不存在”。优点：占用 …

继续阅读“Redis 作为分布式缓存：缓存穿透、雪崩、击穿的解决方案”

2025年7月9日

DeepSpeed/FairScale：大规模分布式训练与模型并行优化

好的，各位观众老爷们，欢迎来到今天的“DeepSpeed/FairScale：大规模分布式训练与模型并行优化”专场！今天咱们不搞虚的，直接上干货，聊聊如何用DeepSpeed和FairScale这两个神器，把那些动不动就几百亿、几千亿参数的大模型给喂饱，让它们跑得飞起！一、引言：模型越来越大，显存越来越小？话说啊，这年头，模型参数量蹭蹭往上涨，恨不得一天一个亿。但咱们手里的显卡，显存就那么点，捉襟见肘啊！单卡训练？那得等到猴年马月！所以，分布式训练是唯一的出路。但是，分布式训练也不是那么容易的，各种问题等着你：显存不够用？一个模型几百G，一张卡才几十G，怎么塞得下？通信开销太大？几百张卡一起训练，数据传来传去，网络带宽不够啊！训练效率不高？卡多了，但效率反而下降了，感觉白花了钱！别慌！DeepSpeed和FairScale就是来拯救世界的！它们提供了各种模型并行技术，帮你解决这些问题，让你的大模型训练事半功倍。二、DeepSpeed：微软出品，必属精品？ DeepSpeed是微软开源的一个深度学习优化库，专注于大规模分布式训练。它的目标是让每个人都能轻松训练拥有数十 …

继续阅读“DeepSpeed/FairScale：大规模分布式训练与模型并行优化”

2025年7月9日

Modin：在现有 Pandas 代码上实现分布式加速

好的，各位观众老爷，欢迎来到今天的“Modin：让你的 Pandas 代码飞起来”特别节目！我是你们的老朋友，人称代码界的“加速器”，今天就来跟大家聊聊如何用 Modin 这个神奇的工具，让你的 Pandas 代码瞬间提速，走向人生巅峰（误）。开场白：Pandas，爱你不容易啊！话说回来，Pandas 这玩意儿，简直是 Python 数据分析界的扛把子，谁不用 Pandas，都不好意思说自己是搞数据的。但是！But！然而！Pandas 也有个小小的缺点，那就是……慢！尤其是当你的数据量蹭蹭往上涨的时候，Pandas 就开始力不从心了，CPU 占用率飙升，风扇狂转，甚至电脑直接卡死，让你怀疑人生。这时候，你可能会想：难道就没有什么办法，能让 Pandas 像吃了炫迈一样，根本停不下来吗？答案是：有！而且它就叫做——Modin！ Modin：Pandas 的超能力外挂 Modin 是一个基于 Ray 或 Dask 的 DataFrame 库，它可以让你只修改一行代码，就能把你的 Pandas 代码变成分布式并行计算，从而大幅提升速度。简单来说，你可以把 Modin 理解成 Pa …

继续阅读“Modin：在现有 Pandas 代码上实现分布式加速”

2025年7月8日

DeepSpeed/FairScale：大规模分布式训练与模型并行优化

好的，各位观众老爷，欢迎来到今天的“DeepSpeed/FairScale：大规模分布式训练与模型并行优化”专场脱口秀！我是你们的老朋友，Bug终结者，代码段子手，今天要跟大家唠唠嗑，聊聊怎么用DeepSpeed和FairScale这两个神器，把那些动辄几十亿、几千亿参数的大模型，像玩泥巴一样轻松训练出来。开场白：模型太大，钱包太瘪？分布式训练来救场！话说，现在AI圈流行“大力出奇迹”，模型参数一个比一个多，动不动就几百GB，单张显卡根本塞不下。就算勉强塞进去，训练起来慢得像蜗牛爬，电费都够你买辆小汽车了！这时候，分布式训练就显得尤为重要了。简单来说，就是把一个大模型切成小块，分给多张显卡甚至多台机器去训练。大家齐心协力，共同进步，效率嗖嗖的！但是，分布式训练也不是那么容易的。数据怎么分？梯度怎么同步？通信开销怎么优化？一不小心就掉坑里了。好在，DeepSpeed和FairScale这两个好基友，帮我们填平了这些坑。第一幕：DeepSpeed：微软出品，必属精品？ DeepSpeed是微软搞出来的，号称“让深度学习更深、更快、更省”。它主要解决了以下几个问题：模型并行性: …

继续阅读“DeepSpeed/FairScale：大规模分布式训练与模型并行优化”

2025年7月8日

Ray 分布式强化学习：构建大规模并发 RL 实验

各位观众老爷们，大家好！今天咱们来聊聊怎么用 Ray 这个神器，搞定分布式强化学习，让你的 RL 实验跑得飞起，并发量嗖嗖地往上涨！开场白：为啥要搞分布式 RL？各位可能要问了，单机跑 RL 不是挺好的吗？为啥要费劲搞分布式？这个问题问得好！单机跑 RL，就像用小马拉大车，数据量一大，神经网络一复杂，立马就歇菜了。训练速度慢得让人怀疑人生，调参调到怀疑世界。想象一下，你要训练一个机器人玩 Atari 游戏，需要成千上万局的游戏数据。单机跑，可能要跑好几天甚至几个星期。这时间，够你把游戏机都玩穿了！所以，为了解决这些问题，我们就需要分布式 RL。它可以把训练任务分解到多个机器上，并行执行，大大缩短训练时间，提高效率。就像雇了一群小弟帮你搬砖，速度自然快多了！ Ray：分布式 RL 的瑞士军刀说到分布式 RL，就不得不提 Ray。Ray 是一个开源的分布式计算框架，它简单易用，功能强大，是构建大规模并发 RL 实验的利器。你可以把 Ray 想象成一个超级调度员，它可以把你的 RL 任务分配到不同的机器上执行，并负责收集结果。你只需要关注你的 RL 算法本身，而不用操心底层的分 …

继续阅读“Ray 分布式强化学习：构建大规模并发 RL 实验”

2025年7月3日

联邦学习 (Federated Learning)：隐私保护下的分布式训练

联邦学习：当数据“宅”起来，还能一起变聪明想象一下，你是一个美食家，想研究出一道独门秘方。你走访了全国各地的小餐馆，每家都有自己的拿手好菜，但老板们都非常“护犊子”，不愿意把配方透露给你，生怕你抢了他们的生意。怎么办呢？联邦学习，就有点像解决这个难题的“妙手厨神”。它让各个餐馆（也就是我们常说的数据拥有者）不用把自己的菜谱（也就是数据）交给你，而是各自在自己的厨房（本地数据）里，按照你给的“烹饪指南”（模型算法）进行训练，然后把“心得体会”（模型更新）告诉你。你综合大家的“心得体会”，不断改进“烹饪指南”，让大家再根据新的“烹饪指南”继续训练。就这样，大家在保护自己独门配方的前提下，一起把菜做得越来越好吃！这就是联邦学习的核心思想：在保护数据隐私的前提下，让多个参与者共同训练一个机器学习模型。听起来是不是有点科幻？但实际上，联邦学习已经悄悄地渗透到我们生活的方方面面，比如：手机上的“智能推荐”：你的手机会根据你的使用习惯，推荐你可能喜欢的App、新闻或者商品。这些推荐背后，就可能用到了联邦学习。各个手机厂商不用收集你的个人数据，而是让你的手机在本地进行模型训练，然后把训练结 …

继续阅读“联邦学习 (Federated Learning)：隐私保护下的分布式训练”