vector - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年8月20日

MySQL高阶讲座之：`MySQL`的`Vector Search`：其在`AI`和相似性搜索中的应用。

各位老铁，双击666！今天咱们不聊八卦，来点硬核的！咱们来扒一扒MySQL的Vector Search，看看这玩意儿到底怎么在AI和相似性搜索里搅风搅雨。开场白：啥是Vector Search？想象一下，你面前摆着一堆照片，让你找出最像“一只可爱的小猫咪”的那张。你怎么找？大概就是凭感觉，看颜色、形状、姿势，然后在脑子里给每张照片打个分。 Vector Search 干的就是类似的事儿。它先把你的数据（比如那些照片、文本、甚至音乐）变成一堆叫做“向量”的数字。这些向量在空间里排兵布阵，距离越近的向量，就代表着数据越相似。这样，你再想找“最像小猫咪”的照片，就变成了在向量空间里找距离最近的向量了。这比传统数据库的精确匹配可灵活多了！传统的数据库只能告诉你“有没有完全一样的猫”，而Vector Search能告诉你“哪个最像”。第一回合：向量化你的数据要玩Vector Search，第一步就是把你的数据变成向量。这步叫做“向量化（Embedding）”。文本向量化：如果你的数据是文本，可以用各种牛逼的模型来向量化，比如： Word2Vec：这老哥比较经典，但 …

继续阅读“MySQL高阶讲座之：`MySQL`的`Vector Search`：其在`AI`和相似性搜索中的应用。”

2025年8月17日

MySQL高级讲座篇之：探讨MySQL的`Vector Search`功能：如何处理向量数据以支持相似性搜索？

各位观众老爷，大家好！我是今天的主讲人，一个在代码堆里摸爬滚打多年的老码农。今天咱们不聊虚的，直接上硬货：MySQL的Vector Search功能，聊聊如何用它来处理向量数据，支持那些让人心动的相似性搜索。开场白：告别“大海捞针”的传统搜索话说，在信息爆炸的时代，传统的关键词搜索就像大海捞针，捞上来的可能全是水草。比如，你想找一张“夕阳下的海滩”的照片，用关键词搜出来的可能全是卖泳装的广告。但有了向量搜索，情况就不一样了。它能理解图片、文本、甚至视频的“语义”，然后根据语义的相似度来找东西。这就像找一个“感觉像夕阳下的海滩”的东西，而不是非得包含那几个关键词。第一部分：什么是向量搜索？别怕，没那么玄乎别被“向量”这两个字吓跑，其实它就是一个包含数字的列表。这些数字代表了数据的一些特征。比如，一张图片可以用一个包含几百甚至几千个数字的向量来表示，这些数字编码了图片的颜色、形状、纹理等等信息。 1.1 向量嵌入（Embedding）：把数据变成数字要把图片、文本变成向量，我们需要用到一个叫做“嵌入模型（Embedding Model）”的东西。你可以把它想象成一个黑盒子，你扔 …

继续阅读“MySQL高级讲座篇之：探讨MySQL的`Vector Search`功能：如何处理向量数据以支持相似性搜索？”

2025年7月23日

Java `Vector API` (JEP 338/448) `SIMD Operations`：CPU 向量指令级并行优化

各位观众老爷，大家好！我是今天的主讲人，很高兴能和大家一起聊聊Java Vector API这玩意儿。这东西听起来高大上，其实说白了，就是让Java也能用上CPU那些贼快的向量指令，让你的代码跑得更快，更省电！今天咱们就来扒一扒这玩意的皮，看看它到底是怎么回事，能干啥，又该咋用。保证让大家听完之后，也能用它来优化自己的代码，让老板刮目相看！开场白：向量是个啥？为啥它这么厉害？咱们先来聊聊向量。这里说的向量，不是数学上的那种箭头，而是CPU里的一种特殊的数据类型。它可以一次性处理多个数据，而不是像以前那样，一个一个地处理。举个例子，假设你要把两个数组里的每个元素都加起来，以前的Java代码可能是这样的： int[] a = {1, 2, 3, 4}; int[] b = {5, 6, 7, 8}; int[] result = new int[4]; for (int i = 0; i < 4; i++) { result[i] = a[i] + b[i]; } 这段代码，CPU要循环4次，每次都做一次加法。但是，如果CPU支持向量指令，它就可以一次性把a数组的前四个元素和 …

继续阅读“Java `Vector API` (JEP 338/448) `SIMD Operations`：CPU 向量指令级并行优化”

2025年7月10日

Redis `Vector Search` 在 AI 大模型中的应用潜力

好的，没问题，直接进入正题！各位老铁，大家好！我是今天的主讲人，一位略懂编程的专家（不敢自称大师，怕被打）。今天咱们聊点硬核的，但保证通俗易懂，那就是Redis Vector Search在AI大模型中的应用潜力。啥是AI大模型？简单说，就是那些参数贼多，能干很多事儿的神经网络，比如生成文本、翻译、写代码等等。这些模型需要海量的数据才能训练出来，训练好了之后，怎么用它来快速找到我们想要的信息，这就是个大问题。传统数据库，像MySQL，找精确匹配还行，但要找“相似”的东西，就有点力不从心了。这时候，Vector Search就派上用场了。一、什么是向量搜索？别怕，不难！向量搜索，顾名思义，就是把东西都变成向量，然后在向量空间里找距离最近的。向量是什么？向量就是一个数字列表。比如，[1.2, 3.4, -0.5, 0.8]就是一个4维向量。怎么把东西变成向量？这就得靠AI模型了。比如，你可以用一个文本嵌入模型（比如Sentence Transformers）把一段文本变成一个向量，这个向量就代表了这段文本的含义。类似的，图像、音频、视频也都可以通过相应的模型变成 …

继续阅读“Redis `Vector Search` 在 AI 大模型中的应用潜力”

2025年7月10日

Redis `Vector Search`：向量相似度搜索与 AI 应用

好，让我们开始这场关于 Redis Vector Search 的技术讲座，主题是：向量相似度搜索与 AI 应用。各位观众，各位朋友，各位未来的人工智能大师们，大家好！今天咱们不整虚的，直接上干货，聊聊 Redis Vector Search 这玩意儿，看看它到底能帮咱们在 AI 的道路上走多远。第一部分：啥是向量，啥是相似度？在深入 Redis Vector Search 之前，咱们得先搞明白两个概念：向量和相似度。向量 (Vector)：别一听这词儿就觉得高大上，其实它就是一堆数字。比如，你可以用一个向量 [0.2, 0.5, 0.1, 0.8] 来表示一篇文章，每个数字代表某个关键词在这篇文章里的重要程度。图像、音频、甚至用户行为，都可以转换成向量。关键在于，向量能把复杂的东西变成计算机能理解的数字。相似度 (Similarity)：有了向量，我们就能算相似度了。相似度就是衡量两个向量有多像的指标。常用的相似度算法有：余弦相似度 (Cosine Similarity)：这是最常用的。它计算的是两个向量夹角的余弦值。余弦值越接近 1，向量越相似；越接近 -1，向量 …

继续阅读“Redis `Vector Search`：向量相似度搜索与 AI 应用”

2025年7月7日

C++ 编写自己的 `std::vector`：从零实现标准库容器

好的，各位老铁，今天咱们要搞点刺激的，手撸一个 C++ 的 std::vector。别害怕，不是让你重新发明轮子，而是让你彻底理解这个轮子是怎么转的。搞明白之后，以后再用 vector，心里就有底了，bug 来了也不慌。第一章：开局一张图，内容全靠编…咳咳，是设计！在开始写代码之前，咱得先想清楚 vector 到底是个啥。它就是一个动态数组，能自动扩容，用起来方便。核心功能无非就这几个：存储元素: 肯定要有个地方放数据，就像你家里的冰箱。动态扩容: 容量不够了，就得自动变大，就像你家的冰箱可以无限扩容（如果真能这样就好了）。随机访问: 像数组一样，可以通过下标快速访问元素。增删元素: 在末尾添加和删除元素是基本操作。获取大小和容量: 知道里面有多少东西，冰箱还有多少空间。用人话说，vector 就是一个可变长的数组，它在内存中是一块连续的空间。第二章：搭积木，从最简单的开始咱们先创建一个 MyVector 类，把基本框架搭起来。 #include <iostream> #include <algorithm> // 为了用到 std::c …

继续阅读“C++ 编写自己的 `std::vector`：从零实现标准库容器”