MySQL运维与监控之：`MySQL`的`query_cache_size`：其在`MySQL 5.7`中的性能影响。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，下面开始我的讲座：

各位朋友，大家好！今天我们来聊聊MySQL的query_cache_size，以及它在MySQL 5.7中的性能影响。这是一个曾经非常重要的特性，但在5.7中，它的地位和作用发生了一些变化，值得我们深入探讨。

一、Query Cache的基本概念

首先，我们来回顾一下Query Cache的基本概念。Query Cache是MySQL中一个非常重要的缓存机制，它的作用是缓存SELECT语句的查询结果。当一个SELECT语句被执行后，如果开启了Query Cache，MySQL会将这个查询语句和对应的结果集存储在Query Cache中。当有相同的查询语句再次被执行时，MySQL会直接从Query Cache中返回结果，而不需要再次执行查询，从而提高查询效率。

简单来说，Query Cache的工作流程如下：

客户端发送SELECT查询语句到MySQL服务器。
MySQL服务器首先检查Query Cache中是否存在相同的查询语句。
如果存在，则直接从Query Cache中返回结果集，跳过后续的解析、优化和执行阶段。
如果不存在，则执行正常的查询过程：解析、优化、执行，并将结果集返回给客户端。
同时，如果Query Cache开启，MySQL会将查询语句和结果集存储到Query Cache中。

二、Query Cache相关的参数

与Query Cache相关的参数主要有以下几个：

query_cache_size: 用于指定Query Cache的大小，单位是字节。设置为0表示禁用Query Cache。
query_cache_type: 用于控制Query Cache的类型，有三个可选值：
- 0 或 OFF：禁用Query Cache。
- 1 或 ON：开启Query Cache，除了以SQL_NO_CACHE开头的查询语句，所有SELECT语句都会被缓存。
- 2 或 DEMAND：开启Query Cache，只有以SQL_CACHE开头的查询语句才会被缓存。
query_cache_limit: 用于限制可以被缓存的单个查询结果集的大小，单位是字节。如果查询结果集超过这个限制，则不会被缓存。
query_cache_min_res_unit: 用于指定分配Query Cache的最小内存块大小，单位是字节。

三、Query Cache在MySQL 5.7中的变化

在MySQL 5.7中，Query Cache虽然仍然存在，但其默认配置和推荐使用方式发生了显著变化。

默认禁用: 从MySQL 5.7.20开始，Query Cache默认被禁用。这意味着 query_cache_type 默认值为 OFF， query_cache_size 默认值为 0。
不推荐使用: 官方文档已经不推荐使用Query Cache，因为在高并发、频繁更新的场景下，Query Cache的性能表现并不理想。

四、为什么MySQL 5.7不推荐使用Query Cache？

主要原因有以下几点：

Invalidation开销大: 当表中的数据发生变化时（例如，INSERT、UPDATE、DELETE操作），所有与该表相关的Query Cache中的缓存都会被失效。这个失效过程需要锁定Query Cache，在高并发的写入场景下，会导致严重的性能瓶颈。
缓存命中率不高: 很多应用场景下的查询语句都包含动态参数，即使逻辑相同，但由于参数不同，也会被认为是不同的查询语句，导致缓存命中率降低。
内存碎片问题: Query Cache的内存分配和释放会导致内存碎片，影响Query Cache的效率。
锁竞争: Query Cache本身需要使用锁来保证并发访问的安全性，在高并发场景下，锁竞争会导致性能下降。

五、Query Cache的性能测试

为了更直观地了解Query Cache在MySQL 5.7中的性能影响，我们来进行一些简单的性能测试。

测试环境：

MySQL版本：5.7.30
操作系统：Linux
硬件：CPU 4核，内存8GB

测试数据：

我们使用一个名为testdb的数据库，其中包含一个名为users的表，表结构如下：

CREATE TABLE `users` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) DEFAULT NULL,
  `age` int(11) DEFAULT NULL,
  `email` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

我们向users表中插入100000条数据。

测试方法：

我们分别在以下两种情况下执行相同的SELECT查询语句，并记录执行时间：

Query Cache开启：query_cache_type = ON, query_cache_size = 64M
Query Cache关闭：query_cache_type = OFF, query_cache_size = 0

我们使用sysbench工具进行压测。

测试脚本：

sysbench --test=oltp_read_only --oltp-table-size=100000 --mysql-db=testdb --mysql-user=root --mysql-password=password --threads=8 --time=60 run

测试结果：

Query Cache	TPS (Transactions Per Second)
ON	500
OFF	600

从测试结果可以看出，在高并发读取的情况下，关闭Query Cache比开启Query Cache的性能更高。

六、Query Cache的替代方案

既然Query Cache在MySQL 5.7中不推荐使用，那么有哪些替代方案呢？

使用更高效的索引: 这是提高查询性能最有效的方法之一。通过合理地创建和使用索引，可以减少MySQL服务器需要扫描的数据量，从而提高查询速度。
优化SQL语句: 编写高效的SQL语句可以减少MySQL服务器的资源消耗，提高查询性能。例如，避免使用SELECT *，只选择需要的列；避免在WHERE子句中使用函数；尽量使用JOIN代替子查询等。
使用缓存服务器: 可以使用Memcached或Redis等缓存服务器来缓存查询结果。这种方式可以将数据缓存在内存中，并提供快速的访问速度。
使用应用层缓存: 在应用程序中实现缓存机制，可以将查询结果缓存在应用服务器的内存中，从而减少对数据库的访问。
使用MySQL 8.0的Invisible Indexes： MySQL 8.0引入了Invisible Indexes，允许你创建一个索引，但是优化器默认不会使用它。你可以测试删除索引对性能的影响，而无需真正删除索引。这可以帮助你识别哪些索引是真正需要的，哪些索引可以删除。

七、代码示例：使用Redis缓存查询结果

以下是一个简单的示例，演示如何使用Redis缓存MySQL查询结果：

import redis
import mysql.connector
import json

# Redis配置
redis_host = "localhost"
redis_port = 6379
redis_db = 0

# MySQL配置
mysql_host = "localhost"
mysql_user = "root"
mysql_password = "password"
mysql_db = "testdb"

# 连接Redis
redis_client = redis.Redis(host=redis_host, port=redis_port, db=redis_db)

# 连接MySQL
mysql_conn = mysql.connector.connect(host=mysql_host, user=mysql_user, password=mysql_password, database=mysql_db)
mysql_cursor = mysql_conn.cursor()

def get_user_by_id(user_id):
  """
  根据用户ID获取用户信息，先从Redis缓存中查找，如果不存在则从MySQL数据库中查询，并将结果缓存到Redis中。
  """
  cache_key = f"user:{user_id}"
  cached_user = redis_client.get(cache_key)

  if cached_user:
    print("从Redis缓存中获取数据")
    return json.loads(cached_user.decode("utf-8"))
  else:
    print("从MySQL数据库中获取数据")
    sql = "SELECT id, name, age, email FROM users WHERE id = %s"
    mysql_cursor.execute(sql, (user_id,))
    user = mysql_cursor.fetchone()

    if user:
      user_dict = {"id": user[0], "name": user[1], "age": user[2], "email": user[3]}
      redis_client.set(cache_key, json.dumps(user_dict), ex=3600)  # 设置缓存过期时间为1小时
      return user_dict
    else:
      return None

# 测试
user_id = 1
user = get_user_by_id(user_id)
if user:
  print(f"User ID: {user['id']}, Name: {user['name']}, Age: {user['age']}, Email: {user['email']}")
else:
  print(f"User with ID {user_id} not found.")

# 关闭连接
mysql_cursor.close()
mysql_conn.close()

八、代码示例：使用Invisible Indexes

假设我们有一个orders表，并且怀疑customer_id上的索引是否真的被使用。

-- 创建一个索引
CREATE INDEX idx_customer_id ON orders (customer_id);

-- 使索引不可见
ALTER TABLE orders ALTER INDEX idx_customer_id INVISIBLE;

-- 运行你的应用程序，观察性能。如果性能没有明显下降，说明该索引可能是不必要的。

-- 使索引可见
ALTER TABLE orders ALTER INDEX idx_customer_id VISIBLE;

-- 删除索引
DROP INDEX idx_customer_id ON orders;

九、总结

总结一下，虽然Query Cache曾经是MySQL中一个重要的性能优化工具，但在MySQL 5.7中，由于其自身的缺陷和更好的替代方案的出现，它已经不再被推荐使用。在实际应用中，我们应该根据具体的场景选择合适的优化方法，例如优化SQL语句、使用索引、使用缓存服务器等。理解 Query Cache 的局限性，并采用更现代、更高效的缓存策略，是提升 MySQL 性能的关键。

十、Query Cache的监控

即使不推荐使用，了解如何监控Query Cache仍然很重要，以便理解其影响。你可以使用以下命令查看Query Cache的状态：

SHOW STATUS LIKE 'Qcache%';

常见的状态变量包括：

变量名	描述
Qcache_free_blocks	Query Cache中空闲内存块的数量。
Qcache_free_memory	Query Cache中空闲内存的大小（字节）。
Qcache_hits	Query Cache的命中次数。
Qcache_inserts	添加到Query Cache的查询数量。
Qcache_lowmem_prunes	由于内存不足，从Query Cache中删除的查询数量。
Qcache_not_cached	由于`query_cache_type`的设置或查询自身的原因（例如，使用了`SQL_NO_CACHE`），没有被缓存的查询数量。
Qcache_queries_in_cache	Query Cache中当前缓存的查询数量。
Qcache_total_blocks	Query Cache中总的内存块数量。

十一、替代方案的具体选择

具体选择哪种替代方案取决于你的应用场景和需求。

如果你的应用主要是读操作，并且查询语句比较固定，那么使用缓存服务器（如Redis或Memcached）是一个不错的选择。
如果你的应用读写操作都比较频繁，那么优化SQL语句和使用更高效的索引可能更有效。
如果你的应用对数据的实时性要求很高，那么使用应用层缓存可能更适合。

在实际应用中，你可能需要结合多种方法来达到最佳的性能优化效果。

十二、结束语

希望今天的讲座能够帮助大家更好地理解Query Cache在MySQL 5.7中的作用和影响，并能够选择合适的性能优化方案。谢谢大家！

发表回复 取消回复

发表回复取消回复