Psycopg2/MySQLdb 连接池：数据库连接的高效管理 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众，晚上好！欢迎来到“数据库连接池：高效管理的那些事儿”讲座。我是今天的讲师，江湖人称“码农老王”，今天跟大家聊聊数据库连接池这个既重要又容易被忽视的话题。

开场白：别让你的数据库连接“堵车”

咱们写程序的时候，尤其是Web应用，经常要跟数据库打交道。想象一下，每次需要从数据库拿点数据，就新建一个连接，用完就关掉。这就像每次你想过个马路，就造一辆汽车，过了马路就扔掉。是不是很浪费？而且速度慢得像蜗牛爬。

数据库连接的建立和销毁，其实是很耗费资源的。频繁地这样做，会让你的程序性能大打折扣，甚至导致数据库服务器崩溃，就像交通高峰期的大堵车。

这时候，连接池就闪亮登场了！它就像一个停车场，预先建立好一批数据库连接，放在那里等待使用。程序需要连接的时候，直接从池子里拿一个，用完再还回去。这样就避免了频繁建立和销毁连接的开销，大大提高了效率。

什么是连接池？

说白了，连接池就是一个“连接仓库”，里面存放着已经建立好的数据库连接。它的作用是：

复用连接： 避免频繁创建和销毁连接的开销。
提高性能： 连接获取速度更快，减少响应时间。
资源控制： 限制最大连接数，防止数据库服务器过载。

为什么要用连接池？

咱们用个形象的比喻：

操作	不使用连接池	使用连接池
请求数据库	每次都建立新连接	直接从连接池获取连接
响应速度	慢，耗时	快，几乎瞬间
资源消耗	高，频繁创建销毁连接	低，连接复用
并发能力	差，易崩溃	强，能处理更多并发请求

总结一下，不用连接池就像每次出门都现造车，用了连接池就像直接去停车场开车。哪个更方便快捷，一目了然！

Python中的连接池：Psycopg2 和 MySQLdb

Python中，我们经常使用 Psycopg2 和 MySQLdb 这两个库来连接 PostgreSQL 和 MySQL 数据库。它们都支持连接池，下面我们就分别来看看如何使用。

1. Psycopg2 连接池 (PostgreSQL)

Psycopg2 提供了多种连接池的实现方式，最常用的是 psycopg2.pool 模块中的 SimpleConnectionPool, ThreadedConnectionPool 和 PersistentConnectionPool。

SimpleConnectionPool: 最简单的连接池，不考虑线程安全。
ThreadedConnectionPool: 线程安全的连接池，适合多线程环境。
PersistentConnectionPool: 持久连接池，连接在进程生命周期内保持可用。

这里我们重点介绍 ThreadedConnectionPool，因为它在Web应用中更常用。

示例代码：

import psycopg2
from psycopg2 import pool

# 数据库连接信息
db_params = {
    'dbname': 'your_dbname',
    'user': 'your_user',
    'password': 'your_password',
    'host': 'your_host',
    'port': 'your_port'
}

# 创建连接池
try:
    connection_pool = pool.ThreadedConnectionPool(5, 20, **db_params) # minconn=5, maxconn=20
    print("PostgreSQL连接池创建成功！")
except Exception as e:
    print(f"创建连接池失败：{e}")
    exit()

def get_data_from_db():
    """从数据库获取数据的函数"""
    conn = None
    cursor = None
    try:
        # 从连接池获取连接
        conn = connection_pool.getconn()
        cursor = conn.cursor()

        # 执行SQL查询
        cursor.execute("SELECT * FROM your_table")
        data = cursor.fetchall()

        # 处理数据
        for row in data:
            print(row)

        # 提交事务
        conn.commit()

    except Exception as e:
        print(f"查询数据失败：{e}")
        if conn:
            conn.rollback() # 回滚事务

    finally:
        # 关闭游标
        if cursor:
            cursor.close()
        # 将连接放回连接池
        if conn:
            connection_pool.putconn(conn)  # 归还连接

# 调用函数获取数据
get_data_from_db()

# 关闭连接池 (程序退出时)
connection_pool.closeall()
print("PostgreSQL连接池已关闭！")

代码解释：

引入模块： 导入 psycopg2 和 psycopg2.pool 模块。
数据库连接信息： 定义数据库连接参数，包括数据库名、用户名、密码、主机地址和端口号。请替换成你自己的数据库信息。
创建连接池： 使用 pool.ThreadedConnectionPool() 创建连接池。
- minconn: 最小连接数，即连接池启动时就创建的连接数量。
- maxconn: 最大连接数，即连接池中允许存在的最大连接数量。
- **db_params: 将数据库连接参数以字典的形式传递给连接池。
获取连接： 使用 connection_pool.getconn() 从连接池中获取一个连接。如果连接池中没有可用连接，并且连接数未达到最大值，则会创建一个新的连接。如果连接数已达到最大值，则会阻塞等待，直到有连接被释放。
执行SQL查询： 使用获取的连接和游标执行SQL查询。
提交事务： 如果SQL查询涉及到数据修改，需要调用 conn.commit() 提交事务。
回滚事务： 如果发生异常，需要调用 conn.rollback() 回滚事务，保证数据一致性。
释放连接： 使用 connection_pool.putconn(conn) 将连接放回连接池。务必确保每次使用完连接后都将其放回连接池，否则会导致连接耗尽。
关闭连接池： 在程序退出时，需要调用 connection_pool.closeall() 关闭连接池，释放所有连接。

注意事项：

try...except...finally 语句：确保在任何情况下都能正确释放连接，避免连接泄漏。
conn.rollback()：在发生异常时，回滚事务，防止数据不一致。
连接池大小： minconn 和 maxconn 的设置需要根据实际情况进行调整。连接数太少会导致并发能力不足，连接数太多会导致数据库服务器压力过大。

2. MySQLdb 连接池 (MySQL)

虽然 MySQLdb 已经不再积极维护，但它仍然被广泛使用。 MySQLdb 本身没有提供内置的连接池，但我们可以使用第三方库来实现连接池，例如 DBUtils。另外也可以选择 PyMySQL，它是 MySQLdb 的一个纯 Python 实现，并提供了一些增强功能，包括连接池。这里我们选择 PyMySQL。

示例代码：

import pymysql
from dbutils.pooled_db import PooledDB

# 数据库连接信息
db_params = {
    'host': 'your_host',
    'port': your_port,
    'user': 'your_user',
    'password': 'your_password',
    'database': 'your_database',
    'charset': 'utf8mb4',
    'cursorclass': pymysql.cursors.DictCursor  # 返回字典形式的结果
}

# 创建连接池
try:
    connection_pool = PooledDB(
        creator=pymysql,  # 使用 PyMySQL 作为连接库
        maxconnections=20,  # 最大连接数
        mincached=5,       # 最小连接数
        maxcached=10,      # 最大缓存连接数
        maxshared=5,       # 最大共享连接数
        blocking=True,     # 连接池已满时是否阻塞
        **db_params
    )
    print("MySQL连接池创建成功！")
except Exception as e:
    print(f"创建连接池失败：{e}")
    exit()

def get_data_from_db():
    """从数据库获取数据的函数"""
    conn = None
    cursor = None
    try:
        # 从连接池获取连接
        conn = connection_pool.connection()
        cursor = conn.cursor()

        # 执行SQL查询
        cursor.execute("SELECT * FROM your_table")
        data = cursor.fetchall()

        # 处理数据
        for row in data:
            print(row)

        # 提交事务
        conn.commit()

    except Exception as e:
        print(f"查询数据失败：{e}")
        if conn:
            conn.rollback()  # 回滚事务

    finally:
        # 关闭游标
        if cursor:
            cursor.close()
        # 将连接放回连接池
        if conn:
            conn.close()  # 关闭连接，连接会放回连接池

# 调用函数获取数据
get_data_from_db()

# 关闭连接池 (DBUtils 没有提供显式的关闭连接池的方法，连接会在程序结束时自动关闭)
print("MySQL连接池已关闭！(自动)")

代码解释：

引入模块： 导入 pymysql 和 dbutils.pooled_db 模块。
数据库连接信息： 定义数据库连接参数。
- charset: 设置字符集，避免中文乱码问题。
- cursorclass: 设置游标类型，pymysql.cursors.DictCursor 返回字典形式的结果，方便使用。
创建连接池： 使用 PooledDB() 创建连接池。
- creator: 指定连接库，这里使用 pymysql。
- maxconnections: 最大连接数。
- mincached: 最小连接数。
- maxcached: 最大缓存连接数。
- maxshared: 最大共享连接数。
- blocking: 连接池已满时是否阻塞，设置为 True 表示阻塞等待。
- **db_params: 将数据库连接参数以字典的形式传递给连接池。
获取连接： 使用 connection_pool.connection() 从连接池中获取一个连接。
执行SQL查询： 使用获取的连接和游标执行SQL查询。
提交事务： 如果SQL查询涉及到数据修改，需要调用 conn.commit() 提交事务。
回滚事务： 如果发生异常，需要调用 conn.rollback() 回滚事务，保证数据一致性。
关闭连接： 使用 conn.close() 关闭连接。注意，这里不是真正关闭连接，而是将连接放回连接池。
关闭连接池： DBUtils 没有提供显式的关闭连接池的方法，连接会在程序结束时自动关闭。

注意事项：

charset: 设置正确的字符集，避免中文乱码问题。
cursorclass: 选择合适的游标类型，DictCursor 返回字典形式的结果，更方便使用。
conn.close()：务必确保每次使用完连接后都调用 conn.close() 将连接放回连接池。

连接池参数调优：

连接池的参数设置，直接影响到程序的性能和稳定性。下面是一些常用的参数及其调优建议：

参数	说明	调优建议
`minconn`/`mincached`	最小连接数，即连接池启动时就创建的连接数量。	根据并发请求量和数据库服务器的负载能力进行调整。如果并发请求量较小，可以设置较小的 `minconn` 值。如果并发请求量较大，可以适当增加 `minconn` 值，避免频繁创建连接的开销。但也要注意，`minconn` 值过大，会占用过多的数据库资源。
`maxconn`/`maxconnections`	最大连接数，即连接池中允许存在的最大连接数量。	根据数据库服务器的负载能力进行调整。如果数据库服务器性能较好，可以适当增加 `maxconn` 值，提高并发能力。如果数据库服务器性能较差，应该限制 `maxconn` 值，防止数据库服务器过载。同时也要考虑应用程序的并发请求量，`maxconn` 值应该能够满足应用程序的并发需求。
`maxshared`	最大共享连接数，仅适用于 `DBUtils`。	`maxshared` 指的是可以被多个线程共享的连接数量。通常情况下，`maxshared` 可以设置为一个较小的值，例如 5 或 10。如果应用程序中存在大量的短连接请求，可以适当增加 `maxshared` 值。
`blocking`	连接池已满时是否阻塞，仅适用于 `DBUtils`。	设置为 `True` 表示阻塞等待，直到有连接可用。设置为 `False` 表示抛出异常。通常情况下，建议设置为 `True`，避免应用程序因为连接池已满而崩溃。但如果应用程序对响应时间要求非常高，可以设置为 `False`，并捕获异常进行处理。
连接超时时间	连接在连接池中空闲的最大时间。	设置连接超时时间可以避免连接长时间占用资源。如果连接在连接池中空闲时间超过设定的超时时间，连接会被自动关闭。具体的超时时间需要根据应用程序的实际情况进行调整。
连接检测机制	定期检测连接的有效性，避免使用失效的连接。	连接检测机制可以定期发送一个简单的 SQL 查询到数据库服务器，检测连接是否仍然有效。如果连接失效，连接会被自动关闭，并从连接池中移除。连接检测机制可以提高应用程序的稳定性和可靠性。

最佳实践：

选择合适的连接池库： 根据数据库类型和应用场景选择合适的连接池库。
配置合理的连接池参数： 根据数据库服务器的负载能力和应用程序的并发需求，配置合理的连接池参数。
确保正确释放连接： 务必确保每次使用完连接后都将其放回连接池，避免连接泄漏。
处理连接异常： 捕获连接异常，并进行适当的处理，例如重试连接、回滚事务等。
监控连接池状态： 监控连接池的状态，例如连接数、活跃连接数、空闲连接数等，及时发现和解决问题。
考虑连接池的生命周期： 连接池的生命周期应该与应用程序的生命周期保持一致。在应用程序启动时创建连接池，在应用程序退出时关闭连接池。
使用连接池管理工具： 可以使用一些连接池管理工具来简化连接池的管理和维护工作。例如，可以使用 pgbouncer 或 proxysql 作为 PostgreSQL 或 MySQL 的连接池代理。

总结：

连接池是数据库连接管理的重要技术，可以显著提高应用程序的性能和稳定性。通过合理配置连接池参数和遵循最佳实践，可以充分发挥连接池的优势，让你的程序像火箭一样飞快！

好了，今天的讲座就到这里。感谢大家的聆听！希望大家以后都能用好连接池，让你的数据库连接不再“堵车”！祝大家编程愉快！散会！

发表回复 取消回复

发表回复取消回复