Python高级技术之：`SQLAlchemy`的事务管理：`autocommit`和`autoflush`的用法。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

咳咳，各位观众老爷们，今天咱们来聊聊 SQLAlchemy 这门手艺里的“自动挡”—— autocommit 和 autoflush。别怕，不是教你们开挖掘机，是让你的数据库操作更丝滑。

开场白：数据库界的“自动化”

在数据库的世界里，事务管理就像一个精密的齿轮系统，保证数据的一致性和完整性。但是，手动控制每一个齿轮，rollback, commit，未免显得有点笨重。所以，SQLAlchemy 提供了 autocommit 和 autoflush 这两个“自动化”功能，让你的数据库操作在某些场景下可以更加便捷。

第一部分：autocommit——“自动提交”的诱惑

autocommit，顾名思义，就是“自动提交”。当你开启了这个选项，SQLAlchemy 会在你每次执行完一个 SQL 语句后，自动帮你提交事务。这就像你的银行卡开通了“小额免密支付”，每次消费都会自动扣款，省去了输密码的麻烦。

1.1 autocommit 的开启方式

在 SQLAlchemy 中，autocommit 是通过 create_engine 函数来配置的。

from sqlalchemy import create_engine

# 开启 autocommit 模式
engine = create_engine('postgresql://user:password@host:port/database', isolation_level="AUTOCOMMIT")

# 关闭 autocommit 模式(默认)
engine = create_engine('postgresql://user:password@host:port/database')

注意，不同的数据库后端，isolation_level的参数值可能不一样。比如MySQL是"AUTOCOMMIT"或者"READ COMMITTED"，PostgreSQL是 "AUTOCOMMIT"。具体查阅对应数据库的SQLAlchemy文档。

1.2 autocommit 的“自动”在哪里？

开启 autocommit 后，以下操作会被自动提交：

DDL 语句: 例如 CREATE TABLE, ALTER TABLE, DROP TABLE 等。
DML 语句: 例如 INSERT, UPDATE, DELETE 等。

from sqlalchemy import create_engine, text

engine = create_engine('sqlite:///:memory:', isolation_level="AUTOCOMMIT") # 使用内存数据库，方便演示

with engine.connect() as conn:
    conn.execute(text("CREATE TABLE users (id INTEGER PRIMARY KEY, name VARCHAR(255))"))
    conn.execute(text("INSERT INTO users (name) VALUES ('Alice')"))
    conn.execute(text("INSERT INTO users (name) VALUES ('Bob')"))

    result = conn.execute(text("SELECT * FROM users"))
    for row in result:
        print(row)  # 结果会立即显示，因为事务已经自动提交

1.3 autocommit 的“坑”：小心驶得万年船

虽然 autocommit 看起来很方便，但是也存在一些潜在的风险：

原子性问题: 如果一系列操作需要保证原子性（要么全部成功，要么全部失败），那么 autocommit 模式下，一旦其中一个操作失败，之前的操作已经提交，无法回滚。
性能问题: 频繁的提交操作会增加数据库的负担，降低性能。

1.4 autocommit 的适用场景

autocommit 并非一无是处，它在某些场景下还是很有用的：

DDL 操作: 对于创建、修改表结构等操作，使用 autocommit 可以简化代码。
不重要的单条数据修改: 如果只是修改一些无关紧要的数据，并且不需要保证原子性，那么使用 autocommit 可以提高效率。

1.5 autocommit 总结

特性	描述	优点	缺点	适用场景
自动提交	每次执行完 SQL 语句后，自动提交事务。	简化代码，提高效率（对于某些场景）。	无法保证原子性，频繁提交会降低性能。	DDL 操作，不重要的单条数据修改。
开启方式	通过 `create_engine` 函数的 `isolation_level` 参数配置。
注意事项	需要谨慎使用，避免在需要保证原子性的场景下使用。

第二部分：autoflush——“自动刷新”的秘密

autoflush，可以理解为“自动刷新”。它控制着 Session 何时将挂起的更改（例如，通过 session.add() 添加的对象，或者对已加载对象的修改）刷新到数据库。简单来说，就是Session在什么时候把内存里面的数据变化同步到数据库。

2.1 autoflush 的默认行为

默认情况下，autoflush 是开启的。这意味着在执行某些查询操作之前，SQLAlchemy 会自动将 Session 中挂起的更改刷新到数据库。

from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.orm import sessionmaker
from sqlalchemy.ext.declarative import declarative_base

engine = create_engine('sqlite:///:memory:')
Base = declarative_base()

class User(Base):
    __tablename__ = 'users'
    id = Column(Integer, primary_key=True)
    name = Column(String)

Base.metadata.create_all(engine)

Session = sessionmaker(bind=engine)
session = Session()

user1 = User(name='Charlie')
session.add(user1)

# 在执行查询之前，autoflush 会自动将 user1 的信息插入到数据库
result = session.query(User).filter_by(name='Charlie').first()
print(result.name) # 输出 Charlie

在这个例子中，虽然我们只是 session.add(user1)，还没有显式地 session.commit()，但是当我们执行 session.query() 查询时，autoflush 会自动将 user1 的信息插入到数据库，保证查询结果是最新的。

2.2 关闭 autoflush 的方法

你可以通过以下几种方式关闭 autoflush：

Session 级别: 在创建 Session 时，设置 autoflush=False。
上下文管理器: 使用 with session.no_autoflush: 上下文管理器。

from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.orm import sessionmaker
from sqlalchemy.ext.declarative import declarative_base

engine = create_engine('sqlite:///:memory:')
Base = declarative_base()

class User(Base):
    __tablename__ = 'users'
    id = Column(Integer, primary_key=True)
    name = Column(String)

Base.metadata.create_all(engine)

# Session 级别关闭 autoflush
Session = sessionmaker(bind=engine, autoflush=False)
session = Session()

user1 = User(name='David')
session.add(user1)

# 查询操作不会触发 autoflush
result = session.query(User).filter_by(name='David').first()
print(result) # 输出 None，因为数据还没有刷新到数据库

session.commit() # 手动提交后，数据才会刷新到数据库

result = session.query(User).filter_by(name='David').first()
print(result.name) # 输出 David

# 上下文管理器关闭 autoflush
with session.no_autoflush:
    user2 = User(name='Eve')
    session.add(user2)
    result = session.query(User).filter_by(name='Eve').first()
    print(result) #输出 None, 即使在session里面

2.3 autoflush 的触发时机

即使 autoflush 是开启的，它也不是每次操作都会触发。以下情况会触发 autoflush：

执行查询操作: 例如 session.query(), session.execute(), session.scalar() 等。
显式调用 session.flush(): 手动刷新 Session。
事务提交: session.commit()。

2.4 autoflush 的作用

autoflush 的主要作用是保证查询结果的准确性。它可以确保你在查询数据时，看到的是最新的状态，而不是 Session 内存中的旧数据。

2.5 autoflush 的适用场景

需要保证查询结果准确性的场景: 例如，在执行复杂的业务逻辑之前，需要先查询数据库中的最新数据。
需要手动控制刷新时机的场景: 例如，在批量操作数据时，可以先关闭 autoflush，等所有操作完成后再手动刷新，以提高性能。

2.6 autoflush 总结

特性	描述	优点	缺点	适用场景
自动刷新	在执行某些查询操作之前，自动将 Session 中挂起的更改刷新到数据库。	保证查询结果的准确性。	可能会影响性能（频繁刷新）。	需要保证查询结果准确性的场景，需要手动控制刷新时机的场景。
关闭方式	通过 Session 级别的 `autoflush=False` 或者 `with session.no_autoflush:` 上下文管理器关闭。
触发时机	执行查询操作，显式调用 `session.flush()`，事务提交。
注意事项	需要根据实际场景选择是否关闭 `autoflush`，避免出现数据不一致的情况。

第三部分：autocommit 和 autoflush 的区别

虽然 autocommit 和 autoflush 都涉及到“自动”操作，但它们的作用范围和影响是不同的：

特性	`autocommit`	`autoflush`
作用范围	作用于整个 Engine，控制事务的提交。	作用于 Session，控制 Session 中挂起的更改何时刷新到数据库。
影响对象	影响 DDL 和 DML 语句的提交。	影响 Session 中对象的状态（例如，新添加的对象，或者对已加载对象的修改）。
目的	简化事务管理，提高效率（对于某些场景）。	保证查询结果的准确性。
开启/关闭方式	通过 `create_engine` 函数的 `isolation_level` 参数配置。	通过 Session 级别的 `autoflush=False` 或者 `with session.no_autoflush:` 上下文管理器关闭。

可以理解为：

autocommit 决定了你的数据什么时候被“永久保存”到数据库。
autoflush 决定了你的 Session 什么时候将内存中的数据“同步”到数据库，以便进行查询。

第四部分：最佳实践：如何正确使用“自动化”功能

谨慎使用 autocommit: 除非你非常清楚自己在做什么，并且不需要保证原子性，否则建议不要开启 autocommit。最好使用显式的事务管理（session.begin(), session.commit(), session.rollback()）来控制事务的边界。
根据需要调整 autoflush: 在需要保证查询结果准确性的场景下，保持 autoflush 开启。在批量操作数据时，可以先关闭 autoflush，等所有操作完成后再手动刷新，以提高性能。
结合使用 autocommit 和 autoflush: 虽然 autocommit 和 autoflush 可以单独使用，但是在某些场景下，它们也可以结合使用。例如，你可以在开启 autocommit 的同时，关闭 autoflush，以实现更精细的控制。

第五部分：实战演练：一个完整的例子

下面是一个结合使用 autocommit 和 autoflush 的例子：

from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.orm import sessionmaker
from sqlalchemy.ext.declarative import declarative_base

# 开启 autocommit 模式
engine = create_engine('sqlite:///:memory:', isolation_level="AUTOCOMMIT")
Base = declarative_base()

class Product(Base):
    __tablename__ = 'products'
    id = Column(Integer, primary_key=True)
    name = Column(String)
    price = Column(Integer)

Base.metadata.create_all(engine)

Session = sessionmaker(bind=engine, autoflush=False) # 关闭 autoflush
session = Session()

try:
    # 批量添加商品
    session.add(Product(name='Apple', price=5))
    session.add(Product(name='Banana', price=2))
    session.add(Product(name='Orange', price=3))

    # 手动刷新 Session，将数据插入到数据库
    session.flush()

    # 查询所有商品
    products = session.query(Product).all()
    for product in products:
        print(f"{product.name}: {product.price}")

    # 提交事务（由于开启了 autocommit，实际上这一步是多余的，但是为了代码的完整性，还是加上）
    session.commit()

except Exception as e:
    print(f"发生错误: {e}")
    session.rollback()

finally:
    session.close()

在这个例子中，我们开启了 autocommit，关闭了 autoflush。这样，我们可以在批量添加商品后，手动刷新 Session，然后一次性提交事务。这可以提高性能，并且保证数据的一致性。

总结：掌握“自动化”的艺术

autocommit 和 autoflush 是 SQLAlchemy 提供的两个强大的“自动化”功能。掌握它们的使用方法，可以让你在数据库操作中更加游刃有余。但是，需要注意的是，任何“自动化”功能都存在潜在的风险，需要谨慎使用，避免出现数据不一致的情况。只有真正理解了它们的原理和适用场景，才能发挥它们的最大价值。

好了，今天的讲座就到这里。希望大家能够熟练掌握 autocommit 和 autoflush 这两门手艺，在数据库的世界里玩得更溜！感谢各位观众老爷的观看！

发表回复 取消回复

发表回复取消回复