深入理解`Python`的`闭包`和`非局部变量`，并解析其在`函数工厂`中的`应用`。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Python闭包、非局部变量与函数工厂：一场深入探索

各位朋友，大家好。今天我们来聊聊Python中一个非常重要且强大的概念：闭包。闭包往往和非局部变量紧密相连，并广泛应用于函数工厂的设计模式中。理解闭包，能帮助我们写出更加灵活、高效和优雅的代码。

1. 什么是闭包？

简单来说，闭包是一个函数对象，它记住并访问了其词法作用域内的变量，即使在其词法作用域之外被执行。换句话说，一个函数携带了它定义时的环境信息。

要理解闭包，首先要回顾Python的作用域规则：

LEGB原则： Local, Enclosing, Global, Built-in。当我们在函数内部查找一个变量时，Python会按照这个顺序查找。
- Local: 当前函数的作用域。
- Enclosing: 包含当前函数的外部函数的作用域。
- Global: 全局作用域。
- Built-in: 内置作用域。

那么，闭包的关键就在于“Enclosing”作用域。当一个内部函数引用了外部函数作用域中的变量，并且外部函数返回了这个内部函数，那么就形成了一个闭包。这个内部函数就“关闭”并“包围”了外部函数作用域中的变量。

让我们看一个简单的例子：

def outer_function(x):
    def inner_function(y):
        return x + y  # inner_function 引用了 outer_function 的变量 x
    return inner_function

closure = outer_function(10)  # outer_function 返回 inner_function
result = closure(5)  # 调用 closure(5) 实际上是在调用 inner_function(5)，但 x 的值仍然是 10
print(result)  # 输出 15

在这个例子中，inner_function 是一个闭包。它引用了 outer_function 的变量 x。即使 outer_function 已经执行完毕，返回了 inner_function，x 的值仍然被 inner_function 记住。当我们调用 closure(5) 时，实际上是在调用 inner_function(5)，但 x 的值仍然是 10，所以结果是 15。

2. 闭包的必要条件

要形成闭包，需要满足以下三个条件：

必须有一个嵌套函数（内部函数）。
内部函数必须引用封闭函数（外部函数）中的变量。
封闭函数必须返回内部函数。

如果缺少任何一个条件，就不能形成闭包。

3. 为什么需要闭包？

闭包提供了一种将数据与函数关联起来的方法，即使函数在其定义作用域之外执行。这在很多情况下都非常有用：

数据封装： 闭包可以用来创建私有变量，防止外部直接访问和修改。
状态保持： 闭包可以用来保存函数的状态，使得函数在多次调用之间可以记住一些信息。
代码复用： 闭包可以用来创建更加灵活和可复用的函数。
延迟计算： 闭包可以用来实现延迟计算，只在需要的时候才计算结果。

4. 非局部变量 (Nonlocal Variables)

在闭包中，内部函数引用的外部函数作用域中的变量被称为非局部变量 (nonlocal variables)。默认情况下，在内部函数中直接修改外部函数作用域中的变量是不允许的。如果你尝试这样做，Python会认为你在内部函数中创建了一个新的局部变量，与外部函数中的变量同名而已。

def outer_function():
    x = 10
    def inner_function():
        x = 20  # 在 inner_function 中创建了一个新的局部变量 x
        print("inner:", x)  # 输出 "inner: 20"
    inner_function()
    print("outer:", x)  # 输出 "outer: 10"

outer_function()

为了在内部函数中修改外部函数作用域中的变量，我们需要使用 nonlocal 关键字来声明变量。

def outer_function():
    x = 10
    def inner_function():
        nonlocal x  # 声明 x 是一个非局部变量，引用 outer_function 中的 x
        x = 20
        print("inner:", x)  # 输出 "inner: 20"
    inner_function()
    print("outer:", x)  # 输出 "outer: 20"

outer_function()

使用 nonlocal 关键字告诉 Python，x 不是一个局部变量，而是外部函数作用域中的变量。这样，在 inner_function 中修改 x 的值，实际上是在修改 outer_function 中的 x 的值。

5. global 关键字

与 nonlocal 类似，global 关键字用于在函数内部访问和修改全局变量。如果不使用 global 关键字，直接在函数内部修改全局变量，Python会认为你在函数内部创建了一个新的局部变量。

x = 10

def my_function():
    global x  # 声明 x 是一个全局变量
    x = 20
    print("function:", x)  # 输出 "function: 20"

my_function()
print("global:", x)  # 输出 "global: 20"

6. 闭包在函数工厂中的应用

函数工厂是一个返回函数的函数。闭包是实现函数工厂的关键技术。函数工厂可以根据不同的参数创建不同的函数，这些函数共享一些共同的逻辑，但又具有一些不同的行为。

一个典型的函数工厂的例子是创建不同指数的幂函数：

def power_factory(exponent):
    def power(base):
        return base ** exponent
    return power

square = power_factory(2)  # 创建一个计算平方的函数
cube = power_factory(3)  # 创建一个计算立方的函数

print(square(5))  # 输出 25
print(cube(5))  # 输出 125

在这个例子中，power_factory 是一个函数工厂。它接受一个参数 exponent，并返回一个函数 power。 power 函数是一个闭包，它引用了 power_factory 的变量 exponent。当我们调用 power_factory(2) 时，它返回一个计算平方的函数，这个函数“记住”了 exponent 的值为 2。当我们调用 power_factory(3) 时，它返回一个计算立方的函数，这个函数“记住”了 exponent 的值为 3。

7. 函数工厂的应用场景

函数工厂在实际编程中有很多应用场景：

配置化： 可以使用函数工厂根据不同的配置参数创建不同的函数，例如，根据不同的数据库连接字符串创建不同的数据库连接函数。
事件处理： 可以使用函数工厂创建不同的事件处理函数，例如，根据不同的事件类型创建不同的事件处理函数。
策略模式： 可以使用函数工厂实现策略模式，根据不同的策略选择不同的算法。
装饰器： 装饰器本质上也是一种函数工厂，它可以用来扩展函数的功能。

8. 一个更复杂的例子：计数器

def make_counter():
    count = 0
    def counter():
        nonlocal count
        count += 1
        return count
    return counter

counter1 = make_counter()
counter2 = make_counter()

print(counter1())  # 输出 1
print(counter1())  # 输出 2
print(counter2())  # 输出 1
print(counter1())  # 输出 3
print(counter2())  # 输出 2

在这个例子中，make_counter 是一个函数工厂，它返回一个计数器函数 counter。每个计数器函数都有自己的 count 变量，它们之间互不影响。这是因为每次调用 make_counter 都会创建一个新的闭包，每个闭包都有自己的 count 变量。

9. 使用闭包实现简单的缓存

def memoize(func):
    cache = {}
    def wrapper(*args):
        if args not in cache:
            cache[args] = func(*args)
        return cache[args]
    return wrapper

@memoize
def fibonacci(n):
    if n <= 1:
        return n
    return fibonacci(n-1) + fibonacci(n-2)

print(fibonacci(10))  # 计算并缓存结果
print(fibonacci(10))  # 直接从缓存中获取结果

这个例子展示了如何使用闭包来实现一个简单的缓存。 memoize 函数是一个装饰器，它接受一个函数 func 作为参数，并返回一个包装函数 wrapper。 wrapper 函数使用一个字典 cache 来缓存 func 的结果。当 wrapper 函数被调用时，它首先检查 args 是否在 cache 中。如果在，则直接从 cache 中返回结果。否则，调用 func 计算结果，并将结果存储到 cache 中，然后返回结果。

10. 闭包的注意事项

变量生存周期： 闭包中的变量的生存周期与闭包函数一样长。这意味着，即使外部函数已经执行完毕，闭包中的变量仍然存在。
内存占用： 闭包会占用一定的内存空间，因为它们需要存储外部函数作用域中的变量。如果创建大量的闭包，可能会导致内存泄漏。
可变对象： 如果闭包引用了外部函数作用域中的可变对象，那么在闭包中修改这个对象会影响到外部函数作用域中的对象。反之亦然。

总结：

闭包和非局部变量是Python中强大的特性，允许函数记住并访问其词法作用域之外的变量。它们在实现函数工厂、数据封装和状态保持等方面发挥着重要作用。理解和掌握闭包的概念，可以编写出更加灵活、可复用和高效的Python代码。

Python闭包、非局部变量与函数工厂：一场深入探索

发表回复 取消回复

发表回复取消回复