使用 `yield` 关键字暂停与恢复生成器执行

开场白

大家好，欢迎来到今天的编程讲座！今天我们要聊一聊 Python 中非常有趣的一个特性——yield 关键字。如果你已经听说过它，可能知道它和生成器（generator）有关；如果你还不太熟悉，没关系，我们会从头开始，一步步揭开它的神秘面纱。

在编程的世界里，yield 就像是一个魔法咒语，可以让函数在执行到一半时“暂停”，等你什么时候想继续，再“恢复”它的执行。听起来是不是有点像《哈利·波特》里的时间转换器？其实，yield 确实有类似的效果，但它不是用来穿越时空的，而是用来优化代码的性能和内存使用。

那么，我们今天就来深入探讨一下 yield 是如何工作的，以及它能为我们的代码带来哪些好处。准备好了吗？让我们开始吧！

1. 什么是生成器？

在讲解 yield 之前，我们先来了解一下生成器（generator）。生成器是一种特殊的迭代器（iterator），它可以逐个生成值，而不是一次性将所有值都准备好。这听起来有点抽象，但其实很好理解。

举个例子，假设我们要生成一个包含 1 到 1000 万个数字的列表。如果我们直接用列表来存储这些数字，内存消耗会非常大，尤其是当数字范围更大时。而生成器则可以逐个生成这些数字，只在需要的时候才计算下一个值，从而大大节省了内存。

传统方式 vs 生成器

传统方式：一次性生成所有数据

def generate_numbers_list(max_num):
    return [x for x in range(1, max_num + 1)]

numbers = generate_numbers_list(1000000)
print(numbers[0])  # 输出 1

在这个例子中，generate_numbers_list 函数会一次性生成 1 到 1,000,000 的所有数字，并将它们存储在一个列表中。虽然我们可以轻松访问第一个元素，但这个列表占用了大量的内存。

生成器方式：逐个生成数据

def generate_numbers_generator(max_num):
    for x in range(1, max_num + 1):
        yield x

numbers_gen = generate_numbers_generator(1000000)
print(next(numbers_gen))  # 输出 1

在这里，generate_numbers_generator 是一个生成器函数。它不会一次性生成所有的数字，而是每次调用 next() 时，只生成下一个数字。这样，我们可以在需要的时候逐个获取数字，而不需要占用大量内存。

2. `yield` 关键字的工作原理

现在我们知道了生成器的好处，接下来就是重头戏——yield 关键字。yield 的作用是让函数变成一个生成器，并且可以在函数执行的过程中“暂停”和“恢复”。

`yield` 的基本用法

yield 和 return 类似，但它不会终止函数的执行，而是将当前的值返回给调用者，并保存函数的状态。下次调用生成器时，函数会从上次 yield 的地方继续执行。

来看一个简单的例子：

def simple_generator():
    print("Step 1")
    yield 1
    print("Step 2")
    yield 2
    print("Step 3")
    yield 3

gen = simple_generator()

print(next(gen))  # 输出 Step 1, 然后输出 1
print(next(gen))  # 输出 Step 2, 然后输出 2
print(next(gen))  # 输出 Step 3, 然后输出 3

在这个例子中，simple_generator 是一个生成器函数。每次调用 next() 时，函数会执行到下一个 yield 语句，并返回相应的值。注意，函数并不会从头开始执行，而是从上次暂停的地方继续。

`yield` 的状态保存

yield 的一个关键特性是它会保存函数的局部变量、指令指针和其他状态信息。这意味着即使函数暂停了，它的内部状态也不会丢失。当函数再次被调用时，它会从上次暂停的地方继续执行，就像什么都没发生过一样。

举个更复杂的例子：

def counter(start=0):
    count = start
    while True:
        yield count
        count += 1

counter_gen = counter(5)

print(next(counter_gen))  # 输出 5
print(next(counter_gen))  # 输出 6
print(next(counter_gen))  # 输出 7

在这个例子中，counter 是一个无限生成器，它会从 start 开始逐个递增计数。每次调用 next() 时，生成器会返回当前的计数值，并将 count 增加 1。由于 yield 保存了函数的状态，所以即使多次调用 next()，生成器也会记住上次的计数值。

3. `yield` 的高级用法

除了基本的 yield 用法，Python 还提供了更多高级功能，比如 send() 和 throw()，甚至可以使用 yield from 来简化嵌套生成器的调用。下面我们来逐一介绍这些高级特性。

3.1 `send()`：向生成器发送数据

通常情况下，生成器只会返回值给调用者，但我们也可以通过 send() 方法向生成器发送数据。这使得生成器不仅可以作为生产者，还可以作为消费者。

来看一个例子：

def echo():
    while True:
        received = yield
        print(f"Received: {received}")

echo_gen = echo()
next(echo_gen)  # 启动生成器

echo_gen.send("Hello")  # 输出 Received: Hello
echo_gen.send("World")  # 输出 Received: World

在这个例子中，echo 是一个生成器函数，它会在每次 yield 时等待外部传入的数据。我们通过 send() 方法向生成器发送字符串，生成器接收到数据后会将其打印出来。

需要注意的是，第一次调用 send() 之前必须先调用一次 next()，因为生成器需要先启动才能接收数据。

3.2 `throw()`：抛出异常

有时候我们希望在生成器内部抛出异常，或者从外部向生成器传递异常。这时可以使用 throw() 方法。它会将异常传递给生成器，并在生成器内部触发该异常。

def risky_generator():
    try:
        while True:
            value = yield
            if value == "error":
                raise ValueError("Oops!")
            print(f"Received: {value}")
    except ValueError as e:
        print(f"Caught an exception: {e}")

risky_gen = risky_generator()
next(risky_gen)  # 启动生成器

risky_gen.send("Hello")  # 输出 Received: Hello
risky_gen.throw(ValueError)  # 输出 Caught an exception: 'value error'

在这个例子中，risky_generator 会在接收到 "error" 时抛出 ValueError 异常。我们可以通过 throw() 方法从外部向生成器传递异常，并在生成器内部捕获和处理它。

3.3 `yield from`：简化嵌套生成器

如果你有一个生成器嵌套在另一个生成器中，使用 yield from 可以简化代码。yield from 会自动遍历子生成器，并将结果逐个返回给调用者。

def sub_generator():
    yield "A"
    yield "B"

def main_generator():
    yield "X"
    yield from sub_generator()  # 等价于 yield "A", yield "B"
    yield "Y"

for item in main_generator():
    print(item)

输出结果：

X
A
B
Y

在这个例子中，main_generator 使用 yield from 来调用 sub_generator，并将其生成的值逐个返回。这种方式不仅简洁，还能避免手动编写繁琐的循环。

4. `yield` 的应用场景

yield 和生成器不仅仅是为了节省内存，它们在许多实际场景中都非常有用。下面我们来看看一些常见的应用场景。

4.1 大文件处理

当你需要处理非常大的文件时，yield 可以帮助你逐行读取文件，而不需要一次性将整个文件加载到内存中。

def read_large_file(file_path):
    with open(file_path, 'r') as file:
        for line in file:
            yield line.strip()

for line in read_large_file('large_file.txt'):
    print(line)

在这个例子中，read_large_file 是一个生成器函数，它会逐行读取文件并返回每一行的内容。这样，即使文件非常大，程序也不会因为内存不足而崩溃。

4.2 数据流处理

yield 也非常适合用于处理实时数据流，比如网络请求、传感器数据等。你可以使用生成器来逐个处理数据，而不需要等待所有数据都到达。

def process_data_stream(stream):
    for data in stream:
        processed_data = process(data)
        yield processed_data

for result in process_data_stream(real_time_data):
    print(result)

在这个例子中，process_data_stream 是一个生成器函数，它会逐个处理传入的数据流，并返回处理后的结果。这种方式非常适合处理实时数据，因为它可以立即响应新数据的到来。

5. 总结

今天我们学习了 yield 关键字的基本用法和高级特性，了解了它是如何让函数变成生成器，并实现暂停和恢复执行的功能。我们还探讨了 yield 在大文件处理、数据流处理等场景中的应用。

yield 不仅仅是一个语法糖，它为我们提供了一种更高效、更灵活的方式来编写代码。通过使用生成器，我们可以节省内存、提高性能，并且让代码更加简洁易读。

希望今天的讲座对你有所帮助！如果你有任何问题或想法，欢迎在评论区留言讨论。下次见！

使用yield关键字暂停与恢复生成器执行

使用 `yield` 关键字暂停与恢复生成器执行

开场白

1. 什么是生成器？

传统方式 vs 生成器

传统方式：一次性生成所有数据

生成器方式：逐个生成数据

2. `yield` 关键字的工作原理

`yield` 的基本用法

`yield` 的状态保存

3. `yield` 的高级用法

3.1 `send()`：向生成器发送数据

3.2 `throw()`：抛出异常

3.3 `yield from`：简化嵌套生成器

4. `yield` 的应用场景

4.1 大文件处理

4.2 数据流处理

5. 总结

发表回复取消回复

使用 yield 关键字暂停与恢复生成器执行

开场白

1. 什么是生成器？

传统方式 vs 生成器

传统方式：一次性生成所有数据

生成器方式：逐个生成数据

2. yield 关键字的工作原理

yield 的基本用法

yield 的状态保存

3. yield 的高级用法

3.1 send()：向生成器发送数据

3.2 throw()：抛出异常

3.3 yield from：简化嵌套生成器

4. yield 的应用场景

4.1 大文件处理

4.2 数据流处理

5. 总结

发表回复 取消回复

使用 `yield` 关键字暂停与恢复生成器执行

2. `yield` 关键字的工作原理

`yield` 的基本用法

`yield` 的状态保存

3. `yield` 的高级用法

3.1 `send()`：向生成器发送数据

3.2 `throw()`：抛出异常

3.3 `yield from`：简化嵌套生成器

4. `yield` 的应用场景

发表回复取消回复