Python高级技术之：`Python`函数调用的底层机制：`frame`对象、`bytecode`和`call stack`。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位观众老爷，晚上好！

今天咱不聊风花雪月，就来点硬核的——扒一扒Python函数调用的老底儿，看看frame对象、bytecode和call stack这些家伙是怎么在幕后搞事情的。保证让你看完之后，感觉自己对Python的理解又深了一层，以后写代码的时候也能更有底气。

一、函数调用：表面风光，暗流涌动

咱们平时写Python代码，调用函数那是家常便饭，像这样：

def add(a, b):
  """一个简单的加法函数"""
  result = a + b
  return result

x = 5
y = 3
sum_result = add(x, y)
print(f"The sum of {x} and {y} is: {sum_result}")

看起来是不是很简单？但你有没有想过，Python解释器在背后都做了些什么？它可不像咱们人类这么简单，看到add(x, y)就知道是把x和y加起来。它需要把这段代码翻译成机器能理解的指令，然后一步一步地执行。

二、bytecode：代码的“机器码”

Python解释器首先会把我们的Python代码编译成bytecode（字节码）。bytecode是一种更接近机器码的中间表示形式，但它仍然是平台无关的，可以在任何安装了Python解释器的机器上运行。

我们可以用dis模块来查看函数的bytecode：

import dis

def add(a, b):
  """一个简单的加法函数"""
  result = a + b
  return result

dis.dis(add)

运行上面的代码，你会看到类似这样的输出：

  5           0 LOAD_FAST                0 (a)
              2 LOAD_FAST                1 (b)
              4 BINARY_OP             0 (+)
              6 STORE_FAST               2 (result)

  6           8 LOAD_FAST                2 (result)
             10 RETURN_VALUE

这些LOAD_FAST、BINARY_OP、STORE_FAST、RETURN_VALUE就是bytecode指令。它们告诉Python虚拟机（PVM）该做什么，怎么做。

LOAD_FAST: 从局部变量中加载值到栈顶。
BINARY_OP: 执行二元运算 (例如加法、减法)。
STORE_FAST: 将栈顶的值存储到局部变量中。
RETURN_VALUE: 返回栈顶的值。

可以把bytecode看作是Python代码的“汇编语言”，Python虚拟机就是执行这些“汇编指令”的“CPU”。

三、frame对象：函数调用的“工作台”

当一个函数被调用时，Python解释器会创建一个frame对象。这个frame对象就像是函数调用的一个“工作台”，它包含了函数执行所需的所有信息：

f_code: 指向函数的code对象，code对象包含了函数的bytecode。
f_locals: 一个字典，存储函数的局部变量及其值。
f_globals: 一个字典，存储函数的全局变量及其值。
f_back: 指向上一个frame对象，用于函数调用结束后返回。
f_lineno: 当前执行的代码行号，用于调试。
f_lasti: 上一次执行的字节码指令的索引。

你可以把frame对象想象成一个“黑匣子”，里面装着函数运行时的所有状态。每个函数调用都会创建一个新的frame对象。

四、call stack：函数调用的“轨迹”

call stack（调用栈）是一个栈数据结构，用于跟踪函数调用链。每当一个函数被调用时，一个新的frame对象会被压入call stack；当函数执行完毕返回时，它的frame对象会被弹出call stack。

call stack的作用是：

记录函数调用的顺序: 方便函数执行完毕后返回到正确的位置。
管理函数之间的关系: 让函数可以访问其他函数的数据。
提供调试信息: 在程序出错时，可以查看call stack，了解函数调用的路径，从而更容易找到错误的原因。

你可以把call stack想象成一个“堆栈”，后进先出。

五、函数调用过程：一步一个脚印

现在，让我们把bytecode、frame对象和call stack串起来，看看函数调用到底是怎么发生的。

函数调用: 当Python解释器遇到一个函数调用时，例如add(x, y)，它会创建一个新的frame对象。
frame对象初始化: 新的frame对象的f_code指向add函数的code对象，f_locals包含传入的参数x和y的值，f_globals指向全局命名空间。
frame对象入栈: 新的frame对象被压入call stack。
执行bytecode: Python虚拟机开始执行add函数的bytecode。
- LOAD_FAST 0 (a): 将a的值（5）压入栈顶。
- LOAD_FAST 1 (b): 将b的值（3）压入栈顶。
- BINARY_OP 0 (+): 从栈顶弹出两个值（5和3），执行加法运算，将结果（8）压入栈顶。
- STORE_FAST 2 (result): 从栈顶弹出结果（8），存储到f_locals的result变量中。
- LOAD_FAST 2 (result): 将result的值（8）压入栈顶。
- RETURN_VALUE: 从栈顶弹出返回值（8），并将frame对象弹出call stack。
返回: Python解释器返回到调用add函数的地方，并将返回值（8）赋给sum_result变量。

用表格总结一下：

步骤	操作	数据变化	`call stack` 变化
1	调用`add(x, y)`	创建`add`的`frame`对象	`add`的`frame`对象入栈
2	执行`LOAD_FAST 0 (a)`	栈顶：5
3	执行`LOAD_FAST 1 (b)`	栈顶：3，栈底：5
4	执行`BINARY_OP 0 (+)`	栈顶：8
5	执行`STORE_FAST 2 (result)`	`f_locals['result']` = 8
6	执行`LOAD_FAST 2 (result)`	栈顶：8
7	执行`RETURN_VALUE`	返回值：8	`add`的`frame`对象出栈
8	返回到调用处，`sum_result` = 8

六、一个更复杂的例子：递归调用

为了更好地理解call stack的作用，我们来看一个递归调用的例子：

def factorial(n):
  """计算n的阶乘"""
  if n == 0:
    return 1
  else:
    return n * factorial(n - 1)

result = factorial(5)
print(f"The factorial of 5 is: {result}")

当调用factorial(5)时，会发生以下过程：

factorial(5)的frame对象入栈。
factorial(5)调用factorial(4)，factorial(4)的frame对象入栈。
factorial(4)调用factorial(3)，factorial(3)的frame对象入栈。
以此类推，直到factorial(0)被调用，factorial(0)的frame对象入栈。
factorial(0)返回1，factorial(0)的frame对象出栈。
factorial(1)返回1 * 1 = 1，factorial(1)的frame对象出栈。
factorial(2)返回2 * 1 = 2，factorial(2)的frame对象出栈。
factorial(3)返回3 * 2 = 6，factorial(3)的frame对象出栈。
factorial(4)返回4 * 6 = 24，factorial(4)的frame对象出栈。
factorial(5)返回5 * 24 = 120，factorial(5)的frame对象出栈。

可以看到，call stack就像一个“记录仪”，它记录了函数调用的顺序，保证了函数能够正确地返回。

七、inspect模块：窥探frame对象的利器

Python的inspect模块提供了一些强大的工具，可以让我们在运行时查看frame对象的信息。

import inspect

def my_function():
  frame = inspect.currentframe()
  print(f"Current frame: {frame}")
  print(f"Frame's code object: {frame.f_code}")
  print(f"Frame's locals: {frame.f_locals}")
  print(f"Frame's globals: {frame.f_globals}")
  print(f"Frame's back frame: {frame.f_back}")
  print(f"Line number: {frame.f_lineno}")

my_function()

这段代码可以打印出当前frame对象的各种信息。

我们还可以使用inspect.stack()来查看当前的call stack：

import inspect

def function_a():
  function_b()

def function_b():
  stack = inspect.stack()
  for frame_info in stack:
    print(f"Frame: {frame_info.frame}")
    print(f"Filename: {frame_info.filename}")
    print(f"Line number: {frame_info.lineno}")
    print(f"Function name: {frame_info.function}")
    print("-" * 20)

function_a()

这段代码会打印出call stack中所有frame对象的信息，包括文件名、行号、函数名等等。

八、调试利器：traceback模块

当程序出错时，Python会抛出一个异常，并打印出traceback（回溯）。traceback就是call stack的一个快照，它可以帮助我们找到错误发生的位置。

def function_a():
  function_b()

def function_b():
  raise ValueError("Something went wrong!")

try:
  function_a()
except ValueError as e:
  import traceback
  traceback.print_exc()

这段代码会抛出一个ValueError异常，并打印出traceback信息，包括函数调用的顺序、文件名、行号等等。仔细阅读traceback，可以帮助我们快速定位错误。

九、总结：理解函数调用的底层机制的重要性

理解Python函数调用的底层机制，可以帮助我们：

更深入地理解Python: 了解Python解释器是如何执行代码的。
更好地调试代码: 能够快速定位错误，并理解错误发生的原因。
优化代码性能: 了解函数调用的开销，从而避免不必要的函数调用。
编写更健壮的代码: 能够更好地处理异常，并避免stack overflow等问题。

掌握这些知识，你就能从一个普通的Python程序员，进阶为一个真正的Python高手！

十、练习题

编写一个递归函数，并使用inspect模块查看call stack的变化。
编写一个会抛出异常的函数，并使用traceback模块打印出traceback信息。
尝试修改frame对象的f_locals，看看会发生什么。

希望今天的讲座对大家有所帮助。以后再遇到什么技术难题，欢迎来找我！拜拜！

发表回复 取消回复

发表回复取消回复