单元测试与测试驱动开发（TDD）在 NumPy 中的实践 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好嘞！既然您是编程专家，那我就来扮演一个您的粉丝，一边听您讲座，一边记录要点，顺便提问一些小白问题，争取把 NumPy 的单元测试和 TDD 搞个明明白白！

NumPy 单元测试与 TDD 实战：从入门到入迷 (粉丝笔记)

各位观众老爷们，大家好！今天能有机会聆听咱们编程界泰斗级人物的讲座，我真是激动得搓手手啊！今天的主题是 NumPy 的单元测试与测试驱动开发（TDD），听起来就很高大上！

开场白：为什么我们要关心测试？

“俗话说，常在河边走，哪能不湿鞋？写代码也一样，代码写多了，Bug 自然就来了。” 专家用一句接地气的话开了场，“别看那些大神们写的代码行云流水，背地里不知道被多少 Bug 折磨过。所以，测试，就是咱们程序员的救命稻草啊！”

我赶紧记下来：测试的重要性：减少 Bug，提高代码质量，确保代码可靠性。

第一部分：什么是单元测试？（小白提问：单元测试是啥玩意儿？）

“咱们先来说说单元测试。顾名思义，就是对代码中最小的可测试单元进行测试。这个单元，通常是一个函数、一个方法，甚至是一个类。” 专家解释道。

我举手提问：“那个…专家，啥叫 ‘最小的可测试单元’ 啊？听起来好抽象！”

专家笑了笑：“问得好！你可以把它想象成乐高积木。一个乐高积木就是一个单元，咱们要测试这个积木是不是能好好地和其他积木拼在一起，是不是足够坚固，是不是颜色正确。”

哦！我明白了！原来单元测试就是测试代码中的小零件啊！

专家继续说：“单元测试的目的是验证每个单元是否按照预期工作。如果每个单元都工作正常，那么整个系统出问题的概率就会大大降低。”

我赶紧在本子上记下：单元测试：测试代码中的最小单元（函数、方法、类），验证其是否按照预期工作。

第二部分：NumPy 中的单元测试框架：unittest 和 pytest (选择困难症犯了！)

“在 Python 中，有很多单元测试框架可供选择。在 NumPy 的世界里，最常用的就是 unittest 和 pytest 这两个家伙了。” 专家介绍道。

unittest：Python 自带的“老大哥”

“unittest 是 Python 标准库的一部分，不需要额外安装。它提供了一套标准的测试结构，包括测试用例、测试套件、测试运行器等等。用起来有点像写作文，要先搭框架，再往里面填内容。” 专家形象地比喻道。

我记下：unittest：Python 标准库，无需安装，提供标准测试结构。
pytest：灵活好用的“小鲜肉”

“pytest 则更加灵活和易用。它不需要你遵循特定的结构，可以自动发现测试用例，而且拥有丰富的插件生态系统。就像用手机拍照，随手一拍就是大片！” 专家笑着说。

我赶紧追问：“专家，那 unittest 和 pytest 哪个更好啊？我选择困难症又犯了！”

专家摆摆手：“没有绝对的好坏，只有适合不适合。unittest 适合大型项目，因为它结构清晰，易于维护。pytest 适合小型项目或者快速原型开发，因为它更加灵活，上手更快。你可以根据自己的需求选择。”

我决定了！先学 pytest，上手快！

我记下：pytest：灵活易用，自动发现测试用例，插件丰富。

第三部分：使用 pytest 编写 NumPy 单元测试 (实战演练！)

“咱们来用 pytest 写一个简单的 NumPy 单元测试。” 专家说，“假设我们要测试一个函数，这个函数的功能是计算数组的平均值。”

import numpy as np

def calculate_average(arr):
  """计算数组的平均值."""
  return np.mean(arr)

“接下来，我们创建一个测试文件，命名为 test_average.py。” 专家继续讲解。

import numpy as np
from your_module import calculate_average # 替换为你的模块名

def test_calculate_average_positive():
  """测试正数数组的平均值."""
  arr = np.array([1, 2, 3, 4, 5])
  expected_average = 3.0
  actual_average = calculate_average(arr)
  assert actual_average == expected_average

def test_calculate_average_negative():
  """测试负数数组的平均值."""
  arr = np.array([-1, -2, -3, -4, -5])
  expected_average = -3.0
  actual_average = calculate_average(arr)
  assert actual_average == expected_average

def test_calculate_average_mixed():
  """测试混合正负数数组的平均值."""
  arr = np.array([-1, 0, 1, 2, 3])
  expected_average = 1.0
  actual_average = calculate_average(arr)
  assert actual_average == expected_average

def test_calculate_average_empty():
    """测试空数组的平均值"""
    arr = np.array([])
    # NumPy 会返回 NaN (Not a Number)
    actual_average = calculate_average(arr)
    assert np.isnan(actual_average)

def test_calculate_average_large_numbers():
    """测试大数值数组的平均值"""
    arr = np.array([1e10, 2e10, 3e10])
    expected_average = 2e10
    actual_average = calculate_average(arr)
    assert np.isclose(actual_average, expected_average) # 使用 isclose 比较浮点数

“在这个测试文件中，我们定义了几个测试函数，每个函数测试不同的情况，比如正数数组、负数数组、混合数组等等。” 专家解释道，“每个测试函数都使用 assert 语句来判断实际结果是否与预期结果相等。”

我迫不及待地问：“专家，那怎么运行这些测试呢？”

专家微微一笑：“打开你的终端，进入到测试文件所在的目录，然后输入 pytest 命令，回车！pytest 会自动发现并运行所有的测试函数。”

我照着做了，果然，终端输出了测试结果！🎉

============================= test session starts ==============================
platform darwin -- Python 3.9.7, pytest-7.1.2, pluggy-1.0.0
rootdir: /Users/yourname/yourproject
collected 5 items

test_average.py .....                                                   [100%]

============================== 5 passed in 0.02s ===============================

“看到没？所有的测试都通过了！说明我们的 calculate_average 函数工作正常！” 专家得意地说。

我赶紧鼓掌：“专家，您太厉害了！”

我记下：使用 pytest 编写单元测试：

创建测试文件，命名为 test_xxx.py。
定义测试函数，函数名以 test_ 开头。
使用 assert 语句判断实际结果是否与预期结果相等。
在终端运行 pytest 命令。

第四部分：测试驱动开发（TDD）：先写测试，再写代码 (颠覆认知！)

“接下来，我们来聊聊测试驱动开发（TDD）。” 专家说，“TDD 是一种软件开发方法，它的核心思想是：先写测试，再写代码。”

我一脸懵：“先写测试？代码都没写，测什么啊？”

专家笑着说：“这就是 TDD 的精髓所在！你可以把测试想象成一份合同，它规定了你的代码应该做什么。只有当你的代码能够通过这份合同，才能算作合格。”

TDD 的流程如下：

编写一个失败的测试用例。
编写能够通过这个测试用例的最少代码。
重构代码，使其更加清晰和易于维护。
重复以上步骤。

“咱们用 TDD 来开发一个计算数组中最大值的函数 find_max。” 专家说。

编写一个失败的测试用例：

# test_max.py
import numpy as np
from your_module import find_max # 替换为你的模块名

def test_find_max_positive():
    """测试正数数组的最大值."""
    arr = np.array([1, 2, 3, 4, 5])
    expected_max = 5
    actual_max = find_max(arr)
    assert actual_max == expected_max

此时运行 pytest，测试会失败，因为我们还没有编写 find_max 函数。

编写能够通过这个测试用例的最少代码：

# your_module.py
import numpy as np

def find_max(arr):
    """计算数组中的最大值."""
    return np.max(arr)

现在运行 pytest，测试应该通过了。

重构代码：

在这个简单的例子中，代码已经足够清晰，不需要重构。

重复以上步骤：

我们可以添加更多的测试用例，比如测试负数数组、混合数组、空数组等等，然后不断地完善 find_max 函数。

# test_max.py
import numpy as np
from your_module import find_max

def test_find_max_positive():
    """测试正数数组的最大值."""
    arr = np.array([1, 2, 3, 4, 5])
    expected_max = 5
    actual_max = find_max(arr)
    assert actual_max == expected_max

def test_find_max_negative():
    """测试负数数组的最大值."""
    arr = np.array([-5, -4, -3, -2, -1])
    expected_max = -1
    actual_max = find_max(arr)
    assert actual_max == expected_max

def test_find_max_mixed():
    """测试混合数组的最大值."""
    arr = np.array([-1, 0, 1, 2, 3])
    expected_max = 3
    actual_max = find_max(arr)
    assert actual_max == expected_max

def test_find_max_empty():
  """测试空数组的最大值"""
  arr = np.array([])
  # NumPy 会返回负无穷
  actual_max = find_max(arr)
  assert np.isinf(actual_max) and actual_max < 0

我记下：TDD 的流程：

编写一个失败的测试用例。
编写能够通过这个测试用例的最少代码。
重构代码，使其更加清晰和易于维护。
重复以上步骤。

第五部分：NumPy 单元测试的最佳实践 (干货满满！)

“最后，我给大家分享一些 NumPy 单元测试的最佳实践。” 专家说。

测试边界条件和异常情况：

“一定要测试边界条件，比如空数组、零值、极大值、极小值等等。还要测试异常情况，比如输入类型错误、数组维度不匹配等等。”
使用断言函数：

“pytest 提供了丰富的断言函数，比如 assert ==、assert !=、assert >、assert <、assert isinstance() 等等。选择合适的断言函数可以使测试代码更加清晰易懂。” 对于浮点数比较，使用 np.isclose() 或 np.allclose() 避免精度问题。

使用参数化测试：

“如果有很多类似的测试用例，可以使用参数化测试来简化代码。pytest 提供了 @pytest.mark.parametrize 装饰器来实现参数化测试。”

例如：

import pytest
import numpy as np
from your_module import calculate_power  # 假设有这样一个函数

@pytest.mark.parametrize(
    "base, exponent, expected",
    [
        (2, 3, 8),
        (3, 2, 9),
        (5, 0, 1),
        (10, -1, 0.1),
    ],
)
def test_calculate_power(base, exponent, expected):
    """测试 calculate_power 函数."""
    actual = calculate_power(base, exponent)
    assert np.isclose(actual, expected)

使用 Mock 对象：

“如果你的代码依赖于外部资源，比如数据库、网络服务等等，可以使用 Mock 对象来模拟这些外部资源，以便进行隔离测试。” unittest.mock 和 pytest-mock 都是不错的选择。
保持测试代码的简洁和可读性：

“测试代码和生产代码一样重要，也要保持简洁和可读性。使用有意义的变量名、注释和文档字符串，让别人能够轻松地理解你的测试代码。”
持续集成：

“将单元测试集成到持续集成（CI）流程中，可以确保每次代码提交都会自动运行测试，及时发现和修复 Bug。” GitHub Actions, GitLab CI, Jenkins 等都是常用的 CI 工具。

我记下：NumPy 单元测试的最佳实践：

测试边界条件和异常情况。
使用合适的断言函数（np.isclose 比较浮点数）。
使用参数化测试 (@pytest.mark.parametrize)。
使用 Mock 对象 (unittest.mock, pytest-mock)。
保持测试代码的简洁和可读性。
持续集成 (CI)。

总结：测试，让你的代码更上一层楼！

“好了，今天的讲座就到这里了。” 专家总结道，“单元测试和 TDD 是软件开发中非常重要的环节，它可以帮助我们提高代码质量、减少 Bug、确保代码可靠性。希望大家能够重视测试，并在实际项目中积极应用。”

我带头鼓掌，现场一片掌声雷动！ 👏

通过今天的讲座，我对 NumPy 的单元测试和 TDD 有了更深入的理解。感谢专家的精彩讲解！我会努力学习，争取早日成为一名合格的程序员！ 💪

发表回复 取消回复

发表回复取消回复