Python高级技术之：`Python`的`hypothesis`：如何进行基于属性的测试。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Alright, buckle up buttercups! 今天咱们要聊聊一个让你的Python代码健壮到能扛住外星人入侵的秘密武器：Hypothesis。

Hypothesis：属性测试界的超级英雄

想象一下，你写了一个函数，号称能对列表进行排序。你写了几个单元测试，确保 [3, 1, 4] 变成了 [1, 3, 4]， [5, 2, 8] 变成了 [2, 5, 8]。万事大吉？Too naive! 你的测试只能证明你的代码 在特定情况下 是对的。但是，如果列表包含负数呢？包含重复元素呢？是空列表呢？包含超大的数字呢？你的测试可能根本没覆盖到这些情况！

传统的单元测试就像警察叔叔站在路口指挥交通，只能管好几个特定的车道。 Hypothesis 则像一个交通模拟器，生成各种各样的随机场景，让你的代码在千锤百炼中成长。

Hypothesis 是一种 基于属性的测试 (Property-Based Testing) 框架。它的核心思想是：与其编写针对特定输入的测试用例，不如定义代码应该满足的属性 (properties)。 Hypothesis 会自动生成大量的随机输入，并检查你的代码是否始终满足这些属性。

Show Me the Code! (入门篇)

首先，安装 Hypothesis：

pip install hypothesis

然后，我们来写一个简单的例子。假设我们有一个函数 reverse_list，用于反转一个列表：

def reverse_list(lst):
  """反转一个列表."""
  return lst[::-1]

现在，让我们用 Hypothesis 来测试它。我们需要定义一个属性：反转一个列表两次应该得到原始列表。

from hypothesis import given
from hypothesis.strategies import lists, integers

@given(lists(integers()))
def test_reverse_twice(lst):
  """测试反转两次是否得到原始列表."""
  assert reverse_list(reverse_list(lst)) == lst

@given 是 Hypothesis 的装饰器，它告诉 Hypothesis 用指定的策略生成输入。
lists(integers()) 是一个策略，它会生成包含整数的列表。 Hypothesis 会自动生成各种长度的列表，以及各种大小的整数。
assert reverse_list(reverse_list(lst)) == lst 断言反转两次后的列表与原始列表是否相同。

运行这个测试，Hypothesis 会生成大量的随机列表，并检查你的 reverse_list 函数是否始终满足这个属性。如果你的代码有问题，Hypothesis 会帮你找到一个 最小的 反例，让你更容易 debug。

更上一层楼：策略 (Strategies)

Hypothesis 提供了丰富的策略，用于生成各种类型的输入：

integers(): 生成整数。
floats(): 生成浮点数。
text(): 生成字符串。
booleans(): 生成布尔值。
dictionaries(keys=text(), values=integers()): 生成字典，其中键是字符串，值是整数。
sampled_from(['A', 'B', 'C']): 从给定的列表中随机选择元素。
one_of(integers(), text()): 生成整数或字符串。
just(42): 总是生成值 42。

你还可以组合这些策略，创建更复杂的输入。例如，要生成包含正整数和负整数的列表，可以使用：

from hypothesis.strategies import integers, lists

@given(lists(integers(min_value=-100, max_value=100)))
def test_something_with_signed_integers(lst):
  # Do something with the list of signed integers
  pass

这里 integers(min_value=-100, max_value=100) 限制了生成的整数的范围。

自定义策略 (Custom Strategies)

如果内置的策略不能满足你的需求，你可以创建自己的策略。这需要使用 hypothesis.strategies.SearchStrategy 的子类，或者使用 composite 装饰器。

假设我们需要测试一个处理 RGB 颜色值的函数。 RGB 颜色值由三个 0 到 255 之间的整数组成。我们可以创建一个自定义策略：

from hypothesis import strategies as st

@st.composite
def rgb_color(draw):
  """生成一个 RGB 颜色值."""
  red = draw(st.integers(min_value=0, max_value=255))
  green = draw(st.integers(min_value=0, max_value=255))
  blue = draw(st.integers(min_value=0, max_value=255))
  return (red, green, blue)

@given(rgb_color())
def test_something_with_rgb_color(color):
  # Do something with the RGB color value
  r, g, b = color
  assert 0 <= r <= 255
  assert 0 <= g <= 255
  assert 0 <= b <= 255

@st.composite 装饰器表示这是一个组合策略。
draw 函数用于从其他策略中抽样。
rgb_color 函数返回一个 RGB 颜色值的元组。

高级技巧：假设 (Assume)

有时候，你可能只想测试满足某些特定条件的输入。例如，你可能只想测试长度大于 0 的列表。可以使用 hypothesis.assume 来过滤掉不满足条件的输入。

from hypothesis import given, assume
from hypothesis.strategies import lists, integers

@given(lists(integers()))
def test_something_with_non_empty_list(lst):
  """测试非空列表."""
  assume(len(lst) > 0)
  # Do something with the non-empty list
  print(f"Testing with list: {lst}")

assume(len(lst) > 0) 告诉 Hypothesis 只测试长度大于 0 的列表。如果 Hypothesis 生成了一个空列表，它会跳过这个测试用例，并尝试生成新的输入。

缩小 (Shrinking)

当 Hypothesis 找到一个反例时，它会尝试缩小 (shrink) 这个反例，找到一个 最小的、仍然能够触发错误的输入。这可以帮助你更容易地理解和 debug 错误。

例如，假设你的 reverse_list 函数在处理包含大量重复元素的列表时会出错。 Hypothesis 可能会找到一个像 [1, 1, 1, 1, 1, 1, 1, 1, 1, 1] 这样的反例。然后，它会尝试缩小这个列表，例如 [1, 1, 1, 1, 1, 1, 1, 1]， [1, 1, 1, 1, 1, 1, 1]，等等，直到找到一个 最小的 能够触发错误的反例。

实际应用：数据验证 (Data Validation)

Hypothesis 非常适合用于测试数据验证代码。假设你有一个函数，用于验证电子邮件地址：

import re

def is_valid_email(email):
  """检查电子邮件地址是否有效."""
  pattern = r"^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}$"
  return bool(re.match(pattern, email))

我们可以使用 Hypothesis 来生成各种各样的电子邮件地址，并检查 is_valid_email 函数是否正确地识别有效的和无效的地址。

from hypothesis import given
from hypothesis.strategies import text

@given(text())
def test_is_valid_email(email):
  """测试 is_valid_email 函数."""
  if "@" in email and "." in email: # Simplified check, adjust as needed
      # If it contains "@" and ".", it *might* be valid.
      # The goal here is not to implement full RFC compliance,
      # but to drive testing of the is_valid_email function.
      if is_valid_email(email):
          print(f"Email {email} is considered valid.")
      else:
          print(f"Email {email} is considered invalid.")
  else:
      # If it doesn't contain "@" or ".", it *should* be invalid.
      assert not is_valid_email(email)

这个例子展示了如何使用 Hypothesis 来测试复杂的数据验证逻辑。注意，text() 策略会生成各种各样的字符串，包括有效的和无效的电子邮件地址。为了更好地测试，你可以创建更精细的策略，例如使用正则表达式来生成更像电子邮件地址的字符串。

最佳实践 (Best Practices)

从简单的属性开始。 先测试一些基本的属性，然后再逐渐增加复杂性。
使用清晰的断言消息。 这可以帮助你更容易地理解错误。
利用 Hypothesis 的缩小功能。 这可以帮助你找到最小的反例，更容易 debug。
将 Hypothesis 集成到你的 CI/CD 流程中。 这可以确保你的代码在每次提交时都经过充分的测试。
不要害怕尝试！ Hypothesis 是一个强大的工具，但需要一些时间才能掌握。多做实验，多阅读文档，你就能成为 Hypothesis 大师。

与其他测试框架集成

Hypothesis 可以轻松地与 pytest 和 unittest 等主流 Python 测试框架集成。

pytest: Hypothesis 可以直接与 pytest 一起使用。你只需要安装 pytest 和 hypothesis，然后运行 pytest 命令即可。 Hypothesis 会自动发现并运行你的 Hypothesis 测试。
unittest: 你可以使用 unittest.TestCase 和 Hypothesis 的 given 装饰器来编写基于属性的 unittest 测试。

案例分析：排序算法 (Sorting Algorithms)

让我们用 Hypothesis 来测试一个排序算法。假设我们有一个 sort 函数：

def sort(lst):
  """对列表进行排序."""
  return sorted(lst)

我们可以定义以下属性：

排序后的列表应该与原始列表包含相同的元素。
排序后的列表应该是有序的。

from hypothesis import given
from hypothesis.strategies import lists, integers

@given(lists(integers()))
def test_sort_preserves_elements(lst):
  """测试排序是否保留元素."""
  sorted_lst = sort(lst)
  assert set(sorted_lst) == set(lst)

@given(lists(integers()))
def test_sort_is_ordered(lst):
  """测试排序后的列表是否是有序的."""
  sorted_lst = sort(lst)
  if len(sorted_lst) > 1:
      for i in range(len(sorted_lst) - 1):
          assert sorted_lst[i] <= sorted_lst[i+1]

这两个测试用例可以帮助我们发现排序算法中的一些常见错误，例如丢失元素或排序不正确。

总结：Hypothesis 的优势

发现隐藏的错误： Hypothesis 可以生成大量的随机输入，覆盖各种边缘情况，从而发现传统单元测试难以发现的错误。
提高代码的健壮性： 通过使用 Hypothesis 进行测试，你可以确保你的代码能够处理各种各样的输入，从而提高代码的健壮性。
节省时间和精力： Hypothesis 可以自动生成测试用例，从而节省你编写大量测试用例的时间和精力。
提高代码的可读性： 基于属性的测试可以更清晰地表达代码的意图，从而提高代码的可读性。
强制思考代码的属性： 使用 Hypothesis 会迫使你深入思考你的代码应该满足哪些属性，从而更好地理解你的代码。

表格总结

特性	传统单元测试	Hypothesis (基于属性的测试)
输入	手动编写的特定输入	自动生成的随机输入
覆盖范围	有限的，只能覆盖特定的情况	广泛的，可以覆盖各种边缘情况
错误发现	容易发现已知错误，难以发现隐藏错误	容易发现隐藏错误，提高代码健壮性
测试用例编写	需要手动编写大量的测试用例	只需要定义代码应该满足的属性，Hypothesis 自动生成测试用例
维护	当代码变更时，需要手动更新测试用例	当代码变更时，只需要更新属性，Hypothesis 自动调整测试用例

友情提示:

Hypothesis 并非银弹。它不能代替传统的单元测试。最佳实践是将 Hypothesis 与传统的单元测试结合使用，以达到最佳的测试效果。传统的单元测试可以用来测试一些特定的场景，而 Hypothesis 可以用来测试代码的通用属性。

所以，下次当你需要测试你的 Python 代码时，不妨试试 Hypothesis。也许你会发现一些意想不到的惊喜 (或者 bug)。 Good luck, and happy testing! 希望大家的代码都能像钢铁侠的战甲一样坚不可摧！

发表回复 取消回复

发表回复取消回复