Python中的数据模型协议（Data Model）：定制类如何响应内置操作符 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

Python 数据模型协议：定制类如何响应内置操作符

大家好，今天我们来深入探讨 Python 中一个非常核心的概念：数据模型（Data Model）。更具体地说，我们将关注数据模型协议，并了解如何通过它来定制我们的类，使其能够自然地响应 Python 的内置操作符，例如 +, -, *, [], len() 等。

什么是数据模型？

在 Python 中，数据模型可以理解为一套协议，它定义了对象应该如何表现以及如何与语言的其他部分交互。它本质上是一组特殊方法（也称为魔术方法或 dunder methods，因为它们的名字以双下划线开头和结尾，例如 __init__, __str__, __add__），当在对象上执行特定操作时，Python 解释器会自动调用这些方法。

例如，当我们使用 + 操作符将两个对象相加时，Python 会尝试调用第一个对象的 __add__ 方法，并将第二个对象作为参数传递给它。如果第一个对象没有实现 __add__ 方法，或者 __add__ 方法返回 NotImplemented，Python 会尝试调用第二个对象的 __radd__ 方法。

通过实现这些特殊方法，我们可以完全控制类的行为，使其能够像内置类型一样工作。这使得 Python 成为一种非常灵活和强大的语言。

为什么要定制类？

Python 提供了许多内置类型，例如 int, float, str, list, dict 等。然而，在很多情况下，我们需要创建自己的类型来表示更复杂的数据结构和算法。

通过定制类，我们可以：

提高代码的可读性和可维护性： 通过定义清晰的操作符行为，我们可以使代码更加直观，更容易理解和修改。
增强代码的表达能力： 我们可以创建具有特定行为的类，使其能够自然地表达我们想要解决的问题。
实现特定领域的逻辑： 我们可以定制类来满足特定领域的需要，例如科学计算、金融建模等。

常见的数据模型方法

以下是一些最常用的数据模型方法，以及它们对应的操作符和行为：

方法名	操作符/函数	描述
`__init__`		构造函数，在创建对象时调用。
`__del__`		析构函数，在对象被销毁时调用。
`__repr__`		返回对象的字符串表示形式，用于调试和日志记录。应该返回一个可以用来重建对象的字符串。
`__str__`	`str()`	返回对象的字符串表示形式，用于用户友好的输出。
`__bytes__`	`bytes()`	返回对象的字节表示形式。
`__format__`	`format()`	返回对象的格式化字符串表示形式。
`__lt__`	`<`	小于运算符。
`__le__`	`<=`	小于等于运算符。
`__eq__`	`==`	等于运算符。
`__ne__`	`!=`	不等于运算符。
`__gt__`	`>`	大于运算符。
`__ge__`	`>=`	大于等于运算符。
`__hash__`	`hash()`	返回对象的哈希值，用于在字典和集合中使用。
`__bool__`	`bool()`	返回对象的布尔值。
`__getattr__`		当访问不存在的属性时调用。
`__setattr__`		当设置属性值时调用。
`__delattr__`		当删除属性时调用。
`__dir__`	`dir()`	返回对象的属性列表。
`__call__`		使对象可以像函数一样被调用。

数值操作符

方法名	操作符	描述
`__add__`	`+`	加法运算符。
`__sub__`	`-`	减法运算符。
`__mul__`	`*`	乘法运算符。
`__truediv__`	`/`	真除法运算符（总是返回浮点数）。
`__floordiv__`	`//`	地板除法运算符（返回整数）。
`__mod__`	`%`	取模运算符。
`__pow__`	`**`	幂运算符。
`__lshift__`	`<<`	左移运算符。
`__rshift__`	`>>`	右移运算符。
`__and__`	`&`	按位与运算符。
`__or__`	`\|`	按位或运算符。
`__xor__`	`^`	按位异或运算符。

反向操作符

对于上面的每个数值操作符，都有一个对应的反向操作符（以 r 开头），例如 __radd__, __rsub__, __rmul__ 等。当左操作数不支持该操作时，会调用反向操作符。

原地操作符

对于上面的每个数值操作符，还有一个对应的原地操作符（以 i 开头），例如 __iadd__, __isub__, __imul__ 等。原地操作符用于修改对象自身，而不是创建一个新的对象。

容器操作符

方法名	操作符/函数	描述
`__len__`	`len()`	返回容器的长度。
`__getitem__`	`[]`	获取容器中指定索引或键的元素。
`__setitem__`	`[] =`	设置容器中指定索引或键的元素。
`__delitem__`	`del []`	删除容器中指定索引或键的元素。
`__contains__`	`in`	检查容器是否包含指定元素。
`__iter__`	`iter()`	返回一个迭代器，用于遍历容器中的元素。
`__reversed__`	`reversed()`	返回一个反向迭代器，用于反向遍历容器中的元素。

示例：定制一个 Vector 类

让我们通过一个具体的例子来说明如何定制类。我们将创建一个 Vector 类，用于表示二维向量，并实现一些常用的操作符，例如加法、减法、乘法和长度计算。

import math

class Vector:
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __repr__(self):
        return f"Vector({self.x}, {self.y})"

    def __str__(self):
        return f"({self.x}, {self.y})"

    def __add__(self, other):
        if isinstance(other, Vector):
            return Vector(self.x + other.x, self.y + other.y)
        else:
            return NotImplemented

    def __sub__(self, other):
        if isinstance(other, Vector):
            return Vector(self.x - other.x, self.y - other.y)
        else:
            return NotImplemented

    def __mul__(self, scalar):
        if isinstance(scalar, (int, float)):
            return Vector(self.x * scalar, self.y * scalar)
        else:
            return NotImplemented

    def __rmul__(self, scalar):
        # 确保 scalar * vector 也能工作
        return self.__mul__(scalar)

    def __len__(self):
        return int(math.sqrt(self.x**2 + self.y**2))

    def __bool__(self):
        # 如果向量的长度大于 0，则为 True
        return bool(len(self))

    def __eq__(self, other):
        if isinstance(other, Vector):
            return self.x == other.x and self.y == other.y
        return False

在这个例子中，我们实现了以下方法：

__init__: 构造函数，用于初始化向量的 x 和 y 坐标。
__repr__: 返回对象的字符串表示形式，用于调试。
__str__: 返回对象的字符串表示形式，用于用户友好的输出。
__add__: 实现加法操作符 +。
__sub__: 实现减法操作符 -。
__mul__: 实现乘法操作符 *（与标量相乘）。
__rmul__: 实现反向乘法操作符 *（当标量在左边时）。
__len__: 实现 len() 函数，返回向量的长度。
__bool__: 实现 bool() 函数，如果向量的长度大于 0，则返回 True。
__eq__: 实现 == 操作符，判断两个向量是否相等。

现在我们可以像使用内置类型一样使用 Vector 类：

v1 = Vector(2, 3)
v2 = Vector(4, 5)

print(v1 + v2)  # 输出: (6, 8)
print(v1 - v2)  # 输出: (-2, -2)
print(v1 * 2)   # 输出: (4, 6)
print(2 * v1)   # 输出: (4, 6)
print(len(v1))  # 输出: 3
print(bool(v1)) # 输出: True
print(v1 == Vector(2,3)) # 输出: True

考虑返回值 `NotImplemented`

在上面的例子中，我们注意到在 __add__、__sub__ 和 __mul__ 方法中，如果 other 不是 Vector 类型的对象，我们会返回 NotImplemented。

NotImplemented 是一个特殊的单例对象，用于告诉 Python 解释器当前对象不支持该操作。当一个操作符方法返回 NotImplemented 时，Python 会尝试调用另一个操作数上的反向操作符方法（例如，如果 a + b 的 a.__add__(b) 返回 NotImplemented，则 Python 会尝试调用 b.__radd__(a)）。

这使得我们可以灵活地处理不同类型的操作数，并允许其他类来实现与我们的类的交互。

例如，我们可以创建一个 Scalar 类，并实现与 Vector 类的交互：

class Scalar:
    def __init__(self, value):
        self.value = value

    def __mul__(self, vector):
        if isinstance(vector, Vector):
            return Vector(self.value * vector.x, self.value * vector.y)
        else:
            return NotImplemented

    def __rmul__(self, vector):
        return self.__mul__(vector)

现在，我们可以使用 Scalar 类与 Vector 类进行乘法运算：

s = Scalar(2)
v = Vector(3, 4)

print(s * v)  # 输出: (6, 8)
print(v * s)  # 输出: (6, 8)

容器类型的定制

除了数值操作符之外，我们还可以定制容器类型的行为，例如列表、字典等。

例如，我们可以创建一个 MyList 类，并实现一些常用的容器操作符：

class MyList:
    def __init__(self, data=None):
        self.data = data or []

    def __len__(self):
        return len(self.data)

    def __getitem__(self, index):
        return self.data[index]

    def __setitem__(self, index, value):
        self.data[index] = value

    def __delitem__(self, index):
        del self.data[index]

    def __iter__(self):
        return iter(self.data)

    def __contains__(self, item):
        return item in self.data

现在我们可以像使用内置列表一样使用 MyList 类：

my_list = MyList([1, 2, 3])

print(len(my_list))      # 输出: 3
print(my_list[0])       # 输出: 1
my_list[1] = 4
print(my_list[1])       # 输出: 4
del my_list[2]
print(my_list.data)      # 输出: [1, 4]
print(2 in my_list)     # 输出: False

for item in my_list:
    print(item)          # 输出: 1, 4

`getattr`、`setattr` 和 `delattr`

这三个方法允许我们拦截对属性的访问、设置和删除操作。它们可以用于实现各种高级功能，例如属性验证、动态属性创建和属性访问控制。

__getattr__(self, name): 当尝试访问不存在的属性 name 时调用。
__setattr__(self, name, value): 当尝试设置属性 name 的值为 value 时调用。
__delattr__(self, name): 当尝试删除属性 name 时调用。

需要注意的是，在 __setattr__ 方法中，我们需要小心避免无限递归。因为在 __setattr__ 方法中设置属性会导致再次调用 __setattr__ 方法。为了避免这种情况，我们应该使用 object.__setattr__(self, name, value) 来设置属性。

例如：

class MyObject:
    def __init__(self):
        self._my_secret_attribute = None

    def __getattr__(self, name):
        if name == "my_attribute":
            return "This is my attribute"
        else:
            raise AttributeError(f"'{type(self).__name__}' object has no attribute '{name}'")

    def __setattr__(self, name, value):
        if name == "my_secret_attribute":
            # 拦截对 my_secret_attribute 的设置
            print("Cannot set my_secret_attribute directly.")
        else:
            # 使用 object.__setattr__ 来避免无限递归
            object.__setattr__(self, name, value)

    def __delattr__(self, name):
        print(f"Cannot delete attribute '{name}'.")

obj = MyObject()

print(obj.my_attribute)  # 输出: This is my attribute
try:
    print(obj.non_existent_attribute)
except AttributeError as e:
    print(e) # 输出: 'MyObject' object has no attribute 'non_existent_attribute'

obj.my_new_attribute = "New value"
print(obj.my_new_attribute) #输出: New value

obj.my_secret_attribute = "Secret!" # 输出: Cannot set my_secret_attribute directly.

del obj.my_new_attribute #删除成功
try:
    print(obj.my_new_attribute)
except AttributeError as e:
    print(e) # 输出: 'MyObject' object has no attribute 'my_new_attribute'

try:
    del obj.my_secret_attribute
except Exception as e:
    print(e) #输出：Cannot delete attribute 'my_secret_attribute'.

`call` 方法

__call__ 方法允许我们将对象像函数一样调用。当对象被调用时，会执行 __call__ 方法。

例如：

class MyCallable:
    def __init__(self, message):
        self.message = message

    def __call__(self, name):
        return f"{self.message}, {name}!"

my_callable = MyCallable("Hello")

print(my_callable("World"))  # 输出: Hello, World!

性能考虑

虽然数据模型协议提供了很大的灵活性，但过度使用它可能会影响性能。因为每次调用魔术方法都会增加额外的开销。因此，在定制类时，我们需要权衡灵活性和性能之间的关系。在性能敏感的场景中，我们应该尽量避免过度使用数据模型方法。

数据模型协议的强大之处

数据模型协议是 Python 中最强大的特性之一。它允许我们完全控制类的行为，并使其能够自然地与语言的其他部分交互。通过定制类，我们可以提高代码的可读性、可维护性和表达能力，并实现特定领域的逻辑。理解并熟练运用数据模型协议是成为一名优秀的 Python 开发者的关键。

定制类使代码更具表达力

今天我们探讨了Python的数据模型协议，学习了如何通过实现特殊方法来定制类的行为，使其能够自然地响应内置操作符。我们通过Vector和MyList类等例子，了解了如何实现数值操作、容器操作等。掌握数据模型协议对于编写可读性强、表达力强的Python代码至关重要。

更多IT精英技术系列讲座，到智猿学院