Python高级技术之：`Python`的`Pythonic`代码：如何编写更符合`Python`哲学的高质量代码。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位朋友，晚上好！我是你们今晚的Python编程向导。咱们今晚不讲那些高深莫测的算法，也不聊那些云里雾里的框架，咱们聊点接地气的——Pythonic代码，也就是怎么把Python写得更“Python”。

想象一下，你用英语写一篇文章，语法正确，意思也表达清楚了，但总觉得少了点味道，不够地道。Python代码也是一样，能跑只是基础，写的漂亮、优雅，才算登堂入室。

那么，什么才是Pythonic？简单来说，就是遵循Python的设计哲学，写出简洁、易读、可维护的代码。就像学一门外语，要学会用母语的思维方式去思考和表达。

咱们今天就来聊聊，如何把你的Python代码变得更“Pythonic”。

一、拥抱Python之禅 (The Zen of Python)

在开始之前，咱们先来温习一下Python的灵魂——Python之禅。在Python解释器中输入import this，你就能看到它：

>>> import this
The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!

虽然有点像绕口令，但它字字珠玑，蕴含了Python设计的核心思想。咱们可以把它看作是Python程序员的“葵花宝典”，没事儿背一背，练一练，准没错。

二、数据结构：玩转内置类型

Python内置的数据结构，像列表(List)、元组(Tuple)、字典(Dictionary)和集合(Set)，就像我们工具箱里的锤子、扳手、螺丝刀，用好了能事半功倍。

列表推导式 (List Comprehension)

列表推导式是Python的杀手锏之一，它能用简洁的语法创建新的列表。比如，我们要创建一个包含1到10的平方的列表，普通的做法可能是：

squares = []
for i in range(1, 11):
    squares.append(i * i)
print(squares)  # Output: [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

但用列表推导式，一行代码就搞定：

squares = [i * i for i in range(1, 11)]
print(squares)  # Output: [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

是不是感觉神清气爽？列表推导式不仅简洁，而且通常比循环更快。

生成器表达式 (Generator Expression)

如果我们需要处理大量数据，但又不想一次性把所有数据加载到内存中，生成器表达式就派上用场了。它和列表推导式很像，只是把方括号换成了圆括号：

squares = (i * i for i in range(1, 11))
print(squares)  # Output: <generator object <genexpr> at 0x...>

for square in squares:
    print(square)

生成器表达式返回的是一个生成器对象，它只有在被迭代时才会计算值，非常节省内存。想象一下，你要读一本几百万字的大部头，难道要一口气全看完吗？肯定是一页一页地翻啊！生成器表达式就是这个“一页一页”的机制。

字典推导式 (Dictionary Comprehension)

字典推导式和列表推导式类似，用于创建字典。比如，我们要创建一个字典，键是1到5，值是它们的平方：

squares = {i: i * i for i in range(1, 6)}
print(squares)  # Output: {1: 1, 2: 4, 3: 9, 4: 16, 5: 25}

集合推导式 (Set Comprehension)

集合推导式用于创建集合，可以自动去重。比如，我们要创建一个包含字符串中所有不同字符的集合：

text = "hello world"
unique_chars = {char for char in text}
print(unique_chars)  # Output: {' ', 'd', 'e', 'h', 'l', 'o', 'r', 'w'}

利用 enumerate 迭代

在循环中，如果我们需要同时获取元素和索引，可以用 enumerate 函数。比起手动维护一个计数器，enumerate 更优雅、更不容易出错：

my_list = ['apple', 'banana', 'cherry']
for index, fruit in enumerate(my_list):
    print(f"Index: {index}, Fruit: {fruit}")

使用 zip 并行迭代

如果我们需要同时迭代多个列表，可以使用 zip 函数。它会将多个列表对应位置的元素打包成元组：

names = ['Alice', 'Bob', 'Charlie']
ages = [25, 30, 28]
for name, age in zip(names, ages):
    print(f"{name} is {age} years old.")

如果列表长度不一致，zip 会在最短的列表结束时停止。如果需要处理长度不一致的情况，可以使用 itertools.zip_longest。

善用 in 操作符

判断一个元素是否在序列中，in 操作符比循环查找更简洁、更高效：

my_list = ['apple', 'banana', 'cherry']
if 'banana' in my_list:
    print("Banana is in the list.")

元组的妙用

元组除了作为不可变列表之外，还有很多妙用。

多重赋值 (Tuple Unpacking)：

a, b = 1, 2
print(a, b)  # Output: 1 2

# 交换变量的值
a, b = b, a
print(a, b)  # Output: 2 1

函数返回多个值：

def get_name_and_age():
    return "Alice", 25

name, age = get_name_and_age()
print(name, age)  # Output: Alice 25

三、函数：编写可重用的代码

函数是代码复用的基本单元。编写Pythonic的函数，要遵循以下原则：

使用默认参数

如果一个参数在大多数情况下都有一个默认值，可以将其设置为默认参数。这样可以简化函数的调用：

def greet(name, greeting="Hello"):
    print(f"{greeting}, {name}!")

greet("Alice")  # Output: Hello, Alice!
greet("Bob", "Hi")  # Output: Hi, Bob!

*使用 `args和kwargs`

*args 用于接收任意数量的位置参数，**kwargs 用于接收任意数量的关键字参数。它们可以使函数更加灵活：

def my_function(*args, **kwargs):
    print("Args:", args)
    print("Kwargs:", kwargs)

my_function(1, 2, 3, name="Alice", age=25)
# Output:
# Args: (1, 2, 3)
# Kwargs: {'name': 'Alice', 'age': 25}

使用文档字符串 (Docstring)

好的文档是代码的生命线。在函数、类、模块的开头，使用文档字符串来描述其功能、参数、返回值等信息。这样可以使用 help() 函数或IDE的自动提示来查看文档：

def add(a, b):
    """
    This function adds two numbers.

    Args:
        a: The first number.
        b: The second number.

    Returns:
        The sum of a and b.
    """
    return a + b

help(add)

使用类型提示 (Type Hints)

Python是动态类型语言，但从Python 3.5开始，引入了类型提示。类型提示可以提高代码的可读性和可维护性，并帮助IDE进行静态分析：

def add(a: int, b: int) -> int:
    return a + b

类型提示只是建议，Python解释器不会强制执行。但它可以帮助我们发现潜在的类型错误。

四、流程控制：让代码更清晰

流程控制语句，如 if、for、while 等，是控制代码执行顺序的关键。

使用 if-else 表达式 (三元运算符)

if-else 表达式可以简化简单的条件赋值：

age = 20
status = "adult" if age >= 18 else "minor"
print(status)  # Output: adult

使用 for-else 语句

for-else 语句在循环正常结束时执行 else 块，如果在循环中遇到 break，则不执行 else 块。这个特性可以用于搜索列表中是否存在某个元素：

my_list = [1, 2, 3, 4, 5]
target = 6

for item in my_list:
    if item == target:
        print("Found!")
        break
else:
    print("Not found.")  # Output: Not found.

避免使用 while True

除非有特殊需要，尽量避免使用 while True 循环。可以使用更明确的条件来控制循环的结束。如果必须使用 while True，确保在循环内部有明确的 break 语句。

五、上下文管理器：优雅地管理资源

上下文管理器 (Context Manager) 用于自动管理资源的分配和释放，比如文件、网络连接、锁等。使用 with 语句可以确保资源在使用完毕后被正确释放，即使发生异常也不会出错。

使用 with open() 操作文件

with open("my_file.txt", "r") as f:
    content = f.read()
    print(content)
# 文件会在 with 语句结束后自动关闭

自定义上下文管理器

可以通过实现 __enter__ 和 __exit__ 方法来创建自定义的上下文管理器：

class MyContextManager:
    def __enter__(self):
        print("Entering the context.")
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        print("Exiting the context.")
        if exc_type:
            print(f"An exception occurred: {exc_type}, {exc_val}")
        return True  # Suppress the exception

    def do_something(self):
        print("Doing something within the context.")

with MyContextManager() as manager:
    manager.do_something()
    #raise ValueError("Something went wrong.") # 注释掉这行，观察不同的结果
# Output:
# Entering the context.
# Doing something within the context.
# Exiting the context.

__enter__ 方法在进入 with 语句块时被调用，返回一个对象，该对象会被赋值给 as 后面的变量。__exit__ 方法在退出 with 语句块时被调用，用于清理资源。如果发生了异常，exc_type、exc_val 和 exc_tb 会分别包含异常的类型、值和堆栈跟踪信息。__exit__ 方法返回 True 可以阻止异常传播，返回 False 或不返回任何值则会重新引发异常。

六、模块和包：组织你的代码

模块和包用于组织大型项目中的代码。

使用有意义的模块名和包名

模块名和包名应该清晰地反映其功能。避免使用过于宽泛或含糊不清的名字。

避免循环导入 (Circular Imports)

循环导入是指两个或多个模块相互导入，导致解释器无法正确加载模块。要避免循环导入，可以重新组织代码结构，或者使用延迟导入 (Lazy Imports)。

使用 __init__.py 文件

在Python 3.3之前，一个目录要被视为一个包，必须包含一个 __init__.py 文件。即使 __init__.py 文件是空的，它也告诉Python解释器这是一个包。从Python 3.3开始，如果一个目录不包含 __init__.py 文件，它仍然可以被视为一个包，称为“命名空间包 (Namespace Package)”。但为了兼容性，建议仍然在包目录下包含 __init__.py 文件。

使用相对导入 (Relative Imports)

在同一个包内的模块之间进行导入时，可以使用相对导入。相对导入使用 . 和 .. 来表示当前目录和上级目录：

# 在 package/module1.py 中
from . import module2  # 导入同一个包中的 module2
from .. import main_module  # 导入上级目录中的 main_module

七、命名规范：让代码更易读

好的命名规范可以提高代码的可读性。Python有一套官方的命名规范，称为PEP 8。

类型	命名规范	示例
变量	小写字母，单词之间用下划线分隔	`my_variable`, `user_name`
函数	小写字母，单词之间用下划线分隔	`my_function`, `calculate_area`
类	首字母大写的驼峰命名法	`MyClass`, `ShoppingCart`
模块	小写字母，单词之间用下划线分隔	`my_module`, `data_processing`
包	小写字母	`mypackage`, `utils`
常量	大写字母，单词之间用下划线分隔	`PI`, `MAX_VALUE`

八、异常处理：优雅地处理错误

异常处理是编写健壮代码的重要组成部分。

只捕获你知道如何处理的异常

不要捕获所有异常，然后简单地忽略它们。只捕获你知道如何处理的异常，并提供有意义的错误信息。

使用 finally 块

finally 块中的代码无论是否发生异常都会被执行，通常用于清理资源。

自定义异常

可以创建自定义的异常类，以更好地表达代码中的错误情况：

class MyCustomError(Exception):
    pass

def my_function():
    raise MyCustomError("Something went wrong.")

try:
    my_function()
except MyCustomError as e:
    print(f"Caught an exception: {e}")

九、工具：辅助你编写Pythonic代码

有很多工具可以帮助我们编写Pythonic代码：

PEP 8 检查器 (如 flake8, pylint)：这些工具可以检查代码是否符合PEP 8规范。
类型检查器 (如 mypy)：mypy 可以进行静态类型检查，帮助我们发现潜在的类型错误。
代码格式化工具 (如 black)：black 可以自动格式化代码，使其符合统一的风格。

总结

编写Pythonic代码是一个不断学习和实践的过程。记住Python之禅，善用内置数据结构和函数，遵循命名规范，编写清晰的流程控制语句，优雅地管理资源，合理地组织代码，处理异常，并使用工具来辅助你。

希望今晚的分享能帮助大家写出更“Python”的代码！谢谢大家！

发表回复 取消回复

发表回复取消回复