`PyAutoGUI`：自动化 GUI 交互与机器人流程自动化 (RPA) - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位观众，欢迎来到今天的“PyAutoGUI：让你的电脑自己玩”讲座！今天咱不谈高深的算法，不搞复杂的架构，咱们就来聊聊怎么让你的电脑像个听话的小弟一样，帮你完成那些重复、枯燥的鼠标键盘操作。

第一部分：认识 PyAutoGUI，你的“电脑遥控器”

啥是 PyAutoGUI？简单来说，它就是一个 Python 库，可以控制你的鼠标和键盘，就像你给电脑装了个遥控器。有了它，你可以用 Python 代码来模拟鼠标点击、键盘输入、屏幕截图等等，简直是自动化办公、游戏脚本、RPA 的神器！

1.1 安装 PyAutoGUI

就像你要用遥控器之前得先装电池一样，使用 PyAutoGUI 之前，你也得先安装它。打开你的终端或者 Anaconda Prompt，输入以下命令：

pip install pyautogui

如果你的网络比较慢，可以尝试使用国内的镜像源，比如：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyautogui

装好之后，就可以开始你的“遥控”之旅啦！

1.2 安全第一：Fail-Safe 特性

在使用 PyAutoGUI 之前，务必了解它的 Fail-Safe 特性。默认情况下，当你的鼠标移动到屏幕左上角时，PyAutoGUI 会抛出一个 pyautogui.FailSafeException 异常，停止你的脚本。这是为了防止你的脚本失控，导致你的电脑一直乱点乱按。

你可以通过设置 pyautogui.FAILSAFE = False 来禁用这个特性，但是强烈建议不要这样做！除非你非常确定你的脚本不会出错。

第二部分：鼠标控制：指哪打哪，精准操控

有了 PyAutoGUI，你可以像操控自己的鼠标一样，控制电脑上的鼠标。

2.1 获取鼠标位置

首先，我们需要知道鼠标当前的位置。使用 pyautogui.position() 函数可以获取鼠标的坐标：

import pyautogui

x, y = pyautogui.position()
print(f"鼠标当前位置：x={x}, y={y}")

这个函数会返回一个元组，包含鼠标的 x 和 y 坐标。

2.2 移动鼠标

你可以使用 pyautogui.moveTo() 函数来移动鼠标到指定的坐标：

import pyautogui

pyautogui.moveTo(100, 150, duration=0.25)  # 将鼠标移动到 (100, 150) 坐标，耗时 0.25 秒

moveTo() 函数接受三个参数：

x: 目标位置的 x 坐标。
y: 目标位置的 y 坐标。
duration: 移动鼠标所需的时间（秒）。如果省略这个参数，鼠标会立即移动到目标位置。

你也可以使用 pyautogui.moveRel() 函数来相对移动鼠标：

import pyautogui

pyautogui.moveRel(100, 0, duration=0.25)   # 将鼠标向右移动 100 像素
pyautogui.moveRel(0, -50, duration=0.25)  # 将鼠标向上移动 50 像素

moveRel() 函数接受的参数和 moveTo() 函数类似，只是 x 和 y 表示的是相对当前位置的偏移量。

2.3 点击鼠标

PyAutoGUI 提供了 pyautogui.click() 函数来模拟鼠标点击：

import pyautogui

pyautogui.click()  # 在鼠标当前位置点击鼠标左键
pyautogui.click(100, 150)  # 在 (100, 150) 坐标点击鼠标左键
pyautogui.click(button='right')  # 在鼠标当前位置点击鼠标右键
pyautogui.click(clicks=2, interval=0.25)  # 双击鼠标左键，每次点击间隔 0.25 秒

click() 函数接受以下参数：

x: 点击位置的 x 坐标。如果省略，则在鼠标当前位置点击。
y: 点击位置的 y 坐标。如果省略，则在鼠标当前位置点击。
button: 点击的鼠标按键，可以是 'left' (默认), 'right', 或 'middle'。
clicks: 点击的次数。
interval: 每次点击之间的间隔时间（秒）。

你还可以使用 pyautogui.doubleClick() 和 pyautogui.rightClick() 函数来分别模拟双击和右键点击：

import pyautogui

pyautogui.doubleClick()  # 在鼠标当前位置双击鼠标左键
pyautogui.rightClick(100, 150)  # 在 (100, 150) 坐标点击鼠标右键

2.4 鼠标按下和释放

有时候，你需要模拟鼠标按下和释放的操作，比如拖拽。PyAutoGUI 提供了 pyautogui.mouseDown() 和 pyautogui.mouseUp() 函数来实现这个功能：

import pyautogui

pyautogui.mouseDown()  # 按下鼠标左键
pyautogui.moveTo(200, 200, duration=0.25)  # 移动鼠标到 (200, 200) 坐标
pyautogui.mouseUp()  # 释放鼠标左键

这段代码会模拟从鼠标当前位置拖拽到 (200, 200) 坐标的操作。

2.5 滚动鼠标

如果你需要滚动鼠标滚轮，可以使用 pyautogui.scroll() 函数：

import pyautogui

pyautogui.scroll(100)  # 向上滚动 100 个单位
pyautogui.scroll(-100) # 向下滚动 100 个单位

scroll() 函数接受一个参数，表示滚动的单位。正数表示向上滚动，负数表示向下滚动。

第三部分：键盘控制：指哪输哪，文字输入

除了鼠标控制，PyAutoGUI 还可以控制键盘，让你用 Python 代码输入文字。

3.1 输入字符串

你可以使用 pyautogui.typewrite() 函数来输入字符串：

import pyautogui

pyautogui.typewrite("Hello, world!", interval=0.25)  # 输入 "Hello, world!"，每个字符之间间隔 0.25 秒

typewrite() 函数接受两个参数：

message: 要输入的字符串。
interval: 每个字符之间的时间间隔（秒）。

3.2 按下和释放按键

如果你需要模拟按下和释放单个按键，可以使用 pyautogui.keyDown() 和 pyautogui.keyUp() 函数：

import pyautogui

pyautogui.keyDown('shift')  # 按下 Shift 键
pyautogui.typewrite('hello')  # 输入 "HELLO"
pyautogui.keyUp('shift')  # 释放 Shift 键

这段代码会模拟按下 Shift 键，然后输入 "hello"，最后释放 Shift 键，最终输入 "HELLO"。

3.3 按下组合键

PyAutoGUI 提供了 pyautogui.hotkey() 函数来模拟按下组合键：

import pyautogui

pyautogui.hotkey('ctrl', 'c')  # 模拟按下 Ctrl+C 复制
pyautogui.hotkey('ctrl', 'v')  # 模拟按下 Ctrl+V 粘贴

hotkey() 函数接受多个参数，表示要按下的按键。

3.4 特殊按键

PyAutoGUI 支持一些特殊按键，比如 enter, tab, esc, space, up, down, left, right 等等。你可以在 pyautogui.KEYBOARD_KEYS 列表中找到所有支持的按键。

import pyautogui

pyautogui.press('enter')  # 按下 Enter 键
pyautogui.press(['left', 'left', 'left'])  # 按下三次左方向键

第四部分：屏幕截图：眼见为实，精准定位

有时候，你需要根据屏幕上的内容来判断下一步的操作。PyAutoGUI 提供了屏幕截图的功能，让你能够“看到”屏幕上的内容。

4.1 截取屏幕

你可以使用 pyautogui.screenshot() 函数来截取屏幕：

import pyautogui

im = pyautogui.screenshot()  # 截取整个屏幕
im.save('screenshot.png')  # 保存截图到文件

screenshot() 函数会返回一个 PIL Image 对象，你可以使用 PIL 库来处理这个图像。

4.2 截取指定区域

你也可以截取屏幕的指定区域：

import pyautogui

im = pyautogui.screenshot(region=(0, 0, 300, 400))  # 截取屏幕左上角 300x400 的区域
im.save('region.png')  # 保存截图到文件

screenshot() 函数的 region 参数接受一个元组，包含要截取的区域的左上角 x 坐标、左上角 y 坐标、宽度和高度。

4.3 图像识别：在屏幕上寻找目标

PyAutoGUI 最强大的功能之一是图像识别。你可以使用 pyautogui.locateOnScreen() 函数在屏幕上寻找指定的图像：

import pyautogui

location = pyautogui.locateOnScreen('button.png')  # 在屏幕上寻找 button.png 图像
if location is not None:
    print(f"找到图像，位置：{location}")
    x, y, width, height = location
    center_x = x + width / 2
    center_y = y + height / 2
    pyautogui.click(center_x, center_y)  # 点击图像的中心位置
else:
    print("未找到图像")

locateOnScreen() 函数接受一个参数，表示要寻找的图像的文件名。如果找到图像，它会返回一个 Box 对象，包含图像的左上角 x 坐标、左上角 y 坐标、宽度和高度。如果没有找到图像，它会返回 None。

你还可以使用 pyautogui.locateAllOnScreen() 函数来寻找屏幕上所有匹配的图像：

import pyautogui

for location in pyautogui.locateAllOnScreen('button.png'):
    print(f"找到图像，位置：{location}")
    x, y, width, height = location
    center_x = x + width / 2
    center_y = y + height / 2
    pyautogui.click(center_x, center_y)  # 点击图像的中心位置

4.4 提高图像识别的准确性

图像识别的准确性受到多种因素的影响，比如屏幕分辨率、图像质量、光照条件等等。你可以尝试以下方法来提高图像识别的准确性：

使用高质量的图像作为模板。
尽量截取包含足够特征的图像区域。
调整 confidence 参数，confidence 参数表示匹配的置信度，取值范围是 0 到 1。默认值为 0.999。降低 confidence 参数可以提高找到图像的可能性，但是也可能导致误判。
调整 grayscale 参数，grayscale 参数表示是否将图像转换为灰度图像。默认值为 False。如果图像是灰度的，可以设置为 True 来提高识别速度。

import pyautogui

location = pyautogui.locateOnScreen('button.png', confidence=0.8, grayscale=True)

第五部分：实战演练：让你的电脑自动点赞

光说不练假把式，咱们来做一个实战演练，让你的电脑自动点赞。

5.1 准备工作

首先，你需要找到你要点赞的按钮的图像，并将其保存为 like_button.png 文件。

5.2 编写代码

import pyautogui
import time

def auto_like():
    """自动点赞函数"""
    while True:
        try:
            location = pyautogui.locateOnScreen('like_button.png', confidence=0.7)
            if location is not None:
                x, y, width, height = location
                center_x = x + width / 2
                center_y = y + height / 2
                pyautogui.click(center_x, center_y)  # 点击图像的中心位置
                print("点赞成功")
                time.sleep(2)  # 等待 2 秒
            else:
                print("未找到点赞按钮")
                time.sleep(5)  # 等待 5 秒
        except pyautogui.FailSafeException:
            print("Fail-Safe triggered! Exiting...")
            break

if __name__ == '__main__':
    print("开始自动点赞...")
    auto_like()

5.3 运行代码

运行这段代码，你的电脑就会自动在屏幕上寻找 like_button.png 图像，如果找到，就会点击它，然后等待 2 秒，再次寻找。如果没找到，就会等待 5 秒，再次寻找。直到你把鼠标移动到屏幕左上角，触发 Fail-Safe 特性，停止脚本。

第六部分：高级技巧：让你的自动化更上一层楼

掌握了基本操作之后，咱们再来学习一些高级技巧，让你的自动化更上一层楼。

6.1 异常处理

在自动化脚本中，异常处理非常重要。因为脚本可能会遇到各种各样的问题，比如找不到图像、网络连接失败等等。如果不进行异常处理，脚本可能会崩溃，导致自动化任务失败。

你可以使用 try...except 语句来捕获异常：

import pyautogui

try:
    location = pyautogui.locateOnScreen('button.png')
    if location is not None:
        x, y, width, height = location
        center_x = x + width / 2
        center_y = y + height / 2
        pyautogui.click(center_x, center_y)
    else:
        print("未找到图像")
except pyautogui.ImageNotFoundException:
    print("图像未找到")
except Exception as e:
    print(f"发生未知错误：{e}")

6.2 多线程

如果你的自动化任务比较耗时，你可以使用多线程来提高效率。比如，你可以使用一个线程来执行自动化操作，另一个线程来监控用户输入，以便随时停止脚本。

import pyautogui
import threading
import time

stop_flag = False

def auto_click():
    """自动点击函数"""
    while not stop_flag:
        try:
            pyautogui.click(100, 150)
            print("点击")
            time.sleep(1)
        except pyautogui.FailSafeException:
            print("Fail-Safe triggered! Exiting...")
            break

def monitor_input():
    """监控用户输入函数"""
    global stop_flag
    input("Press Enter to stop...")
    stop_flag = True

if __name__ == '__main__':
    click_thread = threading.Thread(target=auto_click)
    monitor_thread = threading.Thread(target=monitor_input)

    click_thread.start()
    monitor_thread.start()

    click_thread.join()
    monitor_thread.join()

    print("程序结束")

6.3 GUI 界面

如果你想让你的自动化脚本更加易用，你可以为其添加一个 GUI 界面。你可以使用 Tkinter, PyQt, 或 wxPython 等 GUI 库来实现这个功能。

第七部分：总结与展望

今天咱们一起学习了 PyAutoGUI 的基本用法和一些高级技巧。希望通过今天的讲座，你能够掌握 PyAutoGUI 的使用方法，并将其应用到你的实际工作中，提高工作效率。

PyAutoGUI 是一个非常强大的工具，可以帮助你完成各种各样的自动化任务。但是，在使用 PyAutoGUI 时，也要注意安全问题，避免脚本失控，造成不必要的损失。

未来，随着人工智能技术的不断发展，自动化技术将会越来越普及。PyAutoGUI 也会不断更新和完善，为我们提供更加强大的自动化功能。

最后，感谢大家的观看！希望今天的讲座对你有所帮助。如果大家有什么问题，欢迎在评论区留言。咱们下期再见！

发表回复 取消回复

发表回复取消回复