Timing Attacks (时间攻击) 在 Web API (如密码哈希比较、验证码生成) 中的利用与防御。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

大家好，今天咱们来聊聊一个听起来高深莫测，但实际上离咱们很近的安全问题：Timing Attacks，中文名叫时间攻击。别怕，这玩意儿没那么可怕，就像隔壁老王家的猫，看着凶，其实就是想讨根火腿肠。

咱们主要讲的是在Web API里，这只“猫”是怎么搞事情的，以及咱们怎么喂它，让它别捣乱。主要围绕密码哈希比较和验证码生成这两个场景展开，因为这俩地方最容易被这只“猫”盯上。

开场白：时间攻击是个啥？

简单说，时间攻击就是通过测量执行特定操作所需的时间，来推断出一些秘密信息。这听起来有点像听诊器，医生通过听心跳来判断你的健康状况，攻击者通过听程序的“心跳”（运行时间）来判断你的秘密。

在Web API里，攻击者可能无法直接看到你的密码，但如果你的代码在比较密码哈希时，一旦发现有不同的字符就立即返回，那攻击者就可以通过不断尝试不同的密码，并观察服务器响应的时间，来慢慢猜出你的密码。这就像玩“猜数字”游戏，你每次猜一个数字，对方告诉你“大了”或“小了”，最终你就能猜出正确的数字。

第一幕：密码哈希比较，timing attack的重灾区

密码哈希比较是Web API里最常见的操作之一。用户输入密码，系统对其进行哈希处理，然后将哈希值与数据库中存储的哈希值进行比较。如果两个哈希值匹配，则用户身份验证成功。

问题代码示例 (Python):

import time

def compare_password_hashes_vulnerable(stored_hash, user_input_hash):
    """
    脆弱的密码哈希比较函数，容易受到时间攻击。
    """
    if len(stored_hash) != len(user_input_hash):
        return False

    for i in range(len(stored_hash)):
        if stored_hash[i] != user_input_hash[i]:
            return False  # 发现不同字符立即返回
    return True

# 模拟场景
stored_hash = "a1b2c3d4e5f6"
user_input_hash = "a1b2c3d4e5f7"

start_time = time.time()
result = compare_password_hashes_vulnerable(stored_hash, user_input_hash)
end_time = time.time()

print(f"比较结果: {result}, 耗时: {end_time - start_time:.6f} 秒")

user_input_hash = "xxxxxxxxxxxx" # 全部错误
start_time = time.time()
result = compare_password_hashes_vulnerable(stored_hash, user_input_hash)
end_time = time.time()

print(f"比较结果: {result}, 耗时: {end_time - start_time:.6f} 秒")

在这个例子中，compare_password_hashes_vulnerable 函数会逐个字符地比较两个哈希值。如果发现任何不匹配的字符，它会立即返回 False。这就给时间攻击创造了机会。

攻击者如何利用：

攻击者发送一个错误的密码哈希，例如 "xxxxxxxxxxxx"。
攻击者测量服务器响应的时间。由于第一个字符就不匹配，所以响应会很快。
攻击者发送另一个密码哈希，这次将第一个字符改为 "a"，例如 "axxxxxxxxx"。
攻击者再次测量服务器响应的时间。如果响应时间比之前略长，这意味着第一个字符是正确的。
攻击者重复这个过程，每次尝试猜测下一个字符，直到猜出整个密码哈希。

为什么会发生时间差异？

因为CPU执行比较操作需要时间。如果两个字符匹配，CPU需要更多的时间来比较下一个字符。如果字符不匹配，CPU立即停止比较并返回。这种细微的时间差异，在攻击者持续攻击时会被放大。

防御方法：恒定时间比较

为了防止时间攻击，我们需要使用恒定时间比较算法。这种算法无论输入如何，都会在相同的时间内完成比较。

安全代码示例 (Python):

import time

def compare_password_hashes_secure(stored_hash, user_input_hash):
    """
    安全的密码哈希比较函数，使用恒定时间比较。
    """
    if len(stored_hash) != len(user_input_hash):
        return False

    result = 0
    for i in range(len(stored_hash)):
        result |= ord(stored_hash[i]) ^ ord(user_input_hash[i]) # 使用位运算，无论是否匹配都执行所有比较
    return result == 0

# 模拟场景
stored_hash = "a1b2c3d4e5f6"
user_input_hash = "a1b2c3d4e5f7"

start_time = time.time()
result = compare_password_hashes_secure(stored_hash, user_input_hash)
end_time = time.time()

print(f"比较结果: {result}, 耗时: {end_time - start_time:.6f} 秒")

user_input_hash = "xxxxxxxxxxxx" # 全部错误
start_time = time.time()
result = compare_password_hashes_secure(stored_hash, user_input_hash)
end_time = time.time()

print(f"比较结果: {result}, 耗时: {end_time - start_time:.6f} 秒")

在这个例子中，compare_password_hashes_secure 函数使用位运算来比较两个哈希值。无论字符是否匹配，它都会执行所有比较，因此执行时间是恒定的。

解释：

result |= ord(stored_hash[i]) ^ ord(user_input_hash[i]) 这一行是关键。 ord() 函数返回字符的ASCII码。 ^ 是按位异或运算符。如果两个字符相同，则异或结果为 0。如果两个字符不同，则异或结果为非 0。 |= 运算符将异或结果与 result 进行按位或运算。这样，无论字符是否匹配，都会执行所有比较，并且 result 的值取决于所有字符的比较结果。
最终，如果 result 为 0，则表示所有字符都匹配，否则表示至少有一个字符不匹配。

总结：

特性	脆弱的比较函数	安全的比较函数
提前返回	是	否
恒定时间执行	否	是
安全性	低	高

实战建议：

使用现有的安全库： 大多数编程语言都有提供恒定时间比较功能的库。例如，Python的 secrets 模块的 compare_digest() 函数，Java的 MessageDigest.isEqual() 函数, Go语言的 subtle.ConstantTimeCompare() 函数等。优先使用这些库，避免自己编写容易出错的代码。
避免自己编写比较函数： 除非你对恒定时间比较算法有深入的了解，否则最好不要自己编写比较函数。
测试你的代码： 使用工具来测试你的代码是否容易受到时间攻击。例如，你可以编写一个脚本来测量比较操作的执行时间，并确保执行时间是恒定的。

第二幕：验证码生成，另一块易被盯上的肥肉

验证码的主要目的是区分人机。如果验证码的生成过程存在时间漏洞，攻击者可以通过时间攻击来破解验证码。

问题代码示例 (Python):

import time
import random

def generate_captcha_vulnerable(length):
    """
    脆弱的验证码生成函数，容易受到时间攻击。
    """
    captcha = ""
    for i in range(length):
        time.sleep(random.random() * 0.01)  # 模拟生成验证码的耗时操作
        captcha += random.choice("abcdefghijklmnopqrstuvwxyz")
    return captcha

# 模拟场景
start_time = time.time()
captcha = generate_captcha_vulnerable(6)
end_time = time.time()

print(f"生成的验证码: {captcha}, 耗时: {end_time - start_time:.6f} 秒")

在这个例子中，generate_captcha_vulnerable 函数会生成一个指定长度的验证码。在生成验证码的每个字符时，它会暂停一段时间。这个暂停的时间是随机的。

攻击者如何利用：

攻击者发送请求生成验证码。
攻击者测量服务器响应的时间。
攻击者分析响应时间，推断出验证码的长度。因为每个字符生成时都有一个随机的暂停，所以总的响应时间会与验证码的长度成正比。
攻击者猜测验证码的内容。如果知道验证码的长度，攻击者就可以更容易地猜测验证码。

为什么会发生时间差异？

因为 time.sleep() 函数会暂停程序的执行。暂停的时间越长，程序的响应时间就越长。

防御方法：避免可预测的延迟

为了防止时间攻击，我们需要避免在验证码生成过程中引入可预测的延迟。

安全代码示例 (Python):

import random
import string

def generate_captcha_secure(length):
    """
    安全的验证码生成函数，避免可预测的延迟。
    """
    characters = string.ascii_lowercase + string.digits  # 包含字母和数字
    captcha = ''.join(random.choice(characters) for i in range(length)) # 一次性生成所有字符
    return captcha

# 模拟场景
start_time = time.time()
captcha = generate_captcha_secure(6)
end_time = time.time()

print(f"生成的验证码: {captcha}, 耗时: {end_time - start_time:.6f} 秒")

在这个例子中，generate_captcha_secure 函数使用 random.choice() 函数一次性生成所有字符，避免了在生成每个字符时引入延迟。

解释：

characters = string.ascii_lowercase + string.digits 这一行定义了验证码可以包含的字符集。
captcha = ''.join(random.choice(characters) for i in range(length)) 这一行使用列表推导式和 join() 函数一次性生成所有字符。

总结：

特性	脆弱的生成函数	安全的生成函数
可预测的延迟	有	无
性能	慢	快
安全性	低	高

实战建议：

使用现有的验证码库： 大多数Web框架都有提供验证码功能的库。例如，Python的 captcha 库，Java的 kaptcha 库等。这些库通常已经考虑了时间攻击的防御。
增加验证码的复杂度： 增加验证码的长度和字符集，可以使攻击者更难猜测验证码。
使用验证码挑战： 使用更复杂的验证码挑战，例如滑动拼图或图像识别，可以更有效地防御机器人攻击。
限制验证码的生成频率： 限制每个IP地址或用户生成验证码的频率，可以防止攻击者进行暴力破解。
使用Web Application Firewall (WAF): WAF可以帮助识别和阻止恶意请求，包括针对验证码的攻击。

第三幕：通用防御策略

除了针对特定场景的防御方法，还有一些通用的防御策略可以帮助你提高Web API的安全性。

输入验证： 对所有用户输入进行验证，防止恶意输入。这可以防止各种攻击，包括时间攻击。例如，如果你的API需要接收一个整数作为参数，你应该验证该参数是否确实是一个整数，并且在允许的范围内。
速率限制： 限制每个IP地址或用户发送请求的频率。这可以防止攻击者进行暴力破解或DDoS攻击。
监控和日志记录： 监控你的API的性能和安全事件。记录所有重要的事件，例如登录尝试和错误。这可以帮助你及时发现和响应攻击。
安全审计： 定期对你的代码进行安全审计，以发现潜在的安全漏洞。可以使用静态代码分析工具或聘请专业的安全审计师。
保持更新： 及时更新你的软件和库，以修复已知的安全漏洞。

时间攻击防御 checklist：

检查项	说明
密码哈希比较	使用恒定时间比较算法，避免提前返回。使用现有的安全库，例如 `secrets.compare_digest()`。
验证码生成	避免在生成过程中引入可预测的延迟。使用现有的验证码库。增加验证码的复杂度。限制验证码的生成频率。
输入验证	对所有用户输入进行验证，防止恶意输入。
速率限制	限制每个IP地址或用户发送请求的频率。
监控和日志记录	监控你的API的性能和安全事件。记录所有重要的事件，例如登录尝试和错误。
安全审计	定期对你的代码进行安全审计，以发现潜在的安全漏洞。
保持更新	及时更新你的软件和库，以修复已知的安全漏洞。
使用Web Application Firewall (WAF)	WAF可以帮助识别和阻止恶意请求，包括针对时间攻击的请求。

总结：

时间攻击是一种隐蔽但有效的攻击方式。通过了解时间攻击的原理和防御方法，你可以提高Web API的安全性，保护用户的数据。记住，安全是一个持续的过程，需要不断地学习和改进。

希望今天的讲座对大家有所帮助。谢谢！

发表回复 取消回复

发表回复取消回复