`Web`服务的`日志`系统：`ELK`栈在`Python`后端中的`应用`。 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，下面开始正文：

Web 服务日志系统：ELK 栈在 Python 后端中的应用

大家好，今天我们来聊聊 Web 服务日志系统，以及 ELK 栈如何在 Python 后端中发挥作用。日志对于任何 Web 服务来说都至关重要，它能帮助我们诊断问题、监控性能、分析用户行为，甚至进行安全审计。一个好的日志系统不仅要能记录日志，还要能方便地搜索、分析和可视化这些日志数据。ELK 栈（Elasticsearch, Logstash, Kibana）正是为此而生的。

1. 为什么需要 ELK 栈？

传统的日志管理方法，比如简单的文本文件存储，在面对大规模、高并发的 Web 服务时会显得力不从心。原因如下：

难以搜索： 在大量文本文件中搜索特定信息非常耗时。
难以分析： 复杂的日志分析需要编写大量的脚本和工具。
难以可视化： 很难将日志数据转化为易于理解的图表和仪表盘。
难以集中管理： 分布式系统产生的日志分散在各个服务器上，难以统一管理。

ELK 栈通过提供集中式的日志收集、存储、搜索、分析和可视化能力，解决了这些问题。

Elasticsearch: 强大的搜索和分析引擎，提供近实时的全文搜索和结构化数据分析能力。
Logstash: 数据收集、处理和转换管道，可以将来自不同来源的日志数据统一格式化并发送到 Elasticsearch。
Kibana: 可视化工具，可以基于 Elasticsearch 中的数据创建各种图表、仪表盘和报告。

2. ELK 栈组件详解

让我们更详细地了解 ELK 栈的各个组件。

2.1 Elasticsearch

Elasticsearch 是一个基于 Lucene 的分布式搜索和分析引擎。它以 JSON 文档的形式存储数据，并提供了强大的 REST API 用于索引、搜索和分析数据。

核心概念：

Index (索引): 类似于关系数据库中的数据库，是存储相关文档的集合。
Document (文档): 类似于关系数据库中的行，是存储数据的基本单元。
Field (字段): 类似于关系数据库中的列，是文档中的一个属性。
Mapping (映射): 定义了文档中每个字段的数据类型和索引方式。

示例：

假设我们有一个存储用户信息的索引 users，一个文档可能如下所示：

{
  "user_id": "123",
  "username": "john.doe",
  "email": "[email protected]",
  "created_at": "2023-10-27T10:00:00Z"
}

我们可以使用 Elasticsearch 的 REST API 来创建索引、添加文档、搜索文档等。例如，使用 curl 命令创建一个名为 users 的索引：

curl -X PUT "localhost:9200/users" -H 'Content-Type: application/json' -d'
{
  "mappings": {
    "properties": {
      "user_id": { "type": "keyword" },
      "username": { "type": "text" },
      "email": { "type": "keyword" },
      "created_at": { "type": "date" }
    }
  }
}
'

这个命令创建了一个索引 users，并定义了每个字段的数据类型。keyword 类型适用于精确匹配，text 类型适用于全文搜索，date 类型用于存储日期和时间。

2.2 Logstash

Logstash 是一个数据收集、处理和转换管道。它可以从各种来源收集日志数据，对数据进行过滤、转换和增强，然后将数据发送到 Elasticsearch 或其他目标。

核心概念：

Input (输入): 从各种来源收集日志数据，例如文件、TCP/UDP 端口、HTTP 等。
Filter (过滤器): 对日志数据进行过滤、转换和增强，例如解析日志格式、添加地理位置信息、修改字段值等。
Output (输出): 将处理后的日志数据发送到 Elasticsearch 或其他目标，例如文件、数据库、消息队列等。

示例：

下面是一个简单的 Logstash 配置文件 logstash.conf，用于从文件 /var/log/myapp.log 收集日志数据，并将其发送到 Elasticsearch：

input {
  file {
    path => "/var/log/myapp.log"
    start_position => "beginning"
    sincedb_path => "/dev/null" # 开发环境，不用记录读取位置
  }
}

filter {
  grok {
    match => { "message" => "%{TIMESTAMP_ISO8601:timestamp} %{LOGLEVEL:level} %{DATA:module} - %{GREEDYDATA:message}" }
  }
  date {
    match => [ "timestamp", "ISO8601" ]
    target => "@timestamp"
  }
}

output {
  elasticsearch {
    hosts => ["http://localhost:9200"]
    index => "myapp-%{+YYYY.MM.dd}"
  }
  stdout { codec => rubydebug } # 输出到控制台，方便调试
}

解释：

Input: 使用 file input 插件从 /var/log/myapp.log 文件读取日志数据。start_position => "beginning" 表示从文件开头开始读取，sincedb_path => "/dev/null" 表示不记录读取位置（仅用于开发环境）。
Filter: 使用 grok filter 插件解析日志格式。grok 是一种基于正则表达式的解析器，可以从非结构化的文本中提取结构化数据。%{TIMESTAMP_ISO8601:timestamp} 表示提取 ISO8601 格式的时间戳，并将其存储到名为 timestamp 的字段中。%{LOGLEVEL:level} 表示提取日志级别，并将其存储到名为 level 的字段中。%{DATA:module} 提取模块名，%{GREEDYDATA:message} 提取剩余的日志消息。
然后使用 date filter 插件将 timestamp 字段转换为 Elasticsearch 的 @timestamp 字段，该字段用于存储日志的时间戳。
Output: 使用 elasticsearch output 插件将处理后的日志数据发送到 Elasticsearch。hosts => ["http://localhost:9200"] 指定 Elasticsearch 的地址，index => "myapp-%{+YYYY.MM.dd}" 指定索引的名称，每天创建一个新的索引。 stdout 用于将日志输出到控制台，方便调试。

要启动 Logstash，可以使用以下命令：

./logstash -f logstash.conf

2.3 Kibana

Kibana 是一个可视化工具，可以基于 Elasticsearch 中的数据创建各种图表、仪表盘和报告。它提供了友好的 Web 界面，可以方便地搜索、过滤、分析和可视化日志数据。

核心概念：

Index Pattern (索引模式): 指定 Kibana 要使用的 Elasticsearch 索引。
Visualization (可视化): 基于 Elasticsearch 中的数据创建的图表，例如柱状图、折线图、饼图等。
Dashboard (仪表盘): 包含多个可视化的集合，可以用于监控和分析日志数据。

示例：

创建 Index Pattern: 在 Kibana 中，首先需要创建一个 Index Pattern，指定要使用的 Elasticsearch 索引。例如，我们可以创建一个名为 myapp-* 的 Index Pattern，用于匹配所有以 myapp- 开头的索引。
创建 Visualization: 创建一个可视化，例如一个柱状图，显示每天的日志数量。可以选择 Date Histogram 作为 X 轴，选择 @timestamp 字段作为时间字段，选择 Count 作为 Y 轴。
创建 Dashboard: 创建一个仪表盘，并将创建的可视化添加到仪表盘中。

Kibana 提供了强大的交互式分析能力。例如，可以在仪表盘中选择时间范围，过滤日志数据，查看特定模块的日志，等等。

3. Python 后端集成 ELK 栈

现在，让我们看看如何在 Python 后端中集成 ELK 栈。

3.1 选择合适的日志库

Python 提供了标准的 logging 模块，可以用于记录日志。但是，为了更好地与 ELK 栈集成，我们可以选择一些第三方日志库，例如：

logging (Python 标准库): 功能强大，灵活可配置。
structlog: 强调结构化日志，更易于被 Logstash 解析。
loguru: 简单易用，功能丰富。

这里我们使用 logging 模块作为例子。

3.2 配置 `logging` 模块

我们可以通过配置文件或代码来配置 logging 模块。以下是一个示例配置文件 logging.conf:

[loggers]
keys=root,myapp

[handlers]
keys=consoleHandler,fileHandler

[formatters]
keys=simpleFormatter

[logger_root]
level=WARNING
handlers=consoleHandler

[logger_myapp]
level=INFO
handlers=consoleHandler,fileHandler
qualname=myapp
propagate=0

[handler_consoleHandler]
class=StreamHandler
level=INFO
formatter=simpleFormatter
args=(sys.stdout,)

[handler_fileHandler]
class=logging.handlers.RotatingFileHandler
level=DEBUG
formatter=simpleFormatter
args=('myapp.log', 'maxBytes=10485760', 'backupCount=5', 'encoding="utf8"')

[formatter_simpleFormatter]
format=%(asctime)s - %(name)s - %(levelname)s - %(message)s
datefmt=%Y-%m-%d %H:%M:%S

解释：

[loggers]: 定义了两个 logger，root 和 myapp。
[handlers]: 定义了两个 handler，consoleHandler 和 fileHandler。consoleHandler 用于将日志输出到控制台，fileHandler 用于将日志输出到文件。
[formatters]: 定义了一个 formatter，simpleFormatter，用于指定日志的格式。
[logger_myapp]: 关键的myapp logger设置，qualname 必须和代码中使用的logger名字一致。propagate=0 防止日志传递到root logger，避免重复输出。

在 Python 代码中，我们可以使用以下代码来加载配置文件：

import logging
import logging.config
import sys

logging.config.fileConfig('logging.conf')
logger = logging.getLogger('myapp')

logger.debug('This is a debug message')
logger.info('This is an info message')
logger.warning('This is a warning message')
logger.error('This is an error message')
logger.critical('This is a critical message')

3.3 发送日志到 Logstash

为了将日志发送到 Logstash，我们需要创建一个自定义的 handler。可以使用 SocketHandler 或 HTTPHandler 将日志发送到 Logstash。这里我们使用 SocketHandler 作为例子：

import logging
import logging.handlers
import json

class LogstashHandler(logging.Handler):
    def __init__(self, host, port):
        logging.Handler.__init__(self)
        self.host = host
        self.port = port
        self.sock = None

    def connect(self):
        import socket
        self.sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        try:
            self.sock.connect((self.host, self.port))
        except socket.error as e:
            print(f"Failed to connect to {self.host}:{self.port}: {e}")
            self.sock = None

    def emit(self, record):
        if self.sock is None:
            self.connect()
            if self.sock is None:
                return  # Still can't connect, give up for now

        log_entry = self.format(record) # Format the record *before* converting to JSON

        try:
            self.sock.sendall((log_entry + "n").encode('utf-8'))  # Ensure newline
        except Exception as e:
            print(f"Error sending log to Logstash: {e}")
            self.sock = None # Reset the socket so we try to reconnect next time

    def close(self):
        if self.sock:
            self.sock.close()

class JsonFormatter(logging.Formatter):
    def format(self, record):
        log_data = {
            'timestamp': self.formatTime(record, self.datefmt),
            'level': record.levelname,
            'name': record.name,
            'message': record.getMessage(),
            'module': record.module,
            'funcName': record.funcName,
            'lineno': record.lineno
        }
        return json.dumps(log_data)

# Example Usage:
logstash_host = 'localhost'
logstash_port = 5000

logger = logging.getLogger('myapp')
logger.setLevel(logging.DEBUG)  # Set the logger level
json_formatter = JsonFormatter(datefmt='%Y-%m-%dT%H:%M:%S%z') # Use JsonFormatter
logstash_handler = LogstashHandler(logstash_host, logstash_port)
logstash_handler.setFormatter(json_formatter) # Set the formatter for the handler
logger.addHandler(logstash_handler) # Add the handler to the logger
logger.propagate = False # Prevent duplicate logs if other handlers are configured

logger.info('This is a test message sent to Logstash')

解释：

LogstashHandler: 自定义的 handler，用于将日志发送到 Logstash。它使用 TCP 连接将日志数据发送到指定的 host 和 port。关键是emit函数，发送日志。这里加入了重连逻辑，避免因为Logstash重启导致handler失效的问题。
JsonFormatter: 自定义的 formatter，用于将日志格式化为 JSON 格式。这使得 Logstash 可以更容易地解析日志数据。使用了record.getMessage()方法，避免了unicode的问题。同时，添加了更多的信息到json里，方便后续分析。
使用: 创建 logger, formatter, handler, 然后将handler添加到logger里。设置logger的level和防止日志传递。

Logstash 配置:

我们需要配置 Logstash 监听 TCP 端口，并将接收到的日志数据发送到 Elasticsearch。以下是一个示例 Logstash 配置文件 logstash.conf：

input {
  tcp {
    port => 5000
    codec => json
  }
}

output {
  elasticsearch {
    hosts => ["http://localhost:9200"]
    index => "myapp-%{+YYYY.MM.dd}"
  }
  stdout { codec => rubydebug }
}

解释：

Input: 使用 tcp input 插件监听 5000 端口，并使用 json codec 解析接收到的 JSON 数据。
Output: 使用 elasticsearch output 插件将解析后的日志数据发送到 Elasticsearch。

3.4 使用 `structlog`

structlog 鼓励使用结构化日志，这使得 Logstash 可以更容易地解析日志数据。以下是一个使用 structlog 的示例：

import structlog
import logging

# Configure structlog to use the standard library logging
structlog.configure(
    processors=[
        structlog.stdlib.filter_by_level,
        structlog.stdlib.add_logger_name,
        structlog.stdlib.add_log_level,
        structlog.stdlib.PositionalArgumentsFormatter(),
        structlog.processors.StackInfoRenderer(),
        structlog.processors.format_exc_info,
        structlog.processors.TimeStamper(fmt="iso"),  # Use ISO format
        structlog.stdlib.ProcessorFormatter.wrap_for_formatter,
    ],
    context_class=dict,
    logger_factory=structlog.stdlib.LoggerFactory(),
    wrapper_class=structlog.stdlib.BoundLogger,
    cache_logger_on_first_use=True,
)

# Get a logger instance
log = structlog.get_logger(__name__)

# Now you can log structured data
log.info("User logged in", user_id="123", username="john.doe")
log.warning("Failed login attempt", ip_address="192.168.1.1")
log.error("Database connection error", error="Connection refused")

#Configure logging to send events to logstash
logging.basicConfig(level=logging.INFO)

#Use the same handler as before, for simplicity
logstash_host = 'localhost'
logstash_port = 5000

logger = logging.getLogger(__name__) # important
json_formatter = JsonFormatter(datefmt='%Y-%m-%dT%H:%M:%S%z')
logstash_handler = LogstashHandler(logstash_host, logstash_port)
logstash_handler.setFormatter(json_formatter)
logger.addHandler(logstash_handler)
logger.propagate = False

# Make sure logging level is appropriate
logger.setLevel(logging.INFO)

解释：

structlog.configure: 配置 structlog 使用标准库的 logging 模块。
log.info: 使用 log.info 方法记录结构化日志。

使用 structlog 可以更方便地记录结构化日志，这使得 Logstash 可以更容易地解析日志数据。

4. 最佳实践

结构化日志： 尽可能使用结构化日志，例如 JSON 格式，这使得 Logstash 可以更容易地解析日志数据。
统一的日志格式： 在整个系统中保持统一的日志格式，这使得分析日志数据更加容易。
合适的日志级别： 根据不同的情况使用合适的日志级别，例如 DEBUG、INFO、WARNING、ERROR、CRITICAL。
日志保留策略： 根据需要设置合理的日志保留策略，定期清理过期的日志数据。
监控和告警： 使用 Kibana 监控日志数据，并设置告警规则，以便及时发现问题。
安全： 确保 ELK 栈的安全，例如使用防火墙限制访问，配置身份验证和授权。

5. 总结

今天我们学习了 ELK 栈在 Python 后端中的应用。通过使用 ELK 栈，我们可以构建一个强大的日志系统，方便地收集、存储、搜索、分析和可视化日志数据。希望今天的分享能帮助大家更好地管理 Web 服务的日志。

ELK栈集成提升了日志管理效率

ELK栈的各个组件协同工作，提供了强大的日志处理能力。通过结构化日志和合适的配置，可以方便地进行日志分析和问题诊断。

Web 服务日志系统：ELK 栈在 Python 后端中的应用

1. 为什么需要 ELK 栈？

2. ELK 栈组件详解

2.1 Elasticsearch

2.2 Logstash

2.3 Kibana

3. Python 后端集成 ELK 栈

3.1 选择合适的日志库

3.2 配置 logging 模块

3.3 发送日志到 Logstash

3.4 使用 structlog

4. 最佳实践

5. 总结

ELK栈集成提升了日志管理效率

发表回复 取消回复

3.2 配置 `logging` 模块

3.4 使用 `structlog`

发表回复取消回复