ElasticSearch聚合查询OOM的字段裁剪与分片设计策略 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

ElasticSearch 聚合查询 OOM 的字段裁剪与分片设计策略

大家好，今天我们来聊聊在使用 ElasticSearch 进行聚合查询时，遇到 OOM (Out of Memory) 问题，如何通过字段裁剪和分片设计来进行优化。

OOM 的常见原因与聚合查询的特性

ElasticSearch 的聚合查询非常强大，能够帮助我们从海量数据中提取有价值的信息。然而，如果不加以注意，很容易导致 OOM 问题。主要原因有以下几点：

大量数据加载到内存: 聚合操作需要在内存中对数据进行处理，如果数据量过大，超过 JVM 堆内存的限制，就会发生 OOM。特别是 terms 聚合，需要加载大量的 terms 数据到内存。
深度聚合: 多层嵌套的聚合操作会产生大量的中间结果，这些中间结果也会占用内存。
宽文档: 文档中包含大量的字段，即使只需要对其中几个字段进行聚合，整个文档也会被加载到内存，浪费资源。
不合理的分片策略: 分片数量过多或过少都会影响聚合性能，甚至导致 OOM。

聚合查询的特性决定了它对内存资源的高需求。例如，terms 聚合需要维护一个全局的词频统计，数据量越大，内存占用越高。date_histogram 聚合如果时间跨度过大，也会产生大量的 buckets，同样消耗大量内存。

字段裁剪：减少内存占用的关键

字段裁剪是解决聚合查询 OOM 问题的最直接方法之一。它的核心思想是只加载聚合所需的字段，避免加载不必要的字段。以下是一些常用的字段裁剪策略：

_source 过滤: 通过 _source 参数指定需要返回的字段，可以减少网络传输和内存占用。
```
GET /your_index/_search
{
  "query": {
    "match_all": {}
  },
  "_source": ["field1", "field2"],
  "aggs": {
    "my_agg": {
      "terms": {
        "field": "field1"
      }
    }
  }
}
```
这个例子中，我们只返回 field1 和 field2 字段，同时 terms 聚合也只使用 field1 字段。
stored_fields: 对于不需要进行搜索，只需要进行聚合的字段，可以将其设置为 stored: true，并使用 stored_fields 参数来获取这些字段。这种方式比 _source 过滤更高效，因为它直接从存储中读取字段，而不需要解析 _source 字段。使用 stored_fields 必须在 mapping 中设置 store: true，否则无效。
```
PUT /your_index
{
  "mappings": {
    "properties": {
      "field1": {
        "type": "keyword",
        "store": true
      },
      "field2": {
        "type": "long"
      }
    }
  }
}

POST /your_index/_doc
{
  "field1": "value1",
  "field2": 123
}

GET /your_index/_search
{
  "query": {
    "match_all": {}
  },
  "stored_fields": ["field1"],
  "aggs": {
    "my_agg": {
      "terms": {
        "field": "field1"
      }
    }
  }
}
```
注意：stored_fields 只能获取 store: true 的字段，如果字段没有存储，则返回空数组。

Runtime Fields: Elasticsearch 7.11 引入了 Runtime Fields，允许在查询时动态地创建字段，而不需要修改索引结构。这对于一些复杂的字段计算和转换非常有用，可以避免在索引时存储冗余数据。Runtime Fields 支持 painless 脚本，可以进行各种数据处理操作。Runtime Fields是在查询时动态生成的，不会存储在索引中，因此可以节省存储空间。

PUT /your_index
{
  "mappings": {
    "runtime": {
      "calculated_field": {
        "type": "keyword",
        "script": {
          "source": "emit(doc['field1'].value + '-' + doc['field2'].value)"
        }
      }
    },
    "properties": {
      "field1": {
        "type": "keyword"
      },
      "field2": {
        "type": "keyword"
      }
    }
  }
}

POST /your_index/_doc
{
  "field1": "value1",
  "field2": "value2"
}

GET /your_index/_search
{
  "runtime_mappings": {
    "calculated_field": {
      "type": "keyword",
      "script": {
        "source": "emit(doc['field1'].value + '-' + doc['field2'].value)"
      }
    }
  },
  "aggs": {
    "my_agg": {
      "terms": {
        "field": "calculated_field"
      }
    }
  }
}

在这个例子中，我们定义了一个名为 calculated_field 的 Runtime Field，它将 field1 和 field2 的值拼接起来。在查询时，我们使用 runtime_mappings 定义了这个字段，并在 terms 聚合中使用它。

Doc Values: Doc Values 是一种列式存储结构，用于优化聚合和排序操作。默认情况下，大多数字段类型都会启用 Doc Values。如果某个字段不需要进行聚合或排序，可以禁用 Doc Values 来节省磁盘空间和内存。
注意：禁用 Doc Values 后，该字段将无法用于聚合和排序。
```
PUT /your_index
{
  "mappings": {
    "properties": {
      "field1": {
        "type": "keyword",
        "doc_values": false
      }
    }
  }
}
```
在这个例子中，我们禁用了 field1 的 Doc Values。

字段裁剪策略	适用场景	优点	缺点
`_source` 过滤	需要返回部分字段的数据，并且字段较少。	简单易用，可以减少网络传输和内存占用。	需要解析 `_source` 字段，效率相对较低。
`stored_fields`	只需要获取少量预先存储的字段进行聚合。	直接从存储中读取字段，效率高。	需要在 mapping 中设置 `store: true`，限制较大。
Runtime Fields	需要在查询时动态计算字段，避免存储冗余数据。	灵活性高，可以进行复杂的字段计算和转换，节省存储空间。	查询时动态生成字段，会增加查询延迟。
Doc Values	某个字段不需要进行聚合或排序。	节省磁盘空间和内存。	禁用后，该字段将无法用于聚合和排序。

选择合适的字段裁剪策略需要根据具体的业务场景和数据特点进行权衡。

分片设计：平衡性能与资源消耗

合理的分片设计对于 ElasticSearch 的性能至关重要。分片数量过多或过少都会影响聚合查询的效率，甚至导致 OOM。

分片数量过多的问题:
- 资源浪费: 每个分片都需要一定的资源开销，包括内存、CPU 和文件句柄。过多的分片会增加集群的整体资源消耗。
- 查询性能下降: 查询需要扫描更多的分片，增加查询延迟。聚合操作需要在每个分片上进行，然后将结果汇总，分片越多，汇总的开销越大。
- 节点间通信开销: 节点间需要维护分片的状态信息，过多的分片会增加节点间通信的负担。
分片数量过少的问题:
- 单点瓶颈: 单个分片的数据量过大，会导致单个节点的负载过高，成为性能瓶颈。
- 并行度降低: 无法充分利用集群的并行处理能力，查询效率降低。
- 恢复时间长: 分片恢复需要将整个分片的数据复制到新的节点，分片越大，恢复时间越长。
如何确定合适的分片数量:
- 数据量: 数据量是决定分片数量的重要因素。一般来说，每个分片的大小应该在 30-50GB 之间。
- 集群规模: 集群的节点数量决定了可以并行处理的分片数量。
- 查询模式: 查询模式会影响分片策略的选择。例如，如果查询经常需要扫描整个索引，那么可以适当增加分片数量。
- 硬件资源: 节点的 CPU、内存和磁盘 I/O 能力决定了单个节点可以承载的分片数量。
一个常用的经验法则是：每个节点的分片数量不要超过 CPU 核心数的 1.5-3 倍。

可以使用以下公式来估算分片数量：
```
分片数量 = (总数据量 / 单个分片大小) * (1 + 副本数)
```
例如，如果总数据量为 300GB，单个分片大小为 30GB，副本数为 1，那么分片数量为：
```
分片数量 = (300GB / 30GB) * (1 + 1) = 20
```
这意味着你需要 20 个主分片和 20 个副本分片。
分片策略示例:

假设我们有一个订单索引，每天产生 100GB 的数据，需要保存 30 天的数据。集群有 5 个节点，每个节点有 8 个 CPU 核心。
- 每天一个索引: 每天创建一个新的索引，可以方便地进行数据管理和清理。
- 每个索引 5 个主分片: 每个分片的大小为 20GB，符合 30-50GB 的建议。
- 每个索引 1 个副本: 提高数据的可用性和容错性。
这样，每个节点需要管理 6 个主分片和 6 个副本分片，总共 12 个分片。这个数量在 CPU 核心数的 1.5-3 倍之间，是合理的。

分片数量	优点	缺点
过多	可以提高查询的并行度，缩短查询时间。	资源浪费，查询性能下降，节点间通信开销增加。
过少	减少资源消耗，简化管理。	单点瓶颈，并行度降低，恢复时间长。
合适	在资源消耗和查询性能之间取得平衡，充分利用集群的并行处理能力，提高数据的可用性和容错性。	需要根据具体的业务场景和数据特点进行调整。

其他优化策略

除了字段裁剪和分片设计，还有一些其他的优化策略可以帮助我们解决聚合查询 OOM 问题：

调整 JVM 堆内存大小: 增加 JVM 堆内存可以提高 ElasticSearch 的内存容量，但需要注意不要超过物理内存的一半，并且要留出足够的内存给操作系统。

可以通过修改 jvm.options 文件来调整 JVM 堆内存大小。
```
-Xms8g
-Xmx8g
```
这个例子中，我们将 JVM 堆内存大小设置为 8GB。

使用 size=0: 如果只需要聚合结果，不需要返回原始文档，可以使用 size=0 来禁止返回原始文档，减少网络传输和内存占用。

GET /your_index/_search
{
  "size": 0,
  "query": {
    "match_all": {}
  },
  "aggs": {
    "my_agg": {
      "terms": {
        "field": "field1"
      }
    }
  }
}

使用 composite 聚合: composite 聚合是一种分页聚合，可以避免一次性加载所有数据到内存。它将聚合结果分成多个页面返回，每次只加载一个页面。

GET /your_index/_search
{
  "size": 0,
  "aggs": {
    "my_composite_agg": {
      "composite": {
        "sources": [
          {
            "field1": {
              "terms": {
                "field": "field1"
              }
            }
          }
        ],
        "size": 10
      }
    }
  }
}

第一次查询会返回第一页的聚合结果，以及一个 after_key，用于获取下一页的结果。

GET /your_index/_search
{
  "size": 0,
  "aggs": {
    "my_composite_agg": {
      "composite": {
        "sources": [
          {
            "field1": {
              "terms": {
                "field": "field1"
              }
            }
          }
        ],
        "size": 10,
        "after": {
          "field1": "value1"
        }
      }
    }
  }
}

通过不断地传入 after_key，可以获取所有页面的聚合结果。

优化查询语句: 避免使用复杂的查询语句，尽量使用简单的查询条件。可以使用 profile API 来分析查询语句的性能，找出潜在的瓶颈。
```
GET /your_index/_search
{
  "profile": true,
  "query": {
    "match_all": {}
  },
  "aggs": {
    "my_agg": {
      "terms": {
        "field": "field1"
      }
    }
  }
}
```
profile API 会返回查询的详细执行计划，包括每个阶段的耗时和资源消耗。
升级 ElasticSearch 版本: 新版本的 ElasticSearch 通常会包含性能优化和 bug 修复，升级到最新版本可以提高聚合查询的效率。

案例分析

假设我们有一个电商网站的订单索引，包含以下字段：

order_id (keyword): 订单 ID
user_id (keyword): 用户 ID
product_id (keyword): 商品 ID
order_time (date): 下单时间
order_amount (double): 订单金额
product_category (keyword): 商品分类
user_location (geo_point): 用户地理位置

我们需要统计每个商品分类的订单总金额。

初始查询:

GET /orders/_search
{
  "size": 0,
  "aggs": {
    "category_sales": {
      "terms": {
        "field": "product_category",
        "size": 1000
      },
      "aggs": {
        "total_amount": {
          "sum": {
            "field": "order_amount"
          }
        }
      }
    }
  }
}

如果数据量很大，这个查询可能会导致 OOM。

优化方案:

字段裁剪: 只加载 product_category 和 order_amount 字段。

GET /orders/_search
{
  "size": 0,
  "_source": ["product_category", "order_amount"],
  "aggs": {
    "category_sales": {
      "terms": {
        "field": "product_category",
        "size": 1000
      },
      "aggs": {
        "total_amount": {
          "sum": {
            "field": "order_amount"
          }
        }
      }
    }
  }
}

分片设计: 根据数据量和集群规模，合理设置分片数量。
调整 JVM 堆内存大小: 根据实际情况，调整 JVM 堆内存大小。

通过这些优化，可以有效地减少内存占用，避免 OOM 问题。

结论

解决 ElasticSearch 聚合查询 OOM 问题需要综合考虑多个因素，包括字段裁剪、分片设计、JVM 堆内存大小和查询语句优化。选择合适的优化策略需要根据具体的业务场景和数据特点进行权衡。希望今天的分享能帮助大家更好地使用 ElasticSearch 进行聚合查询。

总结：优化策略的选择与平衡

字段裁剪和分片设计是解决聚合查询 OOM 的关键手段，结合 JVM 调优和其他查询优化技巧，能够有效提升 ElasticSearch 的性能和稳定性。合理选择和平衡这些策略，是确保在高负载下也能稳定运行的关键。