微服务架构中使用Feign大量并发导致CPU飙升的性能优化策略 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

微服务架构下 Feign 大量并发导致 CPU 飙升的性能优化策略

各位听众，大家好。今天我们来探讨一个在微服务架构中常见且棘手的问题：使用 Feign 客户端进行大量并发调用时，导致 CPU 飙升的性能瓶颈，以及如何进行有效的优化。

一、问题诊断：CPU 飙升的根源

Feign 作为一个声明式的 HTTP 客户端，简化了微服务之间的调用。然而，在高并发场景下，不合理的 Feign 配置或不当的使用方式会导致 CPU 资源过度消耗。常见的 CPU 飙升原因包括：

连接池耗尽： Feign 默认使用 Apache HttpClient 或 OkHttp 作为底层客户端。如果连接池配置不当（例如：最大连接数过小、连接超时时间过长），大量并发请求会导致连接池快速耗尽，线程阻塞等待连接，进而增加 CPU 上下文切换的开销。
频繁的 GC (垃圾回收)： 高并发请求可能导致大量的对象创建和销毁，特别是字符串操作、请求/响应数据的序列化/反序列化。频繁的 GC 会暂停应用程序的执行，占用大量的 CPU 时间。
序列化/反序列化瓶颈： Feign 默认使用 Jackson 或 Gson 进行 JSON 序列化和反序列化。在高并发场景下，这些操作本身也会消耗大量的 CPU 资源。特别是对于复杂的对象结构，序列化/反序列化的开销更为明显。
DNS 解析瓶颈： 如果 Feign 调用的服务域名需要频繁解析（例如：动态变化的 IP 地址），大量的 DNS 查询会消耗 CPU 资源。
熔断/限流策略不当： 如果熔断或限流策略配置不合理（例如：阈值过低、降级逻辑复杂），在高并发场景下可能触发大量的熔断/限流操作，增加 CPU 负担。
日志输出过多： 在高并发场景下，过多的日志输出（特别是 DEBUG 级别的日志）会消耗大量的 I/O 资源和 CPU 资源。

二、优化策略：多管齐下，各个击破

针对上述问题，我们可以采取以下优化策略：

优化 HTTP 客户端连接池配置

选择合适的 HTTP 客户端： 根据实际场景选择合适的 HTTP 客户端。Apache HttpClient 性能较稳定，OkHttp 在移动端和某些场景下表现更优异。
合理配置连接池参数： 优化连接池参数，包括最大连接数（maxTotal）、每个路由的最大连接数（defaultMaxPerRoute）、连接超时时间（connectTimeout）、读取超时时间（readTimeout）等。
连接池复用： 确保 Feign 客户端配置的连接池在应用生命周期内复用，避免频繁创建和销毁连接。

代码示例 (Apache HttpClient)：

import org.apache.http.client.HttpClient;
import org.apache.http.impl.client.HttpClientBuilder;
import org.apache.http.impl.conn.PoolingHttpClientConnectionManager;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class HttpClientConfig {

    @Bean
    public PoolingHttpClientConnectionManager poolingConnectionManager() {
        PoolingHttpClientConnectionManager connectionManager = new PoolingHttpClientConnectionManager();
        // 总连接池最大连接数
        connectionManager.setMaxTotal(200);
        // 每个路由最大连接数
        connectionManager.setDefaultMaxPerRoute(20);
        return connectionManager;
    }

    @Bean
    public HttpClient httpClient(PoolingHttpClientConnectionManager poolingConnectionManager) {
        HttpClientBuilder httpClientBuilder = HttpClientBuilder.create();
        httpClientBuilder.setConnectionManager(poolingConnectionManager);
        // 长连接保持活跃
        httpClientBuilder.setKeepAliveStrategy((response, context) -> 60 * 1000);
        return httpClientBuilder.build();
    }
}

Feign 配置：

import feign.Client;
import feign.httpclient.ApacheHttpClient;
import org.apache.http.client.HttpClient;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class FeignConfig {

    @Autowired
    private HttpClient httpClient;

    @Bean
    public Client feignClient() {
        return new ApacheHttpClient(httpClient);
    }
}

减少 GC 压力：优化数据处理和对象创建

避免频繁的字符串拼接： 使用 StringBuilder 或 StringBuffer 进行字符串拼接，减少临时对象的创建。
对象池化： 对于频繁创建和销毁的对象，考虑使用对象池化技术，例如 Apache Commons Pool。
减少不必要的对象创建： 优化代码逻辑，避免在循环中创建大量的临时对象。
选择高效的序列化/反序列化库： 如果对性能有较高要求，可以考虑使用更高效的序列化/反序列化库，例如 Protobuf 或 Kryo。这些库通常比 Jackson 或 Gson 具有更高的性能和更小的序列化结果。

代码示例 (对象池化)：

import org.apache.commons.pool2.BasePooledObjectFactory;
import org.apache.commons.pool2.ObjectPool;
import org.apache.commons.pool2.PooledObject;
import org.apache.commons.pool2.impl.DefaultPooledObject;
import org.apache.commons.pool2.impl.GenericObjectPool;

public class StringObject {
    private String value;

    public StringObject(String value) {
        this.value = value;
    }

    public String getValue() {
        return value;
    }

    public void setValue(String value) {
        this.value = value;
    }
}

class StringObjectFactory extends BasePooledObjectFactory<StringObject> {
    @Override
    public StringObject create() throws Exception {
        return new StringObject("");
    }

    @Override
    public PooledObject<StringObject> wrap(StringObject obj) {
        return new DefaultPooledObject<>(obj);
    }

    @Override
    public void passivateObject(PooledObject<StringObject> p) throws Exception {
        p.getObject().setValue(""); // Reset the object before returning to the pool
    }
}

public class StringObjectPool {
    private final ObjectPool<StringObject> objectPool;

    public StringObjectPool() {
        objectPool = new GenericObjectPool<>(new StringObjectFactory());
    }

    public StringObject borrowObject() throws Exception {
        return objectPool.borrowObject();
    }

    public void returnObject(StringObject obj) throws Exception {
        objectPool.returnObject(obj);
    }

    public void close() throws Exception {
        objectPool.close();
    }

    public static void main(String[] args) throws Exception {
        StringObjectPool pool = new StringObjectPool();

        for (int i = 0; i < 10; i++) {
            StringObject stringObject = pool.borrowObject();
            stringObject.setValue("Object " + i);
            System.out.println("Borrowed: " + stringObject.getValue());
            pool.returnObject(stringObject);
        }

        pool.close();
    }
}

优化序列化/反序列化：选择合适的库和配置

选择合适的序列化/反序列化库： 根据数据格式和性能要求选择合适的库。Jackson 和 Gson 适用于 JSON 数据，Protobuf 和 Kryo 适用于性能敏感的场景。
优化 Jackson 配置： 通过配置 Jackson 的 ObjectMapper，可以提高序列化/反序列化的性能。例如，禁用自动检测功能、缓存序列化器和反序列化器。

代码示例 (Jackson 配置)：

import com.fasterxml.jackson.databind.DeserializationFeature;
import com.fasterxml.jackson.databind.ObjectMapper;
import com.fasterxml.jackson.databind.SerializationFeature;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class JacksonConfig {

    @Bean
    public ObjectMapper objectMapper() {
        ObjectMapper objectMapper = new ObjectMapper();
        // 禁用自动检测功能
        objectMapper.disable(SerializationFeature.FAIL_ON_EMPTY_BEANS);
        objectMapper.disable(DeserializationFeature.FAIL_ON_UNKNOWN_PROPERTIES);
        // 忽略 transient 修饰的属性
        //objectMapper.configure(MapperFeature.PROPAGATE_TRANSIENT_MARKER, true);
        return objectMapper;
    }
}

Feign 配置：

import feign.codec.Decoder;
import feign.codec.Encoder;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.http.converter.json.MappingJackson2HttpMessageConverter;

@Configuration
public class FeignConfig {

    @Autowired
    private MappingJackson2HttpMessageConverter messageConverter;

    @Bean
    public Encoder feignEncoder() {
        return new feign.jackson.JacksonEncoder(messageConverter.getObjectMapper());
    }

    @Bean
    public Decoder feignDecoder() {
        return new feign.jackson.JacksonDecoder(messageConverter.getObjectMapper());
    }
}

缓存 DNS 解析结果：减少 DNS 查询次数
- 配置 JVM DNS 缓存： 通过设置 networkaddress.cache.ttl 和 networkaddress.cache.negative.ttl 系统属性，可以配置 JVM 的 DNS 缓存。
- 使用本地 DNS 缓存服务： 可以考虑使用本地 DNS 缓存服务，例如 dnsmasq，进一步减少 DNS 查询次数。
JVM 配置示例：
```
-Dnetworkaddress.cache.ttl=60
-Dnetworkaddress.cache.negative.ttl=10
```

优化熔断/限流策略：合理配置阈值和降级逻辑

合理配置熔断/限流阈值： 根据实际业务需求和系统负载情况，合理配置熔断/限流阈值，避免过度熔断或限流。
简化降级逻辑： 降级逻辑应该尽可能简单，避免复杂的计算或 I/O 操作。
使用异步降级： 对于非关键业务，可以考虑使用异步降级，避免阻塞主线程。

代码示例 (Hystrix 熔断)：

import com.netflix.hystrix.contrib.javanica.annotation.HystrixCommand;
import org.springframework.stereotype.Service;

@Service
public class MyService {

    @HystrixCommand(fallbackMethod = "fallbackMethod")
    public String myMethod(String input) {
        // 模拟远程调用
        if (Math.random() < 0.5) {
            throw new RuntimeException("Remote call failed");
        }
        return "Result: " + input;
    }

    public String fallbackMethod(String input) {
        return "Fallback: " + input;
    }
}

控制日志输出：避免过多的 DEBUG 日志
- 调整日志级别： 在高并发环境下，将日志级别调整为 INFO 或 WARN，避免输出过多的 DEBUG 日志。
- 使用异步日志： 使用异步日志框架，例如 Logback 的 AsyncAppender，减少日志输出对主线程的影响。
- 过滤不必要的日志： 配置日志过滤器，过滤掉不必要的日志信息。
Logback 配置示例 (异步日志)：
```
<appender name="ASYNC" class="ch.qos.logback.classic.AsyncAppender">
    <queueSize>512</queueSize>
    <discardingThreshold>0</discardingThreshold>
    <appender-ref ref="FILE"/>
</appender>

<root level="INFO">
    <appender-ref ref="ASYNC"/>
</root>
```

异步化 Feign 调用：降低线程阻塞

使用 CompletableFuture： 使用 CompletableFuture 异步执行 Feign 调用，避免阻塞主线程，提高吞吐量。
使用线程池： 为异步 Feign 调用配置独立的线程池，避免线程池资源竞争。

代码示例 (CompletableFuture)：

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.scheduling.annotation.Async;
import org.springframework.stereotype.Service;

import java.util.concurrent.CompletableFuture;

@Service
public class AsyncFeignService {

    @Autowired
    private MyFeignClient myFeignClient;

    @Async("myTaskExecutor")
    public CompletableFuture<String> asyncCall(String input) {
        try {
            String result = myFeignClient.getData(input);
            return CompletableFuture.completedFuture(result);
        } catch (Exception e) {
            return CompletableFuture.failedFuture(e);
        }
    }
}

//配置线程池
@Configuration
@EnableAsync
public class AsyncConfig {

    @Bean(name = "myTaskExecutor")
    public Executor taskExecutor() {
        ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();
        executor.setCorePoolSize(5);
        executor.setMaxPoolSize(10);
        executor.setQueueCapacity(25);
        executor.setThreadNamePrefix("MyAsyncThread-");
        executor.initialize();
        return executor;
    }
}

三、监控与调优：持续追踪，精益求精

优化是一个持续的过程，需要通过监控和调优来不断改进。

监控 CPU 使用率： 使用工具监控 CPU 使用率，及时发现 CPU 飙升的情况。
监控 GC 情况： 使用 JVM 监控工具，例如 jstat 或 VisualVM，监控 GC 情况，找出 GC 瓶颈。
监控 Feign 调用耗时： 使用 Micrometer 或 Prometheus 等监控工具，监控 Feign 调用的耗时，找出性能瓶颈。
性能测试： 在高并发环境下进行性能测试，验证优化效果。
日志分析： 分析日志，找出潜在的性能问题。

表格总结：优化策略与对应问题

问题	优化策略
连接池耗尽	优化连接池配置（最大连接数、每个路由最大连接数、连接超时时间、读取超时时间），连接池复用
频繁的 GC	避免频繁的字符串拼接，对象池化，减少不必要的对象创建，选择高效的序列化/反序列化库
序列化/反序列化瓶颈	选择合适的序列化/反序列化库，优化 Jackson 配置（禁用自动检测功能、缓存序列化器和反序列化器）
DNS 解析瓶颈	配置 JVM DNS 缓存，使用本地 DNS 缓存服务
熔断/限流策略不当	合理配置熔断/限流阈值，简化降级逻辑，使用异步降级
日志输出过多	调整日志级别，使用异步日志，过滤不必要的日志信息
线程阻塞导致吞吐量下降	异步化 Feign 调用，使用 CompletableFuture 或线程池

四、性能优化是综合治理，关注全局

除了上述针对 Feign 客户端本身的优化之外，还需要关注整个微服务架构的性能。例如：

服务拆分粒度： 合理的微服务拆分粒度可以减少服务之间的调用次数，降低网络开销。
数据传输格式： 选择合适的数据传输格式，例如 Protobuf 或 Avro，可以减少网络传输的数据量。
缓存： 使用缓存可以减少对后端服务的调用，提高响应速度。
负载均衡： 使用负载均衡可以将请求分发到多个服务实例，提高系统的吞吐量。

上述这些策略并不是孤立存在的，很多时候需要结合起来使用，才能达到最佳的优化效果。

问题总结：针对性优化，持续监控和调优

Feign 大量并发导致 CPU 飙升是一个复杂的问题，需要针对具体场景进行分析，找出瓶颈所在，然后采取相应的优化策略。优化方案包括优化连接池配置、减少 GC 压力、优化序列化/反序列化、缓存 DNS 解析、优化熔断/限流策略、控制日志输出和异步化 Feign 调用。

优化方案：性能提升需要持续的优化和监控

优化是一个持续的过程，需要通过监控和调优来不断改进。使用工具监控 CPU 使用率、GC 情况和 Feign 调用耗时，在高并发环境下进行性能测试，验证优化效果。

微服务架构下 Feign 大量并发导致 CPU 飙升的性能优化策略

发表回复 取消回复

发表回复取消回复