Spring Cloud Sleuth/Zipkin：分布式链路追踪 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位技术同僚们，大家好！我是你们的老朋友，一位在代码堆里摸爬滚打多年的老码农。今天，咱们要聊一个在微服务架构中至关重要的主题——Spring Cloud Sleuth/Zipkin：分布式链路追踪。

想象一下，你正在指挥一场交响乐，各种乐器齐鸣，奏出美妙的旋律。但突然，某个小提琴手走调了，整个乐章瞬间变得刺耳。问题来了，你怎么才能在茫茫乐器声中找到那个“罪魁祸首”的小提琴手呢？

在微服务架构中，情况也类似。一个请求可能要经过多个服务，就像一场接力赛，一个服务处理完，交给下一个服务，直到最终完成。如果某个环节出了问题，就像接力棒掉在了地上，整个请求就失败了。这时候，我们需要一种机制，能够像追踪接力棒一样，追踪整个请求的生命周期，找到那个“掉棒”的服务，这就是分布式链路追踪。

一、微服务架构下的“迷宫”：为什么要链路追踪？

微服务架构的好处，大家都很清楚：解耦、灵活、可扩展。但它也带来了新的挑战：

调用链复杂： 一个请求可能要经过多个服务，形成复杂的调用链。
问题定位困难： 当请求出错时，很难快速定位是哪个服务出了问题。就像在一堆缠绕的耳机线里找头绪一样，让人头大。🤯
性能瓶颈难寻： 哪些服务是性能瓶颈？哪些服务调用耗时过长？这些问题都需要仔细分析才能找到。
监控难度增加： 单体应用只需要监控一个应用，而微服务需要监控多个服务，监控的复杂度大大增加。

如果没有链路追踪，我们就好像在一个黑暗的迷宫里摸索，不知道方向，也不知道终点在哪里。而有了链路追踪，我们就像拥有了一张迷宫地图，可以清晰地看到请求的路径，快速定位问题，优化性能。

二、Spring Cloud Sleuth：链路追踪的“侦察兵”

Spring Cloud Sleuth就像一个训练有素的“侦察兵”，它可以自动地为你的微服务应用添加链路追踪的功能。它主要做了以下几件事情：

生成 Trace ID 和 Span ID：
- Trace ID： 每个请求都有一个唯一的 Trace ID，它就像一个身份证，贯穿整个调用链。
- Span ID： 每个服务调用都有一个唯一的 Span ID，它表示一个工作单元，比如一个 HTTP 请求，一个数据库查询。Span 之间可以有父子关系，形成一个树状结构，表示调用链的层次关系。
举个例子，假设用户发起一个购买商品的请求，经过以下服务：用户服务 -> 商品服务 -> 订单服务 -> 支付服务。那么：
- 整个请求的 Trace ID 都是一样的，比如 traceId=1234567890。
- 每个服务调用都有自己的 Span ID：
  - 用户服务：spanId=1
  - 商品服务：spanId=2, parentId=1 (parentId 指向父 Span，即用户服务)
  - 订单服务：spanId=3, parentId=2
  - 支付服务：spanId=4, parentId=3
这样，我们就形成了一个清晰的调用链：1 -> 2 -> 3 -> 4，可以清晰地看到请求的流向。
传递 Trace ID 和 Span ID：

Sleuth 会自动地将 Trace ID 和 Span ID 注入到 HTTP Header 或消息队列中，这样，当一个服务调用另一个服务时，就可以将 Trace ID 和 Span ID 传递下去，保证整个调用链的完整性。

你可以通过以下方式查看传递的 Header 信息：
```
X-B3-TraceId: 1234567890
X-B3-SpanId: 2
X-B3-ParentSpanId: 1
X-B3-Sampled: 1  // 是否采样，1 表示采样，0 表示不采样
```
收集链路数据：

Sleuth 会将链路数据发送到一个中心化的存储系统，比如 Zipkin。

三、Zipkin：链路数据的“档案馆”

Zipkin就像一个“档案馆”，它负责存储和展示 Sleuth 收集到的链路数据。你可以通过 Zipkin 的 Web UI，查看请求的调用链、耗时、错误信息等。

Zipkin 的主要组件包括：

Collector： 接收 Sleuth 发送的链路数据。
Storage： 存储链路数据，可以使用内存、MySQL、Cassandra、Elasticsearch 等。
API： 提供查询链路数据的接口。
Web UI： 提供可视化的界面，用于查看链路数据。

四、实战演练：搭建 Sleuth + Zipkin 分布式链路追踪系统

接下来，我们通过一个简单的例子，演示如何搭建 Sleuth + Zipkin 分布式链路追踪系统。

1. 准备工作：

JDK 1.8+
Maven
IDE (IntelliJ IDEA 或 Eclipse)
Docker (可选，用于部署 Zipkin)

2. 创建三个 Spring Boot 应用：

service-a： 提供一个 API 接口，调用 service-b。
service-b： 提供一个 API 接口，调用 service-c。
service-c： 提供一个 API 接口，返回一个字符串。

3. 添加 Sleuth 依赖：

在每个应用的 pom.xml 文件中，添加 Sleuth 依赖：

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-sleuth</artifactId>
</dependency>

4. 添加 Web 依赖：

因为我们需要提供 API 接口，所以还需要添加 Web 依赖：

<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-web</artifactId>
</dependency>

5. 配置 Zipkin：

在每个应用的 application.properties 或 application.yml 文件中，配置 Zipkin 的地址：

spring.zipkin.base-url=http://localhost:9411
spring.application.name=service-a  # 每个应用设置不同的名称

6. 编写 API 接口：

service-a：

@RestController
public class ServiceAController {

    @Autowired
    private RestTemplate restTemplate;

    @GetMapping("/a")
    public String a() {
        return "Service A -> " + restTemplate.getForObject("http://localhost:8082/b", String.class);
    }
}

service-b：

@RestController
public class ServiceBController {

    @Autowired
    private RestTemplate restTemplate;

    @GetMapping("/b")
    public String b() {
        return "Service B -> " + restTemplate.getForObject("http://localhost:8083/c", String.class);
    }
}

service-c：

@RestController
public class ServiceCController {

    @GetMapping("/c")
    public String c() {
        return "Service C";
    }
}

7. 创建 RestTemplate Bean：

在每个应用中，都需要创建一个 RestTemplate Bean，用于调用其他服务。

@Configuration
public class RestTemplateConfig {

    @Bean
    public RestTemplate restTemplate() {
        return new RestTemplate();
    }
}

8. 启动 Zipkin：

可以使用 Docker 启动 Zipkin：

docker run -d -p 9411:9411 openzipkin/zipkin

也可以下载 Zipkin 的 jar 包，直接运行：

java -jar zipkin.jar

9. 启动三个 Spring Boot 应用：

分别启动 service-a、service-b、service-c 三个应用。

10. 访问 service-a 的 API 接口：

在浏览器中访问 http://localhost:8081/a，你应该会看到以下输出：

Service A -> Service B -> Service C

11. 查看 Zipkin 的 Web UI：

在浏览器中访问 http://localhost:9411，你应该可以看到 Zipkin 的 Web UI。点击 "Find by Trace ID"，输入 Trace ID，就可以查看整个请求的调用链。

你会看到类似下图的界面，清晰地展示了请求经过的每个服务，以及每个服务的耗时。

服务名称	Span ID	Parent ID	耗时 (ms)
service-a	1		100
service-b	2	1	80
service-c	3	2	50

五、进阶技巧：定制化 Sleuth 和 Zipkin

Sleuth 和 Zipkin 提供了很多配置选项，可以根据实际需求进行定制。

1. 采样率：

Sleuth 默认会对所有请求进行采样，并将链路数据发送到 Zipkin。但在生产环境中，如果请求量很大，可以降低采样率，减少链路数据的存储和传输压力。

可以通过以下配置设置采样率：

spring.sleuth.sampler.probability=0.1  # 设置采样率为 10%

2. 自定义 Span：

有时候，我们需要在代码中手动创建 Span，记录一些自定义的信息。

@Autowired
private Tracer tracer;

public void doSomething() {
    Span newSpan = tracer.nextSpan().name("my-custom-span");
    try (Tracer.SpanInScope ws = tracer.withSpan(newSpan.start())) {
        // ...
        newSpan.tag("my-tag", "my-value");
    } finally {
        newSpan.end();
    }
}

3. 消息队列支持：

除了 HTTP 请求，Sleuth 也支持消息队列的链路追踪。只需要添加相应的依赖，并进行简单的配置即可。

4. Zipkin 的存储方式：

Zipkin 默认使用内存存储链路数据，但在生产环境中，建议使用 MySQL、Cassandra 或 Elasticsearch 等持久化存储。

六、注意事项：

性能影响： 链路追踪会对性能产生一定的影响，特别是采样率较高时。需要根据实际情况进行权衡。
数据安全： 链路数据可能包含敏感信息，需要注意数据安全，防止泄露。
版本兼容性： Spring Cloud Sleuth 和 Zipkin 的版本需要保持兼容，否则可能会出现问题。
监控和告警： 除了链路追踪，还需要结合其他的监控和告警系统，才能更好地保障微服务的稳定运行。

七、总结：

Spring Cloud Sleuth 和 Zipkin 是构建分布式链路追踪系统的利器。它们可以帮助我们快速定位问题、优化性能、提高微服务的可观测性。希望通过今天的讲解，大家能够对 Spring Cloud Sleuth 和 Zipkin 有更深入的了解，并在实际项目中灵活运用。

记住，链路追踪就像给你的微服务架构装上了一双“千里眼”，让你能够洞察全局，掌握每一个细节。有了这双“千里眼”，你的微服务架构一定会更加健壮、高效！🚀

好了，今天的分享就到这里。感谢大家的聆听，希望对大家有所帮助！如果大家还有什么问题，欢迎在评论区留言，我会尽力解答。

最后，祝大家编码愉快，Bug 远离！😊

发表回复 取消回复

发表回复取消回复