云原生大数据平台的运维挑战：Spark/Flink on Kubernetes 的调度与存储 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

好的，各位观众老爷们，晚上好！欢迎来到“云原生大数据运维吐槽大会”，我是今晚的主讲人，人称“代码界郭德纲”——Coder郭。今天咱们不聊风花雪月，就聊聊这“云原生大数据平台”这座冰山，以及冰山底下那让人头疼的“Spark/Flink on Kubernetes”的调度与存储。

各位是不是经常听到“云原生”这三个字？感觉就像什么新时代的灵丹妙药，包治百病？哎，理想很丰满，现实很骨感。 “云原生”本身没错，但落到实处，尤其是和Spark、Flink这些大数据怪兽结合，再放到Kubernetes这个大集装箱里，那滋味，啧啧，谁用谁知道！

一、啥是云原生大数据？为啥要自讨苦吃？

首先，咱们得搞清楚，啥叫云原生大数据？简单来说，就是把大数据那一套东西（比如Spark、Flink），放到云上，利用云的弹性、可扩展性、自动化等等优点，解决传统大数据平台的一些痛点。

传统大数据平台： 就像一个装修豪华但又笨重的别墅，一旦建好，想改动就难了。资源扩展慢、维护成本高、灵活性差，想搬家？那更是难上加难！
云原生大数据平台： 更像一个模块化的乐高玩具，可以根据需要自由组合、拆卸、扩展。资源按需分配，弹性伸缩，部署快，维护也相对容易。

那问题来了，既然这么好，为啥还有人吐槽？因为这玩意儿，就像个“别人家的孩子”，看着光鲜亮丽，但背后的苦，只有自己知道。

二、Kubernetes：大数据平台的“集装箱”

Kubernetes（K8s），这个名字听起来是不是很科幻？其实它就是一个容器编排平台，可以把各种应用程序（包括Spark、Flink）打包成容器，然后统一管理、调度、部署。

你可以把K8s想象成一个大型的“集装箱码头”，Spark/Flink就是码头上的集装箱。 K8s负责把这些集装箱装船、卸船、搬运，保证它们正常运行。

为啥要用K8s？

资源调度： K8s可以根据资源需求，自动分配CPU、内存等资源给Spark/Flink，避免资源浪费。
弹性伸缩： 根据业务负载，自动增加或减少Spark/Flink的实例数量，应对高峰期。
容错性： 如果某个Spark/Flink实例挂了，K8s会自动重启或替换，保证任务的连续性。
标准化： 通过容器化，统一了Spark/Flink的部署方式，简化了运维工作。

三、Spark/Flink on Kubernetes：爱恨交织

把Spark/Flink放到K8s上，听起来很美好，但实际操作起来，你会发现，这就像一场“恋爱”，一开始很甜蜜，但时间久了，各种矛盾就暴露出来了。

1. 调度难题：资源争夺，性能瓶颈

资源争夺： K8s上可能运行着各种各样的应用，它们会争夺CPU、内存等资源。如果Spark/Flink分配不到足够的资源，性能就会下降，任务执行时间会变长。
- 解决方法：
  - Resource Quotas： 限制每个Namespace的资源使用量，避免某个应用占用过多资源。
  - Limit Ranges： 限制每个Pod的资源使用量，避免单个Pod占用过多资源。
  - Priority Classes： 为Spark/Flink的Pod设置优先级，保证它们在资源紧张时优先获得资源。

策略	描述	适用场景	优点	缺点
ResourceQuota	限制 Namespace 级别的资源使用总量，例如 CPU、内存、存储等。	多团队共享集群，需要控制每个团队的资源使用量。	防止单个团队过度使用资源，影响其他团队。	管理员需要预先规划每个 Namespace 的资源配额，配置不当可能导致资源浪费或应用无法启动。
LimitRange	限制 Namespace 中 Pod 或 Container 的资源使用范围，例如 CPU、内存的最小/最大值。	防止应用程序请求过多的资源，或者请求的资源过少导致无法正常运行。	确保应用程序在合理的资源范围内运行，提高资源利用率。	需要仔细配置资源限制，避免限制过于严格导致应用程序无法正常运行，或者限制过于宽松导致资源浪费。
PriorityClass	定义 Pod 的优先级，高优先级的 Pod 在资源紧张时可以抢占低优先级的 Pod 的资源。	需要保证关键任务的优先级，例如实时计算任务。	确保关键任务能够优先获得资源，保证其性能和稳定性。	需要谨慎设置优先级，避免高优先级的任务过度抢占资源，影响其他任务的运行。
PodDisruptionBudget	定义了在主动中断（例如节点维护）期间允许中断的 Pod 数量或百分比。	需要保证应用程序的高可用性，即使在节点维护期间也需要保持一定数量的 Pod 运行。	确保在维护期间应用程序仍然可用，提高系统的可靠性。	需要根据应用程序的特性和可用性要求进行配置，配置不当可能导致维护期间应用程序不可用。
Node Affinity/Taints & Tolerations	Node Affinity 用于将 Pod 调度到特定的节点上，Taints & Tolerations 用于防止 Pod 被调度到不合适的节点上。	需要将特定的任务调度到特定的节点上，例如将 CPU 密集型任务调度到 CPU 性能高的节点上。	可以根据节点和任务的特性进行调度，提高资源利用率和应用程序性能。	需要仔细配置 Affinity 和 Taints & Tolerations，避免配置错误导致 Pod 无法被调度，或者被调度到不合适的节点上。
Kubernetes Scheduler Extender	允许自定义 Kubernetes 调度器，可以根据自定义的策略进行 Pod 调度。	需要根据自定义的策略进行 Pod 调度，例如根据数据本地性进行调度。	可以实现更加灵活和精细化的调度策略，满足特定的业务需求。	需要开发和维护自定义的调度器，增加了复杂性。

调度延迟： K8s调度器需要一定的时间来决定把Spark/Flink的Pod调度到哪个节点上。如果调度延迟过高，会影响任务的启动速度。
- 解决方法：
  - 预留资源： 提前在K8s集群中预留一些资源，供Spark/Flink使用，减少调度延迟。
  - Node Affinity/Taints & Tolerations： 通过Node Affinity和Taints & Tolerations，指定Spark/Flink的Pod只能调度到特定的节点上，减少调度范围。
  - Kubernetes Scheduler Extender： 使用自定义的调度器，优化调度策略。

2. 存储挑战：数据持久化，性能瓶颈

数据持久化： Spark/Flink需要访问外部存储系统（比如HDFS、对象存储）来读取和写入数据。如何保证数据的可靠性和持久性，是一个很大的挑战。
- 解决方法：
  - Persistent Volumes (PV) & Persistent Volume Claims (PVC)： 使用PV和PVC来管理持久化存储。 PV是集群中的一块存储资源，PVC是Pod对PV的请求。
  - Storage Classes： 使用Storage Classes来动态创建PV，简化存储管理。
  - 对象存储： 使用对象存储（比如Amazon S3、阿里云OSS）来存储数据，具有高可靠性和可扩展性。
性能瓶颈： 存储系统的性能直接影响Spark/Flink的性能。如果存储系统的带宽、IOPS不足，会导致任务执行速度变慢。
- 解决方法：
  - 选择合适的存储介质： 使用SSD等高性能存储介质，提高存储系统的性能。
  - 数据本地性： 尽量将计算节点和存储节点放在一起，减少网络传输延迟。
  - 缓存： 使用缓存技术，减少对存储系统的访问。

3. 网络问题：网络延迟，数据传输

网络延迟： Spark/Flink的各个组件之间需要进行通信，网络延迟会影响任务的执行效率。
- 解决方法：
  - 使用高速网络： 尽量使用高速网络，减少网络延迟。
  - 优化网络配置： 优化K8s的网络配置，提高网络性能。
  - Service Mesh： 使用Service Mesh（比如Istio、Linkerd）来管理服务之间的通信，提高网络可靠性和安全性。
数据传输： Spark/Flink需要从存储系统读取大量数据，网络带宽会成为瓶颈。
- 解决方法：
  - 压缩： 对数据进行压缩，减少数据传输量。
  - 数据本地性： 尽量将计算节点和存储节点放在一起，减少网络传输量。
  - 使用RDMA： 使用RDMA（Remote Direct Memory Access）技术，提高数据传输效率。

四、运维痛点：监控告警，故障排查

监控告警： 如何监控Spark/Flink在K8s上的运行状态，及时发现问题？
- 解决方法：
  - Prometheus + Grafana： 使用Prometheus来收集Spark/Flink的监控指标，使用Grafana来展示监控数据。
  - Alertmanager： 使用Alertmanager来配置告警规则，及时通知运维人员。
  - Spark/Flink自带的监控UI： 使用Spark/Flink自带的监控UI来查看任务的运行状态。
故障排查： 当Spark/Flink出现故障时，如何快速定位问题？
- 解决方法：
  - 查看日志： 查看Spark/Flink的日志，分析错误信息。
  - 使用kubectl： 使用kubectl命令来查看Pod的状态、日志等信息。
  - 使用Spark/Flink自带的调试工具： 使用Spark/Flink自带的调试工具来分析任务的执行过程。

五、总结：拥抱挑战，持续优化

把Spark/Flink放到K8s上，确实会带来一些挑战，但同时也会带来很多好处。只要我们认真分析问题，积极寻找解决方案，就能克服这些挑战，充分利用云原生的优势，构建高效、稳定、可靠的大数据平台。

记住，没有银弹！云原生大数据平台是一个不断演进的过程，需要我们持续学习、持续优化。只有不断拥抱新的技术，才能在这个领域立于不败之地。

好了，今天的吐槽大会就到这里，谢谢大家！各位观众老爷们，如果觉得我讲得还不错，记得点个赞、投个币、加个关注哦！我们下期再见！ 😉

发表回复 取消回复

发表回复取消回复