从 Hadoop 到 Kubernetes：理想汽车大数据平台的云原生演进

Han Qian

中文演讲 2025-07-25 15:00 GMT+8 (ROOM : 阳山会议室) #cloudnative

摘要：
在构建大数据平台的过程中，我们从基于Apache Hadoop生态系统的传统部署模式，过渡到通过JuiceFS实现存储与计算分离，最终迁移至以Kubernetes为核心的调度系统。这一技术演进涵盖存储、计算和集群架构三个方面，旨在提升数据处理效率。

存储优化
通过用JuiceFS替换HDFS，我们实现了集中式存储与弹性计算的结合，解决了云环境中容量扩展和资源利用率的挑战。

计算调度
从YARN迁移到Kubernetes后，我们重点优化了作业调度策略、资源隔离和作业稳定性，以提升调度效率。

集群架构优化通过整合Kubernetes与JuiceFS，我们构建了可扩展的云原生架构，解决了大数据框架（如Apache Spark、Flink）在云环境中的兼容性和可扩展性问题，确保了大规模AI和数据处理任务的高效执行。

讨论主题本次会议将分享我们的技术实践与洞察，包括：

Apache项目（Hadoop、Spark、YARN）的适配经验架构演进阶段遇到的挑战，如JuiceFS元数据性能、Spark在对象存储上的Shuffle操作，以及Flink检查点可靠性问题，这些问题通过社区协作得以解决在推进开源技术生态系统的同时保持生产稳定性的策略，平衡创新与系统可靠性以避免运营风险我们旨在为正经历类似转型的团队提供可操作的参考，分享关键技术选型及不同阶段迁移路径的决策逻辑。本案例研究记录了大数据平台的企业级演进过程，并为采用云原生架构的团队提供实践性指导。

讲师:

Han Qian: Li Auto | 大数据基础设施负责人

Li Auto 大数据基础设施负责人负责构建服务于100万辆以上联网车辆的100PB级数据平台

核心专长为百度广告和京东广告构建流式处理引擎及 OLAP 系统为字节跳动设计EB级数据湖及 100万核资源调度框架