使用 Apache Iceberg 增强 Lakehouse 实施

Bill Zhang

英文演讲 2025-07-26 16:15 GMT+8 (ROOM : 万春厅) #datalake

现代数据湖架构融合了数据湖和数据仓库的优势，通过 ACID 事务、模式演进和性能优化实现可扩展分析。Apache Iceberg 已成为领先的开放表格式，通过提供可靠性、可扩展性以及与 Spark、Flink、Doris、StarRocks、Impala、Hive、Nifi、Kafka 和 Trino 等热门开源计算引擎的无缝集成，为数据湖实现提供强大的支持。

在本次会议中，我们将探讨 Apache Iceberg 如何通过确保数据可靠性、优化性能、实现多引擎兼容性和简化维护来增强数据湖架构。此外，我们还将讨论实际用例、将 Hive 表迁移到 Iceberg 表的最佳实践，以及如何利用其特性构建高性能、面向未来的数据湖。

讲师:

Bill Zhang: Cloudera、Lakehouse 和 Iceberg 集成

Bill 是 Cloudera 的产品战略副总裁，负责 Open Data Lakehouse 产品战略以及 Apache Iceberg 与所有 Cloudera 数据平台 (CDP) 的集成。最近，Bill 还负责 Apache Hive 的产品路线图和应用