使用 Apache Iceberg 增强 Lakehouse 实施
Bill Zhang
英文演讲 #datalake现代数据湖架构融合了数据湖和数据仓库的优势,通过 ACID 事务、模式演进和性能优化实现可扩展分析。Apache Iceberg 已成为领先的开放表格式,通过提供可靠性、可扩展性以及与 Spark、Flink、Doris、StarRocks、Impala、Hive、Nifi、Kafka 和 Trino 等热门开源计算引擎的无缝集成,为数据湖实现提供强大的支持。
在本次会议中,我们将探讨 Apache Iceberg 如何通过确保数据可靠性、优化性能、实现多引擎兼容性和简化维护来增强数据湖架构。此外,我们还将讨论实际用例、将 Hive 表迁移到 Iceberg 表的最佳实践,以及如何利用其特性构建高性能、面向未来的数据湖。
讲师:
Bill 是 Cloudera 的产品战略副总裁,负责 Open Data Lakehouse 产品战略以及 Apache Iceberg 与所有 Cloudera 数据平台 (CDP) 的集成。最近,Bill 还负责 Apache Hive 的产品路线图和应用