当 Flink 遇见 Fluss:流式数据仓库的未来
Jark Wu
中文演讲 #streamingKafka 和 Flink 已广泛应用于流处理场景,成为构建流式数据仓库和实时分析的事实标准范例。然而,它仍然面临许多难以解决的挑战性问题。本讲座将探讨该范例在流式分析中面临的挑战和问题。
我们将首先讨论 Kafka 与 Flink 结合使用的局限性和痛点。然后,我们将介绍 Fluss,一款专为流式分析设计的下一代流式存储。我们将介绍 Fluss 的架构和核心创新,重点介绍它如何与 Flink 无缝集成,从而赋能下一代流式数据仓库。您将发现 Flink 与 Fluss 的结合所带来的颠覆性功能,例如流式列修剪、增量连接、联合读取和合并引擎。
最后,我们将探讨 Flink + Fluss 的实际用例,展示这一强大的组合如何带来真正的优势,例如降低基础设施成本、提升性能以及增强大规模流式和批处理工作负载的稳定性。
=======================================================
委员会须知:Fluss 目前是阿里巴巴旗下的一个开源项目,计划于 2025 年 5 月捐赠给 Apache 软件基金会。如果一切顺利,到大会召开时,它很可能已经是 Apache 孵化项目了。
讲师:
Jark Wu 是 Apache Flink 的提交者和 PMC 成员。他领导着阿里云的 Fluss 和 Flink SQL 团队。凭借十年的 Flink 经验,他深度参与了 Flink SQL 从零到现在的开发和演进。在此期间,他还发起并孵化了 Flink CDC 和 Fluss 项目,进一步扩展了 Flink 生态系统。