利用流式图计算加速多流连接

Zhao Qingwen

中文演讲 #streaming

流式计算在异常检测、搜索、推荐系统、金融交易等领域正变得越来越重要。传统的流式计算引擎(如 Flink 和 Spark Streaming)通常使用基于表的连接操作来处理多流连接场景。然而,随着分析维度的加深,这些基于表的流式引擎面临着显著的性能限制。开源流式图计算引擎 GeaFlow 以一种新颖的方法打破了这些限制。它不仅利用图数据中固有的关系高效地执行多跳查询,还集成了内置的增量图算法。这些算法显著减少了计算中涉及的子图规模,同时仍然提供与全图计算相当的结果。本主题探讨了传统流式引擎在多流连接分析中的局限性,并解释了 GeaFlow 作为流式图引擎如何通过图原生特性和独特的增量算法来加速分析性能。

讲师:


2019年加入蚂蚁集团,是GeaFlow的核心开发者之一。