队列、处理、预测:Kafka 与 Flink LLM 和 Datalake 开启新时代
Shekhar Prasad Rajak
英文演讲 #streaming消息队列对于支付处理、欺诈检测和 AI 支持系统等实时用例至关重要,但传统队列通常缺乏可扩展性、持久性和可重放性。在本演讲中,我们将探讨 Kafka 4.0 如何将原生队列语义引入分布式流处理领域,从而实现公平、并发和隔离的大规模消息处理。
我们将展示 Apache Flink 的原生 LLM 集成如何利用此队列模型执行实时大型语言模型 (LLM) 推理(例如情绪分析或摘要),以及如何将丰富的结果直接写入 Apache Iceberg。Iceberg 是一个强大的数据湖,可用于长期分析、数据版本控制和时间旅行以及机器学习反馈循环。
通过演示和架构演练,您将学习如何构建智能、可扩展的管道,将 Kafka 队列、Flink、LLM 和 Iceberg 整合到统一的实时分析堆栈中。
讲师:
Shekhar 对开源软件充满热情,并积极参与多个项目,包括SymPy、Ruby gems(如他所著的 daru 和daru-view)、Bundler、NumPy 和 SciPy。
他于 2016 年和 2017 年成功完成 Google Summer of Code 项目,并担任 SciRuby 的管理员,指导了多个组织。
谢卡尔曾在 RubyConf 2018、PyCon 2017、ApacheCon 2020 和 Community Over Code 2024 等知名大会上发表演讲,并参与了众多地区性技术聚会。目前,他任职于苹果公司,担任软件开发工程师。