队列、处理、预测：Kafka 与 Flink LLM 和 Datalake 开启新时代

Shekhar Prasad Rajak

英文演讲 2025-07-26 16:45 GMT+8 (ROOM : 圆明厅) #streaming

消息队列对于支付处理、欺诈检测和 AI 支持系统等实时用例至关重要，但传统队列通常缺乏可扩展性、持久性和可重放性。在本演讲中，我们将探讨 Kafka 4.0 如何将原生队列语义引入分布式流处理领域，从而实现公平、并发和隔离的大规模消息处理。

我们将展示 Apache Flink 的原生 LLM 集成如何利用此队列模型执行实时大型语言模型 (LLM) 推理（例如情绪分析或摘要），以及如何将丰富的结果直接写入 Apache Iceberg。Iceberg 是一个强大的数据湖，可用于长期分析、数据版本控制和时间旅行以及机器学习反馈循环。

通过演示和架构演练，您将学习如何构建智能、可扩展的管道，将 Kafka 队列、Flink、LLM 和 Iceberg 整合到统一的实时分析堆栈中。

讲师:

Shekhar Prasad Rajak: 热情的开源倡导者，苹果公司软件工程师。

Shekhar 对开源软件充满热情，并积极参与多个项目，包括SymPy、Ruby gems（如他所著的 daru 和daru-view）、Bundler、NumPy 和 SciPy。
他于 2016 年和 2017 年成功完成 Google Summer of Code 项目，并担任 SciRuby 的管理员，指导了多个组织。谢卡尔曾在 RubyConf 2018、PyCon 2017、ApacheCon 2020 和 Community Over Code 2024 等知名大会上发表演讲，并参与了众多地区性技术聚会。目前，他任职于苹果公司，担任软件开发工程师。