目录即语境:运用元数据驱动和治理下一代 AI 发展

Lisa N. Cao

英文演讲 #ai

开发强大的 AI 工具是我们今年的主题,智能体和基础模型在各领域都取得了长足进展。但核心问题依然存在:我们如何为这些应用提供有效运作的数据?企业级规模又该如何实现?语境(context)的本质究竟是什么?本次演讲将探讨当前大数据生态现状、AI 数据平台面临的挑战,以及为何数据目录和元数据是通向高效、可控 AI 开发的唯一可行路径。我们将以开源框架 Apache Gravitino 为例,阐释为何此类解决方案必须保持厂商中立性。

演讲嘉宾:


Lisa 是一位数据工程师、产品经理,也是开源数据基础设施和 DataOps 领域的知名演讲者。作为 Apache Gravitino 创建公司 Datastrato 的核心成员,她正在为生成式 AI 用例和端到端数据集成重新定义数据目录领域。她现任 Linux 基金会外展委员会委员,领导企业 AI 开放平台(OPEA)开发者体验工作组,并主导持续交付基金会(CDF)的 DataOps 计划。

Lisa 还是 Google Women Techmakers 大使,温哥华 Datajam 创始人及三届主席,曾任 BiocSwirl 项目首席维护者。她曾荣获 Terry Fox 金质奖章(2021)和 Linux 基金会 LiFT"开源领域杰出女性"奖项(2021)。她组织的技术社区活动包括旧金山"AI 数据交流会"、湾区"数据工程师沙龙"以及温哥华"RLadies"等。