从数据到 AI:基于 Apache Cloudberry 构建统一分析平台
Chuanxin Bian
中文演讲 #ai当前企业由于数据系统碎片化、处理流程低效以及分析与机器学习之间的隔阂,难以充分发挥 AI 潜力。Apache Cloudberry 作为开源 MPP 数据仓库,通过深度集成数据处理与 AI 能力,重新定义这一范式,消除壁垒并加速创新。
本次演讲将展示 Cloudberry 如何实现:
- 统一执行:直接在数据仓库上运行原生 AI/ML 模型(如 PyTorch、Scikit-learn)
- 多模态分析:在统一框架中处理结构化与非结构化数据(PDF、图像等文档)
- 智能数据应用:构建 RAG 增强的问答系统、对话式 BI 及多模态搜索
您将了解如何将数据与智能汇聚至统一平台,在简化架构的同时扩展 AI 工作负载。
演讲嘉宾:

边传新博士是专注于深度学习、自然语言处理和时间序列建模的数据科学家与应用数学家,持有香港理工大学应用数学博士学位。现就职于 HashData,主导开发 HashML、ChatData 等 AI 工具及 AIGC 应用。曾任百度高级研发工程师,参与文心大模型开发,基于 PaddleTS 构建时间序列模型,并推进用户画像系统升级。精通 Python 及深度学习框架,善于连接理论与实际推动 AI 创新。