hudi两种数据更新方式:直播 Apache Hudi
hudi两种数据更新方式:直播 Apache HudiDataFunTalk开源交流会:01 详细日程Spark SQL 新功能Flink 集成改进快速浏览其他功能和提升
Apache Hudi 社区在 2022 年 4 月 30 日发布了新版本 0.11.0,其中包括了一系列新功能和提升优化。详情可参考:Apache Hudi 0.11.0版本重磅发布!
https://hudi.apache.org/releases/release-0.11.0/
5 月 14 日,DataFun 将联合 Onehouse 举行线上直播分享,深度解读 Apache Hudi 0.11.0 新版本新特性解。本次交流将围绕以下几个方面进行解读:
-
多级索引
-
Spark SQL 新功能
-
Flink 集成改进
-
快速浏览其他功能和提升
01 详细日程
DataFunTalk开源交流会: Apache Hudi 0.11.0 新版本新特性解读 | ||
分享时间 |
分享内容 |
分享嘉宾 |
09:00 |
多级索引 Multi-Modal Index |
Onehouse 软件工程师 郭一骅(Ethan Guo) |
09:20 |
Spark SQL 新功能与 Flink 集成改进 |
腾讯数据湖研发高级工程师 徐前进 |
09:40 |
快速浏览其他功能和提升 |
Onehouse Team Lead 许世彦 |
09:50 |
Q&A |
02 详细介绍
1 郭一骅(Ethan Guo) Onehouse 软件工程师
个人简介:Apache Hudi Committer,致力于流式数据处理及湖仓一体架构的设计与实现。Onehouse Software Engineer,构建并优化湖仓一体产品。曾任 Uber Senior Software Engineer,设计并实现移动网络性能监测系统,近实时观测生产环境下 Uber app 移动端在全球的网络性能。
演讲主题:Apache Hudi 0.11.0 新功能简介:多级索引 Multi-Modal Index
演讲提纲:
- 为何在 Apache Hudi 中引入多级索引 Multi-Modal Index
- 多级索引的设计与实现
- 利用多级索引极大提升性能
听众收益:
- Apache Hudi 如何利用多级索引(Multi-Modal Index)极大提升读写性能?
- 怎样利用 Data Skipping 极速提升大宽表的查询性能?
- 异步索引器 Async Indexer 有哪些好处?
2 徐前进 腾讯数据湖研发高级工程师
个人简介:多年大数据工作经验,开源大数据组件 Flink、 Iceberg、Pulsar 等贡献者,Apache Calcite 和 Apache Hudi Committer。目前在腾讯从事数据湖存储相关的开发
分享主题:Spark SQL 新功能与 Flink 集成改进
听众收益:
-
Spark SQL中time travel、call commond的使用场景
-
Flink中HoodieCatalog和Bucket Index详解
3 许世彦 Onehouse Team Lead
个人介绍:Apache Hudi PMC成员及Committer。现就职于Onehouse,在Hudi工程团队担任Team Lead。主要工作包括推动Hudi路线图的演进和执行,开发读写引擎相关功能和平台服务,以及面向企业用户的生产环境构建和优化。曾任Zendesk数据湖团队Team Lead。
分享主题:快速浏览其他功能和提升
听众收益:
-
对Spark DataSource 查询优化的改进、Schema演进、保存点和状态恢复等其他功能的初步了解。
03 活动报名
欢迎点击『』体验最新版本~