hudi两种数据更新方式：直播 Apache Hudi

威哥 2022-11-08 17:33:29 405

hudi两种数据更新方式：直播 Apache HudiDataFunTalk开源交流会：01 详细日程Spark SQL 新功能Flink 集成改进快速浏览其他功能和提升

hudi两种数据更新方式：直播 Apache Hudi(1)

Apache Hudi 社区在 2022 年 4 月 30 日发布了新版本 0.11.0，其中包括了一系列新功能和提升优化。详情可参考：Apache Hudi 0.11.0版本重磅发布！

https://hudi.apache.org/releases/release-0.11.0/

5 月 14 日，DataFun 将联合 Onehouse 举行线上直播分享，深度解读 Apache Hudi 0.11.0 新版本新特性解。本次交流将围绕以下几个方面进行解读：

多级索引
Spark SQL 新功能
Flink 集成改进
快速浏览其他功能和提升

01 详细日程

DataFunTalk开源交流会： Apache Hudi 0.11.0 新版本新特性解读
分享时间	分享内容	分享嘉宾
09：00	多级索引 Multi-Modal Index	Onehouse 软件工程师郭一骅（Ethan Guo）
09：20	Spark SQL 新功能与 Flink 集成改进	腾讯数据湖研发高级工程师徐前进
09：40	快速浏览其他功能和提升	Onehouse Team Lead 许世彦
09：50	Q&A

02 详细介绍

1 郭一骅（Ethan Guo） Onehouse 软件工程师

个人简介：Apache Hudi Committer，致力于流式数据处理及湖仓一体架构的设计与实现。Onehouse Software Engineer，构建并优化湖仓一体产品。曾任 Uber Senior Software Engineer，设计并实现移动网络性能监测系统，近实时观测生产环境下 Uber app 移动端在全球的网络性能。

演讲主题：Apache Hudi 0.11.0 新功能简介：多级索引 Multi-Modal Index

演讲提纲：

- 为何在 Apache Hudi 中引入多级索引 Multi-Modal Index

- 多级索引的设计与实现

- 利用多级索引极大提升性能

听众收益：

- Apache Hudi 如何利用多级索引（Multi-Modal Index）极大提升读写性能？

- 怎样利用 Data Skipping 极速提升大宽表的查询性能？

- 异步索引器 Async Indexer 有哪些好处？

2 徐前进腾讯数据湖研发高级工程师

个人简介：多年大数据工作经验，开源大数据组件 Flink、 Iceberg、Pulsar 等贡献者，Apache Calcite 和 Apache Hudi Committer。目前在腾讯从事数据湖存储相关的开发

分享主题：Spark SQL 新功能与 Flink 集成改进

听众收益：

Spark SQL中time travel、call commond的使用场景
Flink中HoodieCatalog和Bucket Index详解

3 许世彦 Onehouse Team Lead

个人介绍：Apache Hudi PMC成员及Committer。现就职于Onehouse，在Hudi工程团队担任Team Lead。主要工作包括推动Hudi路线图的演进和执行，开发读写引擎相关功能和平台服务，以及面向企业用户的生产环境构建和优化。曾任Zendesk数据湖团队Team Lead。

分享主题：快速浏览其他功能和提升

听众收益：

对Spark DataSource 查询优化的改进、Schema演进、保存点和状态恢复等其他功能的初步了解。

03 活动报名

hudi两种数据更新方式：直播 Apache Hudi(2)

欢迎点击『』体验最新版本~

网站首页

返回栏目

hudi两种数据更新方式：直播 Apache Hudi

猜您喜欢：

相关文章