跨域深度解析:HetuEngine如何实现跨源跨域分析
跨域深度解析:HetuEngine如何实现跨源跨域分析输入以下的SQL语句并查看结果和时间SELECT * FROM sales h1 WHERE h1.price >30;3.2. 通过HetuEngine查询MRS集群A中的hive表选择配置好的hive数据源92-HetuEngine - New Connection,右键选择SQL Editor点击三角符号打开已配置好的HetuEngine连接说明:① dws: 外部dws数据库② hbase: MRS集群A中的hbase数据源③ hetu1: 远端MRS集群B的HetuEngine④ hive: MRS集群A中的hive数据源选择配置好的hive数据源92-hive - New Connection,右键选择SQL Editor输入以下SQL语句并查看结果与时间
本文分享自华为云社区《MRS HetuEngine体验跨源跨域分析【玩转华为云】-云社区-华为云》,作者:龙哥手记。
一 场景完整描述1.1 首先说明下1)用户通过登录Windows跳板机,使用SQL开发工具DBeaver连接MRS集群A的HetuEngine进行分析体验
2)跨源分析体验,通过HetuEngine0连接集群内部数据源hive
3)跨源分析体验,通过HetuEngine0连接集群内部数据源hbase
4)跨仓分析体验,通过HetuEngine0连接关系型数据库DWS
5)跨湖分析体验,通过HetuEngine0连接到MRS集群B的HetuEngine1再连接到集群B的数据源hive
登录:http://121.13.226.78:18080/ssh/#/
① 用户名:hdc01,
② 密码:请联系现场引导员获取
点击右下角的MIT Kerberos 选择Get Tickets输入用户名密码获取Kerberos认证票据
① Principal:admintest@HADOOP.COM,
② Password: Admin12!
点击三角符号打开已配置好的HetuEngine连接
说明:
① dws: 外部dws数据库
② hbase: MRS集群A中的hbase数据源
③ hetu1: 远端MRS集群B的HetuEngine
④ hive: MRS集群A中的hive数据源
选择配置好的hive数据源92-hive - New Connection,右键选择SQL Editor
输入以下SQL语句并查看结果与时间
SELECT * FROM sales h1 WHERE h1.price >30;
选择配置好的hive数据源92-HetuEngine - New Connection,右键选择SQL Editor
输入以下的SQL语句并查看结果和时间
SELECT * FROM hive.default.sales h1 WHERE h1.price >30;
通过比较两次查询时间,可以看到HetuEngine会加速查询性能,比普通的hive查询更加快速;
四 体验HetuEngine跨源、跨仓分析能力4.1 通过HetuEngine对MRS集群A中的HBase进行跨源数据查询在打开的SQL Editor中输入如下SQL语句查询MRS集群A的HBase数据
SELECT * FROM hbase.default.sales;
在打开的SQL Editor中输入如下SQL语句查询DWS集群C中的维表数据
SELECT * FROM dws.public.person;
在打开的SQL Editor中输入如下SQL语句可做MRS集群A的hive与DWS集群C的跨仓数据分析
SELECT h1.id h1.price h1.ops_region h1.ops_user_id d1.sex d1.age FROM hive.default.sales h1 INNER JOIN dws.public.person d1 ON h1.ops_user_id=d1.ops_user_id WHERE h1.price >30;
在打开的SQL Editor中输入如下SQL语句可做MRS集群A的hbase与DWS集群C的跨仓数据分析
SELECT h1.id h1.price h1.ops_region h1.ops_user_id d1.sex d1.age FROM hbase.default.sales h1 INNER JOIN dws.public.person d1 ON h1.ops_user_id=d1.ops_user_id WHERE h1.price >50;
出于管理和信息收集的需要,企业内部会存储海量数据,包括数目众多的各种数据库、数据仓库等,此时会面临数据源种类繁多、数据集结构化混合、相关数据存放分散等困境,导致跨源查询开发成本高,跨源复杂查询耗时长。HetuEngine提供了统一标准SQL实现跨源协同分析,简化跨源分析操作;
五 体验HetuEngine跨湖分析能力5.1 将MRS集群A的HetuEngine连接到MRS集群B的HetuEngine进行跨湖查询在打开的SQL Editor中输入如下SQL语句可做MRS集群B中HetuEngine的hive跨湖查询
SELECT * FROM hetu1.hetu1_hive.sales;
打开SQL Editor输入如下SQL语句可做MRS集群B中HetuEngine的hive同DWS集群C的跨湖查询
SELECT h1.id h1.price h1.ops_region h1.ops_user_id d1.sex d1.age FROM hetu1.hetu1_hive.sales h1 INNER JOIN dws.public.person d1 ON h1.ops_user_id=d1.ops_user_id;
HetuEngine提供统一标准SQL对分布于多个地域(或数据中心)的多种数据源实现高效访问,屏蔽数据在结构、存储及地域上的差异,实现数据与应用的解耦。
点击下方,第一时间了解华为云新鲜技术~
华为云博客_大数据博客_AI博客_云计算博客_开发者中心-华为云