Hive8:Hive可集成的数据库

Hive8:Hive可集成的数据库

集成数据库

Hive主要通过storage handler框架中不同的handler完成与各类数据库集成。例如:Habse、Cassandra、Azure Table、JDBC、MongoDB、ElasticSearch、Oracle、PostgreSQL等。

MySQL

 

PostgreSQL

Hive配置元数据库为PostgreSQL

HBase

  • 使用 hive-hbase-handler-xxx.jar 包实现 Hive 与 HBase 关联。
  • Hive 读取的是 HBase 表最新的数据。
  • 通过 Hive 创建的 HBase 表的值默认只有一个 VERSION ,可之后再修改 HBase 表值的最大 VERSION 数。
  • Hive 只显示与 HBase 对应的列值,而那些没有对应的 HBase 列在 Hive 表中不显示。
  • Hive 表与 HBase 表关联后,数据可以在 Hive 端插入,也可在 HBase 中插入。
  • 创建 Hive 外部表与 HBase 的关联,可实现将 Hive 数据导入到 HBase 中。该方式是利用两者本身对外的 API 接口互相通信来完成的,在数据量不大(4T以下)的情况下可以选择该方式导入数据。

MongoDB