BigData12:HBase
BigData12:HBase

BigData12:HBase

Created
Nov 1, 2021 02:36 PM
Describe
Link
Tags
NoSQL
实时读写

一、HBase

  • 利用Hadoop HDFS作为其文件系统
  • 利用Hadoop MapReduce处理HBase海量数据
  • 利用Zookeeper作为系统服务

二、HBase VS Cassandra

HBase

  • 主要特点:
    • 分布式和可扩展的庞大数据存储系统
    • 强一致性
    • 建立在 Hadoop HDFS的基础上
    • CAP中的CP
 

Cassandra

  • 主要特点:
    • 高可用性
    • 逐步可扩展性
    • 最终一致性
    • CAP中的AP
    • 兼顾一致性和延迟
    • 没有单一故障点—Cassandra中所有节点都一样

三、HBase逻辑拓扑结构

  • 采用Master/Slave架构搭建集群
  • Zookeeper
    • 维护元数据总入口
    • 监控集群
    • 协同管理节点
    •  

四、HBse总体架构

notion image
 

五、数据读取、写入

notion image
 
 

Regio规模

  • 大小10GB~50GB
  • 数量在50~100个
  • 一个Cells大小10MB,超过50GB采用HDFS
 

RowKey

  • 唯一性
  • 最高频查询场景
  • 按照RowKey从小到大排序特性
  • 以字典排序
  • RowKey尽量散列
  • RowKey长度尽量短