实时读写
一、HBase
- 利用Hadoop HDFS作为其文件系统
- 利用Hadoop MapReduce处理HBase海量数据
- 利用Zookeeper作为系统服务
二、HBase VS Cassandra
三、HBase逻辑拓扑结构
- 采用Master/Slave架构搭建集群
- Zookeeper
- 维护元数据总入口
- 监控集群
- 协同管理节点
四、HBse总体架构
五、数据读取、写入
Regio规模
- 大小10GB~50GB
- 数量在50~100个
- 一个Cells大小10MB,超过50GB采用HDFS
RowKey
- 唯一性
- 最高频查询场景
- 按照RowKey从小到大排序特性
- 以字典排序
- RowKey尽量散列
- RowKey长度尽量短