博客
关于我
HBase基本概念
阅读量:576 次
发布时间:2019-03-11

本文共 1036 字,大约阅读时间需要 3 分钟。

一、HBase基本概念

1、模型的逻辑实体

包括6大概念,要始终牢记,基本描述了hbase的基本特点

  1. 表(table):组织数据。
  2. 行(row):表里数据按行存储,行键是唯一标示。行键没有数据类型,总是视为字节数组byte[]。
  3. 列族(column family):行里的数据按列族分组,列族同时确定了物理存放,列族的设计很重要。
  4. 列限定符(column qualifier):简称列。列族里的数据通过列定位。列不必提前定义。【无模式db】
  5. 单元(cell):行键、列族、列3个指标确定一个单元,用来存放单元值。单元值没有数据类型,总是视为byte[]。【无模式db】
  6. 时间版本(version):值可以保存多个版本,用时间戳标识。默认有3个版本。

rdbms中是二维坐标,行+列;hbase中是4维坐标,行+列族+列+版本

hbase是key-value数据库库。

2、HBase的存储模型:

  1. Region:是表按行键水平分割的存储单位,相当于rdbms的分区。在RegionServer上,是逻辑单元,是hbase分布的最小单位。
  2. Store:每个列族对应一个store。Region包含多个列族,即Region包含多个Store。
  3. StoreFile:每个store包含memStore和Stofile,MemStore是写缓存,写满后内存刷出就是StoreFile。 HFile:HFile是HBase数据存储在Hadoop上才有的概念,HBase底层存储结构可以不是Hadoop,上面引进StoreFile就是由于这个原因对底层存储文件做的一次封装。HFile通过hbase的dfsClient写入到hdfs。
    Alt

3、功能组件

  1. Client:访问hbase;缓存Cache。
  2. Zookeeper:确保唯一master;保存region地址;监控regionserver;存储hbase的元数据。
  3. Master:分配region;发现失效的regionserver;管理用户对table的操作。
  4. RegionServer:维护region;处理对region的IO;切分过大region。
    Alt

二、hbase特点

分布式、列式、nosql数据库

三、hbase的适应场景

1)存储海量数据2)高写入3)大数据的高效随即访问4)高扩展性scale gracefully with data5)结构或半结构化数据6)不需要rdbms的全部特性,如跨表、跨行的事务;join?

转载地址:http://nnmvz.baihongyu.com/

你可能感兴趣的文章
Mysql学习总结(14)——Mysql主从复制配置
查看>>
Mysql学习总结(15)——Mysql错误码大全
查看>>
Mysql学习总结(16)——Mysql之数据库设计规范
查看>>
Mysql学习总结(17)——MySQL数据库表设计优化
查看>>
Mysql学习总结(18)——Mysql主从架构的复制原理及配置详解
查看>>
Mysql学习总结(19)——Mysql无法创建外键的原因
查看>>
Mysql学习总结(19)——Mysql无法创建外键的原因
查看>>
Mysql学习总结(1)——常用sql语句汇总
查看>>
Mysql学习总结(20)——MySQL数据库优化的最佳实践
查看>>
Mysql学习总结(21)——MySQL数据库常见面试题
查看>>
Mysql学习总结(22)——Mysql数据库中制作千万级测试表
查看>>
Mysql学习总结(23)——MySQL统计函数和分组查询
查看>>
Mysql学习总结(24)——MySQL多表查询合并结果和内连接查询
查看>>
Mysql学习总结(25)——MySQL外连接查询
查看>>
Mysql学习总结(26)——MySQL子查询
查看>>
Mysql学习总结(27)——Mysql数据库字符串函数
查看>>
Mysql学习总结(28)——MySQL建表规范与常见问题
查看>>
Mysql学习总结(29)——MySQL中CHAR和VARCHAR
查看>>
Mysql学习总结(2)——Mysql超详细Window安装教程
查看>>
Mysql学习总结(30)——MySQL 索引详解大全
查看>>