HBase表、行与列族

2020-09-14 17:02 更新

HBase表

HBase 中表是在 schema 定义时被预先声明的。

可以使用以下的命令来创建一个表,在这里必须指定表名和列族名。在 HBase shell 中创建表的语法如下所示:

create ‘<table name>’,’<column family>’ 

HBase行

HBase中的行是逻辑上的行,物理上模型上行是按列族(colomn family)分别存取的。

行键是未解释的字节,行是按字母顺序排序的,最低顺序首先出现在表中。空字节数组用于表示表命名空间的开始和结束。

HBase列族

Apache HBase 中的列分为列族和列的限定符。列的限定符是列族中数据的索引。例如给定了一个列族 content,那么限定符可能是 content:html,也可以是 content:pdf。列族在创建表格时是确定的了,但是列的限定符是动态地并且行与行之间的差别也可能是非常大的。

Hbase表中的每个列都归属于某个列族,列族必须作为标模式(schema)定义的一部分预先给出。如 create'test',''course'。

列名以列族做为前缀,每个“列族”都可以有多个成员(colunm):如 course:math,course:english,新的列族成员(列)可以随后按需、动态加入

权限控制、存储以及调优都是在列族层面进行的。

HBase Cell

由行和列的坐标交叉决定;

单元格是有版本的;

单元格的内容是未解析的字节数组;

单元格是由行、列族、列限定符、值和代表值版本的时间戳组成的({row key,column( =<family>+<qualifier>),version})唯一确定单元格。cell中的数据是没有类型

的,全部是字节码形式存储。


以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号