HBase区域服务器分配

2018-06-02 15:28 更新

HBase区域 - 区域服务器分配

本节介绍HBase区域如何分配给区域服务器。

HBase区域分配启动

当HBase启动区域分配如下(简短版本)时:

  1. 主机在启动时调用AssignmentManager。
  2. AssignmentManager查看hbase:meta中现有的区域分配。
  3. 如果区域分配仍然有效(即,如果RegionServer仍处于联机状态),则将保留分配。
  4. 如果分配无效,则调用LoadBalancerFactory来分配区域。负载均衡器(在HBase 1.0中默认StochasticLoadBalancer)将该区域分配给RegionServer。
  5. hbase:meta使用RegionServer分配(如果需要)和RegionServer启动代码(RegionServer进程的开始时间)在RegionServer打开区域时进行更新。

故障转移

当RegionServer失败时:

  1. 区域立即变得不可用,因为RegionServer已关闭。
  2. 主机将检测到RegionServer失败。
  3. 区域分配将被视为无效,并将像启动序列一样被重新分配。
  4. 飞行中的查询被重新尝试,并且不会丢失。
  5. 操作在以下时间段内切换到新的RegionServer:
    ZooKeeper session timeout + split time + assignment/replay time

区域负载平衡

区域可以由LoadBalancer定期移动。

区域状态转变

HBase维持每个区域的状态并在hbase:meta中保持状态。该hbase:meta地区本身的状态在ZooKeeper中保存。您可以在Master Web UI中查看转换中的区域状态。以下是可能的区域状态。

可能的区域状态:

  • OFFLINE:该区域处于离线状态,无法打开
  • OPENING:该区域正在被打开
  • OPEN:该区域已打开并且RegionServer已通知主机
  • FAILED_OPEN:RegionServer无法打开该区域
  • CLOSING:该区域正在关闭
  • CLOSED:RegionServer关闭了该区域并通知了主机
  • FAILED_CLOSE:RegionServer无法关闭该区域
  • SPLITTING:RegionServer通知主机该地区正在拆分
  • SPLIT:RegionServer通知主机该区域已完成拆分
  • SPLITTING_NEW:该区域正在建设中,正在进行中的拆分
  • MERGING:RegionServer通知主机这个区域正在与另一个区域合并
  • MERGED:RegionServer通知主机该区域已被合并
  • MERGING_NEW:这个区域是由两个区域合并创建的

区域状态转换图:

HBase区域服务器分配

图表图例注释:

  • Brown:离线状态,一种特殊状态,可以是暂时的(打开之前关闭后),终端(已禁用表的区域)或初始(新创建表的区域)
  • Palegreen:区域可以满足请求的在线状态
  • Lightblue:瞬态状态
  • Red:需要OPS注意的失败状态
  • Gold:区域的终端国家拆分/合并
  • Grey:通过拆分/合并创建的区域的初始状态

过渡状态描述:

  1. 主机将区域从OFFLINE状态移动到OPENING状态并尝试将区域分配给RegionServer。RegionServer可能或可能未收到开放区域请求。主机会重试将开放区域请求发送到RegionServer,直到RPC通过或主机用尽重试。在RegionServer收到开放区域请求后,RegionServer开始打开该区域。
  2. 如果主服务器的重试耗尽,则即使RegionServer正在开始打开区域,主服务器也会通过将区域移至CLOSING状态并尝试关闭它来阻止RegionServer打开该区域。
  3. RegionServer打开该区域后,它将继续尝试通知主服务器,直到主服务器将区域移至OPEN状态并通知RegionServer。该地区现在开放。
  4. 如果RegionServer无法打开区域,它会通知主人。主服务器将该区域移至CLOSED状态并尝试在不同的RegionServer上打开该区域。
  5. 如果主机无法在某个区域的任何区域打开该区域,则会将该区域移至FAILED_OPEN状态,并且在操作员从HBase shell进行干预或服务器死机之前不会采取进一步的行动。
  6. 主机将区域从OPEN状态移动到CLOSING状态。持有区域的RegionServer可能已经或可能未收到关闭区域请求。主服务器重试向服务器发送关闭请求,直到RPC通过或主服务器用尽重试。
  7. 如果RegionServer未联机或抛出NotServingRegionException,则主服务器将该区域移至OFFLINE状态并将其重新分配给不同的RegionServer。
  8. 如果RegionServer处于联机状态,但在主服务器用完重试之后无法访问,则主服务器会将该区域移至FAILED_CLOSE状态,并且不会采取进一步的操作,直到操作员从HBase shell进行干预或服务器已死亡。
  9. 如果RegionServer获得关闭区域请求,它会关闭该区域并通知主机。主机将区域移至CLOSED状态并将其重新分配给不同的RegionServer。
  10. 在分配区域之前,如果主区域处于OFFLINE状态,主区域会自动将区域移至CLOSED状态。
  11. 当一个RegionServer即将分割一个区域时,它通知主机。主机将要分割的区域从OPEN状态移动到SPLITTING状态,并将要创建的两个新区域添加到RegionServer。这两个区域最初都处于SPLITTING_NEW状态。
  12. 通知主机后,RegionServer开始拆分区域。一旦经过了不返回的点,RegionServer会再次通知主服务器,以便主服务器可以更新该hbase:meta表。但是,在服务器通知拆分完成之前,主服务器不会更新区域状态。如果拆分成功,拆分区域从SPLITTING状态移动到SPLIT状态,并且将两个新的区域从SPLITTING_NEW状态移动到OPEN状态。
  13. 如果拆分失败,则拆分区域从SPLITTING状态移动回OPEN状态,其中创建的两个新的区域将从SPLITTING_NEW状态移动到OFFLINE状态。
  14. 当一个RegionServer即将合并两个区域时,它首先通知主机。主机将两个区域合并为OPEN到MERGING状态,并将新的区域添加到RegionServer中,该区域将合并区域的内容保存起来。新区域最初处于MERGING_NEW状态。
  15. 通知主机后,RegionServer开始合并这两个区域。一旦经过不返回的点方,RegionServer再次通知主机,以便主机可以更新META。但是,主服务器不会更新区域状态,直到RegionServer通知合并已完成。如果合并成功,则两个合并的区域是从MERGING状态移动到MERGED状态,并且新的区域是从MERGING_NEW状态移动到OPEN状态。
  16. 如果合并失败,两个合并区域从MERGING状态返回到OPEN状态,这是为了保存合并的区域的内容的新的区域是从MERGING_NEW状态移动到OFFLINE状态。
  17. 对于处于FAILED_OPEN或FAILED_CLOSE状态的区域,当主机通过HBase Shell重新分配主区域时,主区域会尝试再次关闭它们。
以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号