故障排除和调试Apache HBase

2018-10-09 15:03 更新

一般准则

始终从主日志开始(TODO:哪些行?)。通常情况下,它只是一遍又一遍地打印相同的行。如果没有,那就有问题了。Google或search-hadoop.com应针对您所看到的异常返回一些匹配。

Apache HBase中很少出现错误,通常当某些东西搞砸了,接下来可能会有数百个异常和来自各地的堆栈跟踪。解决这类问题的最佳方法是将日志提升到所有开始的地方,例如,使用RegionServers的一个技巧是他们将在中止时打印一些度量值,所以对Dump进行grepping应该可以让您绕过问题的开始。

RegionServer自杀是“正常的”,因为这是他们在出现问题时所做的事情。例如,如果ulimit和max transfer threads(两个最重要的初始设置 )没有改变,那么在某些时候DataNodes无法创建新的线程,从HBase的角度来看是好像HDFS已经消失了。想想如果您的MySQL数据库突然无法访问本地文件系统上的文件会发生什么,这与HBase和HDFS相同。看到RegionServers提交seppuku的另一个常见原因是当它们输入比默认ZooKeeper会话超时持续时间更长的垃圾收集暂停时。

以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号