故障排除和调试Apache HBase

2018-10-09 15:03 更新

一般准则

始终从主日志开始（TODO：哪些行？）。通常情况下，它只是一遍又一遍地打印相同的行。如果没有，那就有问题了。Google或search-hadoop.com应针对您所看到的异常返回一些匹配。

Apache HBase中很少出现错误，通常当某些东西搞砸了，接下来可能会有数百个异常和来自各地的堆栈跟踪。解决这类问题的最佳方法是将日志提升到所有开始的地方，例如，使用RegionServers的一个技巧是他们将在中止时打印一些度量值，所以对Dump进行grepping应该可以让您绕过问题的开始。

RegionServer自杀是“正常的”，因为这是他们在出现问题时所做的事情。例如，如果ulimit和max transfer threads（两个最重要的初始设置）没有改变，那么在某些时候DataNodes无法创建新的线程，从HBase的角度来看是好像HDFS已经消失了。想想如果您的MySQL数据库突然无法访问本地文件系统上的文件会发生什么，这与HBase和HDFS相同。看到RegionServers提交seppuku的另一个常见原因是当它们输入比默认ZooKeeper会话超时持续时间更长的垃圾收集暂停时。

以上内容是否对您有帮助：

← 配置HBase和MapReduce

故障排除和调试HBase：日志 →

写笔记

我要补充