故障排除和调试Apache HBase
2018-10-09 15:03 更新
一般准则
始终从主日志开始(TODO:哪些行?)。通常情况下,它只是一遍又一遍地打印相同的行。如果没有,那就有问题了。Google或search-hadoop.com应针对您所看到的异常返回一些匹配。
Apache HBase中很少出现错误,通常当某些东西搞砸了,接下来可能会有数百个异常和来自各地的堆栈跟踪。解决这类问题的最佳方法是将日志提升到所有开始的地方,例如,使用RegionServers的一个技巧是他们将在中止时打印一些度量值,所以对Dump进行grepping应该可以让您绕过问题的开始。
RegionServer自杀是“正常的”,因为这是他们在出现问题时所做的事情。例如,如果ulimit和max transfer threads(两个最重要的初始设置 )没有改变,那么在某些时候DataNodes无法创建新的线程,从HBase的角度来看是好像HDFS已经消失了。想想如果您的MySQL数据库突然无法访问本地文件系统上的文件会发生什么,这与HBase和HDFS相同。看到RegionServers提交seppuku的另一个常见原因是当它们输入比默认ZooKeeper会话超时持续时间更长的垃圾收集暂停时。
以上内容是否对您有帮助:
更多建议: