Rocketmq 引起的磁盘告警排查

早上收到服务器的磁盘告警,查看发现是es日志比较多,具体看索引由rocketmq的store日志造成。

排查:
1、由于rocketmq的日志统一收集到elk,方便排查。
首先定位到是es造成磁盘告警,查看es的索引数据,快速找到具体是哪个索引日志Rocketmq 引起的磁盘告警排查_第1张图片
正常情况下,rocketmq的store索引数据在40M左右。

2、查看rocketmq集群挂载的日志,只有一个slave节点的store日志一直在输出warn日志,如下:
Rocketmq 引起的磁盘告警排查_第2张图片

3、由于是从节点,重启对业务不会有影响,先重启试试,结果是么用。网上搜索一番,https://issues.apache.org/jir...
据说可能是commitlog 数据损坏,那这样没办法了,因为是slave节点可以直接删除commitlog数据,再重启会自动从master同步过来。
store日志恢复正常。

你可能感兴趣的