Prometheus hang 住问题定位解决

格物致知 at 
Prometheus hang 住问题定位解决的配图
概述这里我简单描述了一下我遇到的一次 prometheus hang 住但是却不太完全的一个定位过程。虽然不是一个完整的定位过程,但是,却是一个参考方向,那就是存储会很影响 prometheus 的功能。问题现象图 1:Prometheus 进程状态 但是,却不提供服务且 9090 端口无法访问:图 2:prometheus API 无法访问 定位过程看是否存在网络访问首先得检查一下内部状态,看是完全卡死了还是说只是提供 Web 服务的接口不响应了:[root@liqiang.io]# lsof -p 18244 发现卡住了居然没响应,心中有些不妙,怀疑系统问题了,于是先 top 一把看看:[……