Linux 主机异常信息收集

Yiran at 
背景 链接到标题 通常情况下,一个公司内部都会有监控报警平台去支撑业务主机的稳定运行,比如 Nagios,Zabbix 或者 Prometheus 等其他工具。 这些工具,无论是 push 模式还是 pull 模式,都基于一个前提:主机是可访问的,或者说 agent/exporter 是可正常工作的。如果运维人员在面对一台处于异常状态的主机,应该如何收集该主机的当前状态及相应日志呢?企业级产品通常会内置工具用来采集异常状态信息,比如:DELL 服务器如果出现了未知错误,拨打 400 询问问题, 一线客服会告诉你,打开 iDRAC 界面,点击“收集日志” 选项,会自动收集并下载节点信息 如果你是……