穷人的 supervisor OOM killer

Est at 
厂里的 docker 上跑了个 supervisord,用来把挂掉的进程拉起来。最近的问题不是进程挂掉,而是内存泄漏跑着跑着内存爆了,然后宿主机 OOM 随机杀掉一个进程,结果占用内存最大的那个还活着,正常的进程反而 gg,该漏的继续漏,然后反复 OOM。想看下哪里漏了,--cap-add=SYS_PTRACE 也不给加,OOM 策略也不给调,思来想去只能自己做防水补漏了。做起来也简单,supervisor 再跑一套 bash 脚本即可:while true; do p=`ps --no-headers -xo rss,pid --sort=-rss | awk '{ if($1 >……