L'assassino di OOM suggerisce che in effetti hai esaurito la memoria.
Se dici che ha più memoria di quanta ne abbia bisogno, forse qualche evento di sistema sta creando una perdita di memoria da qualche parte, ma il killer OOM non dirà perché c'è una perdita di memoria, solo che ha esaurito la memoria e ora cerca di uccidere le cose meno importanti (basato su oom_score).
E se il caso è che c'è una perdita di memoria, allora forse l'oom-killer ucciderà solo i proc in modo che il rouge one possa allocare sempre più memoria.
Quindi quello che farei in caso, è
- Configura kdump, che creerà un crash dump vmcore dopo un kernel panic. (è descritto più dettagliatamente qui)
- Impostazione
vm.panic_on_oom=1
parametro del kernel. Ciò causerà un kernel panic se la macchina esaurisce la memoria. - La prossima volta che vieni preso dal panico, puoi aprire il file vmcore creato da kdump e guardare la tabella dei processi, e rivelerà il colpevole.