Странные сбои под Linux
1644
2
Двухпроцессторный сервер для расчетных задач под Red Hat 7. Болезнь проявляется так. Запускаем задачу, она считается минут 10-15 и когда доходит до самого тяжелого места (когда надо много памяти и надо много буферить на диск) начинаются фокусы. Системный блок издает один или несколько (с интервалами) коротких писков, после чего процесс просто тихо умирает без всяких сообщений об ошибках! И это самое странное.
Процессоры теплые, не более того. Диски тоже. Когда в жару ослаб один из вентиляторов, тоже были сбои, но там были сообщения "terminated by signal 11", то есть сбой обращения к памяти, а тут - писк и никаких сообщений.
Что это может быть? Где искать, что читать?
Максимыч
Я понимаю, что скорее всего причина в какой-то аппаратной дури. Раньше те же задачи что я сейчас использую для тестирования проходили.
Я не понимаю другого. Как процесс может быть убит (ядром?) без всяких сообщений об ошибке???
Максимыч
Я не понимаю другого. Как процесс может быть убит (ядром?) без всяких сообщений об ошибке???
Процесс может быть не убит ядром, а помереть сам. При этом сообщения об ошибке он и не выдаст, если при написании программы вариант смерти в этом месте не пришел в голову программисту.