Kernel/hardware errors: различия между версиями
< Kernel
Vt (обсуждение | вклад) (→Проверка памяти: fix url) |
Vt (обсуждение | вклад) Нет описания правки |
||
Строка 11: | Строка 11: | ||
= Мониторинг = | = Мониторинг = | ||
== Мониторинг памяти == | |||
* '''mcelog''': (считается устаревшим и) не поддерживается в ядрах Альта (отсутствует {{Path|/dev/mcelog}} устройство). <br> ''"mcelog logs and accounts machine checks (in particular memory, IO, and CPU hardware errors) on modern x86 Linux systems."'' — https://mcelog.org/ | * '''mcelog''': (считается устаревшим и) не поддерживается в ядрах Альта (отсутствует {{Path|/dev/mcelog}} устройство). <br> ''"mcelog logs and accounts machine checks (in particular memory, IO, and CPU hardware errors) on modern x86 Linux systems."'' — https://mcelog.org/ | ||
* '''edac-util''': рабочий вариант, но плохо поддерживается апстримом. <br> ''"Userspace helper for kernel EDAC drivers (Error Detection and Correction)"'' — https://github.com/grondo/edac-utils | * '''edac-util''': рабочий вариант, но плохо поддерживается апстримом. <br> ''"Userspace helper for kernel EDAC drivers (Error Detection and Correction)"'' — https://github.com/grondo/edac-utils | ||
* '''rasdaemon''': современное решение. Мониторит не только память, а любые доступные ему аппаратные ошибки. <br> ''"Those tools provide a way to get Platform Reliability, Availability and Serviceability (RAS) reports made via the Kernel tracing events."'' — https://github.com/mchehab/rasdaemon | * '''rasdaemon''': современное решение. Мониторит не только память, а любые доступные ему аппаратные ошибки. <br> ''"Those tools provide a way to get Platform Reliability, Availability and Serviceability (RAS) reports made via the Kernel tracing events."'' — https://github.com/mchehab/rasdaemon | ||
# apt-get install rasdaemon | |||
# systemctl enable --now rasdaemon | |||
{{Category navigation|title=Kernel|category=Kernel|sortkey=*}} | {{Category navigation|title=Kernel|category=Kernel|sortkey=*}} |
Версия от 00:52, 28 мая 2023
Перед тем, как заполнять баг-репорт, рекомендуется провести проверку аппаратных компонентов на наличие ошибок. Возникновение аппаратных проблем может привести к появлению "мистических глюков", которые никто не сможет исправить, так как они специфичны только для вашего устройства. Однако эти глюки будут отнимать время и вызывать ложные подозрения о наличии ошибок в ПО.
Проверка системы
Проверка памяти
- Memtest86+: как правило, доступен в меню Advanced options for ALT Sisyphus Sisyphus при загрузке через grub. — https://www.memtest.org/
- efi-memtest86: (при загрузке через EFI) — https://www.memtest86.com/
Для использования необходимо:- установить пакет efi-memtest86 и скопировать /usr/lib64/efi/memtest86.efi в /boot/efi
- установить пакет edk2-efi-shell и скопировать /usr/lib64/efi/shell.efi в /boot/efi
- В BIOS запустить EFI Shell и там запустить memtest86.
Один прогон проверки памяти может занимать несколько часов.
Мониторинг
Мониторинг памяти
- mcelog: (считается устаревшим и) не поддерживается в ядрах Альта (отсутствует /dev/mcelog устройство).
"mcelog logs and accounts machine checks (in particular memory, IO, and CPU hardware errors) on modern x86 Linux systems." — https://mcelog.org/ - edac-util: рабочий вариант, но плохо поддерживается апстримом.
"Userspace helper for kernel EDAC drivers (Error Detection and Correction)" — https://github.com/grondo/edac-utils - rasdaemon: современное решение. Мониторит не только память, а любые доступные ему аппаратные ошибки.
"Those tools provide a way to get Platform Reliability, Availability and Serviceability (RAS) reports made via the Kernel tracing events." — https://github.com/mchehab/rasdaemon
# apt-get install rasdaemon # systemctl enable --now rasdaemon