Сага о драйверах

Материал из ALT Linux Wiki


Статья пишется на основе знаменитой статьи "Сага о драйверах"

Замечания и предложения по статье можно посылать в телеграмм канал Saga_o_Driverah

Stub.png
Данная страница находится в разработке.
Эта страница ещё не закончена. Информация, представленная здесь, может оказаться неполной или неверной.


У вас не работает "железо", что делать

Часто на форуме можно встретить вопрос такого типа:

"Я поставил ваш дистрибутив на свой ноутбук и у меня не работает WiFi карточка".

Давайте на примере этого вопроса узнаем кое-что об оборудовании компьютера (дальше для краткости я его буду просто называть "железо") и о программах,которые с ним работают (для краткости - драйвера).

"Железо" может быть внутри компьютера, или внешним. Оно может подсоединяться к "сердцу" компьютера, его процессору по различным шинам (линиям связи). Для обеспечения этой связи обычно используется "материнская плата" (видел я и компьютеры, в которых она называлась просто "задняя стенка" ;-) ).

Существует достаточно много различных типов таких шин - USB, PCI, PS/2, SATA, Com-порт, LPT порт [1] и т.п.

Если мы говорим про Wi-Fi карточку в ноутбуке, то она может находится или на шине USB или на шине PCI (я говорю о них как о типе шин, так-как например, USB бывают разными, как впрочем и PCI ).

Для обнаружения таких устройств существуют две команды - lspci и lsusb.

Команда lsusb [2]

Вот я сейчас сижу за ноутбуком и даю команду :

$ lsusb
Bus 002 Device 001: ID 1d6b:0003 Linux Foundation 3.0 root hub
Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub
Bus 006 Device 002: ID 0bda:57b4 Realtek Semiconductor Corp. USB Camera
Bus 006 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub
Bus 008 Device 002: ID 13d3:3501 IMC Networks 
Bus 008 Device 001: ID 1d6b:0001 Linux Foundation 1.1 root hub
Bus 005 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub
Bus 007 Device 004: ID 1ea7:0064 SHARKOON Technologies GmbH 2.4GHz Wireless rechargeable vertical mouse [More&Better]
Bus 007 Device 001: ID 1d6b:0001 Linux Foundation 1.1 root hub
Bus 004 Device 001: ID 1d6b:0003 Linux Foundation 3.0 root hub
Bus 003 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub

Разберём одну строчку:

Bus 007 Device 004: ID 1ea7:0064 SHARKOON Technologies GmbH 2.4GHz Wireless rechargeable vertical mouse [More&Better]
  • Bus 007 - устройство висит на седьмой шине USB
  • Device 004:- оно на этой шине четвертое
  • ID 1ea7:0064 - это его идентификатор, определяющая какая фирма произвела устройство (Id Vendor) и идентификатор самого устройства (Id Device)
  • SHARKOON Technologies GmbH 2.4GHz Wireless rechargeable vertical mouse [More&Better] - имя устройства ( за его идентификацию отвечает пакет usbids[1]

Допустим нам надо посмотреть какой драйвер (в данном случае модуль ядра) "обслуживает" устройство мыши.

Для этого даём команду :

 lsusb  -tv
/:  Bus 08.Port 1: Dev 1, Class=root_hub, Driver=ohci-pci/5p, 12M
    ID 1d6b:0001 Linux Foundation 1.1 root hub
    |__ Port 5: Dev 2, If 0, Class=Wireless, Driver=btusb, 12M
        ID 13d3:3501 IMC Networks 
    |__ Port 5: Dev 2, If 1, Class=Wireless, Driver=btusb, 12M
        ID 13d3:3501 IMC Networks 
/:  Bus 07.Port 1: Dev 1, Class=root_hub, Driver=ohci-pci/5p, 12M
    ID 1d6b:0001 Linux Foundation 1.1 root hub
    |__ Port 1: Dev 4, If 0, Class=Human Interface Device, Driver=usbhid, 12M
        ID 1ea7:0064 SHARKOON Technologies GmbH 2.4GHz Wireless rechargeable vertical mouse [More&Better]
....
    ID 1d6b:0003 Linux Foundation 3.0 root hub
/:  Bus 01.Port 1: Dev 1, Class=root_hub, Driver=vhci_hcd/8p, 480M
    ID 1d6b:0002 Linux Foundation 2.0 root hub

lsusb -t наглядно показывает какое USB устройство подсоединено к конкретному порту USB, Но нам в данном случае важно, что команда показывает какой драйвер использует то, или иное устройство [3] . В данном случае, мы видим, например, что "IMC Networks" использует модуль ядра (драйвер) btusb. И мы видим что это составное устройство. Зная устройство своего ноутбука, могу сразу сказать, что это комбинированная внутренняя карточка, одновременно работающая и с Wi-Fi и c bluetooth (сам в своё время покупал, заменив старую карточку).

Команда lspci [4]

Ну и для примера приведу как работать с командой lspci. На другом компьютере даю команду lspci :

00:00.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h (Models 10h-1fh) Processor Root Complex
00:00.2 IOMMU: Advanced Micro Devices, Inc. [AMD] Family 15h (Models 10h-1fh) I/O Memory Management Unit
00:04.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] Family 15h (Models 10h-1fh) Processor Root Port
...
00:18.4 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h (Models 10h-1fh) Processor Function 4
00:18.5 Host bridge: Advanced Micro Devices, Inc. [AMD] Family 15h (Models 10h-1fh) Processor Function 5
01:00.0 VGA compatible controller: NVIDIA Corporation GF119 [GeForce GT 610] (rev a1)
01:00.1 Audio device: NVIDIA Corporation GF119 HDMI Audio Controller (rev a1)
03:00.0 Network controller: Realtek Semiconductor Co., Ltd. RTL8812AE 802.11ac PCIe Wireless Network Adapter (rev 01)
04:00.0 Ethernet controller: Qualcomm Atheros AR8161 Gigabit Ethernet (rev 10)
05:00.0 USB controller: Renesas Technology Corp. uPD720201 USB 3.0 Host Controller (rev 03)

Нас интересует это устройство:

03:00.0 Network controller: Realtek Semiconductor Co., Ltd. RTL8812AE 802.11ac PCIe Wireless Network Adapter (rev 01)
  • 03:00.0 - это "порт" подключения устройства
  • Network controller: Realtek Semiconductor Co., Ltd. RTL8812AE 802.11ac PCIe Wireless Network Adapter (rev 01) - его название (за него отвечает пакет ) pciids[2]

Для поиска драйверов важны идентификаторы вендора (Id Vendor) и устройства (Id Device), именно по ним ищет "операционка" какой драйвер (модуль ядра) нужно загрузить. И по ним легче искать в интернете какой драйвер нужно использовать. Для примера, посмотрим эти идентификаторы у карточки "Network controller: Realtek Semiconductor Co., Ltd. RTL8812AE 802.11ac PCIe Wireless Network Adapter (rev 01)". Мы видим из предыдущей команды, что она подключена к порту 03:00.0. Даём следующую команду:

$ lspci -n -s 03:00.0
03:00.0 0280: 10ec:8812 (rev 01)

Здесь $ - это не часть команды, а приглашение bash и в контексте статьи означает, что команду можно давать от обычного пользователя

Что мы видим :

  • 03:00.0 - это "порт"подключения
  • 0280: идентификатор контроллера
  • 10ec:8812 - идентификатор вендора и идентификатор устройства


Иногда удобнее увидеть и имя устройства, тогда можно дать такую команду:

$ lspci -nn -s 03:00.0
03:00.0 Network controller [0280]: Realtek Semiconductor Co., Ltd. RTL8812AE 802.11ac PCIe Wireless Network Adapter [10ec:8812] (rev 01)

Для того, чтобы посмотреть какой модуль ядра (драйвер) "обслуживает" сейчас данное устройство надо дать команду:

# lspci -k -s 03:00.0 
03:00.0 Network controller: Realtek Semiconductor Co., Ltd. RTL8812AE 802.11ac PCIe Wireless Network Adapter (rev 01)
        Subsystem: Realtek Semiconductor Co., Ltd. RTL8812AE 802.11ac PCIe Wireless Network Adapter
        Kernel driver in use: rtl8821ae

Здесь # - это не часть команды, а приглашение bash пользователя root и в контексте статьи означает, что команду нужно давать от пользователя root.

Как мы видим используется драйвер rtl8821ae

Хуже бывает, если система не говорит о загруженном драйвере , т.е. отсутствует строчка

   Kernel driver in use: rtl8821ae

В этом случае нам надо искать какой драйвер надо использовать.

Немного теории

Под драйверами[5] часто понимают все программы, обеспечивающие работу устройств.

В Линукс можно выделить несколько видов программ, работающих с устройств.

Наибольшая часть из таких программ в Линукс входят в ядро. Это почти все драйвера, работающие с внутренними устройствами компьютера и многие устройства использующие шину USB. Большинство из таких драйверов входят в основную ветку разработки ядра и входят в пакет kernel-image. Кроме того, помимо модулей ядра, входящих в основную ветку ядра, существуют модули ядра по какой-либо причине в него не входящие. Обычно это или модули ядра с закрытыми частями от разработчиков "железа", или новые, ещё не отлаженные до конца модули.

Поскольку Linux достаточно динамичная "среда" программирования [6] , то иногда появляется ситуация, что какое-то оборудование могут поддерживать несколько модулей ядра.

При наличии нескольких конкурирующих модулей, для работы с конкретным устройством, возникает задача указать какой модуль применять. Для этого применяются опции блокировки конкретного модуля. Для этого в каталоге /etc/modprobe.d для этого создаётся файл, обычно с именем blacklist{суффикс}.conf и с опцией blacklist имя_модуля.

Например, в пакет kernel-modules-e1000e-std-def входит файл blacklist-e1000e.conf с содержимым:

blacklist e1000e

Модули ядра расположены в каталоге /lib/modules/имя_релиза_ядра. [7].

Помимо модулей ядра с оборудованием работают и модули других программ, которые в обыденной жизни тоже называют драйверами.

Так со сканерами работают модули программы sane, расположенные в каталоге (для архитектуры x86_64) /usr/lib64/sane (входят в пакет libsane). Поддерживаемые сканеры проектом Sane можно посмотреть в http://www.sane-project.org/sane-supported-devices.html

А с принтерами работают модули cups, который имеет свои модули поддержки принтеров. Про поддержку принтеров проектом cups можно посмотреть https://openprinting.org/printers

Также существуют отдельные модули, обеспечивающие работу графического режима работы ОС - модули работающие с xorg и c wayland.

Где искать драйвер

  • во-первых, стоит поставить пакет типа kernel-doc-std-def, но там обычно есть описания только модулей ядра, которые уже входят в ядро.
  • во-вторых, на сайте https://linux-hardware.org есть возможность поискать по идентификаторам вендора и устройства какой драйвер нужен для вашего устройства.
Например :
Ищем карточку Realtek Semiconductor Co., Ltd. RTL8812AE 802.11ac PCIe Wireless Network Adapter по его id и потм по ссылке смотрим какой драйвер ядра её поддерживает  
  • в-третьих, искать в интернете по идентификаторам , лучше по идентификаторам (Id Vendor и Id Device), в том виде как выдают их команды lsusb и lspci. Искать по названию устройств не эффективно, так как в поиске получите или описание драйверов для Windows или рекламу купить это устройство.

Немного о драйверах и прошивках

В силу того, между разработчиками оборудования существует конкуренция, его разработчики не заинтересованы подробно делиться подробным кодом их работы. Особенно новыми разработками. Поэтому довольно часто создаются закрытые прошивки, которые загружаются драйвером или в ОЗУ компьютера, или в внутреннюю память самого устройства. Ещё одна из причин использовать прошивки - их применение удешевляют стоимость аппаратной части устройства.

Этим "грешат" как некоторые внутренние устройства, например Ethernet и Wi-Fi карты, так и некоторые принтеры и сканеры. Бывают ситуации, что драйвер есть, а прошивки ему не хватает. [8]

Например модуль ядра для Wi-Fi Broadcom, входящий на момент написания статьи в основное дерево, требует отдельной прошивки, причём условия его распространения не позволяют включать прошивки в дистрибутив, и даже класть в репозиторий (см Wi-fi_Broadcom), но достаточно недавно появился модуль bcmwl, устраняющий эту проблему, но он ещё не вошёл в основное дерево ядра и пока распространяется отдельно.

Ещё одним из вариантом применения прошивок является ситуация, когда создаётся модуль ядра, который умеет работать с импортируемой частью драйвера от другой ОС. Ярким примером такого модуля является история модуля ядра ndiswrapper.[9]

Схема работы ядра с оборудованием

Упрощённо работу ядра с оборудованием можно представить так:

  • после загрузки ядра, ядро обнаруживает устройства, которые или находятся внутри компьютера, или присоединены к его внутренним или внешним шинам и идентифицирует их по их идентификаторам.
  • если модуль ядра не загружен к текущему моменту в ОЗУ (некоторые модули ядра могут входить в основную часть ядра и загружаться как единое целое с ним), то условно "диспетчер" (далее без кавычек) модулей ядра ищет по информации находящейся в модулях ядра, необходимый модуль.
  • после нахождения модуля ядра, диспетчер модулей ядра проверяет - нет-ли этого модуля в "черных списках" (blacklist) на загрузку, и если нет, то загружает этот модуль ядра.
  • в момент загрузки модуля диспетчер модулей ядра ищет в /etc/modprobe.d/ информацию о том, с какими параметрами загружать модуль.
  • в этот момент при необходимости, загружается прошивка, необходимая для работы модуля.
  • в виртуальной файловой системе /sys создаётся информация об устройстве и модуле ядра, работающего с ним, для того, чтобы внешние программы могли получить информацию об устройстве и модуле.
  • запускается udev, который считывает свои правила и в соответствии с ними, создаёт (при необходимости) в файловой системе "устройства" /dev (иногда их называют "нодами устройств"), которые являются одним из каналов общения между программами и устройствами. А также может запускать какие-либо программы, которые могут обеспечивать работу программ, вплоть до подмены идентификаторов вендоров и устройств.

В принципе, в большинстве случаев этого достаточно для начала работы с устройствами.

Раньше ноды устройств создавались статически. Некоторые ноды и сейчас создаются статически (и их может создать грамотный администратор) и лежат в каталоге /dev уже в момент загрузки устройств. Но теория и практика применения Линукс развивалась и теперь большинство необходимых нод создаются и удаляются динамически.

Про команды работы с модулями ядра

Команда lsmod

  • Часто для того, чтобы понять почему не работает какое-либо устройство, часто надо посмотреть какие модули ядра загрузились в ОЗУ. Это можно посмотреть с помощью команды lsmod.
# lsmod
Module                  Size  Used by
btrfs                1810432  0
blake2b_generic        20480  0
xor                    24576  1 btrfs
...

ehci_pci               16384  0
serio_raw              16384  0
ehci_hcd               65536  1 ehci_pci
scsi_common            16384  6 scsi_mod,usb_storage,pktcdvd,uas,libata,sr_mod

Команда modinfo

  • Для того, чтобы посмотреть информацию о модуле ядра используется команда modinfo

Например:

# modinfo /lib/modules/$(uname -r)/kernel/drivers/cpufreq/acpi-cpufreq.ko 
# modinfo /lib/modules/$(uname -r)/kernel/drivers/cpufreq/acpi-cpufreq.ko
filename:       /lib/modules/6.1.10-un-def-alt1/kernel/drivers/cpufreq/acpi-cpufreq.ko
alias:          acpi
license:        GPL
description:    ACPI Processor P-States Driver
author:         Paul Diefenbaugh, Dominik Brodowski
srcversion:     AEED556A80507DE37550964
alias:          cpu:type:x86,ven*fam*mod*:feature:*00E8*
alias:          cpu:type:x86,ven*fam*mod*:feature:*0016*
alias:          acpi*:ACPI0007:*
alias:          acpi*:LNXCPU:*
depends:        
retpoline:      Y
intree:         Y
name:           acpi_cpufreq
vermagic:       6.1.10-un-def-alt1 SMP preempt mod_unload modversions 
sig_id:         PKCS#7
signer:         Build time autogenerated kernel key
sig_key:        1D:99:23:2B:7B:A2:C2:14:28:CF:48:1E:DE:E9:2A:57:D4:83:60:47
sig_hashalgo:   sha512
signature:      E7:6F:7F:4F:DA:FC:E1:69:42:2B:28:82:BA:B5:44:90:68:32:E5:F6:
                7A:03:60:DE:E1:30:DB:8E:37:38:39:4A:3F:12:1E:BC:62:D8:70:A3:
                75:CF:4F:2F:9A:BD:09:F3:61:AE:FA:BF:F9:E0:7C:D7:45:21:95:E3:
 ...
                0F:43:AD:84:48:B2:A0:70:52:E0:70:54:BA:6A:5C:0E:41:64:D3:95:
                BD:BE:E8:EC:FC:79:C5:40:37:D6:63:0D
parm:           acpi_pstate_strict:value 0 or non-zero. non-zero -> strict ACPI checks are performed during frequency changes. (uint)

Команда modprobe

  • Для того, чтобы загрузить из командной строки какой либо модуль ядра в ОЗУ можно использовать команду modprobe имя_модуля. Команда modprobe имя_модуля умеет загружать модули из каталога с текущим ядром, и упомянутая в файле /lib/modules/$(uname -r)/modules.dep.

Пример:

# modprobe xor
#

Если в ответ на команду не было сообщений, то существенных ошибок при загрузке ядра не было (хотя из предыдущего сообщения видно, что модуль уже загружен, надо будет потом проверить всегда-ли так с командой modprobe).

insmod

  • Второй способ загрузки модуля ядра, это выполнение команды insmod, она позволяет загружать модуль из заданного каталога, например:
# insmod /lib/modules/$(uname -r)/kernel/drivers/cpufreq/acpi-cpufreq.ko 
# insmod /lib/modules/$(uname -r)/kernel/drivers/cpufreq/acpi-cpufreq.ko 
insmod: ERROR: could not insert module /lib/modules/6.1.10-un-def-alt1/kernel/drivers/cpufreq/acpi-cpufreq.ko: File exists

Здесь я преднамеренно попытался загрузить командой insmod один и тот-же модуль. В первый раз всё прошло без ошибок, а второй раз выдало информацию об ошибке (модуль уже загружен).

rmmod

  • Для того, чтобы выгрузить модуль ядра rmmod имя_модуля. Важно заметить, что когда модуль загружен и в данный момент работает с устройством, его нельзя выгрузить.

Пример 1:

# rmmod  acpi-cpufreq
#

Модуль был выгружен из ОЗУ без ошибок, что в принципе означает, что модуль в данный момент был не задействован.

Пример 2:

# rmmod nvidia
rmmod: ERROR: Module nvidia is in use by: nvidia_modeset

Попытка выгрузки модуля не удалась, так-как он задействован в работе с железом.

dmesg

  • Для того, чтобы посмотреть события, произошедшие с ядром, можно использовать команду dmesg
# dmesg | tail -n2
[28945.743841] nvidia_modeset: disagrees about version of symbol module_layout
[29157.059850] acpi_cpufreq: overriding BIOS provided _PSD data

Мы видим последние два сообщения ядра.

udevadm

  • Для анализа событий происходящих в момент подсоединения, или отсоединения устройства пригодятся команды мониторинга udevadm

Пример:

# udevadm monitor
monitor will print the received events for:
UDEV - the event which udev sends out after rule processing
KERNEL - the kernel uevent

KERNEL[30557.800595] add      /devices/pci0000:00/0000:00:10.0/usb5/5-2 (usb)
KERNEL[30557.802173] add      /devices/pci0000:00/0000:00:10.0/usb5/5-2/5-2:1.0 (usb)
KERNEL[30557.806378] add      /devices/virtual/workqueue/scsi_tmf_9 (workqueue)
KERNEL[30557.806434] add      /devices/pci0000:00/0000:00:10.0/usb5/5-2/5-2:1.0/host9 (scsi)
KERNEL[30557.806470] add      /devices/pci0000:00/0000:00:10.0/usb5/5-2/5-2:1.0/host9/scsi_host/host9 (scsi_host)
...

UDEV  [30558.029462] add      /devices/pci0000:00/0000:00:10.0/usb5/5-2/5-2:1.0/host9/target9:0:0/9:0:0:0/block/sdi (block)
UDEV  [30558.092521] add      /devices/pci0000:00/0000:00:10.0/usb5/5-2/5-2:1.0/host9/target9:0:0/9:0:0:0/block/sdi/sdi2 (block)
UDEV  [30558.133565] add      /devices/pci0000:00/0000:00:10.0/usb5/5-2/5-2:1.0/host9/target9:0:0/9:0:0:0/block/sdi/sdi1 (block)
UDEV  [30558.135974] bind     /devices/pci0000:00/0000:00:10.0/usb5/5-2/5-2:1.0/host9/target9:0:0/9:0:0:0 (scsi)

Вот так показывает udevadm события, связанные с вставлением внешнего диска.

  • Здесь сообщения, начинающиеся со слова KERNEL - это сообщения ядра, сообщения начинающиеся со слова UDEV - сообщения UDEV.
  • [30558.133565] - это время события
  • add - это выполняемая операция
  • /devices/pci0000:00/0000:00:10.0/usb5/5-2/5-2:1.0 (usb) - это адрес устройства внутри файловой системы /sys

Немного о драйверах видеокарт

Для работы видео карт в графическом режиме помимо драйвера ядра, требуются модули графического сервера (например xorg).

Так для работы карт nvidia требуется модуль ядра и соответствующий ему модуль xorg.

Для проприетарного модуля ядра nvidia, входящего в пакет kernel-modules-nvidia, требуется графический модуль xorg, входящий в пакет nvidia_glx_версия_модуля.

А для свободного драйвера nouveau (пакет kernel-modules-drm-nouvea..), также умеющего работать с картами nvidia требуется графический модуль nouveau (пакеты xorg-drv-nouveau и xorg-dri-nouveau).

Это касается не только карт Nvidia, но и многих других видеокарт. В последнее время появилась тенденция большую часть поддержки стандартных и наиболее часто встречающихся карт переносить внутрь ядра, оставляя только несколько универсальных графических модулей xorg (см Kernel mode setting).

  1. строго говоря LPT и Com-порты не шины, например COM-порты это выход шины RS32
  2. lsusb — утилита для вывода информации о шинах USB в системе и подключенных к ним устройствах.
  3. Существуют и другие способы выяснения с каким модулем ядра работает данное устройство часть из них описана, например здесь
  4. Утилита lspci служит для вывода информации о всех имеющихся в системе шинах PCI и всех подключенных к ним устройствах.
  5. в жаргоне их часто просто называют "дровами"
  6. Конечно это ОС, но и благодаря лицензии GPL, это очень удобная среда в которой программисты могут делиться своими знаниями и наработками. Впрочем это вопрос отдельной статьи
  7. Имя релиза загруженного ядра выдаёт команда uname -r
  8. Для анализа таких ситуаций помогает анализ выдачи команды dmesg.
  9. К сожалению на момент написания статьи он не представлен в текущем ядре