РазбиениеДиска: различия между версиями

Материал из ALT Linux Wiki
Строка 81: Строка 81:


Примечание 1: использовать ядра младше 3.14 не рекомендуется; сложные конфигурации использовать без резервных копий не рекомендуется.<br>
Примечание 1: использовать ядра младше 3.14 не рекомендуется; сложные конфигурации использовать без резервных копий не рекомендуется.<br>
Примечание 2: с учётом использования подразделов, вероятно, имеет право на жизнь совмещение подхода, описанного в преамбуле, с тем, что описано в статье, с учётом, разумеется, использования исключительно btrfs.
Примечание 2: с учётом использования подразделов имеет право на жизнь совмещение подхода, описанного в преамбуле, с тем, что описано в статье, с учётом, разумеется, использования исключительно btrfs ([[Установка_AltLinux_на_Btrfs|подробнее тут]]).


=== [[:ruwp:ZFS|zfs]] ===
=== [[:ruwp:ZFS|zfs]] ===

Версия от 11:10, 18 ноября 2018

42px-Wikitext-ru.svg.png
Эту статью следует викифицировать.


Разбиение диска

Преамбула

Существует мнение, что, на рабочей станции, вообще не следует делить HDD/SSD на разделы (исключая /boot/efi и, вероятно, swap), особенно, если рабочей станцией пользуется один пользователь. Плюс такого решения исключительно в том, что не придётся решать вопрос о выборе размеров разделов. В случае такого выбора всю статью можно не читать, но стоит ознакомиться с написанным про разделы /boot/efi, swap и файловые системы btrfs и tmpfs.

Введение

Эта статья содержит информацию, которая может помочь принять решение о правильном выборе количества разделов, на которое следует разделить диск компьютера, о размере разделов, а также используемых на них файловых системах. Целью деления HDD на разделы является повышение быстродействия, надёжности и безопасности системы.

  • Повышение надёжности следует из того, что не на всех разделах будут содержаться файлы, открытые для записи, и, соответственно, вероятность повреждения таких разделов при зависаниях и случайных нештатных перезагрузках будет минимальной. Например, необходимость отделения /var очевидна после изучения вывода
ls -l /proc/*/fd/ | grep "\s/var"

Кроме того, в случае необходимости запуска fsck, может потребоваться много ОЗУ для проверки.

  • Повышение быстродействия следует из того, что, во-первых, для каждого раздела можно выбрать наиболее оптимальный тип ФС, во-вторых, часть разделов можно вовсе убрать с механического носителя в ОЗУ и исключить лишнее обращение к механическому носителю (для SSD - ещё и уменьшить износ). Кроме того, файловые системы, требующие проверки после нештатных перезагрузок, не будут нуждаться в таковой проверке, если на них не будет файлов, открытых для записи (для этого следует отделять от корня разделы /var, /tmp, /home и, вероятно, /opt).
  • Повышение безопасности достигается за счёт различных опций монтирования, ограничивающих те или иные права для разных разделов.


Следует понимать, что универсального решения не существует. Конечный результат зависит от назначения компьютера и особенностей его работы с наложенными предпочтениями и мнением того, кто устанавливал ОС.

Есть мнение, что, по крайней мере, на тестовых машинах следует использовать LVM, который позволяет, при соблюдении ряда правил, гибко манипулировать разделами без потери данных. Но это тема отдельной статьи.

Загрузочный раздел GRUB для GPT

На дисках размером больше 2 Тб мы вынуждены отказаться от MBR и использовать GPT. Но таблица разделов GPT не оставляет места для грубовского загрузчика второго этапа (GRUB boot stage two): в случае GRUB в первом секторе (512 байт) располагается "заглушка" MBR с единственной записью - разделом тип GPT, а во втором секторе диска - уже GPT. (В классическом MBR секторы со 2 по 63 оставались зарезервированными и GRUB stage 2 записывался туда.) Поэтому в GPT для загрузчика второго этапа предусмотрен специальный тип раздела - "BIOS Boot Partition", который в parted и GpartEd обозначается флагом "bios_grub". В старой GRUB Wiki была рекомендация сделать раздел не менее 31 кБ размером и назначить ему в parted флаг "bios_grub". Red Hat рекомендует делать такой раздел размером 1 Мб.

Если планируете установить на диск GRUB на диск с таблицей разделов GPT, обязательно создайте на этом диске раздел размером от 31 кб до 1 Мб и задайте ему флаг bios_grub, после чего выполните команду grub-install /dev/диск (для проверки).

Дисковая подкачка (swap)

У swap есть несколько особенностей.

  1. Если уж он используется, то доступ к нему должен быть максимально быстрый (а это значит либо начало, либо середина диска; для накопителей SSD место расположения, в плане скорости, значения не имеет).
  2. Данные в swap не представляют никакой ценности после перезагрузки машины, исключая случай гибернации.
  3. Если на компьютере (например, ноутбуке) планируется использовать режим гибернации, размер swap следует сделать несколько больше размера ОЗУ; если ОЗУ планируется наращивать в последствии, об этом лучше подумать заранее.
  4. Если для загрузки используете том RAID уровней больше 0, swap (тоже) располагайте на RAID-1, иначе при горячем отключении или поломке диска с размещённом на нём swap получите kernel panic.

Наилучшим решением считается держать swap в начале диска, это поможет спасти информацию на диске при повреждении по каким-либо причинам информации в начале диска. Пример такой причины — опечатка при работе с разделами посредством dd (указали вместо /dev/sda2 просто /dev/sda).

В некоторых случаях swap может быть файлом.

Файловые системы

ext2

ext3

ext4

Пришла на смену ext3, обладает заметно лучшей производительностью благодаря использованию extent-ов.

Применение: ныне самая универсальная файловая система под Linux, рекомендуется использовать её как файловую систему для самых ценных данных, так как она является наиболее надёжной из современных ФС.

btrfs

Журналируемая файловая система нового поколения. Изначально разработана корпорацией Oracle. Список текущих и бывших разработчиков можно посмотреть тут, статус готовности - тут. ФС в стадии активной разработки, хотя базовый функционал считается уже стабильным. По скоростным характеристиками, по большей части, уступает остальным ФС, но значительно превосходит по возможностям (спорно относительно zfs).

Применение:
а) из простого - файловые системы большого размера и/или с большим количеством маленьких файлов;
б) из сложного - RAID средствами ФС (без mdadm), использование подразделов и т.п.

Примечание 1: использовать ядра младше 3.14 не рекомендуется; сложные конфигурации использовать без резервных копий не рекомендуется.
Примечание 2: с учётом использования подразделов имеет право на жизнь совмещение подхода, описанного в преамбуле, с тем, что описано в статье, с учётом, разумеется, использования исключительно btrfs (подробнее тут).

zfs

Прогрессивная журналируемая файловая система, представленная Sun Microsystems в 2005 году в ОС OpenSolaris. Код ФС распространяется под лицензией CDDL, в силу этого не может быть включен в ядро Linux, однако модуль ФС присутствует во многих дистрибутивах Linux. Следует заметить, что Btrfs начинала разрабатываться, как конкурент ZFS, однако в 2010 году компания Sun Microsystems была куплена компанией Oracle.

Ключевой особенностью ZFS считается контроль над физическими и логическими носителями. Зная, как именно расположены данные на дисках, ZFS способна обеспечить высокую скорость доступа к ним, контроль их целостности, а также минимизацию фрагментации данных. Так же, как и btrfs, поддерживает разные уровни RAID и другие варианты объединения носителей в общее дисковое пространство.

reiserfs

Устаревшая в пользу Reiser4, однако, в отличие от Reiser4, включенная в основное ядро Linux, журналируемая файловая система, которая отличалась от других с точки зрения администратора, в первую очередь, хорошей скоростью работы с каталогами, в которых большое количество маленьких файлов. Как и в ext3 в ветке 2.6, в ней используются для поиска файла в каталоге B-tree и хэши. Кроме того она умеет компактно хранить хвосты от файлов для экономии места, обычно расходуемого впустую.

Ещё одно преимущество - длина имени файла ограничена 3968 байтами в случае 4к блока (4096 байт блока минус 128 байт заголовков)[1], тогда как в большинстве файловых систем она ограничена 255 байтами. При использовании кодировки UTF-8 имя файла на русском языке занимает в байтах вдвое больше места (а, например, символы китайского языка кодируются 4 байтами). К сожалению, в библиотеке glibc длина имени файла и каталога также ограничена 255 байтами, поэтому для поддержки длинных имён файлов нужно также патчить glibc. См. Ethersoft Wiki.

Применения:

  • файловые системы с большим количеством маленьких файлов или с большим числом файлов в каталоге;
  • в системе, собранной с модифицированным glibc — файловые системы с файлами с русскими именами и с именами на других национальных языках.

reiser4

Файловая система Reiser4 - наследница ReiserFS. На смену алгоритму B+-tree пришёл алгоритм dancing trees. Система была полностью подготовлена к включению в основное ядро Linux ещё в 2010 году, однако это не произошло. На текущий момент включение кода ФС в основное ядро не является приоритетом ввиду недостатка времени единственного оставшегося разработчика (в этом интервью Эдуард Шишкин сказал несколько слов и о btrfs, но это интервью 2010-ого года).

Применение: файловые системы с большим количеством маленьких файлов, или в которых большое количество файлов в каталоге.

Примечание: в ALT Linux нет готовых ядер с поддержкой Reiser4.

xfs

Разработка SGI, перенесённая в Linux. Присутствует в ядре, начиная с ядра 2.4.25. Оптимизированная для быстрой работы с файлами большого размера (multimedia данных), обладающая великолепной надёжностью, имеющая поддержку ACL (полезно для файл-серверов с Windows-клиентами) и EA (до конца зачем они нужны понимают лишь бывшие пользователи OS/2, остальные смотрят на них с удивлением).

Применение: хранение файлов большого объёма (например мультимедиа-данных) и файл-сервера для Windows-сетей.

jfs

Разработка IBM, использовавшаяся ранее на AIX, ныне портирована на OS/2 и Linux. В OS/2 имеет поддержку ACL и EA (уточнить про Linux).

tmpfs

Специфическая файловая система, предназначенная для хранения временных файлов, которые не имеют ценности после перезагрузки ОС. В силу размещения в ОЗУ, крайне быстра. При этом, в случае размещения части данных в swap, преимущество в быстродействии хотя и падает, но сохраняется. Раздел tmpfs занимает столько памяти, сколько информации в нём размещено. Теоретически, можно задать размер раздела, превышающий размер ОЗУ+swap, но это не стоит делать по вполне понятным причинам. В идеальном случае, суммарный размер всех tmpfs-разделов должен быть меньше суммы ОЗУ+swap, однако могут быть и исключения, в зависимости от назначения tmpfs-разделов. Например, если точно известно, что они не будут одновременно использоваться на полный объём.

Применение: подходит для раздела /tmp, разделов для сборки ПО (например, для раздела, заданного макросом %_tmppath у RPM).

Параметры монтирования

Есть набор параметров монтирования, поддерживаемых всеми файловыми системами, а также есть параметры конкретной файловой системы. Эта информация взята из mount(8). Здесь описаны некоторые параметры, на которые стоит обратить внимание в первую очередь.

Общие параметры монтирования

  • noatime — при каждом доступе (в том числе чтении) к файлу в inode обновляется время последнего доступа к файлу, что требуется крайне редко, при использовании этого параметра это обновление производиться не будет, что заметно ускорит работу news-серверов, и, в особенности, прокси-сервера squid (так как он каждую секунду выполняет несколько обращений к файлам на чтение, каждое из которых без noatime вызывает операцию записи, то есть обновления информации о времени последнего доступа).
  • nodev — не позволяет создавать и использовать на этой файловой системе файлы-устройства, эта возможность полезна для безопасности (если вы точно знаете, что на данной файловой системе файлы-устройства вам не нужны, то есть смысл ставить этот параметр).
  • nosuid — на этой файловой системе не действует бит suid (исполнение программы от имени её владельца, а не запустившего её пользователя).
  • noexec — запрет запуска с этой файловой системы (внимание! скрипты всё равно можно будет запустить командой bash скрипт.sh).
  • ro — доступ только для чтения

ext4

  • data=journal — все данные сначала пишутся в журнал, прежде чем начать запись на файловую систему
  • data=ordered — (режим по умолчанию) сначала пишутся данные прямо в файловую систему, после чего метаданные добавляются в журнал
  • data=writeback — очерёдность записи не соблюдается, метаданные могут быть записаны в журнал до того, как данные будут записаны на файловую систему, хотя этот режим гарантирует целостность файловой системы, он может позволить устаревшим данным присутствовать в файлах после сбоя (и, соответственно, восстановления журнала). Этот режим используется для увеличения производительности

reiserfs

  • notail — отключение ускорения доступа к маленьким файлам и упаковки «хвостов файлов». Она была нужна в те времена, когда загрузчик ядра (LILO) не понимал где искать «хвосты». Кроме того с этим параметром не будет часто замечаемого многими пользователя «обрывков других файлов в файле» после аппаратный сбоев.

Поддерживается в дистрибутивах ALT Linux, выпущенных с начала 2004 года:

  • data=journal — данные сначала пишутся в журнал, а потом начинается запись на файловую систему
  • quota — для управления квотами пользователей на дисковое пространство

xfs

  • dmapi
  • logdev=device — путь к устройству, на котором будет размещён журнал
  • osyncisdsync
  • quota / usrquota / ugnoenforce
  • grpquota / gqnoenforce

tmpfs

  • size=5G - задать размер tmpfs (в примере - 5Гб); если параметр не указывать, размер будет соответствовать 50% ОЗУ.

Значение отдельных разделов

Предлагаемые для разделов файловые системы и опции монтирования не следует рассматривать в качестве догмата. Так же, все рекомендуемые объёмы, со временем, будут расти. Подробно назначение каталогов описано в FHS.

/

Корневой раздел. На этом разделе лучше использовать ФС, которая надёжно восстанавливается после системных сбоев. Если предполагается выносить /usr, /var и /home на отдельные разделы, достаточно порядка 8Гб.

Примечание: в настоящее время существует мнение, что /usr не должен быть отдельным (при этом, некоторые современные init могут вести себя не очень адекватно при наличии отдельного /usr), поэтому, если не планируется отделять /usr, для рабочей станции делайте минимум 30-35Gb под корневой раздел, что бы избежать проблем с обновлением разрастающейся системы через пять-шесть лет. Если планируются отдельные /usr, /var, /home, /tmp (/opt, /srv), то достаточно 4-6 Гб.

Файловая система: ext4.
Опции монтирования: в зависимости от наличия в корне остальных разделов.

/usr

Обычно достаточно большой раздел (20-30Гб), который редко разбивается на подразделы. Объём зависит от количества и назначения устанавливаемого ПО: некоторые приложения (офисные пакеты, игры и т.п.) могут занимать много места (игра VegaStrike, к примеру, требует 1.2Гб). Рекомендуется минимум 20Gb для рабочей станции.

/boot

На этом разделе обычно лежат рабочее и failsafe ядра, initrd образы, system.map файлы, а также некоторые данные используемого загрузчика (lilo или grub). Если этот раздел вообще создавать, объём следует выбирать, исходя из желаемого количества запасных ядер. Ядро 4.4 с соответствующим initrd занимает около 10М, файлы grub2 около 4.5Мб. Объёма 100Мб, таким образом, должно хватить на эксперименты с 9-ю ядрами. При этом, следует учесть, что объёмы, занимаемые ядром и initrd растут из года в год, потому не стоит делать раздел впритык, оставьте запас на будущее.

Раздел часто используется в системах с программным RAID с уровнями, отличными от 1, так как загрузчики могут работать именно с RAID 1. Так же раздел может быть использован в ситуациях, когда BIOS не работает с HDD большого объёма - в этом случае небольшой раздел в начале позволяет не задумываться о проблемах с BIOS (в этом случае раздел должен целиком попасть в область, которую видит BIOS).

Файловая система: ext4, возможно без журнала. Существует мнение, что лучше не монтировать её автоматически, а подключать только в моменты установки ядер и изменения конфигурации загрузчика.

Примечание: в некоторых других ОС GNU/Linux размеры initrd значительно превышают initrd в ALT Linux.

CentOS 7
43422696 initramfs-0-rescue-3dd51b8747f94aa49159fbac88313753.img
17854649 initramfs-3.10.0-229.11.1.el7.x86_64.img
19570267 initramfs-3.10.0-229.11.1.el7.x86_64kdump.img

Ubuntu 14.04
27630536 initrd.img-3.13.0-79-generic

/boot/efi

Обязательный раздел в случае необходимости использования UEFI-загрузчика.

Файловая система - исключительно FAT32.

/opt

В /opt устанавливаются приложения, не входящие в ОС. В обычном случае, этот каталог не используется, но может быть использован при работе с проприетарными приложениями. Например, в этот каталог попадают Adobe Acrobat Reader9, TeamViewer. Некоторые приложения, например, СУБД, могут занимать значительный объём.

Файловая система и опции монтирования - аналогично /usr.

/srv

Cодержит данные для сервисов, предоставляемых системой. В частности, может быть использован Бакулой для хранения архивов. В случае именно такого использования крайне рекомендуется делать отдельным разделом. Однако, чаще, данный каталог не используется.

/var

Раздел, предназначенный для хранения изменяемых в процессе работы системы данных. Кроме того, в нём располагается каталог /var/lib, где расположены chroot-окружения ряда пакетов (при этом, есть исключение в виде chroot резолвера - /var/resolv).

Файловая система и опции монтирования - в зависимости от того, есть ли деление на разделы внутри /var.

/var/log

Этот раздел делать отдельно очень полезно вообще, а для серверов - крайне необходимо. При сбоях или DoS атаках размер журналов может резко увеличиваться, тем самым переполняя этот раздел. Если сервер используется для узкого круга задач (скажем web-сервер), есть смысл журнал основного сервиса вынести на отдельный раздел (скажем /var/log/apache). Например:

/var/log — системные логи
/var/log/apache — логи www-сервера

Файловая система: ext4, xfs.
Опции монтирования: noatime, noexec, nodev.

/var/spool

Различные спулы, как с данными временного (очереди почтовых сообщений или очереди печати), так и постоянного (электронная почта пользователей) хранения.

Файловая система: reiserfs, ext4.
Опции монтирования: noexec, nodev.

/var/spool/mail

Файловая система: каталог с почтой пользователей.

Файловая система: ext4 с data=journal.
Опции монтирования: noatime, noexec, nodev.

Также на этот раздел полезно устанавливать квоты.

Примечание: использование современных POP/IMAP серверов может привести к изменению места хранения почты (в соответствии с особенностями выбранного ПО).

/var/cache

Всякие кэши.

Файловая система: ext4, reiserfs.
Опции монтирования: noexec, nodev, noatime.

/var/tmp

Эта файловая система предназначена, в первую очередь, для хранения временных данных, которые могут иметь смысл после сбоя сервера (например данные autosave, или журнал работы текстовых редакторов). Предназначен исключительно для файлов данных и должен обеспечивать высокую надёжность при аппаратных и программных сбоях.

Файловая система: ext4.
Опции монтирования: data=journal, noexec, nodev, atime.

/var/www

Раздел с сайтами пользователей

/var/run (/run)

надо описать.

Файловая система: runfs (tmpfs)

/var/lock

надо описать.

Файловая система: tmpfs

/tmp

Каталог для временных файлов, не имеющих никакого смысла при перезагрузке. Может пересоздаваться во время загрузки системы.

Время последнего доступа к файлу может использоваться для проверки, не является ли файл в этом каталоге неиспользуемым (скажем если к файлу не было доступа больше трёх суток, и он никем не открыт, то он удаляется), поэтому желательно держать флаг atime.

Файловая система: tmpfs, reiserfs
Опции монтирования: nodev, atime.

/home

Домашние каталоги пользователей. На серверной машине, на которой у пользователей нет shell-доступа, скорее всего, имеет смысл ставить на этот раздел флаг noexec, но если он не ставится, то nosuid обязателен.

Время последнего доступа к файлам, если раздел используется несколькими реальными пользователями, может быть нужно, поэтому в этом случае noatime не нужен. Однако, если машина используется, скажем, как почтовый сервер (то есть пользователи никогда не сталкиваются с данными на файловой системе), то, скорее всего, этот флаг вам нужен.

Файловая система: ext4, xfs
Опции монтирования: nosuid, nodev

/dev

Каталог на корневом разделе, содержащий специальным образом созданные файлы - ссылки на устройства. Как правило, перемонтирован посредством udev и, в обычной системе, является разделом с udevfs.

Специальные файловые системы , создаваемые ядром Linux.

/proc

Псевдо-файловая система, которая используется в качестве интерфейса к структурам данных в ядре.

/sys

Псевдо-файловая система, часть единой унифицированной модели представления устройств в Linux.

Примеры

Примеры представлены, как есть, в качестве наглядных иллюстраций по разделению диска и назначению опций монтирования. Бездумное копирование примеров может оказаться неправильным решением.

Опции монтирования по-умолчанию (altlinux-p7-sysv-tde)

proc            /proc                   proc    nosuid,noexec,gid=proc          0 0
devpts          /dev/pts                devpts  nosuid,noexec,gid=tty,mode=620  0 0
tmpfs           /tmp                    tmpfs   nosuid                          0 0

/dev/sda1       swap                    swap    defaults                        0 0

/dev/sda5       /                       ext4    relatime                        1 1
/dev/sda2       /boot                   ext4    nodev,nosuid,noexec,relatime    1 2
/dev/sda8       /home                   ext4    nosuid,relatime                 1 2
/dev/sda6       /usr                    ext4    nodev,relatime                  1 2
/dev/sda7       /var                    ext4    nosuid,relatime                 1 2
/dev/sda10      /var/ftp                ext4    nodev,nosuid,noexec,relatime    1 2

Размеры и разделы: рабочая станция

Filesystem      Size  Used Avail Use% Mounted on
udevfs          5.0M     0  5.0M   0% /dev
runfs           1.3G  464K  1.3G   1% /run
/dev/sda5       3.9G  845M  2.8G  23% /
shmfs           1.3G  216K  1.3G   1% /dev/shm
tmpfs           7.0G  2.7M  7.0G   1% /tmp
/dev/sda2       488M   27M  426M   6% /boot
/dev/sda8        30G   25G  3.2G  89% /home
/dev/sda6        20G  9.1G  9.5G  49% /usr
/dev/sda7       9.8G  1.5G  7.9G  16% /var
/dev/sda10      113G  105G  2.2G  99% /var/ftp
/dev/sda9        40G   30G  7.5G  81% /home/user/RPM
tmpfs           5.0G  645M  4.4G  13% /home/user/tmp-build
tmpfs           5.0G  545M  4.5G  11% /home/user/RPM/BUILD

Примечание: /dev, /run и /dev/shm созданы приложением udev.

Размеры и разделы: рабочая станция (один раздел + /boot/efi)

Filesystem      Size  Used Avail Use% Mounted on
udevfs          5.0M     0  5.0M   0% /dev 

runfs           1.8G  1.2M  1.8G   1% /run
/dev/sda4       110G   86G   19G  83% /
tmpfs           1.8G   21M  1.8G   2% /dev/shm
tmpfs           1.8G     0  1.8G   0% /sys/fs/cgroup
/dev/sda1       248M  119K  248M   1% /boot/efi
tmpfs           367M   24K  367M   1% /run/user/500

Ссылки

Благодарности

Денис Смирнов — автор начальной версии этой статьи на freesource.info.
Клочков Роман — масса ценных комментариев к начальной версии Дениса Смирнова.

Примечания