Принципы и структура хранения данных на жестком диске
Несомненным фактом является то, что большинство цифровой информации хранится на жестких дисках компьютеров. Данное устройство само по себе является компьютером в миниатюре, поскольку содержит собственный процессор-контроллер, память, схемы управления механикой и ввода-вывода. Как и вся вычислительная техника, накопители на жестких магнитных дисках прошли большой путь от громоздких шумящих агрегатов, до миниатюрных устройств. Вместе с тем, возросло число информации, размещающихся на носителях, или иначе их ёмкость. В наиболее массовых потребительских дисках она достигла одного терабайта.
Существует большое число параметров, по которому различаются типы жестких дисков. Наиболее очевидный из них – размер: 3,5 дюймовые диски применяются в большинстве стационарных компьютеров и серверов, в ноутбуках устанавливаются диски размером 2,5 дюйма. Возможности применения дисков в той или иной конфигурации зависит от типа используемой в них шины передачи данных. На смену параллельному интерфейсу PATA/IDE приходит последовательный SATA. В серверных машинах наибольшее распространение имеют диски с шиной SCSI. Помимо очевидного параметра – ёмкости диска, существуют еще несколько важных характеристик накопителей. На скорость работы диска влияют скорость вращения диска и объем буфера памяти диска.
Структура хранения информации на жестком диске
Наименьшая единица информации, которой оперирует система управления жесткого диска, носит название сектора. В подавляющем числе современных носителей сектор равен 512 байтам. Используемая в настоящий момент система адресации секторов называется LBA (Logical block addressing). В то же время, для дисков небольшой ёмкости или с целью обратной совместимости со старым оборудованием, может быть использована система адресации CHS. Аббревиатура CHS расшифровывается как Cylinder, Head, Sector – цилиндр, головка, сектор. Из названия понятен смысл этого типа адресации, как привязанной к частям устройства жесткого диска. Преимущество LBA над CHS в том, что вторая имеет ограничение на максимальное число адресуемых секторов, в количественном представлении равное 8,4 гигабайта, LBA данного ограничения лишена.
Первый сектор жесткого диска (а точнее нулевой) носит название MBR (Master Boot Record) или главной загрузочной записи. В начале этого сектора находится код, куда передает управление базовая система ввода вывода компьютера при его загрузке. В дальнейшем этот код передает управление загрузчику операционной системы. Так же в 0 секторе находится таблица разделов жесткого диска. Раздел представляет собой определенный диапазон секторов. В таблицу заносится запись о разделе, с номером его начального сектора и размером. Всего в таблице разделов может находиться четыре таких записи.
Раздел, запись о котором находится в таблице разделов нулевого сектора, носит названия первичного (primary). Из-за упомянутых ограничений таких разделов на одном диске может быть максимум четыре. Некоторые операционные системы устанавливаются только на первичные тома. При необходимости использования большего числа разделов в таблицу заносится запись о расширенном (extended) разделе. Данный тип раздела представляет собой контейнер, в котором создаются логические (logical) разделы. Логических томов может быть неограниченное количество, однако в ОС семейства Windows число одновременно подключенных томов ограничено количеством букв латинского алфавита. Эти три типа разделов имеют наиболее широкую поддержку среди подавляющего числа операционных систем и наибольшее распространение. Фактически в домашних условиях, либо масштабе клиентских машин организаций встречаются именно эти типы разделов. Однако, это не значит, что типы разделов ограничиваются этими тремя видами. Существует большое число специализированных разделов, но и они используют первичные тома в качестве контейнеров.
Раздел это всего лишь размеченное пространство на диске, чтобы сохранить в нем какую либо информацию для организации структуры хранения данных должна быть создана файловая система. Данный процесс носит названия форматирования раздела. Типов файловых систем существует великое множество, в ОС семейства Windows используются FAT/NTFS, в операционных системах на ядре Линукс применяются Ext2/3FS, ReiserFS, Swap. Существует множество утилит для кроссплатформенного доступа к различным ФС из неподдерживающих их изначально операционных систем. Partition Manager 8.5 позволяет просматривать содержимое и копировать данные из этих файловых систем.
Некоторые файловые системы, например FAT/NTFS оперируют более крупными структурами данных на жестком диске, носящими название кластеров. Кластер может включать произвольное число секторов. Манипулирование размером кластера приносит дополнительный выигрыш к производительности файловой системы или расходованию свободного пространства.
Оптимизация хранения информации с помощью Partition Manager 8.5
На первый взгляд влияние того, как расположены разделы на жестком диске, незначительно. Действительно, большинство пользователей соглашаются с конфигурацией по умолчанию, которую предлагает поставщик компьютерного оборудования. То же самое можно сказать про процесс установки новой операционной системы, или использовании внешнего накопителя. В этом разделе приведены несколько примеров того, как можно улучшить существующую конфигурацию разделов, что в итоге даст увеличение полезного эффекта от работы компьютера.
Выбор наилучшей схемы расположения информации
Самый простой вариант разметки диска на разделы, с которым сталкивается практически каждый пользователь компьютера – отсутствие по сути этой разметки, а точнее использование одного единственного раздела на всем диске. Сомнительное преимущество данной схемы заключается в её простоте и относительном удобстве для пользователя. Зачастую пользователь вовсе не подозревает о каких либо разделах и видит только букву в папке Мой компьютер. В течение времени информация неизбежно скапливается на таком разделе и смешивается в одну большую кучу: документы, музыка, программы, файлы операционной системы, различный мусор и временные файлы. Вместе с тем растет фрагментация файловой системы, по мере заполнения свободного пространства на разделе. Чем все это грозит пользователю? В самом простом случае многочасовым процессом дефрагментации раздела с невозможностью полноценно работать на компьютере. Наихудший из возможных вариантов – потеря всей информации на разделе, в результате сбоя аппаратной части компьютера или ошибок в программном обеспечении. Ведь файлы операционной системы и все другие данные находятся вперемешку, а для переустановки ОС раздел необходимо заново отформатировать.
Рациональным решением всех вышеперечисленных проблем является создание нескольких разделов на жестком диске. Допустим, первый раздел будет использоваться для размещения операционной системы и наиболее востребованных программ, вроде офисного пакета. На втором разделе будут храниться важные документы и рабочая информация. Третий раздел будет использоваться для размещения музыки, видео, игр и хранения временных файлов. Четвертый станет выполнять функцию архивного хранилища, где могут находиться архивы важных документов и данных. В этом случае при переустановке ОС не возникнет никаких проблем с форматированием системного первого раздела, все прочие данные на других разделах останутся неприкосновенными. К тому же разделы небольшого размера быстрее обслуживаются при дефрагментации.
Создание такой конфигурации в целом не сложная задача. При установке операционной системы обычно предоставляется возможность создать необходимое число разделов, однако в большинстве программ установщиков данный процесс не слишком очевиден неискушенному пользователю. В любом случае, можно создать один раздел на весь диск, поставить туда операционную систему, а затем уже изменить конфигурацию разделов. Программа Paragon Partition Manager 8.5 позволяет, не перезагружая компьютер, уменьшить размер системного раздела и создать необходимое число других томов на освободившемся пространстве. Фактически, данная операция единственный выход пользователей компьютеров с предустановленной операционной системой.
Выбор файловой системы и её параметров
Следующий, скрытый в большинстве случаев, фактор обеспечения оптимальной работы компьютера – тип используемой файловой системы и её особенности. Эти параметры так же определяются при установке операционной системы. Каждая ОС поддерживает определенный набор файловых систем, среди которых одна приходится наиболее подходящей для её работы. Файловые системы обладают преимуществами и недостатками. Например, семейство FAT16/32 поддерживаются большинством существующих ОС вследствие своей простоты организации и долгой истории существования. Поэтому данный тип файловых систем обладает наибольшей переносимостью между различными компьютерами и, например, используется во флеш-накопителях и дискетах. Однако у этих файловых систем существуют серьезные недостатки, один из них – ограничение на максимальный размер файла в 4 гигабайта, другой – большая подверженность фрагментации, третий – слабая защищенность данных.
Операционные системы Microsoft Windows (семейство NT) повсеместно поддерживают тип файловой системы NTFS. Версии, предшествующие выпуску Windows Vista могли быть установлены по выбору, как на FAT, так и на NTFS. Новая операционная система устанавливается только на тома NTFS. Файловая система NTFS значительно совершенней своих предшественниц из семейства FAT, но обладает меньшей поддержкой со стороны прочих не-Windows операционных систем. Так для работы с ней требуются отдельные драйверы и утилиты.
Меньшей кроссплатформенностью обладают файловые системы, использующиеся в операционных системах Unix, на ядре Linux и Mac OS X. Сами по себе файловые системы, использующиеся в этих ОС, обладают многими плюсами и превосходно поддерживаются в родной среде. Для работы с ними в неродном окружении требуются сторонние программы и драйверы. Программа Partition Manager 8.5 поддерживает форматирование разделов в FAT/NTFS и Ext2/3FS.
Важный параметр файловых систем FAT и NTFS – размер кластера. Эффект от величины данного параметра проявляется при большом количестве файлов на разделе. Как уже было сказано – кластер минимальный объем данных, которым оперирует операционная система. Один файл может занимать один кластер или несколько. Допустим, размер кластера равен четырем килобайтам, а размер файла занимает несколько байт. В данном случае операционная система выделит один кластер под файл, при этом три с лишним килобайта будут расходоваться неэффективно. При большом числе мелких файлов общее число потребленного неэффективно пространства будет значительной величиной. По этой причине, для разделов со значительным количеством маленьких файлов предпочтительно выбирать небольшой размер кластера, но необходимо соблюсти баланс между размером раздела и размером кластера. Маленький размер кластера и большой объем раздела может вызвать значительное падение производительности компьютера, в связи с возросшей нагрузкой на механизм работы файловой системы и необходимостью обработки громадного числа служебной информации. В то же время, если на разделе предполагается хранить файлы большого размера (музыка, видео), форматирование файловой системы с большим размером кластера в дальнейшем обеспечит выигрыш в быстродействии компьютера и доступе к данным.