 |
|
|
|
| Автор |
Сообщение |
barcod Знатный посетитель (>20)

Зарегистрирован: 06.12.2005 Сообщения: 50
|
Добавлено: 24 Фев 2006, 17:17 Заголовок сообщения: RAID-массивы |
|
|
Материал по RAID-массивам из статьи: Backup backup’у рознь!
Автор: Валерий Аксак
RAID-массивы
Технология RAID (Redundant Array of Independent Disks — избыточный массив независимых дисков) была разработана еще в 1987 году, но, несмотря на столь солидный, с точки зрения информационных технологий, возраст, она и сегодня пользуется большой популярностью. Создание RAID-массива максимально приближено к организации обычной дисковой подсистемы персонального компьютера. В основе такого массива могут лежать стандартные накопители на жестких дисках, вроде тех, что находятся в вашем системном блоке, что делает этот метод создания системы резервного копирования максимально доступным широкому кругу пользователей. Жесткие диски (минимум два HDD) с помощью RAID-контроллера (он может быть интегрирован в материнскую плату или устанавливаться отдельно в один из слотов расширения) (рис. 1, 2, 3) объединяются в определенную систему — массив (об их разновидностях мы поговорим далее). После чего они функционируют в виде одного виртуального целого диска, с которым можно работать практически так же, как с обычным HDD.
RAID-массивы различаются между собой уровнями организации, от RAID 0 до RAID 5 (существуют также уровни 6 и 7, но по различным причинам они используются очень редко, поэтому в данный обзор их описание не вошло).
 
RAID 0, по большому счету, к резервному копированию никакого отношения не имеет. Основная цель использования подобных систем — ускорение доступа к данным, что особенно актуально при работе с графикой и мультимедийными приложениями. Принцип RAID 0 функционирования состоит в равномерном распределении записываемых данных на два или более физических носителя (чем их больше, тем лучше) в виде небольших порций (блоков). Например, если вы записываете файл любого (предположительно довольно большого) объема (к примеру, 200 гигабайт), то его обработка на RAID-массиве нулевого уровня может происходить таким образом: разбиваемый на равные фрагменты файл беспрерывным потоком одновременно записывается на все доступные в массиве носители одинаковыми порциями. При этом на каждый физический HDD попадает четко определенный его логическим расположением в системе кусочек информации, согласно своему порядковому номеру. Когда же производится вызов записанного таким образом файла, он считывается практически одновременно со всех дисков, что приводит к солидному увеличению скорости доступа к данным. Но в то же время такой способ организации массива теоретически более всего подвержен опасности потери данных, так как с разорванным звеном (выход из строя хотя бы одного из накопителей) цепь работать уже не будет. А значит, при использовании RAID 0 нужно позаботиться о подключении к компьютеру или сети какой-то внешней системы резервного копирования. Кроме этого, следует учесть, что во избежание потерь физического места на жестких дисках следует формировать RAID 0 из устройств одинакового объема, так как форматирование всего массива производится по пределу вместительности наименее емкого HDD в массиве.
RAID 1 — практически полная противоположность RAID 0. Он состоит из парного количества жестких дисков и работает по методу зеркалирования, когда одни и те же данные записываются сразу на пару HDD (второй винчестер в паре формально считается запасным), создавая при этом две копии. То есть содержимое одного винчестера как бы отражается в другом — отсюда и термин mirroring (зеркалирование). Основным преимуществом подобной системы является повышенная отказоустойчивость. Поломка одного HDD не является фатальной для всей системы — контроллер просто полностью переключается на запасной носитель и, как ни в чем не бывало, продолжает считывать данные. Но в то же время у RAID 1 имеется один и, пожалуй, единственный серьезный недостаток — низкий коэффициент использования пространства общей емкости накопителей, который составляет 50%, и, как следствие, налицо высокая себестоимость хранения удельной единицы информации.
Следует подчеркнуть, что системы RAID 1 могут работать параллельно с RAID 0, обеспечивая совместными усилиями и высокую скорость, и максимальную надежность файлооборота (так называемые системы RAID 0+1). К сожалению, о стоимости такого ансамбля справедливо будет сказать только одно — дорого.
RAID 2, RAID 3 и RAID 4 являются по сути разновидностью одной и той же системы. В их основе лежит принцип использования дополнительного физического диска для избыточного хранения, на который записываются контрольные суммы блоков данных, размещаемых на основных HDD равномерными порциями, аналогично RAID 0. В случае сбоя одного из активных носителей в цепочке информацию на испорченном устройстве можно полностью восстановить через контрольные суммы на избыточном диске. Если же выйдет из строя сам избыточный носитель, то считывание информации будет все также доступно (для этого контрольные суммы не нужны, что дает возможность считывания данных на довольно высоких скоростях, так как избыточный носитель не задействуется), а вот за надежность ее сохранности поручиться уже нельзя. Самым распространенным типом массивов из этой троицы является RAID 3. RAID 2 менее популярен, так как применение специфического кода Хемминга требует несколько избыточных носителей (минимум 2), что приводит, в принципе, к совершенно неоправданному подорожанию всей системы. RAID 4 отличается от RAID 3 только большим размером используемых блоков. Для всех трех систем требуется как минимум 3 HDD.
RAID 5 является, пожалуй, самым удачным RAID-решением из всех существующих. Работая по системе блоков и контрольных сумм, такой массив не нуждается в дополнительном избыточном диске, располагая файлы с контрольными суммами на те же физических дисках, что и сами блоки. Например, на диске № 2 хранятся контрольные суммы блоков, размещенных на дисках № 1 и № 3, на диске № 1 — контрольные суммы блоков с дисков № n (где n — последний физический диск в цепочке) и № 2, и т. д. В случае поломки одного из HDD восстановить утерянные данные можно с помощью соседних носителей. RAID 5 хорошо подходит для организации web-серверов и тому подобных баз массового хранения данных, так как обладает хорошей скоростью оборота информации, при этом практически не имея избыточного пространства. Для формирования RAID 5 нужно подключить как минимум 3 физических диска.
Все описанные RAID-системы могут быть как внутренними, так и внешними, оформленными в виде независимого файл-сервера. В плане обслуживания внешние блоки более удобны и практичны, но в то же время они обладают сравнительно высокой стоимостью.
Для полноты картины упомянем еще такое понятие, как программный RAID — система, эмулирующая RAID-массив при использовании обычных IDE/SCSI-контроллеров. Толку от подобных изысков немного, ведь в любом случае все усилия по обработке данных ложатся на центральный процессор, а поэтому ни о каком ускорении файлооборота не может быть и речи. Необходимые условия для организации программных RAID-систем есть, к примеру, в Windows NT 4.0 Server.
Источник: http://www.mycomp.com.ua/ |
|
| Вернуться к началу |
|
 |
Mutabor Модератор
Зарегистрирован: 10.09.2006 Сообщения: 60 Откуда: 127.0.0.1
|
Добавлено: 04 Окт 2006, 22:27 Заголовок сообщения: |
|
|
RAID-массивы начального уровня
Существует несколько различных способов по увеличению производительности компьютера. Можно, например, "разогнать" центральный процессор или видеокарту. А можно построить систему на базе RAID-массива.
Что нужно для построения RAID-массива? Прежде всего, RAID-контроллер и, как минимум, два жестких диска (в зависимости от уровня — например, для массива RAID 5 требуется не менее трех HDD).
До недавнего времени RAID-технологии были прерогативой серверного сегмента рынка. Но ситуация начала потихоньку меняться после того как производители стали интегрировать RAID-контроллеры на несерверные материнские платы. А ведь и правда — почему бы не использовать то, что достается практически даром.
И вот пользователь уже практически созрел, уже почти решился на то, чтобы установить-таки на своем родном ПК этот манящий "шаровой" RAID. И тут же натыкается на проблему выбора. При малых затратах, то есть при использовании двух жестких дисков, нужно выбирать между производительностью и надежностью хранения информации — использовать RAID 0 или RAID 1. А если пользователь хочет получить и скорость и надежность, придется раскошеливаться на четыре накопителя. Мало кто согласится на такие расходы для домашней системы, да и не каждый корпус сможет разместить четыре винчестера.
Эту проблему попыталась решить компания Intel в своих чипсетах нового поколения — i915 и i925. В южный мост ICH6R встроена уникальная технология Intel Matrix Storage Technology, которая позволяет на базе двух жестких дисков построить два разных RAID-массива ("нулевого" и "первого" уровней).
Впрочем, не будем слишком углубляться в технологии. Начнем лучше с азов — проведем небольшой ликбез по RAID.
Что такое RAID?
Сразу стоит заметить, что RAID это не средство от насекомых (как кто-то мог подумать), которое "убивает тараканов насмерть". На самом деле эта аббревиатура расшифровывается как Redundant Array of Independent Disks — избыточный массив независимых дисков. Изначально RAID расшифровывался как Redundant Array of Inexpensive Disks — избыточный массив недорогих дисков. Под недорогими подразумевались диски, предназначенные для использования в ПК,— в противовес дорогим дискам для мэйнфреймов. Но так как в RAID-массивах стали использовать SCSI-винчестеры, которые были существенно дороже применяемых в большинстве компьютеров дисков IDE, слово "недорогой" было заменено на "независимый".
Принцип функционирования RAID-системы заключается в следующем: из набора дисковых накопителей создается массив, который управляется специальным контроллером и определяется компьютером как единый логический диск большой емкости. За счет параллельного выполнения операций ввода-вывода обеспечивается высокое быстродействие системы, а повышенная надежность хранения информации достигается дублированием данных или вычислением контрольных сумм. Следует отметить, что применение RAID-массивов защищает от потерь данных только в случае физического отказа жестких дисков.
Различают несколько основных уровней RAID-массивов: RAID 0, 1, 2, 3, 4, 5, 6, 7. Также существуют комбинированные уровни, такие как RAID 10, 0+1, 30, 50, 53 и т.п. Рассмотрим вкратце принципы функционирования, достоинства и недостатки основных уровней.
RAID 0
Дисковый массив без отказоустойчивости (Striped Disk Array without Fault Tolerance)
Дисковый массив без избыточного хранения данных. Информация разбивается на блоки, которые одновременно записываются на отдельные диски, что обеспечивает повышение производительности. Такой способ хранения информации ненадежен, поскольку поломка одного диска приводит к потере всей информации, поэтому уровнем RAID как таковым не является.
RAID 0 – дешевый и производительный, но ненадежный
За счет возможности одновременного ввода/вывода с нескольких дисков массива RAID 0 обеспечивает максимальную скорость передачи данных и максимальную эффективность использования дискового пространства, так как не требуется места для хранения контрольных сумм. Реализация этого уровня очень проста. RAID 0, как правило, применяется в тех областях, где требуется быстрая передача большого объема данных. Для реализации массива требуется не меньше двух винчестеров.
Преимущества:
наивысшая производительность в приложениях, требующих интенсивной обработки запросов ввода/вывода и данных большого объема;
простота реализации;
низкая стоимость;
максимальная эффективность использования дискового пространства — 100%.
Недостатки:
не является "настоящим" RAID`ом, поскольку не поддерживает отказоустойчивость;
отказ одного диска влечет за собой потерю всех данных массива.
RAID 1
Дисковый массив с зеркалированием (Mirroring & Duplexing)
Дисковый массив с дублированием информации (зеркалированием данных). В простейшем случае два накопителя содержат одинаковую информацию и являются одним логическим диском. При выходе из строя одного диска его функции выполняет другой. Для реализации массива требуется не меньше двух винчестеров.
RAID 1 – простейший отказоустойчивый массив
Преимущества:
простота реализации;
простота восстановления массива в случае отказа (копирование).
Недостатки:высокая стоимость — 100-процентная избыточность;
невысокая скорость передачи данных.
RAID 2
Отказоустойчивый дисковый массив с использованием кода Хемминга (Hamming Code ECC)
Схема резервирования данных с использованием кода Хэмминга (Hamming code) для коррекции ошибок. Поток данных разбивается на слова — причем размер слова соответствует количеству дисков для записи данных. Для каждого слова вычисляется код коррекции ошибок, который записывается на диски, выделенные для хранения контрольной информации. Их число равно количеству бит в слове контрольной суммы.
RAID 2 не получил коммерческого применения
Если слово состоит из четырех бит, то под контрольную информацию отводится три диска. RAID 2 — один из немногих уровней, позволяющих обнаруживать двойные ошибки и исправлять "на лету" одиночные. При этом он является самым избыточным среди всех уровней с контролем четности. Эта схема хранения данных не получила коммерческого применения, поскольку плохо справляется с большим количеством запросов.
Преимущества:
достаточно простая реализация;
коррекция ошибок "на лету";
очень высокая скорость передачи данных;
при увеличении количества дисков накладные расходы уменьшаются.
Недостатки:
низкая скорость обработки запросов;
высокая стоимость;
большая избыточность.
RAID 3
Отказоустойчивый дисковый массив с параллельной передачей данных и четностью (Parallel Transfer Disks with Parity)
Отказоустойчивый массив с параллельным вводом/выводом данных и диском контроля четности. Поток данных разбивается на порции на уровне байт (хотя возможно и на уровне бит) и записывается одновременно на все диски массива, кроме одного. Один диск предназначен для хранения контрольных сумм, вычисляемых при записи данных. Поломка любого из дисков массива не приведет к потере информации.
В RAID 3 информация разбивается на порции одинакового размера
Этот уровень имеет намного меньшую избыточность, чем RAID 2. Во втором рэйде большинство дисков, хранящих контрольную информацию, нужны для определения неисправного разряда. Как правило, RAID-контроллеры могут получить данные об ошибке с помощью механизмов отслеживания случайных сбоев. За счет разбиения данных на порции RAID 3 имеет высокую производительность. Поскольку при каждой операции ввода/вывода производится обращение практически ко всем дискам массива, то одновременная обработка нескольких запросов невозможна.
Этот уровень подходит для приложений с файлами большого объема и малой частотой обращений (в основном это сфера мультимедиа). Использование только одного диска для хранения контрольной информации объясняет тот факт, что коэффициент использования дискового пространства достаточно высок (как следствие этого — относительно низкая стоимость). Для реализации массива требуется не меньше трех винчестеров.
Преимущества:
отказ диска мало влияет на скорость работы массива;
высокая скорость передачи данных;
высокий коэффициент использования дискового пространства.
Недостатки:
сложность реализации;
низкая производительность при большой интенсивности запросов данных небольшого объема.
RAID 4
Отказоустойчивый массив независимых дисков с общим диском четности (Independent Data Disks with Shared Parity Disk)
Этот массив очень похож на уровень RAID 3. Поток данных разделяется не на уровне байтов, а на уровне блоков информации, каждый из которых записывается на отдельный диск. После записи группы блоков вычисляется контрольная сумма, которая записывается на выделенный для этого диск.
В RAID 4 поток данных разделяется на блоки
У RAID 4 возможно одновременное выполнение нескольких операций чтения. Этот массив повышает производительность передачи файлов малого объема (за счет распараллеливания операции считывания). Но поскольку при записи должна изменяться контрольная сумма на выделенном диске, одновременное выполнение операций невозможно (налицо асимметричность операций ввода и вывода). Этот уровень имеет почти все недостатки RAID 3 и не обеспечивает преимущества в скорости при передаче данных большого объема. Схема хранения разрабатывалась для приложений, в которых данные изначально разбиты на небольшие блоки, поэтому нет необходимости разбивать их дополнительно. Эта схема хранения данных имеет невысокую стоимость, но ее реализация достаточно сложна, как и восстановление данных при сбое.
Преимущества:
высокая скорость передачи данных;
отказ диска мало влияет на скорость работы массива;
высокий коэффициент использования дискового пространства.
Недостатки:
достаточно сложная реализация;
очень низкая производительность при записи данных;
сложное восстановление данных.
RAID 5
Отказоустойчивый массив независимых дисков с распределенной четностью (Independent Data Disks with Distributed Parity Blocks)
Самый распространенный уровень. Блоки данных и контрольные суммы циклически записываются на все диски массива, отсутствует выделенный диск для хранения информации о четности, нет асимметричности конфигурации дисков.
В случае RAID 5 все диски массива имеют одинаковый размер — но один из них невидим для операционной системы. Например, если массив состоит из пяти дисков емкостью 10 Гб каждый, то фактически размер массива будет равен 40 Гб — 10 Гб отводится на контрольные суммы. В общем случае полезная емкость массива из N дисков равна суммарной емкости N–1 диска.
В RAID 5 отсутствует выделенный диск для хранения информации о четности
Самый большой недостаток уровней RAID от 2-го до 4-го — это наличие отдельного диска (или дисков), хранящего информацию о четности. Скорость выполнения операций считывания достаточно высока, так как не требует обращения к этому диску. Но при каждой операции записи на нем изменяется информация, поэтому схемы RAID 2-4 не позволяют проводить параллельные операции записи. RAID 5 не имеет этого недостатка, так как контрольные суммы записываются на все диски массива, что делает возможным выполнение нескольких операций чтения или записи одновременно. RAID 5 имеет достаточно высокую скорость записи/чтения и малую избыточность.
Преимущества:
высокая скорость записи данных;
достаточно высокая скорость чтения данных;
высокая производительность при большой интенсивности запросов чтения/записи данных;
высокий коэффициент использования дискового пространства.
Недостатки:
низкая скорость чтения/записи данных малого объема при единичных запросах;
достаточно сложная реализация;
сложное восстановление данных.
RAID 6
Отказоустойчивый массив независимых дисков с двумя независимыми распределенными схемами четности (Independent Data Disks with Two Independent Distributed Parity Schemes)
RAID 6 — это отказоустойчивый массив независимых дисков с распределением контрольных сумм, вычисленных двумя независимыми способами. Этот уровень во многом схож с RAID 5. Только в нем используется не одна, а две независимые схемы контроля четности, что позволяет сохранять работоспособность системы при одновременном выходе из строя двух накопителей. Для вычисления контрольных сумм в RAID 6 используется алгоритм, построенный на основе кода Рида-Соломона (Reed-Solomon).
RAID 6 использует две независимые схемы контроля четности
Этот уровень имеет очень высокую отказоустойчивость, большую скорость считывания (данные хранятся блоками, нет выделенных дисков для хранения контрольных сумм). В то же время из-за большого объема контрольной информации RAID 6 имеет низкую скорость записи. Он очень сложен в реализации, характеризуется низким коэффициентом использования дискового пространства: для массива из пяти дисков он составляет всего 60%, но с ростом числа дисков ситуация исправляется.
RAID 6 по многим характеристикам проигрывает другим уровням, поэтому на сегодня не получил коммерческого применения.
Преимущества:
высокая отказоустойчивость;
достаточно высокая скорость обработки запросов;
Недостатки:
низкая скорость чтения/записи данных малого объема при единичных запросах;
очень сложная реализация;
сложное восстановление данных;
низкая скорость записи данных.
RAID 7
Отказоустойчивый массив, оптимизированный для повышения производительности (Optimized Asynchrony for High I/O Rates as well as High Data Transfer Rates)
В отличие от других уровней, RAID 7 не является открытым индустриальным стандартом — это зарегистрированная торговая марка компании Storage Computer Corporation. Массив основывается на концепциях, использованных в третьем и четвертом уровнях. Добавилась возможность кэширования данных. В состав RAID 7 входит контроллер со встроенным микропроцессором под управлением операционной системы реального времени (real-time OS). Она позволяет обрабатывать все запросы на передачу данных асинхронно и независимо.
RAID 7 – зарегистрированная торговая марка компании Storage Computer Corporation
Блок вычисления контрольных сумм интегрирован с блоком буферизации; для хранения информации о четности используется отдельный диск, который может быть размещен на любом канале. RAID 7 имеет высокую скорость передачи данных и обработки запросов, хорошую масштабируемость. Самым большим недостатком этого уровня является стоимость его реализации.
Преимущества:
очень высокая скорость передачи данных и высокая скорость обработки запросов (в 1,5…6 раз выше других стандартных уровней RAID);
хорошая масштабируемость;
значительно возросшая (благодаря наличию кэша) скорость чтения данных небольшого объема;
отсутствие необходимости в дополнительной передаче данных для вычисления четности.
Недостатки:
собственность одной компании;
сложность реализации;
очень высокая стоимость на единицу объема;
не может обслуживаться пользователем;
необходимость использования блока бесперебойного питания для предотвращения потери данных из кэш-памяти;
короткий гарантийный срок. _________________ Если рассмотреть проблему достаточно внимательно, то вы увидите себя как часть этой проблемы. |
|
| Вернуться к началу |
|
 |
|
|
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах Вы не можете добавлять вложения в этом форуме Вы можете просматривать вложения в этом форуме
|
|