prepare removal что это

Установка нового диска HotSpare в RAID5.

Установка нового диска HotSpare в RAID5.

Сообщение ank0l0g » 25 мар 2011, 15:01

Имеется контроллер LSI MegaRAID 8408E. На нем поднят RAID5+ на 5 HDD + 1 HDD HotSpare.
В какойто момент из массива вывалился один винт и произошла его горячая замена.
Физически заменил вывалившийся винт на новый. Состояние у нового винта Unconfigure&Good. Как этот, новый, винт зделать HotSpare. В предложенных пунктах GUI интерфейса 4 пункта:
Replace Missing Physical Drive
Stop Location Physical Driva
Prepare For Removal
Undo Prepare For Removal

Пытаюсь через коммандную строку, тоже ничего не выходит.

Что предпринять, как новый винт сделать HotSpare

Re: Установка нового диска HotSpare в RAID5.

Сообщение Black-Dragon » 25 мар 2011, 17:47

А вы уверены, что ребилд имел место?
Смущает наличие опции «Replace Missing Physical Drive».

В любом случае, если есть бекап, то стоит попробовать именно этот вариант. Далее смотреть на новый вариант опций после применения означенной.

Всё IMHO, и если нет бекапа, то лучше дождаться других ответов.

Re: Установка нового диска HotSpare в RAID5.

Сообщение ank0l0g » 26 мар 2011, 15:35

Re: Установка нового диска HotSpare в RAID5.

Сообщение Black-Dragon » 27 мар 2011, 14:15

Не мучайте себя, сделайте бекап данных, потом «Replace Missing Physical Drive».

Скорее всего, произойдет новый ребилд на этот диск, и Hot Spare диск освободится и вновь станет HS.

Re: Установка нового диска HotSpare в RAID5.

Сообщение ank0l0g » 23 июл 2011, 15:00

Вернусь к своей давней проблеме которая так и не решена.
Бекапы давно сделаны.

Привожу кусок лога, смотреть снизу вверх:

ID = 2980
SEQUENCE NUMBER = 165677
TIME = 23-07-2011 09:05:51
LOCALIZED MESSAGE = Controller ID: 0 VD is now DEGRADED VD 0

ID = 2979
SEQUENCE NUMBER = 165676
TIME = 23-07-2011 09:05:51
LOCALIZED MESSAGE = Controller ID: 0 State change on VD: 0 Previous = Optimal Current = Degraded

ID = 2976
SEQUENCE NUMBER = 165673
TIME = 23-07-2011 09:00:50
LOCALIZED MESSAGE = Controller ID: 0 Time established since power on: Time 2011-07-23,09:00:53 58844Seconds

Источник

Восстанавливаем RAID 5, 1 или 0 при поломке одного или нескольких дисков

В нашем пошаговом руководстве, я расскажу о нескольких методах восстановления информации с программных RAID 5, 0 или 1, которые собраны под «Linux».

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Если один или несколько физических накопителей повреждены, то кажется что восстановить данные просто невозможно. На самом деле это не так, объем информации, который можно достать из массива, сильно зависит от типа RAID и количества сломанных носителей.

Программный RAID крайне ненадежная штука, отключите всего один накопитель и весь массив перестанет определяться системой. Массив с поломанным носителем, можно пересобрать при помощи специальных программ, в наших тестах я буду использовать Hetman RAID Recovery. После запуска, она автоматически определит тип контроллера, название программы или производителя материнской платы, на основе технологий которых был собран RAID. Потом утилита соберет его из оставшихся «живых» накопителей, просканирует и найдет всю оставшуюся информацию, которую можно будет сохранить в другое место.

Установочный файл программы есть только под ОС Windows. Чтобы запустить ее под Linux понадобиться, либо установить дополнительную систему на компьютер, либо воспользоваться виртуальной машиной под Windows. В нашем случае, я выбрал второй вариант.

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Восстанавливаем файлы с RAID-1

Тестовый массив первого типа состоит из двух одинаковых накопителей. Этот тип очень надежен сам по себе, так как может состоять из четного количества физических дисков, которые работают как «полное зеркало». Если поврежден только один носитель, то все устройство невозможно смонтировать в Linux.

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Запускаем программу, она нашла и пересобрала устройство, все параметры указаны верно.

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Так как, «живой» диск содержит полноценную копию всей информации, то запускаем быстрый анализ, отмечаем нужные нам файлы и каталоги, сохраняем на любой другой диск.

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Восстанавливаем данные с RAID 5

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Тип RAID-5 – это избыточный массив накопителей с чередованием, без определенного диска четности. Главная особенность этого типа, в том что массив гарантировано будет работать даже при поломке одного диска. Но, при попытке смонтировать его в Linux ничего не вышло. Чтобы исправить ситуацию, необходимо подключить чистый «винчестер» на место сломанного, или пересобрать с помощью ПО.

Тестовый RAID 5 состоит из 5 физических дисков, один из них гарантированно сломан. Добавляем их в виртуальную машину с Windows, запускаем Hetman RAID Recovery, массив обнаружен и все настройки и свойства указаны верно.

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Как и положено один накопитель пустой. Так как это RAID 5, то снова запускаем быстрый анализ, находим нужные данные с помощью функции превью и восстанавливаем их. Когда процесс сохранения закончится, все файлы будут находится в выбранном каталоге.

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Теперь рассмотрим вариант когда повреждены два физических носителя из пяти. Программа обнаружила RAID, и два «винчестера» пустые.

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Восстановить данные с такого массива, задача непростая, запускаем полное сканирование, в зависимости от размеров «винчестеров» оно может длиться вплоть до суток. В итоге, программа нашла нетронутые данные, но несколько файлов частично или полностью стерты, их не получиться восстановить.

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Если повреждены два или более физических носителя, RAID 5 становиться полностью неработоспособным, что сулит 100% потерю всех данных. Поэтому наш результат можно считать удовлетворительным.

Как восстановить данные RAID-0

Наш тестовый RAID 0 включает 5 жестких дисков, этот тип один из самых ненадежных. Фактически, это вообще не RAID, так как он не хранит избыточную информацию о хранящихся файлах. Если выйдет из строя хоть один «винчестер», то все устройство целиком нельзя монтировать в ОС. Все данные становятся недоступны.

Тип RAID-0 – это массив физических носителей с чередованием. Он показывает хорошую производительность благодаря высокой скорости чтения/записи, но отказ оборудования для него будет критическим. Посмотрим, сможем ли мы восстановить хоть часть потерянных данных.

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Добавляем диски в виртуальную машину и запускаем утилиту. Hetman Partition Recovery со скрежетом смогла правильно определить тип и свойства массива, один диск отображается пустым.

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Быстрое сканирование бессмысленно, сразу запускаем глубокий анализ. Все живые файлы удалось обнаружить и просмотреть превью, но также много поврежденных данных. Выбираем файлы с помощью превью и кликаем «Восстановить».

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Вывод

Как показали тесты, количество восстанавливаемой информации напрямую зависит от типа массива. Данные с RAID 5 или 1 можно восстановить практически в полном объеме, благодаря «зеркалам» или избыточности информации. Даже при поломке нескольких жестких дисков, шансы вернуть большую часть нужных файлов достаточно высока.

Выход из строя хоть одного носителя, для RAID 0 становиться критическим. В большинстве случаев вы сможете восстановить только малую часть хранящихся данных. Что касается программы, то она смогла в автоматическом режиме распознать подключенные диски и правильно определить тип массива, что дало возможность уже восстанавливать файлы.

Полную версию статьи со всеми дополнительными видео уроками смотрите в источнике.

Источник

Как правильно заменить диск в RAID5 на контроллере Supermicro SMC2108?

Есть RAID5 из 8 винтов, контроллер Supermicro SMC2108.
Один из них написал:
Firmware state: Unconfigured(bad)
и вывалился из рэйда. Есть диск под замену.

Можно ли достать диск на горячую и вставить новый?
Пойдет ли автоматом ребилд или надо будет пнуть?

Оценить 2 комментария

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Hot-Plug он поддерживает. Можете на горячую.

А насчет autorebuild, все зависит от настроек ( hwraid.le-vert.net/wiki/LSIMegaRAIDSAS )

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Такая же проблема приключилась на AOC-SAS2LP-H8iR 2108, BTR-0018L-0000-LSI. Один из восьми дисков в RAID5 показал Media Error Count: 1. Проблема не назрела, но решили превентивно заменить.
Тоже заходили в MegaRAID BIOS Configuration Utility через нажатие CTRL+M и там НЕТУ «Prepare to removal», как нет и «Assign Global Hot Spare». Есть только «Make offline” и «Locate”, но по индикации диск как моргал, так и продолжил моргать.
Просто извлекли сбойный HDD и вставили на его место новый. Естественно, утилитка показала старый как PD Missing, а новый как Unconfigured. Когда зашли на новый SAS-диск, то RAID-контроллер сам сказал, что Array0_Disk3 missed и предложил сделать REPLACE by new? Y/N?
Согласились, контроллер сделал Rebuild и всё заработало.

Источник

Восстановление аппаратного RAID с помощью утилиты MegaCLI для LSI

Процесс замены вышедшего из строя физического диска на сервере с аппаратным RAID контроллером

prepare removal что это. Смотреть фото prepare removal что это. Смотреть картинку prepare removal что это. Картинка про prepare removal что это. Фото prepare removal что это

Прежде всего определим тип RAID-контроллера.
В данном примере будет рассмотрен вариант с LSI, для других типов будут отдельные статьи, когда под рукой окажется свободный котроллер другой модели.

После определения типа контроллера приступим к установке утилиты для работы с ним.
(ПО обновляется, поэтому актуальную версию проверяйте на официальном сайте LSI.)

Проверяем состояние RAID

Выводим информацию о состоянии дисков:

Как видно из лога, то проблема с одним из дисков:

Также можно вывести полную информацию по дискам подключенным к контроллеру:

Заменяем проблемный диск

Если диск в состоянии Online (в нашем случае Failed), то переводим в состояние Offline.

Отметим диск, как извлеченный

Получаем информацию об извлеченном(-ых) диске(-ах):

Подсвечиваем диск, который требуется заменить:

Если возникла проблема с подсветкой, то используем лампочку активности в качестве индикации:

Удаляем диск из RAID

После этого выполняем процедуру физической замены диска(-ов).

В случае с новым диском, если он содержит метаданные от старого RAID массива, эти данные необходимо затереть.

Проверяем их наличие:

Если таковые имеются, то удаляем следующей их командой:
(к счастью у меня такого добра не обнаружилось)

Выполняем замену (нам потребуются значения параметров Array и Row из предыдущего пункта)

И запускаем Rebuild нового диска:

Если получаем эту ошибку при выполнении команды, то Rebuild запустился автоматически.

Проверяем статус Rebuild и оставшееся время до окончания:

Ну и не забываем отключить индикацию диска:

Бонусы

Отключение звукового оповещения до перезагрузки

Включение и выключение звукового оповещения навсегда:

Проверка приоритета ребилда:

Изменяем приоритет ребилда в % соотношении:

Источник

Замена диска в рейде с помощью megacli на контроллере PERC H700

Довелось понастраивать сервер DELL T610 с рейд контроллером PERC H700 на борту. Все как обычно, кроме одного нюанса. Решил проверить, как оперативно выполнить замену сбойного диска. На сервер была установлена стандартная утилита mеgacli для управления всеми контроллерами с драйвером MegaRAID, к коим относится и упомянутый выше. Такая тривиальная задача оказалась не совсем тривиальной и пришлось поковыряться с документацией.

Очень мне понравилось емкое описание процесса у одного админа: «Но замена дисков через такую утилиту — целый hardcore, только для настоящих Tru-админов )).» http://skeletor.org.ua/?p=4093. И я с ним полностью согласен. В принципе, весь процесс у него описан, но я все равно решил поделиться кое-какими дополнениями и своим опытом. Эта megacli такая неочевидная штука, с документацией страниц на 60, что я даже с готовыми примерами соображал некоторое время, какие же значения адаптера, массива, диска, какого-то row, который я никак не мог понять, что это такое, нужно подставить.

У меня был сервер на Debian 8 с 3 рейдами, raid1, raid1, raid10. Я вытаскивал диск из raid10 и заменял его новым.

Сначала проверим состояние наших массивов:

Чувствуете хардкор? Еще нет? Тогда поехали дальше. Обращаю внимание, что последний массив помечен как Degraded, из него вынут диск. Это raid10. К сожалению, я так и не понял, как через megacli посмотреть тип массива. Где тут указано, что в массиве raid10, я не понял. Теперь посмотрим на список дисков:

Нас интересует последний диск. В Firmware state указано Unconfigured(good). Это я уже воткнул новый пустой диск, вместо старого. Если с диском будут какие-то проблемы, то его состояние будет Failed. Дальше вам важно запомнить следующие значения этого диска:

Я немного забежал вперед и поторопился с заменой диска. Я вытащил диск, загрузил сервер, убедился, что он работает без диска и что массив понимает, что он находится в состоянии Degraded. После этого мне нужно было бы выполнить следующие команды.

Отключить сбойный диск:

Пометить его как отключенный:

Я это не сделал, а просто выключил сервер и установил новый диск. После включения убедился, что новый диск присутствует в списке дисков и его статус Unconfigured(good). После этого я указываю контроллеру, что диск заменен:

Над этой командой я долго ломал голову. Расскажу по порядку, что тут к чему.

Array3. Откуда взялась цифра 3? Вот описание:

Выполняем команду просмотра конфигурации:

Получается такая простыня, которую очень трудно читать и анализировать. Грепаю вывод, чтобы разобраться, что тут вообще выходит:

Вижу, что у меня 4 конфигурации, хотя массива только 3. Рассуждаю логически. Так как последний массив это RAID10, то наверно он отображается как 2 RAID1. Проверил внимательно вывод конфигурации, убедился, что так оно и есть. Первые 2 рейда обозначены как DISK GROUP: 0 и 1, а raid10 как SPANNED DISK GROUP: 0, в котором соответственно SPAN: 0 и 1. Один из SPAN имеет статус Degraded и параметр Span Reference: 0x03. Судя по документации, мне надо взять это число 0x03 и отбросить 0x0. Получается цифра 3 и параметр Array3 в команде.

Дальше следует параметр row. Я очень старался понять что это такое 🙂 Описание:

«The number N of the row parameter is the Physical Disk in that span or array starting with zero (it can be but is not always the physical disk’s slot!)».

Только сейчас, когда пишу статью, легко понимаю, откуда берется эта цифра. А когда тестировал сильно тупил и никак не мог сообразить. Сильно мешает очень объемный вывод команд. Я устал глазами бегать по простыням. В общем, это номер диска в сбойном SPAN. В моем случае это второй диск в SPAN, то есть цифра 1, так как отсчет идет с нуля. Таким образом получился параметр row1. Еще раз напоминаю команду замены сбойного диска:

Пока мы только указали, что заменили диск. Теперь нам надо запустить его ребил:

Статус ребилда смотрим командой:

После окончания ребилда снова смотрим вывод информации по массивам и дискам. Массив должен стать Optimal, а диск Online, Spun Up. На этом забываем про megacli как страшный сон и вспоминаем про приятный и удобный mdadm.

Я всегда тестирую выход из строя жесткого диска и его замену. Делаю на всех массивах, железных и софтовых. На железных, чтобы вот таких сюрпризов не было, а была рабочая инструкция. А в софтовых, в основном, чтобы убедиться, что загрузчик стоит на всех нужных дисках и система поднимется в случае чего. По надежности и замене дисков у меня к mdadm вопросов нет. Там все понятно и просто.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *