Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » В помощь системному администратору » Программы для мониторинга RAID-массивов.

Модерирует : lynx, Crash_Master, dg, emx, ShriEkeR

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3

Открыть новую тему     Написать ответ в эту тему

DeMaC

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее...

Всего записей: 18 | Зарегистр. 02-04-2013 | Отправлено: 11:23 03-04-2013
Diabolik



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DeMaC
Ну разумеется я могу зайти внутрь и посмотреть состав RAID'a. Но никакой опции данных о состоянии целостности диска я там не нашел. Во-вторых, что значит использовать? Т.е. допустим у меня посыпался один из дисков. Мне что нужно каждый день/час заходить в состав каждого RAID'а на 3 серваках и смотреть не поползло ли там чего? Даже если данная ситуация будет расписана где-то в логах, по любому нужна какая-то система оповещения (ну SMS на телефон это было бы идеально), хотя бы окно с предупреждением на рабочем столе. А ведь RAID10 может и по диагонали развалиться (был такой случай), а там огромная база 1C за много лет, поэтому мне это так критично.
 
Добавлено:
Нашел систему оповещения на почтовый ящик (не понятно только что он конкретно оповещать собирается). Ну хоть что-то...

Всего записей: 4819 | Зарегистр. 02-10-2004 | Отправлено: 13:49 03-04-2013 | Исправлено: Diabolik, 14:43 03-04-2013
DeMaC

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если я не ошибаюсь, то оповещение должно быть в "Intel(R) Active System Console"...

Всего записей: 18 | Зарегистр. 02-04-2013 | Отправлено: 06:24 05-04-2013
Diabolik



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DeMaC
В консоли заходишь в Tools - Configure Alerts. Там выставляешь на что реагировать и в какие логи писать. Есть выборочная настройка, по самым мелким реакциям (S.M.A.R.T. тока мне так на глаза и не попался)  Там же настраиваешь на какой ящик и в случае какого сбоя отправлять оповещение.

Всего записей: 4819 | Зарегистр. 02-10-2004 | Отправлено: 13:40 05-04-2013 | Исправлено: Diabolik, 13:41 05-04-2013
DeMaC

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
...так и я об этом, или Вам не достаточно этого функционала и нужно что-то более конкретное?!
 
Имхо, "конкретное" необходимо производить выборочно при получении "удобного предупреждения" или при появлении проблем, производить просмотр логов и т.п. Или я не понимаю поставленной задачи...)))
 
На современных контроллерах небольшое количество сбойных секторов может уйти в переназначение почти не заметно и без участия. Но как-то это должно отражаться в логах. Например, у меня на HP замене двух HDD в 10-ке предшествовало то, что в логах периодически появлялось отваливание диска с последующим ребилдом. Детальный диагностический отчет показал наличие ошибок чтения/записи на двух дисках - заменили, а потом проверили отдельно замененные диски: были переназначенные сектора, а рабочие сектора не выдали ошибок.

Всего записей: 18 | Зарегистр. 02-04-2013 | Отправлено: 13:57 05-04-2013 | Исправлено: DeMaC, 13:58 05-04-2013
Ivan_Fedorovv

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Diabolik
Если мать " Intel Sapello S5000VSA, контроллер встроенный Intel® Embedded Server RAID Technology II, обозначенный дисковым накопителем Intel MegaSR SCSI Disk Device " .
Нужно запустить Everest и просмотреть список всего железа.  
Если используется действительно только встроенный контроллер, то это, скорее всего LSI 1068x.  
Есть 2 варианта мониторинга:
Вариант A. Cкачиваешь с LSI его софтину управления с поддержкой командной строки-  
MegaRAID Storage Manager .
После этого смотришь мануал и пишешь команды которые выводят тебе нужные параметры.  
Я обычно использую 2 команды:
1. Статус массива.
2. Состояние дисков.
 
Выполняешь эти команды, выводишь результат в файл sample.txt.
 
После этого, пишешь скрипт из 3 частей.
1. Выполняются эти команды, вывод уже в файл test.txt.
2. Сравнивается содержимое  файлов test.txt и sample.txt.
3. Если содержимое изменилось, тогда тебе отправляется сообщения.  
Если нет, значит все в порядке. Файл test.txt можно удалить.
 
Скрипт помещается в автозагрузку и при сбое ты получаешь сообщение.  
 
Вариант B.  
Если покапаться в настройках софтины MegaRAID Storage Manager в графическом режиме, то можно найти опции мониторинга и отправки сообщений.
 
 
P.S. Все это в теории. На Виндовзе я такое не делал, на Linux написание и настройка нужного скрипта (LSI MegaCLI) заняли 30 минут.  
Все работает.
   

Всего записей: 72 | Зарегистр. 31-03-2008 | Отправлено: 19:39 06-04-2013
Diabolik



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ivan_Fedorovv
Так, а можно поподробней? Ну запустил я AIDA64 (бывший Everest) - где и чего там нужно найти? Во вторых я так понял, версия MegaRAID Storage Manager должна быть именно к тому чипу, который укажет тестилка? А уж со скриптами... обязательно так заморачиваться (что-то там писать/дописывать), что бы тупо отслеживать S.M.A.R.T. утилитой которая для этого и предназначена? Мне казалось что решение должно быть более простым, это не ни какая-то там сверхзадача.

Всего записей: 4819 | Зарегистр. 02-10-2004 | Отправлено: 19:58 06-04-2013 | Исправлено: Diabolik, 12:04 02-05-2013
Ivan_Fedorovv

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
1. AIDA64 или  Everest нужны только для того, чтобы на 100% подтвердить тип контроллера. Где это в них искать,- ХЗ. В винде я таким уже лет 5 не занимался.  
 
2. Не совсем, MegaRAID Storage Manager  подходит для большого списка оборудования.  
Я думаю, что есть 2 подходящих варианта:
http://www.lsi.com/downloads/Public/Host%20Bus%20Adapters/Host%20Bus%20Adapters%20Common%20Files/SAS_SATA_3G_P21/LSImpt_sas_Windows_Server_2003_P21.zip
или  
http://www.lsi.com/downloads/Public/Host%20Bus%20Adapters/Host%20Bus%20Adapters%20Common%20Files/LSImpt_sas_Windows_Server_2003_P20.zip  
 
3. Полазь по настройкам в графической утилите, там такое может быть.  
Но в командной строке ты точно знаешь как отработают команды. А в графике, сработает/не сработает,-ХЗ.  
В Linux такой скрипт занимает меньше страницы и работает больше 2 лет.

Всего записей: 72 | Зарегистр. 31-03-2008 | Отправлено: 19:55 07-04-2013
Diabolik



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ivan_Fedorovv
Все что удалось нарыть тестилкой:
Аппаратный ID: PCI\VEN_8086&DEV_2682&SUBSYS_34858086&REV_09
Поставщик драйвера: LSI Logic, Corp  7.15.209.2007
PCI-устройство (Надеюсь это чип?): Intel 631xESB/6321ESB - SATA RAID Controller

Всего записей: 4819 | Зарегистр. 02-10-2004 | Отправлено: 16:13 06-05-2013 | Исправлено: Diabolik, 16:18 06-05-2013
redson



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
по опыту скажу, для мониторинга серверных райд надо использовать родной софт производителя, универсальных не существует. есть одина универсальная утилита smartmontools, но для одиночных дисокв без райд

Всего записей: 1336 | Зарегистр. 23-04-2007 | Отправлено: 23:32 06-05-2013
Diabolik



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
redson
Так я вот и ищу родной софт именно для своего конфига.

Всего записей: 4819 | Зарегистр. 02-10-2004 | Отправлено: 19:13 07-05-2013
wwladimir



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Diabolik
Это не достаточно родное ? -
http://www.intel.com/p/ru_RU/support/highlights/server/s5000vsa
откуда идет ссылка на web-консоль, скриншот которой Вы приводили -
https://downloadcenter.intel.com/Detail_Desc.aspx?ProductID=2487&DwnldID=22407&lang=rus&iid=dc_rss
Дальше нужно кликнуть по IP адресу машины, массивом которой Вы собираетесь
управлять, затем доказать консоли, что Вы админ... И все у Вас будет.
И удалить, и ребилдить, и состояние физических и логических дисков, и помигать нужным
диском...и настроить алерты по почте и их уровень. Не пойму - чего вам не хватант?
Инструкция (в картинках) там же - http://download.intel.com/support/motherboards/server/sb/d29305020_raid_swug_r20_0.pdf
 
Если и этого мало ( и любителям командной строки) -используйте cmdtool2  
Очень подробно здесь -  http://download.intel.com/support/motherboards/server/sb/e36092004_intelraidcontrollercommandlinetool2_user.pdf
 
 

Всего записей: 527 | Зарегистр. 08-11-2006 | Отправлено: 21:48 07-05-2013 | Исправлено: wwladimir, 21:52 07-05-2013
Diabolik



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
wwladimir
Это родное для матери.
А нужно для чипа, т.е. софт от LSI конкретно для моего набора, шоб извлекать данные S.M.A.R.T. (нужно конкретно это) из всех дисков в составе RAID10 и сигналить вовремя.

Всего записей: 4819 | Зарегистр. 02-10-2004 | Отправлено: 22:43 08-05-2013 | Исправлено: Diabolik, 22:44 08-05-2013
wwladimir



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Diabolik
Вот диск один сбойнул, ждет замены.  
Сообщил сразу по почте, результаты S.M.A.R.T. на панели справа. Какого функционала не хватает...  
Да и кроме "железной" реализации RAID контроллеры имеют и еще свой BIOS  на борту и он тоже может быть от разных разработчиков.
К примеру на многих серверных МБ от INTEL в "биосе" материнки можно переключить режим встроенного контроллера LSI <-->INTEL . Какой софт будете считать родным ?
 

 
 
В документе  
http://download.intel.com/support/motherboards/server/sb/d29305020_raid_swug_r20_0.pdf
сделайте ctrl-f  и там smart ...
 
Непосредственно Ваш "набор" описан на стр. 14 руководства к Вашей же   материнке -
http://download.intel.com/support/motherboards/server/s5000vsa/sb/d36978010_s5000vsa_tps_r1_9.pdf
и он таки "Intel Embedded RAID" (как и на моем сервере со скриншота) и аппаратно выполнен на ESB2-E ICH6 (микросхемка скорее всего промаркирована как 6321ESB ).  
Еще он умеет RAID-5, но требует "аппаратный ключ активации" купить.

Всего записей: 527 | Зарегистр. 08-11-2006 | Отправлено: 23:41 11-05-2013 | Исправлено: wwladimir, 00:12 12-05-2013
redson



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Diabolik
 
скорее всего ваш драйвер все события пишет в журнал windows, для отслеживания нехороших событий нужно написать скрипт, который будет проверять журнал

Всего записей: 1336 | Зарегистр. 23-04-2007 | Отправлено: 14:55 12-05-2013
Diabolik



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
wwladimir
Сбой я вижу на картинке, а вот что именно винт "посыпался" (появились сбойные сектора) не вижу. Может я куда не туда смотрю? Я ж за целостность данных переживаю, а не за железку.

Всего записей: 4819 | Зарегистр. 02-10-2004 | Отправлено: 21:49 12-05-2013
wwladimir



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Diabolik
А какая теперь разница, что с ним, раз контроллер с ним работать не хочет...
В логе запись- нет доступа к  физическому диску: "Controller ID: 0  Unable to access device PD 0"
Все равно вынимать, менять.
Потом можно и потестить, но я обычно их уже не возвращаю. По причине потери моего доверия и замены новым.
Если есть уверенность, что Вы правы, а контроллер нет (ну там шнурок поменяли, разьем
доткнули или спиртом  и тонким слоем )- то правой кнопкой на диске и "мейк онлайн"...  
А забота о целостности данных требует другого контроллера (не встроенного) , с диском/дисками горячего резерва и  "холодного" резерва на физической полке офисной мебели.
У меня так -

Всего записей: 527 | Зарегистр. 08-11-2006 | Отправлено: 23:34 12-05-2013 | Исправлено: wwladimir, 23:59 12-05-2013
Diabolik



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
wwladimir
Разница есть. У меня был печальный опыт разваливания RAID10 по диагонали. И если отказал контроллер или механика -  да и ладно, всему свое время. А вот если винтики посыпятся, данные вытаскивать будет очень геморройно и не дешево.

Всего записей: 4819 | Зарегистр. 02-10-2004 | Отправлено: 01:40 13-05-2013
wwladimir



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Diabolik
Так и я Вам о чем-ставьте RAID6, вынимайте на ходу 2 диска и все будет  в сохранности.
Автоматом подключатся два диска из "хотсвап" и после ребилда массива можете еще на ходу два диска вытянуть. Итого при потере 4 дисков данные без искажений... При выходе из строя самого контроллера - есть софт для программного сбора массива.
 

Всего записей: 527 | Зарегистр. 08-11-2006 | Отправлено: 16:41 13-05-2013
Diabolik



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну вот у меня уже 2 раза вываливался BSOD с кодом:
0x0000007a (0xc07b98e0, 0xc000000e, 0xf731ced6, 0x1357a860)
Но Raid Web Console 2 предательски продолжает показывать что с массивом все хорошо и все жесткие диски целы. Или это не диски? Что тогда (Google вразумительного ответа не дал)?

Всего записей: 4819 | Зарегистр. 02-10-2004 | Отправлено: 11:34 25-09-2013 | Исправлено: Diabolik, 12:18 25-09-2013
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3

Компьютерный форум Ru.Board » Компьютеры » В помощь системному администратору » Программы для мониторинга RAID-массивов.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru