1. Мы построили ЦОД. Что дальше?
Любой ЦОД требует регламентного обслуживания. Какова бы ни была его стоимость, сколько бы стоек в нем ни было установлено, если есть инженерная инфраструктура – системы кондиционирования, бесперебойного гарантированного электроснабжения и т.д., их обязательно нужно обслуживать. Практически все инженерное оборудование имеет рекомендуемые графики проведения регламентных работ, а сложные системы вообще не подлежат гарантии без заключения заказчиком сервисного договора с авторизованной организацией.
2. Можно ли полагаться на свою службу эксплуатации?
Зачастую собственная служба эксплуатации компании – владельца ЦОДа не имеет достаточной квалификации для выполнения даже половины требуемых работ. Обеспечение функционирования среднестатистического центра обработки данных складывается из обширного перечня задач (см. таблицу). Не говоря уже о складе запасных частей, которые нужно закупать и всегда иметь под рукой для того, чтобы можно было гарантировать отказоустойчивость ЦОДа и непрерывность предоставления сервисов.
Прогресс не стоит на месте, и требования к исполнителям в области сервисной поддержки из года в год становятся все строже. Буквально несколько лет назад поддержку оборудования в режиме 24 × 7 могли предоставить только такие «монстры», как Sun, IBM, HP, APC. Сейчас же речь идет не о прибытии обслуживающей бригады на место аварии в течение четырех или двух часов после размещения заявки и даже не о способности исполнителя гарантировать устранение неисправности не более чем за четыре часа после регистрации заявки. Мы вышли на уровень, когда заказчики оперируют такими понятиями, как «процент гарантированной доступности инженерной инфраструктуры ЦОДа в год». Например, одному из наших заказчиков была нужна гарантированная доступность сервисов ЦОДа в год не менее 99,95%! И эти требования, как правило, вовсе не прихоть. Они обусловлены размером убытков от перерыва предоставления ЦОДом сервисов, ведь стоимость подобного обслуживания на порядок выше стандартного.
3. Как создать такую систему обслуживания?
Прежде всего нужно провести аудит всей инженерной инфраструктуры на соответствие условиям работы и проанализировать ее эффективность. В случае необходимости выдвинуть предложения по усовершенствованию систем или замене оборудования. Неразумно браться за обслуживание инженерной инфраструктуры, расчетная мощность которой ниже требуемой ИТ-оборудованием.
После выполнения этой немаловажной задачи можно подумать и об инструментах для организации собственно обслуживания. Без дежурной смены при этом не обойтись. Например, в упоминавшемся случае с обеспечением доступности ЦОДа на уровне четырех девяток было предложено создать две дежурных смены, причем одну непосредственно на объекте. В ее обязанности входило:
- с помощью систем мониторинга следить за состоянием ЦОДа и окружающей среды;
- проводить обход и осмотр всего инженерного оборудования один раз в два часа;
- при отказе оборудования не позднее чем через пять минут проверить выполнение автоматического ввода резерва или ввести в работу резервное оборудование вручную;
- не позднее 30 минут с момента регистрации выхода инженерного оборудования ЦОДа в аварийный режим работы выявить неисправное устройство и причину отказа и при необходимости вызвать вторую дежурную смену;
- документировать все свои действия и состояние оборудования в реальном времени.
Вторая дежурная смена, как вы поняли, состояла из инженеров, готовых прибыть на объект в течение часа.
Ну и конечно же под проект был закуплен ЗИП и регулярно выполнялось регламентное обслуживание оборудования.
4. Хорошо, убедили. Но какой уровень сервиса нужен для ЦОДа?
Для начала нужно определиться, насколько важна непрерывность его функционирования.
Если критичность простоя невысока либо имеется резервирование элементов инфраструктуры (N + 1, 2(N + 1)) или целых подсистем (S + S), то сервисные организации можно привлекать для проведения регламентных работ или по факту выхода оборудования из строя.
Если же критичность простоя высока, то к организации сервисной поддержки нужно подходить очень ответственно. В первую очередь требуется сервисная организация, имеющая опыт эксплуатации таких объектов. Это может быть как мультиинжиниринговая компания, так и системный интегратор, который умеет хорошо управлять сервисными проектами и у которого есть квалифицированные и надежные партнеры по инженерным системам.
5. Как же выбрать аутсорсера?
Для того чтобы не ошибиться при выборе аутсорсера, который будет осуществлять сервисную поддержку инженерной инфраструктуры ЦОДа, следует руководствоваться несколькими важными критериями.
Во-первых, аутсорсер должен гарантировать конфиденциальность информации. Не лишним будет заключить соглашение о конфиденциальности с каждым потенциальным участником конкурса. Помимо ответственности за разглашение информации исполнитель должен нести ответственность за работу, которую он выполняет. Предоставляемые им услуги должны строго соответствовать соглашению об уровне сервиса (SLA) – самому важному документу в сервисном контракте.
Во-вторых, аутсорсер обязан оказывать услуги комплексно. И желательно, чтобы он обходился своими ресурсами. Ведь в таком случае путь прохождения заявки значительно сокращается и время реакции, соответственно, тоже. С другой стороны, мы прекрасно понимаем, что редкая инженерная компания обладает всеми ресурсами, необходимыми для эксплуатационного обслуживания ЦОДа (см. таблицу), и, скорее всего, ей придется брать кого-то на субподряд. В этом случае я бы предложил организовать ознакомительную встречу, на которой присутствовали бы все исполнители по всем системам, чтобы вы могли сами оценить их компетентность и квалификацию.
И наконец, инженерный персонал аутсорсинговой компании обязательно должен пройти сертификацию на выполнение работ, предусмотренных сервисным контрактом. Требуйте прислать вам копии всех необходимых сертификатов ДО заключения договора.
6. Как научить исполнителей разговаривать со мной на одном языке?
Прежде всего необходимо дать понять сервисной организации, что для вас важно не только соблюдение регламентов и стандартов сервиса, но и интеграция сервисного проекта в структуру бизнес-процессов предприятия. Это значит, что исполнителям придется думать не только о выполнении своих работ, но и об их влиянии на ваши бизнес-процессы, придется продумывать и согласовывать с вами планы проведения работ и т.д.
7. Для чего сервисной компании согласовывать со мной планы работ?
Давайте представим себе ситуацию: в вашем ЦОДе запланированы регламентные работы на дизель-гене-раторной установке, которые помимо всего остального включают в себя замену охлаждающей жидкости и сезонную смену топлива в баке. В случае пропадания внешнего электропитания ИБП смогут поддерживать работу ЦОДа не более 15 мин. А при слитых охлаждающей жидкости и топливе, чтобы привести ДГУ в состояние, когда она сможет запуститься, потребуется более получаса.
Выходит, не получи вы план проведения данных регламентных работ с временными интервалами, вы бы не увидели, какой риск грозит вашему центру обработки данных в случае пропадания городского питания. Вы дадите согласие на такие работы? А если минута простоя ЦОДа стоит миллион долларов?
Как бы то ни было, привлекать сервисных интеграторов или делать все своими силами – решать вам.
Статья впервые опубликована на сайте «ИКС-Медиа»
Учитывая стоимость создания ЦОД, сильно сомневаюсь, что его могут позволить себе дилетанты. Для не дилетантов в статье ничего интересного нет.