Произошедшее недавно отключение Amazon’s Elastic Compute Cloud осталось незамеченным для большинства населения земного шара, но повергло во временный траур миллионы хипстеров и любителей мобильных приложений. Еще бы: перестали работать суперпопулярная социальная фотосеть Instagram, Pinterest (коллекция полезных и удивительных идей в виде фото – «открытие 2011 года» в сфере соцмедиа), а также ряд других популярных мобильных и интернет-приложений. Facebook бурлил – все обсуждали, что случилось и можно ли после этого доверять «облачному» монстру Amazon. Ситуация с Amazon поставила под сомнение репутацию не только провайдера, но и «облачных» вычислений как технологии.
При этом саму технологию упрекнуть не в чем: причиной аварии стали погодные условия, приведшие к блэкауту части штата Северная Виргиния, где расположены дата-центры Amazon. И это уже не первый отказ «облачного» сервиса: в апреле прошлого года авария привела к отключению популярных сервисов Foursquare и Reddit. Почему же такой резонанс?
«Облака» позиционируются как отказоустойчивое решение, которое гораздо надежнее, чем традиционная система хостинга данных и приложений – именно из-за распределения вычислительных ресурсов по множеству серверов. Но даже такие гиганты, как Amazon, не могут противостоять ситуациям массовых блэкаутов. И даже те компании-клиенты «облаков», которые застраховались от обрушения одного провайдера, создав распределенную систему, страдают от «эффекта домино» – когда весь поток запросов направляется на оставшиеся доступными резервные мощности, соответственно увеличивая нагрузку на них.
А были ли они вообще, эти резервные мощности? В профессиональной среде сейчас активно обсуждают, как такое вообще могло произойти, и склоняются к мысли о том, что конкретные сервисы Amazon базируются в конкретных же ЦОДах, географически локализованных в конкретном штате и городе. В этом случае правильной распределенной «облачной» структуры не получается, и авария в одном ЦОДе влечет за собой отказ в работе размещенных в нем сервисов. Сделано это, конечно же, не из-за недостатка технических возможностей у Amazon, а с целью экономии и удешевления услуг «облака» для пользователей.
Сервисы Amazon и Google нацелены на сегмент SMB и частных пользователей: здесь невысокие требования к вычислительным мощностям, а частные пользователи, в конце концов, переживут полдня без Instagram. В классе же enterprise, когда в «облаке» находятся критические бизнес-процессы и требуется обеспечить высокий уровень защиты систем хранения данных, такого бы не произошло: распределенная структура обязательна, а на случай вывода из строя системы энергопитания есть как минимум 40 минут на запуск одного из 2-3 дизель-генераторов. Не правда ли, странно, если у ведущего «облачного» провайдера нет запасных дизель-генераторов или они неисправны?
Размышления алармистов заходят далеко - вплоть до предположения о том, что Amazon отключали американские спецслужбы, чтобы изъять подозрительные ресурсы… Но, конечно, крайне сомнительно, что «люди в черном» будут отключать питание во всем дата-центре, когда достаточно просто вынуть нужные сервера из стоек.
Не бывает систем, отказоустойчивых на 100%. Вопрос в том, насколько могут быть минимизированы риски и снижено время простоя. Когда ваше приложение только что купили за миллиард долларов (как это случилось с Instagram: покупатель – Facebook), неудобные вопросы возникнут не только у миллионов пользователей (в конце концов, поворчат и успокоятся), но и у акционеров – а это гораздо неприятнее.
Сегодня Instagram работает, в Facebook переключились на другие сенсации, самое время делать выводы. Пожалуй, самый важный урок – то, что все лишний раз убедились: критически важные приложения должны размещаться в супернадежных и обязательно ориентированных на поддержку крупного бизнеса ЦОДах. Прогресс не остановить. «Офис в облаке» несравнимо эффективнее и удобнее «Лексикона» на дискете, и очень скоро большинство бизнес-процессов будет поддерживаться «облачными» сервисами. Gartner прогнозирует, что к 2016 году более трети цифрового контента пользователи будут хранить в «облаке». Еще несколько лет, и в «облака» постепенно уйдут mission critical приложения (они уже туда уходят, но пока процесс не так заметен). Что, если завалится «облако», в котором будет жить, например, весь земной Microsoft Office?
Я не люблю апокалиптические сценарии. Но на случай, если ваше супер-распределенное enterprise-«облако» все-таки разнесет очередным ураганом, а работу бизнеса нельзя остановить ни на минуту – держите в подсобке старый, но рабочий ноутбук с настроенным софтом и парой-тройкой независимых каналов выхода в интернет. И, очень желательно, с подключением к дизель-генератору. Скорее всего, не пригодится, но всякое бывает.