Вход |  Регистрация

Все Тэги

Масштабный инцидент с доступностью Интернета в Китае потряс мировую паутину

11.03.2014377 просм.

Статья посвящается всем тем, кто побывал в ситуации: пользователи жалуются на работу приложения, а все средства мониторинга приложения и поддерживающей его инфраструктуры корректно отчитываются, что «все в порядке», и достоверно оценить его работоспособность можно только с компьютера реального пользователя.

В начале 2014 года в инфраструктуре, обеспечивающей работу интернета, произошел сбой “тектонического” масштаба. Его последствия затронули ВСЕ организации и бизнесы, имеющие онлайн-присутствие в Китае. Это происшествие стало последним аргументом в дискуссии о необходимости использования мониторинга реальных пользователей.

Во вторник, 21 января, в Китае случился один из самых больших в истории сбоев в работе Интернета: практически все серверы, находящиеся за пределами Китая и большинство серверов на его территории, оказались недоступными для пользователей в течение целого рабочего дня.

Несмотря на то, что Китай – это вторая по размеру и одна из самых быстро растущих экономик в мире, первоначальная реакция международной прессы была довольно вялая. Возможно потому, что это событие не было чем-то значимым для пользователей Интернета за пределами Китая.

А вот по кому оно по-настоящему ударило – так это по всем международным компаниям, ведущим бизнес в Китае, потому что 500 миллионов китайских пользователей не могли воспользоваться онлайн-услугами в течение целого бизнес-дня. К примеру, доходы на Китайском рынке автомобильного гиганта Porsche только за последнее время выросли на 10%. Удар по доходам и имиджу для такой компании – даже если она вообще никак не могла повлиять на события – весьма ощутим. Еще одним примером являются рекламные агентства, которые потеряли инвестиции от рекламы за весь период инцидента.

Подробности инцидента

Итак, что же произошло в этот злополучный день? 21 января, примерно в 3 часа дня по местному времени, две трети всех DNS запросов в Китае начали направляться на один IP-адрес в Вайоминге (США), который под такой нагрузкой очень быстро упал. Достоверно причины инцидента неизвестны. Официально считается, что это была одна из самых больших в истории атак на систему доменных имен. Хотя, есть еще одна правдоподобная версия, по которой причиной были неудачные изменения китайской системы онлайн-цензуры, больше известной как «Золотой Щит» или «Великий Китайский Файервол» – так как были затронуты не все домены, а в основном международные .com и .net, в то время как .com.cn пострадали частично.

Анализ ситуации

Несмотря на то, что на большую часть китайских веб-сайтов не было прямого влияния, они все равно оказались недоступны. Причина достаточно банальная – многие из затронутых инцидентом доменов предоставляли услуги хостинга для тысяч китайских веб-сайтов.

А теперь отвлечемся от того факта, что большинство китайских сайтов на это время оказались недоступны. Как, по-вашему, что произошло с остальными сайтами, когда DNS сервис оказался только частично неработоспособным?

Сегодня мы уже не представляем сайты и онлайн-приложения без использования сервисов по отслеживанию посещений и поведения пользователей. Они поставляют аналитику, которая используется в маркетинге для развития бизнеса. То, что сервисы по сбору статистики не работали, означает потерю аналитической информации, которую можно было бы использовать, например, для увеличения конверсии. Но это так, мелочи. Ведь в качестве побочного эффекта сработал «эффект домино» – все веб-сайты, которые интегрировали и использовали эту аналитику, сами испытали проблемы со скоростью и доступностью.

Все сайты, принимающие платежи, пользуются несколькими международными платежными системами (например, PayPal). Естественно, в этот день они тоже не были доступны. Как результат – не принимались платежи.

Сегодня интеграция онлайн-сервисов, предоставляемых другими компаниями (аналитические, платежные и др.), является основополагающим принципом архитектуры онлайн-приложений. Это дает возможность не изобретать велосипед разработчикам, а концентрироваться на логике самих приложений, и быстро выводить их на рынок.

Примечательно, что данный инцидент с китайским Интернетом является прекрасным примером того, что APM-вендоры проповедуют на протяжении многих лет. А именно – все увеличивающаяся сложность и взаимозависимость современной мировой сети может превратить даже отлично спроектированный и успешно работающий веб-сайт в карточный домик, который может развалиться в любой момент.

И в наше время этого нельзя избежать. Хостинг, DNS, движки аналитики и платежные системы – это все услуги и сервисы, которыми все на рынке так или иначе пользуются. Иногда нет другого выхода (как в случае с DNS), но чаще всего это требования современного бизнеса. Сервисы третьих сторон позволяют веб-сайтам и разработчикам сайтов оперативно и рентабельно выводить на рынок современные приложения и новые услуги, без необходимости разрабатывать весь функционал используемых сервисов с нуля. Никто не приставляет к горлу нож и заставляет подписывать договор на использование сервиса. Но с одной стороны, бизнес требует предложить клиентам новые возможности, и маркетологи требуют аналитику. А с другой стороны пользователи хотят скорости, удобства использования и оплаты. А есть еще конкуренты, которые понимают правила современного рынка и с помощью сторонних сервисов оперативно выкатывают новые обновления своих продуктов.

И выбор на самом деле не в том, пользоваться услугами третьих сторон или нет, а какие из них выбрать и чем это грозит. Китайский пример показал, что кроме положительных моментов, пользование услугами третьих сторон означает зависимость, а следовательно увеличение уязвимости и ненадежности.

Можно ли что-то сделать, чтобы исправить ситуацию? Наш ответ – да! И в следующем посте мы рассмотрим конкретные рекомендации, ответив на вопросы:

  1. Как получать объективную информацию о доступности приложения?
  2. Как выбирать сторонние сервисы для интеграции в приложение и мониторить их работоспособность?
  3. Как обеспечить работоспособность бизнеса на случай недоступности сторонних сервисов?
  4. Почему уровень обслуживания конечного пользователя должен быть приоритетом при принятии любых решений, связанных с услугами третьих сторон?
  5. Как отслеживать всю географию, где используется приложение?

Метки: , , ,

Добавить комментарий

Для отправки комментария вам необходимо авторизоваться.

Партнеры DevOpsHub и DevOpsWiki