Статья посвящается всем тем, кто побывал в ситуации: пользователи жалуются на работу приложения, а все средства мониторинга приложения и поддерживающей его инфраструктуры корректно отчитываются, что «все в порядке», и достоверно оценить его работоспособность можно только с компьютера реального пользователя.
В начале 2014 года в инфраструктуре, обеспечивающей работу интернета, произошел сбой “тектонического” масштаба. Его последствия затронули ВСЕ организации и бизнесы, имеющие онлайн-присутствие в Китае. Это происшествие стало последним аргументом в дискуссии о необходимости использования мониторинга реальных пользователей.
Во вторник, 21 января, в Китае случился один из самых больших в истории сбоев в работе Интернета: практически все серверы, находящиеся за пределами Китая и большинство серверов на его территории, оказались недоступными для пользователей в течение целого рабочего дня.
Несмотря на то, что Китай – это вторая по размеру и одна из самых быстро растущих экономик в мире, первоначальная реакция международной прессы была довольно вялая. Возможно потому, что это событие не было чем-то значимым для пользователей Интернета за пределами Китая.
А вот по кому оно по-настоящему ударило – так это по всем международным компаниям, ведущим бизнес в Китае, потому что 500 миллионов китайских пользователей не могли воспользоваться онлайн-услугами в течение целого бизнес-дня. К примеру, доходы на Китайском рынке автомобильного гиганта Porsche только за последнее время выросли на 10%. Удар по доходам и имиджу для такой компании – даже если она вообще никак не могла повлиять на события – весьма ощутим. Еще одним примером являются рекламные агентства, которые потеряли инвестиции от рекламы за весь период инцидента.
Подробности инцидента
Итак, что же произошло в этот злополучный день? 21 января, примерно в 3 часа дня по местному времени, две трети всех DNS запросов в Китае начали направляться на один IP-адрес в Вайоминге (США), который под такой нагрузкой очень быстро упал. Достоверно причины инцидента неизвестны. Официально считается, что это была одна из самых больших в истории атак на систему доменных имен. Хотя, есть еще одна правдоподобная версия, по которой причиной были неудачные изменения китайской системы онлайн-цензуры, больше известной как «Золотой Щит» или «Великий Китайский Файервол» – так как были затронуты не все домены, а в основном международные .com и .net, в то время как .com.cn пострадали частично.
Анализ ситуации
Несмотря на то, что на большую часть китайских веб-сайтов не было прямого влияния, они все равно оказались недоступны. Причина достаточно банальная – многие из затронутых инцидентом доменов предоставляли услуги хостинга для тысяч китайских веб-сайтов.
А теперь отвлечемся от того факта, что большинство китайских сайтов на это время оказались недоступны. Как, по-вашему, что произошло с остальными сайтами, когда DNS сервис оказался только частично неработоспособным?
Сегодня мы уже не представляем сайты и онлайн-приложения без использования сервисов по отслеживанию посещений и поведения пользователей. Они поставляют аналитику, которая используется в маркетинге для развития бизнеса. То, что сервисы по сбору статистики не работали, означает потерю аналитической информации, которую можно было бы использовать, например, для увеличения конверсии. Но это так, мелочи. Ведь в качестве побочного эффекта сработал «эффект домино» – все веб-сайты, которые интегрировали и использовали эту аналитику, сами испытали проблемы со скоростью и доступностью.
Все сайты, принимающие платежи, пользуются несколькими международными платежными системами (например, PayPal). Естественно, в этот день они тоже не были доступны. Как результат – не принимались платежи.
Сегодня интеграция онлайн-сервисов, предоставляемых другими компаниями (аналитические, платежные и др.), является основополагающим принципом архитектуры онлайн-приложений. Это дает возможность не изобретать велосипед разработчикам, а концентрироваться на логике самих приложений, и быстро выводить их на рынок.
Примечательно, что данный инцидент с китайским Интернетом является прекрасным примером того, что APM-вендоры проповедуют на протяжении многих лет. А именно – все увеличивающаяся сложность и взаимозависимость современной мировой сети может превратить даже отлично спроектированный и успешно работающий веб-сайт в карточный домик, который может развалиться в любой момент.
И в наше время этого нельзя избежать. Хостинг, DNS, движки аналитики и платежные системы – это все услуги и сервисы, которыми все на рынке так или иначе пользуются. Иногда нет другого выхода (как в случае с DNS), но чаще всего это требования современного бизнеса. Сервисы третьих сторон позволяют веб-сайтам и разработчикам сайтов оперативно и рентабельно выводить на рынок современные приложения и новые услуги, без необходимости разрабатывать весь функционал используемых сервисов с нуля. Никто не приставляет к горлу нож и заставляет подписывать договор на использование сервиса. Но с одной стороны, бизнес требует предложить клиентам новые возможности, и маркетологи требуют аналитику. А с другой стороны пользователи хотят скорости, удобства использования и оплаты. А есть еще конкуренты, которые понимают правила современного рынка и с помощью сторонних сервисов оперативно выкатывают новые обновления своих продуктов.
И выбор на самом деле не в том, пользоваться услугами третьих сторон или нет, а какие из них выбрать и чем это грозит. Китайский пример показал, что кроме положительных моментов, пользование услугами третьих сторон означает зависимость, а следовательно увеличение уязвимости и ненадежности.
Можно ли что-то сделать, чтобы исправить ситуацию? Наш ответ – да! И в следующем посте мы рассмотрим конкретные рекомендации, ответив на вопросы:
- Как получать объективную информацию о доступности приложения?
- Как выбирать сторонние сервисы для интеграции в приложение и мониторить их работоспособность?
- Как обеспечить работоспособность бизнеса на случай недоступности сторонних сервисов?
- Почему уровень обслуживания конечного пользователя должен быть приоритетом при принятии любых решений, связанных с услугами третьих сторон?
- Как отслеживать всю географию, где используется приложение?