В пятницу, 19 мая, около полудня в сети сотового оператора «Мегафон» и его стопроцентной дочки «Йота» начался масштабный сбой. Проблемы со связью сообщили абоненты «Билайна». Лишились связи пользователи почти по всей Центральной России и Поволжью — на это пожаловалисьабоненты из Москвы, Нижнего Новгорода, Казани, Саратова, Самары, Ульяновска, Волгограда и других городов.
Клиентам «Мегафона» и «Йоты» нельзя было дозвониться. Они не могли также сами совершать звонки. До пользователей не доходили СМС-сообщения. Из-за этого абоненты не могли получать подтверждения от финансовых организаций и проводить идентификацию платежей.
Официальные представители «Мегафона» вначале выдвинули две возможные причины возникшего сотового «блэкаута»: аварию одного из элементов сетевого оборудования и обновление операционных систем Android на смартфонах абонентов.
Инженер сотовых сетей, работающий в одной из компаний «большой тройки» операторов, анонимно рассказал, что, «сбой произошел на оборудовании HLR (домашний регистр местоположения - Home Location Register ), где хранятся данные об абонентах сети и статусе их активности». Подобный сбой якобы может быть вызван «обновлением программного обеспечения, переносом базы на новые сервера или другими проблемами». Сбой, скорее всего, произошел в Москве, после чего распространился на всю Центральную Россию и Поволжье. Связано это с перераспределением нагрузки в сети: телефоны потерявших связь абонентов начали подключаться к роумингу в соседних регионах, перегружая их системы. По этой же причине, пишут СМИ, произошел кратковременный сбой в сети «Билайн»: часть аппаратов, не найдя домашней сети, подключилась к сети другого оператора. С чисто инженерной точки зрения такую аварию оператор обязан устранить в течение часа, а решение проблемы в целом должно занимать не более суток. Однако, в сети «Мегафона» и «Йоты» сбой длился гораздо дольше.
HLR (Home Location Register)— база данных, которая содержит информацию об абоненте сети GSM-оператора.
HLR содержит данные о -картах данного оператора мобильной связи. Каждой SIM-карте сопоставлен уникальный идентификатор, называемый IMSI, который является ключевым полем для каждой записи в HLR.
Другой важной частью данных, сопоставленных SIM-карте, являются телефонные номера (MSISDN). Главный MSISDN используется для предоставления абоненту основного пакета услуг, возможно также сопоставить SIM-карте несколько других MSISDN для работы с факсимильной связью и передачи данных. Каждый MSISDN также является ключевым полем в базе данных HLR.
У крупных операторов может быть установлено несколько HLR, на каждом из которых хранятся данные лишь по части абонентов оператора, так как из-за аппаратных и программных ограничений ёмкость каждого HLR лимитирована.
Так как HLR является основной базой данных сети, связан он с большим количеством сетевых элементов сети.
Насколько можно доверять версии официальных представителей «Мегафона»? Могут ли в принципе быть какие-то иные причины масштабного «блэкаута», из-за которого пострадали сотни тысяч пользователей по всей России?
Для поиска ответа на эти вопросы воспользуемся советом Шерлока Холмса: «отбросить все невозможное, то, что останется, и будет ответом, каким бы невероятным он ни казался».
Мобильная связь и эфирный интернет сильно зависят от прохождения радиоволн в атмосфере. Поэтому нелишне проверить состояние магнитосферы Земли в эти дни.
Высокоточные космические радиотелескопы Физического Института РАН им. П.Н. Лебедева зафиксировали магнитные бури среднего уровня G2 с 16 по 22 мая.
Наведенные токи на металлических поверхностях, которые генерируются переменными магнитными полями, возникающими в результате магнитных бурь, порой вызывают сбои в работе гироскопов стабилизации искусственных спутников Земли, что приводит к их сходу с орбит и гибели в плотных слоях атмосферы. Магнитная буря 13 марта 1989 года привела к короткому замыканию в главном трансформаторе Квебекского гидроузла в Канаде. В результате более 6 млн канадцев и американцев на 9 часов остались без электричества. Была также нарушена высокочастотная радиосвязь во всем мире и работа космических аппаратов.
Согласно официальной классификации магнитных бурь, магнитные бури среднего уровня (G2 — порядка 100 нанотесла), которые имели место с 16 по 22 мая, могут вызывать сбои напряжения в энергосистемах, расположенных в высоких широтах (на севере), а в случае длительного магнитного шторма - неполадки на трансформаторных подстанциях. Все виды радионавигации, в том числе и GPS, радиосвязь, в том числе и через сотовая, невозможны при экстремальном магнитном шторме уровня G5 (200 нанотесла и выше).
Из этого следует, что магнитные бури не могли внести свой вклад в сбои сотовых операторов 19 мая. Отбрасываем эту версию.
Теперь рассмотрим версию чисто технической неисправности. Вот официальное заявление директора по связям с общественностью «Мегафона» Петра Лидова:
«Проблемы с дозвоном возникли из-за обновления софта (программного обеспечения), установленного в системе обработки данных компании. Сбой привел к тому, что возникает постоянная пиковая нагрузка на систему, в результате чего она не выдерживает. В настоящее время владелец этого программного обеспечения и оборудования компания Hewlett Packard занимается поиском системного решения».
Система обработки данных — это и есть HLR, то есть база данных об абонентах, о сбое в которой ранее сообщили анонимные инсайдеры. Если сбой в этой системе привел к масштабному блэкауту во всей сети, то налицо так называемая «единая точка отказа» в IP-сети комании «Мегафон» и ее дочки «Йоты».
Справка:
Единая точка отказа (SPOF, Single Point Of Failure)— узел, линия связи или объект системы доступности данных, отказ которого может вывести из строя всю систему, или вызвать недоступность данных. Отказоустойчивость — свойство технической системы сохранять свою работоспособность после отказа одного или нескольких составных компонентов. Отказоустойчивость определяется количеством любых последовательных единичных отказов компонентов, после которого сохраняется работоспособность системы в целом. Базовый уровень отказоустойчивости подразумевает защиту от отказа одного любого элемента — исключение единой точки отказа. Основной способ повышения отказоустойчивости — избыточность. Наиболее эффективный метод избыточности — аппаратная избыточность, которая достигается путём резервирования.
Единой точкой отказа в данном случае стало программное обеспечение (софт), разработанный компанией Hewlett Packard.
Однако, сайт «Каждый сбой» сообщил, что 19 мая неполадки появились отнюдь не только у абоненов у «Мегафона» и «Йоты», а практически у всех операторов мобильной связи, причем именно в полдень. В последующие дни сбои продолжались у «Билайна», МТС, «Теле2». 19 мая с трех часов утра начался суточный сбой серверов Сбербанка. Услуга «сбербанк онлайн» была фактически недоступна.
Типичный комментарий в сети:
«Если Сбербанк настолько убогий, что не может провести обновления без остановки основных сервисов, то он должен был предупредить своих клиентов о технических сбоях, чтобы люди заранее запаслись наличными деньгами. Это типичное … отношение к людям, не надо его оправдывать».
Теоретически считается, что у IP-сети нет единой точки отказа, так как основная характеристика IP-сети — ее распределенность и отказоустойчивость, достигаемые за счет дублирования каналов, распределения нагрузки и независимого вычисления альтернативных маршрутов. Все маршруты должны вычисляться независимо с учетом текущей ситуации, загруженности линий связи и телекоммуникационного оборудования. Но это в теории, а на практике российские корпорации, большие и маленькие, экономят на чем только могут.
В данном случае, как мне видится — на собственном программном обеспечении. Перефразируя известную военную максиму — тот, кто не хочет нормально платить собственным программистам, будет платить иностранным.
Уточню: и при этом критически зависеть от крупнейшей американской корпорации Hewlett Packard, которая, возможно, оставила в своем ПО некие уязвимости, подобно тем, которые использовали неведомые хакеры в операционной системе Microsoft во время кибератаки 12 мая.
Если ПО других сотовых операторов (да и Сбербанка) также разрабатывали специалисты Hewlett Packard, что в принципе нетрудно выяснить, то эта версия может стать основной.
В любом случае, одновременные сбои в работе сотовой связи и онлайн-сервисов нескольких крупнейших компаний России через неделю после масштабной кибератаки на те же структуры («Мегафон» и «Сбербанк» в частности) вирусом-вымогателем просто обязывает рассматривать версии внешнего вмешательства, а не только технического сбоя. Однако, если учесть, что даже кибератака 12 мая крайне освещалась и комментировалась в СМИ крайне скупо, односторонне и непрофессионально, то не столь резонансный блэкаут 19 мая тем более будет забыт максимально быстро.
Зависимость от иностранной элементной базы, широкое привлечение западного программного обеспечения и западного хард-вора ставят Россию в крайне уязвимую позицию в случае любой кибер-атаки со стороны наших «стратегических партнеров». Это диктует необходимость крайне осторожной и продуманной внешней и внутренней политики. Возможно, до блэкаутов 12 и 19 мая такого понимания в российском военно-политическом руководстве не было.
Появилось ли оно сейчас — вот в чем вопрос.
Автор: Владимир Прохватилов, президент Академии реальной политики (Realpolitik), эксперт Академии военных наук
Больше новостей и ближе к сути? Заходите на ленту в Телеграм!
Добавляйте CСб в свои источники ЯНДЕКС.НОВОСТИ.