x
channel 9

В падении сети "Селкома" виновны инженеры и руководство компании

В "Селкоме" хранят молчание насчет причин падения сети в среду на минувшей неделе, однако выясняется, что инженерный департамент компании, занимавшийся ликвидацией последствий аварии, несет за нее непосредственную ответственность.

Экономическому изданию The Marker стало известно из интервью с работниками, участвовавшими в восстановлении работоспособности сети "Селкома", что в ночь со вторника на среду один из отделов инженерного департамента занимался испытанием кода, написанного программистами компании. Код должен был автоматизировать добавление информации о новых услугах в базу данных клиентов компании. В процессе испытаний случился сбой, в результате которого произошло частичное уничтожение данных - база данных пострадала, из-за чего идентификация клиента при звонке стала невозможной.

В нормальных условиях компания должна была перейти на запасную систему, однако это удлинило бы процесс испытания кода и заставило бы впоследствии заново синхронизировать данные в обеих системах. Поэтому работа была продолжена (первая ошибка инженеров), и данные пострадали в запасной системе тоже.

На этом этапе у инженеров было два варианта: один из них жесткий, но надежный - погасить обе системы, то есть остановить полностью предоставление услуг клиентам и "начать с чистого листа", то есть загрузить резервный вариант системы. Либо попробовать исправить вред, нанесенный кодом, прогнав процесс назад, не выключая систему. Это был рискованный выход с точки зрения результата, но выбрали именно его.

В результате утром в среду три миллиона клиентов "Селкома" проснулись в досотовом мире. В первую половину дня хаос нарастал и в 13:17 только 40% звонков достигали своей цели. Все это время технические службы занимались восстановлением базы данных, а гендиректор компании успокаивал клиентов, не заявляя никаких сроков восстановления сети. Только к вечеру предоставление услуг "Селкомом" возобновилось в приемлемом объеме.

Согласно данным TheMarker, по крайней мере принятие первого ошибочного решения требовало - по своему характеру - вмешательства руководства достаточно высокого уровня. Это означает, что во многом в аварии виновно не только техническое, но и руководящее звено "Селкома".