Компания Amazon объяснила, что сбой в работе AWS 19–20 октября произошел из-за ошибки в системе обновления DNS. Две программы одновременно изменили адреса серверов и случайно стерли правильные данные - и множество сервисов стало недоступно, передает корреспондент Kazpravda.kz со ссылкой на РБК
Неполадки в регионе Северная Вирджиния привели к сбоям в работе популярных сервисов, включая Signal, Snapchat, Roblox, Zoom, Duolingo.
В официальном техническом отчете Amazon пояснила, что сбой был вызван дефектом в системе управления DNS облачной базы данных Amazon DynamoDB.
Ошибка случилась из-за того, что две автоматические системы Amazon, отвечающие за обновление адресов серверов (DNS), начали работать одновременно и «перепутали» свои действия.
«Из-за удаления активного плана система осталась в несогласованном состоянии, что не позволяло <…> применять последующие обновления плана. Эта ситуация в конечном итоге потребовала ручного вмешательства оператора для исправления», - говорится в сообщении пресс-службы Amazon.
Компания заявила, что уже отключила сбойные процессы обновления DNS, внедрила дополнительные меры защиты и тестирования для предотвращения подобных инцидентов в будущем.
«Приносим извинения за ущерб, нанесенный этим событием нашим клиентам. Несмотря на то, что мы имеем богатый опыт предоставления услуг с высочайшим уровнем доступности, мы понимаем, насколько критически важны наши услуги для наших клиентов, их приложений, конечных пользователей и их бизнеса», - добавили в компании.