Sui раскрывает причину трёх сбоев в основной сети после обновления версии 1.72

Sui раскрывает причину трёх сбоев в основной сети после обновления версии 1.72

Last Updated:
Sui раскрывает причину трёх сбоев в основной сети после обновления версии 1.72
  • Обновление Sui до версии 1.72 добавило два отдельных бага, вызвавших три сбоя основной сети.
  • Первые два остановки были связаны с ошибкой при заряжании газа, связанной с новыми балансами адресов.
  • Отдельная ошибка состояния случайности вызвала третий сбой после перезапуска валидаторов.

Фонд Суй опубликовал подробный анализ отключения, объясняющий три отдельных отключения, которые привели к остановке работы сети 28 и 29 мая.

По данным фонда, две ошибки, появившиеся в версии версии 1.72, вызвали сбои. Эти инциденты трижды отключили блокчейн Layer-1 менее чем за два дня и вызвали резкое падение цены токена SUI.

SUI упал примерно на 8% в период отключения до минимума около $0.90. В понедельник токен торговался примерно на $0.90 и за неделю снизился примерно на 19%.

Фонд заявил, что во время сбоев не было риска средства пользователей, и ни одна завершённая транзакция не была отменена.

Новая функция вызвала отказ газовой зарядки

Первые два отключения были связаны с дефектом в системе зарядки газа в сети. Версия 1.72 ввела «адресные остатки» — функцию, предназначенную для того, чтобы пользователи могли платить комиссию за транзакции напрямую с баланса счета, а не полностью полагаться на монетные объекты.

Обновление также ввело новые пути оплаты, которые объединяют адресные остатки с традиционными платежами на основе монет. Проблема возникала, когда несколько транзакций пытались потратить один и тот же баланс одновременно.

В некоторых случаях транзакция могла быть отменена из-за нехватки средств. Однако часть системы переработки газа всё равно пыталась взимать эти средства после отмены. Это создало отрицательный баланс при расчетах, из-за чего валидаторы вышли из строя.

Первое отключение началось около 7 утра по тихоокеанскому времени 28 мая и продолжалось примерно до 13:30 по тихоокеанскому времени. Чтобы быстро восстановить сеть, разработчики развернули промежуточное исправление. Команда тогда признала, что патч содержит известный риск низкой вероятности, который всё ещё может остановить сеть. Однако риск проявился на следующее утро.

Аварийный патч привёл к второй остановке

Второй отключение начался около 5 утра по тихоокеанскому времени 29 мая. Суй сказала, что некоторые сделки могут одновременно провалиться по нескольким причинам. В одном случае ошибка недостаточного финансирования, на которую был создан патч, была скрыта другой ошибкой отмены.

Поскольку исходная ошибка была замаскирована, временное исправление не смогло предотвратить повторение того же негативного баланса.

Валидаторы вылетали во второй раз из-за той же проблемы с недополнением. Разработчики провели более масштабный ремонт, и достаточно валидаторов обновили сеть примерно к 9:40 утра по тихоокеанскому времени.

Баг случайности вызвал третье отключение

Третий сбой не был связан с самим газовым жуком. После перезапуска валидаторов для установки второго исправления участие в процессе настройки случайности в сети снизилось ниже необходимого порога.

Система случайности автоматически отключалась, как было задумано. Однако отдельная ошибка не позволила валидаторам сохранить отключённое состояние на диск. Когда валидаторы перезапускались, они ошибочно предполагали, что процесс случайности всё ещё активен.

Приложения, основанные на случайности в цепочке, не могли ни выполняться, ни проваляться, из-за чего транзакции накапливались в приостановленной очереди. Сеть застряла во время перехода в следующий период, потому что не могла полностью очистить эту очередь.

Третья остановка началась около 13:30 по тихоокеанскому времени и длилась примерно до 19:20 по тихоокеанскому времени. Разработчики исправили ошибку сохранения и добавили новый механизм, позволяющий валидаторам принудительно закрывать застоявшуюся эпоху при необходимости.

Фонд также раскрыл, что внутренние инструменты на базе искусственного интеллекта помогали инженерам быстрее диагностировать инциденты, запрашивая журналы валидатора, анализируя производственные данные и собирая операционные метрики во время восстановления.

Связанно: Sui Mainnet снова зависает, что вызывает опасения по поводу надёжности

Disclaimer: The information presented in this article is for informational and educational purposes only. The article does not constitute financial advice or advice of any kind. Coin Edition is not responsible for any losses incurred as a result of the utilization of content, products, or services mentioned. Readers are advised to exercise caution before taking any action related to the company.