- A atualização da Sui v1.72 introduziu dois bugs separados que causaram três falhas na mainnet.
- As duas primeiras paradas surgiram devido a uma falha na cobrança de gás relacionada aos novos saldos de endereços.
- Um bug separado no estado de aleatoriedade desencadeou a terceira queda após os validadores reiniciarem.
A Fundação Sui divulgou uma análise detalhada explicando as três interrupções separadas que interromperam a rede em 28 e 29 de maio.
Segundo a fundação, dois bugs introduzidos pelo lançamento do software v1.72 causaram as interrupções. Os incidentes desligaram a blockchain de Camada 1 três vezes em menos de dois dias e provocaram uma queda acentuada no preço do token SII.
A SUI caiu cerca de 8% durante a sequência de interrupções, para um mínimo próximo a $0,90. O token estava sendo negociado em torno de $0,90 na segunda-feira e caiu cerca de 19% ao longo da semana.
A fundação afirmou que nenhum fundo dos usuários esteve em risco durante nenhuma das quedas e nenhuma transação concluída foi revertida.
Novo recurso desencadeou falha na recarga de gás
As duas primeiras quedas foram ligadas a uma falha no sistema de recarga de gás da rede. A versão 1.72 introduziu “saldos de endereço”, um recurso projetado para permitir que os usuários paguem taxas de transação diretamente a partir dos saldos das contas, em vez de depender totalmente de objetos de moedas.
A atualização também introduziu novos caminhos de pagamento que combinam saldos de endereço com pagamentos tradicionais baseados em moedas. O problema surgiu quando várias transações tentaram gastar o mesmo saldo ao mesmo tempo.
Em certos casos, uma transação pode ser cancelada porque não havia fundos suficientes disponíveis. No entanto, parte do sistema de processamento de gás ainda tentou cobrar desses fundos após o cancelamento. Isso criou um saldo negativo durante a liquidação, fazendo com que os validadores travassem.
A primeira queda começou por volta das 7h PT de 28 de maio e durou até cerca de 13h30 PT. Para restaurar a rede rapidamente, os desenvolvedores implementaram uma solução provisória. A equipe reconheceu na época que o patch continha um risco conhecido de baixa probabilidade que ainda poderia interromper a rede. No entanto, o risco se concretizou na manhã seguinte.
Remendo de emergência levou à segunda parada
A segunda queda começou por volta das 5h PT de 29 de maio. Sui disse que algumas transações podem falhar por vários motivos simultaneamente. Em um cenário, o erro de fundos insuficientes que o patch foi projetado para detectar foi ofuscado por outro erro de cancelamento.
Como o erro original foi mascarado, a correção temporária não conseguiu impedir que a mesma condição de saldo negativo se repetisse.
Os validadores travaram uma segunda vez com o mesmo problema subjacente de subfluxo de substância. Os desenvolvedores concluíram um reparo mais abrangente, e validadores suficientes foram atualizados para restaurar a rede por volta das 9h40 PT.
Bug de aleatoriedade causou o terceiro desligamento
A terceira queda não teve relação com o vírus do gás em si. Após os validadores reiniciarem para instalar a segunda correção, a participação no processo de configuração de aleatoriedade da rede caiu abaixo do limite exigido.
O sistema de aleatoriedade se desativava automaticamente conforme projetado. No entanto, um bug separado impediu os validadores de salvar esse estado desativado no disco. Quando os validadores reiniciaram novamente, assumiram incorretamente que o processo de aleatoriedade ainda estava ativo.
Aplicações que dependiam de aleatoriedade on-chain não podiam nem executar nem falhar, fazendo com que transações se acumulassem em uma fila pausada. A rede ficou travada durante a transição da época seguinte porque não conseguiu limpar totalmente essa fila.
A terceira parada começou por volta das 13h30 PT e durou até aproximadamente 19h20 PT. Os desenvolvedores corrigiram o bug de persistência e adicionaram um novo mecanismo permitindo que validadores forçassem o fechamento de uma época parada quando necessário.
A fundação também revelou que ferramentas internas baseadas em IA ajudaram os engenheiros a diagnosticar os incidentes mais rapidamente, consultando logs de validadores, analisando dados de produção e montando métricas operacionais durante os esforços de recuperação.
Relacionado: A mainnet da Sui trava novamente, levantando preocupações sobre confiabilidade
Disclaimer: The information presented in this article is for informational and educational purposes only. The article does not constitute financial advice or advice of any kind. Coin Edition is not responsible for any losses incurred as a result of the utilization of content, products, or services mentioned. Readers are advised to exercise caution before taking any action related to the company.