2 kwietnia, według oficjalnych wiadomości, zespół zkSync ogłosił na Twitterze przyczynę awarii. Produkcja bloku została zatrzymana z powodu awarii bazy danych kolejki bloków. Mimo to nie ma to wpływu na interfejs API serwera. Transakcje są nadal dodawane do pamięci, a usługi zapytań działają normalnie. Chociaż wszystkie komponenty mają kompleksowe monitorowanie, rejestrowanie i ostrzeganie, nie zostały wygenerowane żadne alerty, ponieważ interfejs API działał normalnie. Kiedy doszło do zdarzenia, cały zespół był offline. Naprawę udało się osiągnąć w ciągu 5 minut. Aby rozwiązać podobne problemy, zkSync przydziela agentom monitorującym bazę danych specjalną rolę, umożliwiając im łączenie się z bazą danych i ciągłe zbieranie metryk. Jednocześnie zespół wprowadził mechanizm ostrzegania, który będzie emitowany w przypadku awarii agenta monitorującego bazę danych lub niemożności nawiązania połączenia z bazą danych. Dodatkowo, jeśli sytuacja ulegnie poważnej eskalacji, zespół dyżurowy zostanie natychmiast powiadomiony wieloma kanałami. Jedynym długoterminowym rozwiązaniem jest jednak decentralizacja.