Le 2 avril, selon les informations officielles, l'équipe zkSync a annoncé la cause de la panne sur Twitter. La production de blocs s'est arrêtée en raison d'une défaillance dans la base de données de la file d'attente de blocs. Malgré cela, l’API du serveur n’est pas affectée. Les transactions continuent d'être ajoutées au pool de mémoire et les services de requête sont normaux. Bien que tous les composants disposent d'une surveillance, d'une journalisation et d'alertes complètes, aucune alerte n'a été déclenchée car l'API fonctionnait normalement. Toute l'équipe était hors ligne lorsque l'incident s'est produit. La réparation a été réalisée en 5 minutes. Pour résoudre des problèmes similaires, zkSync donne aux agents de surveillance de base de données un rôle spécial, leur permettant de se connecter à la base de données et de collecter en continu des métriques. Dans le même temps, l'équipe a introduit un mécanisme d'alerte qui retentit lorsque l'agent de surveillance de la base de données échoue ou ne parvient pas à établir une connexion avec la base de données. De plus, si une situation dégénère sérieusement, une équipe de garde sera immédiatement informée via plusieurs canaux. Mais la seule solution à long terme est la décentralisation.