El 2 de abril, según noticias oficiales, el equipo de zkSync anunció la causa de la interrupción en Twitter. La producción de bloques se detuvo debido a una falla en la base de datos de la cola de bloques. A pesar de esto, la API del servidor no se ve afectada. Se continúan agregando transacciones al mempool y los servicios de consulta son normales. Aunque todos los componentes cuentan con monitoreo, registro y alertas integrales, no se activó ninguna alerta porque la API estaba funcionando normalmente. Todo el equipo estaba desconectado cuando ocurrió el incidente. La reparación se logró en 5 minutos. Para resolver problemas similares, zkSync otorga a los agentes de monitoreo de bases de datos una función especial, permitiéndoles conectarse a la base de datos y recopilar métricas continuamente. Al mismo tiempo, el equipo introdujo un mecanismo de alerta que sonará cuando el agente de monitoreo de la base de datos falle o no pueda establecer una conexión con la base de datos. Además, si una situación empeora gravemente, se notificará inmediatamente a un equipo de guardia a través de múltiples canales. Pero la única solución a largo plazo es la descentralización.