公式ニュースによると、4月2日、zkSyncチームはTwitterで障害の原因を発表した。ブロックキューデータベースの障害により、ブロックの生成が停止しました。それにもかかわらず、サーバー API は影響を受けません。トランザクションは引き続きメモリプールに追加され、クエリ サービスは正常に動作します。すべてのコンポーネントには包括的な監視、ログ記録、およびアラート機能がありますが、API が正常に機能していたため、アラートはトリガーされませんでした。インシデントが発生したとき、チーム全体がオフラインでした。修理は5分以内に完了しました。同様の問題を解決するために、zkSync はデータベース監視エージェントに特別な役割を与え、エージェントがデータベースに接続してメトリクスを継続的に収集できるようにします。同時に、チームは、データベース監視エージェントに障害が発生した場合、またはデータベースとの接続を確立できない場合に鳴るアラート メカニズムを導入しました。さらに、状況が深刻にエスカレートした場合は、複数のチャネルを通じてオンコール チームにただちに通知されます。しかし、唯一の長期的な解決策は分散化です。