¿Qué significa la base de datos descentralizada para Web3?

1. ¿Por qué necesitamos una base de datos descentralizada?
Hay dos formas básicas de almacenar datos en aplicaciones Web2: sistema de archivos y base de datos. Debido a la falta de productos de bases de datos en Web3, la mayoría de las DApps todavía utilizan bases de datos centralizadas para almacenar datos estructurados, además de almacenar una pequeña cantidad de datos importantes en costosos contratos inteligentes. A medida que los sistemas de archivos descentralizados como IPFS comienzan a utilizarse gradualmente para almacenar datos NFT para aplicaciones Web3, Web3 reconoce y acepta los sistemas de archivos descentralizados. La tecnología de las bases de datos descentralizadas también ha pasado por una ronda de iteraciones, con una variedad de productos nuevos. .
Las bases de datos descentralizadas tienen ventajas únicas sobre las bases de datos centralizadas tradicionales. Pueden reducir el riesgo de falla de un solo punto de los proyectos Web3 y hacer que las Dapps estén completamente descentralizadas.
Las bases de datos descentralizadas son adecuadas para almacenar datos importantes con alta frecuencia de acceso y datos no financieros de Dapp, como por ejemplo:
 Metadatos NFT Datos de votación DAO Libro de pedidos DEX Datos sociales descentralizados, datos de blogs, correo electrónico. Datos complejos de bases de datos relacionales requeridos por Dapp. 2. ¿Qué tipos de sistemas de almacenamiento de bases de datos descentralizados existen?
En los últimos dos años, han surgido muchos proyectos de bases de datos descentralizadas y algunos proyectos innovadores han recibido amplia atención.
 Cerámica:Ceramic es un proyecto que comenzó en 2019. Los datos se almacenan y administran en forma de transmisiones, y se agregan registros de eventos formateados a las transmisiones. Los registros se convertirán en archivos y se cargarán en IPFS. Proporciona consultas de API GraphQL. Ceramic no tiene un modelo de incentivos como IPFS y admite la creación, lectura y actualización de datos (CRU). OrbitDB: OrbitDB es un proyecto más antiguo que Ceramic y también utiliza el sistema de archivos IPFS para el almacenamiento de archivos. Admite el almacenamiento de bases de datos y archivos NoSQL. Tableland: este proyecto se lanzará en 2022 y actualmente se encuentra en versión beta pública. En 2023 se lanzará una versión de producción de Tableland. El almacenamiento de datos requiere el uso de contratos inteligentes, que definen declaraciones SQL y establecen permisos de uso. La lectura de datos se realiza fuera de la cadena y no requiere pago. Actualmente, el contrato se implementa en L2 como ETH y OP. Polybase: el proyecto ya está activo en la red de prueba. Es una base de datos NoSQL que admite operaciones CRUD y cada operación requiere una tarifa. Además, Polybase admite una variedad de sistemas de archivos para almacenar archivos de bases de datos, incluidos discos locales, IPFS, Filecoin, Polystore e incluso AWS S3. Polybase también utiliza canales de pago para pagos de consultas de datos, lo que reduce la frecuencia de las transacciones en cadena y evita retrasos en las consultas causados ​​por los pagos. Web3Q: Proyecto lanzado en 2022, red de prueba ya en línea. Se propone un nuevo protocolo de acceso Web//patrón URL para acceder a los datos. Su modelo de cobro es muy especial. La eliminación de datos es reembolsable. Kwill: Kwill es un sistema de base de datos SQL basado en Arweave que utiliza contratos inteligentes para pagos. KYVE: KYVE es un sistema de base de datos basado en Arwave. Técnicamente, tanto SQL como NoSQL se pueden utilizar para hacer que las bases de datos sean más maduras y eficientes, mientras que NoSQL es más rico y flexible. La estructura de datos de SQL debe ser altamente consistente, con capacidades de consulta conjunta más sólidas, madura y eficiente. La forma KV de NoSQL está más en línea con el patrón de diseño de Ethereum, puede admitir tipos de datos enriquecidos y es flexible y fácil de expandir; . Funcionalmente, es mejor admitir CRUD, pero admitir UD traerá complejidad al sistema. Si el sistema utiliza almacenamiento local, es posible que no se admita la consulta del valor histórico.Si usa IPFS y Arweave, la base de datos debe ser solo para agregar. De lo contrario, habrá múltiples versiones de un dato y el costo de almacenamiento se duplicará. Hay dos opciones para el sistema de archivos subyacente. Es más flexible almacenar archivos localmente y la lógica de recuperación se puede personalizar, lo que es más eficiente y evita la falta de confiabilidad y complejidad causada por el uso de sistemas de archivos descentralizados como Arweave. Por ejemplo: los usuarios usan TokenA para pagar a los mineros de bases de datos, y los mineros deben pagar monedas Arweave para almacenar datos. La superposición de las dos capas de redes genera complejidad. Los archivos de bases de datos se almacenan en sistemas de archivos descentralizados como IPFS y Arweave localmente en el nodo o en la nube S3. De manera similar al almacenamiento descentralizado, mejorar la velocidad de recuperación de datos de almacenamiento, los modelos de incentivos y la economía de tokens, y los algoritmos de garantía para garantizar la disponibilidad de datos son factores clave para determinar si un protocolo se utilizará ampliamente. Un buen modelo de incentivos y un modelo de tokens no solo pueden movilizar el entusiasmo de los nodos para participar, sino también motivarlos a hacer lo correcto. Por ejemplo: proporcionar funciones de recuperación efectivas en lugar de simplemente almacenar datos para obtener recompensas de almacenamiento. El algoritmo de garantía de disponibilidad de datos verifica el almacenamiento de datos del nodo a intervalos y requiere que el nodo proporcione un certificado de disponibilidad de datos. Este certificado complementa los incentivos del nodo para evitar la pérdida de datos. La recuperación de datos afecta directamente la experiencia del usuario y es crucial para la conveniencia y fluidez de Dapp.
 Resumen: El campo de las bases de datos descentralizadas tiene un alto grado de atención y necesidades urgentes, pero actualmente no existe ningún producto ampliamente aceptado y utilizado. La tecnología de bases de datos descentralizadas está menos madura que los sistemas de almacenamiento de archivos descentralizados. Porque la tecnología de bases de datos descentralizadas se basa en sistemas de archivos distribuidos. Muchos proyectos se lanzan en 2022. Mejorar la velocidad de recuperación de los datos almacenados, el modelo de incentivos y la economía de los tokens, y los algoritmos de garantía utilizados para garantizar la disponibilidad de los datos son factores clave para determinar si un protocolo se utilizará ampliamente. El objetivo del protocolo será reducir el tiempo de recuperación, lo cual es crucial para la facilidad de uso y la fluidez de la Dapp.