Las bases de datos tradicionales son bases de datos relacionales, que almacenan datos en filas y columnas y enfatizan la capacidad de desnormalizar los datos y vincularlos con claves primarias y externas. Esto es muy adecuado para casos de uso tradicionales como una base de datos de clientes y pedidos para almacenar y rastrear a sus clientes, el inventario, los productos y los artículos que el cliente ha comprado.
Las bases de datos gráficas resuelven un problema diferente, enfatizan las relaciones entre los datos en grandes redes conectadas y permiten el almacenamiento, modelado y consulta de estos nuevos conjuntos de datos y casos de uso. Describiremos el contexto y algunos de los casos de uso de ejemplo en los que una base de datos gráfica es más adecuada que una base de datos relacional.
¿Qué es una base de datos gráfica?
Las bases de datos de gráficos proporcionan un enfoque basado en la relación para almacenar y consultar datos. Almacenan datos de una manera lógica que representa la red del mundo real y prioriza las representaciones, la capacidad de descubrimiento y la capacidad de mantenimiento de las relaciones de datos.
Las bases de datos de grafos utilizan estructuras de grafos para consultas semánticas con nodos, llamados vértices, aristas y propiedades para representar y almacenar datos.
- Vértice - representa un objeto del mundo real, como una película o una persona.
- Borde - representa una relación entre dos vértices.
- Propiedades - similar a los campos en una tableta pero más flexible. Se puede aplicar a un borde o un vértice.
Las bases de datos de gráficos se pueden consultar utilizando lenguajes orientados a gráficos como Sparkql, que son adecuados para expresar problemas en dominios de gráficos grandes.
Bases de datos de gráficos más populares
Hay docenas de bases de datos de gráficos comerciales y de código abierto, pero la base de datos de gráficos más popular actualmente disponible es definitivamente Neo4j, que es una base de datos de gráficos de código abierto descrita por sus desarrolladores como una base de datos transaccional compatible con ACID con almacenamiento y procesamiento de gráficos nativos.
Otras bases de datos de gráficos populares incluyen OrientDB (un sistema de administración de base de datos NoSQL de código abierto escrito en Java), ArangoDB (un sistema de base de datos nativo de múltiples modelos desarrollado por triAGENS GmbH), MarkLogic (una base de datos de múltiples modelos diseñada para la velocidad y escala de NoSQL) y AllegroGraph (un almacén de triples de código cerrado que está diseñado para almacenar triples de RDF), solo por nombrar algunos.
Casos de uso de bases de datos gráficas
Las bases de datos de gráficos son aplicables en todos los lugares donde las relaciones de datos son valiosas en tiempo real:
- Redes sociales - Quizás el caso de uso más típico de una base de datos gráfica son las redes sociales, con sus complejas relaciones y actividad de los usuarios.
- Detección de fraudes - Para descubrir el fraude en tiempo real, es fundamental realizar un análisis rápido de las relaciones de datos y las bases de datos de gráficos proporcionan el rendimiento necesario.
- Gráficos de conocimiento - Utilizados tanto por los motores de búsqueda como por las empresas, los gráficos de conocimiento recopilan información de una amplia variedad de fuentes, lo que permite una mejor gestión de los activos digitales y una recuperación de información más sencilla.
- Análisis de redes de TI - La gestión de redes e infraestructuras de TI gira en torno a interdependencias complejas, y las bases de datos de gráficos son inherentemente más adecuadas para este caso de uso que las bases de datos relacionales.
- Recomendaciones - Las empresas pueden utilizar bases de datos de gráficos para impulsar sofisticados motores de recomendación para personalizar productos, contenido y servicios.
- Gestión de identidad - Las bases de datos gráficas permiten un seguimiento eficiente de la actividad del usuario y autorizaciones rápidas y gestión de activos.
Conclusión
Las bases de datos gráficas resuelven los desafíos de datos actuales al centrarse no solo en los datos, sino también en las conexiones entre las entradas individuales de la base de datos. Tienen numerosos casos de uso y están disponibles como productos de software impulsados por la comunidad y como software comercial con soporte de nivel empresarial.