3 Minuten Lesezeit (514 Worte)

Einstieg in die Welt der Graphdatenbanken

Sie habe bestimmt schon von Graphdatenbanken gehört. Graphdatenbanken sind seit Jahren im Gespräch. Gartner listete 2019 Graph Analytics als Trend Nr. 4 der zehn wichtigsten Technologie Trends im Bereich „Data and Analytics" und auch 2021 sind Graphen unter den Top 10 (Gartner Top Data and Analytics Trends for 2021).

Was sind Graphdatenbanken?

Graphdatenbanken benutzen Graph-Strukturen, um Daten zu speichern und zu repräsentieren.

Ein Graph besteht dabei aus Knoten und Verbindungen zwischen den Knoten, den Kanten. Der folgende Graph ist ein Ausschnitt aus einem Beispiel von Neo4j. Der Graph zeigt alle Filme und alle Regisseure, bei denen Tom Hanks als Schauspieler und/oder als Regisseur tätig war.

Query: 

MATCH (tom:Person {name: "Tom Hanks"})-[:ACTED_IN]->(tomHanksMovies)<-[:DIRECTED]-(d:Person) RETURN tom,tomHanksMovies,d  

Welche Vorteile bieten Graphdatenbanken wie Neo4j?

  • Datenmodellierung = Whiteboard-freundlich
    Die Datenmodellierung ist unkompliziert und das am Whiteboard erstellte Modell kann direkt übernommen werden. Bei der Erstellung des Datenmodells wird oft mit Beispieldaten am Whiteboard gearbeitet. Diese Daten werden auf natürliche Weise miteinander verbunden, sodass ein Graph entsteht. Anschließend muss das gezeichnete Modell in das korrekte Format der Zieldatenbank transformiert werden.
  • Flexibilität
    Gibt es bei relationalen Datenbanken Schema-Änderungen, so sind Table-Locks und eine Downtime die Folge. Graphdatenbanken sind, wie viele NoSQL-Datenbanken, schemafrei.
    Wenn sich Geschäftsanforderungen oder Datenstrukturen ändern, können jederzeit neue Knoten-Typen und Kanten erstellt werden.
  • Einfacher Einblick in die Daten
    Menschen sind gut darin, Strukturen visuell zu erfassen. Durch die Repräsentation als Graph werden Strukturen und Cluster in den Daten schnell sichtbar.
    Neo4j bietet mit dem Neo4j Browser ein integriertes Tool für die Visualisierung der Daten an.
  • Performance
    Graphdatenbanken können schnell hoch verknüpfte Daten verarbeiten.
    Wenn bei herkömmlichen relationalen Datenbanken die Anzahl und Tiefe der Beziehungen der Tabellen ansteigen, wird das System langsamer. Bei Graphdatenbanken bleiben Schreibgeschwindigkeit und Abfragegeschwindigkeit konstant. Ein Workaround bei relationalen Datenbanken ist häufig eine Denormalisierung der Daten. Das hat zur Folge, dass Daten redundant gehalten werden, wodurch die Datenpflege schwieriger wird und es zu logischen Inkonsistenzen kommen kann.

Wie gelingt der Einstieg?

Neo4j ist eine der beliebtesten Graphdatenbanken und bietet viel Material zum Lernen und Ausprobieren.

Zudem enthält die Benutzeroberfläche Neo4j Browser verschiedene Guides und Tutorials (siehe Bild). Diese bieten einen unkomplizierten Einstieg in Neo4j, die Abfragesprache Cypher und damit in Graphdatenbanken.

Neo4j gibt es als Docker Image, als Desktop Installer und natürlich auch in der Cloud

Fazit

Selbst wenn Sie noch keine AI- oder Analyse-Projekte mit ihren Daten planen, lohnt es sich, die Zeit zu nehmen, um Neo4j als Vertreter der NoSQL-Datenbanken kennenzulernen.

Um ihre bestehenden Daten in die Graph-Datenbank Neo4j zu importieren, gibt es zahlreiche Tools am Markt. Unter anderem bietet das ETL-Tool Talend die Möglichkeit, Neo4j als Speicherort zu nutzen. Damit haben sie dann einen Datenbestand, den sie bereits kennen und von dem aus weitere Fragen an den Graphen gestellt werden können, um neue Erkenntnisse zu gewinnen.

Wollen sie mehr zu NoSQL-Datenbanken und insbesondere Neo4j wissen? Dann besuchen Sie unser Webinar „Neo4j Quickstart" oder unser kostenloses Webinar „NoSQL Überblick".

Senior Chief Consultant bei ORDIX.

Webinarempfehlungen

 

Kommentare

Derzeit gibt es keine Kommentare. Schreibe den ersten Kommentar!
Gäste
Mittwoch, 08. Februar 2023

Sicherheitscode (Captcha)

×
Informiert bleiben!

Bei Updates im Blog, informieren wir per E-Mail.

Weitere Artikel in der Kategorie