Dataproc, eine skalierbare Hadoop-Distribution in der Google Cloud
Dominik Kramps
Big Data & AI
Dieser Artikel macht den Aufbau eines Dataproc Clusters in der GCP (Google Cloud Platform) verständlich und ermöglicht es dem Leser ein eigenes Dataproc Cluster in der GCP zu erstellen.  Was ist Dataproc? Dataproc bietet eine vollständig verwaltete Plattform zur Verarbeitung großer Datenmengen, die in der GCP gehostet wird und eine nahtlose In...
Weiterlesen
Password expired: Sensitive Werte aus Hashicorp Vault in NiFi synchronisieren
Philipp Srock
Data Management
Ab der NiFi Version 1.18.0 ist eine Anbindung externer Parameter Provider wie die Hashicorp Vault KV-Secret Engine als „Secret Store“ möglich. Damit können sensitive Informationen automatisch vom Vault (Englisch für Tresor) in NiFi synchronisiert werden. Dieses Feature ermöglicht eine verbesserte Zugangskontrolle der Datenbank, die von den NiFi-Pro...
Weiterlesen
ksqlDB, the superpower in the Kafka universe - Part 2
Muriel Djanko Kamdoum
News
KsqlDB is an event streaming database for building stream processing applications on top of Apache Kafka. In the previous article, ksqlDB was introduced and the benefits, and reasons for the existence of another solution within the Kafka universe to build stream processing applications were outlined. KsqlDB proposes a different approach to Kafka St...
Weiterlesen
ksqlDB, die Superkraft im Kafka Universum - Part 2
Muriel Djanko Kamdoum
Data Management
KsqlDB ist eine Event-Streaming-Datenbank zum Aufbau von Datenstromverarbeitungsanwendungen auf Apache Kafka. Im vorangegangenen Artikel wurde ksqlDB vorgestellt und die Vorteile sowie die Gründe für die Existenz einer weiteren Lösung zur Datenstromverarbeitung innerhalb des Kafka-Universums dargelegt. Im Vergleich zu Kafka Streams verfolgt ksqlDB ...
Weiterlesen
Better be safe than sorry: Backup-Möglichkeiten der NiFi Registry
Janis Ax
Data Management
Die NiFi Registry, als Sub-Projekt von Apache NiFi, eignet sich hervorragend, um Dataflows zu versionieren. Änderungen in Dataflows lassen sich nachvollziehen und es gibt eine Commit-Historie mit entsprechenden Commit-Nachrichten. Aus diesen und weiteren Gründen haben wir uns bereits in einem vorherigen Blogartikel für die Registry ausgesprochen. D...
Weiterlesen
Einstieg in die Welt der Graphdatenbanken
Dennis Hermann
Data Management
Sie habe bestimmt schon von Graphdatenbanken gehört. Graphdatenbanken sind seit Jahren im Gespräch. Gartner listete 2019 Graph Analytics als Trend Nr. 4 der zehn wichtigsten Technologie Trends im Bereich „Data and Analytics" und auch 2021 sind Graphen unter den Top 10 (Gartner Top Data and Analytics Trends for 2021). Was sind Graphdatenbanken? Grap...
Weiterlesen