Apache NiFi ist ein leistungsstarkes Open-Source-Tool für die Datenintegration und -verarbeitung. Mit einer Vielzahl von vordefinierten Prozessoren und Integrationsmöglichkeiten bietet Apache NiFi eine flexible und benutzerfreundliche Plattform für die Entwicklung von Datenverarbeitungspipelines. Dennoch kann es vorkommen, dass die vorhandenen Proz...
Die NiFi Registry, als Sub-Projekt von Apache NiFi, eignet sich hervorragend, um Dataflows zu versionieren. Änderungen in Dataflows lassen sich nachvollziehen und es gibt eine Commit-Historie mit entsprechenden Commit-Nachrichten. Aus diesen und weiteren Gründen haben wir uns bereits in einem vorherigen Blogartikel für die Registry ausgesprochen. D...
Nutzen Sie Apache NiFi noch in Ihrer Hortonworks Dataflow (HDF) Umgebung? Dann ist es höchste Zeit, eine Migration zur neueren Cloudera Dataplatform (CDP) in Betracht zu ziehen. In diesem Blogartikel werde ich die wichtigsten Änderungen zwischen der letzten Apache NiFi-Version auf einer HDF-Umgebung (1.12) und der aktuellen Apache NiFi-Version (1.1...
One of our customers uses self-signed certificates for some internal processes. From a technical perspective, they work as expected. Problems arise after about one year, when the certificates expire. Since they are not officially signed, no one watches them to check when they expire. I was wondering if there was a way to set up an easy watch and al...
Ist eine Anwendung unter einer Open-Source-Lizenz veröffentlicht, wird gerne darauf verwiesen, dass jeder mit entwickeln kann und fehlende Features selbst implementiert werden können. So auch bei Apache NiFi. Fehlt ein Prozessor oder eine Funktion, können diese ohne Probleme nachträglich hinzugefügt werden. Soweit die Theorie, doch wie sieht d...
One key feature of Apache NiFi is scheduling. NiFi dataflows should cover streaming and batch use cases. But how can we connect both worlds together, and what settings are available? In this blog, we want to check the scheduling possibilities and show how to use them correctly. General scheduling options The dataflow engineer has in total two...