Joins über mehrere Datenbanksysteme - Was kann Apache NiFis LookUp-Prozessor?
Lukas Rosenfeld
Data Management
Datenquellen wachsen und vermehren sich ständig, egal ob im Internet oder im eigenen Unternehmen. Daten fallen an verschiedenen Stellen und in verschiedenen Formaten an. Um diese Daten sinnvoll zu nutzen, müssen sie oftmals an zentralen Stellen (z.B. in Data Warehouses) zusammengeführt werden.Doch wie führt man die Daten aus vielen verschiedenen Da...
Weiterlesen
Let's commit! Dataflows versionieren mit der NiFi Registry
Janis Ax
Data Management
Nutzen Sie bereits Apache NiFi oder planen Sie es? Dann sollten Sie sich das zugehörige Subprojekt NiFi Registry anschauen! Mit der Apache NiFi Registry können Sie Ihre Dataflows schnell und einfach versionieren, sichern und exportieren. In diesem Blogbeitrag wollen wir auf die Besonderheiten der Registry, die allgemeine Vorgehensweise und natürlic...
Weiterlesen
Pandas Profiler statt Excel für die Ermittlung des Data-Value
ORDIX AG
Data Management
In den Daten so mancher Firma stecke ein größerer Wert, so liest man es immer wieder. Aber wie kann dieser Wert ermittelt werden? Ausgangspunkt sollte hier eine fundierte Betrachtung der Datenbestände sein. Mit der Open-Source Bibliothek „Pandas Profiling" können verfügbare Daten in Tabellenformat, einer effizienten Analyse unterzogen werden. Dies ...
Weiterlesen
Variablen? Parameter? Was denn nun? Wie ein Dataflow in Apache NiFi parametrisiert wird
Janis Ax
Data Management
Wie in jeder Programmiersprache ergibt es auch in Apache NiFi Sinn, einen Dataflow zu parametrisieren. Allerdings gibt es in NiFi zwei Möglichkeiten: Variablen und die relativ neuen Parameter. Was die Unterschiede und Vorteile sind und warum Parameter genutzt werden sollten, klären wir in diesem Blogartikel. Wie in jeder Programmiersprache und...
Weiterlesen
Wettbewerb GermEval 2021 – "ein schöner VW Golf Diesel"
Tobias Bornheim
Big Data & AI
Bei der Verarbeitung natürlicher Sprache stellt sich immer deutlicher heraus, dass sprachspezifische Lösungen den sprachunspezifischen Lösungen überlegen sind. Der jährlich stattfindende GermEval-Wettbewerb hat daher das Ziel, die Forschung in Richtung der Verarbeitung der deutschen Sprache voranzutreiben. Dabei werden die Aufgabenstellungen an akt...
Weiterlesen
Kurzen Prozess machen! Wie nehme ich neue Prozessoren in NiFi auf?
Patrick Münster
Data Management
In der Version 1.14.0 bietet NiFi standardmäßig 288 Prozessoren. Dadurch werden bereits viele Anwendungsfälle abgedeckt. Allerdings ist die umfangreiche Auswahl an Prozessoren trotzdem nicht für jeden Anwendungsfall ausreichend. Für diese Fälle bietet sich die Installation zusätzlicher Prozessoren an. Dabei stellen sich zwei wesentliche Fragen: Wo ...
Weiterlesen