Big Data &amp; AI

In dieser Artikelreihe werden wiederkehrende Dialogentwurfsmuster und der Einsatz von Active Learning in Dialogsystemen vorgestellt. Anhand des Rasa-Frameworks wird zudem eine Implementation von einigen Beispielen aufgezeigt. Dieser Artikel dient als kurze Einführung in die nötige Terminologie von Dialogsystemen im Allgemeinen und des spezifischen ...

Lesen

Donnerstag, 21. Juli 2022

Let’s plan it – Scheduling in Apache NiFi

Janis Ax

Data Management

One key feature of Apache NiFi is scheduling. NiFi dataflows should cover streaming and batch use cases. But how can we connect both worlds together, and what settings are available? In this blog, we want to check the scheduling possibilities and show how to use them correctly. General scheduling options The dataflow engineer has in total two...

Lesen

Dienstag, 05. Juli 2022

Joins über mehrere Datenbanksysteme - Was kann Apache NiFis LookUp-Prozessor?

Lukas Rosenfeld

Data Management

Datenquellen wachsen und vermehren sich ständig, egal ob im Internet oder im eigenen Unternehmen. Daten fallen an verschiedenen Stellen und in verschiedenen Formaten an. Um diese Daten sinnvoll zu nutzen, müssen sie oftmals an zentralen Stellen (z.B. in Data Warehouses) zusammengeführt werden.Doch wie führt man die Daten aus vielen verschiedenen Da...

Lesen

Mittwoch, 04. Mai 2022

Let's commit! Dataflows versionieren mit der NiFi Registry

Janis Ax

Data Management

Nutzen Sie bereits Apache NiFi oder planen Sie es? Dann sollten Sie sich das zugehörige Subprojekt NiFi Registry anschauen! Mit der Apache NiFi Registry können Sie Ihre Dataflows schnell und einfach versionieren, sichern und exportieren. In diesem Blogbeitrag wollen wir auf die Besonderheiten der Registry, die allgemeine Vorgehensweise und natürlic...

Lesen

Donnerstag, 28. April 2022

Pandas Profiler statt Excel für die Ermittlung des Data-Value

ORDIX AG - Sales

Data Management

In den Daten so mancher Firma stecke ein größerer Wert, so liest man es immer wieder. Aber wie kann dieser Wert ermittelt werden? Ausgangspunkt sollte hier eine fundierte Betrachtung der Datenbestände sein. Mit der Open-Source Bibliothek „Pandas Profiling" können verfügbare Daten in Tabellenformat, einer effizienten Analyse unterzogen werden. Dies ...

Lesen

Donnerstag, 14. April 2022

Variablen? Parameter? Was denn nun? Wie ein Dataflow in Apache NiFi parametrisiert wird

Janis Ax

Data Management

Wie in jeder Programmiersprache ergibt es auch in Apache NiFi Sinn, einen Dataflow zu parametrisieren. Allerdings gibt es in NiFi zwei Möglichkeiten: Variablen und die relativ neuen Parameter. Was die Unterschiede und Vorteile sind und warum Parameter genutzt werden sollten, klären wir in diesem Blogartikel. Wie in jeder Programmiersprache und...

Lesen

Donnerstag, 31. März 2022

BLEIBEN SIE INFORMIERT

BLEIBEN SIE INFORMIERT

Big Data & AI