Einfaches Workflow Scheduling via Apache Airflow – ein Usecase aus dem Data Science Umfeld
Ronny Horst
Data Management
Im vorangegangenen Blogartikel haben wir Ihnen die Grundlagen der Workflow-Management-Plattform Apache Airflow vorgestellt. In diesem Artikel gehen wir detaillierter auf das Workflow-Scheduling ein und stellen es anhand eines Use Cases aus dem Text- und Webmining Bereich vor. Kernidee des Use Cases ist es, aktuell diskutierte Themen und T...
Weiterlesen
Talend, NiFi, Spark & Pandas als Data- Engineering-Tools? - Datapreprocessing von Wetterdaten
Ronny Horst
Karriere
In meinem letzten Blogartikel habe ich die Data Science Pipeline (DSP) und insbesondere den Bereich des Data Engineerings anhand meines Praxisprojekts "Evaluierung & Dokumentation der Data Science Pipeline (mit Fokus auf den Data Engineering Kreislauf)" vorgestellt. Dabei lag der Fokus vor allem auf den verschiedenen Arbeitsschritten des Data E...
Weiterlesen
Einstieg in die Data Science Pipeline – Meine zweite Praxisphase
Ronny Horst
Data Management
Im Folgenden werde ich einen kleinen Einblick in die Welt der Data Science geben. Dabei stelle ich das Projekt meiner zweiten Praxisphase vor, mit dem äußerst langen Titel: Evaluierung & Dokumentation der Data Science Pipeline (mit Fokus auf den Data-Engineering-Kreislauf). Mittels Data Science können tiefere Erkenntnisse aus Massendaten gewonn...
Weiterlesen
Duales Studium & Studentenalltag – Einblicke in das Arbeitsleben eines dualen Studenten
Ronny Horst
Unternehmen
Ihr seid unsicher, was euch bei der ORDIX AG in einem dualen Informatikstudium erwarten könnte? Oder euch interessiert einfach, wie der Arbeitsalltag im dualen Studium im Allgemeinen so aussehen kann? Dann lest weiter, denn ich werde euch im Folgenden einen Überblick über das duale Studium bei der ORDIX AG geben. Dadurch möchte ich euch bei eurer S...
Weiterlesen