Woran hat's gelegen? Auditing und weitere Neuerungen bei Apache Cassandra 4.0
Aaron Grummt
Data Management
Eine der wichtigsten Aufgaben eines Datenbank-Administrators (DBA) ist die Überwachung der Datenbanken im laufenden Betrieb. Die neue Version der Open-Source-NoSQL-Datenbank Apache Cassandra liefert dafür sehr hilfreiche Auditing Tools. Dieser Blog-Beitrag gibt einen Überblick über die wichtigsten Neuerungen.  What's new?  Zu den wichtigs...
Weiterlesen
Datenmigration nach Exasol: Welche Migrationsmöglichkeiten gibt es? – Teil 1: Exasol-SQL-Statements
Paula Blankenheim
Data Management
Exasol ist eine relationale Datenbank, die für schnelle Datenanalysen optimiert ist. Durch die In-Memory-Verarbeitung ist die Exasol-Datenbank hochperformant und wird als schnellste Analytics Database der Welt beworben. In den TPC-H-Benchmarks erreicht die Exasol-Datenbank seit Jahren Platz 1. Daher lohnt es sich, eine Datenmigration nach Exas...
Weiterlesen
Erfahrungsbericht: Big Data Engineer Traineeprogramm bei der ORDIX AG
ORDIX AG
Karriere
Während meines Studiums der Betriebswirtschaftslehre, entdeckte ich mein Interesse an Datenwissenschaften und entschied mich in diesem Themengebiet professionell tätig zu werden. Obwohl ich die Möglichkeit hatte, mehrere relevante Kurse zu belegen, fehlten mir dennoch teils grundlegende Kenntnisse für den Einstieg als Big Data Engineer. Nach meinem...
Weiterlesen
Ein Twitter-Bot mit Apache NiFi? Ja, das geht!
Janis Ax
Data Management
Ist eine Anwendung unter einer Open-Source-Lizenz veröffentlicht, wird gerne darauf verwiesen, dass jeder mit entwickeln kann und fehlende Features selbst implementiert werden können. So auch bei Apache NiFi. Fehlt ein Prozessor oder eine Funktion, können diese ohne Probleme nachträglich hinzugefügt werden. Soweit die Theorie, doch wie sieht d...
Weiterlesen
Data Science in der Google Cloud – Wie einfach ist der Start und was sollte beachtet werden?
ORDIX AG
Cloud Services
Für mein Masterarbeitsprojekt sollte ein Deep-Learning-Modell zur Generierung von Musik entwickelt werden. Dies ging mit hohen Anforderungen an die benötigte Hardware einher. Heutzutage kann diese Hardware über Cloud Provider wie Google, Amazon oder Microsoft mit ein paar Klicks, ohne Installation von zu Hause, genutzt werden. Auch d...
Weiterlesen
Einfaches Workflow Scheduling via Apache Airflow – ein Usecase aus dem Data Science Umfeld
ORDIX AG
Data Management
Im vorangegangenen Blogartikel haben wir Ihnen die Grundlagen der Workflow-Management-Plattform Apache Airflow vorgestellt. In diesem Artikel gehen wir detaillierter auf das Workflow-Scheduling ein und stellen es anhand eines Use Cases aus dem Text- und Webmining Bereich vor. Kernidee des Use Cases ist es, aktuell diskutierte Themen und T...
Weiterlesen