hadoop

Datenintegrationsstandards: Apache NiFi - Der Schlüssel zu effizienten Geschäftsprozessen

NiFi

In den letzten Jahren haben wir bei ORDIX zahlreiche Datenintegrationsprojekte mit unterschiedlichen Anforderungen und aus diversen Branchen erfolgreich umgesetzt. Dabei sind uns eine Vielzahl von Datenintegrationsstandards begegnet, die in Geschäftsprozessen eine zentrale Rolle spielen. In diesem Beitrag werfen wir einen Blick auf die gängigsten D...

Apache Hive Query Troubleshooting – Grundlagen zur Fehlerbehebung bei Hive-Abfragen

ORDIX AG - Sales

Big Data & AI

Mit der Einführung von Apache Hive 3 wurden viele Funktionen und Möglichkeiten der Datenverarbeitung in Hadoop-Umgebungen erweitert, einschließlich der Unterstützung für transaktionale Tabellen. Im Artikel „Apache Hive 3 Transactional Tables - Ein Elefant im Bienenstock“ (siehe hier) wird anhand von mehreren Beispielen erklärt, wie die neue AC...

Der Zoowärter braucht Unterstützung - Komplexität und Abhängigkeiten im Hadoop-Zoo

Christoph Lukasseck

Data Management

Hadoop-Cluster bilden eine komplexe Plattform. Dies wird anhand der Kette von Abhängigkeiten aller involvierter Services eines Hive-Jobs aufgezeigt. In diesem Blogartikel geben wir Tipps, an welchen Stellen ein Admin bzw. Zoowärter die Fehlersuche beginnen kann. Ebenso bietet es Anwendern einen detaillierteren Einblick und ein besseres Verständnis ...

Dataproc, eine skalierbare Hadoop-Distribution in der Google Cloud

Dominik Kramps

Big Data & AI

Dieser Artikel macht den Aufbau eines Dataproc Clusters in der GCP (Google Cloud Platform) verständlich und ermöglicht es dem Leser ein eigenes Dataproc Cluster in der GCP zu erstellen. Was ist Dataproc? Dataproc bietet eine vollständig verwaltete Plattform zur Verarbeitung großer Datenmengen, die in der GCP gehostet wird und eine nahtlose In...

Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 3)

ORDIX AG - Sales

Data Management

Fortsetzung des Blogartikels Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 2) Wir geben einen Überblick über die Neuerungen und beleuchten die wichtigen Features der neuen Hadoop-Version. Verbesserte Clusterauslastung durch Yarn Opportunistic Containers Um die Effizienz eines Hadoop Clusters zu erhöhen, muss die Ressourcenauslastung (Prozessor, ...

Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 2)

ORDIX AG - Sales

Data Management

Fortsetzung des Blogartikels Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 1) Wir geben einen Überblick über die Neuerungen und beleuchten die wichtigen Features der neuen Hadoop-Version. Konfiguration mehrerer HDFS NameNodes Die Konfiguration mehrerer NameNodes erfolgt über die core-site.xml und hdfs-site.xml. Folgende Properties müssen gesetzt...

BLEIBEN SIE INFORMIERT
mit den ORDIX Newslettern!

BLEIBEN SIE INFORMIERT
mit den ORDIX Newslettern!

BLEIBEN SIE INFORMIERT mit den ORDIX Newslettern!

BLEIBEN SIE INFORMIERT mit den ORDIX Newslettern!

BLEIBEN SIE INFORMIERT
mit den ORDIX Newslettern!

BLEIBEN SIE INFORMIERT
mit den ORDIX Newslettern!