Dataproc, eine skalierbare Hadoop-Distribution in der Google Cloud
Dominik Kramps
Big Data & AI
Dieser Artikel macht den Aufbau eines Dataproc Clusters in der GCP (Google Cloud Platform) verständlich und ermöglicht es dem Leser ein eigenes Dataproc Cluster in der GCP zu erstellen.  Was ist Dataproc? Dataproc bietet eine vollständig verwaltete Plattform zur Verarbeitung großer Datenmengen, die in der GCP gehostet wird und eine nahtlose In...
Weiterlesen
Upgrade von HDFS zu Ozone
Dominik Kramps
Data Management
Mit Apache Ozone ist ein weiteres verteiltes Dateisystem auf den Markt gekommen, welches eine Alternative zu der Hadoop-Kernkomponente HDFS darstellt. Allerdings ist es noch nicht möglich ein automatisiertes In-Place-Upgrade durchzuführen. Nähere Informationen dazu finden Sie hier. Es ist also noch notwendig die Hadoop-Komponenten einzeln auf die V...
Weiterlesen
Schnelles Aufsetzen eines Monitorings durch Grafana und InfluxDB
Dominik Kramps
Data Management
Wenn eine neue IT-Umgebung aufgesetzt wird, stellt sich in der Regel auch die Herausforderung, diese zu überwachen. Die Einrichtung und Konfiguration des Monitorings kann viel Zeit in Anspruch nehmen und je nach Größe der Umgebung sehr komplex werden. Glücklicherweise gibt es Produkte, mit denen eben dieses Monitoring vereinfacht wer...
Weiterlesen