Apache Kudu 1.10 - jetzt mit Autorisierung & Backup

kudu
Am 9. Juli wurde Apache Kudu 1.10 veröffentlicht. Nur wenige Wochen später hat Cloudera diese Kudu-Version in die neue Hadoop-Distribution CDH 6.3 integriert. Neben vielen Detailverbesserungen und Fehlerkorrekturen enthält Kudu jetzt zwei seit langem erwartete neue Features: "fine-grained authorization via integration with Apache Sentry" "full and ...
Weiterlesen

Einstieg in Neuronale Netze mit TensorFlow und Keras

neuro_titel
Aus der Toolbox des Data Scientists sind sie nicht mehr wegzudenken: Neuronale Netze finden zunehmend überall dort Verbreitung, wo aus Daten Vorhersagen gemacht werden sollen. Ihre Innovation ist einfach beschrieben, aber schwer vorstellbar: Neuronale Netze modellieren Prozesse, die über das menschliche Verständnis hinausgehen. Mit TensorFlow exist...
Weiterlesen

Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 3)

big-data-hadoop3-klein
Fortsetzung des Blogartikels Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 2) Wir geben einen Überblick über die Neuerungen und beleuchten die wichtigen Features der neuen Hadoop-Version. Verbesserte Clusterauslastung durch Yarn Opportunistic Containers Um die Effizienz eines Hadoop Clusters zu erhöhen, muss die Ressourcenauslastung (Prozessor, ...
Weiterlesen

Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 2)

big-data-hadoop2-klein
Fortsetzung des Blogartikels Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 1) Wir geben einen Überblick über die Neuerungen und beleuchten die wichtigen Features der neuen Hadoop-Version. Konfiguration mehrerer HDFS NameNodes Die Konfiguration mehrerer NameNodes erfolgt über die core-site.xml und hdfs-site.xml. Folgende Properties müssen gesetzt...
Weiterlesen

Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 1)

Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 1)
Die Features der Hadoop Version 3 sind bereits seit Ende 2017 verfügbar, wurden aber erst Mitte 2018 von den großen kommerziellen Distributionen adaptiert. Es gibt zu beachtende Änderungen, wie zum Beispiel die Neubelegung der Service Ports, aber auch neue  Features, wie den Support für Erasure Coding innerhalb des HDFS. Die Plattformen  ...
Weiterlesen

Rückblick: Data Works Summit 2019 in Barcelona

Rückblick: Data Works Summit 2019 in Barcelona
Vom 18. bis 21. März fand der Data Works Summit in Barcelona statt. Dort konnten sich die Teilnehmer zu Big Data, AI und Cloud Themen informieren. Schwerpunkte waren Technologien und Lösungen, bei denen Hadoop und weitere Komponenten aus dem Hadoop Ökosystem eine zentrale Rolle spielen. Die Konferenz begann am Montag mit dem zweitägigen Training "H...
Weiterlesen