Cloudera Cluster Automation mit Ansible (Teil 1)
Johannes Julius Schmitz
Data Management
Zielsetzung  Ziel dieses Blog-Beitrags ist es, einen Überblick über die Möglichkeiten für den automatisierten Aufbau eines Cloudera Clusters (CDH 6.x) mit Hilfe von Ansible zu geben. Zunächst werden die allgemeine Vorgehensweise und die notwendigen Voraussetzungen betrachtet und anschließend konkrete Lösungen für den Aufbau eines Cloudera Clus...
Weiterlesen
Software 2.0: Wie sieht ein Entwicklungzyklus von AI-Systemen aus?
Paul Christ
Data Management
In der herkömmlichen Softwareentwicklung haben Versionsverwaltungssysteme wie Git und darauf aufsetzende Deployment-Tools längst Einzug gehalten und sind aus dem Entwicklungsalltag nicht mehr wegzudenken. In der vergleichsweisen jungen Disziplin des modernen Machine Learning wurden diese erprobten Konzepte im Laufe der Zeit auf die zusätzlichen Anf...
Weiterlesen
Apache Hive 3 Transactional Tables - Ein Elefant im Bienenstock
Dennis Hermann
Data Management
Mit dem Release 3.1.0 der Hortonworks Data Platform (HDP) hat auch Hive 3 Einzug in die Hadoop-Distribution gehalten. Mit Hive 3 wurde die ACID-Funktionalität stark verbessert, sodass Transactional Tables nun der Standard-Tabellentyp sind. Wie Transactional Tables verwendet werden, was es bezüglich des darunterliegenden Dateisystems zu beachte...
Weiterlesen
Bitkom veröffentlicht Leitfaden „Konkrete Anwendungsfälle von Künstlicher Intelligenz & Big-Data in der Industrie“
ORDIX AG
Big Data & AI
Was kann KI in der Praxis leisten? Zur Beantwortung dieser Frage haben über 200 Referenten am 10. und 11. April 2019 auf dem Big-Data.AI Summit ihre praktischen Ansätze für konkrete Probleme aus dem Bereich KI vorgestellt. Jetzt hat die Bitkom den Leitfaden „Konkrete Anwendungsfälle von Künstlicher Intelligenz & Big-Data in der Industrie" ...
Weiterlesen
Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 3)
Aron Tigor Möllers
Data Management
Fortsetzung des Blogartikels Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 2) Wir geben einen Überblick über die Neuerungen und beleuchten die wichtigen Features der neuen Hadoop-Version. Verbesserte Clusterauslastung durch Yarn Opportunistic Containers Um die Effizienz eines Hadoop Clusters zu erhöhen, muss die Ressourcenauslastung (Prozessor, ...
Weiterlesen
Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 2)
Aron Tigor Möllers
Data Management
Fortsetzung des Blogartikels Neuigkeiten im Überblick - Apache Hadoop 3 (Teil 1) Wir geben einen Überblick über die Neuerungen und beleuchten die wichtigen Features der neuen Hadoop-Version. Konfiguration mehrerer HDFS NameNodes Die Konfiguration mehrerer NameNodes erfolgt über die core-site.xml und hdfs-site.xml. Folgende Properties müssen gesetzt...
Weiterlesen