Im ersten Teil wurden die konzeptionellen Unterschiede von herkömmlicher Softwareentwicklung zu „Software 2.0" näher beleuchtet. In diesem Artikel werden die Lösungen verschiedener Anbieter evaluiert und es wird ein konkreter Vergleich anhand der gebotenen Features aufgestellt. Zudem erfolgt eine Erläuterung der Schwerpunktrichtungen und eine Auswa...
Für Data Science und Maschinelles Lernen sind Python und die vielen verfügbaren Bibliotheken essenzielle Werkzeuge. Für die Speicherung von großen Datenmengen hat sich Hadoop bewährt und mit PySpark gibt es eine einfache Möglichkeit, die Daten im Hadoop Cluster mit Python zu verarbeiten. Für die Arbeit mit Python wird in der Praxis oft die Anaconda...
Ein zentraler Teil der ORDIX-DNA ist der Leitsatz „WISSEN VERMEHRT SICH, INDEM MAN ES TEILT". ORDIX-Seminare beim Kunden oder in unserem Seminarzentrum sind ein wichtiger Bestandteil unseres Portfolios. Seit dem ersten Lockdown in 2020 boomen bei der ORDIX zudem die Online-Seminare. Einen Erfahrungsbericht zu den Erfolgen bei der Umstellung ei...
Zielsetzung Ziel dieses Blog-Beitrags ist es, einen Überblick über die Möglichkeiten für den automatisierten Aufbau eines Cloudera Clusters (CDH 6.x) mit Hilfe von Ansible zu geben. Zunächst werden die allgemeine Vorgehensweise und die notwendigen Voraussetzungen betrachtet und anschließend konkrete Lösungen für den Aufbau eines Cloudera Clus...
In der herkömmlichen Softwareentwicklung haben Versionsverwaltungssysteme wie Git und darauf aufsetzende Deployment-Tools längst Einzug gehalten und sind aus dem Entwicklungsalltag nicht mehr wegzudenken. In der vergleichsweisen jungen Disziplin des modernen Machine Learning wurden diese erprobten Konzepte im Laufe der Zeit auf die zusätzlichen Anf...
Neben den Vorträgen zu den Themen "Cloudfallen aufgedeckt" von Michael Skowasch und "Aufbau einer Data Science Pipeline mit dem Fokus auf IT-Sicherheit" von Nils von Nethen haben Georg Frey, Dennis Netzer und ich einen Vortrag "Einblick in die Black-Box 'Machine Learning'" sowie einen Workshop "Einführung in Machine Learning mit Tensor Flow & K...