Big Data SQL - Teil 1: Grundlagen
Calvin Knoke
Big Data & AI
Oftmals wird von RDBMS oder aber von Big-Data-Systemen gesprochen. Es wird sich also je nach Gebrauch nur für eine der Technologien entschieden. Wie aber lassen sich diese beiden Welten miteinander verbinden und wo liegen die Unterschiede? In diesem Artikel wird das von Oracle bereitgestellte Produkt "Big Data SQL" vorgestellt. Dies beinhaltet eine...
Weiterlesen
Apache Kafka in a Nutshell
David Hagens
Data Management
Vielleicht haben Sie bereits von Apache Kafka gehört. Immerhin wird Kafka (laut eigener Aussage) in über 80% der 'Fortune-100'-Firmen eingesetzt. Doch was ist Kafka überhaupt? Im Folgenden möchte ich versuchen diese Frage zu beantworten. Dabei gehe ich lediglich auf die fachlichen und technischen Grundlagen ein. Eine Installationsanleitung&nbs...
Weiterlesen
Cassandra NetWorker
Alejandro Steven Michaelis
Big Data & AI
EMC NetWorker ist eine häufig verwendete Backuplösung, welche von verschiedenen Unternehmen eingesetzt wird, um ihre Backup- und Recovery-Strategien umzusetzen. Die Software unterstützt durch seine eigenen Module für Datenbanken und Anwendungen (NMDA) die automatisierte Sicherung und Wiederherstellung einer Vielzahl von Softwaresystemen. Hierz...
Weiterlesen
Einstieg in die Data Science Pipeline – Meine zweite Praxisphase
Ronny Horst
Data Management
Im Folgenden werde ich einen kleinen Einblick in die Welt der Data Science geben. Dabei stelle ich das Projekt meiner zweiten Praxisphase vor, mit dem äußerst langen Titel: Evaluierung & Dokumentation der Data Science Pipeline (mit Fokus auf den Data-Engineering-Kreislauf). Mittels Data Science können tiefere Erkenntnisse aus Massendaten gewonn...
Weiterlesen
Cloudera Cluster Automation mit Ansible (Teil 2)
Johannes Julius Schmitz
Data Management
Zielsetzung Dieser Blog-Beitrag baut auf  Teil 1 der Beitragsreihe zum Thema Cloudera Cluster Automation mit Ansible auf. Ziel dieser Reihe von Blog-Beiträgen ist es, einen Überblick über die Möglichkeiten für den automatisierten Aufbau eines Cloudera Clusters (CDH 6.x) mithilfe von Ansible zu geben. Die in diesem Artikel beschriebene Vor...
Weiterlesen
Software 2.0: Experiment Tracking - Fortsetzung
Paul Christ
Data Management
Im ersten Teil wurden die konzeptionellen Unterschiede von herkömmlicher Softwareentwicklung zu „Software 2.0" näher beleuchtet. In diesem Artikel werden die Lösungen verschiedener Anbieter evaluiert und es wird ein konkreter Vergleich anhand der gebotenen Features aufgestellt. Zudem erfolgt eine Erläuterung der Schwerpunktrichtungen und eine Auswa...
Weiterlesen