Dieser Tag gehört zu 3 privaten Blog der hier nicht aufgeführt ist.
(PySpark) on YARN - Behind the Scenes (Teil 1)
ORDIX AG
Data Management
In den letzten Wochen wurde ich mehrfach von Kunden gefragt, was im Betriebssystem passiert, wenn Spark bzw. PySpark Jobs ausgeführt werden. Dabei waren vor allem die folgenden Fragen von Interesse: Welche Prozesse werden im Betriebssystem gestartet?Mit welchen Rechten werden diese Prozesse ausgeführt?Welcher Python Interpreter und welche Bibliothe...
Weiterlesen
Fünf vor zwölf: Kein RAC mehr in der SE2 / 19c (Teil 4/4)
Ole Breimann
Data Management
OracleVM   Eine Alternative, Funktionen wie Skalierbarkeit und Hochverfügbarkeit der abgekündigten RAC Option für SE2 abzubilden, bietet die Ebene der Virtualisierung. Oracle bietet mit Oracle VM eine supportete Lösung, Oracle Datenbanken virtualisiert zu betreiben. Der Oracle VM Server unterstützt bei der Einrichtung sogenannter Server Pools,...
Weiterlesen
Fünf vor zwölf: Kein RAC mehr in der SE2/19c (Teil 2/4)
Matthias Jung
Data Management
Betriebssystembasierte Clusterlösungen Streng genommen ist es eigentlich aussichtslos, einen adäquaten Ersatz zu einem RAC in der SE2 zu finden, da Funktionalitäten wie Load-Balancing, Skalierung und ein schnelles Applikationsfailover nur schwer auf anderem Wege vollständig zu implementieren sind. In der Praxis werden, aus unserer Erfahrung heraus,...
Weiterlesen
Fünf vor zwölf: Kein RAC mehr in der SE2/19c (Teil 1/4)
Matthias Jung
Data Management
Mit der Version 19c hat Oracle die RAC Option aus der Standard 2 (SE2) eliminiert. Kunden, die aktuell dieses Feature nutzen, haben damit nur noch ca. zwei Jahre, um sich eine alternative Verfügbarkeitsstrategie für ihre Datenbank zu überlegen. Bis spätestens Mitte 2021 (je nach eingesetzter aktueller Version) müssen sie sich einen neuen Weg suchen...
Weiterlesen
Apache Kudu 1.10 - jetzt mit Autorisierung & Backup
ORDIX AG
Data Management
Am 9. Juli wurde Apache Kudu 1.10 veröffentlicht. Nur wenige Wochen später hat Cloudera diese Kudu-Version in die neue Hadoop-Distribution CDH 6.3 integriert. Neben vielen Detailverbesserungen und Fehlerkorrekturen enthält Kudu jetzt einige, seit langem erwartete neue Features: Hive Metastore Integration"fine-grained authorization via integration w...
Weiterlesen
Einstieg in Neuronale Netze mit TensorFlow und Keras
ORDIX AG
Data Management
Aus der Toolbox des Data Scientists sind sie nicht mehr wegzudenken: Neuronale Netze finden zunehmend überall dort Verbreitung, wo aus Daten Vorhersagen gemacht werden sollen. Ihre Innovation ist einfach beschrieben, aber schwer vorstellbar: Neuronale Netze modellieren Prozesse, die über das menschliche Verständnis hinausgehen. Mit TensorFlow exist...
Weiterlesen