Noch vor ein paar Jahren waren die Anforderungen übersichtlich, die Unternehmen an ein Storage stellten. Es sollte vor allem schnell, zuverlässig und relativ preisgünstig je Gigabyte sein. Heute unterliegen Storages ganz anderen Kriterien. Von Anfang an sind Computer auf externe Speicher angewiesen, auf denen die auszuführenden Programme, die...
Durch das verteilte Dateisystem HDFS ermöglicht Hadoop die zuverlässige Ablage großer Datenmengen sowie die effiziente Abfrage der Daten durch paralleles Auslesen. Damit Hadoop selbst und andere Applikationen aus dem Big-Data-Umfeld von diesen Vorteilen profitieren können, müssen die verwendeten Dateiformate bestimmte Anforderungen erfüllen. Im Rah...