18
Apache Hadoop ist ein Open Source-Software-Framework, das datenintensive verteilte Anwendungen unterstützt, die unter der Apache v2-Lizenz lizenziert sind.Es ermöglicht Anwendungen, mit Tausenden von rechnerunabhängigen Computern und Petabyte an Daten zu arbeiten.
apache-hadoop
Webseite:
http://hadoop.apache.org/Eigenschaften
Kategorien
Apache Hadoop-Alternativen für Linux
9
Apache Spark
Apache Spark ™ ist eine schnelle und allgemeine Engine für die Datenverarbeitung in großem Maßstab. SpeedRun-Programme sind bis zu 100-mal schneller als Hadoop MapReduce im Arbeitsspeicher oder 10-mal schneller auf der Festplatte.
1
Disco MapReduce
Disco ist ein leichtes Open-Source-Framework für verteiltes Computing, das auf dem MapReduce-Paradigma basiert und in Python geschrieben ist.