Apache Flink

Apache Flink

Der Kern von Flink ist eine Streaming-Datenfluss-Engine, die Datenverteilung, Kommunikation und Fehlertoleranz für verteilte Berechnungen über Datenströme bietet.Flink enthält mehrere APIs zum Erstellen von Anwendungen, die die Flink-Engine verwenden: DataSet-API für in Java, Scala und Python eingebettete statische Daten, DataStream-API für in Java und Scala eingebettete unbegrenzte Streams und Tabellen-API mit einer in SQL eingebetteten AusdrucksspracheJava und Scala.Flink bündelt außerdem Bibliotheken für domänenspezifische Anwendungsfälle: Machine Learning-Bibliothek und Gelly, eine API und Bibliothek für die Grafikverarbeitung.Sie können Flink problemlos in andere bekannte Open-Source-Systeme integrieren, sowohl für die Dateneingabe und -ausgabe als auch für die Bereitstellung.(Früher Stratosphäre)
stratosphere

Kategorien

Apache Flink-Alternativen für Linux

Splunk

Splunk

Splunk ist eine Software, die von einem Ort aus in Echtzeit eine einzigartige Übersicht über Ihre gesamte IT-Infrastruktur bietet.
Apache Hadoop

Apache Hadoop

Apache Hadoop ist ein Open Source-Software-Framework, das datenintensive verteilte Anwendungen unterstützt, die unter der Apache v2-Lizenz lizenziert sind.
Apache Spark

Apache Spark

Apache Spark ™ ist eine schnelle und allgemeine Engine für die Datenverarbeitung in großem Maßstab. SpeedRun-Programme sind bis zu 100-mal schneller als Hadoop MapReduce im Arbeitsspeicher oder 10-mal schneller auf der Festplatte.
Disco MapReduce

Disco MapReduce

Disco ist ein leichtes Open-Source-Framework für verteiltes Computing, das auf dem MapReduce-Paradigma basiert und in Python geschrieben ist.