1
Disco er en implementering af mapreduce til distribueret computing.Disco understøtter parallelle beregninger over store datasæt, der er gemt på en upålidelig klynge af computere, som i de originale rammer oprettet af Google.Dette gør det til et perfekt værktøj til at analysere og behandle store datasæt uden at skulle bekymre sig om vanskelige tekniske forhold relateret til distribution, såsom kommunikationsprotokoller, belastningsbalancering, låsning, jobplanlægning og fejltolerance, som håndteres af Disco.
Internet side:
http://discoproject.org/Funktioner
Kategorier
Alternativer til Disco MapReduce til Windows
18
Apache Hadoop
Apache Hadoop er en open source-softwareramme, der understøtter dataintensive distribuerede applikationer, der er licenseret under Apache v2-licensen.
9
Apache Spark
Apache Spark ™ er en hurtig og generel motor til databehandling i stor skala. SpeedRun programmer op til 100 gange hurtigere end Hadoop MapReduce i hukommelsen eller 10 gange hurtigere på disken.