Disco MapReduce

Disco MapReduce

Disco er en let, open-source ramme til distribueret computing baseret på MapReduce-paradigmet og skrevet i Python.
Disco er en implementering af mapreduce til distribueret computing.Disco understøtter parallelle beregninger over store datasæt, der er gemt på en upålidelig klynge af computere, som i de originale rammer oprettet af Google.Dette gør det til et perfekt værktøj til at analysere og behandle store datasæt uden at skulle bekymre sig om vanskelige tekniske forhold relateret til distribution, såsom kommunikationsprotokoller, belastningsbalancering, låsning, jobplanlægning og fejltolerance, som håndteres af Disco.
disco-mapreduce

Internet side:

Funktioner

Kategorier

Alternativer til Disco MapReduce til alle platforme med enhver licens

Apache Hadoop

Apache Hadoop

Apache Hadoop er en open source-softwareramme, der understøtter dataintensive distribuerede applikationer, der er licenseret under Apache v2-licensen.
Apache Spark

Apache Spark

Apache Spark ™ er en hurtig og generel motor til databehandling i stor skala. SpeedRun programmer op til 100 gange hurtigere end Hadoop MapReduce i hukommelsen eller 10 gange hurtigere på disken.
Amazon Kinesis

Amazon Kinesis

Amazon Kinesis-tjenester gør det nemt at arbejde med streaming-data i realtid i AWS-skyen.
dispy

dispy

dispy er en Python-ramme til parallel udførelse af beregninger ved at distribuere dem på tværs af flere processorer på en enkelt maskine (SMP), blandt mange maskiner i en klynge eller ...