Disco MapReduce

Disco MapReduce

Disco는 MapReduce 패러다임을 기반으로하고 Python으로 작성된 분산 컴퓨팅을위한 경량의 오픈 소스 프레임 워크입니다.
Disco는 분산 컴퓨팅을위한 mapreduce의 구현입니다.Disco는 Google이 만든 원래 프레임 워크에서와 같이 신뢰할 수없는 컴퓨터 클러스터에 저장된 대용량 데이터 세트에 대한 병렬 계산을 지원합니다.따라서 Disco에서 처리하는 통신 프로토콜,로드 밸런싱, 잠금, 작업 예약 및 내결함성과 같은 배포와 관련된 어려운 기술에 대해 걱정할 필요없이 대용량 데이터 세트를 분석하고 처리 할 수있는 완벽한 도구입니다.
disco-mapreduce

웹 사이트:

풍모

카테고리

Windows 용 Disco MapReduce의 대안

Apache Hadoop

Apache Hadoop

Apache Hadoop은 Apache v2 라이센스에 따라 라이센스가 부여 된 데이터 집약적 인 분산 애플리케이션을 지원하는 오픈 소스 소프트웨어 프레임 워크입니다.
Apache Spark

Apache Spark

Apache Spark ™는 대규모 데이터 처리를위한 빠르고 일반적인 엔진으로, 메모리에서 Hadoop MapReduce보다 최대 100 배 빠르거나 디스크에서 10 배 빠릅니다.
dispy

dispy

dispy는 클러스터의 여러 컴퓨터 중 하나의 컴퓨터 (SMP)에서 여러 프로세서에 분산하여 계산을 병렬로 실행하기위한 Python 프레임 워크입니다.