1
Disco는 분산 컴퓨팅을위한 mapreduce의 구현입니다.Disco는 Google이 만든 원래 프레임 워크에서와 같이 신뢰할 수없는 컴퓨터 클러스터에 저장된 대용량 데이터 세트에 대한 병렬 계산을 지원합니다.따라서 Disco에서 처리하는 통신 프로토콜,로드 밸런싱, 잠금, 작업 예약 및 내결함성과 같은 배포와 관련된 어려운 기술에 대해 걱정할 필요없이 대용량 데이터 세트를 분석하고 처리 할 수있는 완벽한 도구입니다.
disco-mapreduce
웹 사이트:
http://discoproject.org/풍모
카테고리
라이센스가있는 모든 플랫폼에서 Disco MapReduce를 대체
18
Apache Hadoop
Apache Hadoop은 Apache v2 라이센스에 따라 라이센스가 부여 된 데이터 집약적 인 분산 애플리케이션을 지원하는 오픈 소스 소프트웨어 프레임 워크입니다.
9
Apache Spark
Apache Spark ™는 대규모 데이터 처리를위한 빠르고 일반적인 엔진으로, 메모리에서 Hadoop MapReduce보다 최대 100 배 빠르거나 디스크에서 10 배 빠릅니다.
1