Flink의 핵심은 데이터 스트림을 통한 분산 계산을 위해 데이터 분산, 통신 및 내결함성을 제공하는 스트리밍 데이터 흐름 엔진입니다.Flink에는 Flink 엔진을 사용하는 응용 프로그램을 만들기위한 몇 가지 API가 포함되어 있습니다. Java, Scala 및 Python에 포함 된 정적 데이터를위한 DataSet API, Java 및 Scala에 포함 된 무제한 스트림을위한 DataStream API 및 SQL과 같은 표현 언어가 포함 된 Table API자바와 스칼라.또한 Flink는 도메인 별 사용 사례를위한 라이브러리 인 Machine Learning 라이브러리와 그래프 처리 API 및 라이브러리 인 Gelly를 번들로 제공합니다.데이터 입력 및 출력 및 배포를 위해 잘 알려진 다른 오픈 소스 시스템과 Flink를 쉽게 통합 할 수 있습니다.(이전 성층권)
웹 사이트:
http://flink.apache.org카테고리
라이센스가있는 모든 플랫폼에서 Apache Flink를 대체
18
Apache Hadoop
Apache Hadoop은 Apache v2 라이센스에 따라 라이센스가 부여 된 데이터 집약적 인 분산 애플리케이션을 지원하는 오픈 소스 소프트웨어 프레임 워크입니다.
9
Apache Spark
Apache Spark ™는 대규모 데이터 처리를위한 빠르고 일반적인 엔진으로, 메모리에서 Hadoop MapReduce보다 최대 100 배 빠르거나 디스크에서 10 배 빠릅니다.
1
1
Disco MapReduce
Disco는 MapReduce 패러다임을 기반으로하고 Python으로 작성된 분산 컴퓨팅을위한 경량의 오픈 소스 프레임 워크입니다.