Whoosh

Whoosh

Whoosh는 텍스트를 인덱싱하고 인덱스를 검색하기위한 클래스와 함수의 라이브러리입니다.그것은 당신의 콘텐츠에 대한 사용자 정의 검색 엔진을 개발할 수 있습니다.
Whoosh는 순수 Python으로 구현 된 빠르고 기능적인 전체 텍스트 인덱싱 및 검색 라이브러리입니다.프로그래머는이 기능을 사용하여 응용 프로그램 및 웹 사이트에 검색 기능을 쉽게 추가 할 수 있습니다.Whoosh 작동 방식의 모든 부분은 요구 사항을 정확하게 충족하도록 확장 또는 교체 할 수 있습니다.Whoosh의 기능 중 일부는 다음과 같습니다. Pythonic API.순수한 파이썬.컴파일이나 바이너리 패키지가 필요없고 신비한 충돌이 없습니다.필드 인덱싱 및 검색빠른 인덱싱 및 검색-내가 알고있는 다른 순수 Python 검색 솔루션보다 빠릅니다.벤치 마크를 참조하십시오.플러그 가능 스코어링 알고리즘 (BM25F 포함), 텍스트 분석, 저장, 게시 형식 등 강력한 쿼리 언어.생산 품질의 순수한 파이썬 맞춤법 검사기 (내가 아는 한 유일하게).... Whoosh는 다음과 같은 상황에서 유용 할 수 있습니다. 순수 라이브러리 솔루션은 기본 라이브러리를 빌드 / 컴파일하지 않거나 사용자가 강제로 빌드 / 컴파일하도록 강제하지 않습니다.연구 플랫폼으로서 (적어도 Python보다 Java를 읽고 사용하기가 더 쉬운 프로그래머에게는); 사용하기 쉬운 Pythonic 인터페이스가 원시 속도보다 더 중요한 경우.응용 프로그램에서 하나의 심층 통합 검색 / 조회 솔루션을 제대로 사용할 수있는 경우 두 가지 다른 검색 솔루션 (단순 / 저속 / 자체 통합, 색인 / 빠른 / 외부 바이너리 종속성 하나)이 아닌 해당 솔루션에 의존 할 수 있습니다.선택권).Whoosh는 Matt Chaput에 의해 만들어지고 유지됩니다.원래 Side Effects Software의 3D 애니메이션 소프트웨어 Houdini의 온라인 도움말 시스템에서 사용하기 위해 만들어졌습니다.Side Effects Software Inc.는 코드를 공개 소스로 기꺼이 동의했습니다.

상용 라이센스가있는 Java 용 Whoosh 대체