Whoosh

Whoosh

Whoosh는 텍스트를 인덱싱하고 인덱스를 검색하기위한 클래스와 함수의 라이브러리입니다.그것은 당신의 콘텐츠에 대한 사용자 정의 검색 엔진을 개발할 수 있습니다.
Whoosh는 순수 Python으로 구현 된 빠르고 기능적인 전체 텍스트 인덱싱 및 검색 라이브러리입니다.프로그래머는이 기능을 사용하여 응용 프로그램 및 웹 사이트에 검색 기능을 쉽게 추가 할 수 있습니다.Whoosh 작동 방식의 모든 부분은 요구 사항을 정확하게 충족하도록 확장 또는 교체 할 수 있습니다.Whoosh의 기능 중 일부는 다음과 같습니다. Pythonic API.순수한 파이썬.컴파일이나 바이너리 패키지가 필요없고 신비한 충돌이 없습니다.필드 인덱싱 및 검색빠른 인덱싱 및 검색-내가 알고있는 다른 순수 Python 검색 솔루션보다 빠릅니다.벤치 마크를 참조하십시오.플러그 가능 스코어링 알고리즘 (BM25F 포함), 텍스트 분석, 저장, 게시 형식 등 강력한 쿼리 언어.생산 품질의 순수한 파이썬 맞춤법 검사기 (내가 아는 한 유일하게).... Whoosh는 다음과 같은 상황에서 유용 할 수 있습니다. 순수 라이브러리 솔루션은 기본 라이브러리를 빌드 / 컴파일하지 않거나 사용자가 강제로 빌드 / 컴파일하도록 강제하지 않습니다.연구 플랫폼으로서 (적어도 Python보다 Java를 읽고 사용하기가 더 쉬운 프로그래머에게는); 사용하기 쉬운 Pythonic 인터페이스가 원시 속도보다 더 중요한 경우.응용 프로그램에서 하나의 심층 통합 검색 / 조회 솔루션을 제대로 사용할 수있는 경우 두 가지 다른 검색 솔루션 (단순 / 저속 / 자체 통합, 색인 / 빠른 / 외부 바이너리 종속성 하나)이 아닌 해당 솔루션에 의존 할 수 있습니다.선택권).Whoosh는 Matt Chaput에 의해 만들어지고 유지됩니다.원래 Side Effects Software의 3D 애니메이션 소프트웨어 Houdini의 온라인 도움말 시스템에서 사용하기 위해 만들어졌습니다.Side Effects Software Inc.는 코드를 공개 소스로 기꺼이 동의했습니다.
whoosh

상용 라이센스가있는 Java 용 Whoosh 대체