30
Gigablast는 실시간 인덱싱을 수행하는 강력한 오픈 소스 새로운 검색 엔진입니다!수천 대의 서버로 확장 가능한 기능.200 개가 넘는 서버에서 120 억 개가 넘는 웹 페이지로 확장되었습니다.32GB 램이있는 듀얼 쿼드 코어와 8 개의 Gigablast 인스턴스를 실행하는 2 개의 160GB Intel SSD는 천만 페이지의 인덱스에서 약 8qps (초당 쿼리)를 수행 할 수 있습니다.드라이브는 최대 저장 용량에 가깝습니다.인덱스 크기를 두 배로 늘리면 qps 속도가 절반으로 줄어 듭니다.(성능 메트릭은 약 10 배 더 빠를 수 있지만 아직 해결하지 못했습니다. 드라이브 공간 사용량은 이미 매우 효율적이기 때문에 거의 동일하게 유지 될 것입니다.) 1 백만 개의 웹 페이지에는 28.6GB의 드라이브 공간이 필요합니다.여기에는 모든 웹 페이지의 색인, 메타 정보 및 압축 된 HTML이 포함됩니다.스파이더 속도는 코어 당 초당 약 1 페이지입니다.따라서 듀얼 쿼드 코어는 초당 8 페이지, 즉 하루 691,200 페이지를 스파이더 링하고 색인을 생성 할 수 있습니다.Gigablast 인스턴스 당 4GB의 RAM이 필요합니다.(인스턴스 = 프로세스) 최적의 성능을 위해 C / C ++로 작성된 라이브 데모.500,000 줄 이상의 C / C ++100 % 관습.단일 바이너리.웹 서버, 데이터베이스 및 기타 모든 것이이 소스 코드에 매우 효율적으로 포함되어 있습니다.관리 및 문제 해결이 쉬워집니다.신뢰할 수 있습니다.2002 년부터 120 억 개가 넘는 고유 한 웹 페이지 인덱스에 대한 수십억 건의 쿼리에 대해 라이브 프로덕션에서 테스트를 거쳤으며, 240 억 건이 미러링되었습니다.매우 빠르고 효율적입니다.큰 숫자를 기록한 소수의 검색 엔진 중 하나입니다.가지고있는 유일한 오픈 소스 검색 엔진.모든 언어를 지원합니다.쿼리시 지정된 언어로 결과를 다른 언어보다 향상시킬 수 있습니다.내부적으로 UTF-8 표현을 사용합니다.기록을 추적하십시오.많은 고객이 사용하고 있습니다.분산 엔터프라이즈 소프트웨어에서 성공적으로 사용되었습니다.검색어 강조 표시가있는 캐시 된 웹 페이지 ....