ItSucks

ItSucks

이 프로젝트는 파일을 다운로드 (및 재개) 할 수있는 Java 웹 스파이더 (웹 크롤러)입니다.또한 정규식 및 다운로드 템플릿을 사용하여 사용자 지정할 수 있습니다.이 응용 프로그램은 스윙 GUI와 콘솔 인터페이스도 제공합니다.모든 백엔드 기능은 별도의 라이브러리에서 사용할 수 있으며 다른 프로젝트에 쉽게 사용할 수 있습니다.

카테고리

Linux 용 ItSucks의 대안

Wget

Wget

GNU Wget은 가장 널리 사용되는 인터넷 프로토콜 인 HTTP (S) 및 FTP를 사용하여 파일을 검색하기위한 무료 소프트웨어 패키지입니다.
HTTrack

HTTrack

전체 웹 사이트를 다운로드하여 재귀 적으로 로컬로 구축하는 웹 사이트 복사 서비스입니다.
ScrapBook

ScrapBook

ScrapBook은 Firefox 확장으로, 웹 페이지를 저장하고 컬렉션을 관리하는 데 도움이됩니다.주요 기능은 가벼움, 속도, 정확성 및 다국어 지원입니다.
ScrapBook X

ScrapBook X

ScrapBook X는 ScrapBook Plus에 기반한 Firefox 애드온이며 최신 버전의 ScrapBook의 여러 기능을 통합합니다.
PageArchiver

PageArchiver

PageArchiver (이전의 "Scrapbook for SingleFile"이라고 함)는 오프라인에서 읽을 수 있도록 웹 페이지를 보관하는 데 도움이되는 Chrome 확장 프로그램입니다. 주요 기능은 다음과 같습니다.
grab-site

grab-site

grab-site는 웹 사이트를 WARC 파일로 아카이브하기위한 크롤러입니다.여기에는 여러 크롤링을 모니터링하기위한 대시 보드가 포함되어 있으며 크롤링 중에 URL 무시 패턴 변경을 지원합니다.
wpull

wpull

Wpull은 WARC 및 Python / Lua 스크립팅을 지원하는 wget 호환 웹 다운로더 및 크롤러입니다.
WebScrapBook

WebScrapBook

고도로 사용자 정의 가능한 구성으로 웹 페이지를 충실하게 캡처하는 브라우저 확장입니다.