Tesseract

Tesseract

Tesseract.js는 이미지에서 거의 모든 언어로 단어를 가져 오는 자바 스크립트 라이브러리입니다.
Tesseract.js는 이미지에서 거의 모든 언어로 단어를 가져 오는 자바 스크립트 라이브러리입니다.Tesseract OCR 엔진은 1995 UNLV 정확도 테스트에서 3 대 엔진 중 하나였습니다.1995 년과 2006 년 사이에는 거의 작업이 없었지만 아마도 가장 정확한 오픈 소스 OCR 엔진 중 하나 일 것입니다.소스 코드는 이진, 회색 또는 컬러 이미지를 읽고 텍스트를 출력합니다.압축되지 않은 TIFF 이미지를 읽을 수있는 tiff 리더가 내장되어 있거나 압축 이미지를 읽기 위해 libtiff를 추가 할 수 있습니다.Fraktur 및 Blackletter 서체에서 설정된 텍스트에 대해서도 여러 언어의 언어 파일이 있습니다 ....
tesseract

Linux 용 Tesseract의 대안

GImageReader

GImageReader

gImageReader는 Tesseract OCR 엔진의 간단한 Gtk / Qt 프론트 엔드입니다. 특징 :-디스크, 스캔 장치, 클립 보드 및 스크린 샷에서 PDF 문서 및 이미지 가져 오기
CuneiForm

CuneiForm

CuneiForm (OpenOCR)은 인쇄 된 템플릿을위한 텍스트 인식 소프트웨어입니다.원고 또는 PDF 파일은 프로그램이 인식 할 수 없지만 테이블 구조는 인식 할 수 없습니다.
CopyFish

CopyFish

모든 웹 사이트의 이미지 / 비디오 / PDF에서 텍스트를 추출하고 번역하십시오.
OCRFeeder

OCRFeeder

OCRFeeder는 문서 레이아웃 분석 및 광학 문자 인식 시스템입니다.
GOCR

GOCR

GOCR은 GNU Public License에 따라 개발 된 OCR (Optical Character Recognition) 프로그램입니다.스캔 한 텍스트 이미지를 다시 텍스트 파일로 변환합니다.
OCRopus

OCRopus

OCRopus (tm)는 최첨단 문서 분석 및 OCR 시스템으로, 플러그 가능 레이아웃 분석, 플러그 가능 문자 인식, 통계 자연 언어 모델링 ...
VietOCR

VietOCR

Tesseract OCR 엔진을위한 Java / .NET GUI 프론트 엔드.베트남어에 대한 광학 문자 인식을 지원합니다.
OCRmyPDF

OCRmyPDF

OCRmyPDF는 스캔 한 PDF 파일에 OCR 텍스트 레이어를 추가하여 검색하거나 복사하여 붙여 넣을 수 있습니다.
WatchOCR

WatchOCR

WatchOCR은 감시 폴더의 이미지에서 검색 가능한 PDF를 만드는 오픈 소스 OCR 서버입니다.
YAGF

YAGF

CuneiForm의 또 다른 그래픽 프론트 엔드 인 YAGF는 ...