오픈 소스 OCR 엔진
- 소프트웨어 : Tesseract OCR
- OS : Linux,Mac,Windows
- 프로그래밍 언어 : C++
- 공식 웹사이트 : HOME
Tesseract OCR 상세
Tesseract는 오픈 소스 OCR 또는 광학 문자 인식 엔진 및 명령 줄 프로그램입니다.OCR은 디지털 이미지 내에서 텍스트 문자를 인식 할 수있는 기술입니다.Tesseract의 최신 버전으로 라인 인식에 더 큰 초점이 있지만 캐릭터 패턴을 인식하는 레거시 Tesseract OCR 엔진을 여전히 지원합니다.
Tesseract는 100 개가 넘는 언어를 밖으로 인식 할 수 있으며 다른 언어를 인식하도록 훈련받을 수 있습니다.일반 텍스트, HTML, PDF 등 다양한 출력 형식을 지원합니다.또한 유니 코드 (UTF-8) 지원이 있습니다.