Soft/OCR: различия между версиями
< Soft
Строка 62: | Строка 62: | ||
[[Файл:cuneiform-qt.png|480px]] | [[Файл:cuneiform-qt.png|480px]] | ||
Для успешного распознавания подготовьте изображение с помощью [[#Scan Tailor Advanced|Scan Tailor Advanced]]. | |||
Установка: | Установка: |
Текущая версия от 21:21, 26 ноября 2024
Программы для подготовки изображений
Scan Tailor Advanced
Scan Tailor | |
---|---|
Разработчик(и) | Virgil Grigoras |
Первый выпуск | 2022 |
Лицензия | GNU GPL v3 |
Сайт | github.com |
Репозиторий | scantailor |
ScanTailor - программа для подготовки изображения к распознаванию.
Когда вы отсканировали изображение, оно:
- цветное
- может быть не достаточно контрастным
- с неправильной ориентацией
и пр.
ScanTailor пошагово поможет вам максимально подготовить изображение к тому, чтобы OCR как можно лучше распознал текст.
Установка:
# apt-get install scantailor
Программы для распознавания
Cuneiform-qt
Cuneiform-qt | |
---|---|
Разработчик(и) | Андрей Черепанов |
Первый выпуск | 2009 |
Лицензия | GNU GPL v3 |
Сайт | github.com |
Репозиторий | cuneiform-qt |
Для успешного распознавания подготовьте изображение с помощью Scan Tailor Advanced.
Установка:
# apt-get install cuneiform-qt
gImageReader
gImageReader | |
---|---|
Разработчик(и) | Sandro Mani |
Первый выпуск | 2009 |
Лицензия | GNU GPL v3 |
Сайт | github.com |
Репозиторий | gimagereader |
Установка:
# apt-get install gimagereader-qt5
или
# apt-get install gimagereader-gtk
- Программа корректно распознает скан книги в простой неформатированный текст, если выбрать:
- режим распознавания "простой текст"
- русский язык
- режим hOCR, PDF - как и следует - больше подходит для PDF
OCRFeeder
OCRFeeder | |
---|---|
Разработчик(и) | Joaquim Rocha (GNOME) |
Первый выпуск | 2009 |
Лицензия | GNU GPL |
Сайт | wiki.gnome.org |
Репозиторий | ocrfeeder |
Установка:
# apt-get install ocrfeeder
Сравнение
Редакторы субтитров | ||||
---|---|---|---|---|
Параметры | Cuneiform-qt | gImageReader | OCRFeeder | |
Движки | Движок Cuneiform | |||
Движок Tesseract | ||||
Движок Gocr | ||||
Движок Ocrad | ||||
Импорт | Импорт изображений | |||
Импорт PDF | ||||
Экспорт | Экспорт в txt | |||
Экспорт в html | ||||
Экспорт в rtf | ||||
Экспорт в tex | ||||
Экспорт в odt | ||||
Экспорт в pdf | ||||
Возможности | Возможность сканирования | |||
Поворот изображения | ||||
Автоповорот изображения | ||||
Настройка яркости-контраста | ||||
Выбор области | ||||
Автовыбор области | ||||
Unpaper | ||||
Устранение перекосов |