Soft/OCR: различия между версиями

Материал из ALT Linux Wiki
Нет описания правки
Строка 1: Строка 1:
==Программы для подготовки изображений==
==Программы для подготовки изображений==
===Scan Tailor Advanced===
{|class="wikitable" style="float: right; margin-left: 2em"
! colspan="2" | Scan Tailor
|-
| colspan="2" | [[Изображение:User-menu-scantailor.png|100px|center]]
|-
| '''Разработчик(и)'''
| Virgil Grigoras
|-
| '''Первый выпуск'''
| 2022
|-
| '''Лицензия'''
|   GNU GPL v3
|-
| '''Сайт'''
| [https://github.com/vigri/scantailor-advanced github.com]
|-
| '''Репозиторий'''
| [https://packages.altlinux.org/scantailor/ scantailor]
|}
[[Файл:scantailor.png|480px]]
ScanTailor - программа для подготовки изображения к распознаванию.
Когда вы отсканировали изображение, оно:
*цветное
*может быть не достаточно контрастным
*с неправильной ориентацией
и пр.
ScanTailor пошагово поможет вам максимально подготовить изображение к тому, чтобы OCR как можно лучше распознал текст.
Установка:
# apt-get install scantailor


==Программы для распознавания==
==Программы для распознавания==

Версия от 21:19, 26 ноября 2024

Программы для подготовки изображений

Scan Tailor Advanced

Scan Tailor
User-menu-scantailor.png
Разработчик(и) Virgil Grigoras
Первый выпуск 2022
Лицензия GNU GPL v3
Сайт github.com
Репозиторий scantailor

Scantailor.png

ScanTailor - программа для подготовки изображения к распознаванию.

Когда вы отсканировали изображение, оно:

  • цветное
  • может быть не достаточно контрастным
  • с неправильной ориентацией

и пр.

ScanTailor пошагово поможет вам максимально подготовить изображение к тому, чтобы OCR как можно лучше распознал текст.

Установка:

# apt-get install scantailor

Программы для распознавания

Cuneiform-qt

Cuneiform-qt
User-menu-cuneiform-qt.png
Разработчик(и) Андрей Черепанов
Первый выпуск 2009
Лицензия GNU GPL v3
Сайт github.com
Репозиторий cuneiform-qt

Cuneiform-qt.png

Простую картинку с текстом распознавать не хочет.

Установка:

# apt-get install cuneiform-qt

gImageReader

gImageReader
User-menu-gImageReader.png
Разработчик(и) Sandro Mani
Первый выпуск 2009
Лицензия GNU GPL v3
Сайт github.com
Репозиторий gimagereader

GImageReader.png

Установка:

# apt-get install gimagereader-qt5

или

# apt-get install gimagereader-gtk
  • Программа корректно распознает скан книги в простой неформатированный текст, если выбрать:
    • режим распознавания "простой текст"
    • русский язык
  • режим hOCR, PDF - как и следует - больше подходит для PDF

OCRFeeder

OCRFeeder
User-menu-ocrfeeder.png
Разработчик(и) Joaquim Rocha
(GNOME)
Первый выпуск 2009
Лицензия GNU GPL
Сайт wiki.gnome.org
Репозиторий ocrfeeder

OCRFeeder.png

Установка:

# apt-get install ocrfeeder

Сравнение

Редакторы субтитров
Параметры Cuneiform-qt gImageReader OCRFeeder
Движки Движок Cuneiform
Движок Tesseract
Движок Gocr
Движок Ocrad
Импорт Импорт изображений
Импорт PDF
Экспорт Экспорт в txt
Экспорт в html
Экспорт в rtf
Экспорт в tex
Экспорт в odt
Экспорт в pdf
Возможности Возможность сканирования
Поворот изображения
Автоповорот изображения
Настройка яркости-контраста
Выбор области
Автовыбор области
Unpaper
Устранение перекосов