Chefeat.ru

Здоровое питание

OCRopus

07-10-2023


OCRopus
Тип

Оптическое распознавание символов

Разработчик

Thomas Breuel, DFKI

Написана на

C++ и Lua

Операционная система

GNU/Linux, Debian GNU/Hurd, Debian GNU/kFreeBSD

Первый выпуск

9 апреля 2007

Тестовая версия

0.4.4 (alpha) / 1 мая 2010

Лицензия

Apache License v2.0

Сайт

http://code.google.com/p/ocropus/

OCRopus — OCR-система на базе не так давно открытого распознающего ядра — tesseract Программный пакет для распознавания текста, развивающийся по принципам Open Source и распространяющееся под Apache License 2.0. По задумке разработчиков, с помощью OCRopus станет возможным определять текстовое содержимое на цифровых изображениях и переводить его в обычный текстовый формат для дальнейшего редактирования. Помимо печатного текста, программа сможет распознавать и рукописные материалы. По состоянию на альфа-релиз, OCRopus использует язык моделирования код из другого проекта поддерживаемого Google OpenFST. OCRopus в настоящее время доступна только для Linux, но существуют сборки и для Debian GNU/Hurd и Debian GNU/kFreeBSD.

Содержание

Использование

В настоящее время OCRopus использует только интерфейс командной строки, принимая указания на входные изображения с текстом, и выводя данные в формате hOCR (открытый формат на основе HTML). Если необходим более точный контроль, можно указать в командной строке команды для выполнения конкретных операций (например, распознание одной строки).

История развития

  • 0.1.0 — Alpha — 22 Oct 2007
  • 0.1.1 — 14 Dec 2007 — Улучшение системы сборки пакета
  • 0.2 — Alpha 2 — 31 May 2008
  • Beta — Scheduled for August 2008
  • 1.0 — Scheduled for Q3 2008 — Пакеты для других операционных систем, +GUI

См. также

Ссылки

  • OCRopus (официальная страница на Google Code)
  • IUPR Publication Server (описание алгоритмов, используемых в OCRopus)
  • OpenFST Официальный сайт

OCRopus.

© 2014–2023 chefeat.ru, Россия, Челябинск, ул. Речная 27, +7 (351) 365-27-13