Chefeat.ru

Здоровое питание

Microsoft Office Document Imaging

18-10-2023

см. также Microsoft Document Imaging Format

Microsoft Office Document Imaging (MODI) входит в состав пакета Microsoft Office для поддержки редактирования документов, отсканированных в Microsoft Office Document Scanning. Впервые появился в Microsoft Office XP и включался в поздние версии офиса, включая Office 2007. Более не доступен в Office 2010. MODI позволяет распознавать отсканированные документы.

MODI может читать и писать небольшие изображения формата TIFF. Он также может сохранять распознанный текст в оригинальный TIFF файл. Однако, MODI создаёт .tif файлы которые нарушают стандартны формата TIFF[1] и они могут быть использованы только в пакете Microsoft Office[2].

По умолчанию, движок OCR требует правильной ориентации страницы при распознавании. Если вызвать метод objectname.save(), он может записать исправленное положение страницы в исходный файл.

Точность распознавания этого движка невысокая, и для серьёзного применения он мало годится. К тому же он предъявляет высокие требования к качеству входных изображений.

Содержание

Программирование

Через интерфейс COM, MODI предоставляет интерфейс объектной модели, типа документ или изображение. Одна особенность которая представляет практический интерес, это возможность встраиваться в Web интерфейс и распознавать изображения использую встроенный механизм распознавания изображений.

Объект MODI доступен из средств разработки, через программный интерфейс модели COM. Элементы управления MODI доступны через средства разработки которые поддерживают интерфейс ActiveX и использование таких элементов управления. Программный модуль реализующий такой функционал должен быть добавлен в проект, он называется, Microsoft Office Document Imaging Viewer Control 11.0 или 12.0 (MDIVWCTL.DLL). Эти папки обычно находятся в %programfiles%\Common Files\Microsoft Shared\MODI.

MODI стал доступен в MS Office 2003, в то время как связанные программы стали доступны в MS Office XP, объектная модель движка не предоставляет элементов управления, только элемент просмотра.

Пример использования на Visual Basic .NET:

Dim inputFile As String = "C:\test\multipage.tif"
Dim strRecText As String = ""
Dim Doc1 As MODI.Document
 
Doc1 = New MODI.Document
Doc1.Create(inputFile)
Doc1.OCR()  ' распознавание всех страниц, если файл многостраничный
Doc1.Save() ' сохранение переориентированное изображение в оригинальный файл и текст туда же, обратно во входной файл
 
For imageCounter As Integer = 0 To (Doc1.Images.Count - 1) ' срабатывает на кождой странице
    strRecText &= Doc1.Images(imageCounter).Layout.Text    ' помещение результатов работы в строку
Next
 
File.AppendAllText("C:\test\testmodi.txt", strRecText)     ' сохранение распознанного файла на диск
 
Doc1.Close() ' очистка
Doc1 = Nothing

Изменения с Office 2003 SP3

В Office 2003 Service Pack 3, Microsoft исключила ассоциации с файлами типа .TIF and .TIFF с приложением Microsoft Office Document Imaging, как часть пакета исправления проблем безопасности. Также, TIFF файлы более не используют JPEG сжатие.[3]. Никаких объяснений на этот счёт дано не было.

В Office 2010 MODI полностью отвергнут. Это изменение также затронуло дерево установки, которое не показывает пункт MODI Help, OCR. Internet Fax feature в Office 2010 используют Windows Fax драйвер принтера для генерации изображений формата TIF. MODI и все его компоненты убраны в версии офиса для 64-bit Office 2010.[4]

Альтернатива MODI для Office 2010

Если MODI всё же нужен в Office 2010, вот несколько советов (среди прочих):

  • Следуя рекомендациям Microsoft, установите MODI из Office 2007, выбрав в установщике только его. (Этот процесс инсталляции работает и с более ранними версиями Office): http://support.microsoft.com/kb/982760
  • Установите Alterna-TIFF viewer: ActiveX элемент для IE или плагин для браузера (для других браузеров): http://www.alternatiff.com/
  • Установите Black Ice’s TIFF Viewer и плагин: http://www.blackice.com/TIFFViewer.htm
  • Установите Cartesian Product’s CPC viewer: CPC View ax (ActiveX для IE) или CPC Lite pi (плагин для других браузеров): http://www.cartesianinc.com/Products/CPCLite/

Примечания

  1. TIFF Revision 6.0 Final — June 3, 1992, Adobe Developers Association
  2. Handling Microsoft Office Document Scanning TNEF and TIFFs in Linux
  3. You may experience issues when you run the Microsoft Office Document Imaging program after you install Office 2003 Service Pack 3
  4. Changes in Word 2010 (for ITPros)

Ссылки

  • Office — Document Imaging Microsoft online help for MODI users.
  • You may experience issues when you run the Microsoft Office Document Imaging program after you install Office 2003 Service Pack 3 — Information on the changes caused by Office 2003 Service Pack 3
  • [1] — Information on how to install Microsoft Office Document Imaging in Office 2007, as it is not installed automatically.
  • Office 2003: Microsoft Office Document Imaging Visual Basic Reference (MODI)
  • Using the Microsoft Office Document Imaging 2003 Object Model — Microsoft reference for programmers.


Microsoft Office Document Imaging.

© 2014–2023 chefeat.ru, Россия, Челябинск, ул. Речная 27, +7 (351) 365-27-13