18-10-2023
Microsoft Office Document Imaging (MODI) входит в состав пакета Microsoft Office для поддержки редактирования документов, отсканированных в Microsoft Office Document Scanning. Впервые появился в Microsoft Office XP и включался в поздние версии офиса, включая Office 2007. Более не доступен в Office 2010. MODI позволяет распознавать отсканированные документы.
MODI может читать и писать небольшие изображения формата TIFF. Он также может сохранять распознанный текст в оригинальный TIFF файл. Однако, MODI создаёт .tif файлы которые нарушают стандартны формата TIFF[1] и они могут быть использованы только в пакете Microsoft Office[2].
По умолчанию, движок OCR требует правильной ориентации страницы при распознавании. Если вызвать метод objectname.save(), он может записать исправленное положение страницы в исходный файл.
Точность распознавания этого движка невысокая, и для серьёзного применения он мало годится. К тому же он предъявляет высокие требования к качеству входных изображений.
Содержание |
Через интерфейс COM, MODI предоставляет интерфейс объектной модели, типа документ или изображение. Одна особенность которая представляет практический интерес, это возможность встраиваться в Web интерфейс и распознавать изображения использую встроенный механизм распознавания изображений.
Объект MODI доступен из средств разработки, через программный интерфейс модели COM. Элементы управления MODI доступны через средства разработки которые поддерживают интерфейс ActiveX и использование таких элементов управления. Программный модуль реализующий такой функционал должен быть добавлен в проект, он называется, Microsoft Office Document Imaging Viewer Control 11.0 или 12.0 (MDIVWCTL.DLL). Эти папки обычно находятся в %programfiles%\Common Files\Microsoft Shared\MODI.
MODI стал доступен в MS Office 2003, в то время как связанные программы стали доступны в MS Office XP, объектная модель движка не предоставляет элементов управления, только элемент просмотра.
Пример использования на Visual Basic .NET:
Dim inputFile As String = "C:\test\multipage.tif" Dim strRecText As String = "" Dim Doc1 As MODI.Document Doc1 = New MODI.Document Doc1.Create(inputFile) Doc1.OCR() ' распознавание всех страниц, если файл многостраничный Doc1.Save() ' сохранение переориентированное изображение в оригинальный файл и текст туда же, обратно во входной файл For imageCounter As Integer = 0 To (Doc1.Images.Count - 1) ' срабатывает на кождой странице strRecText &= Doc1.Images(imageCounter).Layout.Text ' помещение результатов работы в строку Next File.AppendAllText("C:\test\testmodi.txt", strRecText) ' сохранение распознанного файла на диск Doc1.Close() ' очистка Doc1 = Nothing
В Office 2003 Service Pack 3, Microsoft исключила ассоциации с файлами типа .TIF and .TIFF с приложением Microsoft Office Document Imaging, как часть пакета исправления проблем безопасности. Также, TIFF файлы более не используют JPEG сжатие.[3]. Никаких объяснений на этот счёт дано не было.
В Office 2010 MODI полностью отвергнут. Это изменение также затронуло дерево установки, которое не показывает пункт MODI Help, OCR. Internet Fax feature в Office 2010 используют Windows Fax драйвер принтера для генерации изображений формата TIF. MODI и все его компоненты убраны в версии офиса для 64-bit Office 2010.[4]
Если MODI всё же нужен в Office 2010, вот несколько советов (среди прочих):
Microsoft Office | |
---|---|
Клиентские приложения | Accounting · Access · Lync · Entourage · Excel · Groove · InfoPath · InterConnect · MapPoint · OneNote · Outlook · PowerPoint · Project · Publisher · SharePoint Designer · Visio · Word |
Серверные приложения | Communications · Forms · Groove · PerformancePoint · Project · Project Portfolio · SharePoint |
Устаревшие приложения | Binder · Data Analyzer · FrontPage · Liquid Motion · Mail · Office Assistants · PhotoDraw · Photo Editor · Schedule+ · Vizact · Web Components |
Онлайн-службы | Office Online · Office 365 · Office Live Meeting · SkyDrive |
Версии для Windows | 3.0 · 4.0 · 4.3 · 95 · 97 · 2000 · XP · 2003 · 2007 · 2010 · 2013 |
Версии для Mac OS | 98 · 2001 · X · 2004 · 2008 · 2011 |
Технологии | Object Linking and Embedding · Office Open XML · Visual Studio Tools for Office · Visual Basic for Applications |
Категория |
Программное обеспечение для оптического распознавания символов | |||
---|---|---|---|
Свободное |
|
||
Проприетарное |
Cognitive Forms • Expervision • FineReader • Microsoft Office Document Imaging • OmniPage • Readiris • ReadSoft • SimpleOCR • SmartScore • ViewWise |
Это заготовка статьи о программном обеспечении. Вы можете помочь проекту, исправив и дополнив её. |
Microsoft Office Document Imaging.