Формат MDI

Формат MDI (Microsoft Document Imaging) — формат, используемый программой Microsoft Office Document Imaging. Его основой является формат TIFF (Tagged Image File Format), но MDI имеет ряд преимуществ, как то:

  • Заметно меньший размер файла,
  • Улучшенное качество изображения.

В обоих форматах возможно сохранение вместе с изображениями текста, распознанного программой оптического распознавания текста (OCR).

Недостатоком формата MDI является его закрытость. Формат редактируется только в своей "родной" программе. Чтобы просмотреть его или экспортировать в формат TIFF можно воспользоваться предложенными ниже бесплатными программами.



MDI2PDF Converter 2.61 FREE


MDI2PDF Converter 2.61 FREE
Простая, но симпатичная программка, для просмотра файлов в формате MDI. Бесплатная версия не позволяет распознавать текст и копировать его.

Прогресс — дело хорошее. Однако люди, гонясь за всяческими нововведениями, часто забывают о старых проверенных и главное нужных вещах. Так получилось и с новой версией Microsoft Office. Разработчики или по недосмотру, или специально не включили в 2007-ю версию своего офисного пакета нормальную поддержку формата .mdi (формат сканированных документов). Точнее поддержка есть, но настроить ее рядовому пользователю будет не совсем просто. При двойном клике на файле такого типа Microsoft Office 2007 выдает ошибку.

Бывает и так, что в век глобальной компьютеризации все еще существуют офисные ПК такой конфигурации, которая не вытягивает Microsoft Office вообще.

На все эти неувязки можно было бы просто закрыть глаза, если бы не тот факт, что среди деловых людей (да и среди простых пользователей) формат MDI достаточно популярный. Но если наш русский человек обычно стремится к тому, чтобы упростить жизнь себе и другим (сканируя текст либо в более универсальный графический файл tiff, либо еще каким-то способом более удобоваримым для большинства пользователей), то иностранцы предпочитают не заморачиваться и почти всю деловую документацию сканируют в mdi. Естественно в таком же виде шлют ее нам, мол, разбирайтесь сами. И мы начинаем разбираться :).

Чтобы не морочиться с настройками и не покупать нового оборудования, можно установить программу стороннего производителя, которая бы взяла на себя функцию просмотрщика mdi-файлов. Я предлагаю использовать MDI2PDF Converter, потому что она умеет корректно открывать mdi-файлы и экспортировать их в форматы bmp и jpg (для бесплатной версии). Но, этот момент можно обойти с помощью некоторых ухищрений, описанных в конце этой статьи.

Установка MDI2PDF Converter

Давайте скачаем и установим MDI2PDF Converte. Открываем архив с программой и запускаем файл с расширением .exe – запустится мастер установки. Следуя подсказкам, установите приложение. Готово – можно запускать. Посмотрим, что мы имеем:

Рабочее окно

Интерфейс MDI2PDF Converter

Интерфейс программы ну уж очень интуитивный. Менюшек минимум – результатов максимум. Хоть программа на английском, но нетрудно понять, что в меню «File» будут опции по открытию/закрытию/печати… файла, а меню «View» отвечает за отображение документа.

Нажмем «File» — «Open» и выберем на жестком диске файл для открытия.

Открытый текст

Внизу и сбоку видны полосы прокрутки, с помощью которых Вы будете осуществлять навигацию по тексту. Для того чтобы быстро перейти на следующую страницу, можно использовать кнопки Прокрутка.

Для масштабирования документа можно использовать кнопки Прокрутка

Повернуть документ на угол, кратный 90 градусам можно с помощью кнопок Прокрутка

К сожалению, бесплатная версия не может конвертировать mdi- в tiff-файл (только в bmp или в jpg, и то, лишь по одному и с постоянным напоминанием о регистрации). Поэтому, чтобы добыть из файла картинку или текст в других форматах, придётся применить смекалку и дополнительный бесплатный софт. Во-первых, нам понадобиться программа для снятия скриншотов: FastStone Screen Capture. С её помощью мы сможем сделать снимок экрана и сохранить его как картинку.

Если же, нам нужно извлечь из полученной картинки непосредственно сам текст (при условии, что он содержиться там в приличном качестве, пригодном для распознавания), то, нам также понадобиться программа для распознавания текста CuneiForm.

Таким образом, даже не имея полнофункционального редактора mdi-документов, мы можем посмотреть и преобразовать эти файлы в то, что нам нужно.

P.S. Данная статья предназначена для свободного распространения. Приветствуется её копирование с сохранением авторства Руслана Тертышного и всех P.S. и P.P.S.

P.P.S. Возможно также Вам пригодится ещё одна программа для просмотра изображений. FastStone Image Viewer умеет открывать графические файлы в форматах TIFF. Поддерживает форматы JPEG, JPEG 2000, GIF, PNG, PCX, PDF, WMF, BMP, ICO, RAW и TGA.:
http://www.bestfree.ru/soft/graph/viewer.php#FastStoneImageViewer




← кнопка для выражения благодарности :)




Ссылки по теме:
Формат PDF: STDU Viewer Формат PDF: STDU Viewer Универсальная программа для чтения электронных книг в форматах PDF, DJVU и TIFF.
Захват экрана: Kleptomania Захват экрана: Kleptomania Программа позволяет захватить и обработать текст и графику в любой, даже не подозревающей о буфере обмена, программе.
Просмотр изображений: FastStone Image Viewer Просмотр изображений: FastStone Image Viewer Просмотрщик изображений с множеством дополнительных функций, включая конвертор, редактор, браузер, режим слайдшоу (более 150 вариантов переходов) и пакетное преобразование.
Распознавание текста: CuneiForm Распознавание текста: CuneiForm Бесплатная программа для автоматического распознавания отсканированного текста. Вид у программы не карамельный, но дело своё она знает.
Коллекция шрифтов: Font Navigator Коллекция шрифтов: Font Navigator Программка для удобного просмотра и установки шрифтов на компьютер, плюс отличный набор русских шрифтов на все случаи жизни.
Формат DjVu: WinDjView Формат DjVu: WinDjView Быстрая и компактная программа для просмотра файлов формата DjVu под Windows с режимом непрерывной прокрутки и расширенными возможности печати
Офис: OpenOffice.org Офис: OpenOffice.org OpenOffice.org — это международный проект с открытыми исходными кодами, созданный для того, чтобы разработать универсальный офисный пакет, работающий на разных операционных платформах, имеющий открытый API и формат файлов, основанный на XML.



Правила добавления комментариев:

1. Все комментарии проходят цензуру, нет смысла спамить.
2. Однозначно будут удалены:
Бессмысленные, нецензурные, глупые комментарии, неаргументированная критика, а также ссылки на файлообменники и прочие сайты не в тему.
3. Приветствуются:
Аргументированные отзывы о данной программе, а также грамотность и умение формулировать свою мысль в рамках приличия.


Виктор 2012-01-22 15:29:33
Эта программа триальная
↑ +2 ↓
Руслан Богданов 2012-01-22 19:05:43
Вы правы, Виктор. К сожалению, ничего более бесплатного я пока не нашёл на эту тему. В этой программе можно хотя бы посмотреть документ и сконвертировать в jpg, чтобы потом можно было хоть как-то его распознать.
↑ 0 ↓
Катерина 2012-03-24 18:13:43
Спасибо. Открывается.
↑ 0 ↓

Оставить комментарий


Ваше имя:

RSS
 
Комментарий:
Введите символы: *
captcha
Обновить

 



RSS-лента
РАССЫЛКА (архив)
САМОРЕАЛИЗАЦИЯ
ГАДАНИЕ НА СОФТЕ
РАСПЕЧАТАТЬ

Бесплатный софт:




Система Orphus