Автоматизация работы в офисе
| Категория реферата: Рефераты по информатике, программированию
| Теги реферата: реферат народы, антикризисное управление предприятием
| Добавил(а) на сайт: Kurzybov.
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 9 10 11 | Следующая страница реферата
Программа способна работать со сканером как непосредственно, так и через протокол TWAIN. При непосредственном взаимодействии со сканером возможность сканирования цветных изображений не используется, так как предполагается, что текст в любом случае является одноцветным.
Программа использует для сканирования устройство, которое задано по умолчанию. Для того чтобы выбрать такое устройство или изменить его настройку, надо щелкнуть на раскрывающей кнопке рядом с кнопкой «Сканировать» и выбрать в открывшемся меню пункт «Опции» – откроется диалоговое окно «Опции».
Если к компьютеру подключено несколько сканеров или сканер был подключен после установки программы FineReader, следует щелкнуть на кнопке «Выбрать сканер». В этом случае программа проведет поиск подключенных к компьютеру сканеров и позволит выбрать нужный.
Для изменения настроек сканера используют кнопку «Настройки сканера».
Когда сканер выбран, активизируются два флажка в нижней части диалогового окна. Если установить флажок «Показывать диалог TWAIN-драйвера сканера», то сканирование производится через протокол TWAIN с отображением специального диалогового окна. В противном случае программа работает со сканером напрямую. Использовать протокол TWAIN имеет смысл только в том случае, когда работа напрямую невозможна или дает некачественные результаты.
Флажок «Показывать опции перед началом сканирования» применяют только в том случае, когда бумажные страницы документа существенно отличаются друг от друга. Это может быть вызвано, например, свойствами бумаги или тем, что разные страницы печатались в разное время и разными средствами. В этом случае перед сканированием каждой страницы открывается диалоговое окно настройки сканера, чтобы пользователь мог отрегулировать качество процесса.
Сам процесс сканирования происходит в автоматическом режиме. Если требуется обработать много страниц, то лучше всего сначала все их отсканировать, а уже затем приступать к распознаванию. Это связано с тем, что сканирование требует присутствия пользователя из-за необходимости управления сканером (например, для смены страниц), а распознавание может происходить в автоматическом режиме.
2.4. Сегментация документа
Под естественным порядком распознавания текста понимается последовательное распознавание строк слева направо. Однако, если текст разбит на несколько колонок (столбцов) или содержит врезки, подрисуночные подписи, примечания, таблицы и другие элементы форматирования, его распознавание в естественном порядке невозможно. В таких случаях программа разбивает текст на блоки, каждый из которых представляет собой цельный фрагмент текста, распознаваемый в естественном порядке. Такое разбиение документа называется сегментацией.
Автоматическая сегментация – не простая задача для программы. Программа разыскивает промежутки между строками, а также зоны начала и конца строк. Если последовательность строк, идущих подряд, имеет одинаковые зоны начала и конца, то программа рассматривает такую область как текстовый блок.
Если промежутки между строками вообще отсутствуют, то, по всей видимости, речь идет об иллюстрации. Если обнаруживается большое число вертикальных и горизонтальных фрагментов, образующих правильную структуру, то, вероятно, в текст включена таблица.
Если щелкнуть на кнопке «Сегментировать выделенные страницы», то сегментация страницы производится автоматически. Правда, если изображение документа имеет невысокое качество, то сегментация может быть произведена неудачно, что проявится в избыточном количестве слишком мелких блоков.
В таких случаях можно вручную указать границы блоков или изменить автоматическое разбиение. Новые прямоугольные блоки создают методом протягивания мыши. При протягивании создаваемый блок выделяется пунктирной рамкой, которая в момент создания блока превращается в сплошную зеленую линию.
Если страница имеет простой стандартный вид, то проще вручную создать одиночный блок, охватывающий всю страницу, чем предоставить это программе, рискуя возможностью появления ошибок.
Один из созданных блоков всегда является текущим. Он обведен более жирной линией, а его вершины помечены маркерами. Перетаскиванием этих маркеров можно регулировать границы блока.
Для создания блока непрямоугольной формы или изменения последовательности блоков используют кнопки панели инструментов «Инструменты». Все кнопки этой панели используются именно на этапе сегментации.
Программа FineReader различает несколько типов блоков, которые обрабатываются по-разному. Такие блоки выделяются разными цветами. Текстовые блоки обводятся зеленой линией. Чтобы изменить тип блока, следует щелкнуть в пределах блока правой кнопкой мыши и выбрать нужный тип в меню «Тип блока контекстного меню».
2.5. Распознавание документа
После сегментации и установления порядка следования текстовых блоков выполняют последний этап работы – собственно распознавание. Обычно этот этап проходит автоматически.
Если документ напечатан достаточно стандартным шрифтом, который, к тому же, был хорошо воспроизведен при сканировании, то щелчка на кнопке «Распознать открытую страницу» достаточно, чтобы документ был распознан.
Если бумажный документ имеет недостаточную контрастность или необычный шрифт, процедура несколько усложняется. В этом случае программа может не справляться с распознаванием определенных символов и допускать однотипные ошибки.
В таких случаях для больших документов целесообразно сначала провести обучение программы в соответствии с особенностями данного документа. Это достаточно трудоемкий процесс, но он все же проще, чем ручной ввод многостраничного документа.
Настройку распознавания начинают с создания эталона, в котором сохраняются особенности данного документа. Для этого надо дать команду «Сервис®Редактор эталонов», щелкнуть в открывшемся диалоговом окне «Эталоны» на кнопке «Новый эталон» и ввести имя создаваемого эталона.
Для подключения эталона при распознавании, надо щелкнуть на раскрывающей кнопке рядом с кнопкой «Распознать открытую страницу» и выбрать пункт «Опции». В открывшемся диалоговом окне в группе «Обучение» следует выбрать только что созданный эталон. Если предполагается распознавание документа, соответствующего эталону, который был создан и настроен ранее, то выбирается не новый, а старый эталон.
Для «обучения» эталона следует установить флажок «Распознавание с обучением».
Рекомендуем скачать другие рефераты по теме: конспект 6 класс, м реферат.
Категории:
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 9 10 11 | Следующая страница реферата