Page 8 - 6440
P. 8
Програми OCR у переважній більшості мають інструменти для коректури
розпізнаного тексту. Так, символи, які програма автоматично не змогла розпізнати,
програмно виокремлююся іншим кольором. При наведенні на невпевнено
розпізнаний символ програма підсвічує такий символ у вікні, де відображається
скановане зображення. Користувач може спробувати сам розпізнати символ на
сканованому зображенні та виправити його у розпізнаному тексті.
Варто застерегти, що операцію вичитування не варто виконувати для
документів, які зберігатимуть графічний та текстовий шари (не плутати із текстово-
графічними документами текстових редакторів, у яких сторінки можуть містити
текст і графіку). В таких документах (переважно це будуть *.pdf та *.djvu) текстовий
і графічний шари перекриваються. При цьому текстовий шар використовується в
основному для навігації, а, отже, прив’язка до місця у документі важливіша за
орфографічну і граматичну якість тексту.
Завдання до виконання.
Отримати придатні для редагування електронні копії друкованих
матеріалів використовуючи фотоелектронні перетворювачі та програми
векторизації зображень.
Порядок виконання роботи
1. Розпізнати вказаний викладачем графічний файл з використанням програми-
оцифровувача (FineReader або іншої, вказаної викладачем).
1.1 Запустити програму-оцифровувач, яка встановлена на Вашому комп’ютері
(FineReader або іншу, вказану викладачем).
1.2 Створити новий пакет під стандартним іменем файла лабораторної роботи у
папці групи.
1.3 Завантажити вказаний графічний файл у пакет (Файл\ Открыть
изображение або еквівалентна команда).
1.4 Натиснути на кнопку списку ―Распознать‖ (панель інструментів при роботі з
FineReader) та вибрати пункт ―Опции‖.
1.5 Ознайомитися з вікном параметрів, яке буде відкрито та задати опцію
збереження параметрів форматування лише для шрифту. За необхідності задати
опцію поділу розвороту книги та, попередньо вилучивши з пакета, повторно
відкрити вказане зображення. За необхідності, змінити мову інтерфейсу. Решту
параметрів залишити без змін.
1.6 Запустити процес розпізнавання.
2. Переглянути оцифрований (розпізнаний) текст. Ознайомитися з інтерфейсом
перевірки, описати основні відкриті вікна у вікні програми (їх назви, з ними
можна ознайомитися за розділом меню ―Вид‖). Знайти та виправити
помилки. Скопіювати вікно програми у буфер обміну.
3. Зберегти текст у файл в форматі ―Документ Word‖. Ім’я файла – стандартне,
розміщення - в папці групи або поточної роботи.
4. Використовуючи планшетний сканер та, за необхідності, відповідне
програмне забезпечення, зняти цифрову електронну копію в растровому
форматі (відсканувати) вибраний (вказаний викладачем) друкований
документ. Зберегти копію в папці групи або поточної роботи під
стандартним іменем файла роботи у форматі *.tif (*.tiff) без компресії. В разі
6