Page 8 - 6440
P. 8

Програми  OCR  у  переважній  більшості  мають  інструменти  для  коректури
       розпізнаного тексту. Так, символи, які програма автоматично не змогла розпізнати,
       програмно  виокремлююся  іншим  кольором.  При  наведенні  на  невпевнено
       розпізнаний  символ  програма  підсвічує  такий  символ  у  вікні,  де  відображається
       скановане  зображення.  Користувач  може  спробувати  сам  розпізнати  символ  на
       сканованому зображенні та виправити його у розпізнаному тексті.
            Варто  застерегти,  що  операцію  вичитування  не  варто  виконувати  для
       документів, які зберігатимуть графічний та текстовий шари (не плутати із текстово-
       графічними  документами  текстових  редакторів,  у  яких  сторінки  можуть  містити
       текст і графіку). В таких документах (переважно це будуть *.pdf та *.djvu) текстовий
       і  графічний  шари  перекриваються.  При  цьому  текстовий  шар  використовується  в
       основному  для  навігації,  а,  отже,  прив’язка  до  місця  у  документі  важливіша  за
       орфографічну і граматичну якість тексту.

            Завдання до виконання.
                  Отримати  придатні  для  редагування  електронні  копії  друкованих
                  матеріалів  використовуючи  фотоелектронні  перетворювачі  та  програми
                  векторизації зображень.
                                        Порядок виконання роботи

          1.  Розпізнати вказаний викладачем графічний файл з використанням програми-
              оцифровувача (FineReader або іншої, вказаної викладачем).
          1.1 Запустити  програму-оцифровувач,  яка  встановлена  на  Вашому  комп’ютері
            (FineReader або іншу, вказану викладачем).
          1.2 Створити новий пакет під стандартним іменем файла  лабораторної роботи у
            папці групи.
          1.3 Завантажити  вказаний  графічний  файл  у  пакет  (Файл\  Открыть
            изображение або еквівалентна команда).
          1.4 Натиснути на кнопку списку ―Распознать‖ (панель інструментів при роботі з
            FineReader) та вибрати пункт ―Опции‖.
          1.5 Ознайомитися  з  вікном  параметрів,  яке  буде  відкрито  та  задати  опцію
            збереження параметрів форматування лише для шрифту. За необхідності задати
            опцію  поділу  розвороту  книги  та,  попередньо  вилучивши  з  пакета,  повторно
            відкрити вказане зображення. За необхідності, змінити мову інтерфейсу. Решту
            параметрів залишити без змін.
          1.6 Запустити процес розпізнавання.
          2.  Переглянути оцифрований (розпізнаний) текст. Ознайомитися з інтерфейсом
              перевірки, описати основні відкриті вікна у вікні програми (їх назви, з ними
              можна  ознайомитися  за  розділом  меню  ―Вид‖).  Знайти  та  виправити
              помилки. Скопіювати вікно програми у буфер обміну.
          3.  Зберегти текст у файл в форматі ―Документ Word‖. Ім’я файла – стандартне,
              розміщення - в папці групи або поточної роботи.
          4.  Використовуючи  планшетний  сканер  та,  за  необхідності,  відповідне
              програмне  забезпечення,  зняти  цифрову  електронну  копію  в  растровому
              форматі  (відсканувати)  вибраний  (вказаний  викладачем)  друкований
              документ.  Зберегти  копію  в  папці  групи  або  поточної  роботи  під
              стандартним іменем файла роботи у форматі *.tif (*.tiff) без компресії. В разі

                                                         6
   3   4   5   6   7   8   9   10   11   12   13