Page 12 - 4611
P. 12

шляхом  аналізу  морфем,  що  становлять  словоформу  можна

               розподілити  всі відомі засоби морфологічного аналізу на чотири
               групи (відповідають розглянутим вище школам):
                      1) морфологічний аналіз зі словником основ;
                      2) морфологічний аналіз зі словником словоформ;

                      3) морфологічний аналіз методом логічного множення;
                      4)  морфологічний  аналіз  без  словника,  за  допомогою
               таблиць.

                      Найбільш поширеним типом автоматичного аналізу є аналіз
               зі словником основ, застосовуваний для більшості європейських
               мов.  У  цьому  виді  аналізу,  крім  словника  основ  слів,

               використовується  й  ряд  допоміжних  таблиць.  Словник  містить
               основи простих і складних слів. Якщо слово має кілька основ, то
               словник містить усі форми основ слів. Кожній  основі словника

               ставиться у відповідність сполучення коду основозмінного класу
               і коду, а омонімічній основі - серія сполучень таких кодів. Аналіз
               слова починається з його буквеного аналізу. Його здійснюють з
               метою  правильного  визначення  його  основи,  заміни  буквеного

               складу основи її порядковим номером за словником і визначення
               граматичної  інформації  слова.  Алгоритм  враховує  всі  етапи
               морфологічного  аналізу  за  допомогою  словника  основ  і

               можливих  варіантів  аналізу  при  відхиленні  процесу  від
               однозначних правил.
                      Наприклад,           є     словоформа           consisting.       Послідовним
               накладанням  на  словникові  одиниці  вхідного  словника

               виділяється  основа  consist-,  а  потім  -ing  відшукується  в  списку
               афіксів  англійської  мови.  Якщо  аналіз  здійснюється  справа
               наліво, то спочатку порівнюється суфікс -ing, а потім у словнику

               знаходять решту словоформи - основу consist.
                      У      кожному          словнику          існують        свої      особливості
               суфіксального  словотвору  і  словозміни,  що  ускладнюють

               алгоритм членування словоформ на морфеми. Наприклад, основа
               англійської  словоформи  begging.  При  пошуку  з  кінця
               відкидається  суфікс  -ing.  Залишок  begg-  відшукується  за

               словником. З’ясовується, що такої основи у словнику немає. Тоді
               від  залишку  відсікають  кінцеву  g  і  знову  здійснюють  пошук  за
               словником.
                      Словник основ може містити одиниці двох видів:



                                                           12
   7   8   9   10   11   12   13   14   15   16   17