Page 12 - 4611
P. 12
шляхом аналізу морфем, що становлять словоформу можна
розподілити всі відомі засоби морфологічного аналізу на чотири
групи (відповідають розглянутим вище школам):
1) морфологічний аналіз зі словником основ;
2) морфологічний аналіз зі словником словоформ;
3) морфологічний аналіз методом логічного множення;
4) морфологічний аналіз без словника, за допомогою
таблиць.
Найбільш поширеним типом автоматичного аналізу є аналіз
зі словником основ, застосовуваний для більшості європейських
мов. У цьому виді аналізу, крім словника основ слів,
використовується й ряд допоміжних таблиць. Словник містить
основи простих і складних слів. Якщо слово має кілька основ, то
словник містить усі форми основ слів. Кожній основі словника
ставиться у відповідність сполучення коду основозмінного класу
і коду, а омонімічній основі - серія сполучень таких кодів. Аналіз
слова починається з його буквеного аналізу. Його здійснюють з
метою правильного визначення його основи, заміни буквеного
складу основи її порядковим номером за словником і визначення
граматичної інформації слова. Алгоритм враховує всі етапи
морфологічного аналізу за допомогою словника основ і
можливих варіантів аналізу при відхиленні процесу від
однозначних правил.
Наприклад, є словоформа consisting. Послідовним
накладанням на словникові одиниці вхідного словника
виділяється основа consist-, а потім -ing відшукується в списку
афіксів англійської мови. Якщо аналіз здійснюється справа
наліво, то спочатку порівнюється суфікс -ing, а потім у словнику
знаходять решту словоформи - основу consist.
У кожному словнику існують свої особливості
суфіксального словотвору і словозміни, що ускладнюють
алгоритм членування словоформ на морфеми. Наприклад, основа
англійської словоформи begging. При пошуку з кінця
відкидається суфікс -ing. Залишок begg- відшукується за
словником. З’ясовується, що такої основи у словнику немає. Тоді
від залишку відсікають кінцеву g і знову здійснюють пошук за
словником.
Словник основ може містити одиниці двох видів:
12