Page 10 - 4611
P. 10
1.2 Побудова підсистеми морфологічного аналізу
В обчислювальній лінгвістиці під морфологічним аналізом
розуміють аналіз окремих словоформ поза контекстом. У
результаті такого аналізу послідовність словоформ вхідного
тексту замінюється послідовністю інформації про ці словоформи.
Поняття «морфологічний аналіз» в обчислювальній лінгвістиці
відрізняється від традиційного лінгвістичного погляду на даний
вид аналізу. У мовознавстві під морфологією слова розуміють
тільки те, що належить до його форми: закінчення, суфікси,
флексії, корені й інші частини словоформи.
В автоматичній обробці тексту природною мовою за до-
помогою комп’ютера морфологічний аналіз означає процедуру,
унаслідок якої з форми, зовнішнього оформлення слова в тексті
можна одержати відомості про будь-які рівні мовної структури.
У традиційній лінгвістиці словотвір чітко відокремлений від
словозміни. Українські словоформи висота і висотаю - це різні
слова, що мають різні словозмінні основи (висот- і висота-ти).
В обчислювальній лінгвістиці межу між словотвором і
словозміною майже неможливо встановити. Морфологічний
аналіз у системі автоматичної обробки текстів визначається
такими факторами:
• типом природної мови (аналітична (логічна) чи
флективна (синтактична));
• типом алгоритму автоматичної обробки тексту;
• основозмінними класами слів.
Морфологічний аналіз окремо взятої словоформи надає
можливість одержати велику кількість різноманітної інформації
про пізні граматичні категорії на основі аналізу їх синтаксичних
функцій і систем відмінкових, особових і родових закінчень.
Класи незмінних слів виділяються тільки за синтаксичним
принципом. За синтаксичною функцією змінювані слова
об’єднуються в такі групи:
іменники;
прикметники;
дієслова в особовій формі;
дієслова минулого часу, прикметники і дієприкметники;
10