Page 23 - 4611
P. 23
великої кількості одиниць мови. Для вирішення цієї проблеми в
системах машинного перекладу використовують семнтичні
словники тезауруса Роже. У цих словниках для кожного слова
вказано індексм тих семантичних полів, до яких воно входить.
Автоматичний семантичний аналіз речення полягає в переході
від слів до семантичних індексів. У випадку ж наявності
диз’юнктивних індексів, що вказують на багатозначність,
вибираються ті з них, що повторюються в оточуючому контексті.
Смислову мову, що застосовується для смилового запису
можна описати з позицій інформаційного пошуку у вигляді
системи кодування знань за ознаками позначуваних ними класів
предметів. Значення термінів представлені як комбінації
елементарних семантичних одиниць. Ці одиниці бувають двох
видів: предмети в широкому розумінні, що позначаються
символом Х; та відношення між ними, зображені символом R.
Так, наприклад, R1 позначимо «бути видом», R2 –
відношення «бути покритим», R3 – «бути розташованим», R4 –
«мати». Нехай Х1 – луг, Х2 – ділянка, Х3 – травяниста
рослинність, Х4 – заплава ріки, Х5 – ліс, Х6 – дерева. Тоді зміст
термінів «ліс» і «луг» можна передати таким чином: «ліс» - Х5 =
R1 Х2 R2 Х6, а «луг» - Х1 = R1 Х2 R2 Х3 R3 Х4.
Смислове кодування текстів може будуватися з
використанням особлвих спеціалізованих тезаурусів. Кожне
поняття зіставляється з N-мірним вектором (Z1, Z2, Z3, …, Zn).
При цьому предбачається, що система значеннєвих категорій
задана і скаладається з N різних категорій. Категорія Z, цього
вектора набуває значення, що дорівнює 0, якщо двне поняття не
входить в і-значеннєву категорію; значення, що дорівнює 1, якщо
поняття входить в і-значеннєву категорію; і значення, що
дорівнює -1, якщо поняття входить в і-категорію в протилежному
значенні (тільки на місцях, що відповідають категоріям з
активним протиставленням). Імена, назви об'єктів при цьому
виділяють і ототожнюють спеціальними атрибутами.
Слід зазначити, що в даний час задача побудови
семантичного аналізатора на рівні речень вирішена лише
частково, а на рівні текстів універсальних алгротмів не
розроблено .
23