Page 161 - 4185
P. 161
161
кількості індикаторів вона не повинна перевищувати 1 тис.
записів.
11.5 Електронний словник
11.5.1 Електронний словник: загальні відомості
Електронний словник – словник у комп'ютері або іншому
електронному пристрої. Дані словники дозволяють швидко
знайти потрібне слово, часто з врахуванням морфології і
можливістю пошуку словосполучень (прикладів вживання), а так
само з можливістю перекладу його на інші мови.
З технічної ж точки зору, електронний словник –
комп'ютерна база даних, яка містить словникові статті, що
дозволяють здійснювати швидкий пошук потрібних слів
(словосполучень, фраз).
Електронні словники поділяють на ті, які виконують тільки
одну функцію (наприклад: “тлумачний словник Даля онлайн”), і
ті, які в змозі виконувати багато функцій (наприклад: “ABBYY
LINGVO”).
Комп’ютерний словник для системи редагування
найчастіше створюють на основі частотного словника потрібної
мови. Це зумовлене тим, що слова в тексті за частотою
розподіляють згідно із законом Ципфа. Цей закон формулюють
так: якщо для якогось досить великого тексту скласти список усіх
слів, які вжиті в ньому, полічити для кожного слова частоту його
вживання, розмістити слова в порядку спадання цих частот,
перенумерувати ці слова від 1 (номер „1” присвоюють найбільш
частому слову) до R, то добуток порядкового номера (рангу, r)
будь-якого слова списку на його частоту появи в тексті (1) буде
майже сталою величиною (с):
f∙r = c
На практиці це означає, що, коли перша тисяча слів
частотного словника покриває близько 75% слів будь-якого
тексту, то перші дві тисячі слів лише 80%, перші п’ять тисяч –
лише 85% і т. д. Тобто, покриття тексту словами частотного
словника відбувається дуже нерівномірно: невелика кількість слів
із верхньої частини частотного словника покриває три чверті
тексту, а більшість слів із нижньої його частини – решту, лише
четверту частину.