Page 161 - 4185
P. 161

161

               кількості  індикаторів  вона  не  повинна  перевищувати  1  тис.
               записів.


                      11.5  Електронний словник

                     11.5.1 Електронний словник: загальні відомості

                     Електронний  словник  –  словник  у  комп'ютері  або  іншому
               електронному  пристрої.  Дані  словники  дозволяють  швидко

               знайти  потрібне  слово,  часто  з  врахуванням  морфології  і
               можливістю пошуку словосполучень (прикладів вживання), а так
               само з можливістю перекладу його на інші мови.

                     З  технічної  ж  точки  зору,  електронний  словник  –
               комп'ютерна  база  даних,  яка  містить  словникові  статті,  що
               дозволяють  здійснювати  швидкий  пошук  потрібних  слів
               (словосполучень, фраз).

                     Електронні  словники  поділяють  на  ті,  які  виконують  тільки
               одну функцію (наприклад: “тлумачний словник Даля онлайн”), і
               ті,  які  в  змозі  виконувати  багато  функцій  (наприклад:  “ABBYY

               LINGVO”).
                      Комп’ютерний              словник         для      системи         редагування
               найчастіше створюють на основі частотного словника потрібної
               мови.  Це  зумовлене  тим,  що  слова  в  тексті  за  частотою

               розподіляють  згідно  із  законом  Ципфа.  Цей  закон  формулюють
               так: якщо для якогось досить великого тексту скласти список усіх
               слів, які вжиті в ньому, полічити для кожного слова частоту його

               вживання,  розмістити  слова  в  порядку  спадання  цих  частот,
               перенумерувати ці слова від 1 (номер „1” присвоюють найбільш
               частому  слову)  до  R,  то  добуток  порядкового  номера  (рангу,  r)

               будь-якого слова списку на його частоту появи в тексті (1) буде
               майже сталою величиною (с):
                                                         f∙r = c

                      На  практиці  це  означає,  що,  коли  перша  тисяча  слів
               частотного  словника  покриває  близько  75%  слів  будь-якого
               тексту,  то  перші  дві  тисячі  слів  лише  80%,  перші  п’ять  тисяч  –
               лише  85%  і  т.  д.  Тобто,  покриття  тексту  словами  частотного

               словника відбувається дуже нерівномірно: невелика кількість слів
               із  верхньої  частини  частотного  словника  покриває  три  чверті
               тексту,  а  більшість  слів  із  нижньої  його  частини  –  решту,  лише

               четверту частину.
   156   157   158   159   160   161   162   163   164   165   166