Page 49 - 6247
P. 49

терміни.  Terminology  Extraction  використовує  статистику
                           Пуассона,  оцінку  методом  максимальної  правдоподібності  та
                           зворотну частоту документів між частотою слів у завантаженому
                           документі  та  загальним  корпусом  у  100  мільйонів  слів  на  одну
                           мову.  Сайт  використовує  ймовірнісний  засіб  частиномовної
                           розмітки  для  врахування  вірогідності  того,  що  певна
                           послідовність слів може бути терміном. Він створює n-грами слів
                           шляхом мінімізації відносної ентропії. Translated Labs розробили
                           цю технологію, щоб допомогти перекладачам побачити труднощі
                           у  документі та  спростити процес  створення  глосаріїв.  Компанія
                           також використовує його для покращення результатів пошуку  у
                           традиційних пошукових системах  (наприклад, Google), надаючи
                           кращу оцінку того, наскільки ключове слово має відношення до
                           документа.
                                  Під  термінологічним  менеджментом  розуміють  збір
                           існуючих  термінологічних  ресурсів,  розробку  та  розширення
                           термінології,  перегляд та оновлення термінологічних баз  даних.
                           Якісний менеджмент термінології має низку переваг:
                                  - зменшення фінансових та часових витрат на переклад і
                           створення спеціалізованих текстів;
                                  - мінімалізація помилок та нечіткостей у комунікації;
                                  - ефективність при розробці термінологічних продуктів;
                                  -  спосіб  реалізації  –  terminology  management  system,
                           наприклад, як частини програм для автоматизованого перекладу.

                                                         ХІД РОБОТИ

                                  1.  Знайдіть  технічний  текст  англійською  мовою  обсягом
                           1000 знаків з пробілами.
                                  2. Розпізнайте терміни у тексті за допомогою сайтів:
                           - Five Filters, http://fivefilters.org/term-extraction/
                           - TerMine, http://www.nactem.ac.uk/software/termine/#form
                           -     Terminology       Extraction     by     Translated      Labs,
                           https://labs.translated.net/terminology-extraction/














                                                           47
   44   45   46   47   48   49   50   51   52   53   54