Page 65 - 6246
P. 65

MultiTerm – модуль для ведення глосаріїв.
                                  ExtraTerm  –      модуль    для   автоматичного     пошуку
                           термінологічних кандидатів у текстів і створення глосаріїв на їх
                           основі.
                                  MultiTerm працює як окрема програма синтезу перекладу і
                           дозволяє  екстрагувати  терміни  з  одномовних  і  двомовних
                           документів,  розширювати  і  керувати  термінологічними  базами
                           даних. Можливе також введення термінологічних пар вручну під
                           час перекладу тексту.
                                  Онлайн екстрактори термінології
                                  1. Five Filters – безкоштовний он-лайн проект екстрактора
                           термінології.  Після  внесення  тексту  і  натискання  кнопки
                           «GetTerms»  користувач  отримує  список  найбільш  релевантних
                           термінів. Програма підтримує англійську мову.
                                  2.  TerMine  –  он-лайн  екстрактор,  призначений  для
                           розробки термінологічних банків в галузі біомедицини. Дозволяє
                           вкладати  текст  для  аналізу,  файл  з  текстом  в  *.txt  або  *.pdf
                           форматі, а також URL-адресу. Підтримує англійську мову.
                                  3.  Terminology  Extraction  by  Translated  Labs  –
                           безкоштовний он-лайн екстрактор термінології із тексту. Основна
                           ідея  цього  сайту  полягає  у  порівнянні  частоти  слів  у  певному
                           документі  з  їх  частотою  у  мові.  Слова,  які  дуже  часто
                           з’являються  в  документі,  але  рідко  у  мові,  розглядаються  як
                           терміни.  Terminology  Extraction  використовує  статистику
                           Пуассона,  оцінку  методом  максимальної  правдоподібності  та
                           зворотну частоту документів між частотою слів у завантаженому
                           документі  та  загальним  корпусом  у  100  мільйонів  слів  на  одну
                           мову.  Сайт  використовує  ймовірнісний  засіб  частиномовної
                           розмітки  для  врахування  вірогідності  того,  що  певна
                           послідовність слів може бути терміном. Він створює n-грами слів
                           шляхом мінімізації відносної ентропії. Translated Labs розробили
                           цю технологію, щоб допомогти перекладачам побачити труднощі
                           у  документі та  спростити процес  створення  глосаріїв.  Компанія
                           також використовує його для покращення результатів пошуку  у














                                                           63
   60   61   62   63   64   65   66   67   68   69   70