Page 65 - 6246
P. 65
MultiTerm – модуль для ведення глосаріїв.
ExtraTerm – модуль для автоматичного пошуку
термінологічних кандидатів у текстів і створення глосаріїв на їх
основі.
MultiTerm працює як окрема програма синтезу перекладу і
дозволяє екстрагувати терміни з одномовних і двомовних
документів, розширювати і керувати термінологічними базами
даних. Можливе також введення термінологічних пар вручну під
час перекладу тексту.
Онлайн екстрактори термінології
1. Five Filters – безкоштовний он-лайн проект екстрактора
термінології. Після внесення тексту і натискання кнопки
«GetTerms» користувач отримує список найбільш релевантних
термінів. Програма підтримує англійську мову.
2. TerMine – он-лайн екстрактор, призначений для
розробки термінологічних банків в галузі біомедицини. Дозволяє
вкладати текст для аналізу, файл з текстом в *.txt або *.pdf
форматі, а також URL-адресу. Підтримує англійську мову.
3. Terminology Extraction by Translated Labs –
безкоштовний он-лайн екстрактор термінології із тексту. Основна
ідея цього сайту полягає у порівнянні частоти слів у певному
документі з їх частотою у мові. Слова, які дуже часто
з’являються в документі, але рідко у мові, розглядаються як
терміни. Terminology Extraction використовує статистику
Пуассона, оцінку методом максимальної правдоподібності та
зворотну частоту документів між частотою слів у завантаженому
документі та загальним корпусом у 100 мільйонів слів на одну
мову. Сайт використовує ймовірнісний засіб частиномовної
розмітки для врахування вірогідності того, що певна
послідовність слів може бути терміном. Він створює n-грами слів
шляхом мінімізації відносної ентропії. Translated Labs розробили
цю технологію, щоб допомогти перекладачам побачити труднощі
у документі та спростити процес створення глосаріїв. Компанія
також використовує його для покращення результатів пошуку у
63