Page 49 - 6247
P. 49
терміни. Terminology Extraction використовує статистику
Пуассона, оцінку методом максимальної правдоподібності та
зворотну частоту документів між частотою слів у завантаженому
документі та загальним корпусом у 100 мільйонів слів на одну
мову. Сайт використовує ймовірнісний засіб частиномовної
розмітки для врахування вірогідності того, що певна
послідовність слів може бути терміном. Він створює n-грами слів
шляхом мінімізації відносної ентропії. Translated Labs розробили
цю технологію, щоб допомогти перекладачам побачити труднощі
у документі та спростити процес створення глосаріїв. Компанія
також використовує його для покращення результатів пошуку у
традиційних пошукових системах (наприклад, Google), надаючи
кращу оцінку того, наскільки ключове слово має відношення до
документа.
Під термінологічним менеджментом розуміють збір
існуючих термінологічних ресурсів, розробку та розширення
термінології, перегляд та оновлення термінологічних баз даних.
Якісний менеджмент термінології має низку переваг:
- зменшення фінансових та часових витрат на переклад і
створення спеціалізованих текстів;
- мінімалізація помилок та нечіткостей у комунікації;
- ефективність при розробці термінологічних продуктів;
- спосіб реалізації – terminology management system,
наприклад, як частини програм для автоматизованого перекладу.
ХІД РОБОТИ
1. Знайдіть технічний текст англійською мовою обсягом
1000 знаків з пробілами.
2. Розпізнайте терміни у тексті за допомогою сайтів:
- Five Filters, http://fivefilters.org/term-extraction/
- TerMine, http://www.nactem.ac.uk/software/termine/#form
- Terminology Extraction by Translated Labs,
https://labs.translated.net/terminology-extraction/
47