Ekstrakcja terminów lub ekstrakcja terminologii to automatyczna metoda analizy tekstu w celu zidentyfikowania fraz spełniających kryteria terminów. Ekstrakcja terminologii ma zastosowanie w tłumaczeniach i zarządzaniu terminologią, ale także w analityce tekstu , gdzie jest wykorzystywana do modelowania tematów, eksploracji danych i wyszukiwania informacji z tekstu nieustrukturyzowanego.
W celu sprawnego zarządzania treścią wielojęzyczną dostęp do ekstraktorów terminologii i możliwość tworzenia automatycznych glosariuszy ma kluczowe znaczenie.
Najlepsza ekstrakcja terminów
Najlepsza ekstrakcja terminów to taka, która zapewnia możliwie jak najbardziej czystą i dokładną listę terminów, wymagającą niewielkiego ręcznego czyszczenia. Wiele tradycyjnych metod ekstrakcyjnych polega głównie na częstotliwości występowania danego terminu w tekście. Metoda ta jest stosunkowo mało optymalna – wymaga sprawdzenia i ręcznego oczyszczenia całej listy terminów. Ręczne czyszczenie można ograniczyć stosując kryteria językowe w połączeniu ze statystykami.
Możemy definiować działanie ekstraktora w zakresie minimalnej liczby znaków w terminie, ilości słów w terminie, częstotliwości występowania w danych źródłowych, możemy ograniczać słownictwo w zależności od jego występowania w pospolitym słownictwie.
al. W. Witosa 3
20-315 Lublin
+48 81 30 70 677
info@omero.pl
Ronda Sant Antoni 46,
ent.1A 08001 Barcelona
+34 931 82 42 24
info@omero.es