L'extraction de termes ou l'extraction de terminologie est une méthode d'analyse automatique de textes pour identifier les phrases qui répondent aux critères des termes. L'extraction terminologique s'applique dans la traduction et la gestion terminologique, mais aussi dans l'analyse du texte où elle est utilisée pour la modélisation des sujets, l'exploration des données et la recherche des informations dans des textes non structurés.
Pour une gestion efficace du contenu multilingue, l'accès à des extracteurs de terminologie et la possibilité de créer des glossaires automatiques sont essentiels.
Meilleure extraction des termes
La meilleure extraction de termes est celle qui fournit une liste de termes aussi propre et précise que possible, nécessitant peu de nettoyage manuel.
De nombreuses méthodes d'extraction traditionnelles s'appuient principalement sur la fréquence d'apparition d'un terme dans un texte.
Cette méthode est relativement peu optimale - elle nécessite la vérification et le nettoyage manuel de toute la liste des termes.
Le nettoyage manuel peut être réduit avec l’utilisation de critères linguistiques en combinaison avec des statistiques.
Il est possible de définir l'action de l'extracteur en fonction du nombre minimum de caractères dans un terme, du nombre de mots dans un terme, de la fréquence d'apparition dans les données source. Il est également possible de restreindre le vocabulaire en fonction de son apparition dans le vocabulaire commun.
al. W. Witosa 3
20-315 Lublin
+48 81 30 70 677
info@omero.pl
Ronda Sant Antoni 46,
ent.1A 08001 Barcelona
+34 931 82 42 24
info@omero.es