Une approche de désambiguïsation morpho_lexicale évaluée sur l’analyseur morphologique Alkhalil
Hors contexte, la plupart des mots ont plusieurs sens et plusieurs fonctions. La désambiguïsation lexicale, par exemple, consiste à choisir la bonne signification d’un mot polysémique dans un contexte donné. Plusieurs méthodes et approches existent à tous les niveaux de désambigüisation : morphologique [7], lexicale [3], sémantique [4] pour le TAL (traitement automatique des langues). Mais pour la langue arabe l’ambigüité s’accentue par la non diacritisation des mots. Afin de réduire considérablement ce taux d’ambigüité, nous proposons dans cet article une approche de désambigüisation qui se fonde sur le choix des bonnes diacritiques lors des différentes analyses. Cette approche combine une approche linguistique à une approche multicritère d’aide à la décision. Cette combinaison peut être considérée comme une alternative de choix pour remédier au problème de l’ambigüité morpho_lexicale quelque soit le taux de diacritiques du texte traité. Pour son évaluation, nous avons essayé la désambigüisation de l’analyseur morphologique on-line Alkhalil (L’approche que nous proposons peut être expérimentée sur n’importe quel autre analyseur morphologique da la langue arabe). Alkhalil Morpho Sys, Version 1.3, 2011, un open source http://www.alecso.org.tn/ index.php ?option=com_content&task=view&id=1302&Itemid=956&lang=a . Nous avons obtenu des résultats encourageants avec un F-Measure de plus de 80%.
Mots-clés
- analyseur morphologique ALKHALIL
- diacritisation
- étiquetage grammatical
- exploration contextuelle
- méthode de désambigüisation
- méthode multicritère d’aide à la décision (AMD)
-
Segmentation
-
- IDENTIFICATION DES MASSES NUAGEUSES PAR FUSION DE DONNEES IMAGES (RADAR - SATELLITE)
- Les Algorithmes génétiques Application à la segmentation des images
- Segmentation d’articles de mathématiques d« un corpus en vue d »une navigation n
- La Segmentation des documents techniques en amont de l« indexation : définition d »un modèle
- TALA
fr Informatique, science de l’information et bibliothéconomie RIST Volume 20 Numéro 02 ?