Bonjour,
j'ai un projet de licence...mon projet est de faire l'étiquetage morphosyntaxique des textes arabes en utilisant un réseau de neurone MLP pour faire l'apprentissage a partir d'un corpus étiqueté manuellement. pour faire sa, je peut faire la segmentation du texte puis l'extraction des caractéristiques (ou bien des paramètres) des mots. ces paramètres seront appliquées comme des entrées a mon réseau et à la sortie on trouve qu'il y a un code pour chaque mots a reconnaitre et on fait un apprentissage supervisé.
le problème est: comment je peut codifier les mots arabes par cette methodes?
TRANSLATED
Hello,
I have a project license ... my project is to the morphosyntactic tagging of Arabic texts using an MLP neural network for learning from a corpus manually tagged. to his, I can text segmentation and feature extraction (or parameters) of words. these parameters are applied as inputs to my network and found out that there is a code word for each to recognize and it is a supervised learning.
the problem is: How can I consolidate the Arabic words for this method?