Academic Journals Database
Disseminating quality controlled scientific knowledge

An Arabic Morphological Analyzer/Synthesizer محلل ومركب صرفي عربي

ADD TO MY LIST
 
Author(s): M. KHAYAT | A. AL-OTHMAN | S. AL-SAFRAN

Journal: Journal of King Abdulaziz University : Engineering Sciences
ISSN 1319-1047

Volume: 13;
Issue: 1;
Start page: 71;
Date: 2001;
VIEW PDF   PDF DOWNLOAD PDF   Download PDF Original page

ABSTRACT
Morphology is an essential element in processing natural language. As morphology in Arabic is highly derivational, morphological analysis/synthesis is systematic and can be easily automated. The objective of this research work is to design and implement a morphological analyzer/synthesizer (MAS) for Arabic. In analysis mode, given a word, MAS determines the following properties of words: 1) type (noun, verb, article), 2) person, number and gender (for verbs and nouns), 3) tense of verb (past, present, imperative), 4) type of article (interrogative, prepositional, etc.), 5) root, and derivation (for verbs and nouns), and 6) type and identity of affixes (prefix, infix, suffix). In synthesis mode, the above properties are given and the corresponding word is constructed. MAS is based on linguistic principles of Arabic morphology. It is designed as three modules for particles, nouns and verbs respectively. The modules consist of rules that encode the linguistic principles of word construction in Arabic. The mode (analysis or synthesis) of operation is automatically determined by the values associated with the word and its properties. For a word of size n of a particular type (noun, verb or article), the possible derivations (determined according to the linguistic principles) are implemented as ordered (according to their frequencies of occurrence) Prolog predicates. The size of the word and frequency of occurrence of the corresponding derivation are used to minimize the search time. يمثل الصرف عنصراً أساسياً في معالجة اللغة العربية آلياً. وحيث أن للصرف في اللغة العربية قواعد واضحة فإنه يمكن برمجة التحليل والتركيب الصرفي بسهولة. والهدف من هذا البحث هو تصيم وتطوير محلل ومركب صرفي عربي. وفي حالة التحليل يقوم المحلل بتحديد الخصائص التالية للكلمة : النوع ( اسم ، فعل ، حرف)، والضمير والعدد والجنس ( للأسماء والأفعال)، وحالة الفعل ( ماضي ، مضارع ، أمر، نوع الحرف ( استفهام، جر ، ... الخ)، والجذر ، والوزن ( للأسماء والأفعال)، والزوائد ( قبلية، وسطية، بعدية). وفي حالة التركيب يقوم البرنامج بتركيب الكلمة من الخصائص المذكورة أعلاه. لقد تم تطوير البرنامج بناء على قواعد الصرف العربي. وتم تصميم البرنامج كثلاث وحدات للحروف والأسماء والأفعال. وتتكون كل وحدة من قواعدبرمجية تمثل قواعد الصرف العربي. ويحدد البرنامج الحالة ( تحليل أو تركيب) تلقائيا من المعطيات. وقد تم تمثيل الأوزان المختلفة لكلمة تتكون من عدد س من الحروف كقواعد لغة برولوج مرتبة وفقا لتردد استخدام الوزن. ويستخدم عدد الحروف التي تتكون منها الكلمة وتردد الوزن لتقليل وقد تم تمثيل الأوزان المختلفة لكلمة تتكون منها الكلمة وتردد الوزن لتقليل وقت البحث عن التركيب أو التحليل الصحيح في البرنامج. هذا ويتم استخدام البرنامج المطور حاليا كوحدة في نظام لفهم اللغة العربية. كما يمكن استخدام البرنامج في الترجمة الآلية، والنظم الآلية لتعليم اللغة العربية، ونظم التعرف على الكلام المكتوب، ونظم معالجة الكلام المنطوق.

Tango Rapperswil
Tango Rapperswil

     Affiliate Program