أطروحة دكتوراه في كلية العلوم بعنوان (طرق تحليل النص لخدمات الدعم لتصنيف الخط العربي)
ناقش قسم علوم الحاسوب في كلية العلوم بجامعة ديالى اطروحة طالب الدكتوراه غسان خزعل علي الموسومة (طرق تحليل النص لخدمات الدعم لتصنيف الخط العربي) وذلك على قاعة المناقشات في قسم علوم الفيزياء.
هدفت الاطروحة الى آلية تحليل النص التي تخدم تصنيف النصوص للخط العربي.
تناولت الدراسة حل مشكلة تصنيف النص العربي حيث تم استخدام العديد من البيانات التي تم جمعها بالطرق القياسية والموارد الخارجية المكثفة وخوارزميات التعلم الآلي. وتم اقتراح أسلوباً جديداً لمجموعات البيانات ونوعاً جديداً من المميزات الخاصة باللغة العربية يأخذ بنظر الاعتبار مشكلة الكلمات المختلفة التي تكون مفيدة لفئات مختلفة.
وأظهرت النتائج استخراج خصائص لغوية جديدة لتصنيف النص العربي يمكن اختبارها مع مصنفات مختلفة من خلال اقتراح التقنيات المثلى للمعالجة المسبقة واستخراج الميزات المهمة لتصنيف النص العربي من خلال المصنف CNN مع آلية الانتباه في التعلم العميق ومصنف SVM مع اقتراح مخطط ميزات TF-RFM في تعلم الآلة.