مناقشة رسالة طالبة الماجستير ليلى عبد الحق اسماعيل من قسم علوم الحاسوب
أضيف بواسطة : عبد الله سامر | #مناقشات_الدراسات_العليا |
ناقش قسم علوم الحاسوب في كلية العلوم بجامعة ديالى رسالة طالبة الماجستير ليلى عبد الحق اسماعيل والموسومة حلول ابتكارية لتعدين النصوص من خلال بناء اكتشاف النمط وذلك في يوم الاثنين الموافق 2020/3/2 وعلى قاعة المناقشات في عمادة الكلية.
أوضحت الطالبة في مقدمة رسالتها أنه تزداد كمية المعلومات النصية بسرعة والتي يتم تخزينها إلكترونيًا على أجهزة الكمبيوتر أو الويب الخاصة بنا. أي كمبيوتر (كمبيوتر محمول أو سطح مكتب) قادر على استيعاب كميات هائلة من البيانات بسبب التحسينات في أجهزة التخزين.
وأضافت: يتم تضمين النصوص في مجموعة البيانات النصية وتكون مجموعة البيانات هذه غير منظمة. يمكن معالجة هذه البيانات غير المهيكلة عن طريق التنقيب عن النص. يكشف التعقيد والعدد الكبير لهذه البيانات عن قدرات جديدة للمحللين. لذلك ، يقدم هذا العمل تحسينًا لاستخراج الأنماط المفيدة من المستندات النصية في مجال استخراج النص باستخدام نموذج تصنيف الأنماط (PTM) وخوارزمية مسافة ليفينشيتين (LDA).
اقترحت الدراسة نظام استخراج النصوص للتغلب على المشكلات التي حدثت في الطريقة القائمة على المصطلح والطريقة القائمة على العبارة. يعتمد النظام المقترح على سلوك خوارزمية LDA و PTM لإثبات أن الأسلوب القائم على الأنماط هو أفضل حل لاستخراج النص دون أي مشاكل في المعلومات المستخرجة من النص ولتحديد أفضل دقة للأنماط المستخرجة في وقت قصير.
يتم اختبار قوة الخوارزميات (PTM ، LDA) باستخدام قيم (Threshold) من 1 إلى 10. استخدم النظام المقترح dataset ""Openosis opinion " and "Reuters 50_50 التي تم تخزينها في ملف ".txt" أو مستند نصي. نتائج هذا الاختبار تم الحصول عليها عن طريق المقارنة بين قيم ثلاث ميزات هي (الاحتمال العالمي ، الدعم المطلق ، الدعم النسبي) للنص للحصول على متوسط دقة أعلى.
تمت مقارنة نتائج النظام المقترح مع الأنظمة الأخرى. وقد حصل النظام المقترح على (98.68٪) متوسط دقة لقواعد Unigram و (99.65٪) متوسط دقة لقواعد Bigram حيث حقق النظام الذي استخدم Levenshtein Edit Distance على lemmatization للغة الإنجليزية الحديثة دقة 96٪ للغة الإنجليزية و النظام الذي استخدم عملية تطور النمط ونشر الأنماط يحصل على 62٪ من الدقة و 82٪ من الاستدعاء. لذلك ، حقق استخدام LDA مع PTM نتائج أعلى مقارنةً بالأنظمة الأخرى.
وقد تألفت لجنة المناقشة من السادة المدرجة أسماؤهم أدناه: أ. م. د. بشار مكي نعمة / الجامعة المستنصرية / كلية العلوم … رئيساً أ. م. د. فراس عبد الحميد / جامعة بغداد / كلية التربية – ابن الهيثم … عضواً أ. م. د. طه محمد حسن / جامعة ديالى / كلية العلوم … عضواً أ. ناجي مطر سحيب / جامعة ديالى / كلية العلوم … عضواً ومشرفاً
وقد تم قبول الرسالة ومنحت الطالبة درجة الماجستير في تخصص علوم الحاسوب .. ألف مبارك .. |
مواضيع ذات صلة | الأرشيف |