
تدريسي من كلية العلوم بجامعة ديالى عضواً في لجنة مناقشة أطروحة طالبة دكتوراه بالجامعة التكنولوجية
أضيف بواسطة : عبد الله سامر | #مناقشات_خارجية |
شارك الاستاذ الدكتور ظاهر عبد الهادي عبد الله التدريسي من قسم علوم الحاسوب في كلية العلوم بجامعة ديالى في لجنة مناقشة أطروحة طالبة الدكتوراه ايمان هاتو هاشم من الجامعة التكنولوجية عن اطروحتها الموسومة Based video component retrieval system using data mining techniqes .
واوضحت الباحثة المستخلص بأنه أدى التزايد الكبير لبيانات الفيديوهات المتاحة في الحياة اليومية الحاجة لتسهيل وظائف إسترجاع الفيديو من قاعدة بيانات كبيرة جدًا أو من الإنترنت. تستخدم معظم أنظمة إسترجاع الفيديو الحالية تعليقات توضيحية نصية لإسترجاع مقاطع الفيديو, وتوفر هذه الأنواع من أنظمة الإسترجاع تمثيلًا بعيداً عن محتوى الفيديو, على حين إن المستخدم يسعى إلى تمثيل عالي المستوى للفيديوهات يتيح البحث عن مقاطعها وتصفحها إعتماداً على المعنى الدلالي للفيديو.
تقدم هذه الأطروحة نظامًا تلقائيًا لإسترجاع الفيديو على أساس المعنى الدلالي له عن طريق توظيف المعلومات النصية والمرئية والحركية في تكوين تمثيل ذات معنى دلالي من أجل إسترجاع مقاطع الفيديو بكفاءة وفعالية.
يتكون نظام إسترجاع الفيديو إعتماداً على المعنى الدلالي المقترح من مرحلتين وهما فهرسة الفيديو وإسترجاعه. وفي مرحلة فهرسة الفيديو، يتم تقسيم كل فيديو في قاعدة البيانات إلى مجموعة من المشاهد, إذ يعد المشهد الوحدة الأساسية لتحليل الفيديو. لتجنب الصورغير الضرورية والإكتشاف الخاطئ ، تتم إزالة صور الفواصل الموسيقية قبل عملية إكتشاف حدود المشاهد عن طريق تمييز مقاطع الكلام عن مقاطع الموسيقى في الفيديو. إن الخوارزمية المقترحة للكشف عن حدود المشهد تقوم بالكشف عن التلاشي التدريجي و التغيير المفاجئ والتداخل التدريجي عن طريق إستخدام إنواع مختلفة من الميزات, ويتم تمثيل كل مشهد بمجموعة من الصور المفتاحية المختارة. إن فهرسة الفيديو تقوم بتمثيل مقاطع الفيديو بمجموعة من المفاهيم الدلالية وتستند إلى ثلاثة نماذج هي الإنموذج النصي والإنموذج البصري والإنموذج الحركي.
إن الخوارزمية المقترحة لاكتشاف النص تهدف إلى إكتشاف النص المضاف لمقاطع الفيديو إذ إنه يحتوي على كثير من المعلومات الدلالية. وهذه الخوارزمية تقوم في البدء بإستخراج ميزات MSER من الصور المفتاحية المختارة لتحديد أكبر عدد من االمناطق التي تحتوي على أحرف النص بشكل منفرد. بعد ذلك ، يتم تصفية مناطق النص المحددة لإزالة المناطق غير النصية باستخدام الخصائص الهندسية مع تقنية شرط العتبة, وأخيراً، يتم دمج مناطق النص وتحديدها حتى يتم تمييز النصوص فيها.
يركز الإنموذج المرئي على إكتشاف المفاهيم الدلالية المرئية التي تسمح بفهرسة معلومات الفيديو بكفاءة. يتم تدريب التصنيف الهرمي المقترح ومن ثم يتم تطبيقه لتصنيف المفاهيم المرئية بإستخدام ميزات gist و SVM المتعدد. إما خوارزمية الحركة المقترحة فإن الغرض منها هو توفير معلومات وصفية تستخدم لدعم تحديد المفهوم البصري, ويتم في البدء إستخراج مصفوفة الحركة وتصفيتها من قيم الحركةغير المرغوب بها. ثم يتم إحتساب الإنحراف المعياري لمصفوفة الحركة كمؤشر لنشاط الحركة. ثم يتم بعدها تهذيب مناطق الحركة بإستخدام معلومات اللون وخوارزمية SLIC. بعدها يتم حساب مساحة المناطق المتحركة لتحديد الحركة المحلية والعالمية كمعلومات وصفية تستخدم في عملية فهرسة مقاطع الفيديو.
إن مرحلة إسترجاع الفديديو فتتضمن توفير مفاهيم إستعلام للمستخدم التي تتم مقارنتها بمفاهيم الفيديو المخزنة في قاعدة البيانات, إذ يتم إسترجاع مقاطع الفيديوالمطابقة وفقًا لإستعلام المستخدم.
تشير النتائج التجريبية إلى كفاءة وفعالية نظام الإسترجاع المقترح. إذ كان أداء نظام الإسترجاع المقترح بإستخدام إستعلام مفهوم النص هو 0.949 وكان أداء نظام الإسترجاع المقترح بإستخدام إستعلام مفهوم النص – المرئي هو 0.854 وفقًا لمقياس F. كما كان وقت التنفيذ لإسترجاع الفيديو 0.2 ثانية.
|
مواضيع ذات صلة | الأرشيف |