الرؤية الحاسوبية
فرح فليح حسن
هو فرع من فروع الذكاء الاصطناعي يهدف الى تمكين الحاسوب من استخلاص معلومات ذات معنى من البيانات الصورية، سواء كانت صورا او مقطع فيديو، يتم ذلك من خلال الاستعانة بخوارزميات معالجة الصور، الذكاء الاصطناعي، تدريب الالة اوالتعليم المعمق.
ان الصور الرقمية ببساطة هي عبارة عن مصفوفة ثنائية الابعاد (اذا كانت بالأبيض والأسود) او ثلاثية الابعاد (اذا كانت ملونة)، لتقريب الفكرة اكثر، عبارة عن صفوف واعمدة من دقائق صغيرة تسمى بكسل، كل بكسل يحمل شدة لونية تتراوح (0-255)، بحيث الشدة التي تحمل رقم (0) تعني اللون اسود وهكذا تتدرج الوان الرمادي وصولا الى اعلى شدة لونية (255) وتمثل اللون الأبيض، اما في حال الصورة الملونة فستكون هناك ثلاث طبقات بدلا من طبقة واحدة، بحيث كل طبقة تمثل تدرجات الألوان الأساسية (الأحمر، الأخضر، والازرق) وأيضا كل طبقة مكونة من صفوف واعمدة تحتوي على بكسلات، وكل بكسل يحمل شدة لونية تمثل تدرج اللون الأساسي للطبقة التي ينتمي اليها. اما مقاطع الفيديو فماهي الا عبارة عن سلسلة من الصور التي تعرض بالتتابع بسرعة عالية تسمى الإطارات، عندما يتم عرض هذه الصور بسرعة، يتم خلق إحساس بالحركة نتيجة خداع بصري يعرف باسم استمرارية الرؤية.
اهم تطبيقات الرؤية الحاسوبية هي التعرف على الوجوه، السيارات ذاتية القيادة، التشخيص الطبي، التجارة الالكترونية والواقع المعزز والافتراضي. اهم مراحل معالجة الصور في الرؤية الحاسوبية:
1-التقاط الصور: عن طريق كاميرات او مستشعرات بصرية.
2-معالجة الصورة الأولية: تتضمن تحسين جودة الصورة، إزالة الضوضاء، تعديل الإضاءة والتباين.
3-استخراج الميزات: تحديد السمات المهمة في الصورة كالحواف والتباين.
4-تحليل الصورة: يتم تطبيق نماذج الذكاء الاصطناعي للتعرف على الكائنات، مثل التعرف على الوجوه وتمييز المكونات وتحليل النصوص.
5-اتخاذ القرار: بعد تحليل البيانات، يتخذ النظام قرارات مثل التعرف على الأشخاص، وتمييز إشارات المرور.