معهد ماساتشوستس للتكنولوجيا يطور نموذج الذكاء الاصطناعي للرؤية الحاسوبية الفعالة لمساعدة السيارات ذاتية القيادة في اتخاذ القرارات في الوقت الحقيقي

يجب أن تكون المركبات ذاتية القيادة قادرة على تحديد الأشياء التي تواجهها بسرعة ودقة، مثل شاحنات التوصيل المتوقفة حول الزوايا أو راكبي الدراجات الذين يقتربون من التقاطعات. ولتحقيق ذلك، قد تستخدم السيارات ذاتية القيادة نموذجًا قويًا لرؤية الكمبيوتر لتصنيف كل بكسل في صور المشهد عالية الدقة، مما يضمن عدم إغفالها للأشياء التي قد تكون محجوبة في الصور منخفضة الجودة. ومع ذلك، فإن هذه المهمة، المعروفة باسم التجزئة الدلالية، معقدة للغاية، وتتطلب عمليات حسابية واسعة النطاق، خاصة مع الصور عالية الدقة.

وفقا لتقارير وسائل الإعلام الدولية، تعاون باحثون من معهد ماساتشوستس للتكنولوجيا (MIT)، ومختبر واتسون للذكاء الاصطناعي التابع لمعهد ماساتشوستس للتكنولوجيا (MIT-IBM)، ومؤسسات أخرى لتطوير نموذج رؤية حاسوبية أكثر كفاءة، مما يقلل بشكل كبير من التعقيد الحسابي للمهمة المذكورة أعلاه. يمكن لهذا النموذج إجراء تجزئة دلالية دقيقة في الوقت الفعلي للأجهزة ذات موارد الأجهزة المحدودة، مثل أجهزة الكمبيوتر الموجودة على متن السيارة، مما يتيح للسيارات ذاتية القيادة اتخاذ قرارات فورية.

يمكن لنماذج التجزئة الدلالية الحديثة أن تتعلم بشكل مباشر التفاعلات بين كل زوج من وحدات البكسل في الصورة، مما يعني أن حسابها ينمو بشكل تربيعي مع زيادة دقة الصورة. على الرغم من أن هذه النماذج دقيقة للغاية، إلا أن سرعة معالجتها بطيئة جدًا بحيث لا يمكنها التعامل مع الصور عالية الدقة في الوقت الفعلي على الأجهزة الطرفية مثل أجهزة الاستشعار أو الهواتف الذكية.

صمم الباحثون في معهد ماساتشوستس للتكنولوجيا مكونًا جديدًا لنموذج التجزئة الدلالي، الذي يتميز بقدرات تعادل النماذج الأكثر تقدمًا من نوعها ولكنه يحقق فقط التعقيد الحسابي الخطي ويسهل عمليات الأجهزة الفعالة.

وكانت نتيجة عمل الباحثين سلسلة جديدة من النماذج لرؤية الكمبيوتر عالية الدقة. عند نشرها على الأجهزة المحمولة، تعمل هذه الطرازات أسرع بـ 9 مرات من سابقاتها. والأهم من ذلك، أنه بالمقارنة مع الحلول البديلة، فإن هذا النموذج الجديد يحقق دقة مماثلة، إن لم تكن أفضل.

لا تستطيع هذه التكنولوجيا مساعدة السيارات ذاتية القيادة في اتخاذ القرارات في الوقت الفعلي فحسب، بل يمكنها أيضًا تعزيز كفاءة مهام الرؤية الحاسوبية عالية الدقة الأخرى، مثل تجزئة الصور الطبية.

إرسال التحقيق