YOLO: شما تنها یک بار نگاه می کنید

در این مقاله،‌ الگوریتم YOLO یا You Only Look Once به عنوان شیوه ای نوین در یادگیری ماشین برای شناسایی اشیاء در تصاویر معرفی می شود. پیش از این پژوهش های متعددی در زمینه شناسایی و طبقه بندی اشیاء (Object Detection and Classification) در تصاویر صورت پذیرفته است. لکن توسعه دهندگان YOLO، به شناسایی اشیاء به چشم یک مسأله برازش (Regression) در میان فریم های احاطه کننده (Bounding Boxes) و احتمالات تخصیص یافته در مورد طبقه بندی (Class) شیء نگاه کرده اند. در این الگوریتم، یک شبکه عصبی تنها طی یک تکرار، فریم های احاطه کننده تمام اشیاء موجود در تصویر و طبقه بندی های احتمالی مربوط به هریک را شناسایی و محاسبه می کند. از آن جهت که کل پروسه تشخیص تنها در یک شبکه عصبی منفرد صورت می پذیرد، بار محاسباتی و زمان پردازش به شدت کاهش یافته و امکان استفاده از الگوریتم به صورت offline بر روی دستگاه های مختلف مهیا می گردد.

الگوریتم معرفی شده بسیار سریع است. مدل پایه YOLO توان پردازش تصاویر به صورت بلادرنگ و با نرخ ۴۵ فریم بر ثانیه را داراست. نمونه ساده شده این مدل،‌ تحت عنوان «Fast YOLO»، به نرخ شگفت انگیز ۱۵۵ فریم در ثانیه با خطایی کمتر از نصف خطای شناسایی سایر مدل های موجود دست یافته است. در مقایسه با سامانه های شناسایی اشیاء مدرن، YOLO خطای مکانی بیشتری دارد ولی احتمال آن که شیء ای را در نقطه ای از تصویر که چیزی در آن وجود ندارد، به اشتباه شناسایی کند به شدت کمتر از الگوریتم های رقیب است.

در نهایت، YOLO نمودهای بسیار عمومی از اشیاء را می آموزد. این روش حتی وقتی آن را به جای تصاویر طبیعی بر روی نقاشی و آثار هنری (مجموعه داده های Picasso و People-Art) اعمال نمودیم، با اختلاف چشم گیری همه الگوریتم های موجود (مانند DPM یا R-CNN) را پشت سر گذاشت.

می توانید از طریق لینک های دانلود زیر مطلب مقاله را دریافت و مطالعه نمایید. تجربیات خود را در پیاده سازی این روش در بخش دیدگاه به اشتراک بگذارید.