معرفی ۵ صنعتی که از اپلیکیشنهای بینایی کامپیوتری بهره میبرند
اپلیکیشنهای بینایی کامپیوتری (Computer Vision) یکی از دستاوردهای دنیای هوش مصنوعی بهشمار میروند. انسان توانست قدرت تشخیص اطلاعات تصویری را به کامپیوتر بیاموزد که به این توانایی، بینایی کامیوتری یا بینایی رایانهای میگوییم. برهمین اساس اپلیکیشنهای بینایی کامپیوتری طراحی میشوند که قرار است زندگی را سادهتر کنند.
صنایع مختلفی از اپلیکیشنهای بینایی کامپیوتری بهره میبرند. انسان با بهکار گرفتن این تکنولوژی تلاش میکند به سطح بالاتری از ایمنی و سلامتی بیشتری دست پیدا کند. با خواندن این مطلب از بلاگ «پیشگامان لوتوس» با تعریف بینایی کامپیوتری و کاربرد آن در صنعتهای مختلف، آشنا خواهید شد.
معجزهی بینایی
شاید این ویژگی عجیب ما انسانهاست که همه چیز برایمان عادی میشود، حتی معجزهای مانند بینایی. ما در کسری از ثانیه تصویری را میبینیم و آن را پردازش میکنیم. این عملیات پیچیده چنان سریع رخ میدهد و آنقدر راحت در دسترس ماست که متوجه عجیب بودنش نیستیم؛ مگر زمانی که بخواهیم آن را به کامپیوتر آموزش دهیم!
فرض کنید ماشینی در خیابان باسرعت به عابر پیادهای نزدیک میشود و ما شاهد این صحنه هستیم. ابتدا تصویر جسم را ثبت میکنیم. این تصویر از چشم عبور میکند و پیام تصویری به شبکیه میرسد. شبکیه سریع آن را بررسی میکند و داده را به قشر بینایی میفرستد.
در اینجا مغز وارد بازی میشود و کورتکس مغز دادهها را طبقهبندی میکند. همچنین ابعاد شی را مشخص میکند. خروجی این عملیات این است که ما پس از تحلیل سرعت ماشین و جهت حرکت، به سمت قسمت ایمن تغییر جهت میدهیم. همهی این رخدادها با جزییات کامل در چشم برهم زدنی اتفاق میافتند.
بینایی کامپیوتری چیست؟
اکنون میخواهیم این سیستم پیچیده و سریع را بازسازی کنیم! ناگفته پیداست که کار سادهای نخواهد بود. درواقع میتوان گفت یکی از دشوارترین کارهاییست که انسان انجام داده.
سه مرحلهی شناسایی اجسام بازسازی میشوند. کپی کردن کاری که چشم انجام میدهد، بازسازی واکنش کورتکس و تقلید از روش واکنش مغز به اطلاعات دیداری. بینایی کامپیوتری دقیقا به این میپردازد که چگونه ماشینها بیاموزند محتوا را از تصویر برداشت و تفسیر کنند.
بینایی کامپیوتری (CV) یکی از زمینه های علوم کامپیوتر بوده که کار آن آموزش تحلیل تصاویر و ویدیوهای دیجیتال به کامپیوتر است. بهعبارت دیگر، این شاخه از علوم کامپیوتر با توسعهی تکنیکها و ابزارهایی به کامپیوترها کمک میکند «ببینند» و محتوای آنچه را دیدهاند، درک کنند.
بینایی کامپیوتر به اجرای سیستم پیچیدهی بینایی انسان در کامپیوتر میپردازد تا ماشینها هم بتوانند مانند انسانها وظایف هوشمندانهای انجام دهند.
جایگاه کنونی بینایی کامپیوتری کجاست؟
عکس و ویدیو به بخش بزرگی از زندگی ما تبدیل شده. بیشتر از ۴ میلیون و ۴۰۰ هزار کاربرد اینترنت روزانه عکس و ویدیو تماشا میکنند. آمار سال ۲۰۱۹ نشان میدهد کاربران در هر دقیقه حدود ۴ میلیون و ۳۳۴ هزار ویدیو در یوتوب تماشا کردهاند و در هر دقیقه حدود ۳۰۰ ساعت ویدیو در یوتوب آپلود شده. از کاربران اسکایپ هم بگوییم که حدود ۱۷۶ هزار بار تماس گرفتهاند. درواقع منابع زیادی در اینترنت وجود دارند که بهطور مداوم در حال آپلود عکس و فیلم هستند. یوتوب بعد از گوگل بزرگترین موتور جستوجو بهشمار میرود که کاربران در هر دقیقه در آن ساعتها ویدیو آپلود میکنند.
ایندکس کردن متن کار دشواری نیست، اما برای ایندکس کردن تصویر، لازم است الگوریتمهایی بررسی شوند. کامپیوتر باید بتواند تصویر را درک کند و درواقع تصویر را «ببیند» تا بر آن اساس به کاربران خدمات ارائه کند.
در ادامه ۵ صنعتی را مرور میکنیم که موفق شدهاند از مزایای اپلیکیشنهای بینایی کامپیوتری بهره ببرند.
۱- سلامت و مراقبتهای پزشکی
باوجود ماشین لرنینگ (Machine Learning) و یادگیری عمیق (Deep Learning) پیشرفتهای زیادی در حوزهی مراقبتهای پزشکی رخ داده. بینایی کامپیوتری تلاش میکند هر چه بیشتر از جان و سلامت انسانها مراقبت کند. تشخیص سرطان پستان یکی از کاربردهای آن است که با تصویربرداری دقیقتر به کمک پزشکان آمده.
خونریزی پس از زایمان در طی سالیان جان مادران را گرفته. بینایی کامپیوتری با اندازهگیری دقیق میزان خون از دسترفته، به تحلیل فرایند زایمان کمک میکند.
یادگیری عمیق و بینایی پزشکی باعث بالا رفتن سطح تشخیص در تصویربرداری پزشکی شدهاند. وجود مدلهای سهبعدی تعاملی، تشخیص دقیقتر پزشک را آسان کرده.
۲- کشاورزی و دامداری
هدف اصلی هر کشاورزی، برداشت محصول بیشتر و باکیفیتتر است. دوربینهای مدرنی که روی پهپادها نصب میشوند به یاری کشاورز می آیند تا بتواند بیماری گیاهان و کمآبی خاک را تشخیص دهد. بهاین ترتیب در هزینه و وقت صرفهجویی خواهد شد.
با بررسی وضعیت سلامت و سنجش وزن دام بهسرعت از بیماری و کمبود آنها باخبر میشویم. همچنین شمارش و ردیابی دامها، از دیگر خدمات بینایی کامپیوتری بهحساب میآید.
۳- دنیای آموزش
آموزش یکی دیگر از حوزههاییست که از اپلیکیشنهای مبتنی بر بینایی کامپیوتری سود میبرد. بهویژه که باوجود بیماری کووید ۱۹ و آموزش از راه دور، نیازهای جدیدی شکل گرفت.
یکی از کاربردهای CV سنجش میزان مشارکت است. درگیر کردن دانشآموزان در کلاس آنلاین کار راحتی برای معلم نیست. بینایی کامپیوتری و یادگیری عمیق میتوانند دانشآموزانی را که فعالیت و مشارکت نمیکنند، شناسایی کنند.
سیستم حضور و غیاب دانشآموزان با استفاده از دوربینهای مداربسته، بهطور اتوماتیک زمان دقیق حضور و خروج دانشآموزان را ثبت میکند. شناسایی دانشآموزانی که روی برگهی دیگران نگاه میکنند، شاید برای بچهها ناخوشایند باشد؛ اما به معلم کمک میکند تقلبکارها را شناسایی کند. تشخیص فعالیتهای غیرقانونی در محیط مدرسه یکی دیگر از دستاوردهای این دانش نوین است.
۴- صنعت خودروسازی
ماشینهای خودران سروصدای زیادی بهپا کردند. اما گذشته از خودرانها، ماشینهای معمولی هم از فناوری بینایی کامپیوتری سود میبرند. بعضی از شرکتهای خودرو سازی میتوانند بهطور خودکار محدودیت سرعت تعنیین کنند، مسیر رانندگی را تشخیص دهند، علائم رانندگی را تفسیر کنند و از کل صحنهی مقابل خودرو، آنالیز ارائه دهند.
۵- کاربرد بینایی رایانهای در صنایع غذایی
ارزش صنایع غذایی در سال ۲۰۲۱ حدود ۶ هزار میلیارد دلار برآورد شده. اپلیکیشنهای بینایی کامپیوتری اثر شگرفی بر این صنعت گذاشتهاند. ماشین لرنینگ و بینایی کامپیوتری به بازرس خودکار کیفیت مواد غذایی تبدیل شدهاند. در همین راستا احتمال خوردن غذاهای ناسالم کمتر میشود. همچنین با افزایش دقت در مراحل تولید، تهیه، بستهبندی و توزیع، سطح کیفیت و ایمنی بالا میرود و نیاز به نیروی کار کمتر میشود. مرتب کردن محصولات براساس نوع، رنگ و اندازه از دیگر خدمات این اپلیکیشنهاست.
سخن پایانی
ما از پشت پنجره بیرون را تماشا میکنیم و بدون هیچ تلاش و زحمتی در کسری از ثانیه درک میکنیم کدام تصویر درخت، گل یا ماشین است. درواقع مغز ما بهسرعت وارد عمل میشود و به کمک چشم میآید. هر فریمی که چشم دریافت میکند، شامل یک مجموعه پیکسل است که کورتکس بینایی آن را پردازش میکند. آموختن این توانایی به ماشینها کار راحتی نیست. باید سختافزار دقیقی داشتهباشیم که نور را دریافت کند، همچنین به نرمافزار قدرتمندی نیاز داریم که بتواند طیف رنگی نور را درک کند.
انسان در این زمینه پیشرفت کرده و اکنون حوزه هایی مانند پزشکی، کشاورزی، بیمه، خودروسازی، حملونقل و خردهفروشیها از اپلیکیشنهای بینایی کامپیوتری بهره میبرند.