هوش مصنوعی

معرفی ۵ صنعتی که از اپلیکیشن‌های بینایی کامپیوتری بهره می‌برند

تیم فنی
تیم فنی

معرفی ۵ صنعتی که از اپلیکیشن‌های بینایی کامپیوتری بهره می‌برند

اپلیکیشن‌های بینایی کامپیوتری (Computer Vision) یکی از دستاوردهای دنیای هوش مصنوعی به‌شمار می‌روند. انسان توانست قدرت تشخیص اطلاعات تصویری را به کامپیوتر بیاموزد که به این توانایی، بینایی کامیوتری یا بینایی رایانه‌ای می‌گوییم. برهمین اساس اپلیکیشن‌های بینایی کامپیوتری طراحی می‌شوند که قرار است زندگی را ساده‌تر کنند.

صنایع مختلفی از اپلیکیشن‌های بینایی کامپیوتری بهره می‌برند. انسان با به‌کار گرفتن این تکنولوژی تلاش می‌کند به سطح بالاتری از ایمنی و سلامتی بیشتری دست پیدا کند. با خواندن این مطلب از بلاگ «پیشگامان لوتوس» با تعریف بینایی کامپیوتری و کاربرد آن در صنعت‌های مختلف، آشنا خواهید شد. 

معجزه‌ی بینایی 

شاید این ویژگی عجیب ما انسان‌هاست که همه چیز برای‌مان عادی می‌شود، حتی معجزه‌ای مانند بینایی. ما در کسری از ثانیه تصویری را می‌بینیم و آن را پردازش می‌کنیم. این عملیات پیچیده چنان سریع رخ می‌دهد و آنقدر راحت در دسترس ماست که متوجه عجیب بودنش نیستیم؛ مگر زمانی‌ که بخواهیم آن را به کامپیوتر آموزش دهیم!

فرض کنید ماشینی در خیابان باسرعت به عابر پیاده‌ای نزدیک می‌شود و ما شاهد این صحنه هستیم. ابتدا تصویر جسم را ثبت می‌کنیم. این تصویر از چشم عبور می‌کند و پیام تصویری به شبکیه می‌رسد. شبکیه سریع آن را بررسی می‌کند و داده‌ را به قشر بینایی می‌فرستد.

در این‌جا مغز وارد بازی می‌شود و کورتکس مغز داده‌ها را طبقه‌بندی می‌کند. همچنین ابعاد شی را مشخص می‌کند. خروجی این عملیات این است که ما پس از تحلیل سرعت ماشین و جهت حرکت، به سمت قسمت ایمن تغییر جهت می‌دهیم. همه‌ی این رخدادها با جزییات کامل در چشم برهم زدنی اتفاق می‌افتند.

بینایی کامپیوتری چیست؟

اکنون می‌خواهیم این سیستم پیچیده و سریع را بازسازی کنیم! ناگفته پیداست که کار ساده‌ای نخواهد بود. درواقع می‌توان گفت یکی از دشوارترین کارهایی‌ست که انسان انجام داده. 

سه مرحله‌ی شناسایی اجسام بازسازی می‌شوند. کپی کردن کاری که چشم انجام می‌دهد، بازسازی واکنش کورتکس و تقلید از روش واکنش مغز به اطلاعات دیداری. بینایی کامپیوتری دقیقا به این می‌پردازد که چگونه ماشین‌ها بیاموزند محتوا را از تصویر برداشت و تفسیر کنند.

بینایی کامپیوتری (CV) یکی از زمینه های علوم کامپیوتر بوده که کار آن آموزش تحلیل تصاویر و ویدیوهای دیجیتال به کامپیوتر است. به‌عبارت دیگر، این شاخه از علوم کامپیوتر با توسعه‌‌ی تکنیک‌ها و ابزارهایی به کامپیوترها کمک می‌کند «ببینند» و محتوای آنچه را دیده‌‌اند، درک کنند.

بینایی کامپیوتر به اجرای سیستم پیچیده‌ی بینایی انسان در کامپیوتر می‌پردازد تا ماشین‌ها هم بتوانند مانند انسان‌ها وظایف هوشمندانه‌ای انجام دهند.

جایگاه کنونی بینایی کامپیوتری کجاست؟

عکس و ویدیو به بخش بزرگی از زندگی ما تبدیل شده. بیشتر از ۴ میلیون و ۴۰۰ هزار کاربرد اینترنت روزانه عکس و ویدیو تماشا می‌کنند. آمار سال ۲۰۱۹ نشان می‌دهد کاربران در هر دقیقه حدود ۴ میلیون و ۳۳۴ هزار ویدیو در یوتوب تماشا کرده‌اند و در هر دقیقه حدود ۳۰۰ ساعت ویدیو در یوتوب آپلود شده. از کاربران اسکایپ هم بگوییم که حدود ۱۷۶ هزار بار تماس گرفته‌اند. درواقع منابع زیادی در اینترنت وجود دارند که به‌طور مداوم در حال آپلود عکس و فیلم هستند. یوتوب بعد از گوگل بزرگ‌ترین موتور جست‌وجو به‌شمار می‌رود که کاربران در هر دقیقه در آن ساعت‌ها ویدیو آپلود می‌کنند. 

ایندکس کردن متن کار دشواری نیست، اما برای ایندکس کردن تصویر، لازم است الگوریتم‌هایی بررسی شوند. کامپیوتر باید بتواند تصویر را درک کند و درواقع تصویر را «ببیند» تا بر آن اساس به کاربران خدمات ارائه کند. 

در ادامه‌ ۵ صنعتی را مرور می‌کنیم که موفق شده‌اند از مزایای اپلیکیشن‌های بینایی کامپیوتری بهره ببرند.

۱- سلامت و مراقبت‌های پزشکی

باوجود ماشین لرنینگ (Machine Learning) و یادگیری عمیق (Deep Learning) پیشرفت‌های زیادی در حوزه‌ی مراقبت‌های پزشکی رخ داده. بینایی کامپیوتری تلاش می‌کند هر چه بیشتر از جان و سلامت انسان‌ها مراقبت کند. تشخیص سرطان پستان یکی از کاربردهای آن است که با تصویربرداری دقیق‌تر به کمک پزشکان آمده.

خونریزی پس از زایمان در طی سالیان جان مادران را گرفته. بینایی کامپیوتری با اندازه‌گیری دقیق میزان خون از دست‌رفته، به تحلیل فرایند زایمان کمک می‌کند.

یادگیری عمیق و بینایی پزشکی باعث بالا رفتن سطح تشخیص در تصویربرداری پزشکی شده‌اند. وجود مدل‌های سه‌بعدی تعاملی، تشخیص دقیق‌تر پزشک را آسان‌ کرده.

۲- کشاورزی و دامداری

هدف اصلی هر کشاورزی، برداشت محصول بیشتر و باکیفیت‌تر است. دوربین‌های مدرنی که روی پهپادها نصب می‌شوند به یاری کشاورز می آیند تا بتواند بیماری گیاهان و کم‌آبی خاک را تشخیص دهد. به‌این ترتیب در هزینه و وقت صرفه‌جویی خواهد شد.

با بررسی وضعیت سلامت و سنجش وزن دام به‌سرعت از بیماری و کمبود آنها باخبر می‌شویم. همچنین شمارش و ردیابی دام‌ها، از دیگر خدمات بینایی کامپیوتری به‌حساب می‌آید.

۳- دنیای آموزش

آموزش یکی دیگر از حوزه‌هایی‌ست که از اپلیکیشن‌های مبتنی بر بینایی کامپیوتری سود می‌برد. به‌ویژه که باوجود بیماری کووید ۱۹ و آموزش از راه دور، نیازهای جدیدی شکل گرفت. 

یکی از کاربردهای CV سنجش میزان مشارکت است. درگیر کردن دانش‌آموزان در کلاس آنلاین کار راحتی برای معلم نیست. بینایی کامپیوتری و یادگیری عمیق می‌توانند دانش‌آموزانی را که فعالیت و مشارکت نمی‌کنند، شناسایی کنند.

سیستم حضور و غیاب دانش‌آموزان با استفاده از دوربین‌های مداربسته، به‌طور اتوماتیک زمان دقیق حضور و خروج دانش‌آموزان را ثبت می‌کند. شناسایی دانش‌آموزانی که روی برگه‌ی دیگران نگاه می‌کنند، شاید برای بچه‌ها ناخوشایند باشد؛ اما به معلم کمک می‌کند تقلب‌کارها را شناسایی کند. تشخیص فعالیت‌های غیرقانونی در محیط مدرسه یکی دیگر از دستاوردهای این دانش نوین است.

۴- صنعت خودروسازی

ماشین‌های خودران سروصدای زیادی به‌پا کردند. اما گذشته از خودران‌ها، ماشین‌های معمولی هم از فناوری بینایی کامپیوتری سود می‌برند. بعضی از شرکت‌های خودرو سازی می‌توانند به‌طور خودکار محدودیت سرعت تعنیین کنند، مسیر رانندگی را تشخیص دهند، علائم رانندگی را تفسیر کنند و از کل صحنه‌ی مقابل خودرو، آنالیز ارائه دهند.

۵- کاربرد بینایی رایانه‌ای در صنایع غذایی

ارزش صنایع غذایی در سال ۲۰۲۱ حدود ۶ هزار میلیارد دلار برآورد شده. اپلیکیشن‌های بینایی کامپیوتری اثر شگرفی بر این صنعت گذاشته‌اند. ماشین لرنینگ و بینایی کامپیوتری به بازرس خودکار کیفیت مواد غذایی تبدیل شده‌اند. در همین راستا احتمال خوردن غذاهای ناسالم کمتر می‌شود. همچنین با افزایش دقت در مراحل تولید، تهیه، بسته‌بندی و توزیع، سطح کیفیت و ایمنی بالا می‌رود و نیاز به نیروی کار کمتر می‌شود. مرتب کردن محصولات براساس نوع، رنگ و اندازه از دیگر خدمات این اپلیکیشن‌هاست.

سخن پایانی

ما از پشت پنجره بیرون را تماشا می‌کنیم و بدون هیچ تلاش و زحمتی در کسری از ثانیه درک می‌کنیم کدام تصویر درخت، گل یا ماشین است. درواقع مغز ما به‌سرعت وارد عمل می‌شود و به کمک چشم می‌آید. هر فریمی که چشم دریافت می‌کند، شامل یک مجموعه پیکسل است که کورتکس بینایی آن را پردازش می‌کند. آموختن این توانایی به ماشین‌ها کار راحتی نیست. باید سخت‌افزار دقیقی داشته‌باشیم که نور را دریافت کند، همچنین به نرم‌افزار قدرتمندی نیاز داریم که بتواند طیف رنگی نور را درک کند.

انسان در این زمینه پیشرفت کرده و اکنون حوزه هایی مانند پزشکی، کشاورزی، بیمه، خودروسازی، حمل‌ونقل و خرده‌فروشی‌ها از اپلیکیشن‌های بینایی کامپیوتری بهره می‌برند.

قصد انجام پروژه خاصی را دارید؟

اگر می‌خواهید وب‌سایتی منحصربه‌فرد، متناسب با نیازهای خاص خودتان داشته باشید، یا اگر گمان می‌کنید داشتن یک اپلیکیشن موبایلی اهداف کسب‌و‌کارتان را محقق می‌کند، یا اگر هنوز نمی‌دانید چه محصولی برای پیاده‌سازی ایده‌تان به کار می‌آید، با ما تماس بگیرید. شرکت نرم‌افزاری پیشگامان لوتوس با مشاوره و طراحی محصول ایده‌آل، شما را در مسیر رشد کسب‌و‌کارتان همراهی می‌کند.

با ما تماس بگیرید

مشاوره با ما