پردازش تصویر Image Processing
یادگیری عمیق تأثیر بسیار عظیمی را بر زمینههای مختلف فناوری در سالهای اخیر گذاشته است. یکی از داغترین زمینهها مربوط به بینایی ماشین است؛ توانایی که به کامپیوتر امکان شناسایی و درک تصاویر و ویدئوها را میدهد و مثال بارز آن نیز ماشینهای خودران هستند که عملکرد اصلی آنها بر اساس پردازش تصویر است.
ایمیج(Image) چیست؟
قبل از اینکه به توضیح پردازش تصویر بپردازیم در ابتدا باید بدانیم که ایمیج دقیقا یعنی چه؟ ایمیج عکسی است که آن را با تعداد پیکسلهایش تشخیص میدهند. برای مثال اگر یک عکس ارتفاعی 100 پیکسلی و عرضی 200 پیکسلی داشته باشد، رزولوشن آن 20000 خواهد بود. هر پیکسل یک نقطه بخصوص از یک عکس است با رنگ سایه و میزان شفافیت خاص خودش و به چهار دسته زیر تقسیمبندی میشوند:
1) GrayScale: یک پیکسل با تنها یک مؤلفه بین 0 تا 255(صفر کاملاً سیاه و 255 کاملا سفید است)
2) RGB: یک پیکسل که متشکل از سه مؤلفه بین 0 تا 255 است(شامل سه رنگ سبز، قرمز و آبی ست)
3) RGBA: یک افزونه از RGB است که به آن زمینه آلفا اضافه شدهاست و میزان شفافیت ایمیج(کدر بودن) آن را نیز دخیل میکند
4) CMYK: دارای چهار مؤلفه: فیروزهای(Cyan)، سرخابی(Magenta)، زرد(Yellow) و مشکی(Black) است و هر کدام از مولفهها بین 0 تا 100 درصد هستند
پردازش تصویر بر روی هر یک از این پیکسلها زنجیرهای از عملکردها را برای شناسایی انجام میدهد، به گونهای که وقتی عملکرد اول را بر روی تمامی پیکسلها انجام داد، شروع به انجام عملکرد دوم میکند و به همین ترتیب تا انتها.
مفهوم پردازش تصویر:
پردازش تصویر به معنای تغییر یک ایمیج به فرمت دیجیتال جهت انجام تعدادی عملیات بخصوص برای دست یافتن به اطلاعاتی در مورد آن است. سیستمهای پردازشگر برای پردازش تصاویر معمولا ایمیجها را به صورت سیگنالهای دوبعدی در نظر میگیرند و از روشهای بخصوصی برای پردازش این سیگنالها استفاده میکنند.
در ادامه به 5 روش اصلی برای پردازش تصویر اشاره خواهیم کرد:
1) Visualization: آبجکتهایی را در عکس پیدا میکند که قابل مشاهده نیستند
2) Recognition: تشخیص اشیاء مختلف در تصویر
3) Sharpening and Restoration: یک تصویر پیشرفته از عکس معمولی میسازد
4) Pattern Recognition: الگوهای مختلف اطراف اشیاء در تصویر را بازشناسی میکند
5) Retrieval: شروع به جستجو کردن در یک پایگاهداده بسیار بزرگ میکند تا یک عکس مشابه عکس اصلی پیدا کند
مراحل اصلی پردازش تصویر:
آمادهسازی اولیه(Image Acquisition): این مرحله با نام پیش پردازش(Preprocessing) نیز شناخته میشود و اولین قدم برای پردازش تصویر است که از یک سورس(معمولا یک پایگاهداده سختافزاری) صورت میگیرد.
افزایش کیفیت تصویر(Image Enhancement): شامل شناسایی و برجستهسازی برخی جزئیات است که برای پردازش تصویر مورد نیاز هستند و با تغییر میزان نور(Brightness) و کنتراست(Contrast) عکس همراه است.
بازیابی عکس(Image Restoration): این مرحله شامل بهبود شکل ظاهری یک تصویر است. با این حال برخلاف مرحله قبل(افزایش کیفیت تصویر)، این مرحله با استفاده از مدلها و الگوهای محاسباتی عددی(ریاضیاتی) انجام میشود.
پردازش رنگ تصویر(Color Image Processing): پردازش رنگ تصاویر شامل زنجیرهای از تکنیکهای مدلسازی و تشخیص رنگ در حوزه دیجیتال است و از آنجایی که استفاده از تصاویر دیجیتال(ایمیجها) در بستر اینترنت بسیار پرکاربرد است در نتیجه این حوزه نیز از اهمیت بالایی برخوردار است.
موجکها و پردازش چند رزولوشنی(Wavelets and Multiresolution Processing): این موجکها برای نمایش تصاویر در درجات مختلف رزولوشن استفاده میشوند. تصاویر به موجکها یا تکههای کوچکتر جهت فشردهسازی دادهها و نمایش آنها، تقسیمبندی میشوند.
فشردهسازی(Compression): از طریق فشردهسازی، فضای مورد نیاز برای ذخیره ایمیج کاهش یافته و انتقال آن نیز راحتتر صورت میگیرد. این عمل موقعی اهمیت خود را نشان میدهد که تصاویر برای بکارگیری در بستر اینترنت مورد استفاده قرار میگیرند.
پردازش شکلشناسی(Morphological Processing): مجموعهای از عملیاتهای پردازشیست برای فرمدهی و شناسایی شکل تصاویر بر اساس شمایل کلی آنها.
تقسیمبندی(Segmentation): تقسیمبندی یکی از سختترین قسمتهای پردازش تصویر است و شامل تقسیمبندی عکس به آبجکتها و اجزای تشکیل دهنده آن است.
توصیف و ریپرزنتیشن(Representation and Description): بعد از تقسیمبندی تصویر به قسمتهای مختلف در مرحله تقسیمبندی، هر قسمت به صورت جداگانه برای پردازش توسط کامپیوتر مورد استفاده قرار میگیرند؛ دو عملگر اصلی در این بخش یکی بررسی ویژگیهای خاص موجود در هر قسمت (Representation) و دیگری استخراج کیمیتهای موجود در تصویر برای کمک به شناسایی تمایز بین تصاویر هستند.
بازشناسی(Recognition): پس از انجام مرحله قبل، این بخش یک برچسب(Label) بخصوص به هر تصویر اختصاص میدهد.
زمینههای بکارگیری پردازش تصویر:
پزشکی
پردازش تصویر به صورت گسترده در زمینه پزشکی مورد استفاده قرار میگیرد و باعث دقت و اثربخشی بیشتر در تشخیص و شناسایی بیماریها و برنامهریزی برای درمان آنها شدهاست. برای مثال، میتوان برای تشخیص زودهنگام سرطان و شناسایی بافتهای غیرطبیعی در بدن از پردازش تصویر و الگوریتمهای تشخیصی استفاده کرد. البته باید توجه داشت به علت حساس بودن مسائل پزشکی و نیازمند بودن دقت بالا در دستگاههای پزشکی، باید قبل از بهرهبرداری همگانی از این فناوریها در صنایع حساس آنها را خوب ارزیابی نمود.
ترافیک و کنترل شهری
در زمینه کنترل ترافیک، از یک سیستم پردازش تصویر ویدیوئی به نام VIPS استفاده میشود که شامل سه بخش: سیستم عکسبرداری، سیستم مخابراتی و یک سیستم پردازشگر تصویر است. این سیستم عبور و مرور وسایل نقلیه در یک محدوده خاص را بررسی میکند و عملکرد آن به صورت on و off است. هنگامی که یک وسیله نقلیه به محدوده وارد میشود حسگرها on شده و آن را تا خروج از محدوده دنبال میکنند، سپس پس از خروج دستگاه از محدوده حسگرها off میشوند. این محدوده قابل تعریف است. علاوه بر این، از طریق این سیستم میتوان نوع وسایل نقلیه و پلاک آنها شناسایی و ضبط شوند. همچنین از دیگر کاربردهای بسیار مفید آنها میتوان به کنترل سرعت وسایل نقلیه اشاره کرد.
بازیابی عکس
پردازش تصویر میتواند به ما کمک کند تا قسمتهای از دست رفته و یا خراب شده یک تصویر را بازسازی کنیم. این کار توسط سیستم پردازش تصویری صورت میگیرد که به یک پایگاهداده(این پایگاهداده شامل مجموعهای عظیم از عکسهای مختلف است) متصل است و تعلیم دیده است تا عکسها را چگونه بازیابی کند.
شناسایی چهره
یکی از معمولترین استفادههای پردازش تصویر که امروزه در میان مردم عادی نیز بسیار پرکاربرد است، شناسایی چهره است. در ابتدای امر، الگوریتمهای یادگیری عمیق ماشین پردازشگر، شروع به یادگیری و آموزش در مورد چیزهایی از قبیل، شکل و فرم صورت انسان، فاصله بین دو چشم و... میکند. بعد از یادگیری این ویژگیها، سیستم شروع به پردازش تصاویر مختلف و شناسایی صورت افراد در آنها میکند. امروزه استفاده از این ویژگی پردازش تصویر در زمینههایی از جمله مسائل امنیتی، بیومتریک، گوشیهای همراه و... بیشتر به چشم میخورد.
فواید استفاده از پردازش تصویر:
این فناوری میتواند تأثیرات بسیار مثبتی بر روی تمامی صنایع و تکنولوژیهای دیگر بگذارد که در ادامه به برخی از این اثرات مثبت اشاره خواهیم کرد:
1) تصویر دیجیتال میتواند در قالبهای مختلف در دسترس قرار گیرد(تصاویر بهبود یافته، X-Ray، فیلم نگاتیو و ...)
2) به قابل درکتر شدن برخی تصاویر برای انسان کمک میکند
3) تمامی اطلاعات مورد نیاز از یک عکس را میتوان به راحتی استخراج کرده و در اختیار انسان قرار داد
4) میتوانیم تصاویر را به راحتی ذخیرهسازی و در صورت نیاز دوباره مورد استفاده قرار دهیم
5) میتوان به راحتی از هر چیزی یک ایمیج تهیه کرد و در بستر دیجیتال انتقال داد