مقدمه

در بین بیماری‌های ریوی، سرطان ریه Lung cancer همچنان به عنوان یکی از خطرناکترین سرطان‌ها شناخته می‌شود. یک سوم از مرگ و میرهای ناشی از سرطان‌ها به سرطان ریه اختصاص دارد. در حدود ./ 80 بیماران پس از شناسایی این نوع سرطان در بهترین شرایط پنچ سال از عمرشان باقی مانده است. آلودگی هوا ناشی از صنعتی شدن شهرها، مصرف دخانیات و عوامل ژنتیکی از دلایل عمده ابتلا به این بیماری‌ها می‌باشد. تشخیص زود هنگام بیماری‌های ریوی تاثیر عمده‌ای در احتمال درمان قطعی بیماری خواهد داشت. روش‌های عمده تشخیص سرطان ریه شامل روش‌های تصویر برداری رادیوگرافی و سیتی‌اسکن، بیوپسی، برونکوسکوپی و آزمایش سلول‌های موجود در خلط سینه می‌باشد. که در بافت ریه ایجاد می‌شود، به بیان دیگر ندولها، کدورتهای رادیوگرافیک کروی با قطر کمتر از سه سانتیمتر می‌باشند. با توجه به اهمیت موضوع، امروزه تحقیقات گسترده‌ای در این زمینه صورت گرفته است. در میان راه حل‌های موجود می‌توان از روش‌‫های پردازش تصویر سنتی نام برد، که در نهایت برای تشخیص دسته‌ی بیماری(یا همان نوع ندول ریوی) با استفاده از یک روش ترکیبی مانند منطق فازی، شبکه‌های عصبی، و دیگر دسته‌بندی کننده‌های موجود بهره می‌گیرند.

‫در این میان روش تصویربرداری سیتی اسکن به عنوان روش برتر تشخیص کاربرد فراوانی دارد. در این روش تشخیص، پزشک به بررسی ندولهای احتمالی تصاویر می‌پردازد. ندول ریوی یک توده کوچک، گرد و کدر رنگی است که در داخل بافت ریه ایجاد می‌شود. به بیان دیگر ندولها کدورتهای رادیوگرافیک کروی با قطر کمتر از سه سانتیمتر می‌باشند. ندولهای ریوی به دو دسته خوش‌خیم) غیر سرطانی(و بدخیم )سرطانی تقسیم می‌شوند. علل خوش‌خیم شایع شامل گرانولوم‌های عفونی و هامارتوم‌ها هستند، در صورتی که موارد بدخیم ناشی از سرطان اولیه ریه، تومورهای کارسینویید و متاستازهای ریه می‌باشند. کالج پزشکان قفسه سینه آمریکا ACCP احتمال بدخیمی ندول با قطر هشت میلیمتر و بالاتر را بسیار بیشتر از ندولهای با قطر کمتر دانسته است. از جمله مشکلات موجود در این تحقیق می‌توان شباهت شدید ندولها با یکدیگر در تصاویر را نام برد، به نوعی که پزشک در تشخیص دچار اشتباه می‌شود. انواع مختلف ندولها و امکان وجود آنها در تمام ناحیه ریه از دیگر مشکلات تشخیص در این حوزه می‌باشد.

هدف این مقاله ارائه روشی جدید برای تشخیص ندولهای ریوی می‌باشد بطوری که سیستم توانایی تفکیک پنچ دسته از بیماری را با دقتی بالاتر از روش‌های پیشین ارائه دهد. با در نظر گرفتن اهمیت موضوع و دامنه‌ی وسیع تحقیق تلاش بر این است با توجه به آنچه که در شکل 1 نشان داده شده است، بتوان با استفاده از فیلتر گابور و شبکه عصبی کانولوشن، سیستمی را طراحی کرد که بتواند پس از انجام پیش پردازش به استخراج ویژگی‌های تصاویر با استفاده از فیلتر گابور در چهار نوع از ندول‌های ریوی و دسته داده‌های سالم، بپردازد تا بتواند در مرحله بعد یعنی مرحله دسته‌بندی کلاس ندول‌های ریوی، در دقت کلی افزایش بسزایی داشته باشد. ‫در این مقاله ابتدا به بررسی مقالات پیشین می‌پردازیم و پس از آن دو مفهوم کلی بکار رفته در مقاله را بررسی می‌کنیم. سپس روش پیشنهادی و نتایچ حاصل شده از آن را بیان خواهیم کرد و در نهایت به نتیجه‌گیری می‌پردازیم.

شکل 1: نمایی کلی از مراحل انجام کار

کارهای گذشته

1. روش‌های ادغام تصاویر پزشکی

روش‌های ادغام تصاویر پزشکی به طور خلاصه شامل دو مرحله است. مرحله اول مربوط به ثبت تصاویر و مرحله دوم ادغام مرتبط ویژگی‌های قابل استخراج و مورد نیاز از تصاویر ثبت شده می‌باشد. ثبت تصاویر نیازمند روشی برای تصحیح انحرافات و به نوعی یکسان سازی تصاویر برای انجام آنالیز بر روی آنها دارد، که به عنوان مثال می‌توان تغییرات مقیاس و چرخش تصاویر و از بین بردن نویز و ویژگی‌های از دست رفته و نقاط دور افتاده را بیان کرد.

2. روش مرفولوژی

روش مرفولوژی مدتهاست که مورد استفاده قرار گرفته است و از ایده اصلی، برای شناسایی و تشخیص اطلاعات مکانی در تصاویر پزشکی استفاده می‌شود. به عنوان مثالی برای استفاده از شبکه‌های مورفولوژیکی می‌توان از آنالیز تصویر مغز و ترکیب تصاویر سی تی اسکن و ام آر آی نام برد. دراین مثال‌های کاربردی رفتار روش مرفولوژیکی به ساختاری که برای باز و بسته شدن عملیات تعریف شده است بستگی دارد. در تمام پردازش‌های مورفولوزی از عنصر ساختاری استفاده می‌شود. این عنصر نقش مهمی دارد، به نحوی که انتخاب مناسب آن اغلب مهمترین بخش در یک پردازش می‌باشد. معمولا عنصر ساختاری به صورت یک نقاب روی تصویر حرکت می‌کند و پردازش‌های مرفولوژیکی بر عهده می‌گیرد. خطا در تشخیص ویژگی‌ها در صورت وجود نویز در این تصاویر بسیار بالا است.

به طور مثال در آنالیز تصاویر سی تی ریه اولین گام شناسایی مرزهای ریه می‌باشد، شناسایی مرزهای باریک ریه از تصاویر سی‌تی نیازمند الگوریتمی دقیق و کارامد است که در به این مسشله پرداخته شده است، در این روش ابتدا از گام لبه موجک در دو بعد برای مرز ریه استفاده شده است و سپس با استفاده از سطح خاکستری سه بعدی به بدست آوردن حجم ریه می‌پردازد، و با موفقیت به چالش‌های نمایش مرز و خطوط و ندولهای ریه پاسخ می‌دهد، بعد از تشکیل ساختار کروی سه بعدی عملیات خاتمه می‌یابد.

3. روش‌های مبتنی بر دانش

در تصویربرداری پزشگی در چندین نمونه نیاز به برچسب‌گذاری، تقسیم‌بندی و ثبت تصاویر با استفاده از دانش پزشکی امکان‌پذیر است. به طور کلی دانش وابسته به محدوده‌ی کاری مورد نظر برای بیان واضحی از تقسیم‌بندی یا تشخیص نیازمند اطلاعات است.

4. روش مبتنی بر موجک

مفهوم مقدماتی روش مبتنی بر موجک را می‌توان استخراج جزئیات از یک عکس و انطباق آن ویژگی در دیگر عکس‌ها، بیان کرد. جزئیات اطلاعات از یک تصویر در فرکانس و موجک بالا توانایی انتخاب فرکانس‌های دو بعد زمان و مکان را دارد. مدل‌های زیادی برای تزریق وجود دارد که ساده‌ترین آنها مدل‌های تعویضی هستند، مدل‌های ساده و پیچیده‌ی ریاضی نیز وجود دارد. وضوح تصاویر در قبل و بعد از ادغام تصاویر یکسان باقی می‌ماند. بیشتر روش‌های پیاده‌سازی شده مبتنی بر موجک با ترکیب با شبکه‌های عصبی انجام شده است، که در آن شبکه‌های عصبی بر روی پردازش ویژگی‌ها و موجک بر روی ادغام تصاویر تمرکز دارد. به عنوان مثال کاربردی خارج از آنالیز تصویر در با استفاده از ضرایب موجک و دسته‌بندی کننده ماشین بردار پشتیبان و شبکه‌های عصبی توانسته صداهای نرمال و غیر نرمال ریه را در شش دسته مجزا دسته‌بندی کند.

5. روش مبتنی بر شبکه‌های عصبی

‫توانایی مدل‌های شبکه عصبی برای پیش‌بینی، تجزیه و تحلیل، و استنباط اطلاعات بدون استفاده از فرمول‌های پیچیده‌ی ریاضی به عنوان یک مزیت یاد می‌شود. این ویژگی باعث ارائه‌ی روش‌های جدید در زمینه تصویر پردازی شده است. توانایی آموزش شبکه‌های عصبی باعث شده تا در ادغام اطلاعات، ادغام تصاویر، تشخیص پزشکی و سرطان موثر واقع شود. در جهت بهبود استحکام و یادگیری شبکه‌های عصبی مصنوعی (ANN) با استفاده از پردازش ترتیبی با تلفیق دیگر تکنیک‌ها به نتایچ قابل قبولی رسیده‌اند.

6. روش مبتنی بر منطق فازی

در ادغام تصاویر با استفاده از منطق فازی در انتقال یک ویژگی و یا تصمیم‌گیری استفاده شده است. برنامه‌های کاربردی زیادی در حوزه‌های تشخیص سرطان، ادغام تصاویر، مغز انجام شده است. انتخاب توابع عضویت و مجموعه‌های فازی که بهترین نتیجه را دارا باشند همچنان یک مستله باز تلقی می‌شود.

7. روش‌های مبتنی یادگیری عمیق

در مقاله‌ای از مدلهای DBN و CNN برای طبقه‌بندی تصاویر استفاده کرده است. این مقاله برای ارزیابی کار خود از دیتاست Lung Image Database Consortium استفاده کرده است، نتیجه حاصل شده از این روش 73.4 درصد برای cnn پیشنهاد شده و 73.3 برای DBN پیشنهاد شده بوده است. در مقاله از سه مدل DBN و CNN و SAE استفاده کرده است که دقت حاصل شده به ترتیب 79.2 و ۸۱ و 79.4 درصد می‌باشد. در مقاله از ساختار CNN برای طبقه‌بندی تصاویر استفاده کرده است این مقاله در تعداد تکرارهای متفاوت شبکه خود را تست کرده و در نهایت با 4 لایه کانولوشن و سه pooling و 2 لایه تماما متصل توانسته به دقت 82 درصد برسد. در مقاله نیز از شبکه‌ای کانولوشنی برای طبقه عکس‌های ریوی استفاده شده است ساختار شبکه این مقاله بعد از لایه pooling مستقیما متصل به softmx شده تا میزان شباهت را اعلام کند. با در دست داشتن دیتاستهای غیر عمومی متفاوت توانسته به بهترین دقت 77 درصد برسد.

مفاهیم پایه

در این بخش به بررسی یک مفهوم اساسی بکار رفته در مقاله می‌پردازیم. فیلتر گابور در سال 2006 نشان داده شد که برخالف تصور عام، می‌توان از بخش فاز فیلتر گابور، ویژگی‌های پایدار و مناسبی استخراج کرد. سپس نشان داده شد که با استخراج ویژگی از هر دو بخش اندازه و فاز فیلتر گابور، می‌توان به دقت بالاتری در ELGBP شناسایی چهره دست یافت که حاصل آن، ارائه روش S بود. برای اعمال فیلتر گابور به تصویر، هسته‌ی گابور را با اندازه و جهت o به صورت نشان داده شده در فرمول 1 در سطح پیکسل، به تصویر ورودی اعمال می‌کنیم. X و Y پیکسل مورد نظر و عملگر کانولوشن است و ks.o هسته‌ی گابور می‌باشد که در فرمول 2 باز شده است.

با اعمال هسته‌ی گابور به هر پیکسل X و Y، یک عدد مختلط حاصل می‌شود که بخش حقیق آن را Re و بخش موهومی را Im می‌نامیم. با استفاده از این دو مقدار، بخش‌های اندازه M و فاز P محاسبه می‌شوند فرمول(3).

روش پیشنهادی

دیتاست مورد استفاده دیتاست interstitial hung diseases  at the University Hospitals of Geneva (ILDs) حاوی 111 نمونه می‌باشد که هر کدام از نمونه ها اسلایس‌های متفاوتی را شامل می‌شوند. مختصات نقاط ناحیه دچار بیماری توسط پزشک مشخص شده است. برای ورود اطلاعات به شبکه ابتدا باید ناحیه مورد نظر به ابعاد 3232 تبدیل شود. با توجه به شکل 2 این کار باید بگونه‌ای انجام شود که نوع ندول و مختصات مورد نظر همراه با اعمال تصویر مختصات بر روی تصویر ریه مورد بررسی برای استخراج از دیتاست، صورت گیرد. همچنین حداقل 80 درصد ناحیه جدا شده دچار بافت آسیب دیده باشد. هر کدام از تصاویر استخراج شده در کلاس مورد نظر ذخیره می‌شوند. در این روش پس از استخراج تصاویر ۳۲*۳۲ آن دسته از ground glass, fibrosis تصاویری را که مربوط به کلاس ندول‌های health, consolidation, emphysema, micronodules بودند انتخاب کردیم.

در مرحله بعد با استفاده از فیلتر گابور به استخراج ویژگی از کلاس‌های موجود پرداختیم. مراحل پیاده‌سازی و نوآوری روش پیشنهادی در قالب شکل 3 بیان شده است.

در مرحله آخر، تصاویر کلاس‌های موجود را با سایز ۳۲*۳۲ به ورودی CNN برای دسته‌بندی می‌دهیم. در اینجا داده‌های مورد استفاده برای تست همانند آنچه که در مقالات پیشین از مجموعه داده‌های آموزش می‌باشند. همانطور که در شکل 4 مشاهده می‌شود شبکه CNN که بهترین دقت را نشان داد شامل پنچ لایه کانولوشن است که کرنل‌های بکار گرفته شده در کوچکترین سایز ممکن K= ۲*۲ میباشند و یک Maxpooling و دو لایه تماماً متصل و در نهایت softmx برای اعلام میزان شباهت به هر یک از ۵ کلاس می‌باشد. عمق لایه‌های کانولوشن از فرمول 2^(L+1) تبعیت می‌کند که L نمایش دهنده لایه مورد نظر می‌باشد. با توجه به این فرمول در هر لایه کانولوشنی این شبکه ما به تعداد 2^(L+1)*k کرنل داریم. با توجه به گفته های قبل منطقا لایه pooling باید ۳۶k بردار ویژگی و ورودی برابر با خروجی لایه قبل خود یعنی 27*27 داشته باشد.

تابع فعالسازی(Activation function): مشخص است که تابع فعالسازی نقش بسزایی را در میزان همگرایی شبکه دارد. به این دلیل حساسیت در انتخاب یک تابع فعالسازی مناسب قابل درک است. با توجه به آزمایش تابع فعالسازی‌های مختلف نهایتاً leakly Relu فرمول (۴) به عنوان یکی از موئرترین تابع فعالسازی برای توصیف شبکه‌های کانولوشنی معرفی شده است. در این روش در نهایت از بهینه‌ساز Adam با پارامترهای تنظیم شده در مقاله‌ای استفاده شده است.

نتایج ارزیابی

معیارهای ارزیابی: بدلیل حساسیت نسبت به عدم تعادل کلاس‌های مورد استفاده در اینجا از فرمول (5) average F-score استفاده شد که مقدار آن برابر است با حاصل جمع حاصل ضرب recall و precision تقسیم بر حاصل جمع آنها که برای هر پنچ کلاس مورد نظر این مقادر محاسبه می‌شود. در این فرمول مقدار recall که تعداد نمونه‌های درست دسته‌بندی شده در کلاس مورد ‫نظر را (به طور مثال کلاس c ) به کل نمونه‌های کلاس را نشان می‌دهد. مقدار precision نیز تعداد نمونه‌های درست دسته‌بندی شده در کلاس مورد نظر را (به طور مثال کلاس c ) به کل نمونه‌هایی که در این کلاس دسته‌بندی شده‌اند را نمایش می‌دهد. دقت نهایی نیز از معادله (۶) محاسبه می‌شود. که نمایش دهنده کل تصاویر درست برچسب خورده به کل تصاویر موجود می‌باشد.

نتایج: نتایج ارزیابی با سیستمی با مشخصات ram 16 و core i7 HQ و gtx 1080 8GB به دست آمده است و با استفاده از تنسورفلو و پایتون ۳.۵ شبکه cnn پیاده ‌سازی شده است. لازم به ذکر است که عملیات پیش پردازش و همانطور اعمال فیلتر گابور در محیط متلب انجام شده است. پیش از این با استفاده از شبکه های cnn و اعمال تغییرات در ساختار این شبکه‌ها در حوزه دسته‌بندی تصاویر ریوی مقالات متفاوتی ارائه شده‌اند. آنچه در جدول 1 آمده، مجموعه‌ای از ساختار شبکه‌های متفاوت را نشان می‌دهد که به صورت کلی برای دیتاست‌های گوناگونی که مربوط به حوزه پزشکی نبودند تاکنون مورد استفاده قرار گرفته‌اند مانند: LeNet, Alex-Net, VGG-Net . همچنین ساختار شبکه در مقاله‌ای در این حوزه پیشنهاد شده است که در جدول 2 مشخص شده است این ساختار در مقالات پیشین بهترین دقت را از خود به نمایش گذاشته است. در این مقاله با اعمال فیلتر گابور توانستیم دقت را از بهترین دقت روش‌های پیشین مورد بررسی، دو درصد بهبود دهیم. نتیجه گیری

بیماری‌های ریوی و در راس آنها سرطان ریه جامعه بزرگی از افراد تحت تاشیر قرار داده است. یکی از دلایل اصلی در مرگ میر این بیماری عدم تشخیص بموقع و صحیح آن می‌باشد. پیچیدگی تصویربافت آسیب دیده و انواع گوناگون بیماری‌های ریوی از دیگر عوامل اهمیت پرداختن به موضوع می‌باشند. تاکنون روش‌های گوناگونی برای تشخیص و دسته‌بندی ندول‌های ریوی ارائه شده است، در این مقاله ما با بهره‌گیری از شبکه کانولوشن از مدل‌های یادگیری عمیق و فیلتر گابور برای کمک به استخراج ویژگی‌های تصاویر توانستیم دقت دسته‌بندی را به میزان دو درصد از بهترین دقت مقالا پیشین بهبود دهیم.


و در آخر:

در این قسمت توضیحاتی آموزنده در مورد ‫دسته‌بندی ندول‌های ریوی با استفاده از شبکه‌های یادگیری عمیق‬‬‬‬ گذاشته شد. در آینده مطالب بیشتری را در اختیار شما قرار خواهیم داد، با آرزوی بهترین‌ها برای شما خواننده محترم.


منابع:

یاسمین کوثری، دکتر سید جواد مهدوی چابک، دکتر محمد حسین معطر، "دسته‌بندی ندول‌های ریوی با استفاده از شبکه‌های یادگیری عمیق‬".