مقدمه
در بین بیماریهای ریوی، سرطان ریه Lung cancer همچنان به عنوان یکی از خطرناکترین سرطانها شناخته میشود. یک سوم از مرگ و میرهای ناشی از سرطانها به سرطان ریه اختصاص دارد. در حدود ./ 80 بیماران پس از شناسایی این نوع سرطان در بهترین شرایط پنچ سال از عمرشان باقی مانده است. آلودگی هوا ناشی از صنعتی شدن شهرها، مصرف دخانیات و عوامل ژنتیکی از دلایل عمده ابتلا به این بیماریها میباشد. تشخیص زود هنگام بیماریهای ریوی تاثیر عمدهای در احتمال درمان قطعی بیماری خواهد داشت. روشهای عمده تشخیص سرطان ریه شامل روشهای تصویر برداری رادیوگرافی و سیتیاسکن، بیوپسی، برونکوسکوپی و آزمایش سلولهای موجود در خلط سینه میباشد. که در بافت ریه ایجاد میشود، به بیان دیگر ندولها، کدورتهای رادیوگرافیک کروی با قطر کمتر از سه سانتیمتر میباشند. با توجه به اهمیت موضوع، امروزه تحقیقات گستردهای در این زمینه صورت گرفته است. در میان راه حلهای موجود میتوان از روشهای پردازش تصویر سنتی نام برد، که در نهایت برای تشخیص دستهی بیماری(یا همان نوع ندول ریوی) با استفاده از یک روش ترکیبی مانند منطق فازی، شبکههای عصبی، و دیگر دستهبندی کنندههای موجود بهره میگیرند.
در این میان روش تصویربرداری سیتی اسکن به عنوان روش برتر تشخیص کاربرد فراوانی دارد. در این روش تشخیص، پزشک به بررسی ندولهای احتمالی تصاویر میپردازد. ندول ریوی یک توده کوچک، گرد و کدر رنگی است که در داخل بافت ریه ایجاد میشود. به بیان دیگر ندولها کدورتهای رادیوگرافیک کروی با قطر کمتر از سه سانتیمتر میباشند. ندولهای ریوی به دو دسته خوشخیم) غیر سرطانی(و بدخیم )سرطانی تقسیم میشوند. علل خوشخیم شایع شامل گرانولومهای عفونی و هامارتومها هستند، در صورتی که موارد بدخیم ناشی از سرطان اولیه ریه، تومورهای کارسینویید و متاستازهای ریه میباشند. کالج پزشکان قفسه سینه آمریکا ACCP احتمال بدخیمی ندول با قطر هشت میلیمتر و بالاتر را بسیار بیشتر از ندولهای با قطر کمتر دانسته است. از جمله مشکلات موجود در این تحقیق میتوان شباهت شدید ندولها با یکدیگر در تصاویر را نام برد، به نوعی که پزشک در تشخیص دچار اشتباه میشود. انواع مختلف ندولها و امکان وجود آنها در تمام ناحیه ریه از دیگر مشکلات تشخیص در این حوزه میباشد.
هدف این مقاله ارائه روشی جدید برای تشخیص ندولهای ریوی میباشد بطوری که سیستم توانایی تفکیک پنچ دسته از بیماری را با دقتی بالاتر از روشهای پیشین ارائه دهد. با در نظر گرفتن اهمیت موضوع و دامنهی وسیع تحقیق تلاش بر این است با توجه به آنچه که در شکل 1 نشان داده شده است، بتوان با استفاده از فیلتر گابور و شبکه عصبی کانولوشن، سیستمی را طراحی کرد که بتواند پس از انجام پیش پردازش به استخراج ویژگیهای تصاویر با استفاده از فیلتر گابور در چهار نوع از ندولهای ریوی و دسته دادههای سالم، بپردازد تا بتواند در مرحله بعد یعنی مرحله دستهبندی کلاس ندولهای ریوی، در دقت کلی افزایش بسزایی داشته باشد. در این مقاله ابتدا به بررسی مقالات پیشین میپردازیم و پس از آن دو مفهوم کلی بکار رفته در مقاله را بررسی میکنیم. سپس روش پیشنهادی و نتایچ حاصل شده از آن را بیان خواهیم کرد و در نهایت به نتیجهگیری میپردازیم.
شکل 1: نمایی کلی از مراحل انجام کار
کارهای گذشته
1. روشهای ادغام تصاویر پزشکی
روشهای ادغام تصاویر پزشکی به طور خلاصه شامل دو مرحله است. مرحله اول مربوط به ثبت تصاویر و مرحله دوم ادغام مرتبط ویژگیهای قابل استخراج و مورد نیاز از تصاویر ثبت شده میباشد. ثبت تصاویر نیازمند روشی برای تصحیح انحرافات و به نوعی یکسان سازی تصاویر برای انجام آنالیز بر روی آنها دارد، که به عنوان مثال میتوان تغییرات مقیاس و چرخش تصاویر و از بین بردن نویز و ویژگیهای از دست رفته و نقاط دور افتاده را بیان کرد.
2. روش مرفولوژی
روش مرفولوژی مدتهاست که مورد استفاده قرار گرفته است و از ایده اصلی، برای شناسایی و تشخیص اطلاعات مکانی در تصاویر پزشکی استفاده میشود. به عنوان مثالی برای استفاده از شبکههای مورفولوژیکی میتوان از آنالیز تصویر مغز و ترکیب تصاویر سی تی اسکن و ام آر آی نام برد. دراین مثالهای کاربردی رفتار روش مرفولوژیکی به ساختاری که برای باز و بسته شدن عملیات تعریف شده است بستگی دارد. در تمام پردازشهای مورفولوزی از عنصر ساختاری استفاده میشود. این عنصر نقش مهمی دارد، به نحوی که انتخاب مناسب آن اغلب مهمترین بخش در یک پردازش میباشد. معمولا عنصر ساختاری به صورت یک نقاب روی تصویر حرکت میکند و پردازشهای مرفولوژیکی بر عهده میگیرد. خطا در تشخیص ویژگیها در صورت وجود نویز در این تصاویر بسیار بالا است.
به طور مثال در آنالیز تصاویر سی تی ریه اولین گام شناسایی مرزهای ریه میباشد، شناسایی مرزهای باریک ریه از تصاویر سیتی نیازمند الگوریتمی دقیق و کارامد است که در به این مسشله پرداخته شده است، در این روش ابتدا از گام لبه موجک در دو بعد برای مرز ریه استفاده شده است و سپس با استفاده از سطح خاکستری سه بعدی به بدست آوردن حجم ریه میپردازد، و با موفقیت به چالشهای نمایش مرز و خطوط و ندولهای ریه پاسخ میدهد، بعد از تشکیل ساختار کروی سه بعدی عملیات خاتمه مییابد.
3. روشهای مبتنی بر دانش
در تصویربرداری پزشگی در چندین نمونه نیاز به برچسبگذاری، تقسیمبندی و ثبت تصاویر با استفاده از دانش پزشکی امکانپذیر است. به طور کلی دانش وابسته به محدودهی کاری مورد نظر برای بیان واضحی از تقسیمبندی یا تشخیص نیازمند اطلاعات است.
4. روش مبتنی بر موجک
مفهوم مقدماتی روش مبتنی بر موجک را میتوان استخراج جزئیات از یک عکس و انطباق آن ویژگی در دیگر عکسها، بیان کرد. جزئیات اطلاعات از یک تصویر در فرکانس و موجک بالا توانایی انتخاب فرکانسهای دو بعد زمان و مکان را دارد. مدلهای زیادی برای تزریق وجود دارد که سادهترین آنها مدلهای تعویضی هستند، مدلهای ساده و پیچیدهی ریاضی نیز وجود دارد. وضوح تصاویر در قبل و بعد از ادغام تصاویر یکسان باقی میماند. بیشتر روشهای پیادهسازی شده مبتنی بر موجک با ترکیب با شبکههای عصبی انجام شده است، که در آن شبکههای عصبی بر روی پردازش ویژگیها و موجک بر روی ادغام تصاویر تمرکز دارد. به عنوان مثال کاربردی خارج از آنالیز تصویر در با استفاده از ضرایب موجک و دستهبندی کننده ماشین بردار پشتیبان و شبکههای عصبی توانسته صداهای نرمال و غیر نرمال ریه را در شش دسته مجزا دستهبندی کند.
5. روش مبتنی بر شبکههای عصبی
توانایی مدلهای شبکه عصبی برای پیشبینی، تجزیه و تحلیل، و استنباط اطلاعات بدون استفاده از فرمولهای پیچیدهی ریاضی به عنوان یک مزیت یاد میشود. این ویژگی باعث ارائهی روشهای جدید در زمینه تصویر پردازی شده است. توانایی آموزش شبکههای عصبی باعث شده تا در ادغام اطلاعات، ادغام تصاویر، تشخیص پزشکی و سرطان موثر واقع شود. در جهت بهبود استحکام و یادگیری شبکههای عصبی مصنوعی (ANN) با استفاده از پردازش ترتیبی با تلفیق دیگر تکنیکها به نتایچ قابل قبولی رسیدهاند.
6. روش مبتنی بر منطق فازی
در ادغام تصاویر با استفاده از منطق فازی در انتقال یک ویژگی و یا تصمیمگیری استفاده شده است. برنامههای کاربردی زیادی در حوزههای تشخیص سرطان، ادغام تصاویر، مغز انجام شده است. انتخاب توابع عضویت و مجموعههای فازی که بهترین نتیجه را دارا باشند همچنان یک مستله باز تلقی میشود.
7. روشهای مبتنی یادگیری عمیق
در مقالهای از مدلهای DBN و CNN برای طبقهبندی تصاویر استفاده کرده است. این مقاله برای ارزیابی کار خود از دیتاست Lung Image Database Consortium استفاده کرده است، نتیجه حاصل شده از این روش 73.4 درصد برای cnn پیشنهاد شده و 73.3 برای DBN پیشنهاد شده بوده است. در مقاله از سه مدل DBN و CNN و SAE استفاده کرده است که دقت حاصل شده به ترتیب 79.2 و ۸۱ و 79.4 درصد میباشد. در مقاله از ساختار CNN برای طبقهبندی تصاویر استفاده کرده است این مقاله در تعداد تکرارهای متفاوت شبکه خود را تست کرده و در نهایت با 4 لایه کانولوشن و سه pooling و 2 لایه تماما متصل توانسته به دقت 82 درصد برسد. در مقاله نیز از شبکهای کانولوشنی برای طبقه عکسهای ریوی استفاده شده است ساختار شبکه این مقاله بعد از لایه pooling مستقیما متصل به softmx شده تا میزان شباهت را اعلام کند. با در دست داشتن دیتاستهای غیر عمومی متفاوت توانسته به بهترین دقت 77 درصد برسد.
مفاهیم پایه
در این بخش به بررسی یک مفهوم اساسی بکار رفته در مقاله میپردازیم. فیلتر گابور در سال 2006 نشان داده شد که برخالف تصور عام، میتوان از بخش فاز فیلتر گابور، ویژگیهای پایدار و مناسبی استخراج کرد. سپس نشان داده شد که با استخراج ویژگی از هر دو بخش اندازه و فاز فیلتر گابور، میتوان به دقت بالاتری در ELGBP شناسایی چهره دست یافت که حاصل آن، ارائه روش S بود. برای اعمال فیلتر گابور به تصویر، هستهی گابور را با اندازه و جهت o به صورت نشان داده شده در فرمول 1 در سطح پیکسل، به تصویر ورودی اعمال میکنیم. X و Y پیکسل مورد نظر و عملگر کانولوشن است و ks.o هستهی گابور میباشد که در فرمول 2 باز شده است.
با اعمال هستهی گابور به هر پیکسل X و Y، یک عدد مختلط حاصل میشود که بخش حقیق آن را Re و بخش موهومی را Im مینامیم. با استفاده از این دو مقدار، بخشهای اندازه M و فاز P محاسبه میشوند فرمول(3).
روش پیشنهادی
دیتاست مورد استفاده دیتاست interstitial hung diseases at the University Hospitals of Geneva (ILDs) حاوی 111 نمونه میباشد که هر کدام از نمونه ها اسلایسهای متفاوتی را شامل میشوند. مختصات نقاط ناحیه دچار بیماری توسط پزشک مشخص شده است. برای ورود اطلاعات به شبکه ابتدا باید ناحیه مورد نظر به ابعاد 3232 تبدیل شود. با توجه به شکل 2 این کار باید بگونهای انجام شود که نوع ندول و مختصات مورد نظر همراه با اعمال تصویر مختصات بر روی تصویر ریه مورد بررسی برای استخراج از دیتاست، صورت گیرد. همچنین حداقل 80 درصد ناحیه جدا شده دچار بافت آسیب دیده باشد. هر کدام از تصاویر استخراج شده در کلاس مورد نظر ذخیره میشوند. در این روش پس از استخراج تصاویر ۳۲*۳۲ آن دسته از ground glass, fibrosis تصاویری را که مربوط به کلاس ندولهای health, consolidation, emphysema, micronodules بودند انتخاب کردیم.
در مرحله بعد با استفاده از فیلتر گابور به استخراج ویژگی از کلاسهای موجود پرداختیم. مراحل پیادهسازی و نوآوری روش پیشنهادی در قالب شکل 3 بیان شده است.
در مرحله آخر، تصاویر کلاسهای موجود را با سایز ۳۲*۳۲ به ورودی CNN برای دستهبندی میدهیم. در اینجا دادههای مورد استفاده برای تست همانند آنچه که در مقالات پیشین از مجموعه دادههای آموزش میباشند. همانطور که در شکل 4 مشاهده میشود شبکه CNN که بهترین دقت را نشان داد شامل پنچ لایه کانولوشن است که کرنلهای بکار گرفته شده در کوچکترین سایز ممکن K= ۲*۲ میباشند و یک Maxpooling و دو لایه تماماً متصل و در نهایت softmx برای اعلام میزان شباهت به هر یک از ۵ کلاس میباشد. عمق لایههای کانولوشن از فرمول 2^(L+1) تبعیت میکند که L نمایش دهنده لایه مورد نظر میباشد. با توجه به این فرمول در هر لایه کانولوشنی این شبکه ما به تعداد 2^(L+1)*k کرنل داریم. با توجه به گفته های قبل منطقا لایه pooling باید ۳۶k بردار ویژگی و ورودی برابر با خروجی لایه قبل خود یعنی 27*27 داشته باشد.
تابع فعالسازی(Activation function): مشخص است که تابع فعالسازی نقش بسزایی را در میزان همگرایی شبکه دارد. به این دلیل حساسیت در انتخاب یک تابع فعالسازی مناسب قابل درک است. با توجه به آزمایش تابع فعالسازیهای مختلف نهایتاً leakly Relu فرمول (۴) به عنوان یکی از موئرترین تابع فعالسازی برای توصیف شبکههای کانولوشنی معرفی شده است. در این روش در نهایت از بهینهساز Adam با پارامترهای تنظیم شده در مقالهای استفاده شده است.
نتایج ارزیابی
معیارهای ارزیابی: بدلیل حساسیت نسبت به عدم تعادل کلاسهای مورد استفاده در اینجا از فرمول (5) average F-score استفاده شد که مقدار آن برابر است با حاصل جمع حاصل ضرب recall و precision تقسیم بر حاصل جمع آنها که برای هر پنچ کلاس مورد نظر این مقادر محاسبه میشود. در این فرمول مقدار recall که تعداد نمونههای درست دستهبندی شده در کلاس مورد نظر را (به طور مثال کلاس c ) به کل نمونههای کلاس را نشان میدهد. مقدار precision نیز تعداد نمونههای درست دستهبندی شده در کلاس مورد نظر را (به طور مثال کلاس c ) به کل نمونههایی که در این کلاس دستهبندی شدهاند را نمایش میدهد. دقت نهایی نیز از معادله (۶) محاسبه میشود. که نمایش دهنده کل تصاویر درست برچسب خورده به کل تصاویر موجود میباشد.
نتایج: نتایج ارزیابی با سیستمی با مشخصات ram 16 و core i7 HQ و gtx 1080 8GB به دست آمده است و با استفاده از تنسورفلو و پایتون ۳.۵ شبکه cnn پیاده سازی شده است. لازم به ذکر است که عملیات پیش پردازش و همانطور اعمال فیلتر گابور در محیط متلب انجام شده است. پیش از این با استفاده از شبکه های cnn و اعمال تغییرات در ساختار این شبکهها در حوزه دستهبندی تصاویر ریوی مقالات متفاوتی ارائه شدهاند. آنچه در جدول 1 آمده، مجموعهای از ساختار شبکههای متفاوت را نشان میدهد که به صورت کلی برای دیتاستهای گوناگونی که مربوط به حوزه پزشکی نبودند تاکنون مورد استفاده قرار گرفتهاند مانند: LeNet, Alex-Net, VGG-Net . همچنین ساختار شبکه در مقالهای در این حوزه پیشنهاد شده است که در جدول 2 مشخص شده است این ساختار در مقالات پیشین بهترین دقت را از خود به نمایش گذاشته است. در این مقاله با اعمال فیلتر گابور توانستیم دقت را از بهترین دقت روشهای پیشین مورد بررسی، دو درصد بهبود دهیم. نتیجه گیری
بیماریهای ریوی و در راس آنها سرطان ریه جامعه بزرگی از افراد تحت تاشیر قرار داده است. یکی از دلایل اصلی در مرگ میر این بیماری عدم تشخیص بموقع و صحیح آن میباشد. پیچیدگی تصویربافت آسیب دیده و انواع گوناگون بیماریهای ریوی از دیگر عوامل اهمیت پرداختن به موضوع میباشند. تاکنون روشهای گوناگونی برای تشخیص و دستهبندی ندولهای ریوی ارائه شده است، در این مقاله ما با بهرهگیری از شبکه کانولوشن از مدلهای یادگیری عمیق و فیلتر گابور برای کمک به استخراج ویژگیهای تصاویر توانستیم دقت دستهبندی را به میزان دو درصد از بهترین دقت مقالا پیشین بهبود دهیم.
و در آخر:
در این قسمت توضیحاتی آموزنده در مورد دستهبندی ندولهای ریوی با استفاده از شبکههای یادگیری عمیق گذاشته شد. در آینده مطالب بیشتری را در اختیار شما قرار خواهیم داد، با آرزوی بهترینها برای شما خواننده محترم.
منابع:
یاسمین کوثری، دکتر سید جواد مهدوی چابک، دکتر محمد حسین معطر، "دستهبندی ندولهای ریوی با استفاده از شبکههای یادگیری عمیق".
دیدگاه خود را بنویسید