مقدمه:
پردازش دادههای متنی با توجه به تولید روز افزون این دادهها در پلتفرمهای مختلف از اهمیت زیادی برخوردار است. اندازهگیری شباهت متن یکی از مهمترین عملیات در کاربردهای مختلف متنکاوی نظیر بازیابی اطلاعات، دستهبندی متن، خوشهبندی متن، خلاصهسازی متن و سیستمهای پرسش و پاسخ است. با توجه به اهمیت اندازهگیری شباهت متن، روشهای مختلفی در تحقیقات قبلی در این راستا ارائه شده است که این روشها را میتوان به صورت کلی به روشهای سنتی و روشهای مبتنی بر یادگیری عمیق دستهبندی کرد. روشهای سنتی تشابه متن در سطح کلمات عمل میکنند. یافتن شباهت بین کلمات اولین گام برای محاسبه شباهت بین جملات، پاراگرافها و اسناد است. شباهت کلمات میتواند به دو روش شباهت لغوی و معنایی باشد. کلمات به صورت لغوی مشابه هستند اگر ترتیب کاراکترهای موجود در آنها شبیه باشد. همچنین کلمات از لحاظ معنایی مشابه هستند اگر یک کارکرد مشابهی داشته باشند و در یک زمینه مشابهی استفاده گردند. به صورت کلی روشهای مبتنی بر شباهت لغوی با استفاده از الگوریتمهای مقایسه رشتهها کار میکنند. همچنین روشهای مبتنی بر شباهت معنایی بر اساس الگوریتمهای مبتنی بر پیکره متنی و مبتنی بر دانش عمل میکنند. روشهای نوین در حوزه اندازهگیری تشابه متن مبتنی بر تکنیکهای شبکه عصبی و یادگیری عمیق هستند. روشهای مبتنی بر یادگیری عمیق در ایجاد بازنمایی درستی از کلمات نتایچ موفقیت آمیزی داشتهاند. روش تعبیه کلمات کار بازنمایی کلمه را با در نظر گرفتن کلمات اطراف آن در یک پیکره متن انجام میدهند. خروجی یک روش تعبیه کلمه، یک بردار (معمولا ۳۰۰ عنصری از اعداد حقیقی) که معنی کلمه را منعکس میکند. کلماتی که دارای معانی مشابهی هستند، بردارهای نزدیکتری را دارند. بسیاری از رویکردهای جدید از بردارهای تعبیه کلمه برای اندازهگیری شباهت جملات استفاده میکنند که این رویکردها در دسته یادگیری بدون نظار طبقهبندی میشوند. تکنیکهای یادگیری عمیق شبکه مانند شبکههای عصبی بازگشتی شبکه حافظه کوتاه مد طولانی (LSTM)، در سالهای اخیر توجه زیادی را به خود جلب کردهاند. با استفاده از این روشها یک بازنمایی از جملا و متنها با در نظر گرفتن ترتیب کلمات بدست میآید. شبکههای عصبی بازگشتی توانایی پردازش وابستگی بین کلمات را دارند و بازنمایی ایجاد شده توسط آنها به اندازهگیری دقیق شباهت متون کمک میکند. در دسته دیگری از تحقیقات قبلی بازنمایی ایجاد شده توسط لایههای شبکههای عصبی بازگشتی اغلب در یک معماری شبکه عصبی سیامی مورد استفاده قرار گرفته است و نتایچ خوبی در زمینه اندازهگیری شباهت متن حاصل شده است. روشهای ارائه شده در این تحقیقات جز دسته روشهای یادگیری با نظارت هستند. شبکه عصبی سیامی یک نوع شبکه عصبی خاص است که در وظایف مربوط به اندازهگیری تشابه یا رابطه بین دو چیز قابل مقایسه (برای مثال دو تصویر) بسیار مورد استفاده قرار میگیرد. شبکههای سیامی شامل دو یا چند زیرشبکه یکسانی هستند که هر کدام از آنها دارای پیکره بندی مشابه و پارامترهای مشترکی هستند. عملکرد موفق روشهای یادگیری عمیق در پژوهشهای پیشین مورد تایید قرار گرفته است. در این تحقیق به بررسی این موضوع میپردازیم که ترکیب ویژگیهای بدست آمده از شبکه عصبی عمیق با ویژگیهای شباهت لغوی منجر به بهبود عملکرد مدل یادگیری عمیق میشود یا خیر. در این راستا یک رویکرد ترکیبی مبتنی بر شبکه عصبی سیامی در این تحقیق ارائه میشود. در رویکرد ترکیبی ارائه شده با در نظر گرفتن لایههای عمیق شامل شبکه حافظه کوتاه_مدت طولانی، شبکه پیچشی و شبکه حافظه کوتاه-مدت طولانی دو طرفه و همچنین با استفاده از دو رویکرد تعبیه کلمات، مدلهای مختلفی پیادهسازی شده و بر روی مجموعه داده N2C2 اعمال شدند. نتایچ ارزیابی مدلها با استفاده از معیار همبستگی پیرسون و میانگین مربع خطاها نشان داد که مدل ترکیبی با استفاده از شبکه پیچشی بهترین نتیجه در پیشبینی شباهت را در بین مدلها دارد. به صورت کلی مدلهای ترکیبی نتیجه بهتری نسبت به مدلهای پایه مبتنی بر شبکه عمیق دارند. همچنین مدل پیشنهادی نسبت به مدلهای ارائه شده در عملکرد بهتری دارد.
کارهای مرتبط
در این بخش ابتدا به مرور کلی تحقیقات قبلی پرداخته و سپس به توصیف روشهای یادگیری عمیق بکار گرفته شده در رویکرد پیشنهادی می پردازیم.
1. مروری بر روشهای تخمین شباهت متن مبتنی بر تکنیکهای یادگیری عمیق
روشهای نوین در حوزه اندازهگیری تشابه متن با استفاده از تکنیکهای شبکه عصبی و یادگیری عمیق ارائه شدهاند. این روشها به طور کلی به دو دسته روشهای بی نظارت و با نظارت تقسیم میشوند. روشهای بدون نظار مبتنی بر یادگیری عمیق بر اساس بازنمایی ایجاد شده توسط یک روش تعبیه کلمه عمل میکنند و با داشتن بردار هر کلمه، بردار جملات را بدست آورده و با استفاده از معیارهای شباهت نظیر معیار کسینوسی، شباهت بین دو جمله یا متن را محاسبه میکنند. در دسته روشهای با نظارت، معماریهای مختلف شبکه عصبی عمیق جهت یادگیری مدل اندازه گیری تشابه مورد استفاده قرار گرفته است که در این میان شبکههای یادگیری عمیق مانند شبکههای عصبی بازگشتی، شبکه حافظه کوتاه مدت طولانی از روشهای پرکاربرد در این زمینه محسوب میشوند. این شبکهها بردار تعبیه کلمات مربوط به دو متن را به عنوان ورودی گرفته و بازنمایی منعکسکننده معنای آن دو متن را با استفاده از شبکه عمیق بدست آورده و بر اساس آن کار پیشبینی شباهت را انجام میدهند. این تحقیقات غالبا از یک معماری شبکه عصبی سیامی استفاده کرده و عملکرد موفقی در زمینه اندازهگیری شباهت متن به دست آوردهاند. جدول 1 چندین نمونه از تحقیقات مبتنی بر یادگیری عمیق را با ارائه اطلاعاتی درباره نوآوری روش ارائه شده، رویکرد و معیارها و ابزارهای مورد استفاده و مجموعه داده انتخاب شده جهت انجام آزمایشات نشان میدهد.
2. روشهای مورد استفاده در این پژوهش
در این تحقیق از ۳ شبکه عصبی بازگشتی حافظه کوتاه_مدت طولانی، شبکه عصبی بازگشتی حافظه کوتاه_مدت طولانی دو طرفه و شبکه عصبی پیچشی استفاده میکنیم. در بخشهای زیر هرکدام از این شبکهها را به صورت مختصر توضیح میدهیم.
- شبکه کانولوشنی: شبکه عصبی پیچشی یکی از مهمترین روشهای یادگیری عمیق هستند که در آنها چندین لایه با روشی قدرتمند آموزش میبینند این روش بسیار کارآمد بوده و یکی از رایجترین روشها در کاربردهای مختلف بینایی کامپیوتر است. یک لایه پیچشی دادههای ورودی متن را دریافت کرده و با انجام عملیات کانولوشن با استفاده از کرنلهای کانولوشن ویژگیهای جدیدی از متن را استخراج میکند. هر لایه کانولوشن شامل یک کرنل (یک پنجره کوچک) است که روی دادهها حرکت کرده و از طریق انجام عملیات کانولوشنی ویژگیهای جدید را محاسبه میکند. ویژگیهای جدید قابلیت متمایزسازی بالایی نسبت به دادههای خام ورودی داشته و باعث بهبود دقت پیشبینی میشود.
- شبکه LSTM: شبکه LSTM یک نوع شبکه عصبی بازگشتی بهبود یافته است که توسط هوچریتر و اشمیت توسعه داده شده است. این شبکه برای رفع مشکل ناپدید شدن گرادیان و عدم یادگیری توالیهای طولانی در شبکههای عصبی بازگشتی معرفی شده است و توانایی به یاد سپاری اطلاعات برای بازههای زمانی بلند مدت را دارد همچنین LSTM میتواند اطلاعات وابستگیهای طولانی مدت در داده های متنی را استخراج کرده و به طور مناسب بین داده ورودی و خروجی نگاشت ایجاد کند. مطابق شکل LSTM ۱ از چهار بخش سلول حافظه C ، دروازه ورودی i ، دروازه فراموشی f ، و دروازه خروجی o تشکیل شده است. دروازه ورودی it تشخیص میدهد که از کدام مقدار ورودی باید برای بهبود حافظه استفاده شود. اینکه تا چه حدی اطلاعات حافظه فعلی فراموش شود توسط دروازه فراموشی، ft تعیین میشود. دروازه خروجی ot اطلاعات خروجی واحد LSTM را تنظیم میکند.
جدول ا: بررسى روشهاى شباهت متن
شكل ١: ساختاريك واحد شبكه حافظه كوتاه_مدت طولانى
- LSTM دوطرفه: با توصيف جزئيات مربوط به هر واحد از LSTM در بخش قبلى در اين بخش به توصيف LSTM دوطرفه مپردازيم. اين مدل از دو LSTM يكطرفه جداگانه تشكيل شده است كه در مسائل مدلسازى ترتيبى عملكرد مناسبى از خود نشان داده است و همچنين يكى از مدلهاى پركاربرد در طبقهبندى متون محسوب میشود. شكل ٢ معمارى يك شبكه LSTM دو طرفه را نشان میدهد. همانطور كه Forward LSTM، در شكل مشاهده میشود با داشتن يك جمله به عنوان ورودى محاسبات رو به جلو را انجام میدهد، يعنى از ابتداى جمله شروع مىكند و محاسبات را انجام داده و خروجى را در هر نقطه زمانى (به ازاى هر كلمه)، بر اساس اطلاعات كلمات مجاور بدست میآورد. همچنين Backward LSTM از انتهاى يك جمله شروع كرده و در جهت عكس محاسبات را انجام میدهد و در نهايت بازنمايى حاصل از هر دو LSTM تركيب میشود.
شکل ۲: معماری یک شبکه LSTM دوطرفه
3. روش پیشنهادی
در بخش ۲ خلاصهای از رویکردهای مختلف برای یافتن شباهت بین متون بیان شد. استفاده از شبکههای عصبی عمیق جهت آموزش مدلهای اندازهگیری تشابه یکی از رویکردهای نوین در سالهای اخیر است. در این مطالعه به دنبال ارائه رویکردی برای بهبود دقت مدلهای یادگیری عمیق در اندازهگیری تشابه متون هستیم. بدین ترتیب با بهکارگیری لایههای مختلف یادگیری عمیق نظیر شبکه پیچشی، حافظه کوتاه مدت طولانی و همچنین حافظه کوتاه مدت طولانی دوطرفه و با گنجاندن ویژگیهای شباهت لغوی نظیر شباهت کسینوسی، یک روش شبکه عصبی سیامی ترکیبی برای محاسبه شباهت بین متن ارائه میکنیم. در این بخش ابتدا به توصیف مسئله شباهت متن میپردازیم سپس رویکرد پیشنهادی تحقیق را تشریح میکنیم.
- مسئله شباهت متن: در این بخش مسشله شباهت متن را با در نظر گرفتن شکل زیر توضیح میدهیم. ورودی الگوریتم پیشبینی شباهت، دو متن S2,S1 است. بهازای دو متن ورودی یک امتیاز شباهت بین • تا ۵ وجود دارد که امتیاز • نشان دهنده عدم تشابه و امتیاز ۵ بیانگر کاملاً مشابه است (جدول ۲) هدف الگوریتم، پیشبینی شباهت دو متن بر اساس مدل آموزش دیده است.
جدول ۲: مثالهایی از جفت جملات و امتیاز شباهت آنها: امتیاز صفر نشان دهنده عدم شباهت بین دو جمله و امتیاز ۵ نشاندهنده شباهت کامل بین دو جمله است.
- رویکرد پیشنهادی: شکل ۳ ساختار کلی رویکرد پیشنهادی این تحقیق برای محاسبه شباهت بین متن را نشان میدهد. همانطور که اشاره شد، رویکرد پیشنهادی عبارت است از یک معماری شبکه عصبی سیامی که شامل ویژگیهای شباهت رایچ است. اجزای اصلی رویکرد پیشنهادی عبارتند از: 1) لایه ورودی 2) لایه تعبیه کلمات 3) لایه اصلی 4) لایه تماما متصل 5) لایه خروجی. ابتدا عملیات پیش پردازش روی جملات انجام میگیرد. این عملیات شامل جداسازی کلمات و حذف کلمات توقف است. جملات پیش پردازش شده در ادامه عملیات وارد لایه تعبیه کلمات میشوند که به هر کلمه یک بردار حقیقی تعبیه کلمات نسبت داده میشود. برای بدست آوردن بردار تعبیه هر کلمه علاوه بر استفاده از لایه تعبیه کتابخانه کراس، از مدلهای از پیش آموزش دیده در این حوزه نیز استفاده میشود. در ادامه به ازای هر جمله بردارهای کلمات آن ادغام شده و بردار مربوط به هر جمله تشکیل میشود که این بردارها وارد لایههای شبکه عصبی عمیق میشوند. همانطور که در شکل ۳ مشاهده میشود، در این تحقیق از سه لایه حافظه کوتاه_مدت طولانی، حافظه کوتاه_مدت طولانی دوطرفه و شبکه پیچشی استفاده میکنیم. وظیفه این لایه ایجاد یک بازنمایی جدید از هر یک از جملات ورودی است طوری که بتواند معنای موجود در جمله را بیان کند. به جهت اینکه از معماری شبکه عصبی سیامی استفاده شده است، متناظر با هر زیرشبکه در شبکه سیامی، یک نوع لایه استفاده شده است (لایه A). همچنین در مدل پیشنهادی سه ویژگی شباهت لغوی رایچ شامل معیار شباهت کسینوسی، جاکارد، دایس جهت بهبود مدل محاسبه شده و با ادغام با بردارهای خروجی مسطح شده لایههای اصلی وارد یک لایه تماما متصل میشود. در ادامه یک لایه حذف تصادفی در مدل قرار داده میشود که وظیفه آن جلوگیری از پیش پرازش مدل است. خروجی لایه تماما متصل پس از عبور از لایه حذف تصادفی وارد لایه خروجی میشود که کار پیشبینی شباهت بین دو جمله را انجام میدهد.
شکل ۳: رویکرد پیشنهادی برای پیش بینی تشابه جملات
ویژگیهای لغوی مطابق با فرمول (1) محاسبه میشوند. در این فرمول، S1 و S2 به ترتیب مجموعه کلمات جمله ا و جمله ۲ در شکل ۳ میباشند.
4. آزمایشهای عملی و نتایچ
در این بخش ابتدا به توصیف مجموعه دادههای مورد استفاده جهت انجام آزمایشها پرداخته سپس معیارهای اندازهگیری عملکرد مدلها و تنظیمات مدلها و نتایج را بیان میکنیم. در این مطالعه از کتابخانه Keras جهت پیادهسازی مدلها استفاده میکنیم.
- مجموعه دادهها: در این مطالعه، از سه مجموعه داده استاندارد پزشکی که هر کدام شامل مجموعهای از جفت جملات با نمرات شباهت/ مرتبط بودن است، استفاده میکنیم. توصیف مجموعه دادهها در جدول ۳ بیان شده است.
- معیارهای اندازهگیری:
در این تحقیق، دقت مدلها با استفاده از معیارهای همبستگی پیرسون و معیار MSE محاسبه میشود. با در نظر گرفتن n جفت جمله (P= (P1,P2,...,Pn و مجموعههای و
,...,
,
=
به ترتیب به عنوان امتیازات شباهت واقعی و پیشبینی شده مجموعه P، معیار همبستگی پیرسون با استفاده از رابطه (2) محاسبه میشود:
همچنین معیار میانگین مربع خطاها با رابطه (۳) محاسبه میشود.
که در رابطههای ( ۴ ) و ( ,yi (۵, به ترتیب نشاندهنده امتیاز شباهت واقعی و پیشبینی شده جفت جمله pi است. در رابطه (۲)
و
(y که توان و خط بالای آن« دارد) به ترتیب مقادیر میانگین مجموعه را نشان میدهند.
- تنظیمات آزمایش: تنظیم هایپرپارامترها نقش مهمی در عملکرد مدلهای یادگیری عمیق دارد. پارامترها و هایپرپارامترهای مورد استفاده در هر لایه در جدول ۴ توصیف شده است.
- نتایج: در این بخش با در نظر گرفتن رویکرد پیشنهادی (شکل ۳) و بکارگیری دو لایه تعبیه شامل لایه تعبیه کتابخانه Keras و لایه تعبیه از پیش آموزش دیده Wiki-PubMed-PMC23 و همچنین استفاده از انواع مختلف لایههای شبکه عصبی (بلوک A )، مدلهای مختلفی را روی سه مجموعه داده مورد آزمایش قرار دادیم. در جدولهای نتایج عملکرد مدلها، لایه تعبیه کراس با عدد ا و لایه تعبیه از پیش آموزش دیده Wiki-PubMed-PMC با عدد ۲ کدگذاری شده است.
- نتایچ مدلها روی مجموعه داده N2C2:
نتایج به کارگیری مدلها روی مجموعه داده N2C2 در جدولهای 5 و 6 آورده شده است. جدول 5 نتایچ روشهای یادگیری عمیق بدون استفاده از ویژگیهای لغوی شامل Cosine ,Jaccard ,Dice را نشان میدهد. همچنین جدول 6 نتایچ روشهای ترکیبی شامل ویژگهای لغوی اشاره شده را نمایش میدهد. مطابق جدول 5 از بین روشهای استفاده شده، مدل SNN_Bi-LSTM_no_feat با لایه MSE بالاترین مقدار همبستگی (۰/۶۷۵۹) و پایینترین خطا ،Keras تعبیه (۱/۲۹۱۳) را در پیشبینی شباهت جملا به دست اورده است. همچنین مدل SNN_LSTM_no_feat با لایه تعبیه Keras نتایچ نزدیکتری نسبت به مدل برتر بدست آورده است. بررسی نتایچ مدلها در جدول بیانگر آن است که استفاده از مدل از پیش آموزش دیده در لایه تعبیه باعث بهبود در نتایچ هیچ یک از مدلها نشده است.
در جدول 6 نتایچ مربوط به مدلهای ترکیبی نمایش داده شده است. همانطور که مشخص است مدل شبکه عصبی سیامی ترکیبی مبتنی بر شبکه پیچشی و ویژگیهای لغوی به همراه لایه تعبیه کراس ( SNN_CNN_feat ) بالاترین مقدار همبستگی ( ۰/۷۳۲۴ ) و کمترین مقدار خطای MSE ( ۱/۲۳۱۰ ) را به دست آورده است. پس از این مدل، به ترتیب مدلهای مبتنی بر شبکه حافظه کوتاه_مدت طولانی دوطرفه ( SNN_Bi-LSTM_feat ) و شبکه حافظه کوتاه_مدت طولانی ( SNN_LSTM_feat ) بهترین نتایچ را به دست آوردهاند. مقایسه نتایچ جدولهای 5 و 6 نشان میدهد که افزودن ویژگیهای لغوی باعث بهبود نتایچ هر سه مدل شده است و میزان بهبود برای مدل مبتنی بر شبکه عصبی پیچشی بیشتر از سایر مدلها است. میزان بهبود برای این مدل بر مبنای معیار همبستگی برابر با ۰.۱۰۹۱ و همچنین میزان کاهش خطای این مدل در مقایسه با مدل غیر ترکیبی متناظر آن، برابر با ۴۷۰۶ .• است.
- نتایج مجموعه داده CDD-ful: در این بخش نتایچ مربوط به مدلهای استفاده شده روی مجموعه داده CDD-ful را توصیف میکنیم.جدولهای 7 و 8 به ترتیب نتایچ مدلها را برای حالت پایه و ترکیبی نمایش میدهد. در معیار همبستگی پیرسون نتایچ روشهای پایه نشان از برتری روش شبکه پیچشی با مدل تعبیه کلمات PubMed-PMC دارد. همچنین در معیار MSE روش LSTM دوطرفه با لایه تعبیه کراس بهترین عملکرد را دارد. نتایچ مدلهای ترکیبی توصیف شده در جدول ۸ نشان میدهد که در مدلهای ترکیبی که در هر دو معیار همبستگی پیرسون و خطای MSE، روش شبکه پیچشی با لایه تعبیه Keras عملکرد بهتری نسبت به سایر مدلها داشته است. همچنین روش LSTM دوطرفه عملکرد نزدیکتری نسبت به مدل برتراز خود نشان میدهد. مطابق جدول ۸ از بین روشهای استفاده شده، مدل SNN_CNN_Feat با لایه MSE تعبیه کراس، بالاترین مقدار همبستگی (۰/۷۳۴۲) و پایینترین خطا (۰/۹۸۴۵) را در پیشبینی شباهت جملات به دست آورده است. پس از این مدل، مدل ترکیبی مبتنی بر شبکه حافظه کوتاه مدت طولانی دوطرفه SNN_Bi-LSTM_Feat با لایه تعبیه کراس بهترین نتیجه را به دست میآورد.
- نتایج مجموعه داده CDD-ref: برای این مجموعه داده نتایچ مدلهای پایه و ترکیبی به ترتیب در جدولهای ۹ و ۱۰ نمایش داده شده است. در بین روشهای پایه از نظر معیار همبستگی پیرسون، روش LSTM با مدل تعبیه کلمات Wiki- PubMed-PMC بهترین عملکرد را دارد. همچنین این روش در معیار MSE بهتر از سایر مدلها عمل میکند.
همچنین نتایچ حاصل از مدلهای ترکیبی در جدول 10 حاکی از آن است که در هر دو معیار همبستگی پیرسون و خطای MSE روش شبکه پیچشی با لایه تعبیه Keras بهترین عملکرد را کسب میکند.
- مقایسه نتایج مدلها با روشهای ارائه شده در تحقیقات کنونی: برای بررسی بیشتر عملکرد مدلها روی سه مجموعه داده مورد استفاده، در جدولهای ۱۲،۱۱ و ۱۳ نتایچ مدل برتر بدست آمده در این مطالعه را با نتایچ ارائه شده در مقالات لی و همکاران و دی سوزو و همکاران بر اساس معیارهای همبستگی پیرسون و خطای MSE مقایسه میکنیم. با بررسی نتایچ موجود در جدول ۱۱ به این نتیجه میرسیم که مدل بدست آمده در این مطالعه دارای عملکرد بهتری از نظر معیارهای همبستگی پیرسون و MSE میباشد. مدل بدست آمده از روش پیشنهادی در این تحقیق بر مبنای معیار همبستگی پیرسون با اختلاف ۰.۰۹۲۴ و ۰.۰۷۵۴ به ترتیب قویتر از مدل پیشنهادی دی سوزو و همکاران و همچنین مدل ارائه شده توسط لی و همکاران است. همچنین با درنظر گرفتن معیار MSE، مدل بدست آمده در این تحقیق بهتر از روشهای ارائه شده در لی و همکاران و دی سوزو و همکاران بوده و به ترتیب با اختلاق ۰.۳۵ و ۰/۲۸۲۰ نسبت به این مدلها پیشی گرفته است. همچنین مطابق جدول ۱۲ ، روی مجموعه داده CDD-ful، مدل برتر بدست آمده توسط روش پیشنهادی ( SNN_CNN_feat ) عملکرد بهتری نسبت به روش ارائه شده در لی و همکاران از خود نشان میدهد. به طور خاص در معیار همبستگی پیرسون با اختلاق ۰/۰۲۰۹ بهتراز روش لی و همکاران عمل میکند. همچنین در معیار MSE با اختلاف ۰/۰۷۲۵ نسبت به آن روش پیشی گرفته است. علاوه بر این، براساس نتایج جدول 13 در مجموعه داده CDD-ref نیز مدل حاصل از روش پیشنهادی این مطالعه، عملکرد بهتری نسبت به مدل پیشنهادی در لی و همکاران از خود نشان میدهد.
- نمایش چند نمونه از نتایج پیش بینی شباهت با استفادهد از مدل پیشنهادی: در جدول 14 برای بررسی بیشتر دقت مدلها خروجی پیشبینی شباهت چند نمونه از جفت جملات نمایش داده شده است. همانطور که در این جدول قابل مشاهده است، مدل پیشنهادی در این مطالعه امتیاز شباهت نزدیکتری به امتیاز شباهت واقعی در مقایسه با روش پیشنهادی لی و همکاران به دست میآورد.
نتیجه گیری
اندازهگیری دقیق شباهت بین متون اهمیت زیادی در بسیاری از کاربردهای مرتبط با متن نظیر سیستمهای پرسش و پاسخ، خلاصه سازی متون، بازیابی اطلاعات دارد. در این تحقیق یک رویکرد ترکیبی مبتنی بر شبکه عصبی سیامی و ویژگیهای شباهت لغوی ارائه شد. شبکه سیامی پیشنهادی شامل دو زیر شبکه یکسان است که اجزای اصلی هر کدام از آنها به صورت کلی شامل یک لایه تعبیه کلمات، شبکه عصبی عمیق است. با در نظر گرفتن سه نوع شبکه عصبی عمیق شامل: LSTM، CNN، Bi-LSYM و همچنین دو لایه تعبه کلمات به همراه ویژگیهای شباهت لغوی، چندین مدل پیاده سازی شد. نتیج آزمایشات بر سه مجموعه داده نشان داد که تمامی مدلهای ترکیبی نسبت به مدلهای پایه خود دارای مقدار همبستگی پیرسون بالاتر و خطای MSE کمتری هستند. همچنین مدل شبکه سیامی ترکیبی مبتنی بر شبکه عمیق پیچشی عملکرد بهتری نسبت به سایر مدلها بر مبنای هر دو معیار مقدار همبستگی پیرسون و خطای MSE از خود نشان داد. مقایسه نتایج این تحقیق با نتایج مقالات دیگر نشان می دهد که مدل به دست آمده در این تحقیق دارای عملکرد بهتر از نظر معیارهای همبستگی پیرسون و MSE در تخمین شباهت جملات میباشد. استفاده از روش تعبیه کلمات BERT راه مکانیزم خود توجه از کارهای آتی این پژوهش می باشد.
و در آخر:
در این قسمت توضیحاتی آموزنده در مورد پیشبینی شباهت متن با استفاده از یک شبکه عصبی سیامی مبتنی بر شبکه عمیق و ویژگیهای شباهت لغوی گذاشته شد. در آینده مطالب بیشتری را در اختیار شما قرار خواهیم داد، با آرزوی بهترینها برای شما خواننده محترم.
منابع:
فریبا خلج، حسین عباسی مهر، "پیشبینی شباهت متن با استفاده از یک شبکه عصبی سیامی مبتنی بر شبکه عمیق و ویژگیهای شباهت لغوی".
دیدگاه خود را بنویسید