مقاله شماره ۲: دستیابی به همکاری از طریق یادگیری تقویتی چند عاملی در معمای زندانی تکرارشونده

چکیده

امروزه معمای زندانی یکی از مسائل اولیه‌ و مهم در نظریه بازی‌ها است. در این معما نقطه تعادل نشی وجود دارد و چنانچه عامل‌ها منطقی رفتار کنند در آن نقطه بازی می‌کنند؛ بدین منظور عامل‌ها برای دستیابی به سود بیشتر از بین دو عمل همکاری و عدم همکاری، عدم همکاری را انتخاب می‌کنند. در حالیکه برای عامل‌ها نقطه بهتری نسبت به نقطه نش وجود دارد و آن هم این است که هر دو عامل همکاری را انتخاب کنند. بنابراین، در جهت افزایش میزان همکاری عامل‌ها معمای زندانی به صورت معمای زندانی تکرارشونده با یک رویکرد یادگیری تقویتی در نظر گرفته‌شده است. نتایج مقاله نشان‌دهنده این است که رویکرد مورد نظر سبب افزایش میزان همکاری عامل‌ها شده است و اگر عاملی همکاری را پیشه کند عامل دیگر نیز همکاری را انتخاب می‌کند و بالعکس.


کلیدواژه ها:

عدم همکاری متقابل

معمای زندانی تکرارشونده

یادگیری تقویتی

همکاری متقابل

LSTM


نویسندگان:

سمیرا فرزانه1، فرشته زندی2، جواد سلیمی سرتختی*3

1و2دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار ، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، ایران.

3عضو هیئت علمی، استادیار، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، ایران.


DOR:


Image result for pdf icon jpg

دانلود فایل مقاله                    منابع                   XML

بدون دیدگاه

ارسال دیدگاه

ورود به سایت

خوش آمدید! وارد حساب کاربری خود شوید

بخاطر بسپار فراموشی رمز عبور ؟

آیا حساب کاربری ندارید.؟ عضویت

Lost Password

عضویت