مقاله شماره ۲: دستیابی به همکاری از طریق یادگیری تقویتی چند عاملی در معمای زندانی تکرارشونده
چکیده
امروزه معمای زندانی یکی از مسائل اولیه و مهم در نظریه بازیها است. در این معما نقطه تعادل نشی وجود دارد و چنانچه عاملها منطقی رفتار کنند در آن نقطه بازی میکنند؛ بدین منظور عاملها برای دستیابی به سود بیشتر از بین دو عمل همکاری و عدم همکاری، عدم همکاری را انتخاب میکنند. در حالیکه برای عاملها نقطه بهتری نسبت به نقطه نش وجود دارد و آن هم این است که هر دو عامل همکاری را انتخاب کنند. بنابراین، در جهت افزایش میزان همکاری عاملها معمای زندانی به صورت معمای زندانی تکرارشونده با یک رویکرد یادگیری تقویتی در نظر گرفتهشده است. نتایج مقاله نشاندهنده این است که رویکرد مورد نظر سبب افزایش میزان همکاری عاملها شده است و اگر عاملی همکاری را پیشه کند عامل دیگر نیز همکاری را انتخاب میکند و بالعکس.
کلیدواژه ها:
عدم همکاری متقابل
معمای زندانی تکرارشونده
یادگیری تقویتی
همکاری متقابل
LSTM
نویسندگان:
سمیرا فرزانه1، فرشته زندی2، جواد سلیمی سرتختی*3
1و2دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار ، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، ایران.
3عضو هیئت علمی، استادیار، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، ایران.
DOR:
دانلود فایل مقاله منابع XML
بدون دیدگاه