نظریه بازی ها مطالعه مدل های ریاضی تعاملات استراتژیک است. [1] در بسیاری از زمینههای علوم اجتماعی کاربرد دارد و به طور گسترده در اقتصاد ، منطق ، علم سیستمها و علوم کامپیوتر استفاده میشود . [2] در ابتدا، تئوری بازیها به بازیهای دو نفره با جمع صفر میپردازد که در آن سود یا زیان یک شرکتکننده دقیقاً با ضرر و زیان شرکتکننده دیگر متعادل میشود. در دهه 1950، آن را به مطالعه بازیهای غیرصفری تعمیم داد و در نهایت در طیف وسیعی از روابط رفتاری به کار رفت . در حال حاضر این یک اصطلاح چتر برای علم تصمیم گیری منطقی در انسان، حیوانات و کامپیوتر است.
نظریه بازی های مدرن با ایده تعادل استراتژی مختلط در بازی های دو نفره با جمع صفر و اثبات آن توسط جان فون نویمان آغاز شد . اثبات اصلی فون نیومن از قضیه نقطه ثابت بروور در نگاشتهای پیوسته در مجموعه های محدب فشرده استفاده کرد که به روشی استاندارد در نظریه بازی ها و اقتصاد ریاضی تبدیل شد . مقاله او با تئوری بازی ها و رفتار اقتصادی (1944) که با همکاری اسکار مورگنسترن نوشته شد، دنبال شد که بازی های مشارکتی چند بازیکن را در نظر می گرفت. [3] ویرایش دوم یک نظریه بدیهی از مطلوبیت مورد انتظار را ارائه کرد که به آماردانان و اقتصاددانان ریاضی اجازه داد تا تصمیمگیری را تحت عدم قطعیت قرار دهند. [4]
تئوری بازی ها به طور گسترده در دهه 1950 توسعه یافت و به صراحت در دهه 1970 برای تکامل به کار رفت ، اگرچه پیشرفت های مشابه حداقل به دهه 1930 برمی گردد. نظریه بازی ها به طور گسترده به عنوان یک ابزار مهم در بسیاری از زمینه ها شناخته شده است. جان مینارد اسمیت در سال 1999 جایزه کرافورد را به خاطر کاربرد نظریه بازیهای تکاملی دریافت کرد و پانزده نظریهپرداز بازی تا سال 2020 جایزه نوبل اقتصاد را از آن خود کردند ، از جمله اخیراً پل میلگروم و رابرت بی ویلسون .
استراتژی تئوری بازی در تاریخ ثبت شده حداقل به راهنمای سان تزو در مورد استراتژی نظامی برمی گردد . [5] [6] او در هنر جنگ نوشت
شناخت دیگری و شناخت خود، در صد جنگ خطری ندارد،
ندانستن دیگری و شناختن خود، یک پیروزی در مقابل یک باخت،
ندانستن دیگری و ندانستن خود، در هر نبردی شکست حتمی است
- سان تزو
بحث در مورد ریاضیات بازی ها مدت ها قبل از ظهور نظریه بازی های ریاضی مدرن آغاز شد. اثر Cardano Liber de ludo aleae ( کتاب بازیهای شانس )، که در حدود سال 1564 نوشته شد اما پس از مرگ در سال 1663 منتشر شد، برخی از ایدههای اساسی در مورد بازیهای شانسی را ترسیم میکند. در دهه 1650، پاسکال و هویگنز مفهوم انتظار را در استدلال در مورد ساختار بازی های شانسی توسعه دادند. پاسکال برای تقسیم برابر در زمانی که شانسها مساوی است استدلال میکرد در حالی که هویگنز با در نظر گرفتن استراتژیهایی برای بازیکنی که میتواند هر شرطی را با هر حریفی تا زمانی که شرایط آن برابر است، استدلال را گسترش دهد. [7] هویگنس بعداً حساب قمار خود را با عنوان De ratiociniis in ludo aleæ ( درباره استدلال در بازی های شانس ) در سال 1657 منتشر کرد.
در سال 1713، نامه ای منسوب به چارلز والدگریو، ژاکوبیت فعال و عموی دیپلمات بریتانیایی جیمز والدگریو ، یک بازی به نام " le her " را تجزیه و تحلیل کرد. [8] [9] والدگریو یک راه حل استراتژی مختلط حداقلی را برای نسخه دو نفره بازی ورق ارائه کرد و این مشکل اکنون به عنوان مشکل والدگریو شناخته می شود . در سال 1838، آنتوان آگوستین کورنو یک دوگانگی را در نظر گرفت و راه حلی را ارائه کرد که تعادل نش بازی است در کتاب Recherches sur les principes mathématiques de la théorie des richesses ( تحقیقاتی در مورد اصول ریاضی نظریه ثروت ).
در سال 1913، ارنست زرملو Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels ( در مورد کاربرد نظریه مجموعه ها در تئوری بازی شطرنج ) را منتشر کرد که ثابت کرد استراتژی بهینه شطرنج به شدت تعیین می شود . این امر راه را برای قضایای کلی تری هموار کرد. [10]
در سال 1938، فردریک زوتن ، اقتصاددان ریاضی دانمارکی، با استفاده از قضیه نقطه ثابت بروور ثابت کرد که مدل ریاضی یک استراتژی برنده دارد . [11] امیل بورل در کتاب خود در سال 1938 و یادداشتهای قبلی خود، یک قضیه مینیمکس را برای بازیهای ماتریس مجموع صفر دو نفره تنها زمانی که ماتریس پرداخت متقارن است و راهحلی برای یک نامتناهی غیرمعمول ارائه میدهد اثبات کرد. بازی (به انگلیسی Blotto game معروف است ). بورل عدم وجود تعادلهای استراتژی مختلط را در بازیهای دو نفره مجموع صفر محدود حدس زد ، حدسی که توسط فون نویمان نادرست بود.
نظریه بازیها زمانی که جان فون نویمان مقالهای درباره نظریه بازیهای استراتژی را در سال 1928 منتشر کرد ، به عنوان یک میدان منحصر به فرد ظاهر شد. یک روش استاندارد در نظریه بازی ها و اقتصاد ریاضی . کار فون نویمان در تئوری بازیها در کتاب تئوری بازیها و رفتار اقتصادی او در سال 1944 که با همکاری اسکار مورگنسترن نوشته شد، به اوج خود رسید . [14] ویرایش دوم این کتاب یک نظریه بدیهی از فایده ارائه کرد که نظریه قدیمی سودمندی (پول) دانیل برنولی را به عنوان یک رشته مستقل تجسم بخشید. این کار بنیادی شامل روشی برای یافتن راه حل های متقابل سازگار برای بازی های دو نفره با جمع صفر است. کار بعدی اساساً بر نظریه بازیهای مشارکتی متمرکز شد ، که استراتژیهای بهینه را برای گروههایی از افراد تجزیه و تحلیل میکند، با این فرض که آنها میتوانند توافقاتی را بین آنها در مورد استراتژیهای مناسب اجرا کنند. [15]
در سال 1950، اولین بحث ریاضی درباره معضل زندانی ظاهر شد و آزمایشی توسط ریاضیدانان برجسته مریل ام. فلود و ملوین درشر به عنوان بخشی از تحقیقات شرکت رند در مورد نظریه بازی انجام شد. RAND مطالعات را به دلیل کاربردهای احتمالی در استراتژی هسته ای جهانی دنبال کرد . [16] تقریباً در همان زمان، جان نش معیاری را برای سازگاری متقابل استراتژیهای بازیکنان به نام تعادل نش ایجاد کرد که برای طیف وسیعتری از بازیها نسبت به معیار پیشنهادی فون نویمان و مورگنسترن قابل استفاده است. نش ثابت کرد که هر بازی n-بازیکن محدود، غیر صفر (نه فقط دو نفره مجموع صفر) غیرهمکاری دارای چیزی است که اکنون به عنوان تعادل نش در استراتژی های ترکیبی شناخته می شود.
تئوری بازیها در دهه 1950 فعالیتهای زیادی را تجربه کرد، که طی آن مفاهیم هسته ، بازی فرم گسترده ، بازی ساختگی ، بازیهای تکراری و ارزش شپلی توسعه یافتند. در دهه 1950 نیز اولین کاربردهای نظریه بازی در فلسفه و علوم سیاسی مشاهده شد .
در سال 1965، راینهارد سلتن مفهوم راه حل خود را از تعادل کامل زیر بازی معرفی کرد که تعادل نش را بیشتر اصلاح کرد. بعدها کمال دست لرزان را نیز معرفی کرد . در سال 1994 نش، سلتن و هارسانی به دلیل مشارکت در نظریه بازی های اقتصادی برنده جایزه نوبل اقتصاد شدند .
در دهه 1970، نظریه بازی به طور گسترده در زیست شناسی مورد استفاده قرار گرفت ، که عمدتاً در نتیجه کار جان مینارد اسمیت و استراتژی پایدار تکاملی او بود . علاوه بر این، مفاهیم تعادل همبسته ، کمال دست لرزان و دانش رایج [a] معرفی و مورد تجزیه و تحلیل قرار گرفت.
در سال 1994، جان نش جایزه یادبود نوبل در علوم اقتصادی را به خاطر مشارکتش در نظریه بازی ها دریافت کرد. معروفترین مشارکت نش در نظریه بازیها مفهوم تعادل نش است که یک مفهوم راهحل برای بازیهای غیرهمکاری است . تعادل نش مجموعهای از استراتژیها است، برای هر بازیکن، به طوری که هیچ بازیکنی نمیتواند با تغییر یک طرفه استراتژی خود، سود خود را بهبود بخشد.
در سال 2005، نظریه پردازان بازی، توماس شلینگ و رابرت اومان ، نش، سلتن و هارسانی را به عنوان برندگان جایزه نوبل دنبال کردند. شلینگ روی مدلهای پویا، نمونههای اولیه نظریه بازیهای تکاملی کار کرد . اومان بیشتر به مکتب تعادل کمک کرد، درشتسازی تعادل و تعادلهای همبسته را معرفی کرد، و تحلیل رسمی گستردهای از فرض دانش رایج و پیامدهای آن ایجاد کرد.
در سال 2007، لئونید هورویکز ، اریک ماسکین و راجر میرسون به دلیل پایهگذاری نظریه طراحی مکانیسم ، جایزه نوبل اقتصاد را دریافت کردند. مشارکت میرسون شامل مفهوم تعادل مناسب ، و یک متن مهم فارغ التحصیل است: نظریه بازی، تجزیه و تحلیل تعارض . [1] Hurwicz مفهوم سازگاری انگیزه را معرفی و رسمی کرد .
در سال 2012، الوین ای. راث و لوید اس. شپلی جایزه نوبل اقتصاد "به دلیل تئوری تخصیص پایدار و عمل طراحی بازار" را دریافت کردند. در سال 2014، جایزه نوبل به ژان تیرول نظریهپرداز بازی رسید .
اگر بازیکنان بتوانند تعهدات الزام آور را که از خارج اجرا می شوند (مثلاً از طریق قانون قرارداد ) شکل دهند ، یک بازی تعاونی است . اگر بازیکنان نتوانند اتحاد ایجاد کنند یا اگر همه توافقات لازم باشد خوداجرا شوند (مثلاً از طریق تهدیدهای معتبر ) یک بازی غیرهمکاری است. [17]
بازیهای مشارکتی اغلب از طریق چارچوب نظریه بازیهای تعاونی تحلیل میشوند ، که بر پیشبینی اینکه کدام ائتلافها تشکیل میشوند، اقدامات مشترکی که گروهها انجام میدهند و نتایج جمعی حاصل از آن تمرکز میکند. این نظریه با تئوری بازی های غیرهمکاری متفاوت است که بر پیش بینی اقدامات و بازده بازیکنان با تجزیه و تحلیل تعادل نش تمرکز می کند . [18] [19]
تئوری بازیهای تعاونی رویکردی سطح بالا ارائه میکند، زیرا فقط ساختار و بازده ائتلافها را توصیف میکند، در حالی که نظریه بازی غیرهمکاری به چگونگی تأثیر تعامل استراتژیک بر توزیع سود میپردازد. از آنجایی که نظریه بازیهای غیرهمکاری عمومیتر است، بازیهای مشارکتی را میتوان با رویکرد نظریه بازیهای غیرهمکاری تحلیل کرد (برعکس صادق نیست) مشروط بر اینکه فرضیات کافی برای در بر گرفتن همه استراتژیهای ممکن در دسترس بازیکنان وجود داشته باشد. اجرای خارجی همکاری
بازی متقارن بازی است که در آن هر بازیکن با انتخاب یکسان، سود یکسانی را دریافت می کند. به عبارت دیگر، هویت بازیکن، بازی حاصل از رویارویی با بازیکن دیگر را تغییر نمیدهد. [20] بسیاری از بازیهای 2×2 که معمولاً مورد مطالعه قرار میگیرند، متقارن هستند. نمایش استاندارد مرغ ، معضل زندانی، و شکار گوزن، همه بازی های متقارن هستند.
رایجترین بازیهای نامتقارن بازیهایی هستند که در آن مجموعههای استراتژی یکسانی برای هر دو بازیکن وجود ندارد. به عنوان مثال، بازی اولتیماتوم و به طور مشابه بازی دیکتاتور استراتژی های متفاوتی برای هر بازیکن دارد. با این حال، ممکن است که یک بازی استراتژی های یکسانی برای هر دو بازیکن داشته باشد، اما نامتقارن باشد. به عنوان مثال، بازی تصویر شده در گرافیک این بخش با وجود داشتن مجموعه استراتژی های یکسان برای هر دو بازیکن، نامتقارن است.
بازیهای حاصل جمع صفر (به طور کلی، بازیهای با جمع ثابت) بازیهایی هستند که انتخابهای بازیکنان در آنها نه میتواند منابع موجود را افزایش و نه کاهش دهد. در بازیهای مجموع صفر، سود کل به همه بازیکنان در یک بازی، برای هر ترکیبی از استراتژیها، میرسد و همیشه به صفر میرسد (به طور غیررسمیتر، یک بازیکن فقط با هزینه برابر دیگران سود میبرد). [21] پوکر نمونهای از یک بازی با مجموع صفر است (با نادیده گرفتن احتمال کات خانه)، زیرا شخص دقیقاً همان مقداری را که حریفش از دست میدهد برنده میشود. سایر بازیهای حاصل جمع صفر شامل سکههای مشابه و بیشتر بازیهای رومیزی کلاسیک از جمله Go و شطرنج است .
بسیاری از بازیهایی که توسط نظریهپردازان بازی مورد مطالعه قرار میگیرند (از جمله معضل زندانی معروف) بازیهای غیرصفری هستند، زیرا نتیجه خالصتر یا کمتر از صفر است. به طور غیررسمی، در بازی های غیر صفر، سود یک بازیکن لزوماً با باخت بازیکن دیگر مطابقت ندارد.
علاوه بر این، بازیهای با جمع ثابت با فعالیتهایی مانند دزدی و قمار مطابقت دارند، اما نه با وضعیت اقتصادی اساسی که در آن سود بالقوه از تجارت وجود دارد . با افزودن یک بازیکن ساختگی (که اغلب به آن تخته می گویند) می توان هر بازی با جمع ثابت را به یک بازی مجموع صفر (احتمالا نامتقارن) تبدیل کرد که باخت آن برنده خالص بازیکنان را جبران می کند.
بازیهای همزمان بازیهایی هستند که در آن هر دو بازیکن به طور همزمان حرکت میکنند، یا در عوض بازیکنان بعدی از اقدامات بازیکنان قبلی بیاطلاع هستند (که آنها را به طور مؤثر همزمان میسازد). بازی های متوالی (یا بازی های پویا) بازی هایی هستند که در آن بازیکنان به طور همزمان تصمیم نمی گیرند و اقدامات قبلی بازیکن بر نتیجه و تصمیمات بازیکنان دیگر تأثیر می گذارد. [22] لازم نیست این اطلاعات کامل در مورد هر اقدام بازیکنان قبلی باشد. ممکن است دانش بسیار کمی باشد. به عنوان مثال، یک بازیکن ممکن است بداند که بازیکن قبلی یک عمل خاص را انجام نداده است، در حالی که نداند بازیکن اول کدام یک از اقدامات موجود دیگر را واقعا انجام داده است.
تفاوت بین بازی های همزمان و متوالی در نمایش های مختلف مورد بحث در بالا مشخص می شود. اغلب از فرم معمولی برای نمایش بازی های همزمان استفاده می شود، در حالی که فرم گسترده برای نمایش بازی های متوالی استفاده می شود. تبدیل فرم گسترده به معمولی یک راه است، به این معنی که چندین بازی فرم گسترده با همان فرم عادی مطابقت دارد. در نتیجه، مفاهیم تعادل برای بازی های همزمان برای استدلال در مورد بازی های متوالی کافی نیست. زیربازی کمال را ببینید .
به طور خلاصه، تفاوت بین بازی های متوالی و همزمان به شرح زیر است:
یک زیرمجموعه مهم از بازی های متوالی شامل بازی های اطلاعات کامل است. یک بازی با اطلاعات کامل به این معنی است که همه بازیکنان، در هر حرکت در بازی، تاریخچه قبلی بازی و حرکاتی که قبلاً توسط سایر بازیکنان انجام شده است را بدانند. یک بازی اطلاعاتی ناقص زمانی انجام می شود که بازیکنان از تمام حرکاتی که قبلاً توسط حریف انجام شده است مانند بازی حرکت همزمان اطلاعی نداشته باشند. [23] نمونههایی از بازیهای اطلاعات کامل عبارتند از tic-tac-toe ، چکرز ، شطرنج ، و Go . [24] [25] [26]
بسیاری از بازی های کارتی، بازی هایی با اطلاعات ناقص هستند، مانند پوکر و بریج . [27] اطلاعات کامل اغلب با اطلاعات کامل اشتباه گرفته می شود ، که مفهومی مشابه مربوط به دانش متداول از توالی، استراتژی ها و بازده هر بازیکن در طول بازی است. [28] اطلاعات کامل مستلزم آن است که هر بازیکنی از استراتژیها و بازدههای موجود برای سایر بازیکنان مطلع باشد، اما لزوماً اقدامات انجام شده را بداند، در حالی که اطلاعات کامل، آگاهی از تمام جنبههای بازی و بازیکنان است. [29] بازی های اطلاعات ناقص را می توان با معرفی " حرکات طبیعت " به بازی های اطلاعات ناقص کاهش داد . [30]
یکی از مفروضات تعادل نش این است که هر بازیکنی در مورد اعمال سایر بازیکنان باورهای درستی دارد. با این حال، موقعیت های زیادی در تئوری بازی ها وجود دارد که در آن شرکت کنندگان به طور کامل ویژگی های حریف خود را درک نمی کنند. مذاکره کنندگان ممکن است از ارزش گذاری حریف خود در مورد موضوع مذاکره بی اطلاع باشند، شرکت ها ممکن است از کارکرد هزینه های حریف خود بی اطلاع باشند، رزمندگان ممکن است از نقاط قوت حریف خود بی اطلاع باشند، و هیئت منصفه ممکن است از تفسیر همکار خود از شواهد در دادگاه بی اطلاع باشند. در برخی موارد، شرکت کنندگان ممکن است شخصیت حریف خود را به خوبی بشناسند، اما ممکن است ندانند که حریف آنها چقدر شخصیت خود را می شناسد. [31]
بازی بیزی یعنی یک بازی استراتژیک با اطلاعات ناقص. برای یک بازی استراتژیک، تصمیم گیرندگان بازیکنان هستند و هر بازیکن گروهی از اقدامات را دارد. بخش اصلی مشخصات اطلاعات ناقص مجموعه ای از حالات است. هر ایالت به طور کامل مجموعه ای از ویژگی های مربوط به بازیکن مانند ترجیحات و جزئیات مربوط به آنها را توصیف می کند. برای هر مجموعه ای از ویژگی هایی که برخی از بازیکنان معتقدند ممکن است وجود داشته باشند، باید حالتی وجود داشته باشد. [32]
به عنوان مثال، جایی که بازیکن 1 مطمئن نیست که آیا بازیکن 2 ترجیح می دهد با او قرار بگذارد یا از او دور شود، در حالی که بازیکن 2 ترجیحات بازیکن 1 را مانند قبل درک می کند. به طور خاص، فرض کنید که بازیکن 1 معتقد است که بازیکن 2 می خواهد با احتمال 1/2 با او قرار بگذارد و با احتمال 1/2 از او دور شود (این ارزیابی از تجربه بازیکن 1 احتمالاً ناشی می شود: او با بازیکنانی روبرو می شود که می خواهند در چنین موردی نیمی از زمان با او قرار ملاقات بگذارد و بازیکنانی که می خواهند نیمی از زمان او را دور بزنند). با توجه به احتمال درگیر، تجزیه و تحلیل این وضعیت مستلزم درک ترجیح بازیکن برای تساوی است، حتی اگر مردم فقط به تعادل استراتژیک محض علاقه مند باشند.
بازی هایی که در آنها دشواری یافتن استراتژی بهینه ناشی از تعدد حرکات ممکن است، بازی های ترکیبی نامیده می شوند. به عنوان مثال می توان به شطرنج و Go اشاره کرد . بازی هایی که حاوی اطلاعات ناقص هستند نیز ممکن است دارای یک ویژگی ترکیبی قوی باشند، به عنوان مثال تخته نرد . هیچ نظریه واحدی برای پرداختن به عناصر ترکیبی در بازی ها وجود ندارد. با این حال، ابزارهای ریاضی وجود دارد که می تواند برخی از مسائل خاص را حل کند و به برخی از سؤالات کلی پاسخ دهد. [33]
بازیهای اطلاعات کامل در تئوری بازیهای ترکیبی مورد مطالعه قرار گرفتهاند ، که بازنماییهای بدیع، بهعنوان مثال اعداد سورئال ، و همچنین روشهای اثبات ترکیبی و جبری (و گاهی غیر سازنده ) برای حل بازیهایی از انواع خاص، از جمله بازیهای «لوپی» که ممکن است به دنباله های بی نهایت طولانی از حرکت منجر شود. این روشها به بازیهایی با پیچیدگی ترکیبی بالاتر از آنهایی که معمولاً در نظریه بازیهای سنتی (یا «اقتصادی») در نظر گرفته میشوند، میپردازند. [34] [35] یک بازی معمولی که به این روش حل شده است Hex است . یک زمینه مطالعاتی مرتبط، که برگرفته از نظریه پیچیدگی محاسباتی است، پیچیدگی بازی است که به تخمین دشواری محاسباتی یافتن استراتژیهای بهینه مربوط میشود. [36]
تحقیقات در زمینه هوش مصنوعی به بازیهای اطلاعاتی کامل و ناقصی پرداخته است که ساختارهای ترکیبی بسیار پیچیدهای دارند (مانند شطرنج، رفتن یا تخته نرد) که هیچ استراتژی بهینه قابل اثباتی برای آنها یافت نشده است. راهحلهای عملی شامل اکتشافیهای محاسباتی، مانند هرس آلفا-بتا یا استفاده از شبکههای عصبی مصنوعی آموزشدیده با یادگیری تقویتی است که بازیها را در تمرین محاسباتی قابل حملتر میکند. [33] [37]
بخش اعظم تئوری بازی ها مربوط به بازی های محدود و گسسته ای است که تعداد بازیکنان، حرکات، رویدادها، نتایج و غیره محدودی دارند. با این حال، بسیاری از مفاهیم را می توان گسترش داد. بازیهای پیوسته به بازیکنان این امکان را میدهند که یک استراتژی را از یک مجموعه استراتژی پیوسته انتخاب کنند. برای مثال، رقابت Cournot معمولاً با استراتژیهای بازیکنان مدلسازی میشود که هر کمیت غیرمنفی، از جمله مقادیر کسری است.
بازیهای دیفرانسیل مانند بازی تعقیب و گریز مداوم ، بازیهای پیوستهای هستند که تکامل متغیرهای حالت بازیکنان توسط معادلات دیفرانسیل کنترل میشود . مشکل یافتن یک استراتژی بهینه در یک بازی دیفرانسیل ارتباط نزدیکی با تئوری کنترل بهینه دارد . به طور خاص، دو نوع استراتژی وجود دارد: استراتژیهای حلقه باز با استفاده از اصل ماکزیمم Pontryagin در حالی که استراتژیهای حلقه بسته با استفاده از روش برنامهنویسی پویا بلمن یافت میشوند .
یک مورد خاص از بازی های دیفرانسیل، بازی هایی با افق زمانی تصادفی هستند . [38] در چنین بازیهایی، زمان پایانی یک متغیر تصادفی با تابع توزیع احتمال معین است . بنابراین، بازیکنان انتظارات ریاضی تابع هزینه را به حداکثر میرسانند. نشان داده شد که مسئله بهینه سازی اصلاح شده را می توان به عنوان یک بازی دیفرانسیل با تخفیف در یک بازه زمانی نامحدود فرموله کرد.
نظریه بازی های تکاملی بازیکنانی را مطالعه می کند که استراتژی های خود را در طول زمان بر اساس قوانینی تنظیم می کنند که لزوماً منطقی یا دوراندیش نیستند. [39] به طور کلی، تکامل استراتژی ها در طول زمان طبق چنین قوانینی به عنوان یک زنجیره مارکوف با یک متغیر حالت مانند مشخصات استراتژی فعلی یا نحوه انجام بازی در گذشته نزدیک مدل می شود. چنین قوانینی ممکن است شامل تقلید، بهینه سازی یا بقای بهترین ها باشد.
در زیستشناسی، چنین مدلهایی میتوانند نشاندهنده تکامل باشند ، که در آن فرزندان استراتژیهای والدین خود را اتخاذ میکنند و والدینی که استراتژیهای موفقتری را بازی میکنند (یعنی مطابق با بازده بالاتر) تعداد فرزندان بیشتری دارند. در علوم اجتماعی، چنین مدلهایی معمولاً نشاندهنده تعدیل استراتژیک توسط بازیکنانی است که در طول عمر خود بارها بازی میکنند و آگاهانه یا ناآگاهانه، گاهی اوقات استراتژیهای خود را تنظیم میکنند. [40]
مشکلات تصمیم گیری فردی با نتایج تصادفی گاهی اوقات "بازی های یک نفره" در نظر گرفته می شوند. آنها ممکن است با استفاده از ابزارهای مشابه در رشته های مرتبط تئوری تصمیم گیری ، تحقیقات عملیاتی ، و حوزه های هوش مصنوعی ، به ویژه برنامه ریزی هوش مصنوعی (با عدم قطعیت) و سیستم چند عاملی مدل شوند . اگرچه این زمینه ها ممکن است انگیزه های مختلفی داشته باشند، ریاضیات درگیر اساساً یکسان هستند، به عنوان مثال استفاده از فرآیندهای تصمیم مارکوف (MDP). [41]
نتایج تصادفی را نیز می توان از نظر تئوری بازی با اضافه کردن یک بازیکن به طور تصادفی که "حرکات شانسی" (" حرکات بر اساس طبیعت ") انجام می دهد، مدل سازی کرد. [42] این بازیکن معمولاً به عنوان بازیکن سوم در بازی دو نفره در نظر گرفته نمیشود، بلکه صرفاً برای ارائه یک تاس در جایی که بازی مورد نیاز است، استفاده میکند.
برای برخی مشکلات، رویکردهای مختلف برای مدلسازی نتایج تصادفی ممکن است به راهحلهای متفاوتی منجر شود. برای مثال، تفاوت در رویکرد بین MDP و راهحل حداقل این است که راهحل دوم، بدترین حالت را در مورد مجموعهای از حرکات متخاصم در نظر میگیرد، نه اینکه در مورد این حرکتها با توجه به توزیع احتمال ثابت استدلال کند. رویکرد Minimax ممکن است در جایی که مدلهای تصادفی عدم قطعیت در دسترس نیستند سودمند باشد، اما ممکن است رویدادهای بسیار بعید (اما پرهزینه) را نیز دست بالا برآورد کند، اگر فرض شود که یک دشمن میتواند چنین رویدادی را مجبور به رخ دادن کند، به طرز چشمگیری استراتژی را در چنین سناریوهایی تغییر میدهد. [43] (به نظریه قو سیاه برای بحث بیشتر در مورد این نوع مسئله مدلسازی مراجعه کنید، به ویژه که به پیش بینی و محدود کردن ضرر در بانکداری سرمایه گذاری مربوط می شود.)
مدلهای کلی که شامل تمام عناصر نتایج تصادفی، حریفان و قابلیت مشاهده جزئی یا پر سر و صدا (حرکات توسط بازیکنان دیگر) میشوند نیز مورد مطالعه قرار گرفتهاند. " استاندارد طلایی " به عنوان یک بازی تصادفی تا حدی قابل مشاهده (POSG) در نظر گرفته می شود، اما تعداد کمی از مسائل واقع بینانه از نظر محاسباتی در نمایش POSG امکان پذیر است. [43]
اینها بازیهایی هستند که بازی آنها توسعه قوانین بازی دیگری است، بازی هدف یا موضوع. متاگیم ها به دنبال به حداکثر رساندن ارزش کاربردی مجموعه قوانین توسعه یافته هستند. تئوری متاگیم ها به نظریه طراحی مکانیزم مربوط می شود .
اصطلاح تجزیه و تحلیل متا بازی همچنین برای اشاره به رویکرد عملی توسعه یافته توسط نایجل هاوارد [44] استفاده می شود که به موجب آن یک موقعیت به عنوان یک بازی استراتژیک چارچوب بندی می شود که در آن ذینفعان سعی می کنند اهداف خود را با استفاده از گزینه های در دسترس خود محقق سازند. تحولات بعدی منجر به تدوین تحلیل رویارویی شده است .
نظريه بازي ميدان ميانگين مطالعه تصميم گيري استراتژيك در جمعيت هاي بسيار زيادي از عوامل كوچك در حال تعامل است. این دسته از مسائل در ادبیات اقتصاد توسط بویان یووانوویچ و رابرت دبلیو. روزنتال ، در ادبیات مهندسی توسط پیتر ای. کینز ، و توسط ریاضیدانان پیر لوئیس لیونز و ژان میشل لاسری مورد توجه قرار گرفت.
بازیهایی که در نظریه بازیها مورد مطالعه قرار میگیرند، اشیاء ریاضی کاملاً مشخصی هستند. برای تعریف کامل، یک بازی باید عناصر زیر را مشخص کند: بازیکنان بازی، اطلاعات و اقدامات در دسترس هر بازیکن در هر نقطه تصمیم گیری، و بازده برای هر نتیجه. (اریک راسموسن به این چهار «عنصر اساسی» با نام اختصاری «PAPI» اشاره می کند.) [45] [46] [47] [48] یک نظریه پرداز بازی معمولاً از این عناصر، همراه با مفهوم راه حلی که انتخاب می کند، برای استنباط استفاده می کند. مجموعه ای از استراتژی های تعادلی برای هر بازیکن به گونه ای که وقتی این استراتژی ها به کار گرفته می شوند، هیچ بازیکنی نمی تواند با انحراف یک طرفه از استراتژی خود سود ببرد. این استراتژیهای تعادلی، تعادلی را برای بازی تعیین میکنند – حالتی باثبات که در آن یا یک نتیجه رخ میدهد یا مجموعهای از نتایج با احتمال مشخص رخ میدهد.
بیشتر بازیهای مشارکتی در فرم تابع مشخصه ارائه میشوند، در حالی که از شکلهای گسترده و عادی برای تعریف بازیهای غیرهمکاری استفاده میشود.
فرم گسترده را می توان برای رسمی کردن بازی ها با توالی زمانی حرکات استفاده کرد. بازیهای فرم گسترده را میتوان با استفاده از درختان بازی (همانطور که در اینجا نشان داده شده است) تجسم کرد. در اینجا هر رأس (یا گره) نشان دهنده یک نقطه انتخاب برای یک بازیکن است. بازیکن با یک عدد لیست شده توسط راس مشخص می شود. خطوط خارج از راس یک عمل ممکن برای آن بازیکن را نشان می دهد. سود در پایین درخت مشخص شده است. شکل گسترده را می توان به عنوان تعمیم چند نفره از درخت تصمیم در نظر گرفت . [49] برای حل هر بازی فرم گسترده، باید از استقرا به عقب استفاده شود. این شامل کار کردن به سمت عقب درخت بازی برای تعیین اینکه یک بازیکن منطقی در آخرین راس درخت چه کاری انجام می دهد، بازیکنی که حرکت قبلی را انجام می دهد با توجه به اینکه بازیکنی که آخرین حرکت را انجام داده منطقی است، چه کاری انجام می دهد و به همین ترتیب تا اولین راس آن کار می کند. به راس درخت رسیده است. [50]
بازی در تصویر از دو بازیکن تشکیل شده است. نحوه ساختار این بازی خاص (یعنی با تصمیم گیری متوالی و اطلاعات کامل)، بازیکن 1 ابتدا با انتخاب F یا U (عادلانه یا ناعادلانه) "حرکت" می کند . بعد در دنباله، بازیکن 2 ، که اکنون حرکت بازیکن 1 را مشاهده کرده است ، می تواند A یا R را انتخاب کند (پذیرفتن یا رد کردن). هنگامی که بازیکن 2 انتخاب خود را انجام داد، بازی تمام شده در نظر گرفته می شود و هر بازیکن بازده مربوطه خود را دریافت می کند که در تصویر به صورت دو عدد نشان داده شده است، که در آن عدد اول نشان دهنده بازده بازیکن 1 و عدد دوم نشان دهنده بازده بازیکن 2 است. فرض کنید که بازیکن 1 U را انتخاب کند و سپس بازیکن 2 A را انتخاب کند : بازیکن 1 سپس پاداش "هشت" را دریافت می کند (که در دنیای واقعی می تواند به روش های مختلفی تفسیر شود، که ساده ترین آنها از نظر پول است، اما می تواند به معنای چیزهایی باشد. مانند هشت روز تعطیلات یا هشت کشور فتح شده یا حتی هشت فرصت دیگر برای انجام همان بازی در برابر سایر بازیکنان) و بازیکن 2 بازده "دو" را دریافت می کند.
فرم گسترده همچنین می تواند بازی ها و بازی های حرکت همزمان را با اطلاعات ناقص ضبط کند. برای نشان دادن آن، یا یک خط نقطه چین رئوس مختلف را به هم متصل می کند تا آنها را به عنوان بخشی از مجموعه اطلاعات یکسان نشان دهد (یعنی بازیکنان نمی دانند در کدام نقطه هستند)، یا یک خط بسته در اطراف آنها کشیده می شود. (به مثال در بخش اطلاعات ناقص نگاه کنید.)
بازی معمولی (یا شکل استراتژیک) معمولاً با یک ماتریس نشان داده می شود که بازیکنان، استراتژی ها و بازده ها را نشان می دهد (به مثال سمت راست نگاه کنید). به طور کلی میتوان آن را با هر تابعی نشان داد که بازدهی برای هر بازیکن را با هر ترکیب ممکنی از اقدامات مرتبط میکند. در مثال همراه دو بازیکن وجود دارد. یکی سطر و دیگری ستون را انتخاب می کند. هر بازیکن دارای دو استراتژی است که با تعداد ردیف ها و تعداد ستون ها مشخص می شود. پرداخت ها در فضای داخلی ارائه می شود. اولین عدد، سود دریافتی توسط بازیکن ردیف است (بازیکن 1 در مثال ما). دومی سود برای بازیکن ستون است (بازیکن 2 در مثال ما). فرض کنید که Player 1 Up و Player 2 Left را بازی کند . سپس بازیکن 1 بازده 4 را دریافت می کند و بازیکن 2 3 دریافت می کند.
هنگامی که یک بازی به شکل عادی ارائه می شود، فرض بر این است که هر بازیکن به طور همزمان یا حداقل بدون اطلاع از اقدامات دیگری عمل می کند. اگر بازیکنان اطلاعاتی در مورد انتخاب های بازیکنان دیگر داشته باشند، بازی معمولاً به صورت گسترده ارائه می شود.
هر بازی با فرم گسترده دارای یک بازی با فرم معمولی معادل است، با این حال، تبدیل به فرم معمولی ممکن است منجر به افزایش نمایی در اندازه نمایش شود و آن را از نظر محاسباتی غیرعملی کند. [51]
در تئوری بازی های تعاونی، تابع مشخصه بازده هر ائتلاف را فهرست می کند. منشأ این فرمول بندی در کتاب جان فون نویمان و اسکار مورگنسترن است. [ نیازمند منبع ]
به طور رسمی، یک تابع مشخصه تابعی است [52] از مجموعه همه ائتلافهای ممکن بازیکنان تا مجموعهای از پرداختها، و همچنین برآورده میکند . این تابع توضیح میدهد که مجموعهای از بازیکنان میتوانند با تشکیل یک ائتلاف چقدر سود جمعی کسب کنند.
فرمهای نمایش بازی جایگزین برای برخی از زیر کلاسهای بازیها استفاده میشود یا با نیازهای تحقیقات بینرشتهای تنظیم میشود. [53] علاوه بر نمایشهای بازی کلاسیک، برخی از نمایشهای جایگزین جنبههای مرتبط با زمان را نیز رمزگذاری میکنند.
به عنوان یک روش ریاضی کاربردی ، نظریه بازی برای مطالعه طیف گسترده ای از رفتارهای انسان و حیوان مورد استفاده قرار گرفته است. در ابتدا در علم اقتصاد برای درک مجموعه بزرگی از رفتارهای اقتصادی، از جمله رفتارهای شرکت ها، بازارها و مصرف کنندگان توسعه یافت . اولین استفاده از تجزیه و تحلیل نظری بازی توسط آنتوان آگوستین کورنو در سال 1838 با راه حل دو قطبی کورنو انجام شد . استفاده از نظریه بازی ها در علوم اجتماعی گسترش یافته است و نظریه بازی ها در رفتارهای سیاسی، جامعه شناختی و روانی نیز به کار گرفته شده است. [68]
اگرچه طبیعت گرایان پیش از قرن بیستم مانند چارلز داروین انواع گزاره های نظری بازی را بیان کردند، استفاده از تحلیل نظری بازی در زیست شناسی با مطالعات رونالد فیشر در مورد رفتار حیوانات در طول دهه 1930 آغاز شد. این اثر پیش از نام "تئوری بازی" است، اما ویژگی های مهم بسیاری با این حوزه مشترک است. تحولات اقتصاد بعداً توسط جان مینارد اسمیت در کتاب تکامل و نظریه بازیها در سال 1982 در زیست شناسی اعمال شد . [69]
نظریه بازی علاوه بر استفاده برای توصیف، پیشبینی و توضیح رفتار، برای توسعه نظریههای رفتار اخلاقی یا هنجاری و تجویز چنین رفتاری نیز استفاده شده است. [70] در اقتصاد و فلسفه ، محققان از نظریه بازیها برای کمک به درک رفتار خوب یا مناسب استفاده می کنند. رویکردهای نظری بازی در فلسفه زبان و فلسفه علم نیز مطرح شده است . [71] استدلالهای نظری بازی از این نوع را میتوان تا افلاطون یافت . [72] یک نسخه جایگزین از نظریه بازی، به نام نظریه بازی های شیمیایی ، انتخاب های بازیکن را به عنوان مولکول های واکنش دهنده شیمیایی استعاری به نام "دانش" نشان می دهد. [73] سپس نظریه بازی های شیمیایی نتایج را به عنوان راه حل های تعادلی برای یک سیستم واکنش های شیمیایی محاسبه می کند.
استفاده اولیه از نظریه بازی ها توصیف و مدل سازی نحوه رفتار جمعیت های انسانی است. [ نیاز به منبع ] برخی [ که؟ ] محققان بر این باورند که با یافتن تعادل بازیها میتوانند پیشبینی کنند که جمعیت واقعی انسان در مواجهه با موقعیتهایی مشابه با بازی مورد مطالعه چگونه رفتار خواهند کرد. این دیدگاه خاص از نظریه بازی مورد انتقاد قرار گرفته است. استدلال می شود که مفروضات ارائه شده توسط نظریه پردازان بازی ها اغلب هنگام اعمال در موقعیت های دنیای واقعی نقض می شود. نظریه پردازان بازی معمولاً فرض می کنند که بازیکنان منطقی عمل می کنند، اما در عمل، عقلانیت و/یا رفتار انسان اغلب از مدل عقلانیت که در نظریه بازی استفاده می شود منحرف می شود. نظریه پردازان بازی با مقایسه مفروضات خود با فرضیات مورد استفاده در فیزیک پاسخ می دهند . بنابراین، در حالی که مفروضات آنها همیشه معتبر نیست، آنها می توانند نظریه بازی ها را به عنوان یک ایده آل علمی معقول شبیه به مدل های مورد استفاده فیزیکدانان در نظر بگیرند . با این حال، کار تجربی نشان داده است که در برخی از بازی های کلاسیک، مانند بازی صدپا ، حدس زدن 2/3 بازی متوسط ، و بازی دیکتاتور ، مردم به طور منظم تعادل نش را بازی نمی کنند. بحث در مورد اهمیت این آزمایش ها و اینکه آیا تجزیه و تحلیل آزمایش ها به طور کامل تمام جنبه های وضعیت مربوطه را در بر می گیرد، وجود دارد. [ب]
برخی از نظریه پردازان بازی، به دنبال کارهای جان مینارد اسمیت و جورج آر پرایس ، برای حل این مسائل به نظریه بازی های تکاملی روی آورده اند. این مدلها یا فاقد عقلانیت یا عقلانیت محدود از سوی بازیکنان فرض میشوند. علیرغم نام، نظریه بازی های تکاملی لزوماً انتخاب طبیعی را به معنای بیولوژیکی فرض نمی کند. تئوری بازی های تکاملی هم شامل تکامل بیولوژیکی و هم تکامل فرهنگی و همچنین مدل های یادگیری فردی است (به عنوان مثال، پویایی بازی ساختگی ).
برخی از محققان نظریه بازی ها را نه به عنوان ابزاری برای پیش بینی رفتار انسان ها، بلکه به عنوان پیشنهادی برای چگونگی رفتار افراد می دانند. از آنجایی که یک استراتژی، مطابق با تعادل نش یک بازی، بهترین پاسخ فرد به اقدامات سایر بازیکنان است - به شرطی که آنها در تعادل نش (همانند) باشند - بازی کردن استراتژی که بخشی از تعادل نش است مناسب به نظر می رسد. این استفاده هنجاری از نظریه بازی ها نیز مورد انتقاد قرار گرفته است. [75]
تئوری بازی ها یک روش اصلی است که در اقتصاد و تجارت ریاضی برای مدل سازی رفتارهای رقابتی عوامل متقابل استفاده می شود . [ج] [76] [77] [78] کاربردها شامل طیف گستردهای از پدیدهها و رویکردهای اقتصادی، مانند مزایده ، چانهزنی ، ادغام و قیمتگذاری خرید، [79] تقسیم منصفانه ، دو قطبیها ، انحصارطلبیها ، تشکیل شبکههای اجتماعی ، عامل- اقتصاد محاسباتی مبتنی بر ، [80] [81] تعادل عمومی ، طراحی مکانیسم، [82] [83] [84] [85] [86] و سیستم های رأی گیری . [87] و در حوزههای گستردهای مانند اقتصاد تجربی، [88] [89] [90] [91] [92] اقتصاد رفتاری ، [93] [94] [95] [96] [97] [98] اقتصاد اطلاعات ، [45] [46] [47] [48] سازمان صنعتی ، [99] [100] [101] [102] و اقتصاد سیاسی . [103] [104] [105] [47]
این تحقیق معمولاً بر روی مجموعههای خاصی از استراتژیها به نام «مفاهیم راهحل» یا «تعادل» تمرکز میکند . یک فرض رایج این است که بازیکنان منطقی عمل می کنند. در بازی های غیرهمکاری معروف ترین آنها تعادل نش است. اگر هر کدام بهترین پاسخ را به استراتژی های دیگر نشان دهند، مجموعه ای از استراتژی ها یک تعادل نش هستند. اگر همه بازیکنان استراتژیها را در تعادل نش بازی کنند، انگیزه یکطرفه برای انحراف ندارند، زیرا استراتژی آنها بهترین کاری است که میتوانند با توجه به کاری که دیگران انجام میدهند انجام دهند. [106] [107]
بازده بازی عموماً برای نشان دادن سودمندی بازیکنان منفرد در نظر گرفته می شود.
یک مقاله اولیه در مورد نظریه بازی در اقتصاد با ارائه یک بازی که انتزاعی از یک موقعیت اقتصادی خاص است آغاز می شود. یک یا چند مفهوم راه حل انتخاب می شود، و نویسنده نشان می دهد که کدام مجموعه استراتژی در بازی ارائه شده، تعادل هایی از نوع مناسب هستند. اقتصاددانان و اساتید تجارت دو کاربرد اصلی را پیشنهاد می کنند (که در بالا ذکر شد): توصیفی و تجویزی . [70]
تئوری بازی همچنین در شاخه یا جریان خاصی از اقتصاد - اقتصاد مدیریتی - کاربرد گسترده ای دارد . یکی از کاربردهای مهم آن در حوزه اقتصاد مدیریتی، در تحلیل تعاملات استراتژیک بین شرکت ها است. [108] برای مثال، شرکتها ممکن است در بازاری با منابع محدود رقابت کنند، و تئوری بازی میتواند به مدیران کمک کند تا بفهمند که چگونه تصمیمهایشان بر رقبای خود و نتایج کلی بازار تأثیر میگذارد. تئوری بازی ها همچنین می تواند برای تجزیه و تحلیل همکاری بین شرکت ها، مانند ایجاد اتحاد استراتژیک یا سرمایه گذاری مشترک استفاده شود. یکی دیگر از کاربردهای نظریه بازی در اقتصاد مدیریتی، در تحلیل استراتژی های قیمت گذاری است. به عنوان مثال، شرکت ها ممکن است از تئوری بازی برای تعیین استراتژی قیمت گذاری بهینه بر اساس اینکه چگونه انتظار دارند رقبای خود به تصمیمات قیمت گذاری آنها پاسخ دهند، استفاده کنند. به طور کلی، نظریه بازی به عنوان یک ابزار مفید برای تجزیه و تحلیل تعاملات استراتژیک و تصمیم گیری در زمینه اقتصاد مدیریتی عمل می کند.
موسسه منشور تدارکات و تامین (CIPS) دانش و استفاده از تئوری بازی ها را در چارچوب تدارکات تجاری ترویج می کند . [109] CIPS و شرکای TWS مجموعه ای از نظرسنجی ها را برای کشف درک، آگاهی و کاربرد نظریه بازی در میان متخصصان تدارکات انجام داده اند . برخی از یافته های اصلی در سومین نظرسنجی سالانه آنها (2019) عبارتند از:
تصمیم گیری معقول برای موفقیت پروژه ها حیاتی است. در مدیریت پروژه، از تئوری بازی برای مدل سازی فرآیند تصمیم گیری بازیکنان، مانند سرمایه گذاران، مدیران پروژه، پیمانکاران، پیمانکاران فرعی، دولت ها و مشتریان استفاده می شود. اغلب، این بازیکنان دارای منافع رقابتی هستند، و گاهی اوقات منافع آنها مستقیماً برای سایر بازیکنان مضر است و سناریوهای مدیریت پروژه را برای مدلسازی تئوری بازیها مناسب میسازد.
Piraveenan (2019) [111] در بررسی خود چندین مثال ارائه می دهد که در آن از نظریه بازی برای مدل سازی سناریوهای مدیریت پروژه استفاده می شود. به عنوان مثال، یک سرمایهگذار معمولاً چندین گزینه سرمایهگذاری دارد و هر گزینه احتمالاً منجر به پروژه متفاوتی میشود، و بنابراین باید قبل از تولید منشور پروژه، یکی از گزینههای سرمایهگذاری انتخاب شود. به طور مشابه، هر پروژه بزرگی که شامل پیمانکاران فرعی است، به عنوان مثال، یک پروژه ساختمانی، دارای یک تعامل پیچیده بین پیمانکار اصلی (مدیر پروژه) و پیمانکاران فرعی، یا بین خود پیمانکاران فرعی است که معمولاً دارای چندین نقطه تصمیم است. به عنوان مثال، اگر ابهامی در قرارداد بین پیمانکار و پیمانکار فرعی وجود داشته باشد، هر کدام باید تصمیم بگیرند که بدون به خطر افتادن کل پروژه و در نتیجه سهم خود در آن، چقدر به پرونده خود فشار بیاورند. به طور مشابه، زمانی که پروژههایی از سازمانهای رقیب راهاندازی میشوند، پرسنل بازاریابی باید تصمیم بگیرند که بهترین زمانبندی و استراتژی برای بازاریابی پروژه، یا محصول یا خدمات حاصل از آن چیست، تا بتواند در مواجهه با رقابت، بیشترین کشش را به دست آورد. در هر یک از این سناریوها، تصمیمات مورد نیاز به تصمیمات بازیکنان دیگر بستگی دارد که به نحوی منافعی در رقابت با منافع تصمیم گیرنده دارند و بنابراین می توان به طور ایده آل با استفاده از نظریه بازی مدل سازی کرد.
Piraveenan [111] خلاصه می کند که بازی های دو نفره عمدتاً برای مدل سازی سناریوهای مدیریت پروژه استفاده می شوند و بر اساس هویت این بازیکنان، پنج نوع متمایز از بازی ها در مدیریت پروژه استفاده می شود.
از نظر انواع بازی ها، برای مدلسازی سناریوهای مختلف مدیریت پروژه، از هر دو حالت مشارکتی و غیرهمکاری، فرم معمولی و همچنین فرم گسترده و مجموع صفر و همچنین مجموع غیر صفر استفاده می شود.
کاربرد نظریه بازی در علوم سیاسی در حوزه های همپوشانی تقسیم عادلانه ، اقتصاد سیاسی ، انتخاب عمومی ، چانه زنی جنگ ، نظریه سیاسی مثبت ، و نظریه انتخاب اجتماعی متمرکز است . در هر یک از این حوزهها، محققان مدلهای نظری بازی را توسعه دادهاند که در آن بازیگران اغلب رایدهندگان، ایالتها، گروههای ذینفع خاص و سیاستمداران هستند. [112]
نمونههای اولیه نظریه بازیهای کاربردی در علوم سیاسی توسط آنتونی داونز ارائه شده است . او در کتاب خود در سال 1957، نظریه اقتصادی دموکراسی ، [113] مدل مکان شرکت هتلینگ را در فرآیند سیاسی به کار می برد. در مدل داونسی، نامزدهای سیاسی متعهد به ایدئولوژی ها در فضای سیاستی تک بعدی هستند. داونز ابتدا نشان میدهد که اگر رأیدهندگان کاملاً مطلع باشند، چگونه نامزدهای سیاسی با ایدئولوژی ترجیحی رأیدهندگان متوسط همگرا میشوند، اما سپس استدلال میکند که رأیدهندگان تصمیم میگیرند که از نظر منطقی ناآگاه بمانند که امکان واگرایی نامزدها را فراهم میکند. تئوری بازی ها در سال 1962 برای بحران موشکی کوبا در دوران ریاست جمهوری جان اف کندی به کار گرفته شد. [114]
همچنین پیشنهاد شده است که نظریه بازی ها ثبات هر شکلی از حکومت سیاسی را توضیح می دهد. با در نظر گرفتن ساده ترین حالت سلطنت، برای مثال، پادشاه، که تنها یک نفر است، با اعمال کنترل فیزیکی شخصاً بر همه یا حتی تعداد قابل توجهی از رعایای خود، قدرت خود را حفظ نمی کند و نمی تواند. در عوض، کنترل حاکمیتی با شناخت هر شهروندی توضیح داده میشود که همه شهروندان دیگر از یکدیگر انتظار دارند که پادشاه (یا سایر دولتهای مستقر) را بهعنوان شخصی که دستوراتش اجرا میشود ببینند. از آنجایی که توطئه برای جایگزینی حاکمیت عموماً به عنوان یک جرم قابل مجازات است، هماهنگی ارتباط بین شهروندان برای جایگزینی حاکمیت ممنوع است. [115] بنابراین، در فرآیندی که میتوان با انواع معضل زندانی مدلسازی کرد، در طول دورههای ثبات، هیچ شهروندی حرکت برای جایگزینی حاکمیت را منطقی نمیداند، حتی اگر همه شهروندان بدانند که اگر چنین باشند، وضعیت بهتری خواهند داشت. همه به صورت دسته جمعی عمل کنند. [ نیازمند منبع ]
یک توضیح تئوری بازی برای صلح دموکراتیک این است که بحث عمومی و باز در دموکراسی ها اطلاعات روشن و قابل اعتمادی را در مورد نیات آنها به سایر کشورها ارسال می کند. در مقابل، دانستن نیات رهبران غیر دموکراتیک، تأثیر امتیازات و اینکه آیا به وعده ها عمل خواهد شد، دشوار است. بنابراین، اگر حداقل یکی از طرفین اختلاف غیردموکراسی باشد، بی اعتمادی و عدم تمایل به امتیاز دادن وجود خواهد داشت. [116]
با این حال، نظریه بازی ها پیش بینی می کند که دو کشور ممکن است همچنان وارد جنگ شوند، حتی اگر رهبران آنها از هزینه های جنگ آگاه باشند. جنگ ممکن است ناشی از اطلاعات نامتقارن باشد. دو کشور ممکن است انگیزه هایی برای ارائه نادرست میزان منابع نظامی در اختیار داشته باشند و این باعث می شود که آنها نتوانند به طور توافقی اختلافات را بدون توسل به جنگ حل و فصل کنند. علاوه بر این، جنگ ممکن است به دلیل مشکلات تعهدی رخ دهد: اگر دو کشور بخواهند اختلاف را از طریق راههای مسالمتآمیز حل و فصل کنند، اما هر کدام بخواهند به شرایط آن حل و فصل برگردند، ممکن است چارهای جز توسل به جنگ نداشته باشند. در نهایت، جنگ ممکن است ناشی از عدم تفکیک موضوع باشد. [117]
نظریه بازی همچنین میتواند به پیشبینی واکنشهای یک کشور در زمانی که قانون یا قانون جدیدی برای آن کشور اعمال میشود، کمک کند. یکی از نمونه ها تحقیق پیتر جان وود (2013) است که به این موضوع می پردازد که کشورها چه کاری می توانند برای کمک به کاهش تغییرات آب و هوایی انجام دهند. وود فکر می کرد که این امر می تواند با انعقاد پیمان هایی با کشورهای دیگر برای کاهش انتشار گازهای گلخانه ای انجام شود . با این حال، او به این نتیجه رسید که این ایده نمی تواند کارساز باشد، زیرا یک معضل زندانی برای ملت ها ایجاد می کند. [118]
تئوری بازی به طور گسترده برای مدلسازی سناریوهای تصمیمگیری مرتبط با کاربردهای دفاعی استفاده شده است. [119] اکثر مطالعاتی که تئوری بازی را در تنظیمات دفاعی به کار میبرند، به جنگ فرماندهی و کنترل مربوط میشوند و میتوانند بیشتر به مطالعات مربوط به (1) جنگ تخصیص منابع (2) جنگ اطلاعات (iii) جنگ کنترل سلاحها و ( IV) جنگ نظارتی دشمن. [119] بسیاری از مشکلات مورد مطالعه به سنجش و ردیابی مربوط میشوند، برای مثال یک کشتی سطحی تلاش میکند یک زیردریایی متخاصم را ردیابی کند و زیردریایی تلاش میکند از ردیابی فرار کند، و تصمیمگیری وابسته به هم که در رابطه با باربری، سرعت، و فناوری حسگر فعال شده توسط هر دو کشتی. هو و همکاران [119] خلاصه ای مختصر از آخرین پیشرفت های موجود در رابطه با استفاده از نظریه بازی در کاربردهای دفاعی ارائه می دهد و مزایا و محدودیت های نظریه بازی را در سناریوهای در نظر گرفته شده برجسته می کند.
برخلاف آنهایی که در اقتصاد هستند، بازده بازیها در زیستشناسی اغلب به عنوان تناسب اندام تفسیر میشوند . علاوه بر این، تمرکز کمتر بر روی تعادل هایی بوده است که با مفهوم عقلانیت مطابقت دارد و بیشتر بر تعادل هایی که توسط نیروهای تکاملی حفظ می شوند، بوده است. شناخته شده ترین تعادل در زیست شناسی به عنوان استراتژی پایدار تکاملی (ESS) شناخته می شود که اولین بار در (Maynard Smith & Price 1973) معرفی شد. اگرچه انگیزه اولیه آن شامل هیچ یک از الزامات ذهنی تعادل نش نبود، هر ESS یک تعادل نش است.
در زیست شناسی، نظریه بازی ها به عنوان الگویی برای درک بسیاری از پدیده های مختلف استفاده شده است. برای اولین بار برای توضیح تکامل (و ثبات) نسبت های جنسی تقریبی 1:1 استفاده شد . (فیشر 1930) پیشنهاد کرد که نسبت های جنسی 1:1 نتیجه نیروهای تکاملی است که بر روی افرادی اعمال می شود که تلاش می کنند تعداد نوه های خود را به حداکثر برسانند.
علاوه بر این، زیست شناسان از نظریه بازی های تکاملی و ESS برای توضیح ظهور ارتباطات حیوانات استفاده کرده اند . [120] تجزیه و تحلیل بازی های سیگنالینگ و سایر بازی های ارتباطی بینشی را در مورد تکامل ارتباط بین حیوانات ارائه کرده است. به عنوان مثال، رفتار اوباش گونه های بسیاری، که در آن تعداد زیادی از حیوانات طعمه به یک شکارچی بزرگتر حمله می کنند، به نظر می رسد نمونه ای از سازماندهی خود به خودی اضطراری باشد. همچنین نشان داده شده است که مورچه ها رفتاری شبیه به مد از خود نشان می دهند (به اقتصاد پروانه ای پل اورمرود مراجعه کنید ).
زیست شناسان از بازی مرغ برای تجزیه و تحلیل رفتار جنگی و قلمرویی استفاده کرده اند . [121]
به گفته مینارد اسمیت، در مقدمه تکامل و نظریه بازی ها ، "به طور متناقضی، مشخص شده است که نظریه بازی به راحتی در زیست شناسی اعمال می شود تا در حوزه رفتار اقتصادی که در ابتدا برای آن طراحی شده است". نظریه بازی های تکاملی برای توضیح بسیاری از پدیده های به ظاهر نامتجانس در طبیعت استفاده شده است. [122]
یکی از این پدیده ها به عنوان نوع دوستی بیولوژیکی شناخته می شود . این وضعیتی است که در آن به نظر می رسد یک موجود زنده به گونه ای عمل می کند که برای سایر موجودات مفید است و برای خودش مضر است. این از مفاهیم سنتی نوع دوستی متمایز است زیرا چنین اعمالی آگاهانه نیستند، اما به نظر می رسد سازگاری های تکاملی برای افزایش تناسب اندام کلی باشند. نمونههایی را میتوان در گونههایی یافت از خفاشهای خونآشام که خونی را که از شکار شبانه به دست آوردهاند پس میگیرند و آن را به اعضای گروهی میدهند که نتوانستهاند تغذیه کنند، تا زنبورهای کارگری که برای تمام عمر از ملکه زنبور عسل مراقبت میکنند و هرگز جفت نمیگیرند. میمونهای مخملی که به اعضای گروه درباره رویکرد یک شکارچی هشدار میدهند، حتی زمانی که شانس بقای آن فرد را به خطر میاندازد. [123] همه این اقدامات تناسب اندام کلی یک گروه را افزایش می دهد، اما با هزینه ای برای فرد اتفاق می افتد.
نظریه بازی های تکاملی این نوع دوستی را با ایده انتخاب خویشاوند تبیین می کند . نوعدوستان بین افرادی که به آنها کمک می کنند تبعیض قائل می شوند و از بستگانشان حمایت می کنند. قانون همیلتون منطق تکاملی پشت این انتخاب را با معادله c <b × r توضیح می دهد ، که در آن هزینه c برای نوع دوست باید کمتر از سود b برای گیرنده ضرب در ضریب ارتباط r باشد . ارتباط نزدیکتر دو موجود زنده باعث افزایش بروز نوعدوستی میشود، زیرا آنها در بسیاری از آللهای مشابه مشترک هستند. این بدان معنی است که فرد نوع دوست، با اطمینان از اینکه آلل های خویشاوند نزدیکش از طریق بقای فرزندانش منتقل می شود، می تواند از گزینه داشتن فرزند خود چشم پوشی کند زیرا همان تعداد آلل منتقل می شود. به عنوان مثال، کمک به خواهر و برادر (در حیوانات دیپلوئید) دارای ضریب 1⁄2 است ، زیرا (به طور متوسط) یک فرد نیمی از آلل های فرزندان خواهر یا برادر خود را دارد . حصول اطمینان از زنده ماندن تعداد کافی فرزندان خواهر و برادر تا بزرگسالی، از نیاز فرد نوع دوست برای تولید فرزندان جلوگیری می کند. [123] مقادیر ضرایب به شدت به محدوده زمین بازی بستگی دارد. برای مثال، اگر انتخاب چه کسی به نفع همه موجودات زنده ژنتیکی باشد، نه فقط همه خویشاوندان، ما فرض میکنیم که اختلاف بین همه انسانها فقط تقریباً 1% از تنوع در زمین بازی را به خود اختصاص میدهد، ضریبی که در 1/2 بود . فیلد کوچکتر 0.995 می شود. به طور مشابه، اگر در نظر گرفته شود که اطلاعاتی غیر از ماهیت ژنتیکی (مثلاً اپی ژنتیک، دین، علم، و غیره) در طول زمان باقی مانده است، میدان بازی همچنان بزرگتر می شود، و اختلافات کوچکتر می شود.
تئوری بازی ها نقش مهمی را در منطق و علوم رایانه ایفا می کند . چندین نظریه منطقی در معناشناسی بازی ها پایه و اساس دارند . علاوه بر این، دانشمندان کامپیوتر از بازیها برای مدلسازی محاسبات تعاملی استفاده کردهاند . همچنین، تئوری بازی ها مبنایی نظری برای حوزه سیستم های چند عاملی فراهم می کند . [124]
به طور جداگانه، نظریه بازی در الگوریتم های آنلاین نقش داشته است . به طور خاص، مشکل k -server ، که در گذشته به عنوان بازی با هزینه های جابجایی و بازی های درخواست پاسخ نامیده می شد . [125] اصل یائو یک تکنیک تئوری بازی برای اثبات مرزهای پایین در پیچیدگی محاسباتی الگوریتم های تصادفی ، به ویژه الگوریتم های آنلاین است.
ظهور اینترنت انگیزه توسعه الگوریتمهایی برای یافتن تعادل در بازیها، بازارها، حراجهای محاسباتی، سیستمهای همتا به همتا، و بازارهای امنیت و اطلاعات شده است. نظریه بازی های الگوریتمی [86] و طراحی مکانیزم الگوریتمی [85] طراحی الگوریتم محاسباتی و تجزیه و تحلیل سیستم های پیچیده را با تئوری اقتصادی ترکیب می کند. [126] [127] [128]
نظریه بازی ها در فلسفه کاربردهای متعددی دارد . لوئیس (1969) در پاسخ به دو مقاله WVO Quine (1960، 1967) از نظریه بازی برای توسعه یک شرح فلسفی از قرارداد استفاده کرد . او با این کار اولین تحلیل دانش رایج را ارائه کرد و آن را در تحلیل بازی در بازی های هماهنگی به کار گرفت . علاوه بر این، او ابتدا پیشنهاد کرد که می توان معنی را از نظر بازی های سیگنالینگ درک کرد . این پیشنهاد بعدی از زمان لوئیس توسط چندین فیلسوف دنبال شده است. [129] [130] به دنبال گزارش نظریه بازی لوئیس (1969) از قراردادها، ادنا اولمان-مارگالیت (1977) و بیچیری (2006) نظریه هایی از هنجارهای اجتماعی را توسعه داده اند که آنها را به عنوان تعادل نش که از تغییر یک انگیزه ترکیبی ناشی می شود، تعریف می کند. بازی به یک بازی هماهنگی [131] [132]
نظریه بازی همچنین فیلسوفان را به چالش کشیده است تا بر اساس معرفت شناسی تعاملی بیندیشند : داشتن باورها یا دانش مشترک برای یک جمع به چه معناست و پیامدهای این دانش برای پیامدهای اجتماعی ناشی از تعاملات کارگزاران چیست. فیلسوفانی که در این زمینه کار کرده اند عبارتند از Bicchieri (1989، 1993)، [133] [134] Skyrms (1990)، [135] و Stalnaker (1999). [136]
ترکیب نظریه بازی با اخلاق توسط RB Braithwaite حمایت شد . [137] امید این بود که تجزیه و تحلیل دقیق ریاضی نظریه بازی ها ممکن است به رسمیت بخشیدن به بحث های فلسفی مبهم تر کمک کند. با این حال، این انتظار تنها به میزان محدودی محقق شد. [138]
در اخلاق ، برخی (به ویژه دیوید گوتیه، گرگوری کاوکا، و ژان همپتون) [ چه کسانی؟ ] نویسندگان تلاش کرده اند تا پروژه توماس هابز را برای استخراج اخلاق از نفع شخصی دنبال کنند. از آنجایی که بازیهایی مانند معمای زندانی تضاد آشکاری بین اخلاق و منفعت شخصی ایجاد میکنند، توضیح اینکه چرا همکاری برای منافع شخصی لازم است، جزء مهمی از این پروژه است. این استراتژی کلی جزئی از دیدگاه قرارداد اجتماعی عمومی در فلسفه سیاسی است (برای مثال، به گوتیه (1986) و کاوکا (1986) مراجعه کنید). [d]
نویسندگان دیگر سعی کردهاند از نظریه بازیهای تکاملی برای توضیح ظهور نگرشهای انسانی درباره اخلاق و رفتارهای حیوانی مربوطه استفاده کنند. این نویسندگان به چندین بازی از جمله معضل زندانی، شکار گوزننر و بازی چانهزنی نش به عنوان توضیحی برای ظهور نگرشها در مورد اخلاق نگاه میکنند (به عنوان مثال، Skyrms (1996، 2004) و Sober and Wilson (1998) را ببینید).
از آنجایی که تصمیم به مصرف واکسن برای یک بیماری خاص اغلب توسط افراد گرفته می شود، که ممکن است طیف وسیعی از عوامل و پارامترها را در تصمیم گیری در نظر بگیرند (مانند بروز و شیوع بیماری، خطرات درک شده و واقعی مرتبط با ابتلا به بیماری). ، میزان مرگ و میر، خطرات درک شده و واقعی مرتبط با واکسیناسیون، و هزینه مالی واکسیناسیون)، نظریه بازی برای مدل سازی و پیش بینی جذب واکسیناسیون در یک جامعه استفاده شده است. [139] [140]
نظریه بازی ها کاربردهای متعددی در زمینه هوش مصنوعی/ML دارد. اغلب در توسعه سیستم های خودمختار که می توانند تصمیمات پیچیده را در محیط نامطمئن بگیرند استفاده می شود. [141] برخی از زمینه های دیگر کاربرد نظریه بازی در زمینه AI/ML به شرح زیر است - تشکیل سیستم چند عاملی، یادگیری تقویتی، [142] طراحی مکانیسم و غیره. [143] با استفاده از تئوری بازی ها برای مدل سازی رفتار سایر عوامل. و با پیشبینی اقدامات آنها، سیستمهای AI/ML میتوانند تصمیمات بهتری بگیرند و کارآمدتر عمل کنند. [144]
ویلیام پاوندستون این بازی را در کتاب معمای زندانی خود در سال 1993 توضیح داد: [145]
دو نفر از اعضای یک باند تبهکار به نام های الف و ب دستگیر و زندانی می شوند. هر زندانی در سلول انفرادی بدون وسیله ارتباطی با شریک زندگی خود است. اتهام اصلی منجر به مجازات ده سال زندان می شود. با این حال، پلیس شواهدی برای محکومیت ندارد. آنها قصد دارند هر دوی آنها را با اتهام کمتری به دو سال زندان محکوم کنند، اما به هر زندانی یک معامله فاوستی پیشنهاد می کنند: اگر یکی از آنها به جرم اتهام اصلی، یعنی خیانت به دیگری اعتراف کند، عفو می شوند و آزاد می شوند تا دیگری را ترک کنند. باید تمام مدت محکومیت خود را بجای دو سال برای اتهام کمتر بگذراند.
استراتژی غالب (و در نتیجه بهترین پاسخ به هر استراتژی مخالف ممکن)، خیانت به دیگری است که با اصل چیز مطمئن همسو است . [146] با این حال، ساکت ماندن هر دو زندانی برای هر دوی آنها پاداشی بزرگتر از خیانت متقابل به همراه داشت.
"نبرد جنسیت ها" اصطلاحی است که برای توصیف تعارض ادراک شده بین زن و مرد در زمینه های مختلف زندگی مانند روابط، مشاغل و نقش های اجتماعی استفاده می شود. این تعارض اغلب در فرهنگ عامه مانند فیلم ها و برنامه های تلویزیونی به عنوان رقابتی طنزآمیز یا نمایشی بین جنسیت ها به تصویر کشیده می شود. این تضاد را می توان در چارچوب نظریه بازی به تصویر کشید. این نمونه ای از بازی های غیرهمکاری است.
نمونهای از «نبرد جنسیتها» را میتوان در به تصویر کشیدن روابط در رسانههای عامهپسند مشاهده کرد، جایی که مردان و زنان اغلب بهطور اساسی متفاوت و در تضاد با یکدیگر به تصویر کشیده میشوند. به عنوان مثال، در برخی از کمدی های عاشقانه، قهرمانان زن و مرد به عنوان دیدگاه های متضادی در مورد عشق و روابط نشان داده می شوند و برای با هم بودن باید بر این تفاوت ها غلبه کنند. [147]
در این بازی، دو تعادل ناش استراتژی خالص وجود دارد: یکی که هر دو بازیکن یک استراتژی را انتخاب می کنند و دیگری که بازیکنان گزینه های مختلفی را انتخاب می کنند. اگر بازی در استراتژی های مختلط انجام شود، جایی که هر بازیکن استراتژی خود را به طور تصادفی انتخاب می کند، آنگاه تعداد بی نهایت تعادل نش وجود دارد. با این حال، در چارچوب بازی "نبرد جنسیت ها"، معمولاً این فرض مطرح می شود که بازی در استراتژی های خالص انجام می شود. [148]
بازی اولتیماتوم یک بازی است که به ابزاری محبوب برای آزمایشات اقتصادی تبدیل شده است . توصیف اولیه توسط جان هرسانی برنده جایزه نوبل در سال 1961 است. [149]
به یک بازیکن، پیشنهاد دهنده، مبلغی پول داده شده است. پیشنهاد دهنده وظیفه دارد آن را با یک بازیکن دیگر، پاسخ دهنده (که می داند مجموع آن چقدر است) تقسیم کند. هنگامی که پیشنهاد دهنده تصمیم خود را اعلام می کند، پاسخ دهنده ممکن است آن را بپذیرد یا آن را رد کند. اگر پاسخ دهنده بپذیرد، پول به ازای پیشنهاد تقسیم می شود. اگر پاسخ دهنده رد کند، هر دو بازیکن چیزی دریافت نمی کنند. هر دو بازیکن از قبل از عواقب پذیرش یا رد پیشنهاد توسط پاسخ دهنده مطلع هستند. این بازی نشان می دهد که چگونه پذیرش اجتماعی، انصاف و سخاوت بر تصمیمات بازیکنان تأثیر می گذارد. [150]
بازی اولتیماتوم یک نوع دارد، آن بازی دیکتاتور است. آنها اکثراً یکسان هستند، به جز در بازی دیکتاتور، پاسخ دهنده قدرتی برای رد پیشنهاد پیشنهاد دهنده ندارد.
بازی اعتماد آزمایشی است که برای سنجش اعتماد در تصمیمات اقتصادی طراحی شده است. این بازی همچنین "بازی سرمایه گذاری" نامیده می شود و برای بررسی اعتماد و نشان دادن اهمیت آن به جای "عقلانیت" منفعت شخصی طراحی شده است. این بازی توسط برگ جویس، جان دیکهات و کوین مک کیب در سال 1995 طراحی شد. [151]
در بازی به یک بازیکن (سرمایه گذار) مبلغی پول داده می شود و باید تصمیم بگیرد که چه مقدار از آن را به بازیکن دیگر (معتمد) بدهد. سپس مقدار داده شده توسط آزمایشگر سه برابر می شود. سپس متولی تصمیم می گیرد چه مقدار از مبلغ سه برابر شده را به سرمایه گذار بازگرداند. اگر گیرنده کاملاً به خود علاقه مند است، پس او نباید چیزی را پس دهد. با این حال، به عنوان انجام آزمایش درست نیست. نتیجه حاکی از آن است که مردم مایلند با به خطر انداختن مقداری پول، به اعتمادی اعتماد کنند، با این باور که عمل متقابل وجود خواهد داشت. [152]
مدل رقابت Cournot شامل بازیکنانی است که مقدار یک محصول همگن را برای تولید مستقل و همزمان انتخاب میکنند، جایی که هزینه نهایی برای هر شرکت متفاوت است و سود شرکت سود است. هزینههای تولید اطلاعات عمومی است و هدف شرکت این است که مقدار حداکثر سود خود را بر اساس آنچه که شرکت دیگر تولید میکند و مانند انحصار رفتار میکند، بیابد. در این بازی شرکت ها می خواهند در مقدار انحصاری تولید کنند اما انگیزه زیادی برای انحراف و تولید بیشتر وجود دارد که باعث کاهش قیمت تسویه بازار می شود. [23] برای مثال، شرکتها ممکن است وسوسه شوند که در صورت وجود مقدار کم انحصاری و قیمت بالا، از مقدار انحصار منحرف شوند، با هدف افزایش تولید برای به حداکثر رساندن سود. [23] با این حال، این گزینه بالاترین بازده را ارائه نمی دهد، زیرا توانایی یک شرکت برای به حداکثر رساندن سود به سهم بازار و کشش تقاضای بازار بستگی دارد. [153] تعادل کورنو زمانی حاصل می شود که هر شرکت بر اساس تابع واکنش خود بدون انگیزه انحراف عمل کند، زیرا آنها بهترین پاسخ را بر اساس بازده شرکت های دیگر دارند. [23] در بازی، زمانی که تعادل Cournot به دست میآید، شرکتها به تعادل نش میرسند.
رقابت برتراند محصولات همگن و هزینه نهایی ثابت را در نظر می گیرد و بازیکنان قیمت ها را انتخاب می کنند. [23] تعادل رقابت قیمت در جایی است که قیمت با فرض اطلاعات کامل در مورد هزینه های رقبا برابر با هزینه های نهایی است. بنابراین، شرکت ها انگیزه ای برای انحراف از تعادل دارند، زیرا یک محصول همگن با قیمت پایین تر، تمام سهم بازار را به دست می آورد که به عنوان مزیت هزینه شناخته می شود. [154]
لیست ها
با این وجود، تکنیکهای ریاضی مورد استفاده در تئوری بازیها برای دستیابی به یک هدف واحد طراحی شدهاند: به حداکثر رساندن «سطح امنیتی»، که در آن سطح امنیتی کمترین مقداری است که یک بازیکن میتواند از یک انتخاب استراتژی دریافت کند.
... اين است كه تمام نكته دستگاه روز قيامت از بين رفته است، اگر آن را مخفي نگه داريد!