Дилема в'язня

алгоритмічна торгівля : Дилема в'язня
Що таке дилема в'язня?

Дилема в'язня - це парадокс у аналізі рішень, в якому дві особи, які діють у власних інтересах, не дають оптимального результату. Типова дилема ув'язненого встановлюється таким чином, що обидві сторони вирішують захистити себе за рахунок іншого учасника. В результаті обидва учасники опиняються в гіршому стані, ніж якби вони співпрацювали один з одним у процесі прийняття рішень. Дилема в'язня - одна з найвідоміших концепцій сучасної теорії ігор.

Ключові вивезення

  • Дилема в'язня - це ситуація, коли особи, які приймають рішення, завжди мають стимул вибирати таким чином, що створює менш оптимальний результат для осіб як групи.
  • Дилеми ув'язнених виникають у багатьох аспектах економіки.
  • Люди розробили безліч методів подолання дилеми ув'язнених щодо вибору кращих колективних результатів, незважаючи на несприятливі індивідуальні стимули.
1:46

Дилема в'язня

Розуміння дилеми в'язня

Дилема ув'язненого представляє ситуацію, коли дві сторони, розлучені та не в змозі спілкуватися, повинні обирати, співпрацювати з іншою чи ні. Найвища винагорода для кожної сторони відбувається, коли обидві сторони вирішили співпрацювати.

Класична дилема ув'язненого виглядає так: двох членів банди грабіжників банків, Дейва та Генрі, заарештовано і допитують в окремих кімнатах. У влади немає інших свідків, і вони можуть довести справу проти них, лише якщо вони зможуть переконати хоча б одного з розбійників зрадити свого спільника та дати свідчення злочину. Кожен бандитський грабіжник стикається з вибором співпрацювати зі своїм співучасником і мовчати або брати участь у банді та свідчити про притягнення до кримінальної відповідальності. Якщо вони обидва співпрацюють і мовчать, то влада зможе засудити їх лише за меншу плату за грабіж, що означатиме один рік у в'язниці кожен (1 рік для Дейва + 1 рік для Генрі = 2 роки загальної в'язниці час). Якщо один свідчить, а другий - ні, то той, хто свідчить, піде на волю, а інший отримає три роки (0 років для того, хто перешкоджає + 3 для одного засудженого = 3 роки загалом). Однак якщо обидва свідчать проти інших, кожен отримає два роки в'язниці за те, що частково несе відповідальність за пограбування (2 роки для Дейва + 2 роки для Генрі = 4 роки загального часу в'язниці).

У цьому випадку кожен грабіжник завжди має стимул до дефекту, незалежно від вибору, який робить інший. З точки зору Дейва, якщо Генрі залишається мовчазним, то Дейв може або співпрацювати з Генрі і провести рік у в'язниці, або дефектувати та вийти на волю. Очевидно, що в цьому випадку йому було б краще зрадити Генрі та решту банди. З іншого боку, якщо Генрі заперечує і свідчить проти Дейва, то вибір Дейва стає або мовчати і три роки тримати, або розмовляти і робити два роки у в'язниці. Знову ж, очевидно, він вважає за краще робити два роки понад три.

В обох випадках, незалежно від того, чи Генрі співпрацює з Дейвом, чи дефекти обвинувачення, Дейву буде краще, якщо він сам зазнає дефектів та свідчень. Тепер, оскільки Генрі стоїть перед тим самим набором варіантів, йому також завжди буде зручніше перемогти. Парадокс дилеми ув'язненого полягає в наступному: обидва грабіжники можуть мінімізувати загальний час ув'язнення, який вони будуть робити двоє, лише якщо вони обидва будуть співпрацювати (загалом 2 роки), але стимули, з якими кожен стикається окремо, завжди керуватимуть ними кожен дефектувати і в кінцевому підсумку робити максимальний загальний час ув'язнення між ними (загалом 4 роки).

Приклади дилеми в'язня

Економіка рясніє прикладами дилеми ув'язнених, які можуть мати корисні чи шкідливі наслідки для економіки та суспільства в цілому. Загальна нитка - це ситуації, коли стимули, з якими стикається кожен особа, яка приймає рішення, яка отримує свій вибір, змушують їх поводитись так, що всі вони колективно погіршуються, в той час як окремо уникають вибору, який би змусив їх усіх покращитись, якщо всі могли деякі якось спільно обирають.

Одним із таких прикладів є трагедія общини. Кожній перевазі кожного може бути збереження та реінвестування в розповсюдження загального басейну природного ресурсу для того, щоб мати можливість продовжувати його споживання, однак у кожної людини завжди є стимул замість цього споживати якомога швидше, що можливо потім виснажує ресурс. Пошук якимось чином співпрацювати, очевидно, допоможе всім тут краще.

З іншого боку, поведінку картелів також можна вважати дилемою в'язня. Усі члени картелю можуть колективно збагачуватися, обмежуючи обсяг виробництва, щоб зберегти ціну, яку кожен отримує досить високу, щоб стягнути економічну ренту від споживачів, але кожен член картелю окремо має стимул обдурити картель і збільшити обсяг випуску, а також взяти оренду від інші члени картелю. З точки зору добробуту всього суспільства, в якому діє картель, це приклад того, як дилема в'язнів, яка розбиває картель, іноді може насправді покращити суспільство в цілому.

Втеча від дилеми в'язня

З часом люди розробили різноманітні рішення дилеми ув'язнених, щоб подолати індивідуальні стимули на користь загального блага.

По-перше, у реальному світі більшість економічних та інших людських взаємодій повторюються не раз. Справжня дилема в'язня зазвичай грається лише один раз, інакше вона класифікується як повторена дилема в'язня. В ітераційній дилемі ув'язнених гравці можуть вибирати стратегії, які винагороджують співпрацю або карають дефект у часі. Неодноразово взаємодіючи з одними і тими ж особами, ми навіть можемо навмисно переходити від одноразової дилеми в'язня до повторної дилеми в'язня.

По-друге, люди розробили формальні інституційні стратегії для зміни стимулів, з якими стикаються окремі особи, які приймають рішення. Колективні дії щодо насильства щодо поведінки кооперативу шляхом репутації, правил, законів, демократичного чи іншого колективного прийняття рішень та явного соціального покарання за дефекти перетворюють багато дилеми ув'язнених у бік більш спільних результатів спільної співпраці.

Нарешті, деякі люди та групи людей з часом розвинули психологічні та поведінкові упередження, такі як вища довіра один до одного, довгострокова майбутня орієнтація у повторних взаємодіях та схильність до позитивної взаємності поведінки кооперативу чи негативної взаємності дефектної поведінки. Ці тенденції можуть розвиватися через певний природний відбір у суспільстві з часом або груповий відбір у різних конкуруючих суспільствах. Насправді вони призводять групи людей до «нераціонального» вибору результатів, які насправді є найбільш вигідними для всіх разом.

У сукупності ці три фактори (неодноразові дилеми ув'язненого, формальні інститути, що руйнують дилеми ув'язнених, та поведінкові упередження, які підривають "раціональний" індивідуальний вибір у дилемах ув'язнених) допомагають вирішити численні дилеми ув'язнених, з якими ми все б стикалися.

Порівняйте інвестиційні рахунки Ім’я постачальника Опис Розкриття рекламодавця × Пропозиції, що з’являються в цій таблиці, є партнерствами, від яких Investopedia отримує компенсацію.

Пов'язані умови

Означення дилеми ув'язненого Ідентифікована дилема ув'язненого неодноразово відтворюється одними і тими ж учасниками, і допомагає гравцям дізнатися про поведінкові тенденції свого контрагента. докладніше Як працює теорія ігор Теорія ігор є основою для моделювання сценаріїв, в яких конфлікт інтересів існує серед гравців. детальніше Tit for Tat Definition Tit for tat - це стратегія теорії ігор, в якій гравець вибирає дію, яку обрав противник у попередньому раунді гри. докладніше рівновагу Неша Рівновага Неша - це концепція в теорії ігор, де оптимальний результат гри полягає в тому, що немає стимулів відступати від їх початкової стратегії. більше Визначення аукціону на доларах Аукціон у доларах - це послідовна гра, що не має нульової суми, де найвищий учасник торгів отримує долар, а програв повинен заплатити суму, яку він також подає. докладніше Олігопольне визначення Олігополія - ​​це ринкова структура з невеликою кількістю фірм, жодна з яких не може утримувати інших від значного впливу. більше Посилання партнерів
Рекомендуємо
Залиште Свій Коментар