Pequeno experimento com o Dilema do Prisioneiro

O Dilema do prisioneiro é um jogo clássico da Teoria dos Jogos. É um dilema porque, se um oponente escolher trair o outro, o primeiro obtém ganhos locais. Mas, se um confiar no outro e ambos colaborarem, o resultado global é melhor para todo mundo.
 

Fiz um pequeno simulador baseado neste jogo. É em Excel, disponível para download neste link.
https://drive.google.com/file/d/0B7qV4XXADYw2bzYweWc3YkViOUk/view?usp=sharing

 

TelaDilema


 

O jogo

Você está participando de um jogo com as seguintes regras:
 

– são 12 pontos em jogo, você contra um oponente
– tanto você quanto o oponente têm duas opções: dividir os pontos (cooperar), ou tomar todos os pontos para si.
– caso ambos cooperam, cada um receberá 6 pontos (6 e 6).
– caso um escolha “cooperar” e o outro “tomar”, o primeiro não ganhará pontos, e o segundo ganhará 10 pontos (10 e 0) ou (0 e 10).
– Caso os dois oponentes escolham tomar tudo, ambos ganham um ponto (1 e 1).
– são 20 rodadas contra cada oponente.


 

Os personagens
Simulei três tipos de personagens para jogar: o avarento, o coração mole, e o assertivo.

 
O tipo avarento é alguém que sempre joga “tomar tudo”, a fim de maximizar seus ganhos imediatos.

 
O tipo coração mole sempre joga compartilhar, sabendo que a longo prazo o bolo a ser dividido é maior se houver colaboração.

 
O tipo assertivo é baseado na estratégia “tit for tat” – retribui na mesma moeda o resultado anterior do oponente. Se o oponente escolheu cooperar na rodada anterior, ele coopera também. Se o outro escolheu tomar, ele também vai fazer isto. O primeiro voto dele é sempre cooperar, dando um voto de confiança. Um assertivo é alguém que não é nem “bonzinho” nem “malvado”, e o tit for tat é o comportamento que mais se aproxima de alguém assim.


 

Duelos

O Coração Mole é massacrado pelo Avarento.

game1

 

O Avarento também ganha do Assertivo, mas a margem é menor.

game2

Um avarento contra outro avarento: todo mundo sai perdendo.

game3

Já um coração mole contra um assertivo ou outro coração mole: todos saem ganhando.

Um assertivo contra outro assertivo também resulta em cooperação plena.

games4_6


 

Portanto, o quadro final de resultados entre jogos ficaria assim:

TelaResultados

 

Neste caso, o Assertivo ganha, com o ganancioso em segundo e o coração mole em terceiro.

 

Imaginando algo mais próximo da população de verdade, digamos que 25% da população seja de Avarentos, 50% de assertivos e 25% de corações moles. Neste caso, o ranking de ganhos ponderado ficaria assim:

TelaResumo

 

E o comportamento assertivo sai ganhando, neste mini campeonato de algoritmos.

E, numa população onde a maioria é de assertivos ou corações moles, o coração também ganha do avarento.

O resultado deste joguinho é meio metafórico, mas creio que podem surgir lições daí.

Uma sociedade onde ninguém coopera dá origem à “tragédia dos comuns” – um termo da Economia, onde um resultado que seria melhor para todos nunca é alcançado.

Uma sociedade só com “bonzinhos” é vulnerável a um espertalhão, ganancioso.

De algum modo, o ideal é ficar entre estes extremos.

 

 

Arnaldo Gunzi

Jun/2015

Fat Tony e o dilema do prisioneiro

prisioner
Esta digressão é meio longa e viajante, é normal se ninguém entender.
Já comentei sobre o dilema do prisioneiro aqui (https://ideiasesquecidas.wordpress.com/2014/08/24/dilema-do-prisioneiro-e-assertividade/). É o assunto mais famoso e estudado da teoria dos jogos. Dois homens estão presos. Estão incomunicáveis. Se um confessar e o outro não, o que confessou se livra e o outro fica preso por 10 anos. Se ambos confessarem, ambos ficam 5 anos. Se ninguém confessar, ambos ficam presos por seis meses.
Por outro lado, Fat Tony e Dr. John são personagem criados por Nassim Taleb, autor de Black Swan. Taleb é uma das mentes mais provocativas do mundo atual.
Dr. John é o nerd perfeito. PhD, MBA, terno e gravata, tem um emprego com carteira assinada numa grande empresa.
Fat Tony é alguém que enriqueceu na vida real, investindo em commodities. Desconfia de todas as regras da matemática, dos economistas, do mundo dos negócios. Desrespeita regras quando acha que é a coisa certa a fazer.
Como eles resolveriam o dilema do prisioneiro?
  • Dr. John: se for um jogo único, a estratégia dominante é  a de confessar, independente da ação do outro. Se for um jogo repetitivo, deve-se adotar uma estratégia do tipo tit-for-tat (olho por olho) com perdão, como o tit-for-two-tats.
  • Fat Tony: Porra, eu chamaria o meu conhecido, Don Corleon, para intermediar o acordo. Nenhum de nós confessa. A gente fica um mês preso, depois os advogados tiram a gente e ficamos limpos. Se o corno do outro prisioneiro confessar, ele se ferra.
  • Dr. John: Mas o enunciado do problema diz que eles estão incomunicáveis. Não há um terceiro elemento intermediando a negociação.
  • Fat Tony: Dane-se o enunciado. Nunca vi duas pessoas ficarem incomunicáveis. Nunca vi advogado não poder falar com cliente. Nunca vi juiz não ser influenciado pelas pessoas certas.
Quero salientar nesta história que o modo lógico de resolver problemas não se aplica 100% na realidade. A realidade tem condições de contorno e hipóteses diferentes do mundo matemático. Ficar preso ao enunciado do problema não vai gerar novas soluções.
Recomendo a leitura de Dr. John x Fat Tony, original, no livro do Cisne Negro, para entender este post.
Mas como o Black Swan tem 500 páginas, uma descrição apenas de Dr. John e Fat Tony pode ser vista aqui
Arnaldo Gunzi.
Dez/2014