Como interpretar a regra de Bayes? E o “Paradoxo da Ferrari”

Eu gosto de entender o que as fórmulas querem dizer. Ir além de decorar sua definição.

A regra de Bayes é uma dessas que é bem chata de decorar, confusa, e ninguém sabe muito bem para que serve.

Primeiro, o contexto.

Digamos que eu tenha que dar uma probabilidade de um evento ocorrer. Na falta de dados, vou dar um chute qualquer.

Em termos simples, a regra de Bayes serve para melhorar o seu chute através de novas informações.

Algo assim:

Prob_Posterior = Prob_Anterior x (chance sobre prob_marginal)

Vamos detalhar, a seguir, utilizando como apoio o “Paradoxo da Ferrari”.

O paradoxo da Ferrari

Uma vez, um colega veio com uma história bem esquisita.

Digamos que eu veja um homem com uma Ferrari na rua. Se eu chegar para ele, e perguntar, “Cara, você empresta sua Ferrari para eu dar uma volta?”, qual a chance dele deixar?

(Ferrari ao estilo Van Gogh, imaginada pelo Dall-E)

Esse meu colega argumentava que existiam duas opções: ou ele deixava ou não deixava. Então a chance era de 50%.

Nessa época, eu não conhecia a regra de Bayes e não muito de probabilidades, e não argumentei. Porém, mesmo assim, soou bem esquisito.

Se eu chegar aleatoriamente para uma pessoa e pedir a Ferrari, muito provavelmente a resposta será “não”.

Se ao invés de uma Ferrari, fosse um Gol 1.0, provavelmente a chance seria maior, embora ainda assim tenha mais “nãos” do que “sims”.

A princípio, sem dados alguns, é difícil dar um chute para estimar essas probabilidades.

De forma mais rigorosa, podemos mensurar as probabilidades fazendo pesquisas: vou a campo, pergunto para 1000 pessoas com Ferraris se eles a emprestariam para dar uma volta, e vejo quais as chances. Digamos que o estudo aponte que 1 em 1000 me empreste seu carrão. A partir daí, meu melhor chute vai ser esse:

Prob (sim) = 1/1000.

Aí sim, bem menos do que 50% e mais próximo da realidade.

O paradoxo da Ferrari com mais informações

Agora, suponha que eu seja uma celebridade. Um Leonardo de Caprio, uma Gal Gadot, um Neymar. Se a Gal Gadot fizer a mesma pergunta “Cara, você empresta sua Ferrari para eu dar uma volta?”, as chances de um “sim” seriam extremamente maiores.

Digamos que eu também tenha feito uma pesquisa, e esta aponte 70% de chances de “sim”, sendo celebridade pedindo (suspeito que, no caso do Gol 1.0 com a Gal Gadot pedindo, as chances seriam próximas de 100%!).

Aí, o meu colega chato volta e diz: “Viu, eu não falei que, na média, as chances eram de 50%?” – o que também soa muito estranho, porque não sou uma celebridade e tomaria “não” até no Gol 1.0.

A regra de Bayes vem nos salvar, para que possamos fazer a conta com método.

Exemplificando a Regra de Bayes.

Vamos pegar um universo de 100 mil pessoas.

Digamos que a chance de uma pessoa ser uma celebridade é 1 em 5000.

Portanto, de 100 mil pessoas, há 20 celebridades, e 99.980 pessoas comuns.

Agora, uma pessoa normal tem 1 chance em 1000 de obter um “Sim”. Portanto, das 99.980 pessoas, aproximadamente 100 conseguiriam, caso cada um tentasse uma vez, e 99.880 não conseguiriam.

E, sendo celebridade, 70% conseguiriam. Das 20 celebridades, 14 obteriam “sim”, e 6 obteriam “não”.

A tabela abaixo sumariza todos esses números.

Agora, dadas as informações acima, qual a chance de eu obter um “sim”, dado que sou comum?

Vamos usar a fórmula:

Prob (Sim | Comum) = Prob (Comum | Sim ) * Prob (Sim) / Prob(Comum)

Se não errei nenhuma conta:

Prob (Comum | Sim ) = 100 / 114 (é a probabilidade de eu ser comum, dados todos os “sims”)

Prob ( Sim ) = 114 / 100000 (é a probabilidade de sim, diante do total)

Prob(Comum) = 99980 / 100000 (é a probabilidade de eu ser pessoa comum, no todo)

Portanto:

Prob (Sim | Comum) = (100/114) * (114/100000) / (99980/100000) = 0,001

Ou seja, como a chance do pedinte ser celebridade é rara, isso não afeta em nada as chances. Bate com a intuição, tirando da frente o “paradoxo da Ferrari”. Que me adianta saber que o Cristiano Ronaldo tem muito mais chances de obter um “sim”?

Este é um caso ilustrativo, porém a regra de Bayes pode ser utilizada para condições bem mais complexas.

Portanto, a interpretação é que a regra de Bayes serve para melhorar um cálculo de probabilidade, a partir de informações obtidas a priori. A cada nova informação, melhoro a minha estimativa.

A regra de Bayes é utilizada em modelos estatísticos, problemas matemáticos (como em pesquisa médica), modelos de machine learning e forecast, para citar alguns casos.

Veja também:

https://amzn.to/3W6Xubm


A teoria que não morreria: como a lei de Bayes decifrou o código enigma, perseguiu submarinos russos e emergiu triunfante de dois séculos de controvérsias

https://www.mathsisfun.com/data/bayes-theorem.html

Deixe um comentário

Faça o login usando um destes métodos para comentar:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s