Resposta desafio do exame médico e probabilidades

Enunciado: Um laboratório desenvolveu um teste para detectar uma doença rara. Sabe-se que a doença afeta 1% da população. O teste tem 99% de precisão para detectar a doença se a pessoa estiver realmente doente, e 90% de precisão para dar negativo quando a pessoa realmente não estiver doente. Se uma pessoa recebe um resultado …

Continue lendo Resposta desafio do exame médico e probabilidades

A Escadaria da Causalidade

“Correlação não implica causalidade” é uma das frases mais importantes que podemos ouvir de um curso (bom) de estatística. Mas, o que é exatamente a causalidade? “Se eu chutar uma parede, meu pé vai doer”, é um exemplo simples de causalidade. Porém, na prática, nem sempre pode ser tão simples estabelecer uma relação causal. O …

Continue lendo A Escadaria da Causalidade

Aleatoriedade (tarefa para pensar)

Reflexão. A aleatoriedade e o acaso podem influenciar totalmente as nossas vidas, de maneiras que muitas vezes subestimamos. Pequenas vantagens ou desvantagens, ou uma pequena intervenção da aleatoriedade, podem levar a um resultado desproporcional. Uma bola na trave. Um papel num filme de sucesso. Um encontro casual que resultou num casamento. Como utilizar a aleatoriedade …

Continue lendo Aleatoriedade (tarefa para pensar)

O problema da secretária – Solução

Formulação:Imagine que você está entrevistando candidatos para um emprego de secretária, e quer contratar o melhor possível. Há algumas regras adicionais, em relação a um processo comum: você só pode entrevistar um candidato por vez, deve tomar uma decisão imediatamente após a entrevista e não pode voltar atrás em uma decisão já tomada. Se rejeitar …

Continue lendo O problema da secretária – Solução

Acurácia, Especificidade, Precisão, F1, AUC, etc

Os termos citados acima são algumas das métricas utilizadas para avaliar modelos de machine learning, dentro do contexto de um classificador. São muitas, são confusas, e por isso mesmo, vale um post explicando a necessidade delas. Para introduzir o tema, nada melhor que Machado de Assis! No conto "O Alienista", o médico Simão Bacamarte funda …

Continue lendo Acurácia, Especificidade, Precisão, F1, AUC, etc

Limite Central

Professor, não entendi esse tal de "Teorema do Limite Central"… Realmente é um teorema chato de explicar formalmente (aliás, tudo é chato formalmente). Diz basicamente que 'as médias de amostras grandes tendem a seguir uma distribuição Normal', onde Normal refere-se à distribuição Normal ou Gaussiana. Uma explicação um pouquinho mais detalhada: se você partir de …

Continue lendo Limite Central

O jogo do Bandido de Múltiplos braços

Segue no link uma implementação lúdica, do problema do bandido de múltiplos braços. https://asgunzi.neocities.org/ArteMatematica/bandido O “one-armed bandit” é um caça-níqueis comum, chamado assim porque tem um braço só, e porque é um ladrão de recursos.  Você está em um cassino com N caça-níqueis (daí o termo, multi-armed bandit). Cada máquina tem uma probabilidade de recompensa …

Continue lendo O jogo do Bandido de Múltiplos braços

Visualização de métricas de erro: MAE, MSE, etc

Há algumas formas simples de pensar e visualizar métricas de erro como MAE, MSE, e a relação disso com mediana e média. Quem trabalha com machine learning, estatística e afins, já ouviu falar dos termos MAE (Mean Absolute Error) e o MSE (Mean Square Error). Vamos ver uma forma de interpretar ambos em relação às …

Continue lendo Visualização de métricas de erro: MAE, MSE, etc

P-Hacking

Testes de Hipóteses, com o seu famoso p-value, são métodos extremamente científicos e embasados estatisticamente para chegar a conclusões robustas, certo? Nem tanto. Há uma prática chamada p-hacking, que significa “hackear o p-value”. Há um incentivo para que autores publiquem artigos, e para artigos serem publicados, os dados devem ter validade estatística. Para tal, é …

Continue lendo P-Hacking

Qual a diferença entre o R² e R² Ajustado em regressão linear?

Qual a diferença entre o R² e R² Ajustado em regressão linear?O "R² Ajustado" é uma versão modificada do famoso R², utilizado para avaliar a qualidade de um modelo de regressão linear.O R² simples mede o quanto a variável dependente é explicada pelas variáveis independentes. Só que tem um problema. Se considerarmos só o R² …

Continue lendo Qual a diferença entre o R² e R² Ajustado em regressão linear?

Previsão de queda do Muro de Berlim e a Fórmula do Juízo Final

Seria possível, nos anos 1960, prever a queda do Muro de Berlim? Foi exatamente o que J. Richard Gott fez. E a mesma fórmula pode ser utilizada para calcular o dia do juízo final! A previsão da queda do Muro de Berlim foi baseada no Princípio Copernicano, que é a afirmação de que, na ausência …

Continue lendo Previsão de queda do Muro de Berlim e a Fórmula do Juízo Final

Você trocaria um bode por um carro? O problema de Monty Hall, e como probabilidades não são intuitivas

Introdução Imagine um programa de auditório, tipo Sílvio Santos, com três portas fechadas. Atrás de uma das portas, um belíssimo automóvel 0 Km, por trás das outras duas, um bode em cada. As três portas estão numeradas, de 1 a 3. O participante escolhe uma das três portas, digamos, a porta 1. O apresentador, fazendo …

Continue lendo Você trocaria um bode por um carro? O problema de Monty Hall, e como probabilidades não são intuitivas