Resposta desafio do exame médico e probabilidades

Enunciado: Um laboratório desenvolveu um teste para detectar uma doença rara. Sabe-se que a doença afeta 1% da população. O teste tem 99% de precisão para detectar a doença se a pessoa estiver realmente doente, e 90% de precisão para dar negativo quando a pessoa realmente não estiver doente. Se uma pessoa recebe um resultado …

Continue lendo Resposta desafio do exame médico e probabilidades

A Escadaria da Causalidade

“Correlação não implica causalidade” é uma das frases mais importantes que podemos ouvir de um curso (bom) de estatística. Mas, o que é exatamente a causalidade? “Se eu chutar uma parede, meu pé vai doer”, é um exemplo simples de causalidade. Porém, na prática, nem sempre pode ser tão simples estabelecer uma relação causal. O …

Continue lendo A Escadaria da Causalidade

Aleatoriedade (tarefa para pensar)

Reflexão. A aleatoriedade e o acaso podem influenciar totalmente as nossas vidas, de maneiras que muitas vezes subestimamos. Pequenas vantagens ou desvantagens, ou uma pequena intervenção da aleatoriedade, podem levar a um resultado desproporcional. Uma bola na trave. Um papel num filme de sucesso. Um encontro casual que resultou num casamento. Como utilizar a aleatoriedade …

Continue lendo Aleatoriedade (tarefa para pensar)

O problema da secretária – Solução

Formulação:Imagine que você está entrevistando candidatos para um emprego de secretária, e quer contratar o melhor possível. Há algumas regras adicionais, em relação a um processo comum: você só pode entrevistar um candidato por vez, deve tomar uma decisão imediatamente após a entrevista e não pode voltar atrás em uma decisão já tomada. Se rejeitar …

Continue lendo O problema da secretária – Solução

Acurácia, Especificidade, Precisão, F1, AUC, etc

Os termos citados acima são algumas das métricas utilizadas para avaliar modelos de machine learning, dentro do contexto de um classificador. São muitas, são confusas, e por isso mesmo, vale um post explicando a necessidade delas. Para introduzir o tema, nada melhor que Machado de Assis! No conto "O Alienista", o médico Simão Bacamarte funda …

Continue lendo Acurácia, Especificidade, Precisão, F1, AUC, etc

Limite Central

Professor, não entendi esse tal de "Teorema do Limite Central"… Realmente é um teorema chato de explicar formalmente (aliás, tudo é chato formalmente). Diz basicamente que 'as médias de amostras grandes tendem a seguir uma distribuição Normal', onde Normal refere-se à distribuição Normal ou Gaussiana. Uma explicação um pouquinho mais detalhada: se você partir de …

Continue lendo Limite Central

O jogo do Bandido de Múltiplos braços

Segue no link uma implementação lúdica, do problema do bandido de múltiplos braços. https://asgunzi.neocities.org/ArteMatematica/bandido O “one-armed bandit” é um caça-níqueis comum, chamado assim porque tem um braço só, e porque é um ladrão de recursos.  Você está em um cassino com N caça-níqueis (daí o termo, multi-armed bandit). Cada máquina tem uma probabilidade de recompensa …

Continue lendo O jogo do Bandido de Múltiplos braços

Papa, Deus e Bayes

O novo Papa Leão XIV, Robert Prevost, tem formação em matemática. E, pesquisando alguns papers, aparece o abaixo, entre outros. Este discute a prova de Deus a partir do Teorema de Bayes! Já vi publicações dizendo que é ele, outras que não, é um homônimo. Seria muita coincidência, alguém com o mesmo nome, mais ou …

Continue lendo Papa, Deus e Bayes

Visualização de métricas de erro: MAE, MSE, etc

Há algumas formas simples de pensar e visualizar métricas de erro como MAE, MSE, e a relação disso com mediana e média. Quem trabalha com machine learning, estatística e afins, já ouviu falar dos termos MAE (Mean Absolute Error) e o MSE (Mean Square Error). Vamos ver uma forma de interpretar ambos em relação às …

Continue lendo Visualização de métricas de erro: MAE, MSE, etc

P-Hacking

Testes de Hipóteses, com o seu famoso p-value, são métodos extremamente científicos e embasados estatisticamente para chegar a conclusões robustas, certo? Nem tanto. Há uma prática chamada p-hacking, que significa “hackear o p-value”. Há um incentivo para que autores publiquem artigos, e para artigos serem publicados, os dados devem ter validade estatística. Para tal, é …

Continue lendo P-Hacking

Qual a diferença entre o R² e R² Ajustado em regressão linear?

Qual a diferença entre o R² e R² Ajustado em regressão linear?O "R² Ajustado" é uma versão modificada do famoso R², utilizado para avaliar a qualidade de um modelo de regressão linear.O R² simples mede o quanto a variável dependente é explicada pelas variáveis independentes. Só que tem um problema. Se considerarmos só o R² …

Continue lendo Qual a diferença entre o R² e R² Ajustado em regressão linear?

É bom mas é ruim

Estive de férias no trabalho, uma semaninha. Contudo, fiquei preparando aulas de Estatística, porque também dou algumas aulas sobre o tema. É o típico "É bom mas é ruim". Gosto do tema, gosto de falar sobre projetos utilizando Estatística e Advanced Analytics, mas… Temos "tempo télico", que é aquele onde temos a obrigação de fazer …

Continue lendo É bom mas é ruim