Prezados, muita atenção para o artigo em anexo — ele apresenta uma importante correlação entre o número de formados em Administração e o número de encanadores na Dakota do Sul.

À medida que mais pessoas concluíam o curso de Administração, observou-se um aumento repentino no número de encanadores. Seria possível que os administradores estivessem migrando para a carreira de encanador? Ou será que os encanadores estavam se especializando em gestão?
É um belo “pipeline de dados”, sem dúvidas.
Números: correlação de 0,992, R^2 = 0,983, com altíssimo grau de significância estatística (p < 0,01). O estudo foi publicado no prestigioso Journal of Occupational Osmosis, em 2025.
Em uma frase: Correlação não implica causalidade.
Como já devem imaginar, trata-se de uma correlação espúria, retirada do site Spurious Correlations, de Tyler Vigen.
O site, além de gráficos hilários, agora também oferece artigos gerados por inteligência artificial — tão bem escritos que talvez até passem por revisores desatentos em journals reais.
Este é um exemplo de “data dredging” — ou, em bom português, “picaretagem de dados”. Quando se tem acesso a um grande volume de séries temporais, é muito provável que algumas apresentem correlações elevadas por puro acaso. E daí para inventar uma explicação causal fantasiosa, é um passo.
Recomendações para evitar armadilhas estatísticas:
- Comece formulando hipóteses causais bem fundamentadas
- Defina previamente o valor limite de p (nível de significância)
- Só então realize a análise dos dados
- Conheça profundamente os processos da empresa
- Converse com quem entende da operação — os dados sozinhos não explicam tudo
Não se deixe enganar por miragens estatísticas.
Não seja um picareta dos dados!
(Obs. Eu não sabia que o spurious correlations criava papers também, grato à Larisse Loise dos Santos pela dica)
