Pequeno Experimento com Teorema do Limite Central

O Teorema do Limite Central é um dos mais importantes da Estatística: ele mostra como a aleatoriedade de pequenas partes pode resultar em um comportamento previsível quando olhamos muitas observações.

Não importa como é a distribuição inicial, se você pegar a média de muitos resultados, essa média vai formar uma curva em forma de sino, a famosa curva Normal (ou Gaussiana):

Isso é útil em muitas áreas da ciência e da engenharia, porque significa que podemos fazer previsões sobre o comportamento de sistemas complexos, mesmo que cada parte individual do sistema seja imprevisível.

Por exemplo, vamos partir de uma curva bastante assimétrica.

Imagine uma moeda, que pode dar cara ou coroa. 

Moeda de 1 real: Mais de 18.979 vetores e artes vetoriais ...

Porém, é uma moeda viciada, que dá coroa 90% das vezes e cara 10% das vezes. 

Seu histograma de resultados será:

Como tal curva pode tender a uma normal?

Bom, imagine que vamos sortear a mesma moeda viciada 200 vezes, e somar os resultados (Coroa = 0; Cara = 1).

Vai dar zero 90% das vezes, porém dará 1 de vez em quando.

A soma deste experimento específico resultou na soma igual a 20. Se forem realizados mais experimentos como este, outros resultados serão obtidos.

O histograma do resultado dos experimentos vai tender a uma normal, quanto maior for o número de experimentos.

A planilha Excel anexa mostra a derivação feita. 

Em complemento, é possível fazer código similar em Python, com a vantagem de investigar facilmente um número maior de experimentos.

import random

import matplotlib.pyplot as plt

n_experimentos = 100

s_sorteios = 200

p = 0.9 #Probabilidade de dar 0

experimentos = []

for n in range(n_experimentos):

    soma =0    

    for s in range(s_sorteios):

        sorteio = random.random()

        if sorteio < p:

            resultado =0

        else:

            resultado =1

        soma += resultado    

    experimentos .append(soma)

plt.hist(experimentos ,bins = 10)

plt.title("Histograma de Resultados")

plt.xlabel("Valor")

plt.ylabel("Frequência")

Para o código acima, temos o resultado abaixo (nota, devido ao sorteio aleatório, será diferente toda vez que rodar). Uma normal meio feinha, assimétrica.

Para um número bem grande de experimentos (10.000), será mais próximo a uma Normal.

Por fim, o Teorema do Limite Central ratifica a importância da variável aleatória Normal, que é onipresente em distribuições como altura e peso de uma população, e aplicado em testes de hipótese e controle de qualidade.

Autor: Arnaldo Satoru Gunzi

Revisão: Ernée Kozyreff Filho

Deixe um comentário