Overfitting e elefantes

Overfitting é quando um modelo de aprendizado de máquina se ajusta tão bem aos dados de treinamento, mas tão bem, que captura até o ruído e as variações irrelevantes. Queremos treinar um modelo com sinal, e não com ruído. Com aumento do poder computacional, esse risco é cada vez mais presente. Temos a ilusão de …

Continue lendo Overfitting e elefantes

Otimização de softwares antivírus

Segue um pequeno exercício de otimização. Você está numa empresa brasileira de alcance nacional, responsável pela aquisição de softwares antivírus para a empresa toda. Há 30 softwares possíveis (numerados de 1 a 30) e 15 ameaças mapeadas (denominadas de A a O). Cada software é homologado a prestar somente alguns serviços, e isso é assinalado …

Continue lendo Otimização de softwares antivírus

Pequeno Experimento com Teorema do Limite Central

O Teorema do Limite Central é um dos mais importantes da Estatística: ele mostra como a aleatoriedade de pequenas partes pode resultar em um comportamento previsível quando olhamos muitas observações. Não importa como é a distribuição inicial, se você pegar a média de muitos resultados, essa média vai formar uma curva em forma de sino, …

Continue lendo Pequeno Experimento com Teorema do Limite Central

Gráfico de porcentagens

Fiz um visualizador de porcentagens interativo, em Javascript D3. No caso abaixo, para 30%. Neste caso, escolhi 75% Disponível em: https://asgunzi.neocities.org/ArteMatematica/GraficoPorcentagem

Como você modelaria um problema predador – presa?

Nunca gostei de fórmulas matemáticas. Não há nada mais desestimulante do que pegar um artigo denso, de linguagem difícil, cheio de ideias abstratas e tão compreensível quanto hieróglifos egípcios! Como entender fórmulas como as abaixo? No final das contas, uma fórmula é um modelo, uma abstração da realidade. E entender o que a fórmula tem …

Continue lendo Como você modelaria um problema predador – presa?

Definitions in data science

Repassando um diagrama bem interessante, das principais definições em data science. Engraçado que quando leio o método, vejo um desenho do que ela faz. Isso porque o que vale não é a fórmula, esta é apenas a tradução de um conceito. Exemplo, a normal, vejo a curva. Mínimos quadrados, a ideia é minimizar o erro …

Continue lendo Definitions in data science

Analytics Talks – IA Generativa

Tivemos um Analytics Talks com o Leonardo Machado, da Visagio, o time de Projetos Analíticos da #Klabin e mais de 100 expectadores. Alguns tópicos discutidos: - Estamos vivendo a era da IA Generativa, ou, de forma mais abrangente, Computação Generativa. - Para dar uma ideia do tamanho desses modelos LLM: pense em 10 terabytes de …

Continue lendo Analytics Talks – IA Generativa

K-Means

O K-Means é um algoritmo de clusterização simples e rápido.Como dividir um conjunto de dados em k grupos com base na similaridade de características?Os clusteres devem ser definidos de forma a minimizar a variância dentro dos grupos e maximizar a variância entre eles.No documento, uma explicação simples e intuitiva sobre o K-Means.É um exemplo de …

Continue lendo K-Means

Resposta do puzzle sobre probabilidades condicionais

Relembrando a pergunta. Eu tenho três moedas. A primeira tem cara dos dois lados, a segunda tem cara num lado e coroa do outro, e a terceira tem coroa dos dois lados. Digamos que eu tenha colocado as três moedas numa cartola e sorteado uma das moedas. A moeda sorteada tem cara em um dos …

Continue lendo Resposta do puzzle sobre probabilidades condicionais

Pergunta sobre probabilidades condicionais

Eu tenho três moedas. A primeira tem cara dos dois lados, a segunda tem cara num lado e coroa do outro, e a terceira tem coroa dos dois lados. Digamos que eu tenha colocado as três moedas numa cartola e sorteado uma das moedas. A moeda sorteada tem cara em um dos lados. Qual a …

Continue lendo Pergunta sobre probabilidades condicionais

Desafio da cobertura por dominós

Podemos cobrir a forma da Figura A, à esquerda, com 10 dominós (de dimensões 2 quadrados de largura por 1 de altura, podendo girar 90 graus). A Figura B é idêntica, porém tirando um quadrado de cada ponta. Não consigo cobrir completamente a Figura B com dominós. Alguém consegue? Será que é possível?

Trilha Analytics 2024

Esta semana lançamos a Trilha Analytics 2024, uma das maiores iniciativas de ensino corporativo em métodos analíticos do Brasil! Até o ano passado, as turmas tinham 40 alunos, analistas indicados pelas áreas de negócio Florestal, Papéis, Celulose e Embalagens. Este ano, resolvemos expandir para 65 alunos - dado o aumento da demanda pelo tema. Serão …

Continue lendo Trilha Analytics 2024