Senos de inteiros

Padrões interessantes surgem, quando plotamos a função seno para números inteiros [sin(1), sin(2), sin(3), …, sin(N)].

Painel interativo aqui:
https://asgunzi.github.io/Senos-inteiros/index.html

Para N = 500, aparecem alguns hexágonos.

Para N = 1000, fica mais evidente.

Para N = 2000:

Para N= 5000:

A mesma coisa, mas com o eixo X em escala logarítmica.

Achei bonito o padrão formado, e resolvi fazer os gráficos.

Este post é baseado em artigo de John Cook, referenciado abaixo.

Veja também:

O time de 1 bilhão de euros e o funil estreito

Pep Guardiola é o técnico do Manchester City, time avaliado em 1 bilhão de euros. (Obs. 1 libra = 1,17 euros).

https://www.uol.com.br/esporte/futebol/ultimas-noticias/2021/08/17/city-lidera-lista-de-clubes-com-os-elencos-mais-valiosos-psg-e-o-3.htm

Já ouvi comentários do tipo: “com 1 bilhão de euros, até eu sou técnico”. Isso pode até ser verdade, um time desses joga praticamente sozinho. Porém, a pergunta de verdade a se fazer é exatamente a contrária.

Imagine o grupo de acionistas de um patrimônio tão enorme. A quem eles confiaram o comando do time? A um aventureiro qualquer? Ao Joel Santana? Ou ao Guardiola? Obviamente, o escolhido será quem já provou entregar resultados em alto nível.

É o mesmo para CEO de grandes empresas, posições importantes, etc…

Porém, isso cria um funil estreito: só tem a posição quem já entregou resultados, porém, para entregar resultados é preciso ter a posição.

Como o funil é estreito, salários e atenção da mídia tendem a focar nesses superstars, embora sempre haja uma equipe grande e talentosa “jogando sozinha”. Quanto mais estreito o funil, maior o destaque, é um efeito do tipo power law, o vencedor-leva-tudo.

É por isso que Guardiola é o técnico do time mais valioso do mundo, e não um aventureiro qualquer.

Veja também:

Prova visual da aproximação de raiz (a + b)

A expressão a seguir fornece uma aproximação da raiz (a + b), quando b<<a (b muito menor que a):

Dá para interpretar facilmente a aproximação, pensando em áreas.

A raiz quadrada de a é o lado do quadrado que tem área a.

Suponha que queremos a raiz de a + b, e o quadrado a seguir tenha exatamente as dimensões desejadas.

Como fazer para encontrar o valor desconhecido x?

Se a área verde é igual a b, metade dela será b/2, e essa área é aproximadamente igual a raiz(a) * x, desprezando a “quina” que não faz parte do retângulo.

Assim, temos x = b/(2*raiz(a)), e a dedução da fórmula citada.

Note que o erro equivale à parte em vermelho do diagrama.

E o erro será menor tanto quanto b for menor do que a.

Veja também:

https://ideiasesquecidas.com/laboratorio-de-matematica

Números Triangulares

Números triangulares são aqueles que formam um triângulo, fazendo jus ao próprio nome.

1

3 = 1 +2

6 = 1 +2 + 3

10 = 1 +2 + 3 + 4

Fiz uma animaçãozinha para demonstrar. Para visualização interativa: https://asgunzi.github.io/NumerosTriangulares/

Cada número triangular é a soma da progressão geométrica 1+2+3+…+N, ou seja, podemos usar a fórmula da PG para calcular um número triangular qualquer.

Vide também:

WD40 e persistência

O extremamente eficaz WD40, utilizado para lubrificar e desingripar peças, tem uma história interessante. A sigla de seu nome significa “water displacement 40”, onde o número indica a quadragésima tentativa de criar algo útil.

Ou seja, foram 39 tentativas fracassadas… porém, a que deu certo, continua com a mesma fórmula (secreta) até hoje.

Não desista na primeira tentativa, nem na segunda. Às vezes, são necessárias mais de 40.

Gancho: Todas as vezes que você utilizar o WD-40, lembre-se da história acima.

Veja também:

Prevendo Cisnes Negros (e errando a previsão)

Um dos maiores pensadores de nosso tempo é Nassim Taleb, autor de livros como “A lógica do Cisne Negro” e “Antifrágil”.

Algumas de suas ideias vêm se tornando jargão comum nos negócios e na sociedade, e como sempre acontece nesses casos, há muita gente que faz mau uso dos conceitos envolvidos. Leram e não entenderam. Ou pior, nem devem ter lido e propagam sem entender minimamente.

Dois exemplos:

1 – O meu feed de notícias mostra o seguinte artigo: “Por que eventos inesperados são chamados Cisnes Negros e como a ciência está trabalhando para predizê-los.”https://marketresearchtelecast.com/why-unexpected-events-are-called-black-swans-and-how-science-is-working-to-predict-them/151508

A chamada do artigo não faz nenhum sentido. O que Taleb afirma é exatamente o oposto: há eventos de baixa probabilidade e altíssimo impacto, impossíveis de prever.

Link da Amazon: https://amzn.to/2VvsEzX

Não é colocando mais ciência ou mais estudos econômicos que os Cisnes Negros serão previstos, muito pelo contrário: confiança cega qualquer área do conhecimento é exatamente uma das causas de eventos extremos. Taleb é extremamente crítico a economistas, acadêmicos e consultores que sabem tudo.

A chave é reconhecer que não entendemos o mundo em que vivemos, e por isso, não deixar empresas, governos e economia tomarem proporções complexas demais, alimentando futuramente um risco catastrófico.

Não por acaso, o subtítulo de um dos livros é “Como viver num mundo que não conhecemos”.

2 – Usar “Antifrágil” no sentido de autoajuda: “Seja cada dia mais antifrágil”, “Somos uma empresa antifrágil” ou algum chavão do tipo, que não faz sentido algum.

Primeiro, uma definição. Qual o oposto de frágil? Seria “robusto”?

Link da Amazon: https://amzn.to/3hlSoGJ

Porém, “robusto” tem um problema. Se “frágil” é algo que quebra após um estresse, para o “robusto” não acontece nada. O oposto de “frágil” é algo que fica melhor após o estresse, daí o termo “Antifrágil”, criado por Taleb.

Exercícios físicos são estressores, que tornam o corpo mais forte, por exemplo. Ou o sistema imunológico do corpo humano.

Outro exemplo: as pessoas, como sociedade e não como indivíduo. O indivíduo é frágil: se ele tentar empreender e fracassar, é ele que vai arcar com boletos atrasados. Já a sociedade se beneficia da fragilidade dos indivíduos, porque aqueles que conseguirem triunfar vão gerar valor para o todo continuar evoluindo.

Qual a relação do problema do Cisnes Negros e Antifragilidade? Quanto maior o Cisne Negro, quanto maior o risco, mais frágil é o sistema. Já riscos menores, distribuídos, orgânicos, são bons, porque tornam a sociedade como um todo antifrágil.

A antifragilidade não é uma frase de motivação. Muito pelo contrário. É um convite a abraçar o caos, a empreender, é um convite ao sacrifício de arriscar e assumir as consequências dos erros na própria pele.

Para fechar, algumas frases de Taleb, no seu livro “A cama de Procusto”, ao seu estilo provocador:

Link da Amazon: https://amzn.to/3A0xAMd

“É muito mais fácil enganar pessoas prometendo bilhões do que apenas milhões”

“Vi um painel com o economista Edmundo Phelps, que obteve o Nobel por escritos que ninguém leu, teorias que ninguém aplica e aulas que ninguém entende”.

“A imaginação do gênio vastamente supera seu intelecto; o intelecto do acadêmico vastamente supera a sua imaginação.

“O pior estrago é causado por pessoas competentes tentando fazer o bem; as boas melhorias são feitas por incompentes que não tentar fazer o bem”.

“Uma empresa tem muito a se preocupar quando o cabeça dela vem a público dizer que não há nada a se preocupar”.

“O que eles chamam de risco, eu chamo de oportunidade; mas quando eles dizem oportunidade de baixo risco, eu digo armadilha de perdedor”

“Para se tornar um filósofo, comece a andar bem devagar”.

“Felicidade: não sabemos como medir ou obter, porém sabemos como evitar tristeza”

“Acham que inteligência é sobre notar o que é relevante; num mundo complexo, inteligência consiste em ignorar o que é irrelevante”.

“Conhecimento é subtrativo, não aditivo – subtraímos o que não funciona, o que não fazer”.

Veja também:

Por falta de um prego

O poema “Por falta de um prego” existe há vários séculos, e mostra que o efeito composto de diversas pequenas causas pode gerar consequências gigantescas.

Por falta de um prego, perdeu-se a ferradura.

Por falta de uma ferradura, perdeu-se o cavalo.

Por falta de um cavalo, perdeu-se o cavaleiro.

Por falta do cavaleiro, perdeu-se a batalha.

E assim, o reino foi perdido.

Tudo por falta de um prego.

Em inglês, o poema chama-se “For want of a nail”.

For want of a nail the shoe was lost,
for want of a shoe the horse was lost,
for want of a horse the knight was lost,
for want of a knight the battle was lost,
for want of a battle the kingdom was lost.
So a kingdom was lost—all for want of a nail.

Alguns interpretam o poema como a necessidade de um planejamento meticuloso e atenção aos detalhes, já que um único detalhe pode fazer toda a diferença.

Gosto de ver de outra forma, complementar: não deixe faltar pregos! Estar sempre um pouquinho a favor da segurança. Nos dias de hoje, ter excesso de estoque é ruim, porém, as consequências devem ser analisadas: se faltar um prego, o efeito será pior do que ter um prego em excesso?

Para finalizar, um vídeo engraçado, ilustrando o efeito borboleta.

Ideias técnicas com uma pitada de filosofia: https://ideiasesquecidas.com/

Euclides e a prova visual dos primos

Um dos resultados mais belos da Matemática é a prova de Euclides, sobre a infinitude dos números primos, escrita há mais de 2.300 anos atrás.

Um número é primo se pode ser dividido apenas por 1 e por si mesmo, sem deixar resto.

A prova é por contradição. Primeiro Euclides supôs que o número de primos fosse finito: {p1, p2, …, pN}.

Para ilustrar, suponha que o conjunto de todos os primos seja formado apenas pelos três primeiros, {2, 3, 5}:

A seguir, Euclides afirmou que existe pelo menos um primo maior do que todos os primos finitos conhecidos: p1p2…*pN +1, ou seja, o produto de todos os primos + 1. Tal número não é divisível por nenhum dos primos anteriores, já que restaria 1 na divisão.

No caso do exemplo, tal número seria igual a 2 * 3 * 5 + 1 = 31.

Visualizando, o novo primo não é divisível por 2:

Nem por 3:

Nem por 5:

Sempre vai restar 1 na divisão.

Portanto, como sempre é possível encontrar esse primo adicional para um conjunto de primos finito, a conclusão é a de que o conjunto dos números primos é infinito.

Veja também:

https://ideiasesquecidas.com/2021/08/25/poligonos-e-conexoes/

As piores frases de Nietzsche

O filósofo alemão Friedrich Nietzsche (1844-1900), é, segundo suas próprias palavras, “Dinamite pura”. É um escritor cuja pena é um martelo, que usa para derrubar ídolos, e por isso, é amado e odiado com a mesma intensidade. Descubra o motivo, na coletânea a seguir.

Atenção: conteúdo explosivo.

Que importa que a vida seja longa! Que guerreiro quer ser poupado?

Deus está morto!

Não enfrentes monstros sob pena de te tornares um deles. Se contemplas o abismo, a ti o abismo também contempla.

O ser humano é um erro de Deus? Ou Deus é um erro do ser humano?

Todos os criadores são em verdade duros. E venturança precisa parecer-vos imprimir a vossa marca sobre milênios como sobre cera.

Totalmente duro solitariamente é o que há mais nobre. Esta nova tábua, ó meus irmãos, coloco sobre vossas cabeças: tornai-vos duros!

Supondo que a verdade seja uma mulher – não seria bem fundada a suspeita de que todos os filósofos entendem pouco de mulheres?

Com o risco de desagradar a ouvidos inocentes eu afirmo: o egoísmo é da essência de uma alma nobre; aquela crença inamovível de que, a um ser “tal como nós”, outros seres têm de sujeitar-se por natureza e a ele sacrificar-se.

Toda elevação do homem foi, até o momento, obra de uma sociedade aristocrática – e assim será sempre: de uma sociedade que acredita numa longa escala de hierarquias e escravidão em algum sentido.

A casta nobre sempre foi, no início, a casta de bárbaros: sua preponderância não estava primariamente na força física, mas na psíquica.

O olhar do escravo não é favorável às virtudes do poderoso: é cético e desconfiado.

O amor ao próximo é sempre algo secundário, em parte convencional e ilusório, em relação ao temor ao próximo.

Sobre a convicção do filósofo: chegou o asno, belo e muito forte.

Demonstramos profunda incompreensão do animal de rapina e do homem de rapina (César Bórgia, por exemplo), incompreensão da natureza, ao procurar por algo doentio no âmago desses mais saudáveis monstros.

Sempre, desde que existem homens, houve também rebanhos de homens (clãs, comunidades, tribos, povos, Estados, igrejas) e sempre muitos que obedeceram, em relação ao pequeno número dos que mandaram.

O surgimento de Napoleão é a história da superior felicidade que este século alcançou em seus homens e momentos mais preciosos.

Independência é algo para poucos: é prerrogativa dos fortes. Quem procura ser independente sem ter a obrigação disso, demonstra que é não apenas forte, mas temerário além de qualquer medida.

É inevitável que nossas mais altas intuições pareçam bobagens, delitos, quando chegam indevidamente aos ouvidos daqueles que não são feitos para elas.

As religiões soberanas estão entre as maiores causas que mantiveram o tipo homem num degrau inferior. Destroçar os fortes, debilitar as grandes esperanças, tornar suspeita a felicidade da beleza, dobrar tudo que era altivo.

Um povo é um rodeio que a natureza faz para chegar a 6 ou 7 homens.

Tudo que é grande talvez tenha sido loucura no início.

Ouço, com prazer, que o nosso Sol se dirige velozmente à constelação de Hércules: espero que o homem desta Terra siga o exemplo do Sol.

O homem que aspira a uma coisa grande considera todo aquele que lhe cruza o caminho, ou como um meio, ou como um obstáculo, ou descanso temporário.

Os maiores acontecimentos e pensamentos são os últimos a serem compreendidos. As gerações que vivem no seu tempo não vivenciam tais acontecimentos – passam ao largo deles.

Todo pensador profundo tem mais receio de ser compreendido do que de ser mal compreendido. Neste caso talvez sofra sua vaidade; mas naquele sofrerá seu coração.

A loucura é algo raro em indivíduos – mas em grupos, partidos, povos e épocas é a norma.

Tenho uma predileção por perguntas para as quais ninguém hoje tem a coragem, a coragem para o proibido.

O que é bom? Tudo o que eleva o sentimento de poder, a vontade de poder, o próprio poder no homem.
O que é mau? Tudo o que vem da fraqueza.
O que é felicidade? o sentimento de que o poder cresce, de que uma resistência é superada.

Os fracos e malogrados devem perecer: primeiro princípio de nosso amor aos homens.

O cristianismo tomou partido de tudo o que é fraco, baixo, malogrado, transformou em ideal aquilo que contraria os instintos de conservação da vida forte; corrompeu a própria razão das naturezas mais fortes de espírito, ensinando a perceber como pecaminosos os valores supremos do espírito.

O cristianismo é chamado de religião da compaixão. A compaixão se opõe aos afetos que elevam a energia do sentimento de vida: ela tem efeito depressivo.

A compaixão se opõe à lei da evolução, que é a lei da seleção.

A compaixão é a prática do niilismo. É instrumento multiplicador da miséria e conservador de tudo o que é miserável – a compaixão persuade ao nada.

Nem a moral nem a religião, no cristianismo, têm algum ponto de contato com a realidade. São causas imaginárias (Deus, alma, livre-arbítrio) e efeitos imaginários (pecado, salvação, graça, castigo). Um comércio entre seres imaginários (Deus, espíritos). Um mundo de pura ficção, que falseia, desvaloriza e nega a realidade.

Eles não se denominam fracos, denominam-se “bons”. Deus-de-gente-pobre, Deus-de-pecadores, Deus-de-doentes.

Cristão é o ódio ao espírito, ao orgulho, coragem, cristão é o ódio aos sentidos.

Quanto às três virtudes cristãs, fé, amor e esperança, eu as denomino três espertezas cristãs.

O conceito de Deus falseado, o conceito de moral falseado. Os sacerdotes traduziram em termos religiosos o próprio passado de seu povo.

Simplificaram a psicologia, reduzindo-a à fórmula de “obediência ou desobediência a Deus”.

O sacerdote formula até as taxas a lhe pagar, não esquecendo os mais saborosos pedaços da carne, pois o sacerdote é um comedor de bisteca.

Deus perdoa quem faz penitência – em linguagem franca: quem se submete ao sacerdote.

Nada de conceito de “gênio” tem algum sentido no mundo de Jesus. Falando com o rigor do fisiológico, caberia uma outra palavra – a palavra “idiota”.

A palavra “cristianismo” é um mal-entendido. No fundo, houve apenas um cristão, e ele morreu na cruz. O “evangelho” é o oposto do que ele viveu, um “disangelho”.

Paulo era o gênio em matéria de ódio, na lógica implacável do ódio. Simplesmente riscou o ontem, inventando uma história. Falseou a história de Israel para que ela aparecesse como pré-história: todos os profetas falaram do seu “Redentor”.

O cristianismo é a revolta de tudo o que rasteja no chão contra aquilo que tem altura: o evangelho dos “pequenos” torna pequeno.

Que resulta disso? Que convém usar luvas ao ler o Novo Testamento.

O sacerdote conhece apenas um grande perigo: a ciência – a sadia noção de causa e efeito.

O pecado foi inventado para tornar impossível a ciência, a cultura, toda elevação e nobreza do homem; o sacerdote domina mediante a invenção do pecado.

O bem-aventurado não é provado, mas apenas prometido: a bem-aventurança é ligada à condição de “crer” – a pessoa deverá ser bem-aventurada porque crê.

A fé não desloca montanhas, mas coloca montanhas onde elas não existem.

Não nos enganemos: grandes espíritos são céticos. Zaratustra é um cético.

A necessidade da fé, de um sim ou não, é uma necessidade de fraqueza.

A “Lei”, a “vontade de Deus”, tudo apenas palavras para as condições sob as quais o sacerdote chega ao poder e o sustenta.

As convicções são inimigos mais perigosos da verdade do que as mentiras.

A desigualdade dos direitos é a condição para que haja direitos.

Uma cultura elevada é uma pirâmide. Pode erguer-ses apanas num terreno amplo, tem por pressuposto uma mediocridade forte, sadiamente consolidada.

O cristianismo foi o vampiro do Império Romano.

Eu condeno o cristianismo, faço à Igreja cristã a mais terrível das acusações que um promotor já teve nos lábios. Ela é, para mim, a maior das corrupções imagináveis.

A Igreja cristã nada deixou intacto com seu corrompimento, ela fez de todo valor um desvalor, de toda verdade uma mentira, de toda retidão uma baixeza de alma.

No mundo há mais ídolos do que realidades.

Este pequeno escrito é uma declaração de guerra, não se trata de ídolos contemporâneos, mas de ídolos eternos.

Posso fazer perguntas com o martelo e, talvez, ouvir como resposta aquele famoso som oco que fala das entranhas infladas – quão agradável para aquele que possui ouvidos por trás dos ouvidos, ante ao qual precisamente aquilo que gostaria de permanecer em silêncio, tem de ser ouvido alto e em bom tom.

Sócrates e Platão são sintomas de declínio, instrumentos da dissolução grega.

Sócrates pertencia ao povo mais baixo: Sócrates era plebe. Sabe-se inclusive quão feio ele era. Os antropólogos entre os criminalistas nos dizem que o típico criminoso é feio: monstro de aspecto, monstro de alma.

Em tudo Sócrates é exagerado, bufão, caricatura, e oculto, de segundas intenções, subterrâneo.

Com Sócrates, o gosto grego se modifica em favor da dialética. O gosto aristocrático é vencido com isso; a plebe ascende ao primeiro plano com a dialética.

Sua apavorante feiúra o exprimia para todos os olhos: ele fascinou ainda mais intensamente como resposta, como aparência de cura para esse caso.

Outra idiossincrasia dos filósofos não é menos perigosa: ela consiste em confundir o último e o primeiro. Eles põem no início, como início, aquilo que vem no final – infelizmente!

A doutrina da vontade foi essencialmente inventada com a finalidade de punir, isto é, de querer encontrar um culpado.

O cristianismo é uma metafísica de carrasco.

Conhece-se minha exigência ao filósofo de colocar-se para além do bem e mal. Não existem absolutamente fatores morais. Moral é apenas uma interpretação de certos fenômenos, uma interpretação equivocada.

Em todas as épocas, se quis “melhorar” os seres humanos, a isso se chamou moral.

Da escola de guerra da vida – O que não me mata me fortalece.

Ajuda-te a ti mesmo, e então todos ainda te ajudarão. Princípio do amor ao próximo.

Quão pouco se precisa para a felicidade! O som de uma gaita de fole. A vida seria um erro sem música.

Tu és autêntico? Ou apenas um ator?

Procurei pelos grandes seres humanos, e sempre encontrei apenas os macacos do seu ideal.

Fontes e Link da Amazon:

O Anticristo: https://amzn.to/38DgMP5

Assim falou Zaratustra: https://amzn.to/3jLkg8S

Crepúsculo dos ídolos: https://amzn.to/3tcz2bM

Além do bem e do mal: https://amzn.to/3DOxXvJ

Falsos positivos e a Regra de Bayes

Em 2009, uma agência de saúde americana recomendou algo contra a intuição: que mulheres na faixa de 40 anos não fizessem exame de mamografia anualmente, e sim, a cada 2 anos.

O exame parece ter alta eficácia: se a mulher tem câncer de mama, o exame dá positivo em 80% dos casos. Se ela não tem câncer, dá falso positivo em 10% dos casos.

Como explicar tal decisão? Via a regra de Bayes.

Segundo estatísticas americanas, câncer de mama atinge 0,4% das mulheres nesta faixa etária.

Ou seja, de 10.000 mulheres, 40 têm, em média, e 9960 não.

Fazendo as contas e jogando tais informações na tabela:

Ou seja, se forem feitos 10.000 exames, 1.028 darão positivo, na média.

O número de falsos positivos é extremamente maior do que o de verdadeiros positivos.

Mesmo se o seu exame deu positivo, há apenas uma chance de 32/1028 ~ 3% de ser câncer de mama de verdade.

Como os malefícios (preocupação, necessidade de realizar exames adicionais) eram muito superiores aos benefícios, a recomendação citada, de fazer o exame a cada 2 anos.

Porém, este tipo de tema é sempre polêmico, e a regra de Bayes pode ser atualizada a cada nova informação (digamos, melhoria na qualidade dos exames).

A regra de Bayes, formalmente, envolve probabilidades condicionais:

Probab. de ter câncer, dado que o exame deu positivo = prob. do exame dar positivo dado que tem câncer de verdade x prob de ter câncer de verdade / prob da mamografia dar positivo.

Isso dá (0,8 * 0,004) / (0,8 * 0,004 + 0,1 * 0,996) = 0,03

Porém, eu gosto mais de entender o exemplo do que decorar essa fórmula confusa.

Dados baseados no livro “Theory that would never die”, de Sharon McGrayne.

https://amzn.to/3zHXPqt

Veja também:

Certificado – Quantum Excellence

Compartilhando o Certificado de Quantum Excellence da IBM, para quem passou pelo Summer School deste ano.

Vide comentários sobre essas duas semanas de treinamento aqui: https://medium.com/arnaldo-gunzi-quantum/comments-on-qiskit-summer-school-2021-quantum-machine-learning-4ff5523c6761

Outro post que pode ser de interesse: https://medium.com/arnaldo-gunzi-quantum/how-to-get-the-qiskit-developer-certificate-8dcd3b31fcb0

Agradeço a todos pela ajuda e suporte de sempre!

Como (não) fraudar dados e falar sobre honestidade

Dan Ariely é um palestrante internacionalmente conhecido, autor de best seller sobre economia comportamental, figura carimbada em TED talks e tem até série na Netflix. Há alguns dias, pesquisadores investigativos publicaram evidências fortes de que um de seus estudos é fruto de fraude.

Como o autor de “A (honesta) verdade sobre a desonestidade” pode ter ele mesmo fabricado dados e conclusões? Ele e os demais envolvidos afirmam que também não sabiam da manipulação.

Independente ou não de má fé, sua imagem fica extremamente arranhada.

Vale muito a pena entender a análise investigativa completa. Foi um trabalho de “Sherlock Holmes” de informação, publicado no blog Data Colada: https://datacolada.org/98

Segue um resumo:

  • A tese de Ariely é de que assinar formulários prometendo honestidade antes de preencher os dados faz as pessoas serem mais honestas do que assinar só no final.

  • Essa tese levou diversos governos e empresas a mudarem seus formulários. O problema é que a conclusão não conseguiu ser replicada em estudos similares, o que levou os próprios autores a alertarem sobre o fato, e publicarem os dados crus do estudo original, de 2012.

  • Os dados originais eram de uma seguradora, e os clientes informavam a milhagem dos carros segurados (13.488 registros).

  • Uma distribuição comum de milhagem segue uma normal, já a distribuição de parte dos dados era mais parecida com uma uniforme, que pode ser facilmente gerada com um ‘randbetween’ do Excel.
(Figura do The Economist, sobre o artigo citado)
  • Todos os carros que apresentavam distribuição uniforme tinham valor abaixo de 50.000 milhas – o valor máximo foi 49.997. É extremamente implausível que uma distribuição até 50 mil tenha alta frequência, e não haja nenhum valor maior (ou seja, foi algo como um ‘randbetween 50.000’). Os investigadores também garantem que não teve um corte para gerar o gráfico, são os dados brutos que estão estranhos mesmo.

  • Quando uma pessoa preenche um formulário desses, ou ela realmente consulta o odômetro e anota certinho, ou dá uma arrendondada de cabeça. A frequência de números arredondados, terminando em zero, tende a ser maior. Nas bases do próprio estudo, uma base realmente tinha maior frequência em números terminando em 0. Porém, outra base tinha igual frequência em todos os dígitos (de novo, o randbetween é uma explicação fácil).
Estudo do site Data Colada
  • A fonte utilizada na tabela estava diferente, como explica este resumo da revista The Economist, baseada no artigo.
Figura da revista The Economist, sobre o artigo

Não dá para afirmar que Ariely propositalmente manipulou dados, mas algo que ele deveria ter feito, minimamente, era analisar a consistência dos mesmos.

Algumas lições, para quem trabalha com dados:

1) Nunca, de forma alguma, crie informações falsas.

2) Tenha sempre as bases de dados e o racional auditáveis.

3) Conheça bem as informações que tem, faça checagens de consistência.

Por fim, uma ótima reflexão de Sílvio Meira. Os dados não são o “novo petróleo”. Estão mais para “novo urânio”. Isso porque os dados devem ser tratados, refinados, e atingir massa crítica para gerar valor, e o descarte é um perigo, para o negócio e para o ecossistema.

Links:

https://www.timesofisrael.com/claims-swirl-around-academic-ariely-after-honesty-study-found-to-be-dishonest/amp/

https://www.economist.com/graphic-detail/2021/08/20/a-study-on-dishonesty-was-based-on-fraudulent-data

https://www.economist.com/graphic-detail/2021/08/28/how-data-detectives-spotted-fake-numbers-in-a-widely-cited-paper