Evolução e dicionários

O Dicionário Aurélio da Língua Portuguesa tem mais de 2000 páginas, onde mais de 150 mil verbetes se espremem, impressos em letras pequenas.

Dicionário_Aurélio_da_Língua_Portuguesa.jpg

Quando eu era criança, eu achava que os professores de língua portuguesa sabiam todas as palavras do dicionário.

Mas a verdade é que ninguém sabe todas as palavras do dicionário, e ninguém precisa saber.


Vejamos quantas palavras têm alguns dicionários:
Dicionário Aurélio: 150 mil palavras
Grande Dicionário da Língua Portuguesa: 306 mil verbetes
Dicionário Houaiss: 228 mil verbetes
Dicionário Oxford de Inglês: 290 mil verbetes
Dicionário Larousse da Língua Francesa: 93 mil verbetes
grande-dicionário-da-língua-portuguesa-o-antes-e-o-depois-nova-edição-atualizada.jpgdicionario
Dizem que precisamos saber umas 15 mil palavras para falar fluentemente alguma língua, qualquer seja. O que acontece na prática é que, com muito menos palavras, digamos umas 5 mil palavras, já conseguimos entender muita coisa do contexto e formar combinações de palavras.

Mas se usamos 15 mil palavras, porque tem 300 mil palavras no dicionário?

Nas línguas ocidentais temos tantas palavras, mas somente 26 letras: a, b, c, etc. Mas quando se estuda uma língua como o chinês, há uma quantidade assustadora de caracteres: pelo menos 20 mil no chinês, 10 mil no japonês.

wallpaper_kanji_training_grade_2_1080p_by_palinus-d87nev3.jpg

De novo, não é necessário conhecer tudo. Sabendo uns 3 mil caracteres é suficiente para ser fluente (não significa que seja fácil decorar 3 mil caracteres).


Distribuição Exponencial
Saber 10% das palavras e 10% dos caracteres existentes indica que as línguas têm uma distribuição exponencial, um Pareto. Isto significa que uma pequena porcentagem das palavras responde por quase todo o uso cotidiano da linguagem. Poucos detêm tudo, enquanto muitos nada têm. É igual à economia, queiram ou não os socialistas utópicos.


Mas porque existem 300 mil palavras? Um palpite: Evolução.

A humanidade surgiu há uns 500 mil anos, e a linguagem é uma forma de comunicar a realidade numa comunidade. As palavras moldam o mundo em que vivemos, e têm que ser úteis hoje, agora.

Novas palavras surgem a cada vez que há uma nova necessidade. Ou a cada pequeno grupo de pessoas que têm uma necessidade específica. Ou a cada vez que há troca de ideias entre culturas diferentes.

Assim como na evolução das espécies, novas palavras surgem a todo momento. Algumas “pegam”, outras não, numa seleção natural. As palavras que usamos hoje não necessariamente serão usadas amanhã. As palavras antigas são descartadas da linguagem, no máximo se transformam num verbete esquecido num dicionário.


O nosso DNA também contém muitas palavras esquecidas. Cientistas estimam que 98 % do nosso DNA não serve para nada. É o que eles chamam de “junk DNA”. Talvez estes sejam pedaços de código que um dia serviram para alguma coisa, mas pela evolução foram deixados de lado em algum momento. Ou talvez nunca tenham servido para nada, mas é muito mais difícil subtrair algo que está pronto e rodando, do que simplesmente acrescentar uma funcionalidade a mais.
maxresdefault.jpg
Para os que escrevem códigos computacionais, a mesma coisa. Se um software evolui, ele vai deixar uma porção de “código legado”. Milhares de linhas de código ineficiente ou inútil, mas que um dia serviram para alguma coisa.
O tradeoff é o seguinte. Como tudo evolui, sempre surge a necessidade de alguma mudança, adequação, nova necessidade. Para fazer um puxadinho do sistema que está funcionando, o desenvolvedor vai gastar umas 40 horas. Para recomeçar tudo do zero, tornando todo o sistema o mais eficiente possível, o mesmo desenvolvedor vai demorar umas 500 horas, isso se não causar outros problemas.
Este mesmo comportamento é válido para as ideias, músicas (quantas músicas existem e quantas conhecemos?), filmes (quantos atores existem e quantos conhecemos?) e para quase tudo o que interessa neste mundo exponencial.

A linguagem ótima
Imagine que um acadêmico utópico invente uma linguagem otimizada. Somente as 15 mil palavras mais usadas, com regras gramaticais simples. E que o mundo inteiro adotasse essa linguagem: todos os outros dicionários de todas as línguas seriam apagados para sempre. O que aconteceria?
A sociedade não deixa de evoluir. Novos fenômenos teriam que ser descritos por novas palavras. Sei lá, um bando de pessoas criam uma religião chamada “barraquismo”, onde a missão deles é morar em barracas. E o mestre desta seita não é uma pessoa comum, não é um professor. É um “magnum barracão”.
2015-03-19-1426803829-9735139-8f524af8ef2b50a4dab24786229c28c11.jpg
A tecnologia não deixa de evoluir. Certamente novas palavras surgiriam para descrever novas empresas, ideias, técnicas. Digamos, um wi-fi por satélite é um “sat-fi”.
As coisas são diferentes de um lugar para o outro. O pãozinho do Brasil é diferente do pãozinho do Tibet. Como diferenciá-los se o nome for o mesmo?
Ou seja, mesmo que a linguagem ótima universal tenha 15 mil palavras, a linguagem real sujeita à evolução vai criar mais e mais palavras com o tempo, até voltar para as 300 mil palavras e infindáveis dialetos do nosso mundo!
Portanto, não precisamos saber todas as palavras do dicionário. Devemos saber usar o dicionário, saber que a linguagem é dinâmica e que podemos criar novas palavras e novos mundos através dela.

https://pt.wikipedia.org/wiki/Dicion%C3%A1rio_Aur%C3%A9lio

http://www.streetsmartlanguagelearning.com/2013/02/how-many-words-does-average-native.html

Fontes: dicionarioegramatica.com.br

How much of our DNA is junk?

A sociedade limitada

Na história da humanidade, há uma série de inovações que permitiram um “salto” evolutivo. Inovações não só de produtos, mas de serviços e ideias também.

 

A invenção da sociedade limitada, nos meados dos anos 1850, foi uma dessas mudanças de mentalidade invisíveis que provocaram uma revolução social.

ApertoMae

 

A Sociedade de Responsabilidade Limitada é a dissociação da empresa com o indivíduo. A empresa é uma entidade que tem um nome, um CNPJ, e pode responder judicialmente por alguma coisa. Os indivíduos que detém o controle da empresa têm cotas de propriedade. E os indivíduos são independentes da organização. Os indivíduos têm seus próprios nomes, CPFs e vidas.

 

Nem sempre foi assim. Em tempos antigos, se uma empresa falisse, o dono da empresa tinha que arcar com o prejuízo, nem que fosse vendendo a sua casa e vendendo os seus bens pessoais, incluindo filhos. Portanto, empreender era algo de risco muito alto, capaz de arruinar não só a empresa, mas o indivíduo e a sua família.

 

Um exemplo claro é o Código de Hamurabi, de 1700 aC.

“Se um construtor edificou uma casa para um Awilum, mas não reforçou seu trabalho, e a casa que construiu caiu e causou a morte do dono da casa, esse construtor será morto”. (Imagina esta regra para as construtoras brasileiras da Lava-Jato)
 

Esta regra do indivíduo se responsabilizar pela empresa pode até parecer justa, a princípio. Mas, como os riscos são muito altos, envolvendo até a própria vida e da família, o efeito causado é que pouquíssimas pessoas, principalmente as mais honestas, se meteriam a empreender. Seria um vácuo de empreendedores, empresas e inovações. Muito pior, em termos globais.

 

 
A grande diferença foi a mentalidade das pessoas. Poder reconhecer estes indivíduos virtuais como se fossem indivíduos reais.

 

Hoje em dia, uma empresa como a Renault tem seus lucros, tem seus custos, encargos financeiros, impostos, e pode responder na justiça, mesmo sendo um indivíduo fictício. E também pode sobreviver por centenas de anos, vivendo mais do que os seus criadores.

 

As ideias aqui descritas foram recontadas a partir do excelente livro “Sapiens – Uma breve história da humanidade”, que já teve outra de suas ideias descritas aqui: https://ideiasesquecidas.wordpress.com/2015/05/03/preguicas-gigantes-tatus-gigantes/

 

Apendicite, Internet Explorer e Dinossauros

dinossauro

Qual a semelhança entre o código genético do ser humano e o Internet Explorer?

O ser humano tem uma série de “defeitos de fabricação”. Por exemplo, o apêndice é uma bolsa que fica perto do intestino, e que não serve para nada. Aliás, serve sim. Serve para inflamar e causar apendicite, que se não for tratada, pode até matar.


 

Qual o motivo do apêndice existir?

Dizem que o apêndice já serviu para digerir celulose, num passado muito distante.
 

O apêndice é um reminiscente evolutivo: algo que serviu para alguma coisa no passado, hoje não serve mais, porém continua existindo.

 
Há outros reminiscentes evolutivos além do apêndice. O último osso da coluna, chamado coccis, que é a base para um rabo, uma cauda.


 

Evolução X Criação

Esses defeitos tomam espaço do código genético e desviam um pouco da energia da pessoa, mas não são defeitos fatais. A pessoa que não tem apêndice não tem vantagem nenhuma sobre outra que não tem. Então, dá mais trabalho reescrever o código genético do que deixar assim mesmo.
 

A existência destes reminiscentes evolutivos é uma das evidências de que a evolução realmente existiu, segundo o paleontólogo Stephen Jay Gould. Afinal, se houvesse um criador onipotente, por que ele criaria pessoas com apêndice? Por que criaria galinhas com asas se elas não voam? Por que um ser perfeito criaria seres com defeitos?

 

download (13)


 

Reminiscentes biológicos e Código Legado

Por outro lado, no mundo da computação acontece exatamente a mesma coisa, só que com um nome diferente: código legado.

 
Todo sistema de computador é desenvolvido a partir de um código de programação. Mas sistemas são entes dinâmicos, vivos. Estão sempre evoluindo: incorporando novas ideias, novas tecnologias. Muitas dessas novas ideias não dão certo, e o programador acaba tendo que reescrever o código ou fazer uma adaptação no código existente. Um monte de código adaptado com “reminiscentes” de ideias antigas é um”código legado”.

 


Internet Explorer e Dinossauros

 

O Internet Explorer é um bom exemplo. Um browser antigamente só tinha que ler html. Depois, passou a ler algumas linguagens de programação como Javascript e Vbscript. Depois, a suportar soluções como Flash Player. Depois, novas versões de html, e assim sucessivamente. Além disso, tem que garantir a compatibilidade entre páginas feitas para versões anteriores do IE e do Windows. A cada nova ideia a mais, mais um “puxadinho” no código.
 

Acabou que o Internet Explorer ficou cheio de código legado, o que o tornava pesado e ineficiente. O IE virou um dinossauro, dando espaço para o surgimento de concorrentes.

download (14)


 

Recomeçar do zero
Até que a Microsoft resolveu simplesmente recomeçar tudo do zero. Reescreveram tudo, criando o Microsoft Edge, nova versão do browser. Dizem que removeram 220.000 linhas de código do IE antigo. http://gizmodo.uol.com.br/microsoft-edge-oficial/

http://www.theinquirer.net/inquirer/news/2407685/microsoft-edge-dumps-220-000-lines-of-code-including-activx-and-vml

 
Analogamente, o DNA, código genético dos seres vivos, tem um monte de lixo: um monte de código que não se sabe para que serve, mas está lá no DNA. É o “junk DNA”. No ser humano, isto chega a 98% do DNA. Mas não se sabe exatamente se é mesmo lixo ou se serve para alguma coisa que não foi descoberta ainda. https://en.wikipedia.org/wiki/Noncoding_DNA

 
A diferença é que não dá para “resetar” o ser humano e recomeçar do zero. A menos que caia um meteoro que destrua tudo. Opa! Será que Deus é um programador que achou os dinossauros ineficientes e resolveu recomeçar tudo do zero?

 

Arnaldo Gunzi
Ago 2015

 

O Meme de computador

O que é (ou deveria ser) um meme?

A grande maioria das pessoas acha que um “meme” é uma figura com alguma frase escrita sobre ela, com alguma finalidade humorística.

images

 

Mas um “meme” é muito mais do que isto. A palavra “meme” foi criada pelo cientista Richard Dawkins, em seu livro de 1976, “O gene egoísta”.

 


Richard Dawkins é grande defensor do Darwinismo: a ideia de que as espécies animais passam pelo processo de evolução natural, em que as espécies mais bem adaptadas ao ambiente sobrevivem.
 

Uma dos grandes avanços da ciência foi a descoberta do DNA. É através da informação genética que as características dos pais são transmitidas a seus filhos. Está tudo codificado nos genes: cor do cabelo, formato das mãos, altura, etc.

gene

A ideia é que um “gene” transmite uma unidade de informação biológica do pai para o filho.
 

Já um “meme” é algo que transmite uma unidade de informação cultural de uma pessoa para outra.
 

Portanto, uma ideia que é transmitida de uma pessoa à outra é um meme: “Se é Bayer é Bom”, “rouba mas faz”, “pior que está, não fica”, “aqui é Corinthians”. São ideias virais, e o que é transmitido pelo “vírus” é o “meme”.
 

Esta ideia memética pode ser uma música, uma fofoca, uma ideia, uma figura, um vídeo, e até um… meme de computador!


 

Todos nós recebemos e transmitimos um monte desses memes de informação ao longo do dia. Somos uma composição dos memes que chegam a nós e que permitimos que sejam incorporados à nossa personalidade.

 
Portanto, um “meme de computador” é um “meme”, mas um “meme” engloba um conceito muito maior do que o de “meme de computador”.

 

Arnaldo Gunzi

Jul 2015