Evolução e dicionários

O Dicionário Aurélio da Língua Portuguesa tem mais de 2000 páginas, onde mais de 150 mil verbetes se espremem, impressos em letras pequenas.

Dicionário_Aurélio_da_Língua_Portuguesa.jpg

Quando eu era criança, eu achava que os professores de língua portuguesa sabiam todas as palavras do dicionário.

Mas a verdade é que ninguém sabe todas as palavras do dicionário, e ninguém precisa saber.


Vejamos quantas palavras têm alguns dicionários:
Dicionário Aurélio: 150 mil palavras
Grande Dicionário da Língua Portuguesa: 306 mil verbetes
Dicionário Houaiss: 228 mil verbetes
Dicionário Oxford de Inglês: 290 mil verbetes
Dicionário Larousse da Língua Francesa: 93 mil verbetes
grande-dicionário-da-língua-portuguesa-o-antes-e-o-depois-nova-edição-atualizada.jpgdicionario
Dizem que precisamos saber umas 15 mil palavras para falar fluentemente alguma língua, qualquer seja. O que acontece na prática é que, com muito menos palavras, digamos umas 5 mil palavras, já conseguimos entender muita coisa do contexto e formar combinações de palavras.

Mas se usamos 15 mil palavras, porque tem 300 mil palavras no dicionário?

Nas línguas ocidentais temos tantas palavras, mas somente 26 letras: a, b, c, etc. Mas quando se estuda uma língua como o chinês, há uma quantidade assustadora de caracteres: pelo menos 20 mil no chinês, 10 mil no japonês.

wallpaper_kanji_training_grade_2_1080p_by_palinus-d87nev3.jpg

De novo, não é necessário conhecer tudo. Sabendo uns 3 mil caracteres é suficiente para ser fluente (não significa que seja fácil decorar 3 mil caracteres).


Distribuição Exponencial
Saber 10% das palavras e 10% dos caracteres existentes indica que as línguas têm uma distribuição exponencial, um Pareto. Isto significa que uma pequena porcentagem das palavras responde por quase todo o uso cotidiano da linguagem. Poucos detêm tudo, enquanto muitos nada têm. É igual à economia, queiram ou não os socialistas utópicos.


Mas porque existem 300 mil palavras? Um palpite: Evolução.

A humanidade surgiu há uns 500 mil anos, e a linguagem é uma forma de comunicar a realidade numa comunidade. As palavras moldam o mundo em que vivemos, e têm que ser úteis hoje, agora.

Novas palavras surgem a cada vez que há uma nova necessidade. Ou a cada pequeno grupo de pessoas que têm uma necessidade específica. Ou a cada vez que há troca de ideias entre culturas diferentes.

Assim como na evolução das espécies, novas palavras surgem a todo momento. Algumas “pegam”, outras não, numa seleção natural. As palavras que usamos hoje não necessariamente serão usadas amanhã. As palavras antigas são descartadas da linguagem, no máximo se transformam num verbete esquecido num dicionário.


O nosso DNA também contém muitas palavras esquecidas. Cientistas estimam que 98 % do nosso DNA não serve para nada. É o que eles chamam de “junk DNA”. Talvez estes sejam pedaços de código que um dia serviram para alguma coisa, mas pela evolução foram deixados de lado em algum momento. Ou talvez nunca tenham servido para nada, mas é muito mais difícil subtrair algo que está pronto e rodando, do que simplesmente acrescentar uma funcionalidade a mais.
maxresdefault.jpg
Para os que escrevem códigos computacionais, a mesma coisa. Se um software evolui, ele vai deixar uma porção de “código legado”. Milhares de linhas de código ineficiente ou inútil, mas que um dia serviram para alguma coisa.
O tradeoff é o seguinte. Como tudo evolui, sempre surge a necessidade de alguma mudança, adequação, nova necessidade. Para fazer um puxadinho do sistema que está funcionando, o desenvolvedor vai gastar umas 40 horas. Para recomeçar tudo do zero, tornando todo o sistema o mais eficiente possível, o mesmo desenvolvedor vai demorar umas 500 horas, isso se não causar outros problemas.
Este mesmo comportamento é válido para as ideias, músicas (quantas músicas existem e quantas conhecemos?), filmes (quantos atores existem e quantos conhecemos?) e para quase tudo o que interessa neste mundo exponencial.

A linguagem ótima
Imagine que um acadêmico utópico invente uma linguagem otimizada. Somente as 15 mil palavras mais usadas, com regras gramaticais simples. E que o mundo inteiro adotasse essa linguagem: todos os outros dicionários de todas as línguas seriam apagados para sempre. O que aconteceria?
A sociedade não deixa de evoluir. Novos fenômenos teriam que ser descritos por novas palavras. Sei lá, um bando de pessoas criam uma religião chamada “barraquismo”, onde a missão deles é morar em barracas. E o mestre desta seita não é uma pessoa comum, não é um professor. É um “magnum barracão”.
2015-03-19-1426803829-9735139-8f524af8ef2b50a4dab24786229c28c11.jpg
A tecnologia não deixa de evoluir. Certamente novas palavras surgiriam para descrever novas empresas, ideias, técnicas. Digamos, um wi-fi por satélite é um “sat-fi”.
As coisas são diferentes de um lugar para o outro. O pãozinho do Brasil é diferente do pãozinho do Tibet. Como diferenciá-los se o nome for o mesmo?
Ou seja, mesmo que a linguagem ótima universal tenha 15 mil palavras, a linguagem real sujeita à evolução vai criar mais e mais palavras com o tempo, até voltar para as 300 mil palavras e infindáveis dialetos do nosso mundo!
Portanto, não precisamos saber todas as palavras do dicionário. Devemos saber usar o dicionário, saber que a linguagem é dinâmica e que podemos criar novas palavras e novos mundos através dela.

https://pt.wikipedia.org/wiki/Dicion%C3%A1rio_Aur%C3%A9lio

http://www.streetsmartlanguagelearning.com/2013/02/how-many-words-does-average-native.html

Fontes: dicionarioegramatica.com.br

How much of our DNA is junk?

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s