​ ​O livro de receitas de 1 gigabyte

A fascinante história do DNA é daquelas histórias que merecem ser contadas e recontadas.

 

O DNA é como se fosse um livro de receitas. Só que ao invés de ensinar a preparar arroz, feijão, macarrão e carne, são receitas de como fazer um ser humano: células da pele, do pulmão, do olhos, hormônios, etc. É um livro que passa de pais para filhos.
 
Este livro de receitas é dividido em 23 capítulos. Cada capítulo é chamado de “cromossomo”. São 23 pares de cromossomos: metade vem do pai, e a outra metade vem da mãe, totalizando 46 cromossomos. O pai passa metade do livro, a mãe passa a outra metade.

 

 

Os macacos são 98% similares a nós em termos genéticos. Mas uma grande diferença é que eles têm 24 pares de cromossomos. No ser humanos, dois dos cromossomos dos macacos estão fundidos em um só. E essa é uma das razões para sermos espécies diferentes: um cruzamento de gameta com 23 cromossomos e outro com 24 cromossomos não dá match.

 

Este livro de receitas tem cerca de 1 gigabyte de conteúdo. Cabe num pen drive. Atualmente um vídeo digital, ou um livro cheio de figuras, pode ter mais do que isso de tamanho (isto demonstra que tamanho não significa qualidade). Mas dá para escrever um monte de coisas com um giga. Se for só texto, uma biblioteca de 5.000 livros de 300 páginas cada.

  


DNA, Cromossomos e Genes
 
 

Para ficar mais claro. O nome DNA (ácido desoxiribonucleico) refere-se à molécula em dupla hélice descoberta por Francis Crick e James Watson em 1953. Um cromossomo é feito de uma molécula de DNA.

  

Image result for dna
 
Se o genoma humano é o livro, e os 23 cromossomos são os capítulos, cada capítulo contém milhares de receitas diferentes – chamamos cada receita individual de “gene”. Há mais de 300 mil genes, cada gene com uma instruçãozinha específica: uma para produzir insulina, outra para produzir as células da pele, etc.

 
 

Image result for chromosome and gene
 
 

Temos pares do mesmo cromossomo, o que leva a termos duas receitas para fazer a mesma coisa. Digamos que a receita do pai ensine a fazer olhos castanhos, e a receita da mãe, olhos azuis. Chama-se alelos esses pares de genes que têm o mesmo objetivo final.

  

Algumas instruções dos genes podem ser dominantes em relação ao outro alelo. Digamos, o gene de azul simplesmente diz que não há pigmento, já o gene de castanho diz que precisa de pigmento castanho. A soma de não pigmento com pigmento castanho dá castanho.

  

As ideias de genes ligados à características, genes dominantes e recessivos, tiveram origem com os experimentos de Gregor Mendel com ervilhas, lá pelos anos de 1860.

  


As letras e palavras do livro da vida
  
O livro de receitas do DNA é escrito com 4 letras: A, G, C, T. Cada letra é uma nucleobase molecular formada de carbono e mais alguns outros átomos.

  

  

  

O “A” liga-se com o “T” e o “G” liga-se com o “C”.

  

Image result for adenina guanina citosina e timina

  

Um grupo de três letras forma uma palavra: o aminoácido. Há 20 aminoácidos.

  

Assim como utilizamos letras do alfabeto formando palavras, e com palavras escrevemos qualquer livro possível, as letras e palavras do DNA descrevem qualquer ser vivo: desde vírus, passando por bactérias, células, peixes, aves, mamíferos, até chegar ao ser humano.
Image result for 20 amino acids
Ex. O aminoácido Isoleucina pode ser feito das nucleobases ATT

 

O livro do genoma humano utiliza 1 bilhão de nucleobases, ou letras na nossa analogia. Um bilhão dá um gigabyte, arredondando.
 
Uma analogia irresistível é a com os computadores. Num computador, temos os bits, valores binários 0 ou 1. Um grupo de 8 bits forma um byte. Esses bytes armazenam qualquer coisa que pode ser traduzida em números: palavras, imagens, sons, vídeo.

  

Image result for 8 bits 1 bytes

  

As nossas bases nucleicas são estruturas complexas de carbono. No computador, as estruturas são feitas de silício. O silício é da mesma família do carbono, uma linha abaixo, na tabela periódica de elementos. Não é coincidência. Ambos tem 4 elétrons na última camada, o que mostra uma certa similaridade.

  

Screenshot 2017-07-11 00:48:00.png

  

As letras do alfabeto da vida ficam dispostas sequencialmente, um atrás do outro, como um cordão. Na verdade, um cordão duplo, porque a base oposta se junta, como se fosse um zíper, na elegante forma de dupla hélice. Quando necessário, este zíper se abre e as cópias são feitas. Depois de copiado, o zíper de DNA se fecha novamente.
 

 

Image result for adenina guanina citosina e timina

  

O nosso DNA carrega um monte de informação que não é utilizada para nada, até onde se sabe. Alguns pesquisadores dizem que 90% do nosso código genético seja deste “junk DNA”. Talvez tudo isso seja código legado, ou seja, um dia já serviu para alguma coisa, ficou obsoleto, mas como não faz mal e dá um trabalhão limpar, foi ficando. Todo processo vivo, em constante inovação, acaba gerando um monte de código legado – para fazer uma analogia, o Internet Explorer antigo teve que ser reescrito, porque tinha um milhão de linhas de código que eram obsoletas.

  


Como transformar o DNA num osso?

  

Para transformar uma receita de bolo num bolo de verdade, há um ser humano que executa os passos para tal.

  

Num computador, as instruções do software dizem o que alguns equipamentos elétricos e eletrônicos devem fazer: movimentar o cabeçote de leitura, ler um dado, comparar com o estado dentro da memória.

  

Como isto é feito no interior do corpo humano, somente com bioquímica?

  

Quando um gene é transcrito, é feita uma cópia a partir do DNA. Esta cópia é como uma linha de aminoácidos. E ela começa a se dobrar em si mesmo. Alguns dos aminoácidos são hidrofílicos, outros hidrofóbicos, e também há as forças de atração e repulsão entre eles, de modo que a linha começa a se dobrar e formar uma peça, como se fosse um Lego. O nome desta peça de Lego é proteína. E este Lego tem um formato certinho para encaixar uma molécula de cálcio, no caso do osso. Portanto, o gene é uma receita para montar um Lego, e o Lego vai se montando pelo formato 3D e por forças bioquímicas, algo como uma impressora 3D bioquímica.

  

Image result for protein folding
 
 

De pecinha em pecinha, utilizando forças de atração e repulsão, e respeitando o formato do “Lego”, o corpo humano vai sendo montado. Dá-se o nome de dobramento de proteínas a esta formação da estrutura 3D a partir da base nucleica, e é uma das áreas de muito estudo no mundo atual.

  


Porque a necessidade de alelos?

  

Um último questionamento. Por que há duas receitas para o mesmo bolo? Gastar o dobro de páginas, o dobro de material e energia, para cada celulazinha do corpo humano. Não seria mais barato ter apenas um cromossomo, ao invés de um par dos mesmos?

  

Eis aqui a eterna briga entre a otimização e a redundância.

  

Embora as empresas de hoje tentem sempre otimizar, fazer mais com menos, a sábia natureza diz que otimizar demais não é bom. É melhor ter alguma redundância, um backup de segurança para casos de emergência.

  

Digamos que surja um vírus, a varíola. Aliás, um vírus nada mais é do que um DNA protegido por uma parede de proteínas.

  

Image result for smallpox dna

  

Digamos que este vírus seja letal, e a humanidade tenha tido um trabalhão para desenvolver os genes para vencer o mesmo.

  

Uma vez vencida a varíola, não há a necessidade de ter tais genes. E, talvez, este gene evolua para combater algum outro vírus.

  

Mas, imagine que a varíola volte, e volte mais virulenta ainda (e esses vírus vão e voltam comumente). A humanidade teria que desenvolver de novo os genes para combater a varíola.

  

O fato de ter dois alelos, dois backups para o mesmo gene, é um seguro para que os genes úteis não evoluam depressa demais e não sumam com o tempo. Ter duas cópias do gene aumenta a probabilidade de que alguém, em algum lugar, tenha as chaves para combater a varíola, mesmo que escondidas num gene recessivo.
 

 

Esta é uma das razões pelas quais o corpo humano é antifrágil, tomando emprestado o termo do pensador contemporâneo Nassim Taleb. Ele tem seguros, alternativas, planos B. E vejo muitas empresas do mundo moderno descartando planos alternativos e segurança (como estoques, capacidade ociosa de equipamentos), pois são custos no curto prazo, ficando vulneráveis a longo prazo. Elas deveriam aprender com a natureza…

 
 


 

Exceções

  

Este texto tem a intenção de ser uma introdução leve, interessante, cheia de analogias, sobre o fascinante mecanismo de transmissão de informação de geração em geração. É claro que tudo o que está escrito aqui são teorias, e teorias  mudam com o tempo, há contra-teorias e  exceções para todas as regras.

  

Conforme diz Shakespeare, em Hamlet:
“Há muito mais no céu e na terra do que sonha a nossa vã filosofia”

 


Referências:

 

The Red Queen – Matt Riddley
Genome: the autobiography of a species in 23 chapters – Matt Ridley
Image result

Evolução e dicionários

O Dicionário Aurélio da Língua Portuguesa tem mais de 2000 páginas, onde mais de 150 mil verbetes se espremem, impressos em letras pequenas.

Dicionário_Aurélio_da_Língua_Portuguesa.jpg

Quando eu era criança, eu achava que os professores de língua portuguesa sabiam todas as palavras do dicionário.

Mas a verdade é que ninguém sabe todas as palavras do dicionário, e ninguém precisa saber.


Vejamos quantas palavras têm alguns dicionários:
Dicionário Aurélio: 150 mil palavras
Grande Dicionário da Língua Portuguesa: 306 mil verbetes
Dicionário Houaiss: 228 mil verbetes
Dicionário Oxford de Inglês: 290 mil verbetes
Dicionário Larousse da Língua Francesa: 93 mil verbetes
grande-dicionário-da-língua-portuguesa-o-antes-e-o-depois-nova-edição-atualizada.jpgdicionario
Dizem que precisamos saber umas 15 mil palavras para falar fluentemente alguma língua, qualquer seja. O que acontece na prática é que, com muito menos palavras, digamos umas 5 mil palavras, já conseguimos entender muita coisa do contexto e formar combinações de palavras.

Mas se usamos 15 mil palavras, porque tem 300 mil palavras no dicionário?

Nas línguas ocidentais temos tantas palavras, mas somente 26 letras: a, b, c, etc. Mas quando se estuda uma língua como o chinês, há uma quantidade assustadora de caracteres: pelo menos 20 mil no chinês, 10 mil no japonês.

wallpaper_kanji_training_grade_2_1080p_by_palinus-d87nev3.jpg

De novo, não é necessário conhecer tudo. Sabendo uns 3 mil caracteres é suficiente para ser fluente (não significa que seja fácil decorar 3 mil caracteres).


Distribuição Exponencial
Saber 10% das palavras e 10% dos caracteres existentes indica que as línguas têm uma distribuição exponencial, um Pareto. Isto significa que uma pequena porcentagem das palavras responde por quase todo o uso cotidiano da linguagem. Poucos detêm tudo, enquanto muitos nada têm. É igual à economia, queiram ou não os socialistas utópicos.


Mas porque existem 300 mil palavras? Um palpite: Evolução.

A humanidade surgiu há uns 500 mil anos, e a linguagem é uma forma de comunicar a realidade numa comunidade. As palavras moldam o mundo em que vivemos, e têm que ser úteis hoje, agora.

Novas palavras surgem a cada vez que há uma nova necessidade. Ou a cada pequeno grupo de pessoas que têm uma necessidade específica. Ou a cada vez que há troca de ideias entre culturas diferentes.

Assim como na evolução das espécies, novas palavras surgem a todo momento. Algumas “pegam”, outras não, numa seleção natural. As palavras que usamos hoje não necessariamente serão usadas amanhã. As palavras antigas são descartadas da linguagem, no máximo se transformam num verbete esquecido num dicionário.


O nosso DNA também contém muitas palavras esquecidas. Cientistas estimam que 98 % do nosso DNA não serve para nada. É o que eles chamam de “junk DNA”. Talvez estes sejam pedaços de código que um dia serviram para alguma coisa, mas pela evolução foram deixados de lado em algum momento. Ou talvez nunca tenham servido para nada, mas é muito mais difícil subtrair algo que está pronto e rodando, do que simplesmente acrescentar uma funcionalidade a mais.
maxresdefault.jpg
Para os que escrevem códigos computacionais, a mesma coisa. Se um software evolui, ele vai deixar uma porção de “código legado”. Milhares de linhas de código ineficiente ou inútil, mas que um dia serviram para alguma coisa.
O tradeoff é o seguinte. Como tudo evolui, sempre surge a necessidade de alguma mudança, adequação, nova necessidade. Para fazer um puxadinho do sistema que está funcionando, o desenvolvedor vai gastar umas 40 horas. Para recomeçar tudo do zero, tornando todo o sistema o mais eficiente possível, o mesmo desenvolvedor vai demorar umas 500 horas, isso se não causar outros problemas.
Este mesmo comportamento é válido para as ideias, músicas (quantas músicas existem e quantas conhecemos?), filmes (quantos atores existem e quantos conhecemos?) e para quase tudo o que interessa neste mundo exponencial.

A linguagem ótima
Imagine que um acadêmico utópico invente uma linguagem otimizada. Somente as 15 mil palavras mais usadas, com regras gramaticais simples. E que o mundo inteiro adotasse essa linguagem: todos os outros dicionários de todas as línguas seriam apagados para sempre. O que aconteceria?
A sociedade não deixa de evoluir. Novos fenômenos teriam que ser descritos por novas palavras. Sei lá, um bando de pessoas criam uma religião chamada “barraquismo”, onde a missão deles é morar em barracas. E o mestre desta seita não é uma pessoa comum, não é um professor. É um “magnum barracão”.
2015-03-19-1426803829-9735139-8f524af8ef2b50a4dab24786229c28c11.jpg
A tecnologia não deixa de evoluir. Certamente novas palavras surgiriam para descrever novas empresas, ideias, técnicas. Digamos, um wi-fi por satélite é um “sat-fi”.
As coisas são diferentes de um lugar para o outro. O pãozinho do Brasil é diferente do pãozinho do Tibet. Como diferenciá-los se o nome for o mesmo?
Ou seja, mesmo que a linguagem ótima universal tenha 15 mil palavras, a linguagem real sujeita à evolução vai criar mais e mais palavras com o tempo, até voltar para as 300 mil palavras e infindáveis dialetos do nosso mundo!
Portanto, não precisamos saber todas as palavras do dicionário. Devemos saber usar o dicionário, saber que a linguagem é dinâmica e que podemos criar novas palavras e novos mundos através dela.

https://pt.wikipedia.org/wiki/Dicion%C3%A1rio_Aur%C3%A9lio

http://www.streetsmartlanguagelearning.com/2013/02/how-many-words-does-average-native.html

Fontes: dicionarioegramatica.com.br

How much of our DNA is junk?

Tofu, ração e picanha

Quando a gente passa pelas estradas do interior do Paraná, há soja por toda parte: à direita da estrada, à esquerda da estrada, por infindáveis quilômetros.

Soja.jpeg

Segunda a Embrapa, o Brasil produz 95 milhões de toneladas de soja por ano. É o segundo maior produtor do mundo.

Mas, para que serve tanta soja?

O meu almoço normalmente tem arroz, feijão, uma carne ou frango, salada. Não tem soja.

Comida japonesa tem um pouco de soja. Tofu, missoshiro (sopa à base de soja). Mas quem vai comer 95 milhões de toneladas de tofu?

Tofu.jpg
Tofu

 

miso
Arroz e Missoshiro

O Brasil produz muito mais soja do que arroz, feijão, trigo, mandioca.

 

Producao.JPG

Para onde vai tanta soja?

 


Soja = Proteína

A soja é um alimento rico em proteína e em óleo. Aliado à grande produtividade das nossas  terras do Mato Grosso do Sul e do Paraná, ela se torna a plantação ideal para produção maciça de proteína.

A ideia é alimentar o mundo em larga escala, plantando um grão altamente produtivo em terras bastante férteis, num clima favorável e com grande disponibilidade de água. Note que poucos lugares do mundo têm condições semelhantes de terra, sol, clima e água.

Tudo bem, a soja é uma fonte valiosa de proteína. Mas, proteína por proteína, prefiro comer um churrasco de picanha do que um hambúrguer vegetariano de soja (eca).

Picanha.jpg
A gente reclama da carne de soja, mas os animais não conseguem reclamar do gosto da soja. E é para eles que a soja é empurrada goela abaixo, quase que literalmente, sob a forma de ração.

ração.jpg

O grão do soja viaja em caminhões pelas estradas do Paraná, até chegar aos moinhos onde ela é armazenada e moída. 20% se transforma em óleo vegetal, o óleo de cozinha que a gente compra no supermercado. Os 80% restantes viram ração animal, especialmente para galinhas, porcos e gado. O milho também tem boa parcela destinada à ração.

chicken.jpg
Portanto, há soja sim no meu prato. A minha carne é feita de soja. Aquele churrasco do fim de semana só é possível devido à alta produtividade da soja. E é muita soja.

SUINOSRA.jpg
.

Há uma perda energética quando a soja é transformada em carne. A galinha precisa crescer e viver, e vai consumir uma parte considerável da energia com que é alimentada. É a mesma coisa com o porco, que gasta muito mais energia. Apenas uma fração de toda a soja consumida pelos animais vira a fabulosa picanha

 

gado-de-corte-confinamento-portal-agropecuario.jpg

 

É por causa desta ineficiência da conversão de soja em carne que é necessário plantar 97 milhões de t de soja e apenas 12 milhões t de arroz e 3 milhões t de feijão.

O gráfico a seguir, de uma fonte ligada à conservação ambiental, demonstra o impacto da produção animal nos terrenos agrários.

Cows-are-hogs-infographic.jpg
Portanto, dê o devido valor ao que come. O preço do quilo de carne é alto, mas ambientalmente, custou muito mais do que isto para chegar à sua mesa.

 


 

 

Fonte:

Embrapa: http://www.ibge.gov.br/home/estatistica/indicadores/agropecuaria/lspa/lspa_201603_5.shtm

 

Cows Are the Real Hogs: The IPCC and the Demand Side of Agriculture

Memória rápida e memória lenta

Há diversas similaridades entre computação e biologia. Uma dessas similaridades acontece com as formas de memória utilizadas.

By-Year-2045-It-Would-Be-Able-To-Transfer-Your-Brain-To-A-hard-Disk-1


 

Memórias de computador

Computadores têm dois tipos de memória. Uma com velocidade de processamento extremamente rápida mas capacidade de armazenamento limitada, a memória RAM. A outra, com velocidade de acesso baixa mas capacidade gigantesca, que é o disco rígido do computador.
 

Quando o computador vai processar alguma coisa, utiliza a memória rápida, faz todo o processamento necessário e grava/lê os resultados na memória devagar.

 
A memória rápida é muito cara, em termos de US$/megabyte, portanto ela deve ser grande o suficiente para o processamento, mas muito menor que a memória devagar. Já a memória devagar é barata, portanto dá para ter gigabytes dela.
 

É mais ou menos que nem a mesa de trabalho e um armário de arquivo. Pego do arquivo tudo o que preciso, e deixo na minha mesa. Faço o meu trabalho na mesa e depois devolvo tudo certinho ao armário.

 


Memórias do cérebro

O cérebro humano também tem uma memória rápida e outra devagar. A lógica é exatamente a mesma do computador. A memória de trabalho é limitada e gasta uma enorme energia, além de esquecer facilmente a informação. Já a memória de longo prazo não esquece tão fácil assim, mas demora bastante para gravar alguma coisa nesta memória.
 

Quando a gente aprende alguma coisa nova, quem trabalha é a memória rápida. Na primeira vez em que se dirige um carro, a pessoa presta muita atenção em tudo. Lembro que eu tinha que ver onde estava o câmbio, todas as vezes em que trocava de marcha. Depois que o conhecimento é assimilado, o esforço de dirigir diminui bastante, vira algo automático: o conhecimento foi para a memória devagar.

 
Falar em outra língua, em outro país, também é uma atividade bem difícil e exaustiva no começo. Isto porque a memória rápida tem que se concentrar bastante. Depois de um tempo, a pessoa se acostuma, ou seja, o aprendizado vai para a memória devagar.
 


Memória virtual

O computador usa uma malandragem, que é a memória virtual. Quando a memória RAM acaba, o processador pode pegar um pouco da memória do hard disk emprestada temporariamente. O desempenho do processamento vai diminuir um pouco, mas há o aumento do limite de informação a ser manipulada.
 

Até aí, eu já sabia. Mas o que eu não sabia era que o ser humano também conseguia fazer isso: pegar emprestado um pouco de sua memória de longo prazo para usar na memória rápida.
 

Rüdiger Gamm é um cara normal, e era péssimo em matemática. E ele foi treinado em dividir números primos até a 60a casa decimal, raízes quínticas, etc, tudo de cabeça. Como ele conseguia?

 
Um escaneamento do seu cérebro mostrou que ele estava usando áreas da memória de longo prazo para conseguir estender a sua memória comum.
 

http://archive.wired.com/wired/archive/11.12/genius_pr.html
 


Memorização

Há diversas técnicas de memorização poderosas. Por exemplo, uma delas é associar uma lista de palavras que a pessoa quer decorar com algum lugar físico, e criar uma historinha. Ou associar números de 1 a 99 com pessoas, e números com mais dígitos são uma combinação das pessoas representadas pelos números até 99.

 
Mais ou menos assim:
Decore um número de telefone: (32) 94366-2342
Decore uma historinha: o Bozo subiu em um poste e comeu bife de cavalo com o Silvio Santos, depois beijou a Debora Secco.

o-SILVIO-SANTOS-facebook
É muito mais fácil decorar a historinha, não? O truque é treinar para codificar/decodificar a historinha para os números.

Virando historinha, a gente acessa outras funções do cérebro: criatividade, empatia com os personagens, visualização, etc. E estamos usando outras partes da memória. 

 


Matrix

No filme Matrix 2, tem uma cena em que a Trinity tem que fugir de moto. Mas ela não sabe dirigir. Então, ela downloada a capacidade de dirigir, instala na sua cabeça, e aprende a pilotar a moto em segundos. É no minuto 1:20 do vídeo a seguir.

 

 

Será que um dia chegaremos neste nível?

 

Arnaldo Gunzi
Ago 2015