Sobre o MuZero


A Deepmind é a empresa que criou o AlphaGo, a inteligência artificial que derrotou Lee Seidel, mestre do jogo Go, em 2016. É um dos marcos da evolução da IA na história, pelo Go ser ordens de grandeza mais complexo do que o xadrez.


A evolução do AlphaGo inclui o AlphaGoZero (que derrotou o anterior por 100 x 0) e o AlphaZero (este também inclui Xadrez e Shogi, e bateu o AlphaGoZero por 60 x 40).


A última evolução da família é o MuZero, capaz de aprender a jogar Go, Xadrez, Shogi (um xadrez japonês) e Atari, com desempenho top level, e sem ter as regras explicitamente ensinadas.

https://deepmind.com/blog/article/muzero-mastering-go-chess-shogi-and-atari-without-rules

Fonte: Blog do DeepMind

Seria como aprender a jogar xadrez sem ninguém ensinar. Aprender a jogar jogando, deduzindo as regras e perdendo milhares de partidas até entender as boas jogadas e desenvolver por si só a estratégia de jogo!

O DeepMind é uma empresa que dá prejuízo de uns 600 milhões de dólares por ano. Os custos incluem os computadores e o time de pesquisadores, pessoas caras, de altíssimo nível e bastante cobiçadas pela indústria.
A receita do DeepMind tende a zero, já que os projetos são em nível de pesquisa aplicada. A empresa só sobrevive por ser bancada pelo Google.


A inovação, nesse nível de liderança mundial, é assim. Bilhões de dólares investidos, muitos anos e os melhores cérebros. Além do alto risco.

Porém, são essas as empresas que constroem o futuro.


Daqui a alguns anos, estaremos utilizando ferramentas derivadas deste tipo de pesquisa aplicada. E vamos ficar pensando, “por que o Brasil não consegue chegar nesse nível?”

Veja também:

AlphaFold, dobramento de proteínas e origami (ideiasesquecidas.com)

𝗗𝗲𝗲𝗽𝗠𝗶𝗻𝗱 (ideiasesquecidas.com)

AlphaFold, dobramento de proteínas e origami

O DeepMind, a mesma empresa da inteligência artificial que venceu os mestres do jogo Go, surpreende o mundo novamente.

Ela acaba de vencer o CASP – Critical Assessment of Protein Structure Prediction, uma competição para prever a estrutura de proteínas, com o seu algoritmo AlphaFold.

O CASP existe faz anos, e sempre tem um vencedor. Qual a diferença?

A diferença é que o AlphaFold foi muito superior aos demais, atingindo um nível de acurácia nunca antes visto, e rivalizando com técnicas laboratoriais (como o Raio-X) extremamente mais demoradas e caras.

O que é dobramento de proteínas?

Muito se fala do famoso DNA, a molécula em dupla-hélice que é o livro da vida. Entretanto,o DNA sozinho não faz nada. A informação contida neste, através de suas bases (A,G,C,T), tem que ser transcrita e levada ao ribossomos, onde são transformadas em proteínas.

Um conjunto de três bases forma um aminoácido. O conjunto se dobra em estruturas 3D complexas, que aí sim, tem função no organismo – um hormônio, um anticorpo, etc.

Proteínas são os blocos constituintes da vida, existentes em seres humanos, animais, plantas.

É como dobrar um origami de um cisne. O DNA é o papel desdobrado, onde somente as marcas de dobra são visíveis.

O problema é: a partir das marcas das dobras, como montar o origami completo, dadas as interações físicas e químicas entre os aminoácidos. O problema é extremamente complexo, porque a cadeia pode ter milhares de aminoácidos, e todos influenciam em todos.

O DeepMind é famoso por utilizar redes neurais profundas do começo ao fim, porém, dessa vez, a abordagem foi mista.

Utilizaram: 1- redes neurais de atenção para chegar em fragmentos candidatos; e 2 – algoritmos clássicos (Gradient Descent) para otimização global.

Também esperava-se um esforço computacional gigantesco, fosse puramente redes neurais profundas, mas a abordagem descrita utilizou apenas ~200 GPUS, algo relativamente modesto nos dias de hoje.

Obviamente, fizeram uma quantidade gigantesca de pesquisa para chegar nessas soluções, dentre as inúmeras outras arquiteturas possíveis.

Aplicações do dobramento de proteínas: entender doenças e projetar remédios.

Os métodos atuais permitem obter a estrutura de uma proteína ao cabo de um ano e com um custo de 120 mil dólares. O AlphaFold fornece o resultado em meia hora.

Ainda há um longo caminho a percorrer, para tornar o AlphaFold capaz de resolver problemas de verdade. O CASP é basicamente um jogo controlado, e o algoritmo funciona bem apenas no contexto do desafio proposto.

Mas o futuro é promissor. Na palavra de um dos pesquisadores, “o AlphaFold vai mudar tudo”.

Referências.

https://news.efinancialcareers.com/uk-en/325021/google-deepmind-pay

https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

https://www.businessinsider.com/deepmind-google-protein-folding-ai-alphafold-technology-2020-12

https://www.kdnuggets.com/2019/07/deepmind-protein-folding-upset.html

https://visao.sapo.pt/exameinformatica/noticias-ei/ciencia-ei/2020-12-02-inteligencia-artificial-da-deepmind-faz-descoberta-cientifica-revolucionaria/

𝗗𝗲𝗲𝗽𝗠𝗶𝗻𝗱

Quando se fala de Inteligência Artificial, vale a pena ficar de olho na empresa britânica DeepMind.

Ela alcançou notoriedade ao desenvolver o AlphaGo, programa computacional que derrotou o campeão mundial do jogo Go, em 2016. O Go é uma espécie de xadrez chinês, porém, bastante mais complexo.

A DeepMind foi adquirida pelo Google em 2014.

Atualmente, ela atua em identificação de doenças oculares, economia de energia nos servidores do Google, e a difícil área de dobramento de proteínas, entre outros.

Documentário AlphaGo x Lee Sedol

Site da empresa:

https://deepmind.com