Captchas

images (2)

 

 Captchas
Certamente quem mexe na internet já se deparou com um captcha: é uma imagem, com números e letras aleatórias, e o usuário deve digitar o que lê numa caixa. Se acertar, ele tem acesso. Se não, ele não consegue avançar.

 

Para que serve essa coisa irritante?

 

Serve para distinguir um robô de um ser humano. É relativamente simples criar um programa para visitar páginas da internet e ficar vasculhando o conteúdo. Mas o que gera receita de verdade para o dono da página são seres humanos, e não programas de computador. Um robô pode inclusive roubar o conteúdo valioso de um site e divulgar para o mundo inteiro.

 

Por que o captcha tem que ser tão difícil, cheio de letras distorcidas e traços que atrapalham? Porque existem outros programas de computador, os OCR, que pegam uma imagem e reconhecem o que está escrito. Portanto, o captcha tem que ser suficientemente difícil para um OCR não conseguir transcrever. E, por isso, os captchas são difíceis de entender. Tão difíceis, que nem os humanos entendem… Eu odeio esse negócio. Uma vez, errei três vezes seguidas a transcrição desse negócio, e desisti de acessar o site. Mesmo quando consigo, tenho que fazer um enorme esforço de concentração para isto.

 

Se somar a quantidade de energia mental gasta nesta porcaria por milhões de pessoas no mundo inteira, questiona-se se o captcha foi mesmo uma boa invenção.

O Re captcha

 

O criador do captcha, ao notar o quanto estava dificultando a vida de milhões de pessoas, bolou um jeito de usar esta enorme energia mental para algo produtivo.

 

O google tem uma iniciativa de escanear livros de bibliotecas, e vem gastando um esforço considerável nisto: escaneres extremamente velozes e alta definição, tempo e dinheiro com funcionários para escanear, servidores para armazenar a informação, especialistas em OCR, etc. Mas, mesmo assim, ainda tem um monte de palavras que o OCR não consegue entender. Aí, o google tinha que pagar pessoas para fazer a desambiguidade.

 

A ideia foi brilhante: pegar essas palavras que o OCR não conseguiu entender, jogar no captcha um milhão de vezes. A palavra que for assinalada mais vezes tem grande probabilidade de ser a palavra correta. E todos aqueles que respondem a um captcha estão ajudando a digitalizar um livro.

 

Mas, se ninguém sabe exatamente qual a palavra correta, como usar a palavra escaneada como captcha?

 

Simples, no recaptcha aparecem duas palavras: uma de controle, e a outra com a palavra escaneada. O ser humano só tem que acertar a primeira palavra.

 

Menos mal saber que o tempo gasto para provar que não sou um robô contribui para a digitalização de livros.
difficult-captcha

Alternativas
 

 

Para mim, a responsabilidade e o ônus de saber quem é computador ou não deveria ser do dono da página, e não do usuário.

 

Surgiram outras formas de filtrar robôs, que são muito mais humanas que o captcha.
  • Fazer perguntas literais simples: do tipo “Quanto é dois somado a três?”
  • No ipad, pedir para fazer gestos simples: “Por favor, arraste dois dedos de baixo para cima” (no caso, é para filtrar adulto de criança)
  • Colocar joguinhos simples: arrastar um bloco para um buraco, por exemplo
  • Rastrear a velocidade com que o usuário acessa links e aperta botões.

Unir o útil ao agradável
 

 

A principal razão de eu contar esta história toda não é falar sobre captcha. Mas sim, mostrar que dá para achar utilidade em algo que parecia não ter.

 

Todos os dias, milhões de pessoas gastam tempo, energia e processamento computacional navegando na internet, jogando os mais variados tipos de jogos, acessando facebook, twitter. São formas de entretenimento, não há nada de errado nisto.

 

E se, de alguma forma, quem jogasse um jogo ou lesse uma notícia num site qualquer ao mesmo tempo estivesse contribuindo com alguma coisa, como pesquisa de combate ao câncer?

 

E se fosse possível quebrar um problema em milhões de problemas pequenos e a resolução deste problema for codificado como um pedaço de um jogo?

 

Seria unir o útil ao agradável, e aproveitar um pouquinho do tempo e da energia coletiva de milhões de pessoas.

 

Arnaldo Gunzi

Março 2015


Siglas
Captcha: Completely Automated Public Turing test to tell Computers and Humans Apart
OCR: Optical recognition character
Teste de Turing: concebido por um dos criadores do conceito de computação, o teste de Turing serve para distinguir humano de computadores. Pegue um humano e coloque numa sala. Este humano faz perguntas e recebe respostas de alguém de fora da sala. Se o humano não conseguir distinguir se está falando com um outro humano ou uma máquina, a máquina passou no teste.

Um comentário sobre “Captchas

  1. Arnaldo Gunzi

    Nota: Não confundir esta ideia com a de doar tempo do seu computador, como a do LHC@home. Nessas iniciativas, é simplesmente uma doação de tempo computacional. A ideia do post é aproveitar a capacidade cognitiva das pessoas em resolver alguns problemas. É muito mais complicado.

    Curtir

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s