BRPI0807415A2

BRPI0807415A2 - Controlar o acesso a sistemas de computador e anotar arquivos de mídia.

Info

Publication number: BRPI0807415A2
Application number: BRPI0807415-1A
Authority: BR
Inventors: Luis Von Ahn; Manuel Blum; Benjamin D Maurer
Original assignee: Univ Carnegie Mellon
Priority date: 2007-01-23
Filing date: 2008-01-23
Publication date: 2014-05-27
Also published as: CA2676395A1; EP2605171A3; US9600648B2; KR20090116750A; EP2109837A4; EP2605171A2; EP2109837A1; KR101451454B1; US20140181960A1; JP2010517169A; WO2008091675A1; CN101622620B; AU2008209429A1; US8555353B2; EP2109837B1; US20100031330A1; CA2676395C; EP2605171B1; AU2008209429B2; CN101622620A

Description

CONTROLAR O ACESSO A SISTEMAS DE COMPUTADOR E ANOTAR

ARQUIVOS DE MÍDIA

REFERÊNCIA CRUZADA A APLICAÇÕES RELACIONADAS

Esta aplicação reivindica prioridade do Pedido de Patente Provisória dos Estados Unidos número 60/881.962, requerido em 23 de janeiro de 20 07, que é aqui incorporado por referência.

CAMPO DA INVENÇÃO

A presente invenção é dirigida genericamente a métodos e aparelhos para controlar o acesso a sistemas de computador e para anotar arquivos de mídia.

HISTÓRICO DA INVENÇÃO

CAPTCHA é uma sigla para "CompleteIy Automated Public Turing test to tell Computers and Humans Apart" (Teste de 15 Turing Público Completamente Automatizado para Distinguir entre Computadores e Seres Humanos) e é um teste de desafio-resposta utilizado para determinar se o usuário é um ser humano ou um computador. Esses programas são de utilização comum na World Wide Web (Rede de Amplidão

2 0 Mundial) e muita vez assume a forma de imagens com texto distorcido. CAPTCHAs são utilizados para proteger muitos tipos de serviços, incluindo serviços de correspondência eletrônica, serviços de venda de ingressos, redes sociais, wikis, e blogs. Eles são freqüentemente encontrados no 25 fundo dos formulários de registro na Web e são, por exemplo, utilizados pelo Hotmail, Yahoo, Gmail, MSN Mail, PayPal, TicketMaster, o United States Patent and Trademark Office (Escritório de Patentes e de Marcas Registradas dos Estados Unidos), e muitos outros sítios da Web populares 30 para impedir o abuso automatizado (por exemplo, programas que são redigidos para obter muitas contas de correspondência eletrônica gratuitas todos os dias). CAPTCHAs são eficazes porque os programas de computador são incapazes de Ier texto distorcido tão bem quanto os seres 5 humanos podem. Em geral, CAPTCHAs orientam os usuários a provar que são seres humanos ao digitar letras, números, e outros símbolos que correspondem a caracteres ondulados apresentados na imagem.

No entanto, os CAPTCHAs da tecnologia anterior possuem certas restrições. Em particular, as imagens utilizadas nos CAPTCHAs da tecnologia anterior são criados artificialmente especificamente para utilização como CAPTCHAs. e eles nem sempre são bem selecionados para distinguir entre usuários humanos e não-humanos. Como resultado, spammers (produtores de correspondência indesejada) e outros que tentam burlar os sistemas CAPTCHAs da tecnologia anterior estão tornando- se crescentemente eficientes e utilizar computadores para responder corretamente CAPTCHAs da tecnologia anterior. Como resultado, há uma necessidade de uma maneira mais eficaz de produzir CAPTCHAs que sejam difíceis para os computadores responder e que também são razoavelmente fáceis para os seres humanos responderem.

Os seres humanos ao redor do mundo resolvem mais de 60 milhões de CAPTCHAs todos os dias, em cada caso gastando 25 aproximadamente dez segundos para digitar os caracteres distorcidos. No agregado, isto significa mais de 150.000 homens-horas. Este trabalho é tremendamente valioso e, quase por definição, ele não pode ser feito por computadores. Atualmente, no entanto, CAPTCHAs da 3 0 tecnologia anterior não prevêem qualquer fim útil para este trabalho além de utilizá-lo como uma maneira de limitar o acesso aos usuários humanos. Como resultado, há uma necessidade de fazer utilização mais eficiência do tempo considerável que é gasto coletivamente para resolver 5 CAPTCHAs.

Ademais, livros ou textos físicos que foram escritos antes da era do computador estão sendo atualmente digitalizados em massa (por exemplo, pelo Google Books Project [Projeto de Livros Google] e pelo Internet Archive) para preservar o conhecimento humano e tornar a informação mais acessível ao mundo. As páginas estão sendo digitalizadas fotograficamente em forma de imagem, e então transformadas em texto utilizando o reconhecimento óptico de caracteres (OCR). A transformação de imagens para texto pelo OCR é útil, pois imagens são difíceis de serem armazenadas em dispositivos pequenos, são onerosas para baixar, e não podem ser pesquisadas com facilidade. Entretanto, um dos obstáculos maiores neste processo de digitalização é que o OCR está longe de ser perfeito para decifrar as palavras de textos digitalizados. Para as impressões mais antigas, em que a tinta já desbotou, as páginas ficaram amarelas, ou outras imperfeições existem no papel, OCR não pode reconhecer aproximadamente 20% das palavras. Em contraste com os computadores, os seres humanos são significativamente precisos ao transcrever essas impressões. Um único ser humano pode atingir mais de 95% de precisão ao nível da palavra. Dois seres humanos, utilizando a técnica de 'teclar e conferir', em que cada um deles digita o texto independentemente e então quaisquer discrepâncias são comparadas, pode alcançar mais de 99,5% de precisão ao nível da palavra (erros não são integralmente independentes através de múltiplos seres humanos). Infelizmente, os digitadores humanos são caros, de modo que apenas documentos de extrema importância são 5 transcritos manualmente.

Assim, há uma necessidade de métodos e aparelhos aprimorados relacionados aos CAPTCHAs e, particularmente, de métodos e aparelhos relacionados a CAPTCHAs que ofereçam vantagens além de controlar o acesso a sistemas de 10 computador, como transformar texto escrito, de maneira eficaz de custo, em forma eletrônica que possa ser armazenada e pesquisada com eficiência. Estas e outras vantagens da presente invenção serão descritas em maior detalhe abaixo.

RESUMO SUCINTO DA INVENÇÃO

A presente invenção inclui métodos e aparelhos para controlar o acesso a sistemas de computador e para anotar arquivos de mídia. Em particular, a presente invenção não apenas oferece CAPTCHAs aprimorados, ela permite que a 20 operação de resolução de CAPTCHAs seja aproveitada e utilizada para trabalho produtivo adicional.

O CAPTCHA inclui um teste de desafio-resposta que é utilizado para distinguir entre usuários humanos e não- humanos. De acordo com a presente invenção, o desafio, por 25 exemplo, poderá ser uma imagem distorcida ou não-distorcida de uma palavra que o usuário precisará Ier corretamente e digitar, o desafio poderá ser um clipe de áudio distorcido ou não-distorcido de um objeto que o usuário precisará identificar e digitar o nome, ou o desafio poderá assumir 3 0 alguma outra forma. Ademais, de acordo com algumas versões da presente invenção, o desafio poderá incluir uma ou mais partes, como será descrito em maior detalhe abaixo. A presente invenção será ocasionalmente referida como um 're- CAPTCHA'.

5 A presente invenção pode ser incluída ou incorporada

como software de computador que, quando executado por um processador, faz com que o processador efetue certas ações de acordo com a presente invenção. Em uma versão, a presente invenção inclui um único computador ou dois ou 10 mais computadores conectados através de uma rede. Um ou mais dos computadores tem memória que inclui instruções lidas por computador que, quando executadas, fazem com que o processador efetua as tarefas aqui descritas.

Resolver CAPTCHAs, por definição, requer que as 15 pessoas efetuem uma tarefa que os computadores ainda não podem realizar. A presente invenção faz uso positivo deste esforço humano, e resultados úteis que poderiam se esperar que sejam alcançados desta forma incluem, sem a eles se limitar, reconhecer texto que os programas de

2 0 reconhecimento de caracteres ópticos (OCR) não podem

interpretar, e outras utilizações. Em outras palavras, a presente invenção torna possível utilizar CAPTCHAs para ajudar a digitalizar mídia que de outra forma não seria eficaz de custo digitalizar. No caso de textos escritos, 25 isto significa utilizar CAPTCHAs para fazer os seres humanos decifrar as palavras que os computadores não podem reconhecer.

Em particular, a presente invenção pode ser utilizada para transcrever material impresso antigo, palavra por

3 0 palavra, dentro de formato eletrônico que pode ser armazenado e pesquisado com eficiência. A presente invenção também pode ser utilizada em conexão com documentos manuscritos, utilizando quer caracteres impressos manuscritos ou caracteres cursivos manuscritos. Com relação ao texto manuscrito, a presente invenção pode, por exemplo, ser utilizada para transcrever cartas e outros documentos que de outra forma seriam caros para transcrever. Textos manuscritos são particularmente difíceis para OCR, e a presente invenção pode atrelar o poderio das pessoas que resolvem CAPTCHAs através da World Wide Web ou outras jurisdições para auxiliar neste processo. Enquanto o CAPTCHA 'padrão' exibe imagens de caracteres aleatórios renderizados por um computador, a presente invenção pode exibir palavras ou imagens distorcidas de palavras que vêm de textos digitalizados. As soluções entradas pelos usuários são então agregadas para melhorar o reconhecimento de caracteres no processo de digitalização.

Em algumas versões, para aumentar a eficiência, apenas as palavras que os programas de OCR automatizados não poderem reconhecer são enviadas para os seres humanos e utilizadas como desafios em CAPTCHAs. No entanto, em outras versões, a presente invenção não é limitada apenas a palavras que programas de OCR automatizados não puderem reconhecer. Por exemplo, palavras que são identificadas de maneira apropriada por programas de OCR também poderão ser utilizadas como as palavras 'verificadas' ou 'conhecidas' na presente invenção, conforme descrito em maior detalhe abaixo.

Para auxiliar na diferenciação entre seres humanos e computadores, o sistema precisa ser capaz de verificar o trabalho do usuário. Algumas versões da presente invenção utilizam um desafio de duas partes, em que o usuário recebe duas palavras, uma para a qual a resposta não é conhecida (também referida como a parte de 'leitura'), e outra para a qual a resposta é conhecida (também referida como a parte de 'verificação'). Se o usuário digitar corretamente a palavra 'conhecida', o sistema ganha confiança de que o usuário também digitou corretamente a palavra 'desconhecida'. Este aspecto da presente invenção não é limitado a desafios de palavras, e desafios de duas partes utilizando clipes de áudio e outras formas de desafios também poderão ser utilizados com a presente invenção.

Em parte, a presente invenção será utilizada para canalizar o esforço humano que é gasto resolvendo milhões de CAPTCHAs todos os dias em 'leitura' de livros online. Múltiplos projetos estão tentando atualmente digitalizar livros físicos (por exemplo, Google Books, o Internet Archive, etc.). Os livros são digitalizados, e então, para torná-los capazes de serem pesquisados, são transformados em texto ASCII utilizando OCR. Embora OCR possa alcançar precisão extremamente elevada na maioria dos livros, há muitos que são digitalizados fracamente, danificados (por exemplo, com marcações à lápis ou caneta) , ou que simplesmente se deterioraram com a idade ao ponto em que o texto foi significativamente distorcido. Nesses casos, OCR alcança uma baixa porcentagem de reconhecimento (ver a Figura 5, por exemplo). A presente invenção irá aprimorar o processo de digitalizar livros ao enviar palavras que não puderem ser lidas pelos programas de OCR para os seres humanos na Web na forma de CAPTCHAs. De acordo com algumas versões da presente invenção, uma imagem de uma página digitalizada de um livro é processada por múltiplos programas de OCR. Aquelas palavras que não puderam ser lidas corretamente pelo OCR são 5 segregadas em imagens que contêm uma única palavra, mais de uma palavra, ou parte de uma palavra. Por exemplos, palavras compridas poderão ser separadas em duas ou mais partes, e palavras curtas poderão ser combinadas e juntadas. Separar automaticamente as palavras pode ser 10 feito precisão significativamente maior por programas de OCR do que reconhecer as palavras. Ademais, a maioria dos programas de OCR comuns retorna uma pontuação de confiança para cada palavra, e esta pontuação de confiança pode ser utilizada para determinar se a palavra foi ou não lida 15 corretamente. Cada uma dessas palavras-imagens será utilizada como um CAPTCHA (ver a Figura 6) e é ocasionalmente doravante designada como um 're-CAPTCHA' .

No caso de arquivos de áudio de palavras faladas, um processo similar é seguido. Os arquivos de áudio são

2 0 processados através de software de reconhecimento de palavras e as partes que não puderem ser reconhecidas (ou para as quais o reconhecimento tenha uma pontuação de confiança baixa) são apresentadas ao usuário para transcrição. Como a fala é um processo contínuo, em 25 oposição à leitura em que as palavras são discretas e separadas por espaço em branco, é provável que os clipes de som apresentados ao usuário conterão várias palavras ou frases inteiras. Independentemente do número de palavras utilizadas, os arquivos de áudio que o software de 30 reconhecimento da fala não puder processar com alto grau de confiança também poderão ser utilizados como uma parte desconhecida de um desafio no processo de reCAPTCHA.

Há uma questão significativa sobre quando uma pessoa pode estar certa de que a resposta correta foi dada para tal CAPTCHA. Esta questão é resolvida com a presente invenção ao utilizar as próprias pessoas. Sempre que a presente invenção encontrar uma nova palavra que não puder ser lida corretamente pelo OCR, ela será apresentada ao usuário em conjunto com uma imagem de outra palavra para a qual já se conhece a resposta. O usuário então será solicitado a resolver tanto a palavra 'conhecida' (ou 'verificação') e a palavra 'desconhecida' (ou 'leitura'). Se o usuário resolver a palavra conhecida para a qual a resposta já era sabida, poder-se-á supor que a resposta também está correta para a palavra anteriormente desconhecida. A presente invenção poderá apresentar a palavra desconhecida a um número de usuários para determinar, com maior confiança, se a resposta original estava correta. Uma vez que certo número de pessoas tenha submetido a mesma resposta para a mesma palavra desconhecida, poder-se-á supor que esta resposta está correta.

É importante que a presente invenção seja segura e eficaz contra tentativas por usuários não-humanos. Uma 25 maneira de assegurar a robustez da presente invenção é assegurar que a mesma imagem, clipe de áudio, ou outro desafio nunca seja apresentado duas vezes na mesma forma. Isto porque é possível escrever um programa de software malicioso que pode coletar desafios previamente

3 0 reconhecidos e armazenar a imagem (ou arquivo de áudio) junto com a interpretação correta anteriormente determinada. Uma vez feito isso, o programa malicioso pode acessar um sítio da Web que apresenta um desafio CAPTCHA, pesquisa seus arquivos para ver se a imagem (ou arquivo de 5 áudio) já foi anteriormente identificada corretamente, e então fornece a resposta correta previamente armazenada para o desafio. Tendo feito isso, o mesmo programa malicioso poderia então fornecer uma interpretação inteiramente fictícia da parte desconhecida do desafio (por 10 exemplo, a palavra lida) e então armazenar tanto a imagem desconhecida (ou arquivo de áudio) e a resposta fictícia de modo que a mesma resposta fictícia pode ser dada se o software malicioso puder eventualmente fornecer a mesma resposta fictícia para a parte desconhecida do desafio de 15 modo que o computador que apresenta o reCAPTCHA designaria de maneira inapropriada um nível de alta confiança a esta resposta para a parte desconhecida do desafio.

Ademais, para assegurar contra 'bots' ou agentes automatizados, a presente invenção poderá empregar 20 múltiplos mecanismos. Por exemplo, imagens de palavras desconhecidas serão fornecidas a múltiplos usuários para obter confiança sobre a correção da palavra. Além disso, quando uma imagem ou outro desafio for dado a múltiplos usuários ela poderá ser distorcida aleatoriamente cada vez 25 antes de ser apresentada ao usuário. Portanto, imagens idênticas nunca serão servidas múltiplas vezes.

Um benefício adicional da presente invenção é que se alguma vez ele for quebrado por um bot automatizado, então aquele bot pode ser utilizado para melhorar diretamente a precisão do reconhecimento de caracteres em livros digitalizados ou em transcrever arquivos de áudio. Isto é, melhoramentos na precisão dos programas em derrotar a presente invenção traduz diretamente em melhoramentos no reconhecimento automatizado do texto em livros digitalizados ou áudio em clipes gravados. Isto não é verdadeiro dos CAPTCHAs anteriores, em que as imagens eram criadas artificialmente.

Em resumo, a presente invenção pode ser utilizada para distinguir entre seres humanos e computadores e gerar informação útil. Símbolos, como imagens (ou clipes de áudio) que os computadores não podem interpretar, são apresentados à entidade que estiver tentando acessar um sítio da Web. Alguns desses símbolos foram identificados anteriormente e outros não foram anteriormente identificados. Se a entidade que acessar um sítio da Web interpretar corretamente o símbolo identificado anteriormente, supõe-se que a entidade seja humana e que a informação que ela entrou supõe-se que esteja correta; se a entidade não entrar corretamente com uma interpretação correta então se supõe que a entidade seja um computador. Após apresentar um desafio de palavra desconhecida a um número de usuários determinados como sendo seres humanos, as interpretações das palavras desconhecidas são comparadas e um nível de confiança é estabelecido para cada interpretação. Uma vez o nível de confiança de uma interpretação atinja um nível predeterminado, supõe-se que a interpretação seja correta. Neste caso, pode-se colher a potência cerebral dos usuários do computador para coletar informação que os computadores não são capazes de gerar, como a identificação de palavras que não podem ser identificadas corretamente pelos programas de reconhecimento óptico de caracteres ou a transcrição da fala que os programas de reconhecimento da fala não puderam reconhecer. Para impedir que software malicioso forneça 5 repetidamente uma resposta consistente, mas incorreta, em um desafio, tanto o símbolo anteriormente identificado como a palavra desconhecida são distorcidos aleatoriamente antes de serem apresentados ao usuário, impedindo o software malicioso de reconhecer repetidamente a palavra 10 desconhecida.

Muitas variações são possíveis com a presente invenção. Estes e outros ensinamentos, variações, e vantagens da presente invenção tornar-se-ão aparentes da seguinte descrição detalhada da invenção.

DESCRIÇÃO SUCINTA DAS VÁRIAS VISÕES DO DESENHO

Versões da presente invenção serão descritas agora, apenas por meio de exemplo, com referência aos desenhos acompanhantes para a finalidade de ilustrar as versões, e não para a finalidade de limitar a invenção, em que:

A Figura 1 ilustra uma versão de um sistema de acordo

com a presente invenção.

A Figura 2 é um fluxograma que ilustra uma versão de um método de acordo com a presente invenção.

A Figura 3 é um fluxograma que ilustra uma versão de um método de acordo com a presente invenção em que são geradas as partes de leitura e as partes de verificação.

A Figura 4 é um fluxograma que ilustra uma versão da presente invenção em que as respostas aos desafios são utilizadas para suplementar a representação eletrônica dos

3 0 documentos. A Figura 5 ilustra um exemplo de texto digitalizado de um livro.

A Figura 6 ilustra imagens exemplares geradas de livros digitalizados de acordo com a presente invenção.

A Figura 7 é um fluxograma que ilustra uma versão da

operação da presente invenção utilizada em conjunto com texto digitalizado de um programa de reconhecimento óptico de caracteres.

A Figura 8 ilustra outra versão de um sistema de

acordo com a presente invenção.

A Figura 9 é um fluxograma que ilustra uma versão da etapa de determinação ilustrada na Figura 2.

A Figura 10 ilustra uma versão da presente invenção em que imagens são tomadas de um documento e utilizadas como

parte de um desafio.

DESCRIÇÃO DETALHADA DA INVENÇÃO

A Figura 1 ilustra uma versão de um sistema 10 de acordo com a presente invenção. O sistema 10 inclui vários computadores 12 conectados juntos através de uma rede 14.

2 0 Embora apenas um computador 12 seja mostrado com um

processador 16, memória 18, um dispositivo de entrada 20, e um dispositivo de saída 22, outros computadores 12 também poderão incluir processadores 16, memória 18, um dispositivo de entrada 20, e um dispositivo de saída 22.

Ademais, o sistema 10 poderá incluir mais ou menos computadores 12 do que estão ilustrados na Figura 1.

O sistema 10 não precisa ser dedicado à operação da presente invenção, e embora alguns dos computadores 12 no sistema 10 poderão ser utilizados por pessoas que utilizam

3 0 a presente invenção (por exemplo, pessoas que procuram acesso para outras partes do sistema 10) , outros computadores 12 podem ser associados com processos que controlam a operação da presente invenção e a operação do sistema 10 (por exemplo, servidores que controlam a 5 interação entre usuários, coletam e processam dados, e criam ou atualizam bases de dados de acordo com a presente invenção), e alguns dos computadores 12 poderão ser utilizado por pessoas que efetuam outras tarefas não associadas à presente invenção (por exemplo, pessoas que se 10 comunicam pela rede 14 independentemente da presente invenção).

Os computadores 12 poderão ser computadores no sentido tradicional, como computadores de finalidades gerais, servidores, ou outros tipos de computadores. Também, um ou

mais dos computadores 12 poderão ser nada mais do que dispositivos de entrada/saída, como os terminais burros, que permitem ao usuário se comunicar com outras partes do sistema 10. Os computadores 12 também poderão todos ser os mesmos ou eles poderão ser diferentes. Os computadores 12 20 poderão, por exemplo, incluir processadores 16, dispositivos de memória 18, dispositivos de entrada 20, dispositivos de saída 22.

Os computadores 12 poderão assumir formas diferentes. Embora os computadores 12 sejam descritos genericamente em 25 termos de interfaces para o usuário humano, em algumas versões o computador poderá incluir um processador 16 e dispositivo de memória 18 conectados à rede 14 sem qualquer dispositivo de interface humano (como sem um teclado 2 0 ou uma tela 22) . Tal computador 12 poderá, por exemplo, ser

3 0 acessado através da rede 14 de um ou mais dos demais computadores 12 e poderá, por exemplo, ser utilizado para processar e armazenar dados de acordo com a presente invenção ou operar e controlar os processos de acordo com a presente invenção. Mais do que um processador 16 e um dispositivo de memória 18 poderão ser utilizados de acordo com a presente invenção. Em uma versão, o processador 16 e dispositivos de memória 18 são utilizados para efetuar tarefas de acordo com a presente invenção, e um processador diferente 16 e diferentes dispositivos de memória 18 são utilizados para criar, armazenar, processar, e acessar uma base de dados criada de acordo com a presente invenção.

A rede 14 poderá, por exemplo, ser a Internet ou alguma outra rede pública ou privada. Em outras versões a rede 14 poderá ser conexões direta entre os computadores 12, como cabos ou fios, sem utilizar os tradicionais elementos de rede. Adicionalmente, o número, tipo, interconexão, e outras características do sistema 10, computadores 12, e rede 14, pode variar de acordo com a presete invenção.

O processador 16 recebe entrada do dispositivo de entrada 20 e/ou de outros computadores 12 e fornece sinais para controlar o dispositivo de saída 22 ou fornecer dados de ou para controlar outros computadores 12 ou outras partes do sistema 10. 0 processador 16 também efetua certas funções, conforme aqui descritas. 0 processador 16 poderá executar instruções lidas por computador, como na forma de software, firmware, e hardware. As instruções lidas por computador, quando executadas pelo processador 16, poderão fazer com que o processador 16 ou outros dispositivos operem de uma maneira particular e façam com que sinais sejam processados de uma maneira particular. As instruções lidas por computador, por exemplo, poderão ser armazenadas em um ou mais dispositivos de memória 18, que poderão ou não ser partilhados por dois ou mais processadores 16 ou outros dispositivos. Os processadores 16 também poderão ser incluídos em outras partes do sistema 10 para controlar vários aspectos da operação do sistema 10. Os processadores

16 poderão trabalhar juntos ou independentemente.

A memória 18 pode ser qualquer forma de memória lida por computador incorporada como qualquer forma de mídia lida por computador. Por exemplo, a memória 18 poderá armazenar informação em forma magnética, em forma eletrônica, em forma óptica, ou em outras formas, e poderá ser integral com outro dispositivo, como um processador 16, ou ela poderá ser separada, como um dispositivo de memória 18 independente ou removível. A memória 18 poderá ser incorporada como várias formas de mídia 18, como discos ópticos, discos magnéticos, dispositivos de memória portáteis/removíveis, e outras formas.

A memória 18 poderá incluir instruções lidas por computador que, quando executadas pelo processador 16, fazem com que o processador 16 efetue certas funções, conforme aqui descritas. A memória 18 poderá ser separada do processador 16, ou a memória 18 poderá ser integrada ao processador 16. A memória 18 também poderá incluir mais de um dispositivo de memória, que poderão estar integrados com o processador 16, separados do processador 16, ou ambos. Desta maneira, o sistema 10 poderá fazer com que este seja operado da maneira desejada de acordo com a presente invenção. O dispositivo de entrada 20 poderá ser um teclado, uma tela de toque, um mouse de computador, um microfone, ou outras formas de entrar com a informação de um usuário.

O dispositivo de saída 22 poderá ser um monitor de vídeo, um alto-falante, ou outras formas de emitir informação para o usuário.

Muitas variações são possíveis com o sistema 10, de acordo com a presente invenção. Por exemplo, embora o sistema 10 seja ilustrado no contexto de operar por uma rede 14, o sistema 10 poderá ser implementado como uma máquina individualizada com um ou mais computadores 12 e que não depende de uma rede 14. Outrossim, mais de um processador 16, memória 18, dispositivo de entrada 20, e dispositivo de saída 22 poderá estar presente em cada computador 12. Além disso, dispositivos não mostrados na Figura 1 também poderão ser incluídos no sistema 10, e alguns dispositivos mostrados na Figura 1 poderão ser omitidos, combinados ou integrados juntos dentro de um único dispositivo.

A presente invenção é descrita em termos de controlar o acesso a um 'sistema' . 0 'sistema' ao qual acesso é controlado será geralmente descrito em termos de um ou mais computadores 12 que poderão, por exemplo, ser incorporados como um servidor da Web e/ou outros dispositivos trabalhando juntos como um sistema de computador 12. A presente invenção também utiliza o termo 'sistema' com o número de referência 10 no contexto de um grupo de vários computadores 12 conectados através de uma rede 14. O acesso a um sistema 10 também poderá ser controlado pela presente invenção e está incluído no sistema de computador 12 ao qual o acesso é controlado pela presente invenção.

A Figura 2 é um fluxograma que ilustra uma versão de um método de acordo com a presente invenção. 0 método poderá, por exemplo, ser incorporado em instruções lidas 5 por computador armazenadas em um ou mais dispositivos de memória 18 no sistema 10 e executado por um ou mais processadores 16 no sistema 10.

A etapa 3 0 do método inclui gerar um desafio para o usuário de um sistema de computador. 0 desafio inclui uma 10 parte de 'verificação' para a qual uma resposta é conhecida, e uma parte de 'leitura' do desafio para a qual uma resposta não é conhecida, 0 desafio poderá, por exemplo, ser um desafio visual em que o usuário é orientado a olhar para uma imagem e produzir uma resposta particular. 15 Embora a presente invenção seja genericamente descrita em termos de desafios visuais, a presente invenção não é limitada ao uso de desafios que são visuais. Por exemplo, em outras variações da presente invenção o desafio poderá ser um desafio de áudio em que o usuário é orientado a

2 0 ouvir a uma gravação de áudio e produzir uma resposta desejada. Também é possível para a presente invenção ser utilizada com desafios outros que não o visual e o de áudio, como desafios tácteis que poderão ser, por exemplo, utilizados de uma maneira similar ao Braille, e desafios 25 relacionados ao olfato e ao gosto.

Como é aqui utilizado 'conhecido' e 'não conhecido' poderão se referir a uma certeza em relação à resposta a uma parte correspondente do desafio. Em contraste, 'conhecido' e 'não conhecido' poderão não representar uma certeza e poderão, em vez disso, referir-se a um nível de confiança em relação â resposta. Por exemplo, processos de reconhecimento óptico de caracteres (OCR) geralmente produzem uma pontuação de confiança em relação à precisão da conversão de uma imagem para uma representação 5 eletrônica dos caracteres naquela imagem. Isso, por exemplo, poderá ser feito em base de um caractere de cada vez, em base de uma palavra de cada vez, ou de outras maneiras. Esta pontuação de confiança do processo de OCR poderá ser utilizada para determinar se um caractere, uma 10 série de caracteres, palavras, ou uma série de palavras são 'conhecidas' ou 'não conhecidas'. Outros critérios também poderão ser utilizados para fazer a determinação de 'conhecido' e de 'não conhecido'.

A etapa 32 inclui orientar o usuário para resolver 15 tanto a parte de verificação do desafio como a parte de leitura do desafio. 0 usuário poderá ser orientado com um desafio visual ao apresentar tanto as partes de leitura como de verificação do desafio em um monitor ou outro dispositivo de saída. As partes de leitura e de verificação

2 0 poderão ser apresentadas ao mesmo tempo ou em tempos

diferentes. Em geral, acredita-se que os melhores resultados serão obtidos se a parte de leitura e de verificação são indistinguíveis uma da outra na aparência geral (como na fonte, tamanho e quantidade de distorção 25 igual ou similar), embora isso não seja obrigatório para a presente invenção. Como resultado, a presente invenção poderá incluir modificar pelo menos uma característica perceptível de um ou de ambos da parte de verificação do desafio e da parte de leitura do desafio. A etapa de

3 0 modificar poderá ser parte da etapa de gerar um desafio 30, ou ela poderá ser uma etapa separada efetuada, por exemplo, após a geração do desafio 3 0 e antes de orientar o usuário 32 .

Por exemplo, em um desafio visual as partes de leitura e de verificação poderão estar distorcidas da mesma maneira de modo que elas possuem aparências similares. Se as partes de leitura e de verificação não forem similares na aparência para começar, uma poderá ser distorcida de maneira diferente da outra de modo a tornar suas aparências similares. No entanto, não é obrigatório que as partes de leitura e de verificação tenham a mesma aparência geral e, em algumas versões da presente invenção, as partes de leitura e de verificação possuem aparências diferentes, como de distorcer as partes de leitura e de verificação de maneiras diferentes.

De acordo com uma versão da presente invenção, as partes de leitura e de verificação do desafio são tomadas do mesmo material fonte, como o mesmo documento. Dessa maneira, características de formato, fonte, idade, e outras distorções ao documento geralmente serão as mesmas entre as duas partes. De maneira similar, a ordem em que as partes de leitura e de verificação são apresentadas ao usuário poderão ser aleatoriamente variadas. Por exemplo, as partes de leitura e de verificação poderão ser apresentadas lado a lado, com a parte de leitura aparecendo primeiro algumas das vezes, e a parte de verificação aparecendo primeiro em outras vezes.

Muitas variações são possíveis na maneira em que as partes de leitura e de verificação são apresentadas ao usuário. Por exemplo, as partes de leitura e de verificação poderão ser processadas juntas como uma única cadeia de caracteres ou elas poderão ser separadas como duas ou mais palavras diferentes ou duas ou mais cadeias diferentes de caracteres. Por exemplo, uma única palavra comprida poderá ser decomposta em duas ou mais partes, ou duas ou mais palavras curtas poderão ser agrupadas juntas. Além disso, é possível utilizar mais de uma das partes de leitura (por exemplo, uma parte de leitura tendo mais de uma palavra), e mais de uma das partes de verificação (por exemplo, uma parte de verificação tendo mais de uma palavra) . Por exemplo, algumas versões poderão utilizar uma parte de leitura e duas ou mais partes de verificação, algumas versões poderão utilizar duas ou mais partes de leitura e uma parte de verificação, e algumas versões poderão utilizar duas ou mais partes de leitura e duas ou mais partes de verificação.

A presente invenção será geralmente descrita em termos de um desafio visual que consiste de imagens distorcidas de palavras, embora a presente invenção não seja limitada a esses desafios. Por exemplo, o desafio poderá ser na forma de um ou mais números, outros caracteres, símbolos, ou combinações de números, letras, caracteres, ou símbolos. Por exemplo, a presente invenção poderá tomar vários caracteres de uma ou mais palavras conhecidas ou desconhecidas e utilizá-las como parte de um desafio. Outras variações também são possíveis, por exemplo, como um desafio incluindo uma fotografia ou um desenho que o usuário resolve ao digitar o nome de um objeto na fotografia ou no desenho. Muitas outras variações também são possíveis com a presente invenção. A etapa 34 inclui receber entrada do usuário. Esta entrada é a resposta do usuário ao desafio e poderá, por exemplo, ser apresentada como uma representação eletrônica de caracteres, como uma representação eletrônica de dados 5 de áudio, ou em outras formas dependendo da natureza do desafio. Por exemplo, se o usuário digitar uma resposta de um teclado, a resposta do usuário provavelmente estará na forma de uma representação ASCII em formato eletrônico.

A etapa 36 inclui determinar se a entrada do usuário 10 em relação à parte de verificação do desafio corresponde à resposta conhecida para a parte de verificação do desafio. Determinar se a entrada do usuário em relação à parte de verificação do desafio corresponde à resposta conhecida para a parte do desafio poderá ser feita de várias 15 maneiras. Por exemplo, a determinação poderá ser feita ao comparar a entrada do usuário com uma resposta conhecida. Em outra versão, a entrada do usuário poderá ser enviada para outro local, como um computador 12 diferente na rede 14, onde a entrada do usuário poderá ser comparada com uma

2 0 resposta conhecida e, daí em diante, os resultados são devolvidos. Desta maneira, por exemplo, as respostas aos desafios poderão, por exemplo, ser mantidas em um ou mais depósitos centrais. Servidores de sítios da Web ou outros computadores que utilizam a presente invenção podem receber 25 os desafios do depósito central, e então enviar de volta para o depósito central (ou para algum outro computador 12) dados indicativos das respostas propostas pelos usuários. 0 depósito central (ou outro computador 12) fornecerá informação indicativa de se o desafio foi respondido 30 corretamente e, assim, se o usuário é considerado como sendo um ser humano ou não-humano. Outras variações também são possíveis.

A etapa 38 inclui identificar a entrada do usuário em relação à parte de leitura do desafio como uma resposta ã parte de leitura do desafio se a entrada do usuário em relação à parte de verificação do desafio corresponder à resposta conhecida para a parte de verificação do desafio. Em outras palavras, se o usuário fornecer uma resposta correta para a parte de verificação, então é suposto que o usuário ê um ser humano e que ele pode identificar de maneira apropriada a parte de leitura do desafio. Portanto, a resposta do usuário à parte de leitura do desafio é identificada como uma resposta, ou uma resposta potencial, para a parte de leitura do desafio. Como é descrito abaixo, a parte de leitura poderá ser utilizada mais de uma vez e as respostas comparadas antes de ser determinado se uma resposta particular está correta.

Como resultado, o usuário poderá ser considerado como sendo um ser humano sem determinar a precisão da resposta dada para a parte desconhecida (ou parte de leitura) do desafio. Em outras palavras, menos da totalidade da resposta do usuário ê conferida ou verificada antes de uma decisão ser tomada sobre a concessão de acesso ao usuário. No entanto, como foi aqui declarado, são feitos esforços para tornar difícil para o usuário saber qual parte do desafio ê a parte de leitura e qual parte do desafio é a parte de verificação. Portanto, o ser humano terá uma experiência mais fácil e mais prazerosa (e obter acesso mais rapidamente) ao resolver o desafio inteiro em vez de tentar escolher a resposta correta mínima possível para obter acesso. A etapa 4 0 inclui permitir que o usuário acesse o sistema se a entrada do usuário em relação à parte de verificação do desafio corresponder à resposta conhecida da parte de verificação do desafio. Em outras palavras, quando o usuário for determinado como sendo um usuário humano, o usuário tem o acesso concedido.

Muitas variações são possíveis com a presente invenção. Por exemplo, embora a presente invenção tenha sido descrita em termos de permitir o acesso ao usuário se a entrada do usuário em relação à parte de verificação do desafio corresponder à resposta conhecida para a parte de verificação do desafio, a presente invenção não é assim tão limitada. Por exemplo, testes adicionais poderão ser apresentados ao usuário antes do acesso ser concedido.

Outra versão da presente invenção modifica a presente invenção para acomodar o usuário. Por exemplo, o usuário poderá fornecer sua nacionalidade ou seu idioma preferido, e a presente invenção pode com isso fornecer material de desafio em um idioma apropriado. De modo similar, pelo endereço IP do usuário, o país em que o usuário está operando pode ser determinado e isso poderá ser utilizado para fornecer desafios no idioma apropriado,

A presente invenção também pode aprimorar a probabilidade de que os desafios sejam facilmente resolvidos por seres humanos ao medir, para cada caso, como os seres humanos são bem sucedidos em resolvê-lo, e quanto tempo leva para eles o fazerem. Desafios que são mais fáceis para os seres humanos serão reutilizados mais vezes, assim aumentando a taxa de sucesso geral para os seres humanos .

De maneira similar, a presente invenção poderá dar margem para certos comportamentos 'humanos' ao avaliar a entrada do usuário. Em algumas versões, a presente invenção 5 dá margem para um número predeterminado ou tipo de erro tipográfico (por exemplo, um por palavra) na resposta fornecida pelo usuário.

Em outras versões, o comportamento humano conhecido poderá ser identificado como sendo indesejável. Por 10 exemplo, é possível conhecer certa informação sobre os usuários, como seu endereço IP, o país em que estão operando, e seu histórico anterior com CAPTCHA (como através da utilização de cookies). Como resultado, certo comportamento poderá ser utilizado para identificar 15 usuários humanos indesejáveis, como aqueles que tentam gerar contas de usuário que são vendidas ou de outra forma fornecidas para spammers. Por exemplo, se um usuário responder mais de um número predeterminado de desafios CAPTCHA em um período de tempo dado, o usuário poderá ser 20 marcado como um usuário não-genuíno. Certas medidas poderão ser tomadas contra tais usuários, como fornecer a eles palavras mais longas em seus desafios, fornecer a eles desafios que são mais distorcidos do que o normal, e recusar mais acesso a esses usuários em casos extremos.

A Figura 3 é um fluxograma que ilustra uma versão da

presente invenção em que são geradas as partes de leitura e as partes de verificação. Esta parte da presente invenção poderá ser utilizada para gerar as partes de leitura e de verificação do desafio. No entanto, isto não é obrigatório

3 0 e, por exemplo, é possível criar partes de leitura e de verificação do desafio através de outras fontes, e não conforme aqui fornecido. As partes de leitura e de verificação do desafio poderão ambas ser geradas do mesmo documento, ou elas poderão ser geradas de documentos diferentes ou de fontes outras que não os documentos. 0 método ilustrado nesta Figura poderá, por exemplo, ser incorporado em instruções lidas por computador armazenadas em um ou mais dispositivos de memória 18 no sistema 10 e executadas por um ou mais processadores 16 no sistema 10.

A etapa 50 inclui criar uma representação eletrônica de uma imagem de um documento Isto, por exemplo, poderá ser feito ao digitalizar o documento utilizando técnicas convencionais de digitalização. Por exemplo, o documento poderá ser um jornal, um periódico, ou qualquer outro documento em que palavras estejam presentes. Outrossim, é possível para a presente invenção ser utilizada com texto de várias formas. Por exemplo, texto manuscrito (tanto impresso como cursivo), como letras e anotações de pessoas historicamente significativas, poderão ser utilizados como material fonte com a presente invenção. Ademais, também é possível utilizar documentos que contenham imagens que não representam palavras, como documentos q2ue representam números, outros símbolos, ou fotografias.

A etapa 52 inclui converter a representação eletrônica da imagem do documento em uma representação eletrônica dos caracteres do documento. Isto poderá, por exemplo, ser feito com técnicas de OCR convencionais. Em algumas versões, a etapa de converter é efetuada mais de uma vez utilizando técnicas de OCR diferentes. A conversão 52 também poderá ser feita, pelo menos em parte, por seres humanos. A representação eletrônica das imagens e do texto do documento original poderá ser armazenada em um ou mais dispositivos de memória 18 acessados por um ou mais dos computadores 12 no sistema 10. Em outras versões, a representação eletrônica das imagens e do texto poderá ser armazenada em memória 18 não conectada ao sistema 10, e poderá ser transferida de qualquer número de maneiras, como através de um dispositivo de memória removível ou portátil 18 .

A etapa 54 inclui produzir uma medida representativa da confiança que a representação eletrônica dos caracteres do documento corresponde com precisão ao documento. A 'medida' significa qualquer método, ou combinação- de métodos, para avaliar uma medida de confiança de que a representação eletrônica dos caracteres do documento corresponde com precisão ao documento. Esta medida é utilizada para separar parcelas do texto em partes 'conhecidas' e partes 'desconhecidas' para utilização com a presente invenção. Esta medida poderá ser gerada automaticamente pelo processo de OCR, através da revisão humana, ou através de outros meios. Por exemplo, quando mais de uma técnica de OCR for utilizada na etapa 52, as técnicas de OCR diferentes produzirão ocasionalmente um caractere diferente ou uma combinação de caracteres para a mesma parcela da imagem. Em uma versão da invenção, quando um ou mais caracteres diferentes são produzidos, aquela parcela do texto ê identificada como sendo 'não conhecida'. Em outras versões, um caractere, cadeia de caracteres, ou palavra é identificado como sendo 'não conhecido' se ele não aparecer em uma base de dados predeterminada como, por exemplo, um dicionário. Combinações de fatores poderão ser utilizados, e eles poderão ser combinados e ponderados para produzir a 'medida' representativa de uma confiança de que a representação eletrônica dos caracteres do documento 5 corresponde com precisão ao documento.

A etapa 56 inclui designar pelo menos uma parcela da representação eletrônica dos caracteres do documento como não tendo uma resposta conhecida com base na medida representativa da confiança de que a representação 10 eletrônica dos caracteres do documento corresponde com precisão ao documento.

Embora seja possível para o documento produzir apenas itens 'conhecidos' ou apenas itens 'não conhecidos', isso é improvável e a maioria dos documentos ou outras fontes para 15 o material de desafio produzirão tanto os itens conhecidos e os não conhecidos. Assim, a etapa seguinte poderá ser incluída com a presente invenção, embora não seja obrigatório que ela seja utilizada com as etapas acima.

A etapa 58 inclui designar pelo menos uma parte da

2 0 representação eletrônica dos caracteres do documento como tendo uma resposta conhecida com base na medida representativa da confiança que a representação eletrônica dos caracteres do documento corresponde com precisão ao documento.

Em algumas versões da presente invenção, uma parte

'não conhecida' poderá tornar-se uma parte 'conhecida'. Por exemplo, se os usuários fornecerem consistentemente a mesma resposta para uma parte 'não conhecida', ela poderá ser modificada para uma parte 'conhecida' e utilizada de acordo. De modo similar, se uma parte 'conhecida' for respondida consistentemente de maneira incorreta, ela poderá ser modificada para uma parte 'não conhecida'. Este último exemplo poderá ocorrer quando uma parcela do documento for identificada incorretamente com um alto grau de confiança, ou quando duas ou mais técnicas de OCR cometerem o mesmo erro.

Diferentes critérios poderão ser utilizados para mudar partes 'conhecidas' em partes 'não conhecidas' e vice versa. Por exemplo, um número predeterminado de respostas corretas ou incorretas, respectivamente, uma porcentagem predeterminada de respostas corretas ou incorretas, respectivamente, ou outros critérios poderão ser utilizados.

Outro método para modificar uma parte 'conhecida' em uma parte 'não conhecida' é se um excesso de usuários 'renovarem' o desafio. Em outras palavras, CAPTCHAs muitas vezes permite aos usuários 'renovar' ou obter outro desafio sem tentar o primeiro desafio apresentado. Isto é para possibilitar uma situação em que o desafio foi distorcido além do ponto em que mesmo um ser humano possa lê-lo. Se esse renovar ocorrer vezes demais, o desafio (ou as partes do desafio) poderá ser removido do sistema para uma revisão humana. Em alguns casos, texto não legível (como um ponto de sujeira no documento) pode ser lido erroneamente pelas técnicas de OCR, ou uma distorção excessiva poderá ter sido aplicada à imagem de modo que nem um ser humano a pudesse Ier. Tal situação torna o desafio imprestável para distinguir os usuários humanos dos usuários não-humanos e medidas poderão ser tomadas para identificá-las e removê- A Figura 4 é um fluxograma que ilustra uma versão da presente invenção em que as respostas aos desafios são utilizadas para suplementar a representação eletrônica dos documentos. Em outras palavras, quando uma resposta foi determinada para uma palavra anteriormente desconhecida (uma imagem utilizada anteriormente como a parte de 'leitura' do desafio), então esta resposta pode ser utilizada para melhorar a representação eletrônica do documento do qual a imagem foi digitalizada. No entanto, isto não significa que a imagem não é mais utilizada. Pelo contrário, ainda é possível continuar a utilizar a imagem como a parte de verificação de um desafio, ou utilizá-la de outras maneiras. Ademais, este aspecto da invenção não é obrigatório, e em algumas versões é possível que as respostas as palavras desconhecidas nunca sejam utilizadas para suplementar o documento original. Por exemplo, é possível que textos antigos possam ser utilizados apenas como uma fonte para o material do desafio, sem converter o documento em uma forma eletrônica representativa do texto.

0 método ilustrado nesta Figura poderá, por exemplo, ser incorporado em instruções lidas por computador armazenadas em um ou mais dispositivos de memória 18 armazenados no sistema 10 e executado por um ou mais processadores 16 no sistema 10. Esta parte do método, por exemplo, poderá ser efetuada após ser determinado que a entrada do usuário relacionada à parte de leitura do desafio é uma resposta à parte de leitura do desafio.

A etapa 60 inclui fornecer a entrada do usuário em relação à parte de leitura do desafio como a representação eletrônica da imagem correspondente do documento. Em outras palavras, a saída desconhecida do processo de OCR pode ser substituída por uma resposta 'conhecida'. Desta forma, a efetiva tradução do texto eletrônico do texto do documento é melhorada ao colocar material desconhecido ou questionável com material 'conhecido'.

A etapa 62 inclui designar a imagem do documento correspondente à entrada do usuário como tendo uma resposta conhecida. Em outras palavras, agora que os dados são 'conhecidos', aquela parcela do formato eletrônico do texto pode ser modificado de ser designado como 'desconhecido' para ser designado como sendo 'conhecido'. Naturalmente, é sempre possível que material 'conhecido' poderá posteriormente ser encontrado como sendo incorreto-. Nesses casos, os materiais poderão ser atualizados e corrigidos.

0 formato eletrônico do texto do documento original poderá ser armazenado em um ou mais dispositivos de memória 18 acessados por um ou mais dos computadores 12 no sistema 10. Em outras versões, o formato eletrônico do texto do documento original poderá ser armazenado na memória 18 não conectada ao sistema 10, e os dados 'conhecidos' recém determinados poderão ser transferidos de qualquer número de maneiras, como através de um dispositivo de memória removível ou portátil 18.

A Figura 5 ilustra um exemplo do texto digitalizado de um livro. Os caracteres ASCII a ele associados pelo motor OCR são: "*niis aged pntkm at society were distinguished from." A presente invenção poderá utilizar parte ou a totalidade deste texto digitalizado como parte de um desafio para controlar o acesso ao sistema 10. Após utilizar o texto digitalizado como um desafio, a presente invenção também poderá ser utilizada para identificar o texto correspondente à imagem.

A Figura 6 ilustra imagens CAPTCHA exemplares geradas de livros digitalizados de acordo com a presente invenção.

5 Há muitas maneiras de criar imagens CAPTCHA, e aquelas aqui ilustradas são apenas ilustrativas e não limitativas.

A Figura 7 é um fluxograma que ilustra uma versão da operação da presente invenção utilizada em conjunto com texto digitalizado de um programa de reconhecimento óptico 10 de caracteres (OCR). Embora esta versão ilustrada seja com relação a um desafio visual que utiliza texto, este mesmo processo geral poderá ser utilizado com um desafio visual que utiliza não-texto, ou com desafios não-visuais.

A etapa 7 0 ilustra um livro ou outro documento que é 15 utilizado como a fonte para o material do desafio. O documento poderá ser um para o qual uma tradução do texto digital é desejada, ou ele poderá ser um documento de pouco interesse, mas que é uma fonte útil de material para a presente invenção. O texto poderá, por exemplo, ser

2 0 impresso mecanicamente ou manuscrito.

A etapa 72 ilustra o processo de reconhecimento óptico de caracteres (OCR) ou outros processos sendo utilizado para converter imagens do documento 7 0 em formato eletrônico. O processo de OCR 72 também poderá fornecer 25 processamento adicional, como identificar uma confiança que a imagem foi convertida de maneira apropriada em texto, e fornecer uma separação de imagem da palavra.

A etapa 74 ilustra a identificação de uma imagem de uma palavra que o processo de OCR 72 não pode Ier

3 0 corretamente. Esta imagem será utilizada com a presente invenção como a parte de leitura de um desafio. As palavras que o OCR 72 não pode Ier corretamente poderão ser eventualmente identificadas através da operação da presente invenção e utilizadas como a parte de verificação do desafio, como será ilustrado abaixo.

A etapa 76 determina se uma resposta gerada pelo usuário é conhecida para a imagem particular. Em outras palavras, a imagem foi anteriormente utilizada como a parte de leitura de um desafio e, se tiver sido, há confiança suficiente de que a imagem foi identificada corretamente?

Se for determinado que a resposta gerada pelo usuário não for conhecida para a imagem particular, então a imagem é distorcida para utilização como a parte de leitura de um desafio conforme ilustrado na etapa 78.

A etapa 8 0 ilustra o desafio sendo criado e

apresentado para o usuário. O desafio inclui uma parte de leitura (a imagem desconhecida) e uma parte de verificação (a imagem conhecida) .

A etapa 82 ilustra o processamento da entrada do usuário. É suposto que a parte de leitura (ou desconhecida) do desafio está correta se a parte de verificação (ou conhecida) do desafio for respondida corretamente.

A etapa 84 ilustra a resposta à parte de leitura que está sendo retida. A mesma imagem poderá ser utilizada mais de uma vez como a parte de leitura de um desafio antes de uma determinação ser feita sobre se a resposta à imagem é conhecida.

Com referência de volta à etapa 76, se for determinado que uma resposta gerada pelo usuário é conhecida para uma

3 0 imagem particular, então aquela imagem poderá ser utilizada como a parte de verificação de um desafio.

A etapa 8 6 ilustra a distorção da imagem que será agora utilizada como a parte de verificação de um desafio. Neste exemplo, a imagem nas etapas 8 6 e 8 8 é distorcida de 5 maneira diferente da imagem para a mesma palavra nas etapas 78 e 80. Por exemplo, isto poderá ser feito para impedir usuários não-humanos de circundarem a proteção oferecida pela presente invenção.

A etapa 88 ilustra a imagem sendo utilizada como a 10 parte de verificação de um desafio. Nesta versão, este desafio particular inclui apenas uma parte de verificação, e não inclui uma parte de leitura. Em outras versões, o desafio poderá incluir tanto a parte de leitura como a parte de verificação, e a parte de verificação poderá 15 utilizar uma imagem que fòi desconhecida anteriormente, mas que agora é conhecida.

A Figura 8 ilustra outra versão de um sistema 10 de acordo com a presente invenção. Nesse sistema, há um computador 12/100 sendo utilizado por um usuário 20 desconhecido, um computador 12/102 sendo utilizado como um servidor da Web ou algum outro computador ou sistema que o usuário deseja acessar, e um computador 12/104 sendo utilizado na operação da presente invenção e referido como um 'computador CAPTCHA'. 0 computador 12/100 de um usuário 25 desconhecido está tentando acessar um sitio da Web hospedado no servidor do sítio da Web 12/102. 0 computador CAPTCHA 12/104 retém as imagens, os arquivos de áudio, ou outros dados utilizados para os desafios. O servidor do sítio da Web 12/102 poderá utilizar a presente invenção,

3 0 por exemplo, ao registrar com o computador CAPTCHA 12/104 e acrescentar algumas linhas de código de seu próprio sitio da Web para permitir ao servidor do sítio da Web 12/102 acessar tanto os desafios conhecidos anteriormente (a parte de verificação) como os desafios anteriormente desconhecidos (a parte de leitura).

O sistema 10 da presente invenção poderá ser utilizado para processar grandes números de símbolos que a tecnologia de OCR não pode interpretar. Como resultado, o sistema 10 da presente invenção poderá ser implementado como um sistema de grande escala 10 que poderá, por exemplo, servir uma parcela significativa de todos os CAPTCHAs por toda a Internet.

Muitas versões e variações diferentes são possíveis. Por exemplo, embora um computador CAPTCHA 104 seja mostrado no sistema 10 ilustrado, mais de um computador CAPTCHA 104 poderá ser utilizado de modo a fornecer um sistema mais distribuído 10. Em outras versões, não precisa haver um computador CAPTCHA 12/104 separado, e em vez disso o servidor do sítio da Web 12/102 poderá incluir a totalidade dos dados necessários para operar de acordo com a presente invenção e, portanto, o servidor do sítio da Web 12/1-2 também é o computador CAPTCHA 12/104. Ademais, embora o sistema 10 ilustrado mostre apenas um servidor do sítio da Web 102 e apenas um computador do usuário 100, mais de um servidor do sítio da Web 12/102 (servindo um ou mais sítios da Web) e mais de um computador do usuário 12/10 0 (servindo um ou mais usuários) poderá ser incluído no sistema 10. Na prática, a presente invenção será tipicamente utilizada com muitos usuários 12/100 e muitos sítios da Web 12/100 diferentes. Muitas outras variações são possíveis com a presente invenção. Por exemplo, um problema de monta com as implementações CAPTCHA atuais tem sido a questão de acessibilidade para usuários visualmente deficientes, que não podem Ier imagens distorcidas de texto. Embora a presente invenção tem sido geralmente descrita em termos de desafios visuais, a presente invenção também inclui aplicações que utilizam desafios não-visuais e, com isso, a presente invenção permite maior acessibilidade ao deficiente visual. Em particular, a presente invenção poderá ser implementada com uma alternativa de áudio ou outra alternativa não-visual, e as versões não-visuais poderão ser similares em espírito à versão visual aqui descrita. Por exemplo, arquivos de som (por exemplo, de programas de rádio antigos, de discursos gravados, ou de programas de TV) podem ser coletados, e as palavras que não puderem ser compreendidas pelo software de reconhecimento de fala serão utilizadas para desafios de áudio. Desta maneira, as pessoas que resolvem os desafios de áudio estarão também efetuando a tarefa útil de legendar arquivos de áudio arquivados. Este sistema aprimorará a acessibilidade geral da Web, que atualmente não possui alternativas de áudio para CAPTCHAs.

O sistema 10 aqui revelado terá um benefício adicional para a acessibilidade. Ao melhorar o processo de digitalização de matéria impressa, ele ajudará em tornar esses documentos mais disponíveis para o deficiente visual, que não pode ver as imagens das páginas digitalizadas, mas pode beneficiar-se daqueles textos serem transcritos em formato eletrônico. Por exemplo, após os documentos digitalizados serem transcritos em arquivos ASCII, os usuários visualmente deficientes podem acessá-los através de programas (já comumente disponíveis) que são capazes de Ier arquivos ASCII em voz alta.

A Figura 9 é um fluxograma que ilustra uma versão da etapa de determinar 35 ilustrada na Figura 2, com relação à versão ilustrada na Figura 8. Em particular, embora a etapa de determinar 3 6 poderá ser feita pelo computador 12/102 receber entrada do usuário, também é possível para a etapa de determinar 3 6 (Figura 2) ser efetuada, pelo menos em parte, por um computador diferente 12/104.

A etapa 106 inclui o computador 12/102 enviar para um computador diferente 12/104 os dados representativos da entrada recebida do usuário 12/100.

A etapa 108 inclui o computador 12/102 receber uma resposta indicativa de determinar se a entrada do usuário 12/100 em relação à parte de verificação do desafio corresponder à resposta conhecida para a parte de verificação do desafio.

A Figura 10 ilustra uma versão da operação da presente invenção em que imagens são tomadas de um documento e utilizadas como parte de um desafio. Esta versão, bem como as outras versões aqui descritas, é ilustrativa da presente invenção e não limitativa.

Em resumo, uma parcela do texto 110 de um documento é utilizado como material fonte para o desafio. O documento poderá ser aquele que está sendo digitalizado dentro de formato eletrônico utilizando OCR de modo a estar disponível para uso pela Internet ou em outras aplicações eletrônicas, ou ele poderá ser um documento para o qual nenhuma utilização estã planejada além de como fonte para um desafio. Nesta versão, a maioria das palavras no documento é digitalizada eficazmente e tecnologias de OCR podem converter com precisão as imagens daquelas palavras 5 em um tempo representativo. Pelo menos uma palavra 112, entretanto, não é precisamente identificada pelo processo de OCR. Esta palavra 112 é 'morning' , embora a imagem da palavra 112 seja insuficiente para OCR lê-la adequadamente. Aquela palavra 112 é identificada 114 como não sendo 10 reconhecida pelo processo de OCR e, portanto, um bom candidato para utilização como um desafio. A imagem da palavra 114 é destorcida com linhas e de outras maneiras, e ela é apresentada como uma parte de 'leitura' de um desafio de 'leitura' e de 'verificação' de duas partes 116. Como 15 'morning' não foi reconhecido pelo OCR, a palavra 'upon' também foi apresentada no desafio como a palavra de verificação para determinar se o usuário entra com a resposta correta.

Esta versão será descrita agora em maior detalhe. 20 Começamos com uma imagem de uma página digitalizada 110. Dois programas de OCR diferentes são processados na imagem 110, e suas respectivas saídas são comparadas uma à outra e a um dicionário de inglês. Qualquer palavra 112 que seja decifrada diferentemente por ambos os programas de OCR, ou 25 que não esteja no dicionário de inglês é marcada como 'suspeita'. Essas palavras são tipicamente as palavras que os programas de OCR deixaram de reconhecer corretamente. Cada uma dessas palavras suspeitas 112 é então colocada em uma imagem, destorcida ainda mais, e utilizada como parte

3 0 de um desafio CAPTCHA 116 juntamente com outra palavra para a qual a resposta já é conhecida.

Para baixar a probabilidade de os programas automatizados escolherem aleatoriamente a resposta correta, as palavras de verificação são normalizadas na freqüência - 5 assim, por exemplo, as palavras 'you' e 'abridged' possuem a mesma probabilidade de serem servidas. Ademais, para dar conta do erro humano, cada palavra suspeita é enviada para múltiplos usuários diferentes. A principio, ela é exibida como uma palavra real. Se o usuário entrar com a resposta 10 correta para a palavra de verificação associada, a outra resposta do usuário é gravada como uma escolha plausível para a palavra de leitura. Uma vez a palavra tenha uma indicação plausível do sistema, ela pode ser utilizada como uma palavra de verificação em outros desafios. Respostas a 15 palavras de verificação são utilizadas para obter maior confiança em escolhas humanas anteriores. Por exemplo, se as primeiras duas escolhas humanas concordam uma com a outra, a palavra é marcada como reconhecida corretamente e removida do sistema 10. No caso de discrepâncias entre

2 0 respostas humanas, a presente invenção poderá enviar a

palavra para mais seres humanos e escolher a resposta com o maior número de 'votos', em que cada resposta humana conta como um voto, e cada escolha de OCR conta como metade de um voto. Se não existir nenhuma maioria entre as respostas, a 25 palavra é enviada para mais usuários, até uma maioria existir. Os detalhes de determinar quando uma palavra de leitura é reconhecida corretamente pode variar, e as normas poderão ser diferentes em aplicações diferentes, dependendo, por exemplo, na certeza desejada quando da

3 0 determinação de quando a palavra de leitura é reconhecida corretamente.

Uma etapa pós-processamento é aplicada após todas as palavras suspeitas em um texto terem sido decifradas pelo sistema. Isto é necessário porque os usuários humanos 5 cometem um número de erros pequenos, mas previsíveis. Muitos usuários digitam as duas palavras no desafio sem um espaço, ou omitem maiúsculas e pontuação. Ainda, pessoas com layouts de teclados diferentes muitas vezes entram com caracteres inesperados - por exemplo, usuários turcos 10 freqüentemente entram com o caractere 'i' (sem ponto em cima) em vez de 'i'. Não é também incomum ver usuários cometer erros de digitação como transpor caracteres. Damos conta desses erros de múltiplas maneiras. Primeiro, aplicamos uma série de transformações à entrada inicial do 15 usuário. Por exemplo, se não houver nenhum espaço na entrada, tentamos determinar onde o espaço deveria estar ao casar uma das palavras como uma sub-cadeia. Segundo, quando reconciliar as múltiplas entradas do usuário, levamos em conta erros humanos típicos como digitar em caixa baixa,

2 0 transpor caracteres e substituir um caractere por outro que

esteja próximo no teclado. Terceiro, freqüências 'específicas do livro' são utilizadas para determinar a indicação de probabilidade mais alta para uma dada palavra. Novamente, o grau em que erros são aceitos pode variar e 25 provavelmente será diferente para aplicações diferentes e em situações em que normas diferentes são aplicadas.

A presente invenção tem implementos como um sistema operacional 10, e isto nos permitiu coletar4 um número de resultados. 0 emprego foi alcançado ao ofertar um serviço

3 0 de Web CAPTCHA gratuito através de http://recaptcha.net. Com referência à Figura 8, um sítio da Web 102 que requer proteção contra o abuso automatizado pode obter uma implementação CAPTCHA gratuita e segura. 0 proprietário do sítio da Web 102 acrescente um código HTML simples em seu sítio 102 que exibe uma imagem de desafio CAPTCHA tomada diretamente de nossos servidores 104. Sempre que o usuário 100 entra com a resposta ao desafio CAPTCHA, o sítio da Web entra em contato com nossos servidores 104 para determinar se aquela resposta está correta para o problema exibido. 0 serviço reCAPTCHA foi empregado em 25 de maio de 2007. Desde então, mais de 10.000 sítios da Web começaram a utilizá-lo, e até 25 de novembro de 2007 o sistema estava recebendo mais de três milhões de respostas aos desafios CAPTCHA a cada dia.

O primeiro resultado é que o processo de decifrar palavras utilizando CAPTCHAs pode ser tão preciso quanto dois digitadores humanos digitando o texto independentemente. Uma amostra aleatória de 5 0 artigos digitalizados de cinco anos (1860, 1865, 1908, 1935 e 1970) do arquivo do New York Times (http//www.nytimes.com) foi escolhida e transcrita manualmente para os fins de estimar a precisão de identificar palavras desconhecidas através da presente invenção em base por palavra. Cada palavra contava como um 'acerto' se o algoritmo decifrou a palavra inteira corretamente, e um 'erro' se qualquer uma das letras estivesse errada. A partir disso, a taxa de erro foi definida como o número de erros dividido pelo número total de palavras. Para comparar as taxas de erro de OCR padrão, os resultados do OCR foram processados através do mesmo processo. A presente invenção atinge uma precisão superior a 99,5% ao nível da palavra, enquanto a precisão do OCR padrão é de apenas 82%. Uma precisão de 99,5% é equivalente à precisão de utilizar técnicas de transcrição de 'digitar 5 e verificar' em que dois digitadores profissionais humanos digitam independentemente os dados. Como um relato, as transcrições manuais dos artigos (que foram coletadas como 'verdade chão' para mensurar a precisão da presente invenção) originalmente continha mais erros do que aquelas 10 feitas pela presente invenção. O fato de que a presente invenção pode alcançar uma precisão comparável a dois seres humanos independentes é contra-intuitiva por duas razões. Primeiro, os digitadores humanos podem fazer uso do contexto (palavras imediatamente antes e após), enquanto as 15 palavras apresentadas pela presente invenção são mostradas sozinhas. Segundo, apenas palavras 'suspeitas' são utilizadas com a presente invenção, querendo dizer que a utilização de dois programas de OCR diferentes e um dicionário é suficiente para determinar com alta

2 0 probabilidade quais palavras o OCR não pode decifrar

corretamente.

Outro resultado é que a presente invenção constitui um mecanismo viável para obter grandes quantidades de esforço mental humano. Após apenas seis meses de processar o 25 sistema 10 de acordo com a presente invenção, seres humanos haviam resolvido mais de 250.000.000 CAPTCHAs, totalizando mais de 150.000.000 palavras suspeitas decifradas corretamente. Supondo 100.000 palavras por livro, isto é o equivalente de mais de 7.500 livros transcritos manualmente

3 0 (aproximadamente 2 0% das palavras em um livro são marcadas como suspeitas por nosso algoritmo). 0 sistema 10 continua a crescer em popularidade, e a taxa de transcrição está atualmente a mais de 1,5 milhão de palavras suspeitas por dia - aproximadamente 75 livros por dia. Alcançar esta taxa 5 através de meios convencionais exigiria uma força de trabalho de mais de 500 pessoas decifrando palavras 40 horas por semana.

A presente invenção oferece várias vantagens adicionais. Primeiro, ela é mais segura do que os CAPTCHAs 10 convencionais que geram seus próprios caracteres aleatoriamente distorcidos. É possível construir algoritmos que podem Ier o texto distorcido gerado pela maioria de CAPTCHAs da tecnologia anterior. Ver, por exemplo, K. Chellapilla, P. Y, Simard. Using Machine Learning to Break 15 Visual Human Interaction Proofs (HIPs). Eighteenth Annual Conference on Neural Information Processing Systems, NIPS 2004; G. Mori, J. Malik. Recognizing Objects in Adversarial Clutter: Breaking a Visual CAPTCHA. In IEEE Conference on Computer Vision and Patter Recognition, CVPR 2003. Páginas 20 145-144; e A. Thayananthan, B. Stenger, P.H.S. Toit, R. Cipolla: Shape Context and Chamfer Matching in Clustered Scenes. In IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2003. Páginas 127-133. Uma razão principal para isso é que as distorções artificiais de 25 caracteres nos CAPTCHAs da tecnologia anterior vêm de uma distribuição limitada de transformações possíveis. Portanto, é viável construir algoritmos de aprendizado de máquina que, após algum treinamento, pode reconhecer os caracteres distorcidos. Por outro lado, as palavras

3 0 exibidas pela presente invenção têm dois tipos de distorções. Primeiro, e o mais importante, há distorções naturais que vêm dos textos subjacentes que desbotaram com o tempo, e do ruído no processo de digitalização. Segundo, há transformações artificiais similares àquelas utilizadas pelos CAPTCHAs da tecnologia anterior. Por causa disso, a distribuição das distorções na presente invenção é significativamente menos limitada, e mais difícil de capturar com algoritmos de aprendizado de máquina. Adicionalmente, a presente invenção exibe apenas as palavras para as quais OCR provavelmente falhou. Em essência, essas são as palavras 'mais difíceis' para computadores decifrar e, portanto, são as que mais provavelmente irão distinguir efetivamente entre os usuários humanos e os não-humanos.

A segunda razão para os sítios da Web adotarem a presente invenção é que, embora a presente invenção apresente duas palavras em vez de apenas uma, não leva mais tempo para os usuários resolverem um desafio na presente invenção do que resolver um CAPTCHA da tecnologia anterior. Os CAPTCHAs da tecnologia anterior apresentam seis a oito caracteres escolhidos aleatoriamente, que são igualmente longos para digitar como duas palavras em inglês.

Como foi descrito acima, a presente invenção também poderá ser implementada como um desafio de áudio para indivíduos com deficiência visual. As pessoas cegas surfam na Web utilizando 'leitoras de tela', que são programas que lêem o conteúdo da tela para o usuário. Como as leitoras de tela são elas próprias programas, por definição elas não podem Ier o CAPTCHA da tecnologia anterior para seus usuários. Portanto, os CAPTCHAs da tecnologia anterior com base em palavras distorcidas bloqueiam os indivíduos visualmente deficientes de navegar livremente na Web. Enquanto a maioria das implementações de CAPTCHAs da tecnologia anterior ignoram esta questão, a presente 5 invenção permite ao usuário ouvir um desafio de áudio. Por exemplo, o desafio de áudio poderá ser um clipe de som com oito dígitos distorcidos aleatoriamente, embora mais ou menos dígitos também poderão ser utilizados. Esses dígitos poderão vir de uma biblioteca de muitos dígitos gravada 10 especificamente para este fim, ou de outras fontes de áudio de maneira similar a utilizar documentos como fonte para material de desafio visual. O CAPTCHA de áudio de acordo com a presente invenção também poderá ser implementado de modo a também fornecer a transcrição da fala. Da mesma 15 maneira que os CAPTCHAs visuais podem ser utilizados para transcrever texto, CAPTCHAs de áudio poderiam ser utilizados para transcrever a fala. Embora tecnologia de reconhecimento de voz automatizada avançou

significativamente, a única maneira de obter uma precisão quase perfeita é utilizar seres humanos.

Os resultados aqui apresentados são uma mera prova do conceito de uma idéia mais genérica: a potência de processamento humana 'jogada fora' pode ser atrelada para resolver problemas que os computadores ainda não podem 25 resolver. Em trabalho anterior foi mostrado que essa potência de processamento pode ser atrelada através de jogos de computador: as pessoas participam desses jogos e, como resultado, efetuam coletivamente tarefas que os computadores ainda não podem efetuar. Ver, por exemplo, L. 3 0 Von Ahn. Games With a Purpose. In IEEE Computer Magazine, junho de 2006. Páginas 96-98; L. von Ahn, L. Dabbish, Labeling Images with a Computer Game. In ACM Conference on Human Factors in Computing Systems, CHI 2004. Páginas 319- 326; e L. von Ahn7 R. Liu, M. Blum. Peekaboom: A Game for 5 Locating Objeets in Images. In ACM Conferenee on Human Faetors in Computing Systems, CHI 2006. Páginas 55-64. Aqui mostramos que CAPTCHAs constituem outra avenida para 'reutilizar' potência computacional jogada fora. Uma linha de trabalho diferente mas relacionada é ASIRRA (J. Elson, 10 J. Douceur, J. Howell, Assira: A CAPTCHA that Exploits Interest-Aligned Manual Image Categorization. In ACM Conference on Computer and Communications Security7 CCS 2007), que mostrou que CAPTCHAs podem ser utilizados para finalidades humanitárias. No sistema deles, retratos de 15 gatos e de cachorros são apresentados ao usuário, que tem de determinar quais são gatos e quais são cachorros. 0 gancho humanitário é que as fotos vêm de asilos de animais: se um usuário gostar de um dos gatos ou cachorros, eles podem adotá-los.

2 0 Embora a presente invenção tenha sido geralmente

descrita em termos de versões específicas e implementações, a presente invenção é aplicável a uma ampla gama de outras variações e versões. Essas e outras variações e modificações da presente invenção são possíveis e foram 25 contempladas, e pretende-se que a especificação anterior e as reivindicações seguintes abranjam essas modificações e variações.

Claims

1. Método de controlar o acesso a um sistema (12, 102) caracterizado pelo fato de compreender: gerar (30) um desafio para o usuário do sistema (12, 102), em que o desafio inclui: uma parte de verificação do desafio para a qual uma resposta é conhecida; e uma parte de leitura do desafio para a qual uma resposta não é conhecida; orientar (32) o usuário para resolver tanto a parte de verificação do desafio como a parte de leitura do desafio; receber (34) entrada do usuário; determinar (3 6) se a entrada do usuário em relação â parte de verificação do desafio corresponde à , resposta conhecida para a parte de verificação do desafio; e identificar (3 8) a entrada do usuário em relação â parte de leitura do desafio como uma resposta à parte de leitura do desafio, se a entrada do usuário com relação à parte de verificação do desafio corresponder à resposta conhecida para a parte de verificação do desafio.

2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de determinar (36) se a entrada do usuário com relação à parte de verificação do desafio corresponde à resposta conhecida para a parte de verificação do desafio inclui: enviar (104) para um computador diferente (12, 104) os dados representativos da entrada recebida do usuário; e receber (106) uma resposta indicativa de determinar se a entrada do usuário com relação ã parte de verificação do desafio corresponde à resposta conhecida para a parte de verificação do desafio.

3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de ainda compreender permitir (4 0) que o usuário acesse o sistema de computador (12, 102) se a entrada do usuário com relação à parte de verificação do desafio corresponde a resposta conhecida para a parte de verificação do desafio.

4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de ainda compreender permitir (40) que o usuário acesse o sistema de computador (12, 102) sem determinar se a entrada do usuário com relação à parte de leitura do desafio está correta.

5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de ainda compreender modificar pelo menos uma característica perceptível de pelo menos uma da parte de verificação do desafio e a parte de leitura do desafio.

6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de o desafio ser uma imagem de uma pluralidade de caracteres.

7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de ainda compreender antes de gerar um desafio: criar (50) uma representação eletrônica de uma imagem de um documento; converter (52) a representação eletrônica da imagem do documento em uma representação eletrônica de caracteres do documento; produzir (54) uma medida representativa de uma confiança de que a representação eletrônica dos caracteres do documento corresponde com precisão ao documento; e designar (56) pelo menos uma parcela da representação eletrônica dos caracteres do documento como não tendo uma resposta conhecida com base na medição representativa da confiança de que a representação eletrônica dos caracteres do documento corresponde com precisão ao documento.

8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de ainda compreender após produzir (54) uma medida: designar (58) pelo menos uma parcela da representação eletrônica dos caracteres do documento como tendo uma resposta conhecida com base na medida representativa da confiança de que a representação eletrônica dos caracteres do documento corresponde com precisão ao documento.

9. Método, de acordo com a reivindicação 1, caracterizado pelo fato de o desafio incluir uma gravação audível.

10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de a parte de leitura do desafio ser apresentada antes da parte de verificação do desafio.

11. Método, de acordo com a reivindicação 1, caracterizado pelo fato de a parte de verificação do desafio ser apresentada antes da parte de leitura do desafio.

12. Método, de acordo com a reivindicação 7, caracterizado pelo fato de ainda compreender após identificar (38) a entrada do usuário com relação à parte de leitura do desafio como uma resposta para a parte de leitura do desafio se a entrada do usuário com relação à parte de verificação do desafio corresponder à resposta conhecida para a parte de verificação do desafio: fornecer (60) a entrada do usuário com relação à parte de leitura do desafio como a representação eletrônica da imagem correspondente do documento; e designar (62) a imagem do documento que corresponde à entrada do usuário como tendo uma resposta conhecida.

13. Instruções lidas por computador caracterizadas pelo fato de que quando executada por um processador (16), faz com que o processador (16) efetue operações de: gerar (30) um desafio ao usuário do sistema de computador (10), onde o desafio inclui: uma parte de verificação do desafio para o qual uma resposta ê conhecida; e uma parte de leitura do desafio para o qual uma resposta não é conhecida; orientar (32) o usuário para resolver tanto a parte de verificação do desafio como a parte de leitura do desafio; receber (34) entrada do usuário; determinar (3 6) se a entrada do usuário com relação à parte de verificação do desafio corresponde à resposta conhecida para a parte de verificação do desafio; e identificar (3 8) a entrada do usuário com relação à parte de leitura do desafio como uma resposta à parte de leitura do desafio, se a entrada do usuário com relação â parte de verificação do desafio corresponder à resposta conhecida para a parte de verificação do desafio.

14. Instruções lidas por computador, de acordo com a reivindicação 13, caracterizadas pelo fato de ainda compreenderem antes de gerar (3 0) um desafio: criar (50) uma representação eletrônica de uma imagem de um documento; converter (52) a representação eletrônica da imagem do documento em uma representação eletrônica dos caracteres do documento; e produzir (54) uma medida representativa de uma confiança de que a representação eletrônica dos caracteres do documento corresponde com precisão ao documento.

15. Instruções lidas por computador, de acordo com a reivindicação 14, caracterizadas pelo fato de ainda compreenderem após produzir (54) uma medida: Designar pelo menos uma parcela da representação eletrônica dos caracteres do documento como tendo uma resposta conhecida com base na medida representativa da confiança de que a representação eletrônica dos caracteres do documento corresponde com precisão ao documento.

16. Instruções lidas por computador, de acordo com a reivindicação 14, caracterizadas pelo fato de ainda compreenderem após identificar (38) a entrada do usuário com relação à parte de leitura do desafio como uma resposta à parte de leitura do desafio se a entrada do usuário com relação à parte de verificação do desafio corresponde à resposta conhecida para a parte de verificação do desafio: fornecer (60) a entrada do usuário com relação à parte de leitura do desafio como a representação eletrônica da imagem correspondente do documento; e designar (62) a imagem do documento correspondente a entrada do usuário como tendo uma resposta conhecida.

17. Instruções lidas por computador, de acordo com a reivindicação 13, caracterizadas pelo fato de as instruções lidas por computador serem incorporadas em mídia lida por computador.

18. Sistema (10) caracterizado pelo fato de compreender: uma rede (14) ; uma pluralidade de computadores (12), em que: pelo menos um dos computadores (12, 100) está sendo utilizado por um usuário que tenta ganhar acesso a outro computador (12, 102) no sistema (10); pelo menos um dos computadores (12, 102) inclui um processador (16) e uma memória (18), e em que a memória (18) inclui instruções lidas por computador que, quando executadas pelo processador (16), fazem com que o processador (16) efetue operações de: gerar (30) um desafio para o computador (12, 100) sendo utilizado pelo usuário, em que o desafio inclui: uma parte de verificação do desafio para o qual uma resposta é conhecida; e uma parte de leitura do desafio para a qual uma resposta não é conhecida; orientar (32) o computador (12, 100) do usuário para resolver tanto a parte de verificação do desafio como a parte de leitura do desafio; receber (34) entrada do computador (12, 100) do usuário; determinar (36) se a entrada do computador (12, 100) do usuário com relação à parte de verificação do desafio corresponde à resposta conhecida para a parte de verificação do desafio; e identificar (38) a entrada do computador (12, 10 0) do usuário com relação â parte de leitura do desafio como uma resposta à parte de leitura do desafio, se a entrada do computador (12, 100) do usuário com relação à parte de verificação do desafio corresponde à resposta conhecida para a parte de verificação do desafio.

19. Sistema (10), de acordo com a reivindicação 18, caracterizado pelo fato de ainda compreender um computador (12) que inclui um processador (16) e uma memória (18) , em que a memória inclui instruções lidas por computador que, quando executadas pelo processador (16), fazem com que o processador (16) efetue operações de: criar (50) uma representação eletrônica de uma imagem de um documento; converter (52) a representação eletrônica da imagem do documento em uma representação eletrônica de caracteres do documento; produzir (54) uma medida representativa de uma confiança de que a representação eletrônica dos caracteres do documento corresponde com precisão ao documento; e designar (56) pelo menos uma parcela da representação eletrônica dos caracteres do documento como não tendo uma resposta conhecida com base na medição representativa da confiança de que a representação eletrônica dos caracteres do documento corresponde com precisão ao documento.

20. Sistema (10), de acordo com a reivindicação 19, caracterizado pelo fato de criar (50), converter (52) , produzir (54), e designar (56) são efetuados antes de gerar (3 0) um desafio.

21. Sistema (10), de acordo com a reivindicação 19, caracterizado pelo fato de pelo menos um dos computadores (12) inclui um processador (16) e uma memória (18) , e em que a memória (18) inclui instruções lidas por computador que, quando executadas pelo processador (16), fazem com que o processador (16) efetue operações de: fornecer (60) a entrada do computador (12, 100) do usuário com relação â parte de leitura do desafio como a representação eletrônica da imagem correspondente do documento; e designar (62) a imagem do documento que corresponde a entrada do computador (12, 100) do usuário como tendo uma resposta conhecida.

22. Sistema (10), de acordo com a reivindicação 21, caracterizado pelo fato de fornecer (60) e designar (62) são efetuados após identificar (38) a entrada do computador (12, 10 0) do usuário com relação à parte de leitura do desafio como uma resposta à parte de leitura do desafio se a entrada do computador (12, 100) do usuário com relação â parte de verificação do desafio corresponde à resposta conhecida para a parte de verificação do desafio.