BRPI0708397A2 - extração de comportamento de usuário de busca na rede para aperfeiçoar releváncia de busca na rede - Google Patents

extração de comportamento de usuário de busca na rede para aperfeiçoar releváncia de busca na rede Download PDF

Info

Publication number
BRPI0708397A2
BRPI0708397A2 BRPI0708397-1A BRPI0708397A BRPI0708397A2 BR PI0708397 A2 BRPI0708397 A2 BR PI0708397A2 BR PI0708397 A BRPI0708397 A BR PI0708397A BR PI0708397 A2 BRPI0708397 A2 BR PI0708397A2
Authority
BR
Brazil
Prior art keywords
computer
user behavior
user
fact
search
Prior art date
Application number
BRPI0708397-1A
Other languages
English (en)
Inventor
Yevgeny E Agichtein
Eric D Brill
Susan T Dumais
Robert J Ragno
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of BRPI0708397A2 publication Critical patent/BRPI0708397A2/pt

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Abstract

EXTRAçãO DE COMPORTAMENTO DE USUáRIO DE BUSCA NA REDE PARA APERFEIçOAR RELEVáNCIA DE BUSCA NA REDE Sistemas e métodos que estimam preferência de usuário via interpretação automática de comportamento de usuário. Um componente de comportamento de usuário associado com um mecanismo de busca pode automaticamente interpretar comportamento coletivo de usuários (por exemplo, usuários de busca na rede). Tal componente de retorno pode incluir características de comportamento do usuário e modelos preditivos (por exemplo, a partir de um componente de comportamento de usuário) que são robustos a ruído, que podem estar presentes em iterações de usuário observadas com os resultados da busca (por exemplo, atividade de usuário maliciosa e/ou irracional).

Description

"EXTRAÇÃO DE COMPORTAMENTO DE USUÁRIO DE BUSCA NA REDE PARAAPERFEIÇOAR RELEVÂNCIA DE BUSCA NA REDE"
Fundamentos da Invenção
Dada a popularidade da Rede Mundial e da Internet, os usuários podem adquirir in-formação relacionada a quase qualquer tópico de uma grande quantidade de fontes de in-formação. De modo a encontrar informação, os usuários geralmente aplicam vários meca-nismos de busca á tarefa de retorno de informação. Os mecanismos de busca permitem queusuários encontrem páginas da Rede contendo informação ou outro material na Internet quecontém palavras ou frases específicas.
Em geral, uma busca de palavras chave pode encontrar, para o melhor da capaci-dade de um computador, todos os sítios da Rede que têm qualquer informação neles rela-cionada a quaisquer palavras chave e frases que são especificadas. Um sítio de mecanismode busca terá uma caixa para usuários inserirem palavras chave e um botão para pressionarpara iniciar a busca. Muitos mecanismos de busca têm dicas sobre como usar palavras cha-ve para buscar efetivamente. Tipicamente, tais dicas auxiliam os usuários a definir estreita-mente termos de busca, tal que informação estranha e não relacionada não é retornada e oprocesso de retorno de informação não é desordenado. Tal estreitamento manual de termospode suavizar o recebimento de vários milhares de sítios para classificar quando procurandopor informação específica.
Em alguns casos, tópicos de busca são pré-arranjados em áreas de tópico e sub-tópico. Por exemplo, o "Yahoo" fornece uma lista pré-determinada hierarquicamente arran-jada de tópicos possíveis (por exemplo, negócios, governo, ciência, etc.) onde o usuárioselecionará um tópico e então adicionalmente escolherá um sub-tópico na lista. Um outroexemplo de listas pré-determinadas de tópicos é comum em utilitários de ajuda de computa-dores pessoais de mesa, onde uma lista de tópicos de ajuda e sub-tópicos relacionados éfornecida ao usuário. Enquanto essas hierarquias pré-determinadas podem ser úteis emalguns contextos, os usuários freqüentemente necessitam buscar/exigir informação fora e/ounão incluída nessas listas pré-determinadas. Assim, os mecanismos de busca ou outrossistemas de busca são freqüentemente empregados para habilitar que os usuários direcio-nem consultas, para encontrar informação desejada. Contudo, durante as buscas de usuá-rio, muitos resultados não relacionados são retornados, desde que os usuários podem estarincertos de como autorar ou construir uma consulta particular. Além disso, tais sistemas u-sualmente exigem que os usuários modifiquem continuamente consultas, e refinem resulta-dos de busca retornados para obter um número razoável de resultados para examinar.
Não é incomum digitar uma palavra ou frase em um campo de consulta de entradaem sistema de busca, e então retornar vários milhões de resultados como candidatos poten-ciais. Para compreender o grande número de candidatos retornados, o usuário freqüente-mente experimentará outras combinações de palavras, para adicionalmente estreitar a lista.
Em geral, o sistema de busca classificará os resultados de acordo com a relevânciapredita de resultados para a consulta. A classificação é tipicamente baseada em uma funçãoque combina muitos parâmetros incluindo a similaridade de uma página da Rede com umaconsulta bem como a qualidade intrínseca do documento, freqüentemente inferida a partirde uma informação de topologia de Rede. A qualidade da experiência de busca do usuárioestá diretamente relacionada à qualidade da função de classificação, à medida que os usuá-rios tipicamente não visualizam os resultados classificados mais abaixo.
Em geral, o sistema de busca tentará alcançar ou encontrar todos os tópicos rela-cionados à entrada de consulta do usuário sem considerar se os tópicos "buscados" têmqualquer relação contextual com a área ou categoria de tópico do que o usuário está real-mente interessado. Como um exemplo, se um usuário que estava interessado em astrono-mia inserisse a consulta "Saturno" em um sistema de busca convencional, todos os tipos deresultados não relacionados são provavelmente retornados incluindo aqueles relacionados acarros, comerciantes de carros, jogos de computador, e outros sítios tendo a palavra "Satur-no". Um outro problema com as implementações de busca convencionais é que os meca-nismos de busca operam da mesma forma para todos os usuários sem considerar as dife-rentes necessidades e circunstâncias dos usuários. Assim, se dois usuário inserem a mes-ma consulta de busca, eles tipicamente obtêm os mesmos resultados, sem considerar osseus interesses ou características, histórico de busca anterior, contexto de computação atu-al (por exemplo, arquivos abertos), ou contexto ambiental (por exemplo, localização, máqui-na sendo usada, hora do dia, dia da semana).
Sintonizando as funções de classificação de busca para retornar resultados rele-vantes no topo geralmente exige esforço significativo. Uma aproximação geral para moder-nos mecanismos de busca é treinar funções de classificação e ajustar parâmetros de funçãoe pesos automaticamente baseado em exemplos de resultados de busca manualmente ava-liados. Anotadores humanos podem explicitamente avaliar um conjunto de paginas parauma consulta de acordo com relevância percebida, e criar o "padrão de ouro" contra o qualdiferentes algoritmos de classificação podem ser retornados e avaliados. Entretanto, classi-ficações humanas explícitas são caras e difíceis de obter, freqüentemente resultando emfunções de classificação sub-ótimas e incompletamente treinadas.
Sumário da Invenção
O seguinte apresenta um sumário simplificado de modo a fornecer um entendimen-to básico de alguns aspectos do assunto reivindicado. Este sumário não é uma visão exten-siva. Ele não pretende identificar elementos chave/críticos ou delinear o escopo do assuntoreivindicado. Seu único propósito é apresentar alguns conceitos de uma forma simplificadacomo um prelúdio para a descrição mais detalhada que é apresentada posteriormente.A inovação em questão aperfeiçoa as classificações de busca em um sistema deretorno de informação, via empregar um componente de comportamento de usuário quefacilita uma interpretação automática para o comportamento coletivo de usuários, estimar aspreferências de usuário para um item sobre um outro item. Tais preferências podem entãoser empregadas para vários propósitos, tal como para aperfeiçoar a classificação dos resul-tados. O componente de comportamento de usuário pode interagir com um mecanismo(s)de busca e incluir características de retorno que suavizam ruído que tipicamente acompa-nham o comportamento do usuário (por exemplo, atividade de usuário maliciosa e/ou irra-cional). Explorando o comportamento agregado de usuários (por exemplo, não tratando ca-da usuário como um indivíduo profissional), a inovação em questão pode suavizar ruído egerar julgamentos de relevância a partir do retorno de usuários. O componente de compor-tamento de usuário pode empregar retorno implícito ou explícito de usuários e suas intera-ções com os resultados de consultas anteriores. As características comportamentais chaveincluem características de apresentação que podem ajudar um usuário a determinar se umresultado é relevante olhando o título do resultado e descrição; navegando por característi-cas como tempo de permanência em uma página, maneira de alcançar resultados de busca(por exemplo, através de outros vínculos), desvio do tempo médio no domínio, e seus simila-res; características de clique, tal como o número de cliques em um resultado particular paraa consulta. Para um dado par consulta-resultado, a inovação em questão fornece múltiplosvalores de característica observados e derivados para cada tipo de característica.
O componente de comportamento de usuário pode empregar um modelo acionadopor dados do comportamento do usuário. Por exemplo, o componente de comportamento deusuário pode modelar o comportamento de busca na rede do usuário como se fosse geradopor dois componentes: um componente de "fundo" (tal como usuários clicando indiscrimina-damente), e um componente de "relevância" (tal como comportamento específico de consul-ta que é influenciado pela relevância do resultado para a consulta).
De acordo com um aspecto adicional da inovação em questão, o componente decomportamento de usuário pode gerar e/ou modelar os desvios a partir do comportamentode usuário esperado. Portanto, as características derivadas podem ser computadas, ondetais características derivadas explicitamente abordam o desvio do valor de característicaobservado para um dado resultado de busca a partir dos valores esperados para um resul-tado, sem informação dependente de consulta.
Além disso, o componente de comportamento de usuário da inovação em questãopode empregar modelos tendo dois tipos de característica para descrever o comportamentodo usuário, ou seja: direto e desviado, onde o primeiro é os valores diretamente medidos, eo ultimo é o desvio dos valores esperados estimados a partir das distribuições gerais (inde-pendentes de consulta) para as características diretamente observadas correspondentes.Conseqüentemente, o valor observado o de uma característica f para uma consulta q e re-sultado r, pode ser expresso como uma mistura de dois componentes:
o(q, r, f) = C(r, f) + rel(q, r, f)
onde C(r, f) é a distribuição de "fundo" anterior para valores de f agregados atravésde todas as consultas correspondentes ar, e rel(q, r, f) é o componente "relevância" docomportamento influenciado pela relevância do resultado para a consulta. Por exemplo, umaestimativa de relevância do comportamento de usuário pode ser obtida com característicade clique, via uma subtração de distribuição de fundo a partir da freqüência de clique emuma dada posição. Para suavizar o efeito de variações de usuário individuais em comporta-mento, a inovação em questão pode tirar a média de valores de característica através detodos os usuários e sessões de busca para cada par consulta-resultado. Tal agregação po-de fornecer robustez adicional, onde interações de usuário "ruidosas" adicionais não sãoconsideradas.
Conseqüentemente, o comportamento de usuário para um par consulta-resultadopode ser representado por um vetor característica que inclui ambas as características dire-tamente observadas e os valores de características "corrigidos" derivados. Várias técnicasde aprendizagem de máquina podem também ser empregadas em conjunto com algoritmosde classificação de treinamento para sistemas de retorno de informação. Por exemplo, jul-gamentos de relevância humana explícitos podem ser inicialmente fornecidos para váriasconsultas de busca e empregados para subseqüentes algoritmos de classificação de trei-namento.
Em um aspecto relacionado, o comportamento coletivo de usuários interagindo comum mecanismo de busca na rede pode ser automaticamente interpretado de modo a preverfuturas preferências de usuário; portanto, o sistema pode se adaptar para mudar padrões decomportamento de usuário e diferentes configurações de busca re-treinando automatica-mente o sistema com os dados de comportamento de usuário mais recentes.
Para alcançar os fins anteriores e relacionados, certos aspectos ilustrativos do as-sunto reivindicado são descritos aqui em conjunto com a descrição seguinte e os desenhosem anexo. Esses aspectos são indicativos de várias formas nas quais o assunto pode serpraticado, todas as quais pretendem estar no escopo do assunto reivindicado. Outras vanta-gens e novas características podem se tornar aparentes a partir da seguinte descrição deta-lhada quando consideradas em conjunto com os desenhos.
Breve Descrição dos Desenhos
A Fig. 1 ilustra um diagrama de bloco de um componente de comportamento de u-suário de acordo com um aspecto exemplificado da inovação em questão.
A Fig. 2 ilustra um diagrama de bloco de um sistema que incorpora um componentede comportamento de usuário e interage com um modelo de treinamento de um mecanismode busca de acordo com um aspecto da inovação em questão.
A Fig. 3 ilustra um diagrama de bloco de um sistema que incorpora um componenteclassificador operativamente conectado a um componente de comportamento de usuário, eum mecanismo de busca de acordo com um aspecto exemplificado da inovação em ques-tão.
A Fig. 4 ilustra uma tabela de características que representam atividades de nave-gação de usuário de acordo com um aspecto da inovação em questão.
A Fig. 5 ilustra um sistema de retorno de informação automatizado que pode em-pregar um componente de aprendizado de máquina com um aspecto da inovação em ques-tão.
A Fig. 6 ilustra um componente de comportamento de usuário que interage comuma pluralidade de características de sistema, que representa ação do usuário de acordocom um aspecto particular da inovação em questão.
A Fig. 7 ilustra uma metodologia exemplificada de interpretar o comportamento dousuário para estimar preferências do usuário de acordo com um aspecto da inovação emquestão.
A Fig. 8 ilustra uma metodologia de implementar o comportamento de usuário comoparte de classificação de valor de acordo com um aspecto da inovação em questão.
A Fig. 9 ilustra um ambiente exemplificado para implementar vários aspectos da i-novação em questão.
A Fig. 10 é um diagrama de bloco esquemático de um ambiente de computação a-dicional que pode ser empregado para implementar vários aspectos da inovação em ques-tão.
Descrição Detalhada da Invenção
Os vários aspectos da inovação em questão são agora descritos com relação aosdesenhos em anexo, onde números similares se referem a elementos similares ou corres-pondentes. Dever-se-ia entender, entretanto, que os desenhos e a descrição detalhada rela-cionada a esses não pretendem limitar o assunto reivindicado à forma particular descrita. Depreferência, a intenção é abranger todas as modificações, equivalentes, e alternativas quecaem no espírito e escopo do assunto reivindicado.
Como usado aqui, os termos "componente", "sistema", "característica" e seus simi-lares pretendem também se referir a uma entidade relacionada a computador, ou hardware,uma combinação de hardware e software, software, ou software em execução. Por exemplo,um componente pode ser, mas não está limitado a ser, um processo executando em umprocessador, um processador, um objeto, um executável, um processo de execução, umprograma, e/ou um computador. A título de ilustração, ambos uma aplicação executando emcomputador e o computador podem ser um componente. Um ou mais componentes podemresidir em um processo e/ou tarefa de execução e um componente pode estar localizado emum computador e/ou distribuído entre dois ou mais computadores.
A palavra "exemplificado" e usada aqui para significar servir como um exemplo, ca-so, ou ilustração. Qualquer aspecto ou projeto descrito aqui como "exemplificado" não é ne-cessariamente construído como preferencial ou vantajoso sobre outros aspectos ou proje-tos.
Além disso, o assunto descrito pode ser implementado como um sistema, método,aparelho, ou artigo de fabricação usando programação padrão e/ou técnicas de engenhariapara produzir software, suporte lógico inalterável, hardware, ou qualquer combinação des-ses para controlar um dispositivo baseado em computador ou processador para implementaraspectos detalhados aqui. O termo programa de computador como usado aqui pretendeabranger um programa de computador acessível a partir de qualquer dispositivo legível porcomputador, portadora ou meios. Por exemplo, os meios legíveis por computador podemincluir, mas não estão limitados a dispositivos de armazenamento magnético (por exemplo,disco rígido, disco flexível, fitas magnéticas, ...), discos ópticos (por exemplo, disco compac-to (CD), disco versátil digital (DVD), ...), cartões inteligentes, e dispositivos de memória rápi-da (por exemplo, cartão, módulo). Adicionalmente, dever-se-ia apreciar que uma onda por-tadora pode ser empregada para carregar dados eletrônicos legíveis por computador tal co-mo aqueles usados na transmissão e recebimento de correio eletrônico ou no acesso a umarede tal como a Internet ou uma rede de área local (LAN). É claro, aqueles versados na téc-nica reconhecerão que muitas modificações podem ser feitas a essa configuração sem a-bandonar o escopo ou espírito do assunto reivindicado.
Voltando inicialmente para a Fig. 1, um diagrama de bloco de um sistema 100 é i-lustrado, o qual incorpora um componente de comportamento de usuário que interage com um mecanismo de busca de acordo com um aspecto exemplificado da inovação em ques-tão. O componente de comportamento de usuário 104 associado com o mecanismo de bus-ca 102 pode automaticamente interpretar o comportamento coletivo de usuários 101, 103,105 (1 a N, onde N é um inteiro). Tal componente de comportamento de usuário 104 podeincluir características de retorno que suavizam ruído, que tipicamente acompanham o com-portamento de usuário (por exemplo, atividade de usuário maliciosa e/ou irracional). Explo-rando o comportamento agregado dos usuários 101, 103, 105 (por exemplo, não tratandocada usuário como um indivíduo especialista), o sistema 100 pode suavizar ruído, e gerarjulgamentos de relevância a partir de retorno de usuários.
O componente de comportamento de usuário 104 pode interagir com o componentede classificação. Para uma dada consulta, o componente de comportamento de usuário 104retorna as predições derivadas de um modelo de comportamento anteriormente treinadopara essa consulta, e re-ordena os resultados para a consulta, tal que os resultados queparecem relevantes para usuários anteriores são classificados mais altos. Por exemplo, parauma dada consulta q, a pontuação implícita ISr pode ser computada para cada resultado r apartir das características de interação de usuário disponível, resultando na classificação im-plícita Ir, para cada resultado. Uma pontuação combinada SM(r) pode ser computada para rcombinando as classificações obtidas a partir do retorno implícito, Ir, com a classificaçãooriginal de r, Or:
<formula>formula see original document page 8</formula>
O peso W| é um fator de escala heuristicamente sintonizado que representa a "im-portância" relativa do retorno implícito. Os resultados de consulta podem ser ordenados emvalores decrescentes de SM(r) para produzir a classificação final. Um caso particular de talmodelo aparece quando configurando w, para um valor muito grande, efetivamente forçandoresultados clicados como sendo classificados mais altos do que resultados não clicados -uma heurística efetiva e intuitiva que pode ser empregada como uma linha de base. Em ge-ral, a aproximação acima assume que não há interações entre as características subjacen-tes produzindo a classificação de busca na rede original e as características de retorno im-plícitas. Outros aspectos da inovação em questão relaxam tal hipótese interagindo as carac-terísticas de retorno implícitas diretamente no processo de classificação, como descrito emdetalhes a seguir. Além disso, aprecia-se que comportamento de usuário mais sofisticado ealgoritmos de combinação de classificador podem ser empregados, e estão bem no âmbitoda inovação em questão.
A Fig. 2 ilustra um aspecto adicional da inovação em questão, onde o mecanismode busca 202 adicionalmente compreende um modelo de treinamento 204 de acordo comum aspecto da inovação em questão. O modelo de treinamento 204 pode ademais compre-ender tipos de modelo adicional para descrever comportamento de usuário, ou seja: umacaracterística de comportamento observado 201 e uma característica de comportamentoderivado 203. As características de comportamento observadas 201 são os valores direta-mente medidos, e a característica de comportamento derivada 203 é o desvio dos valoresesperados estimados a partir dos valores esperados estimados a partir das distribuiçõesgerais (independentes de consulta) para as características diretamente observadas corres-pondentes. Conseqüentemente, o valor observado o de uma característica f para uma con-sulta q e resultado r, pode ser expresso como uma mistura de dois componentes:
o(q, r, f) = C(r, f) + rel(q, r, f)
onde C(r, f) é a distribuição de "fundo" anterior para valores de f agregados atravésde todas as consultas correspondentes a r, e rel(q, r, f) é o componente do comportamentoinfluenciado pela relevância dos resultados. Por exemplo, uma estimativa de relevância docomportamento de usuário pode ser obtida com característica de clique, via uma subtraçãode distribuição de fundo (por exemplo, ruído) da freqüência de clique observada em umadada posição. Para suavizar o efeito de variações de usuário individuais em comportamento,a inovação em questão pode tirar a média de valores de característica direta através de to-dos os usuários e sessões de busca para cada par consulta-URL. Tal agregação pode for-necer robustez adicional, onde interações de usuário "ruidosas" individuais não são conside-radas. Conseqüentemente, o comportamento de usuário para um par consulta-URL podeser representado por um vetor de característica que inclui ambas as características direta- mente observadas e, valores de características "corrigidas" derivadas.
A Fig. 3 ilustra um diagrama de bloco de um sistema 300 que incorpora um compo-nente classificador 310 operacionalmente conectado a um componente de comportamentode usuário 315 e um mecanismo de busca 340 de acordo com um aspecto exemplificado dainovação em questão. Tipicamente, o mecanismo de busca 340 pode classificar resultados de busca 350 baseado em um grande número de características, incluindo característicasbaseadas em conteúdo (por exemplo, o quanto uma consulta se aproxima do texto ou títuloou texto âncora do documento), e características de qualidade de página independente deconsulta (por exemplo, Classificação da Página do documento ou do domínio), como descri-to em detalhes a seguir. Além disso, o mecanismo de busca 340 pode empregar métodos<- 20 automáticos (ou semi-automáticos) para sintonizar a função de classificação específica quecombina tais valores de característica. Por exemplo, pode-se assumir que um usuário quefaz uma consulta 360 executará ações particulares. Tais ações podem incluir clicar, nave-gar, enviar refinamentos de consulta até encontrar um documento relevante, e seus simila-res. Mediante encontrar o documento relevante, o usuário pode se tornar satisfeito e mudar o comportamento (por exemplo, ler o documento). A inovação em questão habilita descobrirum conjunto suficientemente rico de características que permitiriam a detecção de quando ousuário está satisfeito com um resultado retornado. Tais características são dependentesdas consultas feitas, e, portanto, são específicos de consulta. Por exemplo, característi-cas/atividades de usuário podem ser categorizadas em características de apresentação, características de navegação, e características de clique, como descrito com relação à Fig.4.
A Fig. 4 ilustra uma tabela de características 400 que representam atividades denavegação de usuário. As características de apresentação 410 são tipicamente projetadaspara representar a experiência do usuário à medida que elas afetam alguns ou todos os as-pectos do comportamento (por exemplo, um usuário pode decidir clicar em um resultadobaseado nas características de apresentação). Para modelar tal aspecto de experiência deusuário, a inovação em questão pode empregar características tais como sobreposição empalavras no título e palavras na consulta (Sobreposição de Título) e a fração de palavrascompartilhadas pela consulta e o sumário de resultado, à medida que esses são freqüente-mente considerados por usuários quando tomando uma decisão se clicar em um sumário deresultado para visualizar o documento completo.
Igualmente, a característica de navegação 420 pode capturar e quantificar aspectosdas interações de página da rede de usuário. Por exemplo, a inovação em questão podecomputar o desvio de tempo de permanência a partir do tempo de permanência da páginaesperada para uma consulta, o que permite modelar a diversidade intra-consulta de compor-tamento de navegação de página. Esse pode ademais incluir ambas características diretas eas derivadas, como descrito em detalhes a seguir. Igualmente, as características de clique430 são um exemplo de interação de usuário com os resultados de mecanismo de busca.Por exemplo, as características de clique podem incluir o número de cliques para um parconsulta-resultado, ou o desvio da probabilidade de clique esperada.
Como ilustrado na Fig. 4, o clique ilustra um aspecto de interações de usuário com um mecanismo de busca na rede. A inovação em questão pode empregar modelos de com-portamento de usuário preditivos automaticamente derivados. Conseqüentemente, para umadada consulta, cada resultado pode ser representado com as características na Tabela daFig. 4. As preferências de usuário relativas podem então ser estimadas usando o modelo decomportamento de usuário aprendido, como descrito em detalhes acima. O uso de tais mo-delos de comportamento de usuário habilita o mecanismo de busca a se beneficiar da com-preensão de multidões interagindo com os resultados da busca bem como característicasmais ricas caracterizando comportamento de navegação além da página de resultados debusca.
A Fig. 5 ilustra um sistema de retorno de informação automatizado 500 que podeempregar um componente de aprendizado de máquina 535 de acordo com um aspecto dainovação em questão. Uma estratégia de interpretação de retorno implícito geral pode serempregada para automaticamente aprender um modelo de preferências de usuário (por e-xemplo, ao invés de contar com heurísticas ou intuições). O sistema 500 inclui um compo-nente de classificação 510 que pode ser treinado a partir de um registro de dados 520 ouinterações com o componente de comportamento de usuário 515, por exemplo. Os dados noregistro 520 podem ser reunidos a partir de fontes de dados locais ou remotas e inclueminformação relacionada aos dados de busca anteriores ou atividades 530 a partir de umapluralidade de usuários. Depois de treinar, o componente classificador 510 pode interagircom o mecanismo de busca 540 para facilitar ou aperfeiçoar resultados de busca futurosque são indicados como resultados relevantes 550. Por exemplo, uma ou mais novas con-sultas de busca 560 podem ser processadas pelo mecanismo de busca 540, baseadas emparte no treinamento a partir de dados de busca anteriores 530, e/ou informação a partir docomponente de comportamento de usuário 515. Em geral, o sistema 500 pode empregarvárias técnicas de mineração de dados para aperfeiçoar a relevância do mecanismo de bus-ca. Tais técnicas podem incluir empregar classificadores de relevância no componente clas-sificador 510, para gerar dados de treinamento de alta qualidade para classificadores detempo de execução, que são empregados com o mecanismo de busca 540 para gerar osresultados de busca 550. A Fig. 6 ilustra um componente de comportamento de usuário 610que interage com uma pluralidade de características de sistema, que representam a ação dousuário. Em um aspecto, a inovação em questão considera os comportamentos de busca narede como uma combinação de um componente de "fundo" (por exemplo, ruído independen-te de consulta e de relevância no comportamento do usuário, e seus similares), e um com-ponente de "relevância" (por exemplo, comportamento específico de consulta indicativo darelevância de um resultado para uma consulta). Tal arranjo pode levar vantagem de compor-tamento de usuário agregado, onde o conjunto de características é compreendido de carac-terísticas diretamente observadas (computadas diretamente a partir de observações paracada consulta), bem como características derivadas específicas de consulta, computadascomo o desvio da distribuição independente de consulta total de valores para os valores decaracterística diretamente observados correspondentes. Como ilustrado na Fig. 6, caracte-rísticas de sistema exemplificadas tais como: característica(s) de clique 612, característicasde navegação 614, e características de apresentação 616, que podem ser empregadas pararepresentar interações de usuário com resultados de busca na rede, através do componentede comportamento de usuário 610. Além disso, características tal como o desvio do númerode cliques observados para um dado par consulta-URL a partir do número esperado de cli-ques em um resultado na dada posição, podem também ser consideradas. Além disso, ocomportamento de navegação pode ser modelado, por exemplo, depois que um resultado éclicado, então o tempo de permanência em página médio para um dado par consulta-URLdado, bem como seu desvio a partir do tempo de permanência (médio) esperado, é empre-gado para tal modelo. Adicionalmente, por exemplo, usuário de busca na rede podem fre-qüentemente determinar se um resultado é relevante olhando no título do resultado, URL esumário - em muitos casos, olhar no documento original é tipicamente não necessário. Paramodelar esse aspecto de experiência de usuário, características tais como: sobreposiçõesem palavras no título e palavras na consulta, podem também ser empregadas.
A Fig. 7 ilustra uma metodologia exemplificada 700 de interpretar o comportamentodo usuário para estimar as preferências do usuário de acordo com um aspecto da inovaçãoem questão. Enquanto o método exemplificado é ilustrado e descrito aqui como uma sériede blocos representativos de vários eventos e/ou ações, a inovação em questão não estálimitada pelo ordenamento ilustrado de tais blocos. Por exemplo, algumas ações ou eventospodem ocorrer em diferentes ordens e/ou ao mesmo tempo com outras ações ou eventos,separado do ordenamento ilustrado aqui, de acordo com a inovação. Em adição, nem todosos blocos ilustrados, eventos ou ações, podem ser exigidos para implementar uma metodo-logia de acordo com a inovação em questão. Além disso, será apreciado que o método e-xemplificado e outros métodos de acordo com a inovação podem ser implementados emassociação com o método ilustrado e descrito aqui, bem como em associação com outrossistemas e aparelhos não ilustrados ou descritos. Inicialmente e em 710, dados relacionadosà interação de usuário com o mecanismo de busca, tal como comportamento de usuário pósbusca podem ser adquiridos. Subseqüentemente e em 720, o comportamento do usuáriopode ser agregado, por exemplo, empregando técnicas de análise estatística. Em 730, oaprendizado em máquina pode então ser empregado para treinar modelo de preferência deusuário. Subseqüentemente e em 740, as predições de preferência podem ser fornecidaspara resultado de consultas futuras.
A Fig. 8 ilustra uma metodologia 800 de implementar o comportamento de usuáriocomo parte da classificação de acordo com um aspecto da inovação em questão. Inicial-mente e em 810, os dados relacionados ao comportamento do usuário podem ser coletados.Tal comportamento do usuário pode então ser empregado para treinar e/ou automaticamen-te gerar um modelo de comportamento em 820. Tal modelo (por exemplo, modelo de com-portamento preditivo) pode então ser incorporado como parte de um mecanismo de buscapara classificar resultados e/ou gerar julgamentos de relevância implícitos a partir do retornode usuários, em 830. Subseqüentemente, e 840, baseado em parte na informação de mode-lo comportamental gerado e/ou treinado retornada pelo mecanismo de busca pode então serclassificado.
De modo a fornecer um contexto para os vários aspectos do assunto descrito, asFigs. 9 e 10, bem como a seguinte discussão pretendem fornecer uma breve descrição geralde um ambiente adequado no qual os vários aspectos do assunto descrito podem ser in>plementados. Enquanto o assunto foi descrito acima no contexto geral de instruções execu-táveis por computador de um programa de computador que executa em um computadore/ou computadores, aqueles versados na técnica reconhecerão que a inovação tambémpode ser implementada em combinação com outros módulos de programa. Geralmente, osmódulos de programa incluem rotinas, programas, componentes, estruturas de dados, etc.,que executam tarefas particulares e/ou implementam tipos de dados abstratos particulares.Além disso, aqueles versados na técnica apreciarão que os métodos inovadores podem serpraticados com outras configurações de sistema de computador, incluindo sistemas decomputador de único processador ou de multiprocessador, dispositivos de mini-computação,computadores de grande porte, bem como computadores pessoais, dispositivos de compu-tação portáteis (por exemplo, assistente digital pessoal (PDA), telefone, relógio, ...), eletrôni-cos industriais ou de consumo programáveis ou baseados em microprocessador, e seussimilares. Os aspectos ilustrados podem também ser praticados em ambientes de computa-ção distribuídos onde tarefas são executadas por dispositivos de processamento remoto quesão ligados através de uma rede de comunicações. Entretanto, alguns, de não todos os as-pectos da inovação podem ser praticados em computadores autônomos. Em um ambientede computação distribuído, os módulos de programa podem ser localizados em ambos dis-positivos de armazenamento em memória remoto ou local.
Com relação à Fig. 9, um ambiente exemplificado 910 para implementar vários as-pectos da inovação em questão é descrito, o qual inclui um computador 912. O computador912 inclui uma unidade de processamento 914, uma memória de sistema 916, e um barra-mento de sistema 918. O barramento de sistema 918 acopla componentes de sistema inclu-indo, mas não limitados a, memória de sistema 916 à unidade de processamento 914. Aunidade de processamento 914 pode ser qualquer dos vários processadores disponíveis. Osmicroprocessadores duplos e outras arquiteturas de multiprocessador também podem serempregados como a unidade de processamento 914.
O barramento de sistema 918 pode ser qualquer um dos vários tipos de estrutura(s)de barramento incluindo barramento de memória ou controlador de memória, um barramen-to periférico ou barramento externo, e/ou um barramento local usando qualquer variedadede arquiteturas de barramento disponíveis incluindo, mas não limitadas a, barramentos de11 bits, Arquitetura Padrão de Indústria (ISA), Arquitetura de Micro Canal (MCA), ISA Esten-dido (EISA), Eletrônica de Acionamento Inteligente (IDE), Barramento Local VESA (VLB),Componentes Periféricos Interconectados (PCI), Barramento Serial Universal (USB), PortaGráfica Avançada (AGP), barramento de Associação Internacional de Placa de Memória deComputador Pessoal (PCMCIA), e Interface de Sistemas de Pequeno Computador (SCSI).
A memória de sistema 916 inclui memória volátil 920 e memória não volátil 922. Osistema de entrada/saída básico (BIOS), contendo as rotinas básicas para transferir infor-mação entre elementos no computador 912, tal como durante a inicialização, é armazenadoem memória não volátil 922. A título de ilustração, e não limitação, a memória não volátil 922pode incluir memória somente de leitura (ROM), ROM programável (PROM), ROM eletrica-mente programável (EPROM), ROM eletricamente apagável (EEPROM), ou memória rápida.A memória volátil 920 inclui memória de acesso aleatório (RAM), que age como memóriacache externa. A título de ilustração e não limitação, a RAM está disponível em muitas for-mas, tal como RAM síncrona (SRAM), RAM dinâmica (DRAM), DRAM síncrona (SDRAM),SDRAM de taxa dupla de dados (DDR SDRAM), SDRAM aperfeiçoada (ESDRAM), DRAMde ligação síncrona (SLDRAM), e RAM Rambus direta (DRRAM).
O computador 912 também inclui meios de armazenamento em computador remo-víveis/não removíveis, voláteis/não voláteis. A Fig. 9 ilustra, por exemplo, um armazenamen-to em disco 924. O armazenamento em disco 924 inclui, mas não está limitado a, dispositi-vos como uma unidade de disco magnético, unidade de disco flexível, unidade de fita, uni-dade de Jaz, unidade de Zip, unidade LS-60, cartão de memória rápida, ou módulo de me-mória. Em adição, o armazenamento em disco 924 pode incluir meios de armazenamentoseparadamente ou em combinação com outros meios de armazenamento incluindo, masnão limitados a, uma unidade de disco óptico tal como dispositivo ROM de disco compacto(CD-ROM), unidade gravável de CD (Unidade de CD-R), unidade regravável de CD (Unida-de de CD-RW) ou uma unidade ROM de disco versátil digital (DVD-ROM). Para facilitar aconexão dos dispositivos de armazenamento em disco 924 ao barramento de sistema 918,uma interface removível ou não removível é tipicamente usada tal como a interface 926.
Aprecia-se que a Fig. 9 descreve software que age como um intermediário entreusuários e os recursos básicos de computador descritos no ambiente operacional adequado910. Tal software inclui um sistema operacional 928. O sistema operacional 928, que podeser armazenado no armazenamento em disco 924, age para controlar e alocar recursos dosistema de computador 912. Os aplicativos de sistema 930 levam vantagem do gerencial- mente de recursos pelo sistema operacional 928 através de módulos de programa 932 edados de programa 934 armazenados ou na memória de sistema 916 ou no armazenamen-to em disco 924. Aprecia-se que vários componentes descritos aqui podem ser implementa-dos com vários sistemas operacionais ou combinações de sistemas operacionais.
Um usuário insere comandos ou informação no computador 912 através do disposi-tivo(s) de entrada 936. Os dispositivos de entrada 936 incluem, mas não estão limitados a,um dispositivo de apontamento tal como um mouse, mouse estacionário, caneta gráfica,mesa sensível ao toque, teclado, microfone, comando de jogos, mesa de jogos, antena desatélite, digitalizador, placa sintonizadora de TV, câmera digital, câmera de vídeo digital,câmera de rede, e seus similares. Esses e outros dispositivos de entrada se conectam à unidade de processamento 914 através do barramento de sistema 918 via a porta(s) de in-terface 938. As portas de interface 938 incluem, por exemplo, uma porta serial, uma portaparalela, uma porta de jogos, e um barramento serial universal (USB). O dispositivo(s) desaída 940 usa algum do mesmo tipo de portas do dispositivo(s) de entrada 936. Assim, porexemplo, uma porta USB pode ser usada para fornecer entrada para o computador 912, epara emitir informação a partir do computador 912 a um dispositivo de saída 940. O adapta-dor de saída 942 é fornecido para ilustrar que há alguns dispositivos de saída 940 comomonitores, alto-falantes, e impressoras, dentre outros dispositivos de saída 940 que exigemadaptadores especiais. Os adaptadores de saída 942 incluem, a título de ilustração e nãolimitação, placas de vídeo e som que fornecem um dispositivo de conexão entre o dispositi- vo de saída 940 e o barramento de sistema 918. Dever-se-ia notar que outros dispositivose/ou sistemas de dispositivos fornecem ambas as capacidades de entrada e saída tal comoo computadores) remoto 944. O computador remoto 944 pode ser um computador pessoal,um servidor, um roteador, um PC em rede, uma estação de trabalho, uma ferramenta base-ada em microprocessador, um dispositivo par ou outro nó de rede comum e seus similares,e tipicamente inclui muitos ou todos os elementos descritos em relação ao computador 912.Para propósitos de brevidade, somente um dispositivo de armazenamento em memória 946é ilustrado com o computador remoto 944. O computador remoto 944 é logicamente conec-tado ao computador 912 através de uma interface de rede 948 e então fisicamente conecta-do via a conexão de comunicação 950. A interface de rede 948 abrange redes de comunica-ção tais como redes de área local (LAN) e redes de área ampla (WAN). As tecnologias LANincluem Interface de Dados Distribuídos por Fibra Ótica (FDDI), Interface de Dados Distribu-idos por Cabos de Par Trançado (CDDI), Ethernet/IEEE 802.3, Anel de Sinal/IEEE 802.5 eseus similares. As tecnologias WAN incluem, mas não são limitadas a, conexões ponto aponto, redes de comutação de circuito como Redes Digitais de Serviços Integrados (ISDN) evariações nestas, redes de comutação de pacote, e Linhas de Assinante Digital (DSL).
A conexão de comunicação 950 refere-se ao hardware/software empregado paraconectar a interface de rede 948 ao barramento 918. Enquanto a conexão de comunicação950 é mostrada para esclarecimento ilustrativo dentro do computador 912, ela pode ser ex-terna ao computador 912. O hardware/software necessário para conexão à interface de rede948 inclui, para propósitos exemplificados somente, tecnologias internas e externas tais co-mo, modems incluindo modems de qualidade de telefone regular, modems a cabo e mo-dems DSL, adaptadores ISDN, e placas Ethernet.
Como usado aqui, os termos "componente", "sistema" e seus similares pretendemse referir a uma entidade relacionada a computador, ou hardware, uma combinação dehardware e software, software, ou software em execução. Por exemplo, um componentepode ser, mas não é limitado a ser, um processo executando em um processador, um pro-cessador, um objeto, um executável, uma tarefa de execução, um programa, e/ou um com-putador. A título de ilustração, ambas uma aplicação executando no computador e o compu-tador podem ser um componente. Um ou mais componentes podem residir em um processoe/ou tarefa de execução e um componente pode estar localizado em um computador e/oudistribuído entre dois ou mais computadores. A palavra "exemplificado" é usada aqui parasignificar servir como um exemplo, caso, ou ilustração. Qualquer aspecto ou projeto descritoaqui como "exemplificado" não é necessariamente construído como preferencial ou vantajo-so sobre outros aspectos ou projetos.
Além disso, o assunto descrito pode ser implementado como um sistema, método,aparelho ou artigo de fabricação usando técnicas de programação padrão e/ou de engenha-ria para produzir software, suporte lógico inalterável, hardware ou qualquer combinaçãodesses para controlar um dispositivo baseado em computador ou processador para imple-mentar aspectos detalhados aqui. O termo programa de computador como usado aqui pre-tende abranger um programa de computador acessível a partir de qualquer dispositivo legí-vel por computador, portadora ou meios. Por exemplo, os meios legíveis por computadorpodem incluir, mas não estão limitados a, dispositivos de armazenamento magnético (porexemplo, disco rígido, disco flexível, fitas magnéticas, ...), discos ópticos (por exemplo, discocompacto (CD), disco versátil digital (DVD), ...), cartões inteligentes, e dispositivos de me-mória rápida (por exemplo, cartão, módulo). Adicionalmente, dever-se-ia apreciar que umaonda portadora pode ser empregada para carregar dados eletrônicos legíveis por computa-dor tal como aqueles usados na transmissão e recebimento de correio eletrônico ou no a-cesso a uma rede, tal como a Internet ou uma rede de área local (LAN). É claro, aqueles versados na técnica reconhecerão que muitas modificações podem ser feitas a essa confi-guração sem abandonar o escopo ou espírito do assunto reivindicado.
A Fig. 10 é um diagrama de bloco esquemático de um ambiente de computador deamostra 1000 que pode ser empregado para estimar preferência de usuário via o compo-nente de comportamento de usuário de acordo com um aspecto da inovação em questão. Osistema 1000 inclui um ou mais cliente(s) 1010. O cliente(s) 1010 pode ser hardware e/ousoftware (por exemplo, tarefas, processos, dispositivos de computação). O sistema 1000também inclui um ou mais servidor(es) 1030. O servidor(es) 1030 pode também ser hardwa-re e/ou software (por exemplo, tarefas, processos, dispositivos de computação). Os servido-res 1030 podem alojar tarefas para executar transformações empregando os componentes descritos aqui, por exemplo. Uma comunicação possível entre um cliente 1010 e um servi-dor 1030 pode ser na forma de um pacote de dados adaptado para ser transmitido entredois ou mais processos de computador. O sistema 1000 inclui uma estrutura de comunica-ção 1050 que pode ser empregada para facilitar comunicações entre o cliente(s) 1010 e oservidor(es) 1030. Os clientes 1010 são operacionalmente conectados a um ou mais arma-zenadores de dados de cliente 1060 que podem ser empregados para armazenar informa-ção local no cliente(s) 1010. Similarmente, os servidores 1030 são operacionalmente conec-tados a um ou mais armazenadores de dados de servidor 1040 que podem ser empregadospara armazenar informação local nos servidores 1030.
O que foi descrito acima inclui vários aspectos exemplificados. Não é possível, é claro, descrever cada combinação concebível de componentes ou metodologias para propó-sitos de descrever esses aspectos, mas um versado na técnica pode reconhecer que muitascombinações adicionais e permutas são possíveis. Conseqüentemente, os aspectos descri-tos aqui pretendem abranger todas tais alterações, modificações, e variações que caem noespírito e escopo das reivindicações em anexo.
Além disso, no que diz respeito ao termo "inclui", este é usado ou na descrição de-talhada ou nas reivindicações, tal termo pretende ser inclusivo de uma maneira similar aotermo "compreende", como "compreende" é interpretado quando empregado como uma pa-lavra transitória em uma reivindicação.

Claims (20)

1. Sistema implementado por computador, CARACTERIZADO pelo fato de quecompreende os seguintes componentes executáveis por computador:um componente de comportamento de usuário (104, 35, 515, 610) que facilita a in-terpretação automática de comportamento coletivo de usuários (101, 103, 105) para estimarpreferências de usuário de resultados de busca (350, 550) eum mecanismo de busca (102, 202, 340, 540) que incorpora o comportamento cole-tivo para determinação de relevância e classificação de resultados de busca retornados(350, 550).
2. Sistema implementado por computador, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que o componente de comportamento de usuário adicio-nalmente compreende um componente de fundo e um componente de relevância.
3. Sistema implementado por computador, de acordo com a reivindicação 1,CARACTERIZADO adicionalmente pelo fato de que compreende um componente de a -prendizado de máquina.
4. Sistema implementado por computador, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que o componente de comportamento de usuário adicio-nalmente compreende um modelo acionado por dados de comportamento de usuário.
5. Sistema implementado por computador, de acordo com a reivindicação 4,CARACTERIZADO pelo fato de que o mecanismo de busca adicionalmente compreendeum modelo de comportamento de usuário com características diretamente observadas ecaracterísticas de comportamento derivadas.
6. Sistema implementado por computador, de acordo com a reivindicação 4,CARACTERIZADO adicionalmente pelo fato de que compreende um registro de dados queinclui dados de busca anteriores.
7. Sistema implementado por computador, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que o mecanismo de busca adicionalmente compreendeum componente classificador que classifica os resultados de busca.
8. Sistema implementado por computador, de acordo com a reivindicação 5,CARACTERIZADO adicionalmente pelo fato de que compreende um componente de a-prendizado de máquina que treina o modelo de comportamento de usuário.
9. Sistema implementado por computador, de acordo com a reivindicação 5,CARACTERIZADO pelo fato de que o modelo adicionalmente compreende característicasde clique, características de apresentação e características de navegação.
10. Método implementado por computador, CARACTERIZADO pelo fato de quecompreende as seguintes ações executáveis por computador:obter comportamento de usuário durante a interação com o mecanismo de busca(102, 202, 340, 540);agregar o comportamento de usuário para uma análise desse; eestimar as preferências de usuário para resultados retornados (350, 550).
11. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende classificar informação re-tornada baseada em preferências de usuário.
12. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende treinar um modelo paraclassificar a informação.
13. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende automaticamente gerar omodelo a partir do comportamento de usuário.
14. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende desenvolver um conjuntode características relacionadas à interação de usuário com a informação retornada.
15. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende empregar aprendizado demáquina para incorporar o comportamento de usuário.
16. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende prever o comportamentodo usuário.
17. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende minar comportamento deusuário agregado para classificar os resultados da busca.
18. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende empregar característicasdiretamente observadas a partir de interações de usuário com os resultados da busca paraestimar as preferências de usuário.
19. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende suavizar ruído associadocom comportamento de usuário agregado.
20. Sistema implementado por computador, CARACTERIZADO pelo fato de quecompreende os seguintes componentes executáveis por computador:Dispositivo (102, 202, 340, 540) para coletar retorno implícito de usuários; eDispositivo (104, 315, 515, 610) para estimar preferências de usuário.
BRPI0708397-1A 2006-03-02 2007-02-08 extração de comportamento de usuário de busca na rede para aperfeiçoar releváncia de busca na rede BRPI0708397A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US77865006P 2006-03-02 2006-03-02
US60/778,650 2006-03-02
US11/457,733 US20070208730A1 (en) 2006-03-02 2006-07-14 Mining web search user behavior to enhance web search relevance
US11/457,733 2006-07-14
PCT/US2007/003530 WO2007106269A1 (en) 2006-03-02 2007-02-08 Mining web search user behavior to enhance web search relevance

Publications (1)

Publication Number Publication Date
BRPI0708397A2 true BRPI0708397A2 (pt) 2011-05-31

Family

ID=38472589

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0708397-1A BRPI0708397A2 (pt) 2006-03-02 2007-02-08 extração de comportamento de usuário de busca na rede para aperfeiçoar releváncia de busca na rede

Country Status (9)

Country Link
US (1) US20070208730A1 (pt)
EP (1) EP1997065A4 (pt)
JP (1) JP5247475B2 (pt)
KR (1) KR101366408B1 (pt)
BR (1) BRPI0708397A2 (pt)
CA (1) CA2644440A1 (pt)
MX (1) MX2008011223A (pt)
RU (1) RU2435212C2 (pt)
WO (1) WO2007106269A1 (pt)

Families Citing this family (118)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461059B2 (en) * 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US7860886B2 (en) * 2006-09-29 2010-12-28 A9.Com, Inc. Strategy for providing query results based on analysis of user intent
US9747349B2 (en) * 2006-10-30 2017-08-29 Execue, Inc. System and method for distributing queries to a group of databases and expediting data access
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US9110975B1 (en) * 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
US9305088B1 (en) * 2006-11-30 2016-04-05 Google Inc. Personalized search results
KR100898456B1 (ko) * 2007-01-12 2009-05-21 엔에이치엔(주) 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템
US8938463B1 (en) 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
US8832140B2 (en) * 2007-06-26 2014-09-09 Oracle Otc Subsidiary Llc System and method for measuring the quality of document sets
US8935249B2 (en) 2007-06-26 2015-01-13 Oracle Otc Subsidiary Llc Visualization of concepts within a collection of information
US8458165B2 (en) * 2007-06-28 2013-06-04 Oracle International Corporation System and method for applying ranking SVM in query relaxation
US7783620B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Relevancy scoring using query structure and data structure for federated search
US7783630B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Tuning of relevancy ranking for federated search
US8694511B1 (en) 2007-08-20 2014-04-08 Google Inc. Modifying search result ranking based on populations
US20090089311A1 (en) * 2007-09-28 2009-04-02 Yahoo! Inc. System and method for inclusion of history in a search results page
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
US7984000B2 (en) 2007-10-31 2011-07-19 Microsoft Corporation Predicting and using search engine switching behavior
US9152699B2 (en) * 2007-11-02 2015-10-06 Ebay Inc. Search based on diversity
US20090119278A1 (en) * 2007-11-07 2009-05-07 Cross Tiffany B Continual Reorganization of Ordered Search Results Based on Current User Interaction
US20090119254A1 (en) * 2007-11-07 2009-05-07 Cross Tiffany B Storing Accessible Histories of Search Results Reordered to Reflect User Interest in the Search Results
US7797260B2 (en) * 2008-02-11 2010-09-14 Yahoo! Inc. Automated document classifier tuning including training set adaptive to user browsing behavior
US7836058B2 (en) 2008-03-27 2010-11-16 Microsoft Corporation Web searching
US8069179B2 (en) * 2008-04-24 2011-11-29 Microsoft Corporation Preference judgements for relevance
US8543592B2 (en) * 2008-05-30 2013-09-24 Microsoft Corporation Related URLs for task-oriented query results
US20090299964A1 (en) * 2008-05-30 2009-12-03 Microsoft Corporation Presenting search queries related to navigational search queries
US8639636B2 (en) * 2008-08-15 2014-01-28 At&T Intellectual Property I, L.P. System and method for user behavior modeling
US7979415B2 (en) * 2008-09-04 2011-07-12 Microsoft Corporation Predicting future queries from log data
US8037043B2 (en) 2008-09-09 2011-10-11 Microsoft Corporation Information retrieval system
US8060456B2 (en) * 2008-10-01 2011-11-15 Microsoft Corporation Training a search result ranker with automatically-generated samples
US8515950B2 (en) * 2008-10-01 2013-08-20 Microsoft Corporation Combining log-based rankers and document-based rankers for searching
US9449078B2 (en) * 2008-10-01 2016-09-20 Microsoft Technology Licensing, Llc Evaluating the ranking quality of a ranked list
US8122021B2 (en) * 2008-10-06 2012-02-21 Microsoft Corporation Domain expertise determination
US8126894B2 (en) * 2008-12-03 2012-02-28 Microsoft Corporation Click chain model
US8396865B1 (en) 2008-12-10 2013-03-12 Google Inc. Sharing search engine relevance data between corpora
US8341167B1 (en) 2009-01-30 2012-12-25 Intuit Inc. Context based interactive search
US8577875B2 (en) * 2009-03-20 2013-11-05 Microsoft Corporation Presenting search results ordered using user preferences
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US8073832B2 (en) 2009-05-04 2011-12-06 Microsoft Corporation Estimating rank on graph streams
US9495460B2 (en) * 2009-05-27 2016-11-15 Microsoft Technology Licensing, Llc Merging search results
US20100306224A1 (en) * 2009-06-02 2010-12-02 Yahoo! Inc. Online Measurement of User Satisfaction Using Long Duration Clicks
US20100332550A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Platform For Configurable Logging Instrumentation
US20100332531A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Batched Transfer of Arbitrarily Distributed Data
US8447760B1 (en) 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US8392380B2 (en) * 2009-07-30 2013-03-05 Microsoft Corporation Load-balancing and scaling for analytics data
US8082247B2 (en) * 2009-07-30 2011-12-20 Microsoft Corporation Best-bet recommendations
US8135753B2 (en) * 2009-07-30 2012-03-13 Microsoft Corporation Dynamic information hierarchies
US20110029516A1 (en) * 2009-07-30 2011-02-03 Microsoft Corporation Web-Used Pattern Insight Platform
US9020936B2 (en) * 2009-08-14 2015-04-28 Microsoft Technology Licensing, Llc Using categorical metadata to rank search results
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US9576251B2 (en) * 2009-11-13 2017-02-21 Hewlett Packard Enterprise Development Lp Method and system for processing web activity data
US8874555B1 (en) 2009-11-20 2014-10-28 Google Inc. Modifying scoring data based on historical changes
US8615514B1 (en) 2010-02-03 2013-12-24 Google Inc. Evaluating website properties by partitioning user feedback
US8924379B1 (en) 2010-03-05 2014-12-30 Google Inc. Temporal-based score adjustments
US8959093B1 (en) 2010-03-15 2015-02-17 Google Inc. Ranking search results based on anchors
US9009134B2 (en) * 2010-03-16 2015-04-14 Microsoft Technology Licensing, Llc Named entity recognition in query
WO2011120211A1 (en) * 2010-03-29 2011-10-06 Nokia Corporation Method and apparatus for seeded user interest modeling
KR101098871B1 (ko) 2010-04-13 2011-12-26 건국대학교 산학협력단 랭크된 사용자의 피드백 정보에 기반한 컨텐츠 유사도 측정 장치, 방법 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체
US20110258032A1 (en) * 2010-04-14 2011-10-20 Microsoft Corporation Search advertisement selection based on user actions
US10204163B2 (en) 2010-04-19 2019-02-12 Microsoft Technology Licensing, Llc Active prediction of diverse search intent based upon user browsing behavior
US8799280B2 (en) 2010-05-21 2014-08-05 Microsoft Corporation Personalized navigation using a search engine
US20110295897A1 (en) * 2010-06-01 2011-12-01 Microsoft Corporation Query correction probability based on query-correction pairs
US8612432B2 (en) 2010-06-16 2013-12-17 Microsoft Corporation Determining query intent
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US8825649B2 (en) 2010-07-21 2014-09-02 Microsoft Corporation Smart defaults for data visualizations
US8832083B1 (en) 2010-07-23 2014-09-09 Google Inc. Combining user feedback
US8577915B2 (en) 2010-09-10 2013-11-05 Veveo, Inc. Method of and system for conducting personalized federated search and presentation of results therefrom
US8560484B2 (en) 2010-12-17 2013-10-15 Intel Corporation User model creation
US9002867B1 (en) 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
US9449093B2 (en) * 2011-02-10 2016-09-20 Sri International System and method for improved search experience through implicit user interaction
US9053208B2 (en) 2011-03-02 2015-06-09 Microsoft Technology Licensing, Llc Fulfilling queries using specified and unspecified attributes
US9507861B2 (en) * 2011-04-01 2016-11-29 Microsoft Technolgy Licensing, LLC Enhanced query rewriting through click log analysis
US8732151B2 (en) 2011-04-01 2014-05-20 Microsoft Corporation Enhanced query rewriting through statistical machine translation
JP2013037624A (ja) * 2011-08-10 2013-02-21 Sony Computer Entertainment Inc 情報処理システム、情報処理方法、プログラム及び情報記憶媒体
CA2857517A1 (en) * 2011-12-15 2013-06-20 Yahoo! Inc. Systems and methods involving features of search and/or search integration
US9355095B2 (en) 2011-12-30 2016-05-31 Microsoft Technology Licensing, Llc Click noise characterization model
US20140143250A1 (en) * 2012-03-30 2014-05-22 Xen, Inc. Centralized Tracking of User Interest Information from Distributed Information Sources
US9460237B2 (en) * 2012-05-08 2016-10-04 24/7 Customer, Inc. Predictive 411
CN103544150B (zh) * 2012-07-10 2016-03-09 腾讯科技(深圳)有限公司 为移动终端浏览器提供推荐信息的方法及系统
US8996513B2 (en) * 2012-07-24 2015-03-31 Microsoft Technology Licensing, Llc Providing an interface to access website actions
CN103631794B (zh) * 2012-08-22 2019-05-07 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行排序的方法、装置与设备
US10108720B2 (en) * 2012-11-28 2018-10-23 International Business Machines Corporation Automatically providing relevant search results based on user behavior
US9589149B2 (en) 2012-11-30 2017-03-07 Microsoft Technology Licensing, Llc Combining personalization and privacy locally on devices
KR102090269B1 (ko) 2012-12-14 2020-03-17 삼성전자주식회사 정보 검색 방법, 그와 같은 기능을 갖는 디바이스 및 기록 매체
US9824151B2 (en) * 2012-12-27 2017-11-21 Google Inc. Providing a portion of requested data based upon historical user interaction with the data
US20140188889A1 (en) * 2012-12-31 2014-07-03 Motorola Mobility Llc Predictive Selection and Parallel Execution of Applications and Services
US9594837B2 (en) 2013-02-26 2017-03-14 Microsoft Technology Licensing, Llc Prediction and information retrieval for intrinsically diverse sessions
RU2543315C2 (ru) 2013-03-22 2015-02-27 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" Способ отбора эффективных вариантов в поисковых и рекомендательных системах (варианты)
US10079737B2 (en) 2013-09-13 2018-09-18 Clicktale Ltd. Method and system for generating comparable visual maps for browsing activity analysis
CN104679771B (zh) * 2013-11-29 2018-09-18 阿里巴巴集团控股有限公司 一种个性化数据搜索方法和装置
RU2608886C2 (ru) * 2014-06-30 2017-01-25 Общество С Ограниченной Ответственностью "Яндекс" Ранжиратор результатов поиска
US10042936B1 (en) * 2014-07-11 2018-08-07 Google Llc Frequency-based content analysis
CN104268212A (zh) * 2014-09-23 2015-01-07 北京奇虎科技有限公司 一种互联网产品的发放方法和装置
CN104462377A (zh) * 2014-12-09 2015-03-25 小米科技有限责任公司 提供联系人信息的方法及装置
US10430473B2 (en) 2015-03-09 2019-10-01 Microsoft Technology Licensing, Llc Deep mining of network resource references
US9697286B2 (en) 2015-03-16 2017-07-04 International Business Machines Corporation Shared URL content update to improve search engine optimization
CN105095357A (zh) * 2015-06-24 2015-11-25 百度在线网络技术(北京)有限公司 一种用于咨询数据处理的方法和装置
RU2637899C2 (ru) 2015-07-16 2017-12-07 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер определения изменений в пользовательском интерактивном взаимодействии со страницей результатов поиска
RU2632138C2 (ru) 2015-09-14 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и сервер ранжирования поисковых результатов на основе параметра полезности
RU2632133C2 (ru) * 2015-09-29 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и система (варианты) создания модели прогнозирования и определения точности модели прогнозирования
RU2632423C2 (ru) * 2015-09-30 2017-10-04 Общество С Ограниченной Ответственностью "Яндекс" Способ и поисковая система предоставления поисковых результатов на множество клиентских устройств
CN114357128A (zh) * 2016-04-18 2022-04-15 谷歌有限责任公司 适当的代理的自动化助理调用
US10055481B2 (en) * 2016-07-20 2018-08-21 LogsHero Ltd. Method and system for automatic event classification
US10803070B2 (en) * 2016-07-29 2020-10-13 International Business Machines Corporation Selecting a content summary based on relevancy
RU2621962C1 (ru) * 2016-08-16 2017-06-08 Игорь Юрьевич Скворцов Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных обмена комментариями между пользователями
RU2630741C1 (ru) * 2016-12-20 2017-09-12 Игорь Юрьевич Скворцов Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных обмена комментариями между пользователями
CN107133290B (zh) * 2017-04-19 2019-10-29 中国人民解放军国防科学技术大学 一种个性化信息检索方法与装置
US11842533B2 (en) * 2017-04-26 2023-12-12 Chia-Lin Simmons Predictive search techniques based on image analysis and group feedback
RU2663706C1 (ru) * 2017-07-20 2018-08-08 Общество С Ограниченной Ответственностью "Центр Разработки И Внедрения Инновационных Технологий" Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных оценки доверия контенту
RU2689812C2 (ru) * 2017-07-25 2019-05-29 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для определения ранжированных позиций ненативных элементов с помощью системы ранжирования
RU2757546C2 (ru) * 2017-07-25 2021-10-18 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания персонализированного пользовательского параметра интереса для идентификации персонализированного целевого элемента содержимого
RU2693324C2 (ru) 2017-11-24 2019-07-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер преобразования значения категориального фактора в его числовое представление
JP7343504B2 (ja) * 2017-12-21 2023-09-12 コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガナイゼーション ユーザ固有ユーザインターフェースの生成
JP6560843B1 (ja) * 2018-03-16 2019-08-14 楽天株式会社 検索システム、検索方法、及びプログラム
CN110971659A (zh) * 2019-10-11 2020-04-07 贝壳技术有限公司 推荐消息的推送方法、装置及存储介质
KR102144370B1 (ko) * 2019-11-18 2020-08-13 주식회사 오투오 대화형 정보 검색장치
CN113127614A (zh) * 2020-01-16 2021-07-16 微软技术许可有限责任公司 基于隐式相关性反馈来提供qa训练数据以及训练qa模型

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6272507B1 (en) * 1997-04-09 2001-08-07 Xerox Corporation System for ranking search results from a collection of documents using spreading activation techniques
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
US6321228B1 (en) * 1999-08-31 2001-11-20 Powercast Media, Inc. Internet search system for retrieving selected results from a previous search
US6546388B1 (en) * 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6701362B1 (en) * 2000-02-23 2004-03-02 Purpleyogi.Com Inc. Method for creating user profiles
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
US6792434B2 (en) * 2001-04-20 2004-09-14 Mitsubishi Electric Research Laboratories, Inc. Content-based visualization and user-modeling for interactive browsing and retrieval in multimedia databases
US20030018621A1 (en) * 2001-06-29 2003-01-23 Donald Steiner Distributed information search in a networked environment
KR100438857B1 (ko) * 2001-09-26 2004-07-05 엘지전자 주식회사 사용자 선호도 기반 멀티미디어 검색 시스템
US8117072B2 (en) * 2001-11-13 2012-02-14 International Business Machines Corporation Promoting strategic documents by bias ranking of search results on a web browser
US7814043B2 (en) * 2001-11-26 2010-10-12 Fujitsu Limited Content information analyzing method and apparatus
US7024404B1 (en) * 2002-05-28 2006-04-04 The State University Rutgers Retrieval and display of data objects using a cross-group ranking metric
CA2397424A1 (en) * 2002-08-09 2004-02-09 Mohammed Lamine Kherfi Content-based image retrieval using positive and negative examples
US20060136405A1 (en) * 2003-01-24 2006-06-22 Ducatel Gary M Searching apparatus and methods
US20050071328A1 (en) * 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search
US20050120003A1 (en) * 2003-10-08 2005-06-02 Drury William J. Method for maintaining a record of searches and results
JP2005208943A (ja) * 2004-01-22 2005-08-04 Denso It Laboratory Inc サービス候補提供システム及びユーザ側通信装置並びにサービス候補提供サーバ
US7457823B2 (en) * 2004-05-02 2008-11-25 Markmonitor Inc. Methods and systems for analyzing data related to possible online fraud
US7257577B2 (en) * 2004-05-07 2007-08-14 International Business Machines Corporation System, method and service for ranking search results using a modular scoring system
TWI386824B (zh) * 2004-08-19 2013-02-21 Carhamm Ltd Llc 響應終端使用者資訊請求之方法及裝置
WO2006036781A2 (en) * 2004-09-22 2006-04-06 Perfect Market Technologies, Inc. Search engine using user intent
WO2006042265A2 (en) * 2004-10-11 2006-04-20 Nextumi, Inc. System and method for facilitating network connectivity based on user characteristics

Also Published As

Publication number Publication date
KR101366408B1 (ko) 2014-03-03
KR20080114708A (ko) 2008-12-31
WO2007106269A1 (en) 2007-09-20
JP2009528619A (ja) 2009-08-06
RU2008135459A (ru) 2010-03-10
MX2008011223A (es) 2008-11-04
US20070208730A1 (en) 2007-09-06
EP1997065A4 (en) 2011-04-13
RU2435212C2 (ru) 2011-11-27
JP5247475B2 (ja) 2013-07-24
CA2644440A1 (en) 2007-09-20
EP1997065A1 (en) 2008-12-03

Similar Documents

Publication Publication Date Title
BRPI0708397A2 (pt) extração de comportamento de usuário de busca na rede para aperfeiçoar releváncia de busca na rede
US11347963B2 (en) Systems and methods for identifying semantically and visually related content
Sugiyama et al. Exploiting potential citation papers in scholarly paper recommendation
Sieg et al. Learning ontology-based user profiles: A semantic approach to personalized web search.
Li et al. Towards effective browsing of large scale social annotations
Noruzi Folksonomies:(un) controlled vocabulary?
US7716150B2 (en) Machine learning system for analyzing and establishing tagging trends based on convergence criteria
US20060224579A1 (en) Data mining techniques for improving search engine relevance
US20090171938A1 (en) Context-based document search
US20110302156A1 (en) Re-ranking search results based on lexical and ontological concepts
GB2486490A (en) Method for structuring a network
Wang et al. Mining subtopics from text fragments for a web query
Jeong et al. i-TagRanker: an efficient tag ranking system for image sharing and retrieval using the semantic relationships between tags
Matsumoto et al. Fuzzy clustering and relevance ranking of web search results with differentiating cluster label generation
Sharifpour et al. Large-scale analysis of query logs to profile users for dataset search
Gendarmi et al. Community-driven ontology evolution based on folksonomies
Chen et al. iMecho: an associative memory based desktop search system
Bracamonte et al. Extracting semantic knowledge from web context for multimedia IR: a taxonomy, survey and challenges
Grey et al. So you think you're an expert: Keyword searching vs. controlled subject headings
US20240037375A1 (en) Systems and Methods for Knowledge Distillation Using Artificial Intelligence
Bouchoucha et al. Université de Montréal at the NTCIR-11 IMine Task.
Song et al. Multi-aspect query summarization by composite query
US20230061289A1 (en) Generation and use of topic graph for content authoring
Pabitha et al. Refining Serp Search engine result page for Enhanced Information Retrieval
Gupta Design of search system for online digital libraries

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 8A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: REFERENTE AO DESPACHO 8.6 PUBLICADO NA RPI 2308 DE 31/03/2015.