BRPI0708397A2 - extração de comportamento de usuário de busca na rede para aperfeiçoar releváncia de busca na rede - Google Patents
extração de comportamento de usuário de busca na rede para aperfeiçoar releváncia de busca na rede Download PDFInfo
- Publication number
- BRPI0708397A2 BRPI0708397A2 BRPI0708397-1A BRPI0708397A BRPI0708397A2 BR PI0708397 A2 BRPI0708397 A2 BR PI0708397A2 BR PI0708397 A BRPI0708397 A BR PI0708397A BR PI0708397 A2 BRPI0708397 A2 BR PI0708397A2
- Authority
- BR
- Brazil
- Prior art keywords
- computer
- user behavior
- user
- fact
- search
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Abstract
EXTRAçãO DE COMPORTAMENTO DE USUáRIO DE BUSCA NA REDE PARA APERFEIçOAR RELEVáNCIA DE BUSCA NA REDE Sistemas e métodos que estimam preferência de usuário via interpretação automática de comportamento de usuário. Um componente de comportamento de usuário associado com um mecanismo de busca pode automaticamente interpretar comportamento coletivo de usuários (por exemplo, usuários de busca na rede). Tal componente de retorno pode incluir características de comportamento do usuário e modelos preditivos (por exemplo, a partir de um componente de comportamento de usuário) que são robustos a ruído, que podem estar presentes em iterações de usuário observadas com os resultados da busca (por exemplo, atividade de usuário maliciosa e/ou irracional).
Description
"EXTRAÇÃO DE COMPORTAMENTO DE USUÁRIO DE BUSCA NA REDE PARAAPERFEIÇOAR RELEVÂNCIA DE BUSCA NA REDE"
Fundamentos da Invenção
Dada a popularidade da Rede Mundial e da Internet, os usuários podem adquirir in-formação relacionada a quase qualquer tópico de uma grande quantidade de fontes de in-formação. De modo a encontrar informação, os usuários geralmente aplicam vários meca-nismos de busca á tarefa de retorno de informação. Os mecanismos de busca permitem queusuários encontrem páginas da Rede contendo informação ou outro material na Internet quecontém palavras ou frases específicas.
Em geral, uma busca de palavras chave pode encontrar, para o melhor da capaci-dade de um computador, todos os sítios da Rede que têm qualquer informação neles rela-cionada a quaisquer palavras chave e frases que são especificadas. Um sítio de mecanismode busca terá uma caixa para usuários inserirem palavras chave e um botão para pressionarpara iniciar a busca. Muitos mecanismos de busca têm dicas sobre como usar palavras cha-ve para buscar efetivamente. Tipicamente, tais dicas auxiliam os usuários a definir estreita-mente termos de busca, tal que informação estranha e não relacionada não é retornada e oprocesso de retorno de informação não é desordenado. Tal estreitamento manual de termospode suavizar o recebimento de vários milhares de sítios para classificar quando procurandopor informação específica.
Em alguns casos, tópicos de busca são pré-arranjados em áreas de tópico e sub-tópico. Por exemplo, o "Yahoo" fornece uma lista pré-determinada hierarquicamente arran-jada de tópicos possíveis (por exemplo, negócios, governo, ciência, etc.) onde o usuárioselecionará um tópico e então adicionalmente escolherá um sub-tópico na lista. Um outroexemplo de listas pré-determinadas de tópicos é comum em utilitários de ajuda de computa-dores pessoais de mesa, onde uma lista de tópicos de ajuda e sub-tópicos relacionados éfornecida ao usuário. Enquanto essas hierarquias pré-determinadas podem ser úteis emalguns contextos, os usuários freqüentemente necessitam buscar/exigir informação fora e/ounão incluída nessas listas pré-determinadas. Assim, os mecanismos de busca ou outrossistemas de busca são freqüentemente empregados para habilitar que os usuários direcio-nem consultas, para encontrar informação desejada. Contudo, durante as buscas de usuá-rio, muitos resultados não relacionados são retornados, desde que os usuários podem estarincertos de como autorar ou construir uma consulta particular. Além disso, tais sistemas u-sualmente exigem que os usuários modifiquem continuamente consultas, e refinem resulta-dos de busca retornados para obter um número razoável de resultados para examinar.
Não é incomum digitar uma palavra ou frase em um campo de consulta de entradaem sistema de busca, e então retornar vários milhões de resultados como candidatos poten-ciais. Para compreender o grande número de candidatos retornados, o usuário freqüente-mente experimentará outras combinações de palavras, para adicionalmente estreitar a lista.
Em geral, o sistema de busca classificará os resultados de acordo com a relevânciapredita de resultados para a consulta. A classificação é tipicamente baseada em uma funçãoque combina muitos parâmetros incluindo a similaridade de uma página da Rede com umaconsulta bem como a qualidade intrínseca do documento, freqüentemente inferida a partirde uma informação de topologia de Rede. A qualidade da experiência de busca do usuárioestá diretamente relacionada à qualidade da função de classificação, à medida que os usuá-rios tipicamente não visualizam os resultados classificados mais abaixo.
Em geral, o sistema de busca tentará alcançar ou encontrar todos os tópicos rela-cionados à entrada de consulta do usuário sem considerar se os tópicos "buscados" têmqualquer relação contextual com a área ou categoria de tópico do que o usuário está real-mente interessado. Como um exemplo, se um usuário que estava interessado em astrono-mia inserisse a consulta "Saturno" em um sistema de busca convencional, todos os tipos deresultados não relacionados são provavelmente retornados incluindo aqueles relacionados acarros, comerciantes de carros, jogos de computador, e outros sítios tendo a palavra "Satur-no". Um outro problema com as implementações de busca convencionais é que os meca-nismos de busca operam da mesma forma para todos os usuários sem considerar as dife-rentes necessidades e circunstâncias dos usuários. Assim, se dois usuário inserem a mes-ma consulta de busca, eles tipicamente obtêm os mesmos resultados, sem considerar osseus interesses ou características, histórico de busca anterior, contexto de computação atu-al (por exemplo, arquivos abertos), ou contexto ambiental (por exemplo, localização, máqui-na sendo usada, hora do dia, dia da semana).
Sintonizando as funções de classificação de busca para retornar resultados rele-vantes no topo geralmente exige esforço significativo. Uma aproximação geral para moder-nos mecanismos de busca é treinar funções de classificação e ajustar parâmetros de funçãoe pesos automaticamente baseado em exemplos de resultados de busca manualmente ava-liados. Anotadores humanos podem explicitamente avaliar um conjunto de paginas parauma consulta de acordo com relevância percebida, e criar o "padrão de ouro" contra o qualdiferentes algoritmos de classificação podem ser retornados e avaliados. Entretanto, classi-ficações humanas explícitas são caras e difíceis de obter, freqüentemente resultando emfunções de classificação sub-ótimas e incompletamente treinadas.
Sumário da Invenção
O seguinte apresenta um sumário simplificado de modo a fornecer um entendimen-to básico de alguns aspectos do assunto reivindicado. Este sumário não é uma visão exten-siva. Ele não pretende identificar elementos chave/críticos ou delinear o escopo do assuntoreivindicado. Seu único propósito é apresentar alguns conceitos de uma forma simplificadacomo um prelúdio para a descrição mais detalhada que é apresentada posteriormente.A inovação em questão aperfeiçoa as classificações de busca em um sistema deretorno de informação, via empregar um componente de comportamento de usuário quefacilita uma interpretação automática para o comportamento coletivo de usuários, estimar aspreferências de usuário para um item sobre um outro item. Tais preferências podem entãoser empregadas para vários propósitos, tal como para aperfeiçoar a classificação dos resul-tados. O componente de comportamento de usuário pode interagir com um mecanismo(s)de busca e incluir características de retorno que suavizam ruído que tipicamente acompa-nham o comportamento do usuário (por exemplo, atividade de usuário maliciosa e/ou irra-cional). Explorando o comportamento agregado de usuários (por exemplo, não tratando ca-da usuário como um indivíduo profissional), a inovação em questão pode suavizar ruído egerar julgamentos de relevância a partir do retorno de usuários. O componente de compor-tamento de usuário pode empregar retorno implícito ou explícito de usuários e suas intera-ções com os resultados de consultas anteriores. As características comportamentais chaveincluem características de apresentação que podem ajudar um usuário a determinar se umresultado é relevante olhando o título do resultado e descrição; navegando por característi-cas como tempo de permanência em uma página, maneira de alcançar resultados de busca(por exemplo, através de outros vínculos), desvio do tempo médio no domínio, e seus simila-res; características de clique, tal como o número de cliques em um resultado particular paraa consulta. Para um dado par consulta-resultado, a inovação em questão fornece múltiplosvalores de característica observados e derivados para cada tipo de característica.
O componente de comportamento de usuário pode empregar um modelo acionadopor dados do comportamento do usuário. Por exemplo, o componente de comportamento deusuário pode modelar o comportamento de busca na rede do usuário como se fosse geradopor dois componentes: um componente de "fundo" (tal como usuários clicando indiscrimina-damente), e um componente de "relevância" (tal como comportamento específico de consul-ta que é influenciado pela relevância do resultado para a consulta).
De acordo com um aspecto adicional da inovação em questão, o componente decomportamento de usuário pode gerar e/ou modelar os desvios a partir do comportamentode usuário esperado. Portanto, as características derivadas podem ser computadas, ondetais características derivadas explicitamente abordam o desvio do valor de característicaobservado para um dado resultado de busca a partir dos valores esperados para um resul-tado, sem informação dependente de consulta.
Além disso, o componente de comportamento de usuário da inovação em questãopode empregar modelos tendo dois tipos de característica para descrever o comportamentodo usuário, ou seja: direto e desviado, onde o primeiro é os valores diretamente medidos, eo ultimo é o desvio dos valores esperados estimados a partir das distribuições gerais (inde-pendentes de consulta) para as características diretamente observadas correspondentes.Conseqüentemente, o valor observado o de uma característica f para uma consulta q e re-sultado r, pode ser expresso como uma mistura de dois componentes:
o(q, r, f) = C(r, f) + rel(q, r, f)
onde C(r, f) é a distribuição de "fundo" anterior para valores de f agregados atravésde todas as consultas correspondentes ar, e rel(q, r, f) é o componente "relevância" docomportamento influenciado pela relevância do resultado para a consulta. Por exemplo, umaestimativa de relevância do comportamento de usuário pode ser obtida com característicade clique, via uma subtração de distribuição de fundo a partir da freqüência de clique emuma dada posição. Para suavizar o efeito de variações de usuário individuais em comporta-mento, a inovação em questão pode tirar a média de valores de característica através detodos os usuários e sessões de busca para cada par consulta-resultado. Tal agregação po-de fornecer robustez adicional, onde interações de usuário "ruidosas" adicionais não sãoconsideradas.
Conseqüentemente, o comportamento de usuário para um par consulta-resultadopode ser representado por um vetor característica que inclui ambas as características dire-tamente observadas e os valores de características "corrigidos" derivados. Várias técnicasde aprendizagem de máquina podem também ser empregadas em conjunto com algoritmosde classificação de treinamento para sistemas de retorno de informação. Por exemplo, jul-gamentos de relevância humana explícitos podem ser inicialmente fornecidos para váriasconsultas de busca e empregados para subseqüentes algoritmos de classificação de trei-namento.
Em um aspecto relacionado, o comportamento coletivo de usuários interagindo comum mecanismo de busca na rede pode ser automaticamente interpretado de modo a preverfuturas preferências de usuário; portanto, o sistema pode se adaptar para mudar padrões decomportamento de usuário e diferentes configurações de busca re-treinando automatica-mente o sistema com os dados de comportamento de usuário mais recentes.
Para alcançar os fins anteriores e relacionados, certos aspectos ilustrativos do as-sunto reivindicado são descritos aqui em conjunto com a descrição seguinte e os desenhosem anexo. Esses aspectos são indicativos de várias formas nas quais o assunto pode serpraticado, todas as quais pretendem estar no escopo do assunto reivindicado. Outras vanta-gens e novas características podem se tornar aparentes a partir da seguinte descrição deta-lhada quando consideradas em conjunto com os desenhos.
Breve Descrição dos Desenhos
A Fig. 1 ilustra um diagrama de bloco de um componente de comportamento de u-suário de acordo com um aspecto exemplificado da inovação em questão.
A Fig. 2 ilustra um diagrama de bloco de um sistema que incorpora um componentede comportamento de usuário e interage com um modelo de treinamento de um mecanismode busca de acordo com um aspecto da inovação em questão.
A Fig. 3 ilustra um diagrama de bloco de um sistema que incorpora um componenteclassificador operativamente conectado a um componente de comportamento de usuário, eum mecanismo de busca de acordo com um aspecto exemplificado da inovação em ques-tão.
A Fig. 4 ilustra uma tabela de características que representam atividades de nave-gação de usuário de acordo com um aspecto da inovação em questão.
A Fig. 5 ilustra um sistema de retorno de informação automatizado que pode em-pregar um componente de aprendizado de máquina com um aspecto da inovação em ques-tão.
A Fig. 6 ilustra um componente de comportamento de usuário que interage comuma pluralidade de características de sistema, que representa ação do usuário de acordocom um aspecto particular da inovação em questão.
A Fig. 7 ilustra uma metodologia exemplificada de interpretar o comportamento dousuário para estimar preferências do usuário de acordo com um aspecto da inovação emquestão.
A Fig. 8 ilustra uma metodologia de implementar o comportamento de usuário comoparte de classificação de valor de acordo com um aspecto da inovação em questão.
A Fig. 9 ilustra um ambiente exemplificado para implementar vários aspectos da i-novação em questão.
A Fig. 10 é um diagrama de bloco esquemático de um ambiente de computação a-dicional que pode ser empregado para implementar vários aspectos da inovação em ques-tão.
Descrição Detalhada da Invenção
Os vários aspectos da inovação em questão são agora descritos com relação aosdesenhos em anexo, onde números similares se referem a elementos similares ou corres-pondentes. Dever-se-ia entender, entretanto, que os desenhos e a descrição detalhada rela-cionada a esses não pretendem limitar o assunto reivindicado à forma particular descrita. Depreferência, a intenção é abranger todas as modificações, equivalentes, e alternativas quecaem no espírito e escopo do assunto reivindicado.
Como usado aqui, os termos "componente", "sistema", "característica" e seus simi-lares pretendem também se referir a uma entidade relacionada a computador, ou hardware,uma combinação de hardware e software, software, ou software em execução. Por exemplo,um componente pode ser, mas não está limitado a ser, um processo executando em umprocessador, um processador, um objeto, um executável, um processo de execução, umprograma, e/ou um computador. A título de ilustração, ambos uma aplicação executando emcomputador e o computador podem ser um componente. Um ou mais componentes podemresidir em um processo e/ou tarefa de execução e um componente pode estar localizado emum computador e/ou distribuído entre dois ou mais computadores.
A palavra "exemplificado" e usada aqui para significar servir como um exemplo, ca-so, ou ilustração. Qualquer aspecto ou projeto descrito aqui como "exemplificado" não é ne-cessariamente construído como preferencial ou vantajoso sobre outros aspectos ou proje-tos.
Além disso, o assunto descrito pode ser implementado como um sistema, método,aparelho, ou artigo de fabricação usando programação padrão e/ou técnicas de engenhariapara produzir software, suporte lógico inalterável, hardware, ou qualquer combinação des-ses para controlar um dispositivo baseado em computador ou processador para implementaraspectos detalhados aqui. O termo programa de computador como usado aqui pretendeabranger um programa de computador acessível a partir de qualquer dispositivo legível porcomputador, portadora ou meios. Por exemplo, os meios legíveis por computador podemincluir, mas não estão limitados a dispositivos de armazenamento magnético (por exemplo,disco rígido, disco flexível, fitas magnéticas, ...), discos ópticos (por exemplo, disco compac-to (CD), disco versátil digital (DVD), ...), cartões inteligentes, e dispositivos de memória rápi-da (por exemplo, cartão, módulo). Adicionalmente, dever-se-ia apreciar que uma onda por-tadora pode ser empregada para carregar dados eletrônicos legíveis por computador tal co-mo aqueles usados na transmissão e recebimento de correio eletrônico ou no acesso a umarede tal como a Internet ou uma rede de área local (LAN). É claro, aqueles versados na téc-nica reconhecerão que muitas modificações podem ser feitas a essa configuração sem a-bandonar o escopo ou espírito do assunto reivindicado.
Voltando inicialmente para a Fig. 1, um diagrama de bloco de um sistema 100 é i-lustrado, o qual incorpora um componente de comportamento de usuário que interage com um mecanismo de busca de acordo com um aspecto exemplificado da inovação em ques-tão. O componente de comportamento de usuário 104 associado com o mecanismo de bus-ca 102 pode automaticamente interpretar o comportamento coletivo de usuários 101, 103,105 (1 a N, onde N é um inteiro). Tal componente de comportamento de usuário 104 podeincluir características de retorno que suavizam ruído, que tipicamente acompanham o com-portamento de usuário (por exemplo, atividade de usuário maliciosa e/ou irracional). Explo-rando o comportamento agregado dos usuários 101, 103, 105 (por exemplo, não tratandocada usuário como um indivíduo especialista), o sistema 100 pode suavizar ruído, e gerarjulgamentos de relevância a partir de retorno de usuários.
O componente de comportamento de usuário 104 pode interagir com o componentede classificação. Para uma dada consulta, o componente de comportamento de usuário 104retorna as predições derivadas de um modelo de comportamento anteriormente treinadopara essa consulta, e re-ordena os resultados para a consulta, tal que os resultados queparecem relevantes para usuários anteriores são classificados mais altos. Por exemplo, parauma dada consulta q, a pontuação implícita ISr pode ser computada para cada resultado r apartir das características de interação de usuário disponível, resultando na classificação im-plícita Ir, para cada resultado. Uma pontuação combinada SM(r) pode ser computada para rcombinando as classificações obtidas a partir do retorno implícito, Ir, com a classificaçãooriginal de r, Or:
<formula>formula see original document page 8</formula>
O peso W| é um fator de escala heuristicamente sintonizado que representa a "im-portância" relativa do retorno implícito. Os resultados de consulta podem ser ordenados emvalores decrescentes de SM(r) para produzir a classificação final. Um caso particular de talmodelo aparece quando configurando w, para um valor muito grande, efetivamente forçandoresultados clicados como sendo classificados mais altos do que resultados não clicados -uma heurística efetiva e intuitiva que pode ser empregada como uma linha de base. Em ge-ral, a aproximação acima assume que não há interações entre as características subjacen-tes produzindo a classificação de busca na rede original e as características de retorno im-plícitas. Outros aspectos da inovação em questão relaxam tal hipótese interagindo as carac-terísticas de retorno implícitas diretamente no processo de classificação, como descrito emdetalhes a seguir. Além disso, aprecia-se que comportamento de usuário mais sofisticado ealgoritmos de combinação de classificador podem ser empregados, e estão bem no âmbitoda inovação em questão.
A Fig. 2 ilustra um aspecto adicional da inovação em questão, onde o mecanismode busca 202 adicionalmente compreende um modelo de treinamento 204 de acordo comum aspecto da inovação em questão. O modelo de treinamento 204 pode ademais compre-ender tipos de modelo adicional para descrever comportamento de usuário, ou seja: umacaracterística de comportamento observado 201 e uma característica de comportamentoderivado 203. As características de comportamento observadas 201 são os valores direta-mente medidos, e a característica de comportamento derivada 203 é o desvio dos valoresesperados estimados a partir dos valores esperados estimados a partir das distribuiçõesgerais (independentes de consulta) para as características diretamente observadas corres-pondentes. Conseqüentemente, o valor observado o de uma característica f para uma con-sulta q e resultado r, pode ser expresso como uma mistura de dois componentes:
o(q, r, f) = C(r, f) + rel(q, r, f)
onde C(r, f) é a distribuição de "fundo" anterior para valores de f agregados atravésde todas as consultas correspondentes a r, e rel(q, r, f) é o componente do comportamentoinfluenciado pela relevância dos resultados. Por exemplo, uma estimativa de relevância docomportamento de usuário pode ser obtida com característica de clique, via uma subtraçãode distribuição de fundo (por exemplo, ruído) da freqüência de clique observada em umadada posição. Para suavizar o efeito de variações de usuário individuais em comportamento,a inovação em questão pode tirar a média de valores de característica direta através de to-dos os usuários e sessões de busca para cada par consulta-URL. Tal agregação pode for-necer robustez adicional, onde interações de usuário "ruidosas" individuais não são conside-radas. Conseqüentemente, o comportamento de usuário para um par consulta-URL podeser representado por um vetor de característica que inclui ambas as características direta- mente observadas e, valores de características "corrigidas" derivadas.
A Fig. 3 ilustra um diagrama de bloco de um sistema 300 que incorpora um compo-nente classificador 310 operacionalmente conectado a um componente de comportamentode usuário 315 e um mecanismo de busca 340 de acordo com um aspecto exemplificado dainovação em questão. Tipicamente, o mecanismo de busca 340 pode classificar resultados de busca 350 baseado em um grande número de características, incluindo característicasbaseadas em conteúdo (por exemplo, o quanto uma consulta se aproxima do texto ou títuloou texto âncora do documento), e características de qualidade de página independente deconsulta (por exemplo, Classificação da Página do documento ou do domínio), como descri-to em detalhes a seguir. Além disso, o mecanismo de busca 340 pode empregar métodos<- 20 automáticos (ou semi-automáticos) para sintonizar a função de classificação específica quecombina tais valores de característica. Por exemplo, pode-se assumir que um usuário quefaz uma consulta 360 executará ações particulares. Tais ações podem incluir clicar, nave-gar, enviar refinamentos de consulta até encontrar um documento relevante, e seus simila-res. Mediante encontrar o documento relevante, o usuário pode se tornar satisfeito e mudar o comportamento (por exemplo, ler o documento). A inovação em questão habilita descobrirum conjunto suficientemente rico de características que permitiriam a detecção de quando ousuário está satisfeito com um resultado retornado. Tais características são dependentesdas consultas feitas, e, portanto, são específicos de consulta. Por exemplo, característi-cas/atividades de usuário podem ser categorizadas em características de apresentação, características de navegação, e características de clique, como descrito com relação à Fig.4.
A Fig. 4 ilustra uma tabela de características 400 que representam atividades denavegação de usuário. As características de apresentação 410 são tipicamente projetadaspara representar a experiência do usuário à medida que elas afetam alguns ou todos os as-pectos do comportamento (por exemplo, um usuário pode decidir clicar em um resultadobaseado nas características de apresentação). Para modelar tal aspecto de experiência deusuário, a inovação em questão pode empregar características tais como sobreposição empalavras no título e palavras na consulta (Sobreposição de Título) e a fração de palavrascompartilhadas pela consulta e o sumário de resultado, à medida que esses são freqüente-mente considerados por usuários quando tomando uma decisão se clicar em um sumário deresultado para visualizar o documento completo.
Igualmente, a característica de navegação 420 pode capturar e quantificar aspectosdas interações de página da rede de usuário. Por exemplo, a inovação em questão podecomputar o desvio de tempo de permanência a partir do tempo de permanência da páginaesperada para uma consulta, o que permite modelar a diversidade intra-consulta de compor-tamento de navegação de página. Esse pode ademais incluir ambas características diretas eas derivadas, como descrito em detalhes a seguir. Igualmente, as características de clique430 são um exemplo de interação de usuário com os resultados de mecanismo de busca.Por exemplo, as características de clique podem incluir o número de cliques para um parconsulta-resultado, ou o desvio da probabilidade de clique esperada.
Como ilustrado na Fig. 4, o clique ilustra um aspecto de interações de usuário com um mecanismo de busca na rede. A inovação em questão pode empregar modelos de com-portamento de usuário preditivos automaticamente derivados. Conseqüentemente, para umadada consulta, cada resultado pode ser representado com as características na Tabela daFig. 4. As preferências de usuário relativas podem então ser estimadas usando o modelo decomportamento de usuário aprendido, como descrito em detalhes acima. O uso de tais mo-delos de comportamento de usuário habilita o mecanismo de busca a se beneficiar da com-preensão de multidões interagindo com os resultados da busca bem como característicasmais ricas caracterizando comportamento de navegação além da página de resultados debusca.
A Fig. 5 ilustra um sistema de retorno de informação automatizado 500 que podeempregar um componente de aprendizado de máquina 535 de acordo com um aspecto dainovação em questão. Uma estratégia de interpretação de retorno implícito geral pode serempregada para automaticamente aprender um modelo de preferências de usuário (por e-xemplo, ao invés de contar com heurísticas ou intuições). O sistema 500 inclui um compo-nente de classificação 510 que pode ser treinado a partir de um registro de dados 520 ouinterações com o componente de comportamento de usuário 515, por exemplo. Os dados noregistro 520 podem ser reunidos a partir de fontes de dados locais ou remotas e inclueminformação relacionada aos dados de busca anteriores ou atividades 530 a partir de umapluralidade de usuários. Depois de treinar, o componente classificador 510 pode interagircom o mecanismo de busca 540 para facilitar ou aperfeiçoar resultados de busca futurosque são indicados como resultados relevantes 550. Por exemplo, uma ou mais novas con-sultas de busca 560 podem ser processadas pelo mecanismo de busca 540, baseadas emparte no treinamento a partir de dados de busca anteriores 530, e/ou informação a partir docomponente de comportamento de usuário 515. Em geral, o sistema 500 pode empregarvárias técnicas de mineração de dados para aperfeiçoar a relevância do mecanismo de bus-ca. Tais técnicas podem incluir empregar classificadores de relevância no componente clas-sificador 510, para gerar dados de treinamento de alta qualidade para classificadores detempo de execução, que são empregados com o mecanismo de busca 540 para gerar osresultados de busca 550. A Fig. 6 ilustra um componente de comportamento de usuário 610que interage com uma pluralidade de características de sistema, que representam a ação dousuário. Em um aspecto, a inovação em questão considera os comportamentos de busca narede como uma combinação de um componente de "fundo" (por exemplo, ruído independen-te de consulta e de relevância no comportamento do usuário, e seus similares), e um com-ponente de "relevância" (por exemplo, comportamento específico de consulta indicativo darelevância de um resultado para uma consulta). Tal arranjo pode levar vantagem de compor-tamento de usuário agregado, onde o conjunto de características é compreendido de carac-terísticas diretamente observadas (computadas diretamente a partir de observações paracada consulta), bem como características derivadas específicas de consulta, computadascomo o desvio da distribuição independente de consulta total de valores para os valores decaracterística diretamente observados correspondentes. Como ilustrado na Fig. 6, caracte-rísticas de sistema exemplificadas tais como: característica(s) de clique 612, característicasde navegação 614, e características de apresentação 616, que podem ser empregadas pararepresentar interações de usuário com resultados de busca na rede, através do componentede comportamento de usuário 610. Além disso, características tal como o desvio do númerode cliques observados para um dado par consulta-URL a partir do número esperado de cli-ques em um resultado na dada posição, podem também ser consideradas. Além disso, ocomportamento de navegação pode ser modelado, por exemplo, depois que um resultado éclicado, então o tempo de permanência em página médio para um dado par consulta-URLdado, bem como seu desvio a partir do tempo de permanência (médio) esperado, é empre-gado para tal modelo. Adicionalmente, por exemplo, usuário de busca na rede podem fre-qüentemente determinar se um resultado é relevante olhando no título do resultado, URL esumário - em muitos casos, olhar no documento original é tipicamente não necessário. Paramodelar esse aspecto de experiência de usuário, características tais como: sobreposiçõesem palavras no título e palavras na consulta, podem também ser empregadas.
A Fig. 7 ilustra uma metodologia exemplificada 700 de interpretar o comportamentodo usuário para estimar as preferências do usuário de acordo com um aspecto da inovaçãoem questão. Enquanto o método exemplificado é ilustrado e descrito aqui como uma sériede blocos representativos de vários eventos e/ou ações, a inovação em questão não estálimitada pelo ordenamento ilustrado de tais blocos. Por exemplo, algumas ações ou eventospodem ocorrer em diferentes ordens e/ou ao mesmo tempo com outras ações ou eventos,separado do ordenamento ilustrado aqui, de acordo com a inovação. Em adição, nem todosos blocos ilustrados, eventos ou ações, podem ser exigidos para implementar uma metodo-logia de acordo com a inovação em questão. Além disso, será apreciado que o método e-xemplificado e outros métodos de acordo com a inovação podem ser implementados emassociação com o método ilustrado e descrito aqui, bem como em associação com outrossistemas e aparelhos não ilustrados ou descritos. Inicialmente e em 710, dados relacionadosà interação de usuário com o mecanismo de busca, tal como comportamento de usuário pósbusca podem ser adquiridos. Subseqüentemente e em 720, o comportamento do usuáriopode ser agregado, por exemplo, empregando técnicas de análise estatística. Em 730, oaprendizado em máquina pode então ser empregado para treinar modelo de preferência deusuário. Subseqüentemente e em 740, as predições de preferência podem ser fornecidaspara resultado de consultas futuras.
A Fig. 8 ilustra uma metodologia 800 de implementar o comportamento de usuáriocomo parte da classificação de acordo com um aspecto da inovação em questão. Inicial-mente e em 810, os dados relacionados ao comportamento do usuário podem ser coletados.Tal comportamento do usuário pode então ser empregado para treinar e/ou automaticamen-te gerar um modelo de comportamento em 820. Tal modelo (por exemplo, modelo de com-portamento preditivo) pode então ser incorporado como parte de um mecanismo de buscapara classificar resultados e/ou gerar julgamentos de relevância implícitos a partir do retornode usuários, em 830. Subseqüentemente, e 840, baseado em parte na informação de mode-lo comportamental gerado e/ou treinado retornada pelo mecanismo de busca pode então serclassificado.
De modo a fornecer um contexto para os vários aspectos do assunto descrito, asFigs. 9 e 10, bem como a seguinte discussão pretendem fornecer uma breve descrição geralde um ambiente adequado no qual os vários aspectos do assunto descrito podem ser in>plementados. Enquanto o assunto foi descrito acima no contexto geral de instruções execu-táveis por computador de um programa de computador que executa em um computadore/ou computadores, aqueles versados na técnica reconhecerão que a inovação tambémpode ser implementada em combinação com outros módulos de programa. Geralmente, osmódulos de programa incluem rotinas, programas, componentes, estruturas de dados, etc.,que executam tarefas particulares e/ou implementam tipos de dados abstratos particulares.Além disso, aqueles versados na técnica apreciarão que os métodos inovadores podem serpraticados com outras configurações de sistema de computador, incluindo sistemas decomputador de único processador ou de multiprocessador, dispositivos de mini-computação,computadores de grande porte, bem como computadores pessoais, dispositivos de compu-tação portáteis (por exemplo, assistente digital pessoal (PDA), telefone, relógio, ...), eletrôni-cos industriais ou de consumo programáveis ou baseados em microprocessador, e seussimilares. Os aspectos ilustrados podem também ser praticados em ambientes de computa-ção distribuídos onde tarefas são executadas por dispositivos de processamento remoto quesão ligados através de uma rede de comunicações. Entretanto, alguns, de não todos os as-pectos da inovação podem ser praticados em computadores autônomos. Em um ambientede computação distribuído, os módulos de programa podem ser localizados em ambos dis-positivos de armazenamento em memória remoto ou local.
Com relação à Fig. 9, um ambiente exemplificado 910 para implementar vários as-pectos da inovação em questão é descrito, o qual inclui um computador 912. O computador912 inclui uma unidade de processamento 914, uma memória de sistema 916, e um barra-mento de sistema 918. O barramento de sistema 918 acopla componentes de sistema inclu-indo, mas não limitados a, memória de sistema 916 à unidade de processamento 914. Aunidade de processamento 914 pode ser qualquer dos vários processadores disponíveis. Osmicroprocessadores duplos e outras arquiteturas de multiprocessador também podem serempregados como a unidade de processamento 914.
O barramento de sistema 918 pode ser qualquer um dos vários tipos de estrutura(s)de barramento incluindo barramento de memória ou controlador de memória, um barramen-to periférico ou barramento externo, e/ou um barramento local usando qualquer variedadede arquiteturas de barramento disponíveis incluindo, mas não limitadas a, barramentos de11 bits, Arquitetura Padrão de Indústria (ISA), Arquitetura de Micro Canal (MCA), ISA Esten-dido (EISA), Eletrônica de Acionamento Inteligente (IDE), Barramento Local VESA (VLB),Componentes Periféricos Interconectados (PCI), Barramento Serial Universal (USB), PortaGráfica Avançada (AGP), barramento de Associação Internacional de Placa de Memória deComputador Pessoal (PCMCIA), e Interface de Sistemas de Pequeno Computador (SCSI).
A memória de sistema 916 inclui memória volátil 920 e memória não volátil 922. Osistema de entrada/saída básico (BIOS), contendo as rotinas básicas para transferir infor-mação entre elementos no computador 912, tal como durante a inicialização, é armazenadoem memória não volátil 922. A título de ilustração, e não limitação, a memória não volátil 922pode incluir memória somente de leitura (ROM), ROM programável (PROM), ROM eletrica-mente programável (EPROM), ROM eletricamente apagável (EEPROM), ou memória rápida.A memória volátil 920 inclui memória de acesso aleatório (RAM), que age como memóriacache externa. A título de ilustração e não limitação, a RAM está disponível em muitas for-mas, tal como RAM síncrona (SRAM), RAM dinâmica (DRAM), DRAM síncrona (SDRAM),SDRAM de taxa dupla de dados (DDR SDRAM), SDRAM aperfeiçoada (ESDRAM), DRAMde ligação síncrona (SLDRAM), e RAM Rambus direta (DRRAM).
O computador 912 também inclui meios de armazenamento em computador remo-víveis/não removíveis, voláteis/não voláteis. A Fig. 9 ilustra, por exemplo, um armazenamen-to em disco 924. O armazenamento em disco 924 inclui, mas não está limitado a, dispositi-vos como uma unidade de disco magnético, unidade de disco flexível, unidade de fita, uni-dade de Jaz, unidade de Zip, unidade LS-60, cartão de memória rápida, ou módulo de me-mória. Em adição, o armazenamento em disco 924 pode incluir meios de armazenamentoseparadamente ou em combinação com outros meios de armazenamento incluindo, masnão limitados a, uma unidade de disco óptico tal como dispositivo ROM de disco compacto(CD-ROM), unidade gravável de CD (Unidade de CD-R), unidade regravável de CD (Unida-de de CD-RW) ou uma unidade ROM de disco versátil digital (DVD-ROM). Para facilitar aconexão dos dispositivos de armazenamento em disco 924 ao barramento de sistema 918,uma interface removível ou não removível é tipicamente usada tal como a interface 926.
Aprecia-se que a Fig. 9 descreve software que age como um intermediário entreusuários e os recursos básicos de computador descritos no ambiente operacional adequado910. Tal software inclui um sistema operacional 928. O sistema operacional 928, que podeser armazenado no armazenamento em disco 924, age para controlar e alocar recursos dosistema de computador 912. Os aplicativos de sistema 930 levam vantagem do gerencial- mente de recursos pelo sistema operacional 928 através de módulos de programa 932 edados de programa 934 armazenados ou na memória de sistema 916 ou no armazenamen-to em disco 924. Aprecia-se que vários componentes descritos aqui podem ser implementa-dos com vários sistemas operacionais ou combinações de sistemas operacionais.
Um usuário insere comandos ou informação no computador 912 através do disposi-tivo(s) de entrada 936. Os dispositivos de entrada 936 incluem, mas não estão limitados a,um dispositivo de apontamento tal como um mouse, mouse estacionário, caneta gráfica,mesa sensível ao toque, teclado, microfone, comando de jogos, mesa de jogos, antena desatélite, digitalizador, placa sintonizadora de TV, câmera digital, câmera de vídeo digital,câmera de rede, e seus similares. Esses e outros dispositivos de entrada se conectam à unidade de processamento 914 através do barramento de sistema 918 via a porta(s) de in-terface 938. As portas de interface 938 incluem, por exemplo, uma porta serial, uma portaparalela, uma porta de jogos, e um barramento serial universal (USB). O dispositivo(s) desaída 940 usa algum do mesmo tipo de portas do dispositivo(s) de entrada 936. Assim, porexemplo, uma porta USB pode ser usada para fornecer entrada para o computador 912, epara emitir informação a partir do computador 912 a um dispositivo de saída 940. O adapta-dor de saída 942 é fornecido para ilustrar que há alguns dispositivos de saída 940 comomonitores, alto-falantes, e impressoras, dentre outros dispositivos de saída 940 que exigemadaptadores especiais. Os adaptadores de saída 942 incluem, a título de ilustração e nãolimitação, placas de vídeo e som que fornecem um dispositivo de conexão entre o dispositi- vo de saída 940 e o barramento de sistema 918. Dever-se-ia notar que outros dispositivose/ou sistemas de dispositivos fornecem ambas as capacidades de entrada e saída tal comoo computadores) remoto 944. O computador remoto 944 pode ser um computador pessoal,um servidor, um roteador, um PC em rede, uma estação de trabalho, uma ferramenta base-ada em microprocessador, um dispositivo par ou outro nó de rede comum e seus similares,e tipicamente inclui muitos ou todos os elementos descritos em relação ao computador 912.Para propósitos de brevidade, somente um dispositivo de armazenamento em memória 946é ilustrado com o computador remoto 944. O computador remoto 944 é logicamente conec-tado ao computador 912 através de uma interface de rede 948 e então fisicamente conecta-do via a conexão de comunicação 950. A interface de rede 948 abrange redes de comunica-ção tais como redes de área local (LAN) e redes de área ampla (WAN). As tecnologias LANincluem Interface de Dados Distribuídos por Fibra Ótica (FDDI), Interface de Dados Distribu-idos por Cabos de Par Trançado (CDDI), Ethernet/IEEE 802.3, Anel de Sinal/IEEE 802.5 eseus similares. As tecnologias WAN incluem, mas não são limitadas a, conexões ponto aponto, redes de comutação de circuito como Redes Digitais de Serviços Integrados (ISDN) evariações nestas, redes de comutação de pacote, e Linhas de Assinante Digital (DSL).
A conexão de comunicação 950 refere-se ao hardware/software empregado paraconectar a interface de rede 948 ao barramento 918. Enquanto a conexão de comunicação950 é mostrada para esclarecimento ilustrativo dentro do computador 912, ela pode ser ex-terna ao computador 912. O hardware/software necessário para conexão à interface de rede948 inclui, para propósitos exemplificados somente, tecnologias internas e externas tais co-mo, modems incluindo modems de qualidade de telefone regular, modems a cabo e mo-dems DSL, adaptadores ISDN, e placas Ethernet.
Como usado aqui, os termos "componente", "sistema" e seus similares pretendemse referir a uma entidade relacionada a computador, ou hardware, uma combinação dehardware e software, software, ou software em execução. Por exemplo, um componentepode ser, mas não é limitado a ser, um processo executando em um processador, um pro-cessador, um objeto, um executável, uma tarefa de execução, um programa, e/ou um com-putador. A título de ilustração, ambas uma aplicação executando no computador e o compu-tador podem ser um componente. Um ou mais componentes podem residir em um processoe/ou tarefa de execução e um componente pode estar localizado em um computador e/oudistribuído entre dois ou mais computadores. A palavra "exemplificado" é usada aqui parasignificar servir como um exemplo, caso, ou ilustração. Qualquer aspecto ou projeto descritoaqui como "exemplificado" não é necessariamente construído como preferencial ou vantajo-so sobre outros aspectos ou projetos.
Além disso, o assunto descrito pode ser implementado como um sistema, método,aparelho ou artigo de fabricação usando técnicas de programação padrão e/ou de engenha-ria para produzir software, suporte lógico inalterável, hardware ou qualquer combinaçãodesses para controlar um dispositivo baseado em computador ou processador para imple-mentar aspectos detalhados aqui. O termo programa de computador como usado aqui pre-tende abranger um programa de computador acessível a partir de qualquer dispositivo legí-vel por computador, portadora ou meios. Por exemplo, os meios legíveis por computadorpodem incluir, mas não estão limitados a, dispositivos de armazenamento magnético (porexemplo, disco rígido, disco flexível, fitas magnéticas, ...), discos ópticos (por exemplo, discocompacto (CD), disco versátil digital (DVD), ...), cartões inteligentes, e dispositivos de me-mória rápida (por exemplo, cartão, módulo). Adicionalmente, dever-se-ia apreciar que umaonda portadora pode ser empregada para carregar dados eletrônicos legíveis por computa-dor tal como aqueles usados na transmissão e recebimento de correio eletrônico ou no a-cesso a uma rede, tal como a Internet ou uma rede de área local (LAN). É claro, aqueles versados na técnica reconhecerão que muitas modificações podem ser feitas a essa confi-guração sem abandonar o escopo ou espírito do assunto reivindicado.
A Fig. 10 é um diagrama de bloco esquemático de um ambiente de computador deamostra 1000 que pode ser empregado para estimar preferência de usuário via o compo-nente de comportamento de usuário de acordo com um aspecto da inovação em questão. Osistema 1000 inclui um ou mais cliente(s) 1010. O cliente(s) 1010 pode ser hardware e/ousoftware (por exemplo, tarefas, processos, dispositivos de computação). O sistema 1000também inclui um ou mais servidor(es) 1030. O servidor(es) 1030 pode também ser hardwa-re e/ou software (por exemplo, tarefas, processos, dispositivos de computação). Os servido-res 1030 podem alojar tarefas para executar transformações empregando os componentes descritos aqui, por exemplo. Uma comunicação possível entre um cliente 1010 e um servi-dor 1030 pode ser na forma de um pacote de dados adaptado para ser transmitido entredois ou mais processos de computador. O sistema 1000 inclui uma estrutura de comunica-ção 1050 que pode ser empregada para facilitar comunicações entre o cliente(s) 1010 e oservidor(es) 1030. Os clientes 1010 são operacionalmente conectados a um ou mais arma-zenadores de dados de cliente 1060 que podem ser empregados para armazenar informa-ção local no cliente(s) 1010. Similarmente, os servidores 1030 são operacionalmente conec-tados a um ou mais armazenadores de dados de servidor 1040 que podem ser empregadospara armazenar informação local nos servidores 1030.
O que foi descrito acima inclui vários aspectos exemplificados. Não é possível, é claro, descrever cada combinação concebível de componentes ou metodologias para propó-sitos de descrever esses aspectos, mas um versado na técnica pode reconhecer que muitascombinações adicionais e permutas são possíveis. Conseqüentemente, os aspectos descri-tos aqui pretendem abranger todas tais alterações, modificações, e variações que caem noespírito e escopo das reivindicações em anexo.
Além disso, no que diz respeito ao termo "inclui", este é usado ou na descrição de-talhada ou nas reivindicações, tal termo pretende ser inclusivo de uma maneira similar aotermo "compreende", como "compreende" é interpretado quando empregado como uma pa-lavra transitória em uma reivindicação.
Claims (20)
1. Sistema implementado por computador, CARACTERIZADO pelo fato de quecompreende os seguintes componentes executáveis por computador:um componente de comportamento de usuário (104, 35, 515, 610) que facilita a in-terpretação automática de comportamento coletivo de usuários (101, 103, 105) para estimarpreferências de usuário de resultados de busca (350, 550) eum mecanismo de busca (102, 202, 340, 540) que incorpora o comportamento cole-tivo para determinação de relevância e classificação de resultados de busca retornados(350, 550).
2. Sistema implementado por computador, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que o componente de comportamento de usuário adicio-nalmente compreende um componente de fundo e um componente de relevância.
3. Sistema implementado por computador, de acordo com a reivindicação 1,CARACTERIZADO adicionalmente pelo fato de que compreende um componente de a -prendizado de máquina.
4. Sistema implementado por computador, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que o componente de comportamento de usuário adicio-nalmente compreende um modelo acionado por dados de comportamento de usuário.
5. Sistema implementado por computador, de acordo com a reivindicação 4,CARACTERIZADO pelo fato de que o mecanismo de busca adicionalmente compreendeum modelo de comportamento de usuário com características diretamente observadas ecaracterísticas de comportamento derivadas.
6. Sistema implementado por computador, de acordo com a reivindicação 4,CARACTERIZADO adicionalmente pelo fato de que compreende um registro de dados queinclui dados de busca anteriores.
7. Sistema implementado por computador, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que o mecanismo de busca adicionalmente compreendeum componente classificador que classifica os resultados de busca.
8. Sistema implementado por computador, de acordo com a reivindicação 5,CARACTERIZADO adicionalmente pelo fato de que compreende um componente de a-prendizado de máquina que treina o modelo de comportamento de usuário.
9. Sistema implementado por computador, de acordo com a reivindicação 5,CARACTERIZADO pelo fato de que o modelo adicionalmente compreende característicasde clique, características de apresentação e características de navegação.
10. Método implementado por computador, CARACTERIZADO pelo fato de quecompreende as seguintes ações executáveis por computador:obter comportamento de usuário durante a interação com o mecanismo de busca(102, 202, 340, 540);agregar o comportamento de usuário para uma análise desse; eestimar as preferências de usuário para resultados retornados (350, 550).
11. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende classificar informação re-tornada baseada em preferências de usuário.
12. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende treinar um modelo paraclassificar a informação.
13. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende automaticamente gerar omodelo a partir do comportamento de usuário.
14. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende desenvolver um conjuntode características relacionadas à interação de usuário com a informação retornada.
15. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende empregar aprendizado demáquina para incorporar o comportamento de usuário.
16. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende prever o comportamentodo usuário.
17. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende minar comportamento deusuário agregado para classificar os resultados da busca.
18. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende empregar característicasdiretamente observadas a partir de interações de usuário com os resultados da busca paraestimar as preferências de usuário.
19. Método implementado por computador, de acordo com a reivindicação 10,CARACTERIZADO adicionalmente pelo fato de que compreende suavizar ruído associadocom comportamento de usuário agregado.
20. Sistema implementado por computador, CARACTERIZADO pelo fato de quecompreende os seguintes componentes executáveis por computador:Dispositivo (102, 202, 340, 540) para coletar retorno implícito de usuários; eDispositivo (104, 315, 515, 610) para estimar preferências de usuário.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US77865006P | 2006-03-02 | 2006-03-02 | |
US60/778,650 | 2006-03-02 | ||
US11/457,733 US20070208730A1 (en) | 2006-03-02 | 2006-07-14 | Mining web search user behavior to enhance web search relevance |
US11/457,733 | 2006-07-14 | ||
PCT/US2007/003530 WO2007106269A1 (en) | 2006-03-02 | 2007-02-08 | Mining web search user behavior to enhance web search relevance |
Publications (1)
Publication Number | Publication Date |
---|---|
BRPI0708397A2 true BRPI0708397A2 (pt) | 2011-05-31 |
Family
ID=38472589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0708397-1A BRPI0708397A2 (pt) | 2006-03-02 | 2007-02-08 | extração de comportamento de usuário de busca na rede para aperfeiçoar releváncia de busca na rede |
Country Status (9)
Country | Link |
---|---|
US (1) | US20070208730A1 (pt) |
EP (1) | EP1997065A4 (pt) |
JP (1) | JP5247475B2 (pt) |
KR (1) | KR101366408B1 (pt) |
BR (1) | BRPI0708397A2 (pt) |
CA (1) | CA2644440A1 (pt) |
MX (1) | MX2008011223A (pt) |
RU (1) | RU2435212C2 (pt) |
WO (1) | WO2007106269A1 (pt) |
Families Citing this family (118)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7461059B2 (en) * | 2005-02-23 | 2008-12-02 | Microsoft Corporation | Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks |
US7860886B2 (en) * | 2006-09-29 | 2010-12-28 | A9.Com, Inc. | Strategy for providing query results based on analysis of user intent |
US9747349B2 (en) * | 2006-10-30 | 2017-08-29 | Execue, Inc. | System and method for distributing queries to a group of databases and expediting data access |
US8661029B1 (en) | 2006-11-02 | 2014-02-25 | Google Inc. | Modifying search result ranking based on implicit user feedback |
US9110975B1 (en) * | 2006-11-02 | 2015-08-18 | Google Inc. | Search result inputs using variant generalized queries |
US9305088B1 (en) * | 2006-11-30 | 2016-04-05 | Google Inc. | Personalized search results |
KR100898456B1 (ko) * | 2007-01-12 | 2009-05-21 | 엔에이치엔(주) | 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템 |
US8938463B1 (en) | 2007-03-12 | 2015-01-20 | Google Inc. | Modifying search result ranking based on implicit user feedback and a model of presentation bias |
US9092510B1 (en) | 2007-04-30 | 2015-07-28 | Google Inc. | Modifying search result ranking based on a temporal element of user feedback |
US8832140B2 (en) * | 2007-06-26 | 2014-09-09 | Oracle Otc Subsidiary Llc | System and method for measuring the quality of document sets |
US8935249B2 (en) | 2007-06-26 | 2015-01-13 | Oracle Otc Subsidiary Llc | Visualization of concepts within a collection of information |
US8458165B2 (en) * | 2007-06-28 | 2013-06-04 | Oracle International Corporation | System and method for applying ranking SVM in query relaxation |
US7783620B1 (en) * | 2007-06-29 | 2010-08-24 | Emc Corporation | Relevancy scoring using query structure and data structure for federated search |
US7783630B1 (en) * | 2007-06-29 | 2010-08-24 | Emc Corporation | Tuning of relevancy ranking for federated search |
US8694511B1 (en) | 2007-08-20 | 2014-04-08 | Google Inc. | Modifying search result ranking based on populations |
US20090089311A1 (en) * | 2007-09-28 | 2009-04-02 | Yahoo! Inc. | System and method for inclusion of history in a search results page |
US8909655B1 (en) | 2007-10-11 | 2014-12-09 | Google Inc. | Time based ranking |
US7984000B2 (en) | 2007-10-31 | 2011-07-19 | Microsoft Corporation | Predicting and using search engine switching behavior |
US9152699B2 (en) * | 2007-11-02 | 2015-10-06 | Ebay Inc. | Search based on diversity |
US20090119278A1 (en) * | 2007-11-07 | 2009-05-07 | Cross Tiffany B | Continual Reorganization of Ordered Search Results Based on Current User Interaction |
US20090119254A1 (en) * | 2007-11-07 | 2009-05-07 | Cross Tiffany B | Storing Accessible Histories of Search Results Reordered to Reflect User Interest in the Search Results |
US7797260B2 (en) * | 2008-02-11 | 2010-09-14 | Yahoo! Inc. | Automated document classifier tuning including training set adaptive to user browsing behavior |
US7836058B2 (en) | 2008-03-27 | 2010-11-16 | Microsoft Corporation | Web searching |
US8069179B2 (en) * | 2008-04-24 | 2011-11-29 | Microsoft Corporation | Preference judgements for relevance |
US8543592B2 (en) * | 2008-05-30 | 2013-09-24 | Microsoft Corporation | Related URLs for task-oriented query results |
US20090299964A1 (en) * | 2008-05-30 | 2009-12-03 | Microsoft Corporation | Presenting search queries related to navigational search queries |
US8639636B2 (en) * | 2008-08-15 | 2014-01-28 | At&T Intellectual Property I, L.P. | System and method for user behavior modeling |
US7979415B2 (en) * | 2008-09-04 | 2011-07-12 | Microsoft Corporation | Predicting future queries from log data |
US8037043B2 (en) | 2008-09-09 | 2011-10-11 | Microsoft Corporation | Information retrieval system |
US8060456B2 (en) * | 2008-10-01 | 2011-11-15 | Microsoft Corporation | Training a search result ranker with automatically-generated samples |
US8515950B2 (en) * | 2008-10-01 | 2013-08-20 | Microsoft Corporation | Combining log-based rankers and document-based rankers for searching |
US9449078B2 (en) * | 2008-10-01 | 2016-09-20 | Microsoft Technology Licensing, Llc | Evaluating the ranking quality of a ranked list |
US8122021B2 (en) * | 2008-10-06 | 2012-02-21 | Microsoft Corporation | Domain expertise determination |
US8126894B2 (en) * | 2008-12-03 | 2012-02-28 | Microsoft Corporation | Click chain model |
US8396865B1 (en) | 2008-12-10 | 2013-03-12 | Google Inc. | Sharing search engine relevance data between corpora |
US8341167B1 (en) | 2009-01-30 | 2012-12-25 | Intuit Inc. | Context based interactive search |
US8577875B2 (en) * | 2009-03-20 | 2013-11-05 | Microsoft Corporation | Presenting search results ordered using user preferences |
US9009146B1 (en) | 2009-04-08 | 2015-04-14 | Google Inc. | Ranking search results based on similar queries |
US8073832B2 (en) | 2009-05-04 | 2011-12-06 | Microsoft Corporation | Estimating rank on graph streams |
US9495460B2 (en) * | 2009-05-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Merging search results |
US20100306224A1 (en) * | 2009-06-02 | 2010-12-02 | Yahoo! Inc. | Online Measurement of User Satisfaction Using Long Duration Clicks |
US20100332550A1 (en) * | 2009-06-26 | 2010-12-30 | Microsoft Corporation | Platform For Configurable Logging Instrumentation |
US20100332531A1 (en) * | 2009-06-26 | 2010-12-30 | Microsoft Corporation | Batched Transfer of Arbitrarily Distributed Data |
US8447760B1 (en) | 2009-07-20 | 2013-05-21 | Google Inc. | Generating a related set of documents for an initial set of documents |
US8392380B2 (en) * | 2009-07-30 | 2013-03-05 | Microsoft Corporation | Load-balancing and scaling for analytics data |
US8082247B2 (en) * | 2009-07-30 | 2011-12-20 | Microsoft Corporation | Best-bet recommendations |
US8135753B2 (en) * | 2009-07-30 | 2012-03-13 | Microsoft Corporation | Dynamic information hierarchies |
US20110029516A1 (en) * | 2009-07-30 | 2011-02-03 | Microsoft Corporation | Web-Used Pattern Insight Platform |
US9020936B2 (en) * | 2009-08-14 | 2015-04-28 | Microsoft Technology Licensing, Llc | Using categorical metadata to rank search results |
US8498974B1 (en) | 2009-08-31 | 2013-07-30 | Google Inc. | Refining search results |
US8972391B1 (en) | 2009-10-02 | 2015-03-03 | Google Inc. | Recent interest based relevance scoring |
US9576251B2 (en) * | 2009-11-13 | 2017-02-21 | Hewlett Packard Enterprise Development Lp | Method and system for processing web activity data |
US8874555B1 (en) | 2009-11-20 | 2014-10-28 | Google Inc. | Modifying scoring data based on historical changes |
US8615514B1 (en) | 2010-02-03 | 2013-12-24 | Google Inc. | Evaluating website properties by partitioning user feedback |
US8924379B1 (en) | 2010-03-05 | 2014-12-30 | Google Inc. | Temporal-based score adjustments |
US8959093B1 (en) | 2010-03-15 | 2015-02-17 | Google Inc. | Ranking search results based on anchors |
US9009134B2 (en) * | 2010-03-16 | 2015-04-14 | Microsoft Technology Licensing, Llc | Named entity recognition in query |
WO2011120211A1 (en) * | 2010-03-29 | 2011-10-06 | Nokia Corporation | Method and apparatus for seeded user interest modeling |
KR101098871B1 (ko) | 2010-04-13 | 2011-12-26 | 건국대학교 산학협력단 | 랭크된 사용자의 피드백 정보에 기반한 컨텐츠 유사도 측정 장치, 방법 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체 |
US20110258032A1 (en) * | 2010-04-14 | 2011-10-20 | Microsoft Corporation | Search advertisement selection based on user actions |
US10204163B2 (en) | 2010-04-19 | 2019-02-12 | Microsoft Technology Licensing, Llc | Active prediction of diverse search intent based upon user browsing behavior |
US8799280B2 (en) | 2010-05-21 | 2014-08-05 | Microsoft Corporation | Personalized navigation using a search engine |
US20110295897A1 (en) * | 2010-06-01 | 2011-12-01 | Microsoft Corporation | Query correction probability based on query-correction pairs |
US8612432B2 (en) | 2010-06-16 | 2013-12-17 | Microsoft Corporation | Determining query intent |
US9623119B1 (en) | 2010-06-29 | 2017-04-18 | Google Inc. | Accentuating search results |
US8825649B2 (en) | 2010-07-21 | 2014-09-02 | Microsoft Corporation | Smart defaults for data visualizations |
US8832083B1 (en) | 2010-07-23 | 2014-09-09 | Google Inc. | Combining user feedback |
US8577915B2 (en) | 2010-09-10 | 2013-11-05 | Veveo, Inc. | Method of and system for conducting personalized federated search and presentation of results therefrom |
US8560484B2 (en) | 2010-12-17 | 2013-10-15 | Intel Corporation | User model creation |
US9002867B1 (en) | 2010-12-30 | 2015-04-07 | Google Inc. | Modifying ranking data based on document changes |
US9449093B2 (en) * | 2011-02-10 | 2016-09-20 | Sri International | System and method for improved search experience through implicit user interaction |
US9053208B2 (en) | 2011-03-02 | 2015-06-09 | Microsoft Technology Licensing, Llc | Fulfilling queries using specified and unspecified attributes |
US9507861B2 (en) * | 2011-04-01 | 2016-11-29 | Microsoft Technolgy Licensing, LLC | Enhanced query rewriting through click log analysis |
US8732151B2 (en) | 2011-04-01 | 2014-05-20 | Microsoft Corporation | Enhanced query rewriting through statistical machine translation |
JP2013037624A (ja) * | 2011-08-10 | 2013-02-21 | Sony Computer Entertainment Inc | 情報処理システム、情報処理方法、プログラム及び情報記憶媒体 |
CA2857517A1 (en) * | 2011-12-15 | 2013-06-20 | Yahoo! Inc. | Systems and methods involving features of search and/or search integration |
US9355095B2 (en) | 2011-12-30 | 2016-05-31 | Microsoft Technology Licensing, Llc | Click noise characterization model |
US20140143250A1 (en) * | 2012-03-30 | 2014-05-22 | Xen, Inc. | Centralized Tracking of User Interest Information from Distributed Information Sources |
US9460237B2 (en) * | 2012-05-08 | 2016-10-04 | 24/7 Customer, Inc. | Predictive 411 |
CN103544150B (zh) * | 2012-07-10 | 2016-03-09 | 腾讯科技(深圳)有限公司 | 为移动终端浏览器提供推荐信息的方法及系统 |
US8996513B2 (en) * | 2012-07-24 | 2015-03-31 | Microsoft Technology Licensing, Llc | Providing an interface to access website actions |
CN103631794B (zh) * | 2012-08-22 | 2019-05-07 | 百度在线网络技术(北京)有限公司 | 一种用于对搜索结果进行排序的方法、装置与设备 |
US10108720B2 (en) * | 2012-11-28 | 2018-10-23 | International Business Machines Corporation | Automatically providing relevant search results based on user behavior |
US9589149B2 (en) | 2012-11-30 | 2017-03-07 | Microsoft Technology Licensing, Llc | Combining personalization and privacy locally on devices |
KR102090269B1 (ko) | 2012-12-14 | 2020-03-17 | 삼성전자주식회사 | 정보 검색 방법, 그와 같은 기능을 갖는 디바이스 및 기록 매체 |
US9824151B2 (en) * | 2012-12-27 | 2017-11-21 | Google Inc. | Providing a portion of requested data based upon historical user interaction with the data |
US20140188889A1 (en) * | 2012-12-31 | 2014-07-03 | Motorola Mobility Llc | Predictive Selection and Parallel Execution of Applications and Services |
US9594837B2 (en) | 2013-02-26 | 2017-03-14 | Microsoft Technology Licensing, Llc | Prediction and information retrieval for intrinsically diverse sessions |
RU2543315C2 (ru) | 2013-03-22 | 2015-02-27 | Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" | Способ отбора эффективных вариантов в поисковых и рекомендательных системах (варианты) |
US10079737B2 (en) | 2013-09-13 | 2018-09-18 | Clicktale Ltd. | Method and system for generating comparable visual maps for browsing activity analysis |
CN104679771B (zh) * | 2013-11-29 | 2018-09-18 | 阿里巴巴集团控股有限公司 | 一种个性化数据搜索方法和装置 |
RU2608886C2 (ru) * | 2014-06-30 | 2017-01-25 | Общество С Ограниченной Ответственностью "Яндекс" | Ранжиратор результатов поиска |
US10042936B1 (en) * | 2014-07-11 | 2018-08-07 | Google Llc | Frequency-based content analysis |
CN104268212A (zh) * | 2014-09-23 | 2015-01-07 | 北京奇虎科技有限公司 | 一种互联网产品的发放方法和装置 |
CN104462377A (zh) * | 2014-12-09 | 2015-03-25 | 小米科技有限责任公司 | 提供联系人信息的方法及装置 |
US10430473B2 (en) | 2015-03-09 | 2019-10-01 | Microsoft Technology Licensing, Llc | Deep mining of network resource references |
US9697286B2 (en) | 2015-03-16 | 2017-07-04 | International Business Machines Corporation | Shared URL content update to improve search engine optimization |
CN105095357A (zh) * | 2015-06-24 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 一种用于咨询数据处理的方法和装置 |
RU2637899C2 (ru) | 2015-07-16 | 2017-12-07 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер определения изменений в пользовательском интерактивном взаимодействии со страницей результатов поиска |
RU2632138C2 (ru) | 2015-09-14 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ (варианты) и сервер ранжирования поисковых результатов на основе параметра полезности |
RU2632133C2 (ru) * | 2015-09-29 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ (варианты) и система (варианты) создания модели прогнозирования и определения точности модели прогнозирования |
RU2632423C2 (ru) * | 2015-09-30 | 2017-10-04 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и поисковая система предоставления поисковых результатов на множество клиентских устройств |
CN114357128A (zh) * | 2016-04-18 | 2022-04-15 | 谷歌有限责任公司 | 适当的代理的自动化助理调用 |
US10055481B2 (en) * | 2016-07-20 | 2018-08-21 | LogsHero Ltd. | Method and system for automatic event classification |
US10803070B2 (en) * | 2016-07-29 | 2020-10-13 | International Business Machines Corporation | Selecting a content summary based on relevancy |
RU2621962C1 (ru) * | 2016-08-16 | 2017-06-08 | Игорь Юрьевич Скворцов | Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных обмена комментариями между пользователями |
RU2630741C1 (ru) * | 2016-12-20 | 2017-09-12 | Игорь Юрьевич Скворцов | Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных обмена комментариями между пользователями |
CN107133290B (zh) * | 2017-04-19 | 2019-10-29 | 中国人民解放军国防科学技术大学 | 一种个性化信息检索方法与装置 |
US11842533B2 (en) * | 2017-04-26 | 2023-12-12 | Chia-Lin Simmons | Predictive search techniques based on image analysis and group feedback |
RU2663706C1 (ru) * | 2017-07-20 | 2018-08-08 | Общество С Ограниченной Ответственностью "Центр Разработки И Внедрения Инновационных Технологий" | Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных оценки доверия контенту |
RU2689812C2 (ru) * | 2017-07-25 | 2019-05-29 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для определения ранжированных позиций ненативных элементов с помощью системы ранжирования |
RU2757546C2 (ru) * | 2017-07-25 | 2021-10-18 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для создания персонализированного пользовательского параметра интереса для идентификации персонализированного целевого элемента содержимого |
RU2693324C2 (ru) | 2017-11-24 | 2019-07-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер преобразования значения категориального фактора в его числовое представление |
JP7343504B2 (ja) * | 2017-12-21 | 2023-09-12 | コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガナイゼーション | ユーザ固有ユーザインターフェースの生成 |
JP6560843B1 (ja) * | 2018-03-16 | 2019-08-14 | 楽天株式会社 | 検索システム、検索方法、及びプログラム |
CN110971659A (zh) * | 2019-10-11 | 2020-04-07 | 贝壳技术有限公司 | 推荐消息的推送方法、装置及存储介质 |
KR102144370B1 (ko) * | 2019-11-18 | 2020-08-13 | 주식회사 오투오 | 대화형 정보 검색장치 |
CN113127614A (zh) * | 2020-01-16 | 2021-07-16 | 微软技术许可有限责任公司 | 基于隐式相关性反馈来提供qa训练数据以及训练qa模型 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6272507B1 (en) * | 1997-04-09 | 2001-08-07 | Xerox Corporation | System for ranking search results from a collection of documents using spreading activation techniques |
US6493702B1 (en) * | 1999-05-05 | 2002-12-10 | Xerox Corporation | System and method for searching and recommending documents in a collection using share bookmarks |
US6321228B1 (en) * | 1999-08-31 | 2001-11-20 | Powercast Media, Inc. | Internet search system for retrieving selected results from a previous search |
US6546388B1 (en) * | 2000-01-14 | 2003-04-08 | International Business Machines Corporation | Metadata search results ranking system |
US6701362B1 (en) * | 2000-02-23 | 2004-03-02 | Purpleyogi.Com Inc. | Method for creating user profiles |
JP2002032401A (ja) * | 2000-07-18 | 2002-01-31 | Mitsubishi Electric Corp | 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体 |
US6792434B2 (en) * | 2001-04-20 | 2004-09-14 | Mitsubishi Electric Research Laboratories, Inc. | Content-based visualization and user-modeling for interactive browsing and retrieval in multimedia databases |
US20030018621A1 (en) * | 2001-06-29 | 2003-01-23 | Donald Steiner | Distributed information search in a networked environment |
KR100438857B1 (ko) * | 2001-09-26 | 2004-07-05 | 엘지전자 주식회사 | 사용자 선호도 기반 멀티미디어 검색 시스템 |
US8117072B2 (en) * | 2001-11-13 | 2012-02-14 | International Business Machines Corporation | Promoting strategic documents by bias ranking of search results on a web browser |
US7814043B2 (en) * | 2001-11-26 | 2010-10-12 | Fujitsu Limited | Content information analyzing method and apparatus |
US7024404B1 (en) * | 2002-05-28 | 2006-04-04 | The State University Rutgers | Retrieval and display of data objects using a cross-group ranking metric |
CA2397424A1 (en) * | 2002-08-09 | 2004-02-09 | Mohammed Lamine Kherfi | Content-based image retrieval using positive and negative examples |
US20060136405A1 (en) * | 2003-01-24 | 2006-06-22 | Ducatel Gary M | Searching apparatus and methods |
US20050071328A1 (en) * | 2003-09-30 | 2005-03-31 | Lawrence Stephen R. | Personalization of web search |
US20050120003A1 (en) * | 2003-10-08 | 2005-06-02 | Drury William J. | Method for maintaining a record of searches and results |
JP2005208943A (ja) * | 2004-01-22 | 2005-08-04 | Denso It Laboratory Inc | サービス候補提供システム及びユーザ側通信装置並びにサービス候補提供サーバ |
US7457823B2 (en) * | 2004-05-02 | 2008-11-25 | Markmonitor Inc. | Methods and systems for analyzing data related to possible online fraud |
US7257577B2 (en) * | 2004-05-07 | 2007-08-14 | International Business Machines Corporation | System, method and service for ranking search results using a modular scoring system |
TWI386824B (zh) * | 2004-08-19 | 2013-02-21 | Carhamm Ltd Llc | 響應終端使用者資訊請求之方法及裝置 |
WO2006036781A2 (en) * | 2004-09-22 | 2006-04-06 | Perfect Market Technologies, Inc. | Search engine using user intent |
WO2006042265A2 (en) * | 2004-10-11 | 2006-04-20 | Nextumi, Inc. | System and method for facilitating network connectivity based on user characteristics |
-
2006
- 2006-07-14 US US11/457,733 patent/US20070208730A1/en not_active Abandoned
-
2007
- 2007-02-08 CA CA002644440A patent/CA2644440A1/en not_active Abandoned
- 2007-02-08 WO PCT/US2007/003530 patent/WO2007106269A1/en active Application Filing
- 2007-02-08 KR KR1020087021426A patent/KR101366408B1/ko not_active IP Right Cessation
- 2007-02-08 RU RU2008135459/08A patent/RU2435212C2/ru not_active IP Right Cessation
- 2007-02-08 MX MX2008011223A patent/MX2008011223A/es active IP Right Grant
- 2007-02-08 BR BRPI0708397-1A patent/BRPI0708397A2/pt not_active IP Right Cessation
- 2007-02-08 JP JP2008557273A patent/JP5247475B2/ja not_active Expired - Fee Related
- 2007-02-08 EP EP07750372A patent/EP1997065A4/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
KR101366408B1 (ko) | 2014-03-03 |
KR20080114708A (ko) | 2008-12-31 |
WO2007106269A1 (en) | 2007-09-20 |
JP2009528619A (ja) | 2009-08-06 |
RU2008135459A (ru) | 2010-03-10 |
MX2008011223A (es) | 2008-11-04 |
US20070208730A1 (en) | 2007-09-06 |
EP1997065A4 (en) | 2011-04-13 |
RU2435212C2 (ru) | 2011-11-27 |
JP5247475B2 (ja) | 2013-07-24 |
CA2644440A1 (en) | 2007-09-20 |
EP1997065A1 (en) | 2008-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BRPI0708397A2 (pt) | extração de comportamento de usuário de busca na rede para aperfeiçoar releváncia de busca na rede | |
US11347963B2 (en) | Systems and methods for identifying semantically and visually related content | |
Sugiyama et al. | Exploiting potential citation papers in scholarly paper recommendation | |
Sieg et al. | Learning ontology-based user profiles: A semantic approach to personalized web search. | |
Li et al. | Towards effective browsing of large scale social annotations | |
Noruzi | Folksonomies:(un) controlled vocabulary? | |
US7716150B2 (en) | Machine learning system for analyzing and establishing tagging trends based on convergence criteria | |
US20060224579A1 (en) | Data mining techniques for improving search engine relevance | |
US20090171938A1 (en) | Context-based document search | |
US20110302156A1 (en) | Re-ranking search results based on lexical and ontological concepts | |
GB2486490A (en) | Method for structuring a network | |
Wang et al. | Mining subtopics from text fragments for a web query | |
Jeong et al. | i-TagRanker: an efficient tag ranking system for image sharing and retrieval using the semantic relationships between tags | |
Matsumoto et al. | Fuzzy clustering and relevance ranking of web search results with differentiating cluster label generation | |
Sharifpour et al. | Large-scale analysis of query logs to profile users for dataset search | |
Gendarmi et al. | Community-driven ontology evolution based on folksonomies | |
Chen et al. | iMecho: an associative memory based desktop search system | |
Bracamonte et al. | Extracting semantic knowledge from web context for multimedia IR: a taxonomy, survey and challenges | |
Grey et al. | So you think you're an expert: Keyword searching vs. controlled subject headings | |
US20240037375A1 (en) | Systems and Methods for Knowledge Distillation Using Artificial Intelligence | |
Bouchoucha et al. | Université de Montréal at the NTCIR-11 IMine Task. | |
Song et al. | Multi-aspect query summarization by composite query | |
US20230061289A1 (en) | Generation and use of topic graph for content authoring | |
Pabitha et al. | Refining Serp Search engine result page for Enhanced Information Retrieval | |
Gupta | Design of search system for online digital libraries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B08F | Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette] |
Free format text: REFERENTE A 8A ANUIDADE. |
|
B08K | Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette] |
Free format text: REFERENTE AO DESPACHO 8.6 PUBLICADO NA RPI 2308 DE 31/03/2015. |