BRPI0616233A2

BRPI0616233A2 - funÇÕes de classificaÇço usando estatÍsticas de uso de documento

Info

Publication number: BRPI0616233A2
Application number: BRPI0616233-9A
Authority: BR
Inventors: Dmitriy Meyerzon; Hugo Zaragoza; Kyle Peltonen; Andrew Debruyne
Original assignee: Microsoft Corp
Priority date: 2005-09-21
Filing date: 2006-09-20
Publication date: 2011-06-14
Also published as: AU2006292103A1; JP5174931B2; MY149197A; EP1952277A1; NO20080934L; US20070067284A1; IL189495A0; RU2419861C2; US20100191744A1; RU2008110731A; JP2011108268A; JP2009509275A; EP1952277A4; IL189495A; EP1952277B1; NZ566532A; US20120041960A9; CN101268464A; CN101268464B; KR20080046670A

Abstract

FUNÇÕES DE CLASSIFICAÇçO USANDO ESTATÍSTICAS DE USO DE DOCUMENTO. São discutidos aqui métodos que fornecem uma classificação de relevância de documento a um documento em uma rede. O meio legível por computador que tem armazenado neste instruções executáveis por computador para executar um método para fornecer uma classificação de relevância de documento a um documento em uma rede também é discutido. Ademais, são discutidos sistemas de computação que contêm no mínimo um módulo de aplicação, onde no mínimo um módulo aplícativo compreende o código de aplicação para executar métodos de fornecimento de uma classificação de relevância de documento a um documento em uma rede.

Description

"FUNÇÕES DE CLASSIFICAÇÃO USANDO ESTATÍSTICAS DEUSO DE DOCUMENTO"

Fundamentos da Invenção

As funções de classificação que classificam docu-mentos de acordo com sua relevância em uma dada consulta deprocura, são conhecidas. Esforços continuam na técnica paradesenvolver funções de classificação que fornecem melhoresresultados de procura para uma dada consulta de procura com-parada aos resultados de procura gerados por mecanismos deprocura que usam funções de classificação conhecidas.

Sumário da Invenção

São descritas aqui, entre outras coisas, váriastecnologias que determinam uma classificação de relevânciade documento para um dado documento em uma rede. A classifi-cação de relevância de documento é gerada via uma função declassificação que compreende um ou mais componentes indepen-dentes de consultas, onde no mínimo um componente indepen-dente de consulta inclui um parâmetro de uso que leva emconta dados de uso de documentos reais mantidos e armazena-dos em um servidor da Rede para um ou mais documentos na re-de. As funções de classificação podem ser usadas por um me-canismo de procura para classificar múltiplos documentos emordem (normalmente, na ordem decrescente) baseados nas clas-sificações de relevância de documento dos múltiplos documentos .

Este sumário é fornecido para geralmente introdu-zir ao leitor um ou mais conceitos selecionados descritosabaixo mais detalhadamente na seção "Descrição Detalhada" deuma forma simplificada. Este sumário não pretende identifi-car as características chave e/ou solicitadas do assuntoreivindicado.

Breve Descrição dos Desenhos

A FIG. 1 representa um fluxograma lógico exempli-ficado que mostra etapas exemplificadas em um método de pro-dução de resultados de procura classificados em resposta auma consulta de procura inserida por um usuário;

A FIG. 2 representa um diagrama de bloco de algunsdos componentes primários de um ambiente operacional exem-plificado para a implementação dos métodos e processos des-critos aqui λ-

Α FIG. 3 representa um fluxograma lógico exempli-ficado que mostra etapas exemplificadas do método de deter-minação de classificação de relevância de documento para do-cumentos em uma rede; e

A FIG. 4 representa um fluxograma lógico exempli-ficado que mostra etapas exemplificadas em um método declassificação de resultados de procura gerados por uma fun-ção de classificação que contém um parâmetro de uso de documento .

Descrição Detalhada da Invenção

Para promover um entendimento dos princípios dosmétodos e processos descritos aqui, as descrições de modali-dades específicas seguem e linguagem específica é usada paradescrever as modalidades específicas. Todavia entende-se quenenhuma limitação do escopo dos métodos e processos descri-tos é pretendida pelo uso de linguagem específica. Altera-ções, modificações adicionais e tais aplicações adicionaisdos princípios dos métodos descritos e processos discutidossão observadas como normalmente ocorreria a um versado natécnica ao qual os métodos e processos descritos pertencem.

Métodos de determinar uma classificação de rele-vância de documento para documentos em uma rede são descri-tos. Cada classificação de relevância de documento é calcu-lada usando uma função de classificação que desejavelmentecontém um ou mais componentes independentes de consulta (porexemplo, um componente de função que não depende de uma dadaconsulta de procura ou termo de consulta de procura), ou umacombinação desses. As classificações de relevância de docu-mento determinadas pela função de classificação podem serusadas para classificar documentos dentro de um espaço derede (por exemplo, um espaço de intranet corporativa) de a-cordo com cada classificação de relevância de documento. Umprocesso de procura exemplificado no qual os métodos descri-tos podem ser usados é mostrado como o processo exemplifica-do 10 na FIG. 1.

A FIG. 1 descreve o processo de procura exemplifi-cado 10, que inicia com a etapa de processo 80, onde um usu-ário insere uma consulta de procura. A partir da etapa 80, oprocesso de procura exemplificado 10 prossegue para a etapa200, onde um mecanismo de procura busca todos os documentosdentro de um espaço de rede por um ou mais termos da consul-ta de procura. A partir da etapa 200, o processo de procuraexemplificado 10 prossegue para a etapa 300, onde uma funçãode classificação do mecanismo de procura classifica os docu-mentos dentro do espaço de rede baseado na classificação derelevância de cada documento, a classificação de relevânciade documento baseia-se em um ou mais componentes independen-tes de consulta, um ou mais componentes dependentes de con-sulta, ou a combinação desses. A partir da etapa 300, o pro-cesso de procura exemplificado 10 prossegue para a etapa400, onde os resultados de procura classificados são apre-sentados ao usuário, tipicamente na ordem decrescente, iden-tificando os documentos dentro do espaço de rede que sãomais relevantes à consulta de procura.

Como discutido mais detalhadamente abaixo, em al-guns métodos exemplificados de determinar uma classificaçãode relevância de documento, no mínimo um componente indepen-dente de consulta de uma função de classificação usada paradeterminar uma classificação de relevância de documento levaem conta "dados de uso de documento" ou "estatísticas de usode documento" relacionados ao uso atual de um ou mais docu-mentos dentro de um espaço de rede por um ou mais usuários.Os dados e/ou estatísticas de uso de documento são gerados earmazenados por código de aplicação em um servidor da Rede,que é separado de um dado mecanismo de procura. Por exemplo,os dados de uso de documento podem ser mantidos por um sítioda Rede tal que, cada vez que um usuário solicita uma URL, oservidor atualiza um contador de uso. 0 contador de uso podemanter os dados relacionados a documentos obtidos para umdado intervalo de tempo, tal como última semana, o últimomês, o último ano, ou o tempo de vida de um dado documentoou conjunto de documentos. 0 código de aplicação pode serusado para obter os dados de uso do sítio da Rede via (i)uma interface de programação de aplicação especial (API),(ii) uma solicitação de serviço da Rede, ou (iii) solicitan-do uma pagina da Rede de administração que retorna dados deuso para cada URL no sítio da Rede.

Os sítios da Rede específicos podem ser usados pa-ra gerar e manter os dados de uso dentro de um espaço de re-de, bem como armazenar os dados de uso em um sistema de ar-mazenamento remoto ou local. Os sítios da Rede adequados pa-ra gerar, manter e armazenar os dados de uso de documentosdentro de um espaço de rede incluem, mas não são limitadosa, sítios de Serviços WINDOWS® SHAREPOINT®.

Os métodos descritos de determinar uma classifica-ção de relevância de documento podem adicionalmente utilizaruma função de classificação que compreende um ou mais compo-nentes adicionais independentes de consulta. Os componentesadicionais adequados independentes de consulta incluem, masnão são limitados a, um componente independente de consultaque leva em consideração uma distância de clique para cadadocumento dentro de um espaço de rede como descrito no Pedi-do de Patente Norte-Americana Número Serial 10/995.983 inti-tulado "SISTEMA E MÉTODO PARA CLASSIFICAR RESULTADOS DEPROCURA USANDO DISTÂNCIA DE CLIQUE" depositado em 30 de A-gosto de 2004, um componente independente de consulta queleva em conta uma distância de clique induzida para cada do-cumento dentro de um espaço de rede como descrito no Pedidode Patente Norte-Americana Número Serial 11/206.286 intitu-lado "FUNÇÕES DE CLASSIFICAÇÃO QUE USAM UMA DISTÂNCIA DENDUZIDA DE UM DOCUMENTO EM UMA REDE" depositado emde Agosto de 2005, e um componente independente de con-sulta que leva em conta a URL para cada documento dentro deum espaço de rede como descrito no Pedido de Patente Norte-Americana Número Serial 10/955.983 intitulado "SISTEMA E MÉ-TODO PARA CLASSIFICAR RESULTADOS DE PROCURA USANDO DISTÂNCIADE CLIQUE" depositado em 30 de Agosto de 2004. O assunto decada um dos Pedidos de Patente Norte-Americana acima mencio-nados, que são atribuídos ao cessionário do presente pedidode patente, é aqui incorporado como referência em sua inte-gridade .

Ainda em uma modalidade exemplificada, os métodosdescritos de determinar uma classificação de relevância dedocumento utilizam uma função de classificação que compreen-de no mínimo um componente independente de consulta, que in-clui ambos o parâmetro de uso acima descrito e um ou maiscomponentes adicionais independentes de consulta descritosacima.

A classificação de relevância de documento podeser usada para classificar documentos em um espaço de rede.Por exemplo, um método de classificar documentos em uma redepode compreender as etapas de determinar uma classificaçãode relevância de documento para cada documento na rede usan-do o método descrito acima; e classificar os documentos emuma ordem desejada (tipicamente, na ordem decrescente) base-ada nas classificações de relevância de documento de cadadocumento.A classificação de relevância de documento podeser também usada para classificar os resultados de procurade uma consulta de procura. Por exemplo, um método de clas-sificar resultados de procura de uma consulta de procura po-de compreender as etapas de determinar uma classificação derelevância de documento para cada documento nos resultadosde procura de uma consulta de procura usando o método des-crito acima, e classificar os documentos em uma ordem dese-jada (tipicamente, na ordem decrescente) baseada nas classi-ficações de relevância de documento de cada documento.

Os programas de aplicação que usam os métodosdescritos aqui podem ser carregados e executados em uma va-riedade de sistemas de computador que compreendem uma varie-dade de componentes de hardware. Um sistema de computadorexemplificado e um ambiente operacional exemplificado parapraticar os métodos descritos aqui são descritos abaixo.

Ambiente Operacional Exemplificado

A FIG. 2 ilustra um exemplo de um ambiente de sis-tema de computação adequado 100 no qual os métodos descritosaqui podem ser implementados. 0 ambiente de sistema de com-putação 100 é somente um exemplo de um ambiente de computa-ção adequado e não pretende sugerir qualquer limitação comoao escopo do uso ou funcionalidade dos métodos descritos a-qui. O ambiente de computação 100 nem deveria ser interpre-tado como tendo qualquer dependência ou exigência relaciona-da a qualquer componente ou combinação de componentes ilus-trados no ambiente operacional exemplificado 100.Os métodos descritos aqui são operacionais com nu-merosos outros ambientes ou configurações de sistema de com-putação de propósito geral ou de propósito especial. Exem-plos de sistemas de computação, ambientes, e/ou configura-ções bem conhecidos que podem ser adequados ao uso com osmétodos descritos aqui incluem, porém não são limitados a,computadores pessoais, computadores servidores, computadoresportáteis ou dispositivos laptops, sistemas multiprocessado-res, sistemas baseados em microprocessador, aparelho de co-nexão à internet via TV, eletrônicos programáveis por consu-midor, PCs de rede, minicomputadores, computadores de grandeporte, ambientes de computação distribuídos que incluemqualquer um dos sistemas ou dispositivos acima, e seus simi-lares.

Os métodos e processos descritos aqui podem serdescritos no contexto geral de instruções executáveis porcomputador, tal como módulos de programa, que são executadospor um computador. Geralmente, os módulos de programa inclu-em rotinas, programas, objetos, componentes, estruturas dedados, etc. que executam tarefas particulares ou implementamtipo de dados abstratos particulares. Os métodos e processosdescritos aqui também podem ser praticados em ambientes decomputação distribuídos onde tarefas são executadas por dis-positivos de processamento remoto que são ligados através deuma rede de comunicações. Em um ambiente de computação dis-tribuído, os módulos de programa podem ser localizados emambos meios de armazenamento por computador local e remotoincluindo dispositivos de armazenamento em memória.Com relação à FIG. 2, um sistema exemplificado pa-ra implementar os métodos e processos descritos aqui incluium dispositivo de computação de propósito geral na forma deum computador 110. Os componentes do computador 110 podemincluir, porém não estão limitados a, uma unidade de proces-samento 120, uma memória de sistema 130, e um barramento desistema 121 que acopla vários componentes de sistema, inclu-indo, porém não limitados a, memória de sistema 130, à uni-dade de processamento 120. O barramento de sistema 121 podeser qualquer um dos vários tipos de estruturas de barramen-tos incluindo um barramento de memória ou controlador de me-mória, um barramento periférico, e um barramento local usan-do qualquer uma de uma variedade de arquiteturas de barra-mento. A titulo de exemplo, e não limitação, tais arquitetu-ras incluem barramento de Arquitetura Padrão de Indústria(ISA), barramento de Arquitetura de Micro Canal (MCA), bar-ramento ISA Aperfeiçoado (EISA), barramento local de Associ-ação de Padrões Eletrônicos de Video (VESA), e barramento deComponentes Periféricos Interconectados (PCI), também conhe-cido como barramento Mezzanine.

0 computador 110 tipicamente inclui uma variedadede meios legíveis por computador. Esses podem ser quaisquermeios disponíveis que podem ser acessados pelo computador110 e incluem ambos meios voláteis e não voláteis, removí-veis e não removíveis. A título de exemplo, e não limitação,os meios legíveis por computador podem compreender meios dearmazenamento por computador e meios de comunicação. Os mei-os de armazenamento por computador incluem ambos meios volá-teis e não voláteis, removíveis e não removíveis implementa-dos em qualquer método ou tecnologia para armazenamento deinformação tal como instruções legíveis por computador, es-truturas de dados, módulos de programa ou outros dados. Osmeios de armazenamento por computador incluem, mas não estãolimitados a, RAM, ROM, EEPROM, memória rápida ou outra tec-nologia de memória, CD-ROM, discos versáteis digitais (DVD)ou outro armazenamento em disco óptico, cassetes magnéticos,fita magnética, armazenamento em disco magnético ou outrosdispositivos de armazenamento magnéticos, ou qualquer outromeio que pode ser usado para armazenar a informação desejadae que pode ser acessado pelo computador 110. Os meios de co-municação tipicamente incorporam instruções legíveis porcomputador, estruturas de dados, módulos de programa ou ou-tros dados em um sinal modulado de dados tal como uma ondaportadora ou outro mecanismo de transporte, e incluem quais-quer meios de entrega de informação. 0 termo "sinal moduladode dados" significa um sinal que tem uma ou mais de suas ca-racterísticas ajustadas ou alteradas de tal maneira a codi-ficar informação no sinal. A título de exemplo, e não limi-tação, os meios de comunicação incluem meios por fios taiscomo uma rede por fios ou conexão direta por fios, e meiossem fio tais como acústicos, RF, infravermelhos e outrosmeios sem fio. Combinações de qualquer um dos acima deveriamser também incluídas no escopo dos meios legíveis por compu-tador como usado aqui.

A memória de sistema 130 inclui meios de armazena-mento por computador na forma de memória volátil e/ou nãovolátil, tal como a memória somente de leitura (ROM) 131 e amemória de acesso aleatório (RAM) 132. Um sistema de entra-da/saida básico (BIOS) 133, contendo as rotinas básicas queajudam a transferir informação entre elementos no computador110, tal como durante a inicialização, é tipicamente armaze-nado na ROM 131. A RAM 132 tipicamente contém dados e/ou mó-dulos de programa que estão imediatamente acessíveis e/ouestão presentemente sendo operados pela unidade de processa-mento 120. A título de exemplo, e não limitação, a FIG. 210 ilustra o sistema operacional 134, programas de aplicação135, outros módulos de programa 136, e dados de programa 137 .

O computador 110 pode também incluir outros meiosde armazenamento por computador removíveis/não removíveis,voláteis/não voláteis. A título de exemplo somente, a FIG. 2ilustra uma unidade de disco rígido 141 que lê a partir de eescreve em meios magnéticos não removíveis e não voláteis,uma unidade de disco magnético 151 que lê a partir de e es-creve em discos magnéticos removíveis e não voláteis 152, euma unidade de disco óptico 155 que lê a partir de e escreveem um disco óptico removível e não volátil 156, tal como umCD-ROM ou outro meio óptico. Outros meios de armazenamentopor computador removíveis/não removíveis, voláteis/não volá-teis que podem ser usados no ambiente operacional exemplifi-cado incluem, mas não estão limitados a, fitas cassetes mag-néticas, cartões de memória rápida, discos versáteis digi-tais, fita de vídeo digital, RAM de estado sólido, ROM deestado sólido, e seus similares. A unidade de disco rígido141 é tipicamente conectada ao barramento de sistema 121 a-través de uma interface de memória não removível tal como ainterface 140, e a unidade de disco magnético 151 e a unida-de de disco óptico 155 são tipicamente conectadas ao barra-5 mento de sistema 121 por uma interface de memória removível,tal como a interface 150.

As unidades e seus meios de armazenamento por com-putador associados discutidos acima e ilustrados na FIG. 2fornecem armazenamento de instruções legíveis por computa-10 dor, estruturas de dados, módulos de programa e outros dadospara o computador 110. Na FIG. 2, por exemplo, a unidade dedisco rígido 141 é ilustrada como armazenando o sistema ope-racional 144, programas de aplicação 145, outros módulos deprograma 146, e dados de programa 147. Nota-se que esses15 componentes podem ou ser os mesmos ou diferentes do sistemaoperacional 134, programas de aplicação 135, outros módulosde programa 136, e dados de programa 137. Ao sistema opera-cional 144, aos programas de aplicação 145, a outros progra-mas 14 6 e aos dados de programa 147 são atribuídos números20 diferentes aqui para ilustrar que, no mínimo, eles são có-pias diferentes.

Um usuário pode inserir comandos e informação nocomputador 110 através de dispositivos de entrada, tal comoum teclado 162 e um dispositivo de apontamento 161, comumen-25 te referido como um mouse, mouse estacionário ("trackball")ou mesa sensível ao toque. Outros dispositivos de entrada(não mostrados) podem incluir um microfone, um comando dejogos, mesa de jogos, antena de satélite, digitalizador, ouseus similares. Esses e outros dispositivos de entrada sãofreqüentemente conectados à unidade de processamento 120 a-través de uma interface de entrada de usuário 160 que é aco-plada ao barramento de sistema 121, mas pode ser conectadapor outra interface e estruturas de barramento, tal como umaporta paralela, porta de jogos ou um barramento serial uni-versal (USB). Um monitor 191 ou outro tipo de dispositivo deexibição está também conectado ao barramento de sistema 121via uma interface, tal como uma interface de video 190. Emadição ao monitor 191, o computador 110 pode também incluiroutros dispositivos periféricos de saida tal como alto-falantes 197 e impressora 196, que podem ser conectados a-través de uma interface periférica de saida 195.

O computador 110 pode operar em um ambiente de re-de usando conexões lógicas a um ou mais computadores remo-tos, tal como um computador remoto 180. O computador remoto180 pode ser um computador pessoal, um servidor, um rotea-dor, um PC de rede, um dispositivo não hierárquico ou outronó de rede comum, e tipicamente inclui muitos ou todos oselementos descritos acima em relação ao computador 110, em-bora somente um dispositivo de armazenamento em memória 181foi ilustrado na FIG. 2. As conexões lógicas representadasna FIG. 2 incluem uma rede de área local (LAN) 171 e uma re-de de área ampla (WAN) 173, mas podem também incluir outrasredes. Tais ambientes de rede são comuns em escritórios, re-des de computador de grandes empresas, intranets e a Inter-net .Quando usado em um ambiente de rede LAN, o compu-tador 110 é conectado à LAN 171 através de uma interface derede ou adaptador 170. Quando usado em um ambiente de redeWAN, o computador 110 tipicamente inclui um modem 172 ou ou-tro dispositivo para estabelecer comunicações pela WAN 173,tal como a Internet. O modem 172, que pode ser interno ouexterno, pode estar conectado ao barramento de sistema 121via a interface de entrada de usuário 160, ou outro mecanis-mo apropriado. Em um ambiente de rede, os módulos de progra-ma representados em relação ao computador 110, ou partesdesses, podem ser armazenados no dispositivo de armazenamen-to em memória remota. A titulo de exemplo, e não limitação,a FIG. 2 ilustra programas de aplicação remota 185 como re-sidindo no dispositivo de memória 181. Será apreciado que asconexões de rede mostradas são exemplificadas e outros meiosde estabelecer uma ligação de comunicação entre os computa-dores podem ser usados.

Métodos e processos discutidos aqui podem ser im-plementados usando um ou mais programas de aplicação que in-cluem, mas não estão limitados a, um aplicativo de softwarede sistema servidor (por exemplo, aplicativo de softwareWINDOWS SERVER SYSTEM™) , um aplicativo de classificação deprocura, e um aplicativo para gerar, manter e armazenar da-dos de uso de documentos em um espaço de rede (por exemplo,aplicativo de serviços WINDOWS® SHAREPOINT®), qualquer umdos quais poderia ser um dos vários programas de aplicaçãodesignados como programas de aplicação 135, programas de a-plicação 145 e programas de aplicação remota 185 no sistemaexemplificado 100.

Como mencionado acima, aqueles versados na técnicaapreciarão que os métodos descritos de gerar uma classifica-ção de relevância de documento, para um dado documento, po-dem ser implementados em outras configurações do sistema decomputador, que inclui dispositivos portáteis, sistemas mul-tiprocessadores, eletrônicos programáveis de consumidor oubaseados em microprocessador, computadores pessoais em rede,minicomputadores, computadores de grande porte, e seus simi-lares. Os métodos descritos de gerar uma classificação derelevância de documento para um dado documento podem tambémser praticados em ambientes de computação distribuídos, ondetarefas são executadas por dispositivos de processamento re-moto que são ligados através de uma rede de comunicações. Emum ambiente de computação distribuído, os módulos de progra-ma podem estar localizados em ambos dispositivos de armaze-namento em memória local e remoto.

Implementação de Modalidades Exemplificadas

Como discutido acima, métodos de determinar umaclassificação de relevância de documento para um documentoem uma rede são fornecidos. Os métodos descritos podem clas-sificar um documento em uma rede utilizando uma função declassificação que leva em conta um valor de uso de documentode cada documento na rede.

Os métodos descritos de determinar uma classifica-ção de relevância de documento para um documento em uma redepodem compreender um número de etapas. Em uma modalidade e-xemplifiçada, o método de determinar uma classificação derelevância de documento para um documento em uma rede com-preende as etapas de atribuir um valor de uso atual (Ua) aum ou mais documentos em uma rede compreendendo N documen-tos, onde o valor de uso atual (Ua) é baseado em dados deuso atual mantidos e armazenados em um servidor; e a menosdo que N documentos são atribuídos um valor de uso atual(Ua) , atribuir um valor de uso padrão (U0) aos documentosque não têm dados de uso atual associados a eles; e usar ovalor de uso (isto é, Ua ou UD) para cada documento para de-terminar a classificação de relevância de documento de umdado documento na rede.

Como usado aqui, o termo "dados de uso atual" re-presenta um ou mais tipos de dados associados com o "uso" dodocumento por um ou mais usuários. Tipos de dados de uso a-tual para um dado documento ou conjunto de documentos podemincluir, mas não estão limitados, o número de visualizaçõesde documentos por todos os usuários em um dado período detempo, o número médio de visualizações de documento por usu-ário em um dado período de tempo, o tempo total gasto em umdocumento particular em um dado período de tempo, o tempomédio gasto em um documento particular em um dado período detempo, etc. O dado período de tempo pode ser, por exemplo, aúltima semana, o último mês, o último ano, ou o tempo de vi-da do documento, ou qualquer outro período desejado de tempo.

As etapas de gerar, manter e armazenar dados ouestatísticas de uso de documento para documentos em um espa-ço de rede podem ser executadas por código de aplicação co-mumente encontrado em sistemas de computação. Os dados deuso de documento são gerados, mantidos e armazenados inde-pendentemente de uma dada consulta de procura ou mecanismo5 de procura, e são tipicamente gerados, mantidos e armazena-dos por código de aplicação no servidor que mantém o docu-mento (ou página) e torna o documento (ou página) disponívelpara um usuário. Os programas de aplicação adequados paragerar, manter e armazenar dados ou estatísticas de uso de10 documento incluem, mas não estão limitados, ServiçosWINDOWS® SHAREPOINT® e outros programas de aplicação simila-res .

Os dados de uso de documento armazenados e manti-dos nesses sítios de serviço, bem como outros sítios da Rede15 executando uma função similar, podem ser acessados usandocódigo de aplicação como discutido acima. Por exemplo, osdados de uso de documento podem ser acessados a partir de umdado sítio da Rede (por exemplo, um sítio de ServiçosWINDOWS® SHAREPOINT®) via (i) uma interface de programação20 de aplicação especial (API), (ii) uma solicitação de serviçoda Rede, ou (iii) solicitando uma pagina da Rede de adminis-tração que retorna dados de uso para cada URL no sítio daRede.

Os métodos descritos de determinar uma classifica-25 ção de relevância de documento para um documento em uma redepodem compreender um número de etapas adicionais incluindo,mas não limitadas, monitorar um ou mais documentos em um es-paço de rede para uso atual de documento; armazenar dados deuso atual de documento para um ou mais documento em um ar-quivo de armazenamento de dados local ou remoto; calcular umvalor de uso atual (Ua) para um documento baseado nos dadosde uso atual para o documento ou uma pasta contendo o docu-5 mento; armazenar valores de uso atual (Ua) para um ou maisdocumentos em um arquivo de armazenamento de dados local ouremoto; solicitar dados de uso de documento armazenado ouvalores de uso atual (Ua) a partir de um arquivo de armaze-namento de dados local ou remoto (por exemplo, uma solicita-10 ção por tais dados a partir de um mecanismo de procura de-pois de uma consulta de procura especifica por um usuário) ;restaurar os dados de uso de documento atual ou um valor deuso atual (Ua) para um ou mais documentos de um arquivo dearmazenamento de dados local ou remoto; e opcionalmente,15 combinar um valor de uso de documento (isto é, atual ou pa-drão) com uma ou mais propriedades de documento adicionaispara determinar uma classificação de relevância de documentopara um documento.

A FIG. 3 representa um fluxograma lógico que mos-20 tra etapas exemplificadas em um método exemplificado de for-necer valores de uso atual ou padrão para documentos em umarede seguidos por um procedimento opcional de rebaixamen-to/atualização por um administrador do sistema. Como mostra-do na FIG. 3, o método exemplificado 401 inicia no bloco 40225 e prossegue para a etapa 403. Na etapa 403, um primeiro do-cumento na rede é rastreado por dados de uso atual.

Δ etapa de rastrear um primeiro documento por da-dos de uso atual (etapa 403) pode ser executada usando umaaplicação rastreadora capaz de determinar se o primeiro do-cumento tem quaisquer dados de uso atual associados a ele, ese o primeiro documento tem dados de uso atual associados aele, restaurando os dados de uso atual. As aplicações ras-5 treadoras adequadas para uso nos métodos descritos de forne-cer valores de uso atual ou padrão para documentos em umarede incluem, mas não estão limitadas, aplicações rastreado-ras descritas nas Patentes Norte-Americanas Nos. 6.463.455 e6.631.369, o assunto de ambas é aqui incorporado em usa in-10 tegridade como referência.

Como discutido acima, os dados de uso atual podemser obtidos a partir de um ou mais arquivos que armazenamdados de uso atual para um ou mais documentos em uma rede.Os dados de uso atual podem ser armazenados, junto com o do-15 cumento, como um componente do documento, ou podem ser arma-zenados em um arquivo de armazenamento de dados separado dodocumento atual. Os sistemas de armazenamento remoto adequa-dos incluem, mas não estão limitados a, produtos de Serviçosde WINDOWS® SHAREPOINT® (WSS) comercialmente disponíveis a20 partir da Microsoft Corporation (Redmond, WA) , bem comoqualquer outro sistema de armazenamento remoto. Por exemplo,o sistema de armazenamento remoto WSS grava dados de uso a-tual incluindo, por exemplo, o número de solicitações a cadadocumento em uma dada rede através de todos os usuários, e25 produz estatísticas de números de cliques por documentos du-rante a última semana, o último mês, o último ano, ou o tem-po de vida total do documento, ou qualquer outro período detempo. Ademais, como notado acima, deveria ser entendido queos métodos descritos aqui não estão limitados a um sistemade armazenamento remoto WSS, mas podem utilizar um sistemade armazenamento remoto WSS ou qualquer outro sistema de da-dos de documento similar nos métodos descritos.

Uma vez que o documento é rastreado, o método e-xemplificado 401 prossegue para o bloco de decisão 404. Nobloco de decisão 404, uma determinação é feita pelo códigode aplicação como se o documento tem dados de uso atual as-sociados a ele. Se uma decisão é feita de que o documento10 tem dados de uso atual associados a ele, o método exemplifi-cado '401 prossegue para a etapa 405, onde um valor de usobaseado no uso atual (Ua) é atribuído ao documento. 0 valorde uso atual (Ua) pode ser determinado usando um ou maiscomponentes dos dados de uso atual associados com o documen-to. Por exemplo, em algumas modalidades, o valor de uso atu-al (Ua) atribuído ao documento pode ser relacionado somenteao número de usuários visualizando o documento. Em outrasmodalidades, o valor de uso atual (Ua) atribuído ao documen-to pode estar relacionado ao número de visualizações do do-cumento por todos os usuários em um dado período de tempo, onúmero médio de visualizações do documento por usuário em umdado período de tempo, o tempo total gasto em um documentoparticular em um dado período de tempo, o tempo médio gasto uma combinação de qualquer um dos critérios acima, onde odado período de tempo compreende a última semana, o últimomês, o último ano, ou o tempo de vida do documento, ou qual-quer outro período desejado de tempo.Em alguns casos, os dados de uso atual associadoscom um dado documento sugerem que o documento não foi usadoou visualizado durante um dado período de tempo. Em tal ca-so, ao documento poderia ser atribuído um valor de uso (Ua)iguala zero para indicar nenhum uso durante o período detempo; entretanto, tipicamente, aos valores de uso (Ua) ba-seados no uso atual ou nenhum uso atual são atribuídos umnúmero além de zero.

Ademais, em alguns casos, os dados de uso atualpodem ser associados a um conjunto de documentos como opostoa documentos individuais. Por exemplo, uma pasta pode conterum conjunto de documentos, e um servidor associado pode so-mente rastrear dados de uso relacionados ao acesso à pasta(isto é, uso da pasta) , e não aos documentos individuaisdentro da pasta. Nessa modalidade, se houver dados de usoatual associados com uma pasta, um valor de uso (Ua) podeser fornecido para cada documento dentro da pasta baseadonos dados de uso atual da pasta. Tipicamente, cada valor deuso (Ua) será o mesmo para cada documento dentro da pasta;entretanto, diferentes valores de uso (Ua) podem ser atribu-ídos a diferentes documentos em uma pasta se assim desejado.

A partir da etapa 405, Ό método exemplificado 401prossegue para o bloco de decisão 406 descrito abaixo.

Retornando ao bloco de decisão 404, se uma decisãoé feita de que o documento não tem dados de uso atual asso-ciados a ele, o método exemplificado 401 prossegue para aetapa 407, onde um valor de uso padrão (Ud) é atribuído aodocumento. Por exemplo, um valor de uso padrão (U0) pode seratribuído a um documento que é parte de um sitio da Rede quenão mantém dados de uso de documento. 0 valor de uso padrão(UD) atribuído ao documento pode ser usado para fornecer umaimportância inicial ao documento em relação aos documentosque têm dados de uso atual. Por exemplo, se um valor de usomais alto para um dado documento indica importância relativado documento na rede, atribuir um valor de uso padrão maisbaixo (UD) ao documento rebaixa a importância do documentoem relação a outros documentos na rede.

Em uma modalidade exemplificada onde um valor deuso mais alto para um dado documento indica importância re-lativa do documento na rede, o valor de uso padrão (U0) a-tribuído ao documento pode ser relativo aos valores de usoatual (UD) atribuídos a outros documentos na rede. Por exem-pio, de modo a abaixar a importância relativa do documento,um valor de uso padrão (UD) pode ser atribuído ao documento,onde este é menor do que qualquer valor de uso atual (UD)atribuído a outros documentos na rede como descrito acima.Se for desejado aumentar a importância relativa do documen-to, um valor de uso padrão (UD) pode ser atribuído ao docu-mento, onde este é maior do que qualquer valor de uso atual(Ua) atribuído a outros documentos na rede ou maior do quealguns dos valores de uso atual (Ua) atribuídos a alguns dosoutros documentos na rede.

Em outras modalidades, um valor de uso padrão (UD)pode ser atribuído a um documento sem dados de uso atual talque ao documento é dada uma importância relativa média com-parada aos documentos que têm um valor de uso atual atribuí-do (Ua) . Por exemplo, nessa modalidade, os valores de usopadrão (U0) para documentos sem dados de uso atual podem es-tar na faixa de um valor de uso atual atribuído mínimo (UA_min) a um valor de uso atual atribuído máximo (Uamax) , ou po-dem estar em uma faixa específica entre o valor de uso atualatribuído mínimo (Uftmin) e o valor de uso atual atribuído má-ximo (Uftmax) . Nessa modalidade, os documentos sem dados deuso atual são fornecidos com uma importância relativa média,sugerindo uso médio, comparado a documentos que têm dados deuso atual associados a eles.

A partir da etapa 407, o método exemplificado 401prossegue para o bloco de decisão 406. Neste, uma determina-ção é feita pelo código de aplicação como se todos os docu-mentos em uma rede têm um valor de uso atual (Ua) ou padrão (UD), o método exemplificado prossegue para a etapa 408, on-de o próximo documento é rastreado por dados de uso atual. Apartir da etapa 408, o método exemplificado 401 retorna parao bloco de decisão 404 e prossegue como discutido acima.

Retornando ao bloco de decisão 406, se uma deter-minação é feita pelo código de aplicação de que todos os do-cumentos na rede têm um valor de uso atual (Uft) ou padrão(U0) , o método exemplificado 401 prossegue para o bloco dedecisão 409. Neste, uma determinação é feita por um adminis-trador do sistema se rebaixar quaisquer valores de uso atual(Ua) ou padrão (U0) de modo a representar de forma mais pró-xima a importância de um dado documento em um espaço de re-de. Se uma decisão é feita para rebaixar um ou mais valoresde uso atual (Uft) ou padrão (Ud) de modo a representar deforma mais próxima a importância de um dado documento em umespaço de rede, o método exemplificado 401 prossegue para aetapa 410, onde o valores de uso atual (Ua) ou padrão (Ud)de um ou mais documentos (ou URLs) são ajustados ou negati—vãmente ou positivamente. A partir da etapa 410, o métodoexemplificado 401 prossegue para a etapa 411 descrita abai-xo .

Retornando ao bloco de decisão 409, se uma decisãoé feita para não rebaixar (ou atualizar) um ou mais valoresde uso atual (Ua) ou padrão (Ud) , o método exemplificado 401prossegue diretamente para a etapa 411. Na etapa 411, os va-lores de uso atual (Ua) ou padrão (U0) são utilizados em umafunção de classificação para determinar uma classificação derelevância de documento total para cada documento em um es-paço de rede. A partir da etapa 411, o método exemplificado401 prossegue para o bloco final 412.

Uma vez que todos os valores de uso atual (UA) oupadrão (U0) tenham sido determinado e opcionalmente rebaixa-dos ( ou atualizados), se assim desejado, o valor de uso atu—al (Ua) ou padrão (U0) para cada documento pode ser usadocomo um parâmetro em uma função de classificação para forne-cer classificação de relevância para cada documento. Talclassificação de relevância de documento pode ser usada paraclassificar resultados de procura de uma consulta de procu-ra. Um método exemplificado de classificar resultados deprocura gerados usando uma função de classificação contendoum parâmetro de valor de uso de documento é mostrado na FIG.4 .A FIG. 4 fornece um fluxograma lógico que mostraetapas exemplificadas no método exemplificado 20 que compre-ende um método de classificar resultados de procura geradosusando uma função de classificação contendo um parâmetro devalor de uso. Como mostrado na FIG. 4, o método exemplifica-do 20 inicia no bloco 201 e prossegue para a etapa 202. Naetapa 202, um usuário solicita uma procura inserindo umaconsulta de procura. Antes da etapa 202, valores de uso atu-al ou padrão para cada um dos documentos na rede foram pre-viamente calculados. A partir da etapa 202, o método exem-plificado 20 prossegue para a etapa 203.

Na etapa 203, o valor de uso atual ou padrão paracada documento em uma rede é combinado com qualquer outrasestatística de documento (por exemplo, outra estatística in-dependente de consulta) para cada documento armazenado noíndice. Combinando os valores de uso atual ou padrão com ou-tras estatísticas de documento permite um tempo de respostaà consulta mais rápido já que toda a informação relacionadaà classificação é agrupada junta. Conseqüentemente, cada do-cumento listado no índice tem um valor de uso atual ou pa-drão associado depois da combinação. Uma vez que a combina-ção está completa, o método exemplificado 20 prossegue paraa etapa 204.

Na etapa 204, as estatísticas de documento inde-25 pendente de consulta para um dado documento, incluindo umparâmetro de uso, são fornecidas como um componente de umafunção de classificação. Dados dependentes de consulta sãotambém fornecidos para o dado documento, tipicamente como umcomponente separado da função de classificação. Os dados de-pendentes de consulta ou partes relacionada a conteúdo dafunção de classificação dependem dos termos de procura atuale do conteúdo do dado documento.

Em uma modalidade, a função de classificação com-preende pelo menos um componente independente de consulta(QID) que compreende um parâmetro de uso. Em uma modalidade,o componente independente de consulta (QID) pode ser repre-sentado pela seguinte equação:

<formula>formula see original document page 27</formula>

onde:

U representa um valor de uso atual ou um valor deuso padrão; e

wu e ku representam parâmetros de ajuste para ovalor de uso. Em uma modalidade adicional, o componente in-dependente de consulta (QID) pode ser representado pela se-guinte equação:

<formula>formula see original document page 27</formula>

onde:

U representa um valor de uso atual ou um valor deuso padrão; e

wu e ku representam parâmetros de ajuste para ovalor de uso. Em ainda uma modalidade adicional, o componen-te independente de consulta (QID) pode ser representado pelaseguinte equação:QID( doc ) = Wu [1 + exp(—kuU -B)] + C(3)

onde:

U representa um valor de uso atual ou um valor deuso padrão; e

Wu, Ku, B e C representam parâmetros de ajuste(isto é, constantes escalares) para o valor de uso.

Em uma modalidade adicional, a função de classifi-cação compreende a soma do componente independente de con-sulta (QID) acima descrito e pelo menos um componente depen-dente de consulta (QD) tal como

Classificação = QD(doe, consulta) + QID(doe).

O componente QD pode ser qualquer função de clas-sificação de documento. Em uma modalidade, o componente QDcorresponde a uma função de classificação ponderada por cam-po descrita no Pedido de Patente Norte-Americana No. Serial10/804.326 intitulada "PONDERAÇÃO POR CAMPO EM PROCURA DEDOCUMENTO DE TEXTO", depositado em 18 de Março de 2004, oassunto da qual é aqui incorporado como referência em suaintegridade. Como fornecido no Pedido de Patente Norte-Americana No. Serial 10/804.326, uma equação que pode serusada como uma representação da função de classificação pon-derada por campo é como segue:

<formula>formula see original document page 28</formula>

onde:

wtf' representa uma freqüência de termo ponderadaou soma de freqüências de termo de dados termos na consultade procura multiplicada pelos pesos através de todos os cam-pos (por exemplo, o titulo, o corpo, etc. do documento) enormalizados de acordo com o comprimento de cada campo e ocomprimento médio correspondente,

N representa um número de documento na rede,

η representa um número de documentos contendo umtermo de consulta, e

ki é uma constante ajustável.

Os termos e equação acima são adicionalmente des-critos em detalhes no Pedido de Patente Norte-Americana No.Serial 10/804.326, o assunto da qual é aqui incorporado comoreferência em sua integridade.

Em algumas modalidades, a função de classificaçãopode adicionalmente compreender um componente QID que levaem conta (i) um valor de distância de clique determinado pe-Ios métodos descritos no Pedido de Patente Norte-AmericanaNo. Serial 10/955.983, intitulada "SISTEMA E MÉTODO PARACLASSIFICAR RESULTADOS DE PROCURA USANDO DISTÂNCIA DECLIQUE", depositado em 30 de Agosto de 2004, (ii) um valorde distância de clique induzida determinado pelos métodosdescritos no Pedido de Patente Norte-Americana No. Serial11/206.286 intitulada "FUNÇÕES DE CLASSIFICAÇÃO USANDO UMA. DISTÂNCIA DE CLIQUE INDUZIDA DE UM DOCUMENTO EM UMA REDE"depositado em 15 de Agosto de 2005, o assunto de ambos dasquais é incorporado aqui como referência em sua integridade,(iii) uma profundidade URL de um documento, ou (iv) uma com-binação de (i) ou (ii) e (iii) . Por exemplo, esse componenteQID adicional pode compreender uma função como segue:<formula>formula see original document page 30</formula>

onde:

Wcd representa um peso de um componente indepen-dente de consulta tal como um componente contendo um parâme-tro de distância de clique ou distância de clique induzida,bcd representa um peso de uma distância de clique

ou distância de clique induzida em relação à profundidadeURL,

bud representa um peso de uma profundidade URL,

CD representa uma distância de clique computada ouatribuída ou distância de clique induzida para um documento,Jcew representa uma constante de ajuste que é deter-minada pela otimização da precisão da função de classifica-ção, similar a outros parâmetros de ajuste (isto é, kew poderepresentar o valor de peso de margem quando todas as mar-gens têm o mesmo valor de peso de margem, ou kew pode' repre-sentar o valor de margem médio quando os valores de peso demargem diferem uns dos outros) ,

UD representa uma profundidade de URL, ekcd é a constante de saturação de distância de cli-que .

Os termos ponderados (Wcdf bcd e bud ) auxiliam nadefinição da importância de cada um dos seus termos relacio-nados (isto é, o componente contendo um parâmetro de distân-cia de clique ou distância de clique induzida, a distânciade clique ou distância de clique induzida para um dado docu-mento, e a profundidade URL do dado documento, respectiva-mente) e por fim o resultado da função de classificação.

A profundidade de URL (UD) é uma adição opcionalao componente independente de consulta acima referido parasuavizar o efeito que o valor de distância de clique ou dedistância de clique induzida pode ter na função de classifi-cação. Por exemplo, em alguns casos, um documento que não émuito importante (isto é, tem uma grande profundidade deURL) pode ter uma curta distância de clique ou valor de dis-tância de clique induzida. A profundidade de URL é represen-tada pelo número de barras diagonais em uma URL do documen-to. Por exemplo, www.example.com\d1\d2\d3\d4.htm inclui qua-tro barras diagonais e, portanto, teria uma profundidade deURL de 4. Esse documento, entretanto, pode ter uma ligaçãodiretamente a partir da página principal www.example.comdando a ela um valor de distância de clique ou de distânciade clique induzida relativamente baixo. Incluindo o termo deprofundidade de URL na função acima referida e ponderando otermo de profundidade de URL contra o valor de distância decl ique ou de distância de clique induzida compensa um valorde distância de clique ou de distância de clique induzidarelativamente alto para refletir mais precisamente a impor-tância do documento na rede. Dependendo da rede, uma profun-didade de URL de 3 ou mais pode ser considerada uma ligaçãoprofunda.

Em uma modalidade, a função de classificação usadapara determinar uma classificação de relevância de documentopara um dado documento compreende uma função como segue:<formula>formula see original document page 32</formula>

onde os termos são como descrito acima.

Em outras modalidades, a profundidade de URL podeser removida da função de classificação ou outros componen-tes podem ser adicionados à função de classificação para a-perfeiçoar a precisão do componente dependente de consulta,do componente independente de consulta, ou de ambos. Alémdisso, o componente independente de consulta acima descritocontendo um parâmetro de uso pode ser incorporado em outrasfunções de classificação (não mostradas) para aperfeiçoar aclassificação de resultados de procura.

Uma vez que as estatísticas de documento para umdado documento são fornecidas a uma função de classificaçãona etapa 204, o método exemplificado 20 prossegue para a e-tapa 205. Na etapa 205, uma classificação de relevância dedocumento é determinada para um dado documento, armazenadana memória, e associada com o dado documento. A partir daetapa 205, o método exemplificado 20 prossegue para o blocode decisão 206.

No bloco de decisão 206, uma determinação é feitapelo código de aplicação se uma classificação de relevânciade documento foi calculada para cada documento em uma rede.Se uma determinação é feita de que uma classificação de re-levância de documento não foi calculada para cada documentoem uma rede, o método exemplificado 20 retorna para a etapa204 e continua como descrito acima. Se uma determinação éfeita de que uma classificação de relevância de documentofoi calculada para cada documento em uma rede, o método e-xemplificado 20 prossegue para a etapa 207.

Na etapa 207, os resultados de procura da consultacompreendendo numerosos documentos são classificados de a-cordo com suas classificações de relevância de documento as-sociadas. As classificações de relevância de documento re-sultantes levam em conta o valor de uso atual ou padrão decada um dos documentos na rede. Uma vez que os resultados deprocura são classificados, o método exemplificado 20 prosse-gue para a etapa 208 onde resultados classificados são exi-bidos a um usuário. A partir da etapa 208, o método exempli-ficado 20 prossegue para a etapa 209 onde os resultadosclassificados mais altos são selecionados e visualizados pe-lo usuário. A partir da etapa 209, o método exemplificado 20prossegue para a etapa 210 onde o método exemplificado 20termina.

Em adição aos métodos acima descritos de gerar umaclassificação de relevância de documento para documentos emuma rede e de usar classificações de relevância de documentopara classificar resultados de procura de uma consulta deprocura, o meio legível por computador tendo armazenado nes-te instruções executáveis por computador para executar osmétodos acima descritos é descrito também aqui.

Sistemas de computação são também descritos aqui.

Um sistema de computação exemplificado contém pelo menos ummódulo de aplicação utilizado no sistema de computação, ondepelo menos um módulo de aplicação compreende código de apli-cação carregado neste, onde o código de aplicação executa ummétodo de gerar uma classificação de relevância de documentopara documentos em uma rede. 0 código de aplicação pode sercarregado no sistema de computação usando qualquer um dosmeios legíveis por computador acima descritos tendo nestesinstruções executáveis por computador para gerar uma classi-ficação de relevância de documento para documentos em umarede e para usar classificações de relevância de documentopara classificar resultados de procura de uma consulta deprocura como descrito acima.

Enquanto a especificação foi descrita em detalhescom relação às modalidades específicas dessa, aqueles versa-dos na técnica apreciarão, mediante um entendimento do ante-rior, que podem prontamente conceber as alterações, varia-ções, e equivalentes a essas modalidades. Conseqüentemente,o escopo dos métodos descritos, o meio legível por computa-dor, e os sistemas de computação deveriam ser avaliados comoaqueles das reivindicações em anexo e quaisquer equivalentesa esses.

Claims

1. Meio legível por computador, CARACTERIZADO pelofato de que compreende instruções executáveis por computadorarmazenadas nele para classificar documentos em uma rede, asditas instruções executáveis por computador utilizam umafunção de classificação que compreende um ou mais componen-tes independentes de consulta, onde pelo menos um componenteindependente de consulta inclui um parâmetro de uso que levaem conta dados de uso gerados por servidor, armazenados emservidor para um ou mais documentos na rede.

2. Meio legível por computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que o valor deuso compreende (i) um valor de uso atual baseado nos dadosde uso atual mantidos por um servidor ou (ii) um valor deuso padrão que não é baseado em dados de uso atual.

3. Meio legível por computador, de acordo com areivindicação 2, CARACTERIZADO pelo fato de que o valor deuso atual é dependente de uma ou mais propriedades relacio-nadas ao uso de um documento ou de uma pasta contendo umconjunto de documentos, as ditas uma ou mais propriedadesrelacionadas ao uso compreendem um número total de visuali-zações de documento ou de pasta por usuários em um dado pe-ríodo de tempo, um número médio de visualizações de documen-to ou de pasta por usuário em um dado período de tempo, umtempo total gasto em um documento ou pasta particular em umdado período de tempo, um tempo médio gasto em um documentoou pasta particular em um dado período de tempo, onde o dadoperíodo de tempo compreende a última semana, o último mês, oúltimo ano, ou o tempo de vida total do documento ou pasta,ou qualquer outro período de tempo.

4. Meio legível por computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que pelo menosum componente independente de consulta é representado poruma fórmula:<formula>formula see original document page 36</formula>onde:U representa um valor de uso atual ou um valor deuso padrão; ewu e ku representam parâmetros de ajuste para ovalor de uso.

5. Meio legível por computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que pelo menosum componente independente de consulta inclui ambos (i) oparâmetro de uso e (ii) um parâmetro de distância de cliqueou de distância de clique induzida.

6. Meio legível por computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que pelo menosum componente independente de consulta inclui ambos o parâ-metro de uso e um parâmetro de profundidade de URL.

7. Meio legível por computador, de acordo com areivindicação 1, CARACTERIZADO adicionalmente pelo fato deque compreende instruções executáveis por computador paraatribuir uma classificação gerada pela função de classifica-ção a cada documento na rede, a dita classificação é usadapara classificar documentos em ordem.

8. Meio legível por computador, de acordo com areivindicação 7, CARACTERIZADO pelo fato de que a classifi-cação para cada documento é gerada usando uma fórmula:<formula>formula see original document page 37</formula>onde:wtf representa uma freqüência de termo ponderada,N representa um número de documentos na rede,η representa um número de documentos contendo umtermo de consulta,wcd representa um peso de' um componente indepen-dente de consulta,bCí/ representa um peso de uma distância de clique,bud representa um peso de uma profundidade de URL,CD representa uma distância de clique computada oudistância de clique induzida atribuída a um documento,kew representa uma constante de ajuste relacionadaa pesos de margem,UD representa uma profundidade de URL,U representa um valor de uso atual ou um valor deuso padrão,wu e ku representam parâmetros de ajuste para ovalor de uso, eKcd e são constantes.

9. Meio legível por computador, de acordo com areivindicação 1, CARACTERIZADO adicionalmente pelo fato deque compreende instruções executáveis por computador paraaceitar um pedido de consulta inserido por um usuário, con-duzir uma procura dos documentos na rede para gerar resulta-dos de procura compreendendo múltiplos documentos, classifi-car os múltiplos documentos dos resultados de procura usandoa função de classificação para gerar resultados de procuraclassificados, e exibir os resultados de procura classifica-dos ao usuário.

10. Meio legível por computador, de acordo com areivindicação 1, CARACTERIZADO adicionalmente pelo fato deque compreende instruções executáveis por computador parahabilitar um administrador a manualmente ajustar os resulta-dos de classificação gerados pela função de classificação.

11. Sistema de computação, CARACTERIZADO pelo fatode que contém pelo menos um módulo de aplicação utilizado nosistema de computação, onde pelo menos um módulo de aplica-ção compreende código de aplicação carregado neste a partirdo meio legível por computador de acordo com a reivindicação-1.

12. Método de determinar uma classificação de re-levância de documento para um documento em uma rede,CARACTERIZADO pelo fato de que compreende as etapas de:atribuir um valor de uso atual (Ua) a um ou maisdocumentos em uma rede compreendendo N documentos, onde ovalor de uso atual (Ua) é baseado nos dados de uso real man-tidos e armazenados em um servidor;se a menos do que N documentos são atribuídos umvalor de uso atual (Ua) , atribuir um valor de uso padrão(U0) aos documentos que não têm dados de uso atual associa-dos a eles; eusar o valor de uso para cada documento para de-terminar a classificação de relevância de documento de umdado documento na rede.

13. Método, de acordo com a reivindicação 12,CARACTERIZADO adicionalmente pelo fato de que compreende aetapa de:restaurar os dados de uso atual ou um valor de usoatual (Ua) para um documento a partir de um arquivo de arma-zenamento de dados no servidor.

14. Método, de acordo com a reivindicação 12,CARACTERIZADO adicionalmente pelo fato de que compreende aetapa de:armazenar os dados de uso atual ou um valor de usoatual (Ua) para um documento em um arquivo de armazenamentode dados.CARACTERIZADO pelo fato de que a classificação de relevânciade documento para cada documento na rede é gerada usando umafórmula:

15. Método, de acordo com a reivindicação 12,<formula>formula see original document page 39</formula>onde:wtf representa uma freqüência de termo ponderada,N representa um número de documentos na rede,η representa um número de documentos contendo umtermo de consulta,wcd representa um peso de um componente indepen-dente de consulta,bcd representa um peso de uma distância de clique,bud representa um peso de uma profundidade de URL,CD representa uma distância de clique computada oudistância de clique induzida atribuída a um documento,kew representa uma constante de ajuste relacionadaa pesos de margem,UD representa uma profundidade de URL,U representa um valor de uso atual ou um valor deuso padrão,wu e ku representam parâmetros de ajuste para ovalor de uso, ekcd e são constantes.

16. Método de classificar documentos em uma rede,CARACTERIZADO pelo fato de que compreende as etapas de:determinar uma classificação de relevância de do-cumento para cada documento na rede usando o método da rei-vindicação 12; eclassificar os documentos em ordem decrescente ba-seados nas classificações de relevância de documento paracada documento.

17. Método de classificar resultados de procura deuma consulta de procura, CARACTERIZADO pelo fato de que com-preende as etapas de:determinar uma classificação de relevância de do-cumento para cada documento nos resultados de procura de umaconsulta de procura usando o método da reivindicação 12; eclassificar os documentos em ordem decrescente ba-seados nas classificações de relevância de documento de cadadocumento.

18. Meio legível por computador, CARACTERIZADO pe-lo fato de que compreende instruções executáveis por compu-tador armazenadas neste para executar o método da reivindi-cação 12.

19. Sistema de computação que contém pelo menos ummódulo de aplicação utilizado no sistema de computação, ondepelo menos um módulo de aplicação compreende código de apli-cação para executar um método de determinar uma classifica-ção de relevância de documento para um documento em uma re-de, o dito método, CARACTERIZADO pelo fato de que compreendeas etapas de:atribuir um valor de uso atual (Ua) a um ou maisdocumentos em uma rede compreendendo N documentos, onde ovalor de uso atual (Ua) é baseado nos dados de uso real man-tidos e armazenados em um servidor;se a menos do que N documentos são atribuídos umvalor de uso atual (Ua) , atribuir um valor de uso padrão(Ud) aos documentos que não têm dados de uso atual associa-dos a eles; eusar o valor de uso para cada documento para de-terminar a classificação de relevância de documento de umdado documento na rede.

20. Sistema de computação, de acordo com a reivin-dicação 19, CARACTERIZADO pelo fato de que o valor de usoatual é dependente de uma ou mais propriedades relacionadasao uso de um documento ou de uma pasta contendo um conjuntode documentos, as ditas uma ou mais propriedades relaciona-das ao uso compreendem um número total de visualizações dedocumento ou de pasta por usuários em um dado período detempo, um número médio de visualizações de documento ou depasta por usuário em um dado período de tempo, um tempo to-tal gasto em um documento ou pasta particular em um dado pe-ríodo de tempo, um tempo médio gasto em um documento ou pas-ta particular em um dado período de tempo, onde o dado perí-odo de tempo compreende a última semana, o último mês, o úl-timo ano, ou o tempo de vida total do documento ou pasta, ouqualquer outro período de tempo.