BRPI0613523A2 - indexação e pesquisa inteligente em recipientes - Google Patents

indexação e pesquisa inteligente em recipientes Download PDF

Info

Publication number
BRPI0613523A2
BRPI0613523A2 BRPI0613523-4A BRPI0613523A BRPI0613523A2 BR PI0613523 A2 BRPI0613523 A2 BR PI0613523A2 BR PI0613523 A BRPI0613523 A BR PI0613523A BR PI0613523 A2 BRPI0613523 A2 BR PI0613523A2
Authority
BR
Brazil
Prior art keywords
file
indexing
computer
target
files
Prior art date
Application number
BRPI0613523-4A
Other languages
English (en)
Inventor
David G De Vorchik
Timothy P Mckee
Jeffrey C Belt
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=37662832&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0613523(A2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of BRPI0613523A2 publication Critical patent/BRPI0613523A2/pt
Publication of BRPI0613523A8 publication Critical patent/BRPI0613523A8/pt
Publication of BRPI0613523B1 publication Critical patent/BRPI0613523B1/pt

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Abstract

INDEXAçãO E PESQUISA INTELIGENTE EM RECIPIENTES. A presente invenção revela aspectos para indexar arquivos e referências de arquivo dentro de um recipiente de arquivos (por exemplo, um arquivo de lista, arquivo zip, arquivo gabinete, entre outros) . Um manipulador de protocolo inteligente é criado para acessar recipientes de arquivos e indexar, de forma seletiva, o conteúdo deles a fim de evitar entradas duplicadas de arquivos nos resultados de pesquisa. As referências de arquivo de recipiente referindo-se a arquivos dentro do escopo de uma pesquisa são indexadas ao mínimo.

Description

"INDEXAÇÃO E PESQUISA INTELIGENTE EM RECIPIENTES"
ANTECEDENTES DA INVENÇÃO
Uma parte imprescindível de praticamente qualquercomputador é o sistema de arquivos, usado para armazenarprogramas de computador e dados associados. Os avanços re-centes possibilitam a pesquisa nos sistemas de arquivos,permitindo aos usuários localizar qualquer arquivo com faci-lidade. No caso dos arquivos de dados, os usuários podempesquisar não apenas pelo nome do arquivo, mas também pelosatributos do arquivo (por exemplo, autor, data de criação) eaté mesmo pelo conteúdo textual dentro do arquivo (por exem-plo, palavras em um documento, palavras em uma mensagem decorreio eletrônico).
Até certo ponto, a capacidade de pesquisa foi a-primorada pelos avanços na indexação, que é o processo decatalogar o conteúdo de um ou mais sistemas de arquivos demaneira a otimizar o tempo necessário para a realização deuma pesquisa. Tais índices costumam estar associados a meca-nismos de pesquisa da Internet (por exemplo, MSN Search, Go-ogle), que catalogam uma imensidão de conteúdo da Rede Mun-dial de Computadores. Entretanto, a indexação também chegouao computador convencional, melhorando a pesquisa dos siste-mas de arquivos locais.
Enquanto cataloga o conteúdo do computador, umprograma de indexação de pesquisa pode encontrar recipientesde arquivos. Os tipos de recipientes de arquivos podem in-cluir arquivos compactados e/ou agrupados (por exemplo, for-matos de arquivo como zip, gabinete (CAB) , arquivo em fita(TAR)) e outras coleções de referências de arquivo associa-das. As referências de arquivo podem agir como arquivos mar-cadores de posição que simplesmente apontam para um arquivoem algum local de um sistema de arquivos local ou remoto. Asreferências de arquivo também podem apontar para outros i-tens além de arquivos, como por exemplo, uma mensagem decorreio eletrônico especifica dentro de um arquivo contendovárias mensagens de correio eletrônico.
Quando um serviço de indexação indexa um arquivoespecifico e também indexa um arquivo de referência tendocomo alvo o arquivo especifico, o serviço de indexação podeacabar criando várias entradas de indice para o mesmo arqui-vo. Como resultado, o mesmo arquivo pode aparecer várias ve-zes em um conjunto especifico de resultados de pesquisa, oque, inevitavelmente, deixa o usuário confuso. Além disso,se um arquivo referenciado estiver localizado em um sistemade arquivos remoto, o programa de indexação pode não sabercatalogar seu conteúdo, impedindo inadequadamente sua inclu-são nos resultados da pesquisa.
Podem surgir outros problemas quando o programa deindexação encontra um recipiente de arquivos, como um arqui-vo zip. O programa de indexação pode não conseguir acessar oconteúdo do recipiente de arquivos, excluindo da pesquisaresultados de possível relevância. Mas mesmo se o recipientede arquivos estiver acessível, o programa de indexação podenão ser capaz de indexar corretamente os arquivos e as refe-rências de arquivo armazenados dentro do recipiente de ar-quivos, o que pode gerar resultados de pesquisa confusos ouincompletos.
SUMÁRIO
Os aspectos referem-se à indexação de arquivos decomputador e referências de arquivo dentro de um recipientede arquivos. Em outros aspectos, um manipulador de protocolointeligente é criado para acessar recipientes de arquivo eindexar, de forma seletiva, o conteúdo deles a fim de evitarentradas duplicadas de arquivos nos resultados de pesquisa.
DESENHOS
Os aspectos da presente invenção são ilustrados, atitulo exemplificativo e sem restrição, nas figuras concomi-tantes, nas quais números de referências parecidos indicamelementos similares, e nas quais:
A Figura 1 ilustra um diagrama esquemático de umambiente de computação digital de uso geral;
A Figura 2 representa uma parte ilustrativa de umsistema de arquivos local;
A Figura 3 representa uma interface ilustrativapara um arquivo de lista;
A Figura 4 representa uma interface ilustrativapara um arquivo zip;
As Figuras 5 e 6 representam resultados de pesqui-sa ilustrativos; e
A Figura 7 é um fluxograma que ilustra um métodoilustrativo para indexar recipientes de arquivo.
DESCRIÇÃO DETALHADA
Os aspectos proporcionam métodos e sistemas paraindexar e pesquisar de maneira inteligente o conteúdo de umsistema de arquivos, incluindo a indexação e pesquisa de re-cipientes de arquivo (por exemplo, arquivos zip ou arquivosde lista).
Nota-se que várias conexões podem ser estabeleci-das entre os elementos na descrição a seguir. Salvo indica-ção ao contrário, essas conexões podem ser diretas ou indi-retas e o presente relatório descritivo não tem a intençãode impor limitações nesse aspecto.
Visão Geral
Ao indexar de forma inteligente o conteúdo dos re-cipientes de arquivo, é possível evitar resultados de pes-quisa duplicados, confusos ou incompletos. Os arquivos co-muns contidos nos arquivos compactados e/ou agrupados podemser indexados normalmente, ao passo que as referências dearquivo apontando para arquivos armazenados localmente podemser indexadas apenas parcialmente.
Ambiente de Computação de Uso Geral
A FIG. 1 ilustra um exemplo de um ambiente de sis-tema de computação adequado 100 em que a invenção pode serimplementada. 0 ambiente de sistema de computação 100 é ape-nas um exemplo de um ambiente de computação adequado e nãotem a intenção de implicar em qualquer limitação ao âmbitode uso ou à funcionalidade da invenção. Tampouco se deve in-terpretar o ambiente de computação 100 como tendo qualquerdependência ou exigência com relação a qualquer um dos com-ponentes ilustrados, ou combinação desses, no ambiente ope-racional exemplificativo 100.
A invenção é operacional com vários ambientes ouconfigurações diferentes de sistema de computação de uso ge-ral ou especifico. Exemplos de sistemas, ambientes e/ou con-figurações de computação bem conhecidos que podem ser ade-quados para uso com a invenção incluem, sem a isto se res-tringir, computadores pessoais, computadores servidores,dispositivos portáteis ou laptop, sistemas multiprocessado-res, sistemas baseados em microprocessador, caixas decodifi-cadoras, componentes eletrônicos programados pelo consumi-dor, computadores de rede, microcomputadores, computadoresde grande porte, ambientes de computação distribuída que in-cluem qualquer um dos sistemas ou dispositivos acima, entreoutros.
A invenção pode ser descrita no contexto geral deinstruções executadas por computador, tais como módulos deprograma sendo executados por um computador. Geralmente, osmódulos de programa incluem rotinas, programas, objetos, es-truturas de dados etc., que efetuam tarefas específicas ouimplementam tipos de dados abstratos específicos. A invençãotambém pode ser praticada em ambientes de computação distri-buída, em que as tarefas são realizadas por dispositivos deprocessamento remoto ligados por módulos que podem estar lo-calizados tanto em meios de armazenamento locais como remo-tos do computador, inclusive dispositivos de armazenamentoem memória.
Com referência à FIG. 1, um sistema exemplificaii-vo para implementação da invenção inclui um dispositivo decomputação de uso geral na forma de um computador 110. Oscomponentes do computador 110 podem incluir, sem a isto serestringir, uma unidade de processamento 120, uma memória desistema 130 e um barramento de sistema 121 que acopla várioscomponentes do sistema, incluindo a memória do sistema à u-nidade de processamento 120. O barramento de sistema 121 po-de possuir qualquer um dos diferentes tipos de estrutura debarramento, incluindo um barramento de memória ou controla-dor de memória, um barramento periférico e um barramento lo-cal usando qualquer uma das diferentes arquiteturas de bar-ramento. A titulo exemplificativo, sem limitação, tais ar-quiteturas incluem barramento da Arquitetura Padrão da In-dústria (ISA), barramento da Arquitetura de Microcanal(MCA), barramento ISA Aperfeiçoada (EISA), barramento localda Associação de Padrões Eletrônicos de Video (VESA) e bar-ramento de Interconexão de Componentes Periféricos (PCI),também chamado de barramento Mezanino.
0 computador 110 geralmente inclui uma variedadede meios legíveis por computador. Meios legíveis por compu-tador podem ser qualquer meio disponível que pode ser aces-sado por computador 110 e que inclui tanto meios voláteis enão-voláteis quanto meios removíveis e não-removíveis. A tí-tulo exemplificativo, sem limitação, meios legíveis por com-putador podem compreender meios de armazenamento e meios decomunicação de computador. Os meios de armazenamento de com-putador incluem tanto meios voláteis e não-voláteis, quantoremovíveis e não-removíveis implementados em qualquer métodoou tecnologia para armazenamento de informações, tais comoinstruções legíveis por computador, estruturas de dados, mó-dulos de programa ou outros dados. Os meios de armazenamentoincluem, sem a isto se restringir, RAM, ROM, EEPROM, memóriaflash ou outra tecnologia de memória, CD-ROM, discos versá-teis digitais (DVD) ou outro armazenamento em disco óptico,cassetes magnéticos, fita magnética, armazenamento em discomagnético ou outros dispositivos de armazenamento magnético,ou qualquer outro meio que possa ser usado para armazenar asinformações desejadas e que possa ser acessado pelo computa-dor 110. Os meios de comunicação geralmente abrangem instru-ções legíveis por computador, estruturas de dados, módulosdé programa ou outros dados em um sinal de dados moduladotal como uma onda portadora ou outro mecanismo de transpor-te, e incluem quaisquer meios de distribuição de informa-ções. 0 termo "sinal de dados modulados" significa um sinalque uma ou mais de suas características ajustadas ou altera-das de tal maneira a codificar as informações no sinal. Atítulo exemplificativo, e sem limitação, os meios de comuni-cação incluem meios com fio, tal como uma rede com fio ouconexão direta com fio, e meios sem fio, tal como acústico,RF, infravermelho e outros meios sem fio. Combinações dequalquer um dos elementos anteriores também deverão ser in-cluídas no âmbito de meios legíveis por computador.
A memória do sistema 130 inclui meios de armazena-mento de computador na forma de memória volátil e/ou não-volátil, tal como memória somente para leitura (ROM) 131 ememória de acesso aleatório (RAM) 132. Um sistema básico deentrada/saída 133 (BIOS), contendo as rotinas básicas paraajudar a transferir informações entre os elementos dentro docomputador 110, tal como durante a inicialização, é geral-mente armazenado na ROM 131. A RAM 132 geralmente contém da-dos e/ou módulos de programa que podem ser acessados a qual-quer momento e/ou que estão sendo operados pela unidade deprocessamento 120. A título exemplificativo, e sem limita-ção, a FIG. 1 ilustra o sistema operacional 134, softwaresaplicativos 135, outros módulos de programa 136, e dados deprograma 137.
0 computador 110 também inclui outros meios de ar-mazenamento de computador removíveis/não-removíveis e volá-teis/não-voláteis. A título meramente exemplificativo, aFIG. 1 ilustra uma unidade de disco rígido 141 que lê ougrava em meios magnéticos não-removíveis e não-voláteis, umaunidade de disco magnético 151 que lê ou grava em um discomagnético removível e não-volátil 152, e uma unidade de dis-co óptica 155 que lê ou escreve em um disco óptico removívele não-volátil 156, tal como um CD-ROM ou outros meios ópti-cos. Outros meios de armazenamento de computador removí-veis/não-removíveis e voláteis/não-voláteis que podem serusados no ambiente operacional exemplificativo incluem, massem a isto se restringir, cassetes de fita magnética, car-tões de memória flash, discos versáteis digitais, fitas devídeo digital, RAM de estado sólido, ROM de estado sólido,entre outros. A unidade de disco rígido 141 é geralmente co-nectada ao barramento do sistema 121 por meio de uma inter-face de memória não-removível, tal como a interface 140, e aunidade de disco magnético 151 e a unidade de disco óptico155 são geralmente conectadas ao barramento de sistema 121por uma interface de memória removível, tal como a interface150.
As unidades e seus meios de armazenamento de com-putador associados, discutidos acima na FIG. 1, fornecem oarmazenamento de instruções legíveis por computador, estru-turas de dados, módulos de programa e outros dados para ocomputador 110. Na FIG. 1, por exemplo, a unidade de discorígido 141 é ilustrada armazenando o sistema operacional144, os softwares aplicativos 145, outros módulos de progra-ma 14 6, e dados de programa 147. Observe que esses componen-tes podem ou ser os mesmos ou ser diferentes do sistema ope-racional 134, dos softwares aplicativos 135, dos outros mó-dulos de programa 136, e dos dados de programa 137. 0 siste-ma operacional 144, os softwares aplicativos 145, os outrosmódulos de programa 146, e os dados de programa 147 recebemnúmeros diferentes neste documento para mostrar que se tra-tam, no mínimo, de cópias diferentes. Um usuário pode entrarcom comandos e informações no computador 20 por meio de dis-positivos de entrada, tal como um teclado 162 e o dispositi-vo de apontamento 161, normalmente chamado de mouse, track-bali ou superfície de toque. Outros dispositivos de entrada(não ilustrados) podem incluir um microfone, joystick, con-trole de jogo, antena de satélite, scanner, entre outros.
Esses e outros dispositivos de entrada são geralmente conec-tados à unidade de processamento 120 por meio de uma inter-face de entrada do usuário 160 que é acoplada ao barramentodo sistema, mas que pode ser conectada por outra interface eestruturas de barramento, tal como uma porta paralela, portade jogo ou um barramento serial universal (USB). Um monitor191, ou outro tipo de dispositivo de exibição, também é co-nectado ao barramento de sistema 121 por meio de uma inter-face, tal como uma interface de video 190. Além do monitor,os computadores também podem incluir outros periféricos desaida, tais como alto-falantes 197 e impressora 196, que po-dem ser conectados por meio de uma interface periférica desaida 195.
0 computador 110 pode operar em um ambiente em re-de usando conexões lógicas com um ou mais computadores remo-tos, tal como o computador remoto 180. 0 computador remoto180 pode ser um computador pessoal, um servidor, um rotea-dor, um computador de rede, um dispositivo não hierarquizadoou outro nó comum da rede, e geralmente inclui muitos ou to-dos os elementos supramencionados com relação ao computador110, apesar de apenas um dispositivo de armazenamento em me-mória 181 haver sido ilustrado na FIG. 1. As conexões lógi-cas ilustradas na FIG. 1 incluem uma rede local (LAN) 171 euma rede de longa distância (WAN) 173, mas também pode in-cluir outras redes. Tais ambientes de rede são comuns em es-critórios, redes de computador a nivel empresarial, intra-nets e a Internet.
Quando usado em um ambiente em rede LAN, o compu-tador 110 é conectado à LAN 171 por meio de uma interface derede ou adaptador 170. Quando usado em um ambiente em redeWAN, o computador 110 geralmente inclui um modem 172 ou ou-tros meios para estabelecer comunicações pela WAN 173, talcomo a Internet. 0 modem 172, que pode ser interno ou exter-no, pode ser conectado ao barramento do sistema 121 por meioda interface de entrada do usuário 160, ou por outro meca-nismo apropriado. Em um ambiente em rede, os módulos de pro-grama representados com relação ao computador 110, ou partesdeles, podem ser armazenados no dispositivo de armazenamentoem memória remoto. A título exemplificativo, e sem limita-ção, a FIG. 1 ilustra softwares aplicativos remotos 185 comoresidentes no dispositivo de memória 181. Será apreciado queas conexões de rede ilustradas são exemplificativas e queoutros meios para estabelecer uma ligação de comunicaçõesentre os computadores podem ser usados.
Em alguns aspectos, uma caneta digitalizadora 165e uma caneta ou caneta stylus anexa 166 são proporcionadospara a captura digital de entrada à mão livre. A caneta di-gitalizadora 165 também pode usar tecnologias capacitivas ouresistivas, permitindo uma caneta stylus ativa ou uma canetastylus passiva (por exemplo, um dedo ou outro dispositivo deapontamento). Embora seja ilustrada uma conexão direta entrea caneta digitalizadora 165 e a interface de entrada do usu-ário 160, na prática, a caneta digitalizadora 165 pode seracoplada diretamente à unidade de processamento 110, à portaparalela ou outra interface, e ao barramento do sistema 130por qualquer técnica, inclusive sem o uso de fios. Além dis-so, a caneta 166 pode ter uma câmera associada a ela e umtransceptor para transmitir, sem o uso de fios, informaçõesde imagem capturadas pela câmera, para uma interface intera-gindo com o barramento 130. Além disso, a caneta pode teroutros sistemas de sensoriamento em adição ou em vez da câ-mera para determinar os cursos da tinta eletrônica, incluin-do acelerômetros, magnetômetros e giroscópios.
Será apreciado que as conexões de rede ilustradassão exemplificativas e que outros meios para estabelecer umaligação de comunicações entre os computadores podem ser usa-dos. Pressupõe-se a existência de qualquer um dos váriosprotocolos bem conhecidos, tais como TCP/IP, Ethernet, FTP,HTTP, entre outros, e o sistema pode operar em uma configu-ração cliente-servidor para permitir um usuário a acessarpáginas da Rede (Web) de um servidor baseado na Rede. É pos-sivel usar qualquer um dos vários navegadores da Rede con-vencionais para exibir e manipular dados em páginas da Rede.
Indexação e Pesquisa
A Figura 2 representa uma parte ilustrativa de umsistema de arquivos local 201 do computador 110. Os arquivosestão organizados em pastas e subpastas, criando uma imagemde interface, bem conhecida pelo usuário, para organizar oconteúdo do sistema de arquivos. 0 conteúdo do sistema dearquivos 201 inclui arquivos que podem ser pesquisados quan-do o usuário está procurando um item especifico.
Talvez o método mais lento de pesquisar os arqui-vos armazenados no computador 110 seja o de simplesmentepassar por todo o conteúdo de todos os arquivos, buscandouma seqüência de caracteres de pesquisa especificada (porexemplo, "relatório anual") no momento da solicitação dapesquisa. Esse método tem grandes chances de levar horas pa-ra apresentar resultados completos, o que seria, no máximo,um desperdício de tempo desnecessário. Para acelerar o pro-cesso, muitos programas de pesquisa empregam um sistema deindexação, que permite resultados de pesquisa mais rápidos.Um indice é geralmente uma estrutura de dados desenvolvidacom o objetivo de reduzir de maneira significativa os temposde pesquisa. Um algoritmo de indexação percorre pelo conteú-do do sistema de arquivos 201 antes da pesquisa e cria en-tradas numa estrutura de índice para cada um dos itens en-contrados. Quando uma pesquisa é solicitada, os itens pes-quisáveis podem ser encontrados com muito mais rapidez usan-do a estrutura de dados especial.
No mínimo, o programa de pesquisa (e seu componen-te de indexação) pode pesquisar apenas nomes de arquivo. Porexemplo, o usuário só pode encontrar o arquivo "BizDev.doc"se lembrar de seu nome ou uma parte dele. Os programas depesquisa também podem permitir pesquisar com base em outraspropriedades intrínsecas ou metadados de um item (por exem-plo, data de criação, data de modificação, autor). Usando oexemplo anterior, o usuário pode encontrar "BizDev.doc" Iem-brando-se do nome do autor desse documento, ou da última vezem que ele foi editado. Programas de pesquisa mais avançadostambém podem permitir pesquisar todo o texto associado a umarquivo, incluindo propriedades extrínsecas, como comentá-rios e o conteúdo textual do próprio arquivo. Novamente, u-sando o exemplo anterior, o usuário pode encontrar "Biz-Dev.doc" lembrando-se de uma nota associada ao arquivo (porexemplo, "Documento Importante de um Grande Cliente") oulembrando-se de uma palavra ou frase do próprio arquivo (porexemplo, "diretrizes de desenvolvimento do negócio").
Os arquivos armazenados no sistema de arquivos 201apresentam diferentes níveis de complexidade no que tange àindexação e pesquisa. Pelo menos as propriedades simples in-trínsecas, como o nome de arquivo e a data de criação, sãoacessíveis por meio de chamadas diretas para um sistema ope-racional. Entretanto, as propriedades extrínsecas e o conte-údo textual podem exigir código especial. Um método de aces-so a informações em tipos de arquivo distintos consiste emusar diferentes códigos especiais para cada tipo de arquivo.
Por exemplo, um documento do Microsoft Word® pode armazenarinformações de uma forma e exigir código especial para docu-mentos do Word; já um documento PDF (Formato de DocumentoPortátil) da Adobe Acrobat® pode exigir um método completa-mente diferente para acessar seu conteúdo textual e suaspropriedades extrínsecas. Tal código especial pode serchamado de IFilter ou interface IFilter. Diferentes tipos dearquivo podem ter um IFilter que permite aos serviços de in-dexação, programas de pesquisa e outros softwares obter a-cesso às propriedades e ao conteúdo textual dos documentosdesse tipo de arquivo. Portanto, podem existir IFilters paradocumentos do Microsoft Word®, documentos do Adobe Acrobat®,documentos HTML e assim por diante.
Os recipientes de arquivos podem incluir arquivoscompactados e/ou agrupados, e podem conter arquivos e refe-rências de arquivos. Uma forma de recipiente de arquivos es-pecífico é o arquivo de lista. 0 arquivo de lista contém umacoleção de referência de arquivos, cada uma apontando paraoutro arquivo. Uma lista estática pode incluir uma lista dereferências de arquivo selecionada pelo usuário, ao passoque uma lista dinâmica pode incluir uma lista de referênciasde arquivo atualizada de maneira automática. As listas dinâ-micas podem ser baseadas em consulta, adicionando e removen-do automaticamente referências de arquivo quando os arqui-vos-alvo das referências tiverem seus atributos ou conteúdomodificados. Por exemplo, uma lista dinâmica contendo refe-rências para todos os arquivos criados pelo autor John Doepode se atualizar automaticamente quando John Doe cria umnovo arquivo. Além disso, as listas estáticas, em particu-lar, podem permitir que atributos extrinsecos adicionais se-jam aplicados às referências de arquivo contidas. Esses a-tributos podem incluir notas especificas a cada referênciade arquivo dentro da lista. Embora atualmente não seja o ca-so, outros recipientes de arquivos (por exemplo, listas di-nâmicas, arquivos zip, etc.) podem futuramente permitir aadição de atributos extrinsecos a serem aplicados a cada ar-quivo ou referência de arquivo contida neles.
Os recipientes de arquivos podem apresentar um ní-vel de adicional de complexidade ao acessar as propriedadese o conteúdo textual. A FIG. 3 representa uma interface i-lustrativa 301 para o arquivo de lista "Big ClientDocs.list" e a FIG. 4 representa uma interface ilustrativa401 para o arquivo zip "Archived Files.zip". Como mostra ainterface da lista 301, um arquivo de lista pode conter re-ferências a uma coleção de arquivos 302 montada pelo criadorda lista. Além dos arquivos 302, a lista também inclui pro-priedades intrínsecas 303 e propriedades extrínsecas 304. Aspropriedades intrínsecas 303 são as que são inerentes em umarquivo, incluindo a identidade do autor, datas importantes,entre outras. As propriedades extrinsecas 304 incluem as quepodem ser modificadas diretamente pelo usuário, tais comonotas associadas a cada uma das referências de arquivo con-tidas dentro de uma lista. Embora não seja mostrado na in-terface zip 403, um arquivo zip também pode incluir proprie-dades intrínsecas e extrinsecas. O arquivo zip apresentadoaqui inclui uma coleção de arquivos 402 que foram compacta-dos e reunidos em um arquivo. Os arquivos zipados 402 dife-rem-se dos arquivos listados 302 pelo fato de que os pró-prios arquivos reais estão armazenados dentro do arquivozip, enquanto que os arquivos listados são apenas referên-cias que apontam para os arquivos reais localizados em outro lugar.
Um IFilter para cada tipo de recipiente de arqui-vos pode permitir o acesso às propriedades intrínsecas e ex-trinsecas de cada recipiente, similar a outros tipos de ar-quivo. Tais IFilters também podem permitir acesso às listasde arquivos armazenadas dentro de cada recipiente. Essas in-formações, acessadas por um serviço de indexação usando oIFilter apropriado, podem então ser apresentadas como partede um resultado de pesquisa. Por exemplo, o arquivo de lista"Big Client Docs.list" contém uma referência de arquivo para"foo.doc", entre outros. Pesquisar por "foo.doc" pode entãoretornar o arquivo original "foo.doc" do sistema de arquivoslocal, além de retornar o arquivo de lista "Big ClientDocs.list", uma vez que o texto foi indexado usando o IFil-ter da lista.Tais IFilters de recipientes podem ser complemen-tados pela criação de manipuladores de protocolo. 0 manipu-lador de protocolo é um software usado por outros softwares,como um serviço de indexação, para acessar e ler vários sis-temas de armazenamento, inclusive sistemas de arquivos, cli-entes de correio eletrônico, programas de calendário, dentreoutros. Os manipuladores de protocolo permitem que outrossoftwares utilizem a hierarquia de dados do sistema de arma-zenamento subjacente e tratem elementos individuais dentrodo sistema de armazenamento como itens distintos. A criaçãode um manipulador de protocolo para um recipiente de arqui-vos, tal como uma lista, permite que o recipiente seja aces-sado como se fosse uma pasta e retorne um caminho atravésdele mesmo para os itens individuais dentro da lista. Dessaforma, um serviço de indexação que antigamente utilizava umIFilter para simplesmente obter uma listagem do conteúdodentro de uma lista pode agora obter acesso real a esse con-teúdo e indexá-lo individualmente.
Um manipulador de protocolo para recipientes dearquivos pode oferecer ao recipiente de arquivos a função deagir como uma extensão de espaço para nome do shell. Dessaforma, os arquivos contidos no recipiente de arquivos setornam itens dentro de um espaço para nome, o espaço paranome sendo uma extensão da estrutura de diretórios na qual orecipiente se encontra.
A criação de um manipulador de protocolo para umalista pode criar entradas de índice duplicadas para o mesmoarquivo-alvo caso o manipulador de protocolo não possua umainteligência especifica quanto a quais atributos dos itensem uma lista devem ser indexados. Por exemplo, o documentodo PowerPoint "product_research.ppt" é referenciado por "BigClient Docs.list". 0 documento está no sistema de arquivosde local, e, portanto, já foi indexado por um serviço de in-dexação. Se o arquivo fosse indexado completamente outra vezcomo um item na lista, ele depois apareceria várias vezes emqualquer lista de resultados. No entanto, dar ao manipuladorde protocolo inteligência especifica para permitir apenasindexação limitada ajuda a suavizar esse problema.
Essa inteligência especifica pode ser reduzida ba-sicamente a duas regras: (1) se um arquivo-alvo referenciadodentro de um recipiente de arquivos estiver fora do escopode indexação de um serviço de indexação (por exemplo, o ar-quivo está em uma máquina remota que atualmente não está in-dexada), então todas as propriedades intrínsecas e extrínse-cas, bem como todo o conteúdo, são indexados; e (2) se umarquivo-alvo referenciado - dentro de um recipiente de arqui-vos estiver dentro do escopo do serviço de indexação (porexemplo, no sistema de arquivos local), então apenas as pro-priedades extrínsecas do arquivo-alvo associado à lista sãoindexadas. Usando essas duas regras, os itens referenciadosdentro de um recipiente de arquivos que estão fora do escopoda indexação podem ser indexados completamente e serem re-tornados em uma pesquisa. Além disso, com apenas a indexaçãodas propriedades extrínsecas dos arquivos locais, evitam-seresultados de pesquisa duplicados.
As FIGS. 5 e 6 representam dois resultados de pes-quisa ilustrativos 502, 602 com base nas pesquisas do siste-ma de arquivos 201. Os resultados de pesquisa exibidos nesteexemplo representam meramente um método ilustrativo de apre-sentação dos resultados de pesquisa. Não há a menor intençãode limitar a invenção à tela exibida. Para cada resultado,foi entrada uma pesquisa na caixa de pesquisa 501. A primei-ra pesquisa, "must read", pesquisa os arquivos e itens jáindexados por um serviço de indexação. Alguns dos arquivos505 referenciados pela lista "Big Client Docs.list", conten-do notas extrinsecas incluindo a frase "must read", são lis-tados nos resultados de pesquisa 502. Além disso, alguns dosarquivos 506 armazenados em "Archived Files.zip" são lista-dos, pois contêm "must read", seja no nome de arquivo ou emoutro lugar em seu conteúdo.
Os resultados de pesquisa 602 pesquisam por arqui-vos em que a propriedade intrínseca "autor" está definidacomo "John Doe". Novamente, deve-se notar que a sintaxe daconsulta de pesquisa e a disposição dos resultados são mera-mente para fins ilustrativos. Por autor ser uma propriedadeintrínseca dos arquivos referenciados pela lista "Big ClientDocs.list", apenas os arquivos referenciados que não estãono sistema de arquivos local são indexados com base nessapropriedade. Como tal, a Base de Dados Sales de arquivos re-motos 606, aparentemente tendo John Doe como autor, aparecesob a lista 605. Os arquivos "foo.doc" e "BizDev.doc" 607também aparecem nos resultados de pesquisa, não por seremreferenciados pela lista, mas sim pelo fato de os arquivosreais terem sido indexados e terem como autor John Doe. Comoarquivos referenciados localmente, os dois arquivos 607 nãoaparecem como resultados de pesquisa em suas capacidades co-mo membros da lista, pois não foram indexados com base emsuas propriedades intrínsecas.
Dessa forma, nenhum arquivo é duplicado desneces-sariamente em um conjunto de resultados de pesquisa. De modosimilar, os arquivos que se encontram fora do escopo normalde uma pesquisa podem ser incluídos completamente nos resul-tados de pesquisa por mera referência a eles em uma lista ououtro recipiente de arquivos.
A Figura 7 é um fluxograma que ilustra um métodopara indexar arquivos, incluindo recipientes de arquivo. Asetapas exibidas apresentam um exemplo ilustrativo de reali-zação do método, entretanto, métodos alternativos podem en-quadrar-se no âmbito e espírito das reivindicações. As eta-pas podem ser combinada ou dividias, adicionadas ou removi-das. Essas etapas podem ser realizadas por qualquer programade pesquisa ou serviço de indexação no computador 110, ourodando remotamente para esse propósito.
Na etapa 701, um primeiro arquivo é avaliado paraindexação, com base no tipo do arquivo. Um IFilter apropria-do pode ser selecionado para indexar o arquivo, se necessá-rio. Por exemplo, se o arquivo for um documento do Word, en-tão o código que constitui um IFilter do Word (ou código si-milar) pode ser selecionado para acessar o arquivo. De modosimilar, se o arquivo a ser avaliado for um arquivo de lis-ta, então um IFilter de lista pode ser selecionado. Na deci-são 702, é determinado se o arquivo de interesse é uma refe-rência para um arquivo, ou um arquivo real. Se o arquivo nãofor uma referência, então na etapa 703 o arquivo é acessado,e suas propriedades extrinsecas, propriedades intrínsecas econteúdo são indexados conforme necessário. Alguns arquivos(por exemplo, arquivos de programa, arquivos de imagem, ou-tros arquivos puramente binários) podem não conter conteúdoa ser indexado e podem não conter nenhuma propriedade ex-trínseca. Tais arquivos podem simplesmente ter suas proprie-dades intrínsecas indexadas, e podem até mesmo dispensar có-digo especial na forma de um IFilter para serem acessados.
Os arquivos com conteúdo para indexação podem conter entãoconteúdo relevante extraído e avaliado para fins de indexa-ção e/ou pesquisa.
Se o arquivo for uma referência de arquivo, entãona decisão 704 é determinado se o arquivo ao qual aponta areferência é um arquivo fora do escopo normal de indexação.
Neste caso, então na etapa 703 o arquivo é totalmente inde-xado. Se, entretanto, o alvo da referência de arquivo for umarquivo local dentro do escopo, então na etapa 705, as pro-priedades extrinsecas da referência de arquivo (caso haja)são meramente indexadas, dessa forma, a referência apareceráapenas nos resultados de pesquisa quando suas propriedadesextrinsecas corresponderem à pesquisa. Na decisão 706, é de-terminado se o arquivo é um recipiente de arquivos, como umarquivo de lista ou um arquivo zip. Neste caso, o processo éentão repetido para cada um dos arquivos e/ou referências dearquivo dentro do recipiente, começando pela etapa 701. Se oarquivo não for um recipiente (ou se o recipiente estivervazio), então na decisão 708, determina-se se ainda existealgum arquivo a ser indexado. Neste caso, esses arquivos sãoentão percorridos pelo processo, começando na etapa 701. Noentanto, se não houver arquivos adicionais a serem indexadosdessa forma, então o método termina.
Conclusão
A presente matéria foi descrita em termos de con-cretizações ilustrativas e exemplificativas. Deve-se enten-der que a presente matéria definida nas reivindicações ane-xas não se limita necessariamente aos aspectos ou procedi-mentos específicos descritos acima. Em vez disso, os aspec-tos e procedimentos descritos acima são revelados como for-mas exemplificativas de se implementar as reivindicações.

Claims (20)

1. Método implementado por computador para indexaro conteúdo de um recipiente de arquivos, o método sendoCARACTERIZADO por compreender as etapas de:acessar itens dentro de um recipiente de arquivos;epara cada item dentro do recipiente de arquivos:determinar se o item é uma referência de arquivode um arquivo-alvo;em resposta a se o item for uma referência de ar-quivo, determinar se o arquivo-alvo da referência de arquivoestá dentro de um escopo de indexação;em resposta a se o arquivo-alvo estiver dentro doescopo, indexar as propriedades extrinsecas da referência dearquivo; eem resposta a se o arquivo-alvo estiver fora doescopo, indexar as propriedades intrínsecas e extrinsecas eo conteúdo do arquivo-alvo.
2. Método implementado por computador, de acordocom a reivindicação 1, CARACTERIZADO por adicionalmente com-preender a etapa de:indexar as propriedades intrínsecas e extrinsecase o conteúdo do recipiente de arquivos.
3. Método implementado por computador, de acordocom a reivindicação 2, CARACTERIZADO pelo fato de que inde-xar as propriedades e o conteúdo do recipiente de arquivoscompreende usar um IFilter.
4. Método implementado por computador, de acordocom a reivindicação 1, CARACTERIZADO pelo fato de que deter-minar se o arquivo-alvo está dentro do escopo de indexaçãocompreende determinar uma localização do arquivo-alvo.
5. Método implementado por computador, de acordocom a reivindicação 1, CARACTERIZADO pelo fato de que aces-sar itens dentro do recipiente de arquivos compreende usarum manipulador de protocolo.
6. Método implementado por computador, de acordocom a reivindicação 1, CARACTERIZADO pelo fato de que o re-cipiente de arquivos compreende um arquivo de lista.
7. Método implementado por computador, de acordocom a reivindicação 1, CARACTERIZADO pelo fato de que o re-cipiente de arquivos compreende pelo menos um arquivo deformato zip, um arquivo de formato gabinete e um arquivo deformato arquivo em fita.
8. Método implementado por computador, de acordocom a reivindicação 1, CARACTERIZADO pelo fato de que aspropriedades extrinsecas compreendem notas de entrada do u-suário sobre a referência de arquivo.
9. Sistema para indexação do conteúdo de uma ex-tensão de espaço para nome do shell, CARACTERIZADO por com-preender:uma memória, para armazenamento de instruções ele-trônicas; um armazenamento, para armazenamento de uma multi-plicidade de arquivos; eum processador, configurado para aceitar as ins-truções eletrônicas e realizar as etapas de:indexar a multiplicidade de arquivos;encontrar um arquivo dentre a multiplicidade dearquivos, em que o arquivo contém pelo menos uma referênciade arquivo; eacessar o arquivo como uma extensão de espaço paranome do shell para indexar a pelo menos uma referência dearquivo.
10. Sistema, de acordo com a reivindicação 9,CARACTERIZADO pelo fato de que o processador é adicionalmen-te configurado para realizar as etapas de:para cada referência de arquivo dentro do arquivo:determinar se a referência de arquivo se refere aum arquivo-alvo dentro do escopo de indexação;em resposta a se o arquivo-alvo estiver dentro doescopo, indexar as propriedades extrinsecas da referência dearquivo;e em resposta a se o arquivo-alvo estiver fora doescopo, indexar o conteúdo do arquivo-alvo.
11. Sistema, de acordo com a reivindicação 10,CARACTERIZADO pelo fato de que as propriedades extrinsecascompreendem comentários inseridos por um usuário.
12. Sistema, de acordo com a reivindicação 10,CARACTERIZADO pelo fato de que determinar se a referência dearquivo se refere a um arquivo-alvo dentro do escopo da in-dexação compreende determinar uma localização do arquivo-alvo.
13. Sistema, de acordo com a reivindicação 9,CARACTERIZADO pelo fato de que acessar o arquivo como umaextensão de espaço para nome do shell compreende acessar oarquivo usando um manipulador de protocolo.
14. Sistema, de acordo com a reivindicação 9,CARACTERIZADO pelo fato de que o recipiente de arquivos com-preende um arquivo de lista.
15. Sistema, de acordo com a reivindicação 9,CARACTERIZADO pelo fato de que o recipiente de arquivos com-preende pelo menos um arquivo de formato zip, um arquivo deformato gabinete e um arquivo de formato arquivo em fita.
16. Meio legível por computador armazenando ins-truções para controlar um computador, as instruções sendoCARACTERIZADAS por compreender:indexar um arquivo dentre uma multiplicidade dearquivos, em que o arquivo inclui pelo menos uma referênciade arquivo;acessar o arquivo para indexar a pelo menos umareferência de arquivo; epara cada referência de arquivo dentro do arquivo:determinar se a referência de arquivo se refere aum arquivo-alvo dentro da multiplicidade de arquivos;em resposta a se o arquivo-alvo estiver dentro damultiplicidade de arquivos, não indexar as propriedades in-trínsecas da referência de arquivo e não indexar o conteúdodo arquivo-alvo; eem resposta a se o arquivo-alvo estiver fora damultiplicidade de arquivos, indexar as propriedades intrín-secas, as propriedades extrínsecas e o conteúdo do arquivo-alvo.
17. Meio legível por computador, de acordo com areivindicação 16, CARACTERIZADO pelo fato de que acessar oarquivo compreende usar um manipulador de protocolo.
18. Meio legível por computador, de acordo com areivindicação 17, CARACTERIZADO pelo fato de que acessar oarquivo compreende criar uma extensão de espaço para nome doshell.
19. Meio legível por computador, de acordo com areivindicação 16, CARACTERIZADO pelo fato de que o arquivocompreende um formato de arquivo de lista.
20. Meio legível por computador, de acordo com areivindicação 16, CARACTERIZADO pelo fato de que o arquivocompreende pelo menos um dentre um formato zip, um formatogabinete e um formato arquivo em fita.
BRPI0613523-4A 2005-07-15 2006-06-30 Indexação e pesquisa inteligente em recipientes BRPI0613523B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US11/181,996 US7630999B2 (en) 2005-07-15 2005-07-15 Intelligent container index and search
US11/181.996 2005-07-15
US11/181,996 2005-07-15
PCT/US2006/026171 WO2007011527A2 (en) 2005-07-15 2006-06-30 Intelligent container index and search

Publications (3)

Publication Number Publication Date
BRPI0613523A2 true BRPI0613523A2 (pt) 2011-01-18
BRPI0613523A8 BRPI0613523A8 (pt) 2016-11-16
BRPI0613523B1 BRPI0613523B1 (pt) 2019-02-12

Family

ID=37662832

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0613523-4A BRPI0613523B1 (pt) 2005-07-15 2006-06-30 Indexação e pesquisa inteligente em recipientes

Country Status (8)

Country Link
US (3) US7630999B2 (pt)
KR (1) KR101343165B1 (pt)
CN (1) CN101223517B (pt)
BR (1) BRPI0613523B1 (pt)
MX (1) MX2008000520A (pt)
RU (1) RU2417419C2 (pt)
TW (1) TWI399654B (pt)
WO (1) WO2007011527A2 (pt)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070244861A1 (en) * 2006-04-13 2007-10-18 Tony Malandain Knowledge management tool
US7873625B2 (en) * 2006-09-18 2011-01-18 International Business Machines Corporation File indexing framework and symbolic name maintenance framework
US7490077B2 (en) * 2006-09-28 2009-02-10 International Business Machines Corporation Extensible dependency management framework and method
US20080294492A1 (en) * 2007-05-24 2008-11-27 Irina Simpson Proactively determining potential evidence issues for custodial systems in active litigation
US7725454B2 (en) * 2007-07-20 2010-05-25 Microsoft Corporation Indexing and searching of information including handler chaining
US7849065B2 (en) * 2007-07-20 2010-12-07 Microsoft Corporation Heterogeneous content indexing and searching
US9158493B2 (en) 2007-09-28 2015-10-13 Adobe Systems Incorporated Page description language package file preview
US8677229B2 (en) * 2007-09-28 2014-03-18 Adobe Systems Incorporated Presentation of files packaged within a page description language document
US8572043B2 (en) 2007-12-20 2013-10-29 International Business Machines Corporation Method and system for storage of unstructured data for electronic discovery in external data stores
US8112406B2 (en) 2007-12-21 2012-02-07 International Business Machines Corporation Method and apparatus for electronic data discovery
US8140494B2 (en) * 2008-01-21 2012-03-20 International Business Machines Corporation Providing collection transparency information to an end user to achieve a guaranteed quality document search and production in electronic data discovery
US9448976B2 (en) 2008-05-20 2016-09-20 Adobe Systems Incorporated Package file presentation including reference content
US8732581B2 (en) 2008-05-20 2014-05-20 Adobe Systems Incorporated Package file presentation
US9946692B2 (en) 2008-05-20 2018-04-17 Adobe Systems Incorporated Package file presentation
US8479087B2 (en) * 2008-05-20 2013-07-02 Adobe Systems Incorporated Authoring package files
US8275720B2 (en) 2008-06-12 2012-09-25 International Business Machines Corporation External scoping sources to determine affected people, systems, and classes of information in legal matters
US9830563B2 (en) 2008-06-27 2017-11-28 International Business Machines Corporation System and method for managing legal obligations for data
US8079065B2 (en) * 2008-06-27 2011-12-13 Microsoft Corporation Indexing encrypted files by impersonating users
US8327384B2 (en) 2008-06-30 2012-12-04 International Business Machines Corporation Event driven disposition
US8484069B2 (en) 2008-06-30 2013-07-09 International Business Machines Corporation Forecasting discovery costs based on complex and incomplete facts
US8515924B2 (en) 2008-06-30 2013-08-20 International Business Machines Corporation Method and apparatus for handling edge-cases of event-driven disposition
US8073729B2 (en) 2008-09-30 2011-12-06 International Business Machines Corporation Forecasting discovery costs based on interpolation of historic event patterns
US8489439B2 (en) 2008-06-30 2013-07-16 International Business Machines Corporation Forecasting discovery costs based on complex and incomplete facts
US8204869B2 (en) * 2008-09-30 2012-06-19 International Business Machines Corporation Method and apparatus to define and justify policy requirements using a legal reference library
US8818959B2 (en) 2008-12-02 2014-08-26 Adobe Systems Incorporated Virtual embedding of files in documents
US8938467B2 (en) 2009-03-25 2015-01-20 Eloy Technology, Llc System and method for intelligent storage of time shifted content
EP2465246B1 (en) * 2009-08-12 2017-04-19 Google Technology Holdings LLC Layered protection and validation of identity data delivered online via multiple intermediate clients
US20110040600A1 (en) * 2009-08-17 2011-02-17 Deidre Paknad E-discovery decision support
US8332748B1 (en) * 2009-10-22 2012-12-11 Google Inc. Multi-directional auto-complete menu
US8250041B2 (en) 2009-12-22 2012-08-21 International Business Machines Corporation Method and apparatus for propagation of file plans from enterprise retention management applications to records management systems
US8655856B2 (en) 2009-12-22 2014-02-18 International Business Machines Corporation Method and apparatus for policy distribution
US8832148B2 (en) 2010-06-29 2014-09-09 International Business Machines Corporation Enterprise evidence repository
US8566903B2 (en) 2010-06-29 2013-10-22 International Business Machines Corporation Enterprise evidence repository providing access control to collected artifacts
US8402359B1 (en) 2010-06-30 2013-03-19 International Business Machines Corporation Method and apparatus for managing recent activity navigation in web applications
US9122660B2 (en) 2011-03-21 2015-09-01 Adobe Systems Incorporated Presentation overlays to modify presentations of packaged files
US8584167B2 (en) 2011-05-31 2013-11-12 Echostar Technologies L.L.C. Electronic programming guides combining stored content information and content provider schedule information
US8627349B2 (en) 2011-08-23 2014-01-07 Echostar Technologies L.L.C. User interface
US9621946B2 (en) 2011-08-23 2017-04-11 Echostar Technologies L.L.C. Frequency content sort
US8437622B2 (en) 2011-08-23 2013-05-07 Echostar Technologies L.L.C. Altering presentation of received content based on use of closed captioning elements as reference locations
US8660412B2 (en) 2011-08-23 2014-02-25 Echostar Technologies L.L.C. System and method for dynamically adjusting recording parameters
US9357159B2 (en) 2011-08-23 2016-05-31 Echostar Technologies L.L.C. Grouping and presenting content
US8447170B2 (en) 2011-08-23 2013-05-21 Echostar Technologies L.L.C. Automatically recording supplemental content
US8763027B2 (en) 2011-08-23 2014-06-24 Echostar Technologies L.L.C. Recording additional channels of a shared multi-channel transmitter
US8959566B2 (en) * 2011-08-23 2015-02-17 Echostar Technologies L.L.C. Storing and reading multiplexed content
US9185331B2 (en) 2011-08-23 2015-11-10 Echostar Technologies L.L.C. Storing multiple instances of content
US8819722B2 (en) 2012-03-15 2014-08-26 Echostar Technologies L.L.C. Smartcard encryption cycling
US9489981B2 (en) 2012-03-15 2016-11-08 Echostar Technologies L.L.C. Successive initialization of television channel recording
US8989562B2 (en) 2012-03-15 2015-03-24 Echostar Technologies L.L.C. Facilitating concurrent recording of multiple television channels
US8959544B2 (en) 2012-03-15 2015-02-17 Echostar Technologies L.L.C. Descrambling of multiple television channels
US9774676B2 (en) 2012-05-21 2017-09-26 Google Inc. Storing and moving data in a distributed storage system
US9298576B2 (en) 2012-06-04 2016-03-29 Google Inc. Collecting processor usage statistics
US9195611B2 (en) 2012-06-04 2015-11-24 Google Inc. Efficiently updating and deleting data in a data storage system
US9449006B2 (en) * 2012-06-04 2016-09-20 Google Inc. Method and system for deleting obsolete files from a file system
US9659038B2 (en) 2012-06-04 2017-05-23 Google Inc. Efficient snapshot read of a database in a distributed storage system
WO2013184712A2 (en) 2012-06-04 2013-12-12 Google Inc. Systems and methods of increasing database access concurrency using granular timestamps
US9230000B1 (en) 2012-06-04 2016-01-05 Google Inc. Pipelining Paxos state machines
US9135030B2 (en) * 2012-06-29 2015-09-15 M-Files Oy Method, an apparatus and a computer program product for extending an application in a client device
WO2014010082A1 (ja) * 2012-07-13 2014-01-16 株式会社日立ソリューションズ 検索装置、検索装置の制御方法及び記録媒体
US8793724B2 (en) 2012-11-08 2014-07-29 Eldon Technology Limited Image domain compliance
US9166866B2 (en) * 2013-04-30 2015-10-20 Microsoft Technology Licensing, Llc Hydration and dehydration with placeholders
US9405767B2 (en) 2013-05-01 2016-08-02 Microsoft Technology Licensing, Llc Streaming content and placeholders
US9628838B2 (en) 2013-10-01 2017-04-18 Echostar Technologies L.L.C. Satellite-based content targeting
WO2015052690A1 (en) * 2013-10-10 2015-04-16 Yandex Europe Ag Methods and systems for indexing references to documents of a database and for locating documents in the database
US10049329B2 (en) 2014-05-30 2018-08-14 Amadeus S.A.S. Content exchange with a travel management system
FR3021788B1 (fr) * 2014-05-30 2023-07-21 Amadeus Sas Procede et systeme d'acces de contenu
US10042871B2 (en) 2014-05-30 2018-08-07 Amadeaus S.A.S. Content management in a travel management system
FR3021787B1 (fr) * 2014-05-30 2023-08-18 Amadeus Sas Systeme de gestion de contenu
US9756378B2 (en) 2015-01-07 2017-09-05 Echostar Technologies L.L.C. Single file PVR per service ID
CN105160269A (zh) * 2015-08-13 2015-12-16 浪潮电子信息产业股份有限公司 一种Docker容器内数据的访问方法及装置
RU2636702C1 (ru) 2016-07-07 2017-11-27 Общество С Ограниченной Ответственностью "Яндекс" Способ и устройство для выбора сетевого ресурса в качестве источника содержимого для системы рекомендаций
TWI622890B (zh) * 2016-12-29 2018-05-01 慧榮科技股份有限公司 建立多重命名空間方法與存取多重命名空間的資料的方法
TWI602074B (zh) 2016-12-29 2017-10-11 慧榮科技股份有限公司 建立多重命名空間方法與存取多重命名空間的資料的方法
USD882600S1 (en) 2017-01-13 2020-04-28 Yandex Europe Ag Display screen with graphical user interface
EP3633475A4 (en) * 2017-05-25 2020-05-13 LSIS Co., Ltd. METHOD FOR EXECUTING A CONTROL PROGRAM
RU2720952C2 (ru) 2018-09-14 2020-05-15 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания рекомендации цифрового содержимого
RU2720899C2 (ru) 2018-09-14 2020-05-14 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для определения зависящих от пользователя пропорций содержимого для рекомендации
RU2714594C1 (ru) 2018-09-14 2020-02-18 Общество С Ограниченной Ответственностью "Яндекс" Способ и система определения параметра релевантность для элементов содержимого
RU2725659C2 (ru) * 2018-10-08 2020-07-03 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для оценивания данных о взаимодействиях пользователь-элемент
RU2731335C2 (ru) 2018-10-09 2020-09-01 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для формирования рекомендаций цифрового контента
RU2757406C1 (ru) 2019-09-09 2021-10-15 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для обеспечения уровня сервиса при рекламе элемента контента
US11308280B2 (en) 2020-01-21 2022-04-19 International Business Machines Corporation Capture and search of virtual machine application properties using log analysis techniques
CN117216006A (zh) * 2023-11-07 2023-12-12 国网信息通信产业集团有限公司 文件内容的检索方法、装置、存储介质和电子设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5572729A (en) * 1994-01-11 1996-11-05 Sun Microsystems, Inc. Method for stateless rename propagation between hierarchical file name spaces
US6038610A (en) * 1996-07-17 2000-03-14 Microsoft Corporation Storage of sitemaps at server sites for holding information regarding content
US6834276B1 (en) * 1999-02-25 2004-12-21 Integrated Data Control, Inc. Database system and method for data acquisition and perusal
CN1458599A (zh) * 2003-04-15 2003-11-26 刘彬 新型网页信息在线收集管理系统及方案
CN1549155A (zh) * 2003-05-14 2004-11-24 魏 茹 基于网页的用于文件展示与操作的动态书
US7373514B2 (en) * 2003-07-23 2008-05-13 Intel Corporation High-performance hashing system
US20050086225A1 (en) * 2003-10-15 2005-04-21 Xiaoming Cheng Apparatus and method for searching a directory of stored items
US8165998B2 (en) * 2004-05-14 2012-04-24 Sap Ag Fast comparison using multi-level version format

Also Published As

Publication number Publication date
US7953745B2 (en) 2011-05-31
CN101223517B (zh) 2010-05-19
MX2008000520A (es) 2008-03-06
TWI399654B (zh) 2013-06-21
CN101223517A (zh) 2008-07-16
TW200712949A (en) 2007-04-01
WO2007011527A2 (en) 2007-01-25
RU2417419C2 (ru) 2011-04-27
US7630999B2 (en) 2009-12-08
US20070016546A1 (en) 2007-01-18
KR101343165B1 (ko) 2013-12-19
US20100057808A1 (en) 2010-03-04
RU2008101529A (ru) 2009-07-20
US20110282882A1 (en) 2011-11-17
BRPI0613523A8 (pt) 2016-11-16
KR20080033945A (ko) 2008-04-17
WO2007011527A3 (en) 2007-12-13
BRPI0613523B1 (pt) 2019-02-12
US8117232B2 (en) 2012-02-14

Similar Documents

Publication Publication Date Title
BRPI0613523A2 (pt) indexação e pesquisa inteligente em recipientes
US8661064B2 (en) File management system
US7370061B2 (en) Method for querying XML documents using a weighted navigational index
US7865873B1 (en) Browser-based system and method for defining and manipulating expressions
US7072983B1 (en) Scheme for systemically registering meta-data with respect to various types of data
JP4944008B2 (ja) ファイルシステム内での効率的なファイルコンテンツをサーチするためのシステム、方法及びコンピュータアクセス可能な記録媒体
CA2501667C (en) System and method for managing data using static lists
US20210109976A1 (en) System, method and computer program product for protecting derived metadata when updating records within a search engine
JP2011065546A (ja) ファイル検索システム及びプログラム
KR20220154717A (ko) 파일 시스템 디렉터리 트리 또는 객체 저장 버킷을 기반으로 하는 커스텀 메타데이터 태그 상속
KR101272656B1 (ko) 태그 기반 파일 관리 방법 및 그 시스템
CN107103023B (zh) 使用自动生成的存储层级组织电子存储的文件
Chang et al. Knowledge File System--A Principled Approach to Personal Information Management
Archer et al. Capturing and reusing human attention in corporate decision making
Aggarwal High Performance Document Store Implementation in Rust
Yang CASH: a category-based file management system
Fogelberg An object-oriented database for advanced searches of file systems based on metadata
Christmas The Cricket-Tracking Project: a case study
Stevenson Data on data

Legal Events

Date Code Title Description
B25A Requested transfer of rights approved

Owner name: MICROSOFT TECHNOLOGY LICENSING, LLC (US)

B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 12/02/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 12/02/2019, OBSERVADAS AS CONDICOES LEGAIS

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 16A ANUIDADE.

B24J Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12)

Free format text: EM VIRTUDE DA EXTINCAO PUBLICADA NA RPI 2677 DE 26-04-2022 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDA A EXTINCAO DA PATENTE E SEUS CERTIFICADOS, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.