BRPI0606259B1 - Sistema de recuperação de informação e método - Google Patents

Sistema de recuperação de informação e método Download PDF

Info

Publication number
BRPI0606259B1
BRPI0606259B1 BRPI0606259-8A BRPI0606259A BRPI0606259B1 BR PI0606259 B1 BRPI0606259 B1 BR PI0606259B1 BR PI0606259 A BRPI0606259 A BR PI0606259A BR PI0606259 B1 BRPI0606259 B1 BR PI0606259B1
Authority
BR
Brazil
Prior art keywords
load
documents
servers
monitor
database
Prior art date
Application number
BRPI0606259-8A
Other languages
English (en)
Inventor
Mark A. Bluhm
Jon Verreaux
Original Assignee
Thomson Global Resources
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Global Resources filed Critical Thomson Global Resources
Publication of BRPI0606259A2 publication Critical patent/BRPI0606259A2/pt
Publication of BRPI0606259B1 publication Critical patent/BRPI0606259B1/pt

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

sistema de recuperação de informação, método e estrutura de dados. os presentes inventores conceberam um ou mais sistemas, métodos e suportes lógicos para carregamento distribuído de sistemas de recuperação de informação. um sistema exemplar inclui dois ou mais (pelo menos dois) servidores monitores de carga que não somente monitoram e garantem a conclusão de tarefas de carregamento por servidores de carga individuais em um conjunto de dois ou mais servidores de carga, mas também permitem que um monitor de carga monitore o desempenho de um outro. além do mais, o sistema exemplar provê uma estrutura de dados de acordo de nível de serviço (sla) para cada servidor de carga. a estrutura de dados sla governa quais tipos e níveis de prioridade de tarefas de carregamento serão realizados por períodos de tempo pré-determinados.

Description

SISTEMA DE RECUPERAÇÃO DE INFORMAÇÃO E MÉTODO
PEDIDO RELACIONADO
O presente pedido reivindica prioridade do pedido provisório US 60/642.351 que foi depositado em 7 de janeiro de 2005 e que é aqui incorporado pela referência.
CAMPO TÉCNICO
Várias modalidades da presente invenção dizem respeito à recuperação de informação, particularmente a sistemas, métodos e suporte lógico para carregar dados em bases de dados.
ANTECEDENTES DA INVENÇÃO
Um problema reconhecido pelos presentes inventores diz respeito ao carregamento de novos documentos em um sistema de recuperação de informação em linha. No geral, o carregamento implica na indexação de documentos para facilitar a pesquisa usando algoritmos de busca de linguagem booleana ou natural e, então, na adição dos documentos e dos dados de índice correspondentes em uma base de dados e arquivo de índice existentes.
Convencionalmente, um servidor grande e oneroso, tais como um Sun Microsystems 6500 ou 6800, foi adquirido e programado para servir especificamente as necessidades de carregamento de um dado conjunto de bases de dados ou coleções. Infelizmente, a confiabilidade de um único servidor torna o sistema vulnerável aos maus funcionamentos ou travamentos do servidor durante o processo de carregamento. Em muitos exemplos, um travamento necessita do re-carregamento da íntegra da quantidade de dados e, em última análise,
Petição 870180131294, de 17/09/2018, pág. 6/28 atrasa a adição e, assim, o acesso do usuário ou assinante a novos documentos. Tais atrasos são particularmente significativos para dados urgentes tais como decisões da Suprema Corte dos EUA ou notícias de última hora.
Dessa maneira, os inventores reconheceram uma necessidade de melhores maneiras de carregar bases de dados em sistema de recuperação de informação em linha.
SUMÁRIO DA INVENÇÃO
Para atender estas e/ou outras necessidades, os presentes inventores conceberam um ou mais sistemas, métodos e suporte lógico para distribuir carregamento de sistemas de recuperação de informação. Em um sistema exemplar, domínios de carga distribuídos organizam e coordenam logicamente a operação de múltiplos servidores de carga para satisfazer as necessidades de capacidade de carga de um conjunto de uma ou mais bases de dados. Os sistemas exemplares incluem dois ou mais (pelo menos dois) servidores monitores de carga que não somente monitoram e garantem a conclusão das tarefas de carga por servidores de carga individuais, mas também provêem um monitor de carga para monitorar o desempenho de um outro. Além do mais, o sistema exemplar provê uma estrutura de dados de acordo de nível de serviço (SLA) para cada servidor de carga. A estrutura de dados SLA governa quais tipos e níveis de prioridade de tarefas de carregamento serão desempenhados por períodos de tempo predeterminados.
DESCRIÇÃO RESUMIDA DOS DESENHOS
A figura 1 é um diagrama em blocos de um sistema de recuperação de informação exemplar 100 que corresponde a
Petição 870180131294, de 17/09/2018, pág. 7/28 uma ou mais modalidades da invenção.
A figura 2 é um diagrama em blocos de um método exemplar que corresponde a uma ou mais modalidades da invenção.
DESCRIÇÃO_____DETALHADA_____DA(S)_____MODALIDADE (S) EXEMPLAR(S)
Esta descrição, que incorpora as figuras e reivindicações, descreve uma ou mais modalidades específicas de uma invenção. Estas modalidades, oferecidas não para limitar, mas somente para exemplificar e preceituar a invenção, são mostradas e descritas com detalhes suficientes para permitir que os versados na técnica implementem ou pratiquem a invenção. Assim, onde for apropriado evitar obscurecer a invenção, a descrição pode omitir certas informações conhecidas pelos versados na técnica.
SISTEMA DE RECUPERAÇÃO DE INFORMAÇÃO EXEMPLAR
A figura 1 mostra um sistema de recuperação de informação exemplar 100 que incorpora os preceitos da presente invenção. O sistema 100 inclui uma base de dados de chegada 110, um domínio de carga 120, uma base de dados primária 130 e uma base de dados secundária 140.
A base de dados de chegada 110 recebe e armazena arquivos novos ou atualizados para adição no sistema 100 ou na base de dados primária 130. Na modalidade exemplar, a base de dados de chegada 110 toma a forma de um dispositivo de armazenamento acessível em rede (NAS) e recebe e armazena arquivos em um formato de linguagem extensível de formatação (XML). Os arquivos incluem documentos com uma informação de
Petição 870180131294, de 17/09/2018, pág. 8/28 cabeçalho tipo conjunto de instruções de comando que inclui um identificador de documento globalmente exclusivo e um comando de base de dados, tais como um adicionar ou apagar.
O domínio de carga 120 inclui um conjunto de um ou mais servidores de carga 122, um conjunto de dois ou mais servidores monitores de carga 124, um conjunto de um ou mais servidores de distribuição 126, uma fila de carga 128 e um diretório compartilhado 129. Na modalidade exemplar, cada um dos servidores está logicamente associado com um domínio de carga que é associado com uma ou mais coleções ou bases de dados de documentos, tal como a base de dados primária 130. (Na modalidade exemplar, um domínio de carga inclui uma ou mais caixas de carga que têm acesso compartilhado em um arquivo de chegada e de índice de carga. Qualquer caixa de carga em um domínio de carga pode servir qualquer coleção que seja parte daquele domínio de carga.)
Os servidores 122, 124 e 126 incluem módulos de processamento respectivos 1221, 1241 e 1261 e módulos de memória respectivos 1222, 1242 e 1262. Cada um dos módulos de processamento inclui um ou mais processadores ou circuitos de processamento, por exemplo, processadores duais. E, cada um dos módulos de memória inclui instruções executáveis por máquina (suporte lógico (SW)) para fazer com que os respectivos módulos de processamento realizem atos conforme descrito a seguir na seção do método exemplar. Além do mais, na modalidade exemplar, cada um dos servidores inclui as instruções de cada um dos outros servidores permitindo, por exemplo, que um servidor de carga (LS) seja facilmente ope
Petição 870180131294, de 17/09/2018, pág. 9/28 rado como um servidor monitor de carga (LM) ou um servidor de distribuição (DS) . (Em algumas modalidades, cada um dos servidores é implementado como uma folha de servidor, isto é, uma placa de circuito única populada com componentes tais como processadores, memória e conexões de rede que são usualmente encontrados em múltiplas placas. Folhas de servidor são mais baratas, menores e consomem menos energia que servidores tradicionais baseados em caixa usados em outras modalidades.)
Adicionalmente, cada um dos servidores de carga 122 inclui ou é associado com uma estrutura de dados de acordo de nível de serviço (SLA) que governa o contexto operacional do servidor de carga. A estrutura de dados SLA 1223, que é representativa, inclui um campo cliente 1223A para indicar a quais bases de dados ou coleções de base de dados a solicitação de carga ou outro trabalho a ser aceito pelo servidor de carga associado devem fazer parte; um campo de prioridade 1223B para indicar uma prioridade mínima das solicitações de carga ou outro trabalho a ser aceito pelo servidor de carga associado; e um indicador temporal 1223C para indicar aspectos temporais relacionados do acordo de nível de serviço, tal como o período efetivo ou duração do acordo. Algumas modalidades provêem duas estruturas de dados SLA, uma permanente e uma temporária, com a temporária tendo uma vida que expira depois de um período predeterminado de tempo e permite que a estrutura de dados SLA anterior se renomeie automaticamente. Assim, por exemplo, um usuário que usa uma GUI (interface gráfica de usuário) não mostrada pode
Petição 870180131294, de 17/09/2018, pág. 10/28 estabelecer um ou mais dos servidores de carga como dedicado para lidar com as solicitações de carga para uma base de dados específica, tal como a Suprema Corte dos EUA, ou para lidar com a solicitação de uma prioridade específica mínima. O SLA fica em vigor por diversas horas, dias, semanas ou mesmo mais tempo antes de expirar automaticamente e permitir a renomeação do SLA anterior.
Em algumas modalidades, cada servidor monitor de carga 124 opera usando os seguintes parâmetros:
Distributed_Load_Shared_Directory identifica o caminho para o diretório compartilhado onde informação tipo freqüência é escrita pelos monitores de carga; Distributed_Load_Directory_Monitor_Interval, por exemplo, 300.000 milissegundos, denota a quantidade de tempo em milissegundos antes que o monitor de carga não ativo ou secundário verifique novamente a plataforma de chegada com relação a novas solicitações;
Distributed_Load_Working_File_Monitor_Interval, por exemplo, 300.000 milissegundos, denota a quantidade de tempo antes que o monitor de carga não ativo verifique novamente o tempo de modificação do arquivo de trabalho;
Distributed_Load_Completed_Requests_Monitor_Interval, por exemplo, 300.000 milissegundos, denota a quantidade de tempo em milissegundos antes que o monitor de carga não ativo verifique novamente a fila de carga 128 com relação a solicitações completas.
A fila de carga 128 provê uma função de fila para
Petição 870180131294, de 17/09/2018, pág. 11/28 uso no gerenciamento do fluxo de trabalho do domínio de carga. Na modalidade exemplar, a fila é acessível pelos servidores 122, 124 e 126.
O diretório compartilhado 129 funciona como um intermediário de comunicações, que é acessível a outros componentes ou servidores no domínio de carga, tais como todos os outros monitores de carga no domínio de carga 120. Na modalidade exemplar, o diretório compartilhado é parte de um dispositivo de armazenamento acessível em rede (NAS) e é usado para trocar informação de freqüência de um monitor de carga para um outro conforme descrito a seguir. Em algumas modalidades, o diretório compartilhado pode ser uma parte da base de dados de chegada. (Em algumas modalidades com múltiplos domínios de carga, cada domínio de carga inclui seu próprio conjunto de monitores de carga que incluem seus próprios respectivos diretórios compartilhados.)
A base de dados primária 130 e a base de dados secundária 140 são redundantes ou bases de dados imagem espelho. Em algumas modalidades elas são mantidas em locais separados para reduzir o risco de falha catastrófica. Embora não mostrado na figura, usuários ou assinantes acessam a base de dados primária 130 usando um dispositivo cliente, tal como computador pessoal em uma rede local ou de área ampla.
MÉTODO EXEMPLAR PARA OPERAR UM SISTEMA DE RECUPERAÇÃO DE INFORMAÇÃO
A figura 2 mostra um fluxograma 200 de um método exemplar para operar um sistema de recuperação de informação, tal como o sistema 100 na figura 1. O fluxograma 200
Petição 870180131294, de 17/09/2018, pág. 12/28 inclui blocos 210-270, que são arranjados e descritos em série. Entretanto, outras modalidades executam dois ou mais blocos em paralelo usando múltiplos processadores ou dispositivos tipo processador ou um único processador organizado como duas ou mais máquinas virtuais ou subprocessadores. Outras modalidades também alteram a seqüência de processo ou provêem diferentes partições ou blocos funcionais para alcançar resultados análogos. Além do mais, ainda outras modalidades implementam os blocos como dois ou mais módulos de hardware interconectados com controle relacionado e sinais de dados comunicados entre os módulos e através deles. Assim, o fluxo de processo exemplar se aplica em implementações de suporte lógico, hardware e suporte lógico embarcado.
No bloco 210, o método exemplar começa recebendo um arquivo que contém documentos para adição na base de dados de um sistema de recuperação de informação em linha. Na modalidade exemplar, isto implica na plataforma de chegada 110 recebendo um arquivo XML contendo dois ou mais documentos judiciais, financeiros, de notícia ou científicos. A execução continua no bloco 220.
O bloco 220 implica notificar dois ou mais servidores de carga que novos documentos estão disponíveis para carregar na base de dados. Na modalidade exemplar, isto implica que um dos servidores monitores de carga 124, especificamente um ativo designado ou um primário dos servidores monitores de carga, cheque a plataforma de chegada 110 para determinar ou detectar se novos documentos para uma ou mais coleções ou bases de dados específicas foram adicionados na
Petição 870180131294, de 17/09/2018, pág. 13/28 plataforma de chegada. Se tais documentos foram adicionados na plataforma de chegada, o servidor monitor de carga ativo adiciona dados relacionados ao arquivo na fila de carga 128, e notifica dois ou mais dos servidores de carga 122 em resposta a detectar a recepção do arquivo. Adicionalmente, o servidor monitor de carga ativo escreve ou grava uma mensagem no diretório compartilhado 129, com a mensagem incluindo uma marca de tempo e um identificador de servidor de carga para o servidor monitor de carga ativo (primário). (No mesmo ponto, pelo menos um dos servidores monitores de carga inativos (cópia de segurança ou secundário) irá rever a mensagem e fazer uma determinação se o monitor de carga ativo está funcionando apropriadamente.) Então, a execução avança para o bloco 230.
O bloco 230 implica na indexação dos documentos no arquivo usando um dos servidores de carga notificados. Na modalidade exemplar, cada um dos servidores de carga que está disponível e que tem uma estrutura de dados SLA que o permite processar os documentos no arquivo, acessar a fila de carga e tentar processar os documentos no arquivo; entretanto, somente o primeiro servidor de carga a responder à notificação consegue processar os documentos. Em algumas modalidades, todos os servidores de carga não ocupados no domínio de carga respondem inicialmente à notificação e respectivamente avaliam a conformidade dos arquivos contra sua estrutura de dados SLA somente depois de obter os direitos de processar o novo arquivo. Em outras modalidades, os monitores de carga ativos conhecem as estruturas de dados SLA
Petição 870180131294, de 17/09/2018, pág. 14/28 para cada um dos servidores de carga e somente comunicam adições de fila de carga para aqueles servidores de carga que podem processar os documentos correspondentes. Depois que um dos servidores de carga indexou os documentos e gerou dados de índice correspondentes, ele notifica cada um dos servidores de distribuição 126 que trabalho de distribuição está disponível, por exemplo, transmitindo uma mensagem para aqueles servidores verificarem a fila. Adicionalmente, na modalidade exemplar, o servidor de carga selecionado verifica automaticamente a fila de carga por qualquer novo trabalho de carga. A execução procede para o bloco 240.
O bloco 240 implica em carregar os documentos em uma base de dados acessível a usuário ou assinante. Na modalidade exemplar, isto implica no servidor de carga selecionado no bloco 230 notificar dois ou mais dos servidores de distribuição que dados de índice e arquivos correspondentes estão disponíveis para distribuição. Em resposta, todos os servidores de distribuição não ocupados 128 tentam ganhar os direitos de realizar a distribuição, isto é, carregar os documentos e dados de índice nas partes respectivas da base de dados primária. Entretanto, o primeiro servidor de distribuição a responder à notificação é designado com o trabalho de distribuição. O trabalho de distribuição implica carregar os documentos e dados de índice na base de dados primária 130 e na base de dados secundária 140 ou, mais precisamente, em partes respectivas das bases de dados 130 e 140. Em algumas modalidades, o trabalho de espelhar documentos da base de dados primária 130 para a base de dados secundária 140 é
Petição 870180131294, de 17/09/2018, pág. 15/28 realizado por um servidor separado ou componente de suporte lógico diferente do servidor de distribuição selecionado. Por exemplo, algumas modalidades usam o produto Oracle Data Guard. A execução exemplar continua no bloco 250.
No bloco 250, o servidor selecionado dos servidores de distribuição 126 notifica dois ou mais monitores de carga 126 que os documentos foram carregados na base de dados. Na modalidade exemplar, qualquer monitor de carga inativo ou secundário que receba a notificação ignora a notificação, enquanto que o monitor de carga ativo ou primário procede conforme indicado pelo bloco 260. (Adicionalmente, na modalidade exemplar, o servidor de distribuição selecionado verifica automaticamente a fila de carga por qualquer novo trabalho.)
O bloco 260 implica em confirmar que os documentos foram carregados na base de dados. Na modalidade exemplar, esta confirmação implica no monitor de carga ativo ou primário tentar ler um “fim de arquivo, “fim de carga ou outro indicador análogo da base de dados secundária 140. A leitura com sucesso do indicador é observada como confirmação de que o processo de carregamento iniciado no bloco 210 foi completado, e o monitor de carga primário escreve uma mensagem com marca de tempo no diretório compartilhado indicando a conclusão com sucesso da tarefa de carga. (Algumas modalidades podem ler a base de dados primária por uma indicação se a solicitação de carga foi satisfeita, em vez da base de dados secundária; entretanto, outras modalidades podem ler tanto a base de dados primária quanto a secundária pelo indicador
Petição 870180131294, de 17/09/2018, pág. 16/28 “fim de arquivo. Uma falha na leitura do indicador “fim de arquivo indica uma falha e este estado também é comunicado no diretório compartilhado usando um primeiro monitor dos monitores de carga notificados.
O bloco 270 implica determinar se o monitor de carga primário ou ativo está operando apropriadamente usando um dos monitores de carga secundários ou inativos. Na modalidade exemplar, o monitor de carga secundário revê uma ou mais mensagens no diretório compartilhado para determinar se o monitor de carga primário está operando apropriadamente. Especificamente, o monitor de carga secundário garante que o monitor de carga primário esteja ligado e funcionando (por exemplo, a cada 60 segundos), garante que o primário esteja encontrando todos os novos arquivos adicionados (por exemplo, a cada 5 minutos), e garante que o primário esteja respondendo aos indicadores ou estados de fim de carga. Se qualquer destas condições não for satisfeita, o monitor de carga secundário assume o comando do estado de monitor de carga primário, possivelmente desliga o monitor com falha, inicia o processamento de solicitações de carga e emite um alerta de evento com falha. Uma execução normal continua com o retorno ao bloco 210 para o processamento de solicitações adicionais.
CONCLUSÃO
Pretende-se que as modalidades expostas e as reivindicações somente ilustrem e preceituem uma ou mais maneiras de praticar ou implementar a presente invenção, não restringir sua amplitude ou escopo. O escopo real da invenção,
Petição 870180131294, de 17/09/2018, pág. 17/28 que abrange todas as maneiras de praticar ou implementar os preceitos da invenção, é definido somente pelas reivindicações publicadas e seus equivalentes.

Claims (18)

  1. REIVINDICAÇÕES
    1. Sistema de recuperação de informação, compreendendo :
    uma fila para armazenar solicitações de dados de carga;
    um conjunto de dois ou mais servidores de carga para recuperar dados de uma fila e indexar documentos para recuperação com base nos dados recuperados da fila;
    primeiro e segundo monitores de carga para monitorar a operação dos servidores de carga e prover novos dados na fila acessíveis pelo conjunto de carregadores, com o primeiro monitor de carga configurado para prover informação em relação às suas operações para o segundo monitor de carga, e o segundo monitor de carga configurado para responder para a informação de estado indicando falha do primeiro monitor de carga para assumir o controle da monitoração dos servidores de carga e prover novos dados na fila;
    em que cada servidor de carga é associado com uma estrutura de dados de acordo de nível de serviço, a estrutura de dados incluindo um primeiro campo para indicar uma prioridade mínima das solicitações de indexação de documento que o servidor de carga é permitido aceitar;
    CARACTERIZADO pelo fato de que compreende ainda:
    um segundo campo para identificar para quais bases de dados o servidor de carga é permitido indexar documentos; e um terceiro campo indicando um período de tempo efetivo ou a duração do acordo de nível de serviço.
    Petição 870190028135, de 25/03/2019, pág. 8/14
  2. 2. Sistema, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que para prover informação de estado para o segundo monitor de carga, o primeiro monitor de carga é configurado para escrever periodicamente um relató-
    5 rio com marca de tempo em uma parte predeterminada de um dispositivo de armazenamento acessível em rede e o segundo monitor de carga é configurado para ler o relatório com marca de tempo no dispositivo de armazenamento acessível em rede em intervalos predeterminados.
    10
  3. 3. Sistema, de acordo com a reivindicação 1,
    CARACTERIZADO pelo fato de que o primeiro monitor de carga é configurado para notificar cada um dos servidores de carga quando novos dados são adicionados na fila, e em que qualquer um dos servidores de carga que não estiver ocupado é
    15 configurado para responder à notificação, tentando recuperar os novos dados da fila e indexar os documentos com base nos novos dados.
  4. 4. Sistema, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que compreende adicionalmente um 20 conjunto de dois ou mais servidores de distribuição configurados para distribuir respectivamente dados de índices gerados pelos servidores de carga e documentos correspondentes para um índice primário e uma base de dados primária para uso pelos assinantes.
    25
  5. 5. Sistema, de acordo com a reivindicação 4,
    CARACTERIZADO pelo fato de que cada servidor de carga é configurado para prover uma notificação de carregador para cada um dos servidores de distribuição para indicar que ele com
    Petição 870190028135, de 25/03/2019, pág. 9/14 pletou a indexação de um conjunto de documentos com base em dados recuperados da fila; e em que qualquer um dos servidores de distribuição que não estiver ocupado é configurado para responder à notificação do carregador tentando distribuir dados de índice gerados pelo servidor de carga que proveu a notificação de carregador para o índice mestre e distribuir documentos correspondentes para a notificação de carregador para a base de dados.
  6. 6. Sistema, de acordo com a reivindicação 5, CARACTERIZADO pelo fato de que cada servidor de distribuição é configurado para prover uma notificação de distribuição para cada um dos monitores de carga para indicar que ele completou a distribuição de um conjunto de documentos com base em dados recuperados da fila para o índice mestre e para a base de dados.
  7. 7. Sistema, de acordo com a reivindicação 6, CARACTERIZADO pelo fato de que compreende adicionalmente dispositivo, responsivo à notificação de distribuição, para replicar os dados de índice distribuídos e documentos para um índice e base de dados secundários.
  8. 8. Sistema, de acordo com a reivindicação 5, CARACTERIZADO pelo fato de que cada servidor de carga é configurado para verificar a fila por novos dados depois de prover a notificação de carregador.
  9. 9. Sistema, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de que o primeiro monitor de carga é configurado para confirmar a replicação dos dados de índice
    Petição 870190028135, de 25/03/2019, pág. 10/14 distribuídos e documentos no índice e base de dados secundários e em resposta à confirmação de replicação escrever uma mensagem de conclusão de carga com marca de tempo em um dispositivo de armazenamento acessível em rede; e em que o segundo monitor de carga é configurado para determinar periodicamente se o dispositivo de armazenamento acessível em rede inclui mensagens confirmando a operação apropriada do primeiro monitor de carga.
  10. 10. Sistema de recuperação de informação, compreendendo:
    primeiro e segundo monitores de carga para monitorar a operação de uma pluralidade de servidores de carga que indexam documentos para adição em uma base de dados, em que o primeiro monitor de carga é configurado para prover informação de estado em relação à sua operação para o segundo monitor de carga, e o segundo monitor de carga é configurado para responder à informação de estado indicando falha do primeiro monitor de carga para assumir o comando de monitoração dos servidores de carga, e em que cada servidor de carga é associado com uma estrutura de dados de acordo de nível de serviço, a estrutura de dados incluindo um primeiro campo para indicar uma prioridade mínima de solicitações de indexação de documento que o servidor de carga é permitido aceitar;
    CARACTERIZADO pelo fato de que compreende ainda:
    um segundo campo para identificar para quais bases de dados o servidor de carga é permitido indexar documentos; e
    Petição 870190028135, de 25/03/2019, pág.
  11. 11/14
    um terceiro c ampo indicando um período de tempo efetivo ou a duração do acordo de nível de serviço. 11. Sistema, de acordo com a reivindicação 10, CARACTERIZADO pelo fato de que para prover informação de es-
    tado para o segundo monitor de carga, o primeiro monitor de carga inclui dispositivo para escrever periodicamente um relatório com marca de tempo em uma parte predeterminada de um dispositivo de armazenamento acessível em rede e o segundo monitor de carga inclui dispositivo para ler o relatório com marca de tempo no dispositivo de armazenamento acessível em rede em intervalos predeterminados.
  12. 12. Sistema, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que o primeiro monitor de carga é configurado para notificar cada um dos servidores de carga quando novos documentos estiverem prontos para serem adicionados na base de dados e em que qualquer um dos servidores de carga que não estiver ocupado é configurado para responder à notificação, tentando recuperar os novos dados da fila e para indexar os documentos com base nos novos dados.
  13. 13. Método, compreendendo:
    receber um arquivo contendo documentos para adição em uma base de dados de um sistema de recuperação de informação em linha;
    notificar dois ou mais servidores de carga em resposta ao recebimento do arquivo;
    indexar os documentos no arquivo usando um dos servidores de carga notificados;
    carregar os documentos indexados na base de dados;
    Petição 870190028135, de 25/03/2019, pág. 12/14 notificar dois ou mais monitores de carga que os documentos foram carregados na base de dados;
    confirmar que os documentos foram carregados na base de dados usando um primeiro dos monitores de carga notificados; e confirmar operação apropriada de um primeiro dos monitores de carga notificados usando um segundo dos monitores de carga notificados;
    em que cada servidor de carga é associado com uma estrutura de dados de acordo de nível de serviço, a estrutura de dados incluindo um primeiro campo para indicar uma prioridade mínima de solicitações de indexação de documento que o servidor de carga é permitido aceitar;
    CARACTERIZADO pelo fato de que compreende ainda:
    um segundo campo para indicar um período de tempo efetivo ou a duração do acordo de nível de serviço; e um terceiro campo para identificar para qual base de dados o servidor de carga é permitido para indexar documentos.
  14. 14. Método, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que notificar dois ou mais servidores de carga compreende:
    detectar a recepção do arquivo;
    adicionar dados em relação ao arquivo na fila de carga; e notificar os dois ou mais servidores de carga que novos dados foram adicionados na fila de carga.
  15. 15. Método, de acordo com a reivindicação 13,
    Petição 870190028135, de 25/03/2019, pág. 13/14
    CARACTERIZADO pelo fato de que carregar os documentos indexados na base de dados compreende:
    notificar dois ou mais servidores de distribuição que dados de índice e documentos correspondentes estão disponíveis para carregamento; e usar um dos dois ou mais servidores de distribuição para carregar os dados de índice e documentos correspondentes na base de dados.
  16. 16. Método, de acordo com a reivindicação 13, CARACTERIZADO pelo fato de que confirmar que os documentos foram carregados na base de dados inclui ler um fim de arquivo” ou outro indicador análogo a partir da base de dados.
  17. 17. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato de que confirmar operação apropriada de um primeiro dos monitores de carga usando um segundo dos monitores de carga compreende determinar se o primeiro dos monitores de carga escreveu uma ou mais mensagens em um diretório compartilhado.
  18. 18. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato de que indexar os documentos no arquivo usando um dos servidores de carga notificados inclui revisar uma estrutura de dados de acordo de nível de serviço para determinar se um ou mais dos servidores de carga notificados estão autorizados a processar os documentos.
BRPI0606259-8A 2005-01-07 2006-01-09 Sistema de recuperação de informação e método BRPI0606259B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US64235105P 2005-01-07 2005-01-07
US60/642,351 2005-01-07
PCT/US2006/000747 WO2006078502A2 (en) 2005-01-07 2006-01-09 Systems, methods, and software for distributed loading of databases

Publications (2)

Publication Number Publication Date
BRPI0606259A2 BRPI0606259A2 (pt) 2009-06-09
BRPI0606259B1 true BRPI0606259B1 (pt) 2019-04-30

Family

ID=36581217

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0606259-8A BRPI0606259B1 (pt) 2005-01-07 2006-01-09 Sistema de recuperação de informação e método

Country Status (12)

Country Link
US (2) US7480644B2 (pt)
EP (1) EP1834261B1 (pt)
JP (2) JP4722944B2 (pt)
CN (1) CN101137984B (pt)
AR (1) AR052083A1 (pt)
AU (1) AU2006206756B2 (pt)
BR (1) BRPI0606259B1 (pt)
CA (1) CA2593542C (pt)
ES (1) ES2500140T3 (pt)
HK (1) HK1108740A1 (pt)
NZ (1) NZ556503A (pt)
WO (1) WO2006078502A2 (pt)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4722944B2 (ja) 2005-01-07 2011-07-13 トムソン ルーターズ グローバル リソーシーズ データベースの分散ロードのためのシステム、方法およびソフトウェア
US7747663B2 (en) * 2008-03-05 2010-06-29 Nec Laboratories America, Inc. System and method for content addressable storage
US8443370B2 (en) 2008-08-26 2013-05-14 Microsoft Corporation Method of assigning resources to fulfill a service request by a programming model abstraction layer at a data center based at least in part on a reference of the requested resource class indicative of an abstract amount of resources
SE533007C2 (sv) * 2008-10-24 2010-06-08 Ilt Productions Ab Distribuerad datalagring
US8713182B2 (en) * 2009-08-03 2014-04-29 Oracle International Corporation Selection of a suitable node to host a virtual machine in an environment containing a large number of nodes
CN101924798B (zh) * 2010-09-08 2012-11-21 北京大学 一种基于文件类型的Android构件透明加载方法及系统
US10341919B2 (en) * 2010-11-24 2019-07-02 Elta Systems Ltd. Handover initiation methods and systems for improvement of cellular network performance
JP5687219B2 (ja) * 2012-01-20 2015-03-18 日本電信電話株式会社 データ検索システム、データ検索方法及びデータ検索プログラム
US11455350B2 (en) 2012-02-08 2022-09-27 Thomson Reuters Enterprise Centre Gmbh System, method, and interfaces for work product management
TWI613556B (zh) * 2013-01-28 2018-02-01 通用儀器公司 對遠端分散式資料庫伺服器之選擇性資料同步及傳送
US10140313B2 (en) * 2015-09-27 2018-11-27 International Business Machines Corporation Parallel processing of large data files on distributed file systems with dynamic workload balancing
DE102016119426B4 (de) * 2016-10-12 2020-03-12 Pierburg Gmbh Klappenvorrichtung für eine Verbrennungskraftmaschine
US11409781B1 (en) 2019-09-30 2022-08-09 Amazon Technologies, Inc. Direct storage loading for adding data to a database

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6044205A (en) * 1996-02-29 2000-03-28 Intermind Corporation Communications system for transferring information between memories according to processes transferred with the information
US5530855A (en) * 1992-10-13 1996-06-25 International Business Machines Corporation Replicating a database by the sequential application of hierarchically sorted log records
US5838965A (en) * 1994-11-10 1998-11-17 Cadis, Inc. Object oriented database management system
JPH08202573A (ja) * 1995-01-27 1996-08-09 Fuji Electric Co Ltd 二重化システムにおけるras情報の保存方法
JPH10105566A (ja) * 1996-09-30 1998-04-24 Hitachi Software Eng Co Ltd 画像データの検索・表示方法
EP0838924A1 (en) * 1996-10-23 1998-04-29 Alcatel Method to determine a scheduled rate value to be used in a policing algorithm, and related policing device
US5978462A (en) * 1997-10-08 1999-11-02 Mci Communications Corporation Method and system for automating updates to subscriber service accounts to accommodate numbering plan area splits
US6519763B1 (en) * 1998-03-30 2003-02-11 Compuware Corporation Time management and task completion and prediction software
US6247141B1 (en) * 1998-09-24 2001-06-12 Telefonaktiebolaget Lm Ericsson (Publ) Protocol for providing replicated servers in a client-server system
US7100195B1 (en) * 1999-07-30 2006-08-29 Accenture Llp Managing user information on an e-commerce system
US6601192B1 (en) * 1999-08-31 2003-07-29 Accenture Llp Assertion component in environment services patterns
JP3772606B2 (ja) * 1999-10-19 2006-05-10 株式会社日立製作所 電子文書管理方法及びシステム並びに記録媒体
US6985901B1 (en) * 1999-12-23 2006-01-10 Accenture Llp Controlling data collection, manipulation and storage on a network with service assurance capabilities
US6571285B1 (en) * 1999-12-23 2003-05-27 Accenture Llp Providing an integrated service assurance environment for a network
US6983317B1 (en) * 2000-02-28 2006-01-03 Microsoft Corporation Enterprise management system
US20020194251A1 (en) * 2000-03-03 2002-12-19 Richter Roger K. Systems and methods for resource usage accounting in information management environments
US20020120741A1 (en) * 2000-03-03 2002-08-29 Webb Theodore S. Systems and methods for using distributed interconnects in information management enviroments
US20020065864A1 (en) * 2000-03-03 2002-05-30 Hartsell Neal D. Systems and method for resource tracking in information management environments
US20020174227A1 (en) * 2000-03-03 2002-11-21 Hartsell Neal D. Systems and methods for prioritization in information management environments
US6601020B1 (en) * 2000-05-03 2003-07-29 Eureka Software Solutions, Inc. System load testing coordination over a network
US6574617B1 (en) * 2000-06-19 2003-06-03 International Business Machines Corporation System and method for selective replication of databases within a workflow, enterprise, and mail-enabled web application server and platform
US7379994B2 (en) * 2000-10-26 2008-05-27 Metilinx Aggregate system resource analysis including correlation matrix and metric-based analysis
US20030009385A1 (en) * 2000-12-26 2003-01-09 Tucciarone Joel D. Electronic messaging system and method thereof
US6631379B2 (en) * 2001-01-31 2003-10-07 International Business Machines Corporation Parallel loading of markup language data files and documents into a computer database
US6785696B2 (en) * 2001-06-01 2004-08-31 Hewlett-Packard Development Company, L.P. System and method for replication of distributed databases that span multiple primary nodes
US20030037284A1 (en) * 2001-08-15 2003-02-20 Anand Srinivasan Self-monitoring mechanism in fault-tolerant distributed dynamic network systems
US6745209B2 (en) * 2001-08-15 2004-06-01 Iti, Inc. Synchronization of plural databases in a database replication system
US6662198B2 (en) * 2001-08-30 2003-12-09 Zoteca Inc. Method and system for asynchronous transmission, backup, distribution of data and file sharing
US20030074606A1 (en) * 2001-09-10 2003-04-17 Udi Boker Network-based control center for conducting performance tests of server systems
US7149898B2 (en) * 2002-01-14 2006-12-12 Sun Microsystems, Inc. Self-monitoring and trending service system with a cascaded pipeline with enhanced authentication and registration
US20030135823A1 (en) * 2002-01-14 2003-07-17 Richard Marejka Loader and provider configuration for remotely provided services
US20030143978A1 (en) * 2002-01-18 2003-07-31 Boston Communications Group, Inc. Wireless telephone call processing
US20040128165A1 (en) * 2002-10-07 2004-07-01 Block Brad J. Method and apparatus for accessing and synchronizing multiple health care databases
US7085755B2 (en) * 2002-11-07 2006-08-01 Thomson Global Resources Ag Electronic document repository management and access system
US7089356B1 (en) * 2002-11-21 2006-08-08 Oracle International Corporation Dynamic and scalable parallel processing of sequence operations
US7209925B2 (en) * 2003-08-25 2007-04-24 International Business Machines Corporation Method, system, and article of manufacture for parallel processing and serial loading of hierarchical data
WO2005057362A2 (en) * 2003-12-08 2005-06-23 Notable Solutions, Inc. Systems and methods for data interchange among autonomous processing entities
US7246256B2 (en) * 2004-01-20 2007-07-17 International Business Machines Corporation Managing failover of J2EE compliant middleware in a high availability system
US7457796B2 (en) * 2004-07-08 2008-11-25 International Business Machines Corporation Method using virtual replicated tables in a cluster database management system
JP4722944B2 (ja) * 2005-01-07 2011-07-13 トムソン ルーターズ グローバル リソーシーズ データベースの分散ロードのためのシステム、方法およびソフトウェア

Also Published As

Publication number Publication date
EP1834261B1 (en) 2014-06-25
BRPI0606259A2 (pt) 2009-06-09
EP1834261A2 (en) 2007-09-19
JP2010250854A (ja) 2010-11-04
AR052083A1 (es) 2007-02-28
NZ556503A (en) 2011-07-29
AU2006206756A1 (en) 2006-07-27
JP4722944B2 (ja) 2011-07-13
CN101137984B (zh) 2011-08-03
WO2006078502A2 (en) 2006-07-27
WO2006078502A3 (en) 2007-02-08
CA2593542C (en) 2012-02-28
US20100017364A1 (en) 2010-01-21
HK1108740A1 (en) 2008-05-16
ES2500140T3 (es) 2014-09-30
JP2008527547A (ja) 2008-07-24
CA2593542A1 (en) 2006-07-27
AU2006206756B2 (en) 2009-07-30
CN101137984A (zh) 2008-03-05
US7480644B2 (en) 2009-01-20
US20060174101A1 (en) 2006-08-03

Similar Documents

Publication Publication Date Title
BRPI0606259B1 (pt) Sistema de recuperação de informação e método
US7546486B2 (en) Scalable distributed object management in a distributed fixed content storage system
US9904605B2 (en) System and method for enhancing availability of a distributed object storage system during a partial database outage
JP5254611B2 (ja) 固定内容分散データ記憶のためのメタデータ管理
US8229893B2 (en) Metadata management for fixed content distributed data storage
US8600944B2 (en) System and method for managing integrity in a distributed database
US7949636B2 (en) Systems and methods for a read only mode for a portion of a storage system
US8762642B2 (en) System and method for secure and reliable multi-cloud data replication
US8332363B2 (en) Storage system and data management method of the same
US11106541B2 (en) System and method for replicating data in distributed database systems
US20100191757A1 (en) Recording medium storing allocation control program, allocation control apparatus, and allocation control method
US8892830B2 (en) Changing ownership of cartridges
US10866756B2 (en) Control device and computer readable recording medium storing control program
JP2004302573A (ja) データバックアップ方法及びバッアップシステム
US20240143620A1 (en) Object access based on tracking of objects and replication policies
US10853188B2 (en) System and method for data retention in a decentralized system
Garlick I/O forwarding on livermore computing commodity linux clusters
CN116881049A (zh) 一种云构架下基于终端和云主机的分布式数据备份方法
JP5276391B2 (ja) インテリジェント・コンテンツのインデックス付け実行技術

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 30/04/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 30/04/2019, OBSERVADAS AS CONDICOES LEGAIS

B25D Requested change of name of applicant approved

Owner name: THOMSON REUTERS GLOBAL RESOURCES (CH)

B25D Requested change of name of applicant approved

Owner name: THOMSON REUTERS GLOBAL RESOURCES UNLIMITED COMPANY (CH)

B25A Requested transfer of rights approved

Owner name: THOMSON REUTERS ENTERPRISE CENTRE GMBH (CH)