BR102016005928A2

BR102016005928A2 - método para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, sistema para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, e, produto de programa de computador

Info

Publication number: BR102016005928A2
Application number: BR102016005928A
Authority: BR
Inventors: Ashwin Srinivasan; Ehtesham HASSAN; Gautam Shroff; Mohit Yadav; Puneet Agarwal
Original assignee: Tata Consultancy Services Ltd
Priority date: 2015-06-19
Filing date: 2016-03-17
Publication date: 2016-12-27
Also published as: EP3107036A1; CA2923908A1; CA2923908C; US9996617B2; JP6807649B2; MX2016003370A; MX364165B; US20160371376A1; AU2016201689A1; AU2016201689B2; JP2017010523A

Abstract

são providenciados métodos e sistemas para pesquisar padrões lógicos em dados multissensores volumosos a partir da internet industrial. o método recupera exemplos de padrões em séries temporais de dados em que os padrões são especificados logicamente, usando uma sequência de símbolos. os símbolos lógicos usados são um subconjunto das abstrações qualitativas especificamente, os conceitos de estável, aumentando, decrescendo. os padrões podem incluir sequências de símbolos para multissensores, duração aproximada, assim como valores de inclinação para cada símbolo. para facilitar uma consulta eficiente, cada sensor de série temporal é pré processado em uma sequência de símbolos lógicos. cada posição na sequência comprimida resultante é registrada numa estrutura de índice trie correspondente aos múltiplos padrões lógicos a que pode pertencer. padrões multissensores lógicos são eficientemente recuperados e classificados utilizando uma tal estrutura. este método de indexar e pesquisar providencia um mecanismo eficiente para uma análise exploratória de dados multissensores volumosos.

Description

MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS A PARTIR DE SÉRIES TEMPORAIS DE DADOS MULTISSENSORES, SISTEMA PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS A PARTIR DE SÉRIES TEMPORAIS DE DADOS MULTISSENSORES, E, PRODUTO DE PROGRAMA DE COMPUTADOR

REFERÊNCIA CRUZADA A PEDIDOS E PRIORIDADE RELACIONADOS

[001] O presente pedido reivindica a prioridade do pedido de Patente indiana n.° 2351/MUM/2015, depositado em 19 de junho de 2015, a qual é aqui incorporada na sua totalidade a titulo de referência.

CAMPO TÉCNICO

[002] As modalidades aqui mencionadas se referem geralmente à pesquisa de padrões lógicos e, mais particularmente, à pesquisa de padrões lógicos que são volumosos e incluem dados distintos disponíveis a partir da internet industrial.

ANTECEDENTES

[003] A automatização atualmente é caracterizada por instrumentação disseminada com multissensores que resultam em dados volumosos no comportamento de maquinaria que vai de simples comutadores a sistemas complexos que incluem centenas de milhares de peças. O volume e diversidade de dados a partir de miríades de sensores instalados tem o potencial para ajudar a compreender melhor os ambientes em que estas máquinas estão a operar. Torna-se imperativo para engenheiros e técnicos trabalhar com tais dados para procurar eventos específicos tais como "paradas repentinas", "trocas de faixa", "sobrecarga do motor" etc. Cada padrão pode habitualmente ser expresso em termos da ocorrência simultânea de um conjunto de padrões lógicos através de multissensores. Por exemplo, uma parada repentina é uma queda súbita de velocidade juntamente com uma pressão de frenagem crescente em um curto espaço de tempo. Ocorrências especificas de tais padrões podem diferir em sua duração real, assim como a exata natureza de cada queda ou aumento em uma sequência especificada. Assim, técnicas tradicionais que assentam em correspondências de formas de onda quase exatas falham em muitos exemplos.

[004] Eventos de interesse são muitas vezes caracterizados por um conjunto de padrões em multissensores, ocorrendo simultaneamente. Além disso, a duração de cada ocorrência de um evento não é constante. Por exemplo, os condutores de veículos não aplicam sempre frenagens repentinas com uma duração fixa todas as vezes. Além disso, se observa que a duração do evento é diferente em cada sensor, envolvido no evento. Por exemplo, quando se aplica uma frenagem repentina em um veículo, o padrão em um sensor de freio é de duração mais longa do que em um sensor de velocidade. O problema fica ainda mais complexo porque os padrões não têm de ocorrer na mesma janela de tempo para cada um dos sensores. Por exemplo, pode existir um pequeno intervalo de tempo entre o padrão de início de uma 'frenagem repentina' em sensor de velocidade versus o sensor de freio. Valores em falta em leituras de sensor complicam ainda mais a questão fazendo da pesquisa de padrões multissensores um desafio.

[005] Muitas vezes eventos de interesse são baseados no domínio do conhecimento. Todavia, requer depois um esforço manual significativo anotar eventos em dados de sensor volumosos. Na prática, tais eventos são detectados programaticamente por pesquisa de condições codificadas que são observadas nos valores do sensor. Por exemplo, um evento poderia ser traduzido em uma regra codificada que procura situações em que o "sensor-1 é maior do que sl no tempo tl e o derivado do sensor-2 é mais do que d2 para a duração t2". Por causa dos desafios práticos, tais regras codificadas são muitas vezes ineficazes, e também difíceis de implementar. Técnicas alternativas para a detecção de séries temporais de eventos usam técnicas de aprendizagem automática, mas a maioria destes métodos trabalham em subsequências de séries temporais que já foram extraídas a partir de séries temporais completas. Todavia, esses métodos conhecidos na arte são minados por desafios que incluem mas não estão limitados a, duração variável de eventos, desalinhamento em tempo de ocorrências de padrões através de sensores e variação na resposta ao mesmo evento. Além disso, os métodos conhecidos na arte encontram correspondências com um padrão particular em vez de todos os exemplos que poderíam corresponder a um evento de interesse.

[006] Uma grande parte da arte anterior também se focou na classificação supervisionada para a identificação de eventos em séries temporais. Algumas usam uma mistura de métodos supervisionados e não supervisionados para descobrir padrões temporais a partir do conjunto de dados e podem discriminar estes padrões temporais dos restantes. Mas todos esses métodos requerem exemplos etiquetados de segmentos de séries temporais para treinar seus classificadores. Além disso, a maioria destas abordagens trabalha em segmentos de séries temporais de comprimento fixo. Todavia, esses métodos também lutam para detectar eventos práticos que são de comprimento variável e abrangem multissensores, uma vez que seria necessário explorar comprimentos múltiplos de janelas abrangendo todas as séries temporais, fazendo a detecção computacionalmente intensiva usando uma tal abordagem.

[007] Existe, portanto, uma necessidade de métodos e sistemas que abordem os inconvenientes acima e outros inconvenientes e limitações possíveis dos métodos e sistemas presentemente utilizados relacionados com o campo da pesquisa de padrões lógicos.

SUMÁRIO

[008] Modalidades da presente divulgação apresentam melhoramentos tecnológicos como soluções para um ou mais dos problemas técnicos acima descritos reconhecidos pelos inventores em sistemas convencionais.

[009] São descritos métodos e sistemas que possibilitam a pesquisa de padrões lógicos a partir de séries temporais de dados multissensores. A pesquisa e a consulta em séries temporais de dados multissensores de grande volume, séries temporais de dados compactação, formação de consulta para pesquisa em séries e indexação e armazenamento de séries temporais são alguns dos desafios colocados pelos sistemas e métodos da presente divulgação assegurando ao mesmo tempo eficácia e precisão.

[010] Em um aspecto, é fornecido um método para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores que podem incluir receber pelo menos uma série temporal de dados a partir de pelo menos um sensor para pesquisar e recuperar padrões lógicos, por um módulo de input; pré-processar a pelo menos uma séries temporal de dados recebidos em pelo menos uma sequência de símbolos lógicos, por um pré-processador; extrair padrões lógicos a partir da pelo menos uma sequência de símbolos lógicos, por um extrator; agrupar e armazenar os padrões lógicos extraídos em um disco e em uma memória, por um organizador; e íterativamente efetuar: a descrição de um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida, por um gerador de padrão; a pesquisa e recuperação de pelo menos um cluster a partir do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para consulta de pesquisa, por um motor de pesquisa; a classificação dos padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa baseada no grau de relevância para a consulta de pesquisa, por um motor de classificação; e a recuperação de pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa, por um recuperador de padrão.

[011] Em uma modalidade, a etapa de pré-processar a pelo menos uma série temporal de dados recebidos pode ainda incluir dividir a pelo menos uma série temporal de dados recebidos em uma pluralidade de segmentos de série temporal que não se sobreponham; computar inclinações de cada segmento; ordenar e agrupar o conjunto de segmentos ordenados com base nas inclinações computadas, cada grupo tendo igual número de pontos de amostragem; computar inclinações médias para cada grupo de segmentos; anotar cada ponto de amostragem como aumentando (+), estável (0) e decrescendo (-) comparando a inclinação com o valor médio de inclinação computado correspondente; e classificar a pelo menos uma série temporal de dados como uma sequência de símbolos lógicos caracterizada pelos pontos de amostragem anotados, valor compreendendo magnitude média e comprimento do segmento.

[012] Em uma modalidade, a etapa de pré-processar a pelo menos uma série temporal de dados recebidos é precedida pela etapa de suavização para eliminar ruído, a etapa de suavização sendo realizada pelo menos por uma técnica escolhida do grupo consistindo em filtro de média móvel, suavização aditiva, filtro de Butterworth, filtro digital, filtro de Kalman, suavização laplaciana, suavização exponencial, método de grelha estirada, filtro de passa baixo, filtro de suavização Savitzky-Golay, regressão local, suavização spline, algoritmo de Ramer-Douglas-Peucker, e filtro de Kolmogorov-Zurbenko.

[013] De acordo com uma modalidade, a etapa de pré-processar a pelo menos uma série temporal de dados recebidos compreende ainda a etapa de refinar a sequência de símbolos lógicos incorporando símbolos lógicos tendo comprimento do segmento inferior a um limiar predefinido.

[014] De acordo com uma modalidade, o valor e comprimento do segmento pode incluir pelo menos um de três atributos, tais como tipo livre, tipo aproximado e tipo de intervalo.

[015] Em uma modalidade, a etapa de agrupar e armazenar os padrões lógicos extraídos pode ainda compreender: predefinir um limiar comum para todos os sensores executando uma normalização-Z; rejeitar os padrões lógicos extraídos com desvio de magnitude menor do que o limiar predefinido; representar cada padrão lógico extraído de comprimento fixo de símbolos lógicos como um vetor; agrupar vetores semelhantes de acordo com marcação temporal, duração e valores de símbolos lógicos associados juntamente com o índice associado ou com o índice do símbolo seguinte no padrão lógico; armazenar os clusters em um disco como banco de dados; e armazenar metadados dos clusters em uma memória em uma estrutura TRIE.

[016] Em uma modalidade, a etapa de descrever um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida pode ainda compreender definir pelo menos um atributo associado ao valor e comprimento do segmento para cada símbolo lógico.

[017] Em uma modalidade, a etapa de pesquisar e recuperar pelo menos um cluster pode ainda compreender: inicializar uma lista de contêiner de cluster para cada sensor envolvido na consulta de pesquisa, a lista de contêiner de cluster compreendendo uma primeira dimensão para armazenar índices de passagens e uma segunda dimensão para armazenar índice de marcações temporais em que o padrão lógico aparece no interior daquela passagem; ordenar os clusters no interior da estrutura TRIE para cada sensor com base na sua distância a partir da consulta de pesquisa; carregar os clusters mais próximos na lista de contêiner para cada sensor; executar iterativamente: a identificação de marcações temporais comuns que satisfazem propriedades especificadas pela consulta de pesquisa; computar valores heurísticos para todas as escolhas de clusters a carregar; carregar o cluster com o valor heurístico mais elevado; e terminar a pesquisa quando for alcançado um critério de término predefinido.

[018] De acordo com uma modalidade, a consulta de pesquisa é uma consulta textual.

[019] De acordo com uma modalidade, a etapa de identificar marcações temporais comuns pode compreender encontrar uma interseção de ocorrências de padrões lógicos através do pelo menos um sensor para marcações temporais comuns: detectando interseção na primeira dimensão da lista de contêiner de cluster; e detectando interseção na segunda dimensão da lista de contêiner de cluster, no caso de haver uma correspondência para interseção na primeira dimensão.

[020] Em um outro aspecto, é fornecido um sistema para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores compreendendo: um ou mais processadores; um dispositivo de interface de comunicação; um ou mais dispositivos de armazenamento interno operativamente acoplado(s) a um ou mais processadores para armazenar: um módulo de input configurado para receber pelo menos uma série temporal de dados a partir de pelo menos um sensor para pesquisar e recuperar padrões lógicos; um pré-processador configurado para pré-processar a pelo menos uma série temporal de dados recebidos em pelo menos uma sequência de símbolos lógicos; um extrator configurado para extrair padrões lógicos da pelo menos uma sequência de símbolos lógicos; um organizador configurado para agrupar e armazenar os padrões lógicos extraídos em um disco e em uma memória; um gerador de padrão configurado para descrever um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida; um motor de pesquisa configurado para pesquisar e recuperar pelo menos um cluster a partir do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para a consulta de pesquisa; um motor de classificação configurado para classificar os padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa com base no grau de relevância para a consulta de pesquisa; e um recuperador de padrão configurado para recuperar pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa.

[021] Ainda em um outro aspecto, é fornecido um produto de programa de computador compreendendo um meio de suporte informático legível duradouro tendo um suporte informático incorporado no mesmo, em que o programa de computador legível, quando executado em um dispositivo informático, faça com que o dispositivo informático: receba pelo menos uma série temporal de dados de pelo menos um sensor para pesquisar e recuperar padrões lógicos, por um módulo de input; pré-processe a pelo menos uma série temporal de dados recebidos em pelo menos uma sequência de símbolos lógicos, por um pré-processador; extraia padrões lógicos a partir da pelo menos uma sequência de símbolos lógicos, por um extrator; agrupe e armazene os padrões lógicos extraídos em um disco e em uma memória, por um organizador; descreva um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida, por um gerador de padrão; pesquise e recupere pelo menos um cluster do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para a consulta de pesquisa, por um motor de pesquisa; classifique os padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa com base no grau de relevância para a consulta de pesquisa, por um motor de classificação; e recupere pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa, por um recuperador de padrão.

[022] Deve ser compreendido que tanto a descrição geral supracitada como a descrição detalhada seguinte são apenas exemplificativas e explicativas e não são restritivas da invenção, tal como reivindicada.

BREVE DESCRIÇÃO DOS DESENHOS

[023] As modalidades aqui referidas serão melhor compreendidas a partir da descrição detalhada que se segue com referência aos desenhos, nos quais: [024] A FIG. 1 ilustra um diagrama de blocos exemplificativo de um sistema para pesquisar padrões lógicos a partir de séries temporais de dados multissensores volumosos disponíveis a partir da internet industrial de acordo com uma modalidade da presente divulgação;

[025] A FIG. 2 ilustra uma estrutura de índice TRIE implementada pelo sistema da presente divulgação de acordo com uma modalidade da presente divulgação;

[026] A FIG. 3 é um diagrama de fluxo exemplificativo ilustrando um método para a pesquisa de padrões lógicos a partir de séries temporais de dados multissensores volumosos usando o sistema da FIG. 1 de acordo com uma modalidade da presente divulgação;

[027] A FIG. 4A é uma ilustração de output associado a um setup experimental com o conjunto de dados de velocidade do veículo e pressão primária de cilindro obtidos para condição de parada repentina; e [028] A FIG. 4B é uma ilustração de um output associado a um setup experimental com dados de sensor obtidos a partir de motores para a condição de carga.

[029] Deve ser reconhecido pelos peritos na arte que qualquer diagrama de blocos aqui mencionado representa vistas conceptuais de sistemas ilustrativos incorporando os princípios do presente assunto. De modo semelhante, será reconhecido que quaisquer diagramas de fluxo, fluxogramas, diagramas de transição de estado, pseudo código, e similares representam vários processos que podem ser substancialmente representados em meio de suporte informático legível e assim executados por um processador ou dispositivo informático, quer esse dispositivo informático dispositivo ou processador seja ou não explicitamente mostrado.

DESCRIÇÃO DETALHADA

[030] As modalidades aqui referidas e suas várias características e detalhes vantajosos são explicados mais completamente com referência às modalidades não limitativas que são ilustradas nos desenhos anexados e na descrição detalhada seguinte. Os exemplos aqui usados são destinados meramente a facilitar um entendimento dos modos como as modalidades aqui mencionadas podem ser praticadas e a permitir ainda que os peritos na arte pratiquem as modalidades aqui incorporadas. Consequentemente, os exemplos não devem ser interpretados como limitando o escopo das modalidades aqui incorporadas.

[031] A expressão internet industrial tal como referida na presente divulgação diz respeito à integração de maquinaria física com sensores e software em rede. Dados volumosos capturados a partir do grande número de sensores geralmente associados a máquinas de todos os tipos incluindo motores, equipamento fabril e similares são transmitidos para ulterior análise comportamental das máquinas associadas sob várias condições. Tais dados recebidos a partir de sensores, quer estejam direta ou indiretamente acoplados ao sistema na forma de séries temporais de dados servem como input ao sistema da presente divulgação.

[032] As modalidades aqui mencionadas fornecem sistemas e métodos para pesquisar padrões lógicos a partir de séries temporais de dados multissensores volumosos disponíveis a partir da internet industrial. Os sistemas para a pesquisa de padrões lógicos são confrontados com desafios práticos particularmente quando os padrões se referem a durações variáveis de eventos, existe mudança no tempo de ocorrências de padrões através de sensores diferentes e existe uma variação no tempo de resposta de sensores diferentes ao mesmo evento real. Os padrões caracterizam eventos e é imperativo poder pesquisar eficazmente padrões e identificar eventos associados para se poderem usar eficazmente os dados volumosos disponíveis. Os sistemas e métodos da presente divulgação abordam particularmente estas questões da arte encontrando ocorrências de um padrão dada a sua descrição em termos lógicos em vez de descobrir padrões temporais que caracterizam o comportamento do sistema subj acente.

[033] Por facilidade de explanação, a descrição de sistemas e métodos da presente divulgação é fornecida com referência a exemplo não limitativo de sessões de operação de um sistema mecânico exemplificativo, por exemplo a deslocação de um veículo. Pode ser compreendido que os sistemas e métodos da presente divulgação podem encontrar aplicabilidade em qualquer domínio em que é requerida a análise de dados exploratórios, marcando ocorrências de eventos candidatos para treinar um sistema de aprendizagem automática, por análise humana de exemplos recuperados em resposta a uma consulta de padrão lógico e selecionar subsequências nas quais aplicar um classificador.

[034] Embora os sistemas e métodos da presente divulgação sejam aqui a seguir explicados com referência a duas ou mais séries temporais de dados recebidos pelo sistema da presente divulgação, pode ser entendido por um perito no ramo que os sistemas e métodos da presente divulgação podem encontrar aplicabilidade mesmo quando apenas está envolvida uma série temporal de dados.

[035] Fazendo agora referência aos desenhos, a FIG. 1 ilustra um diagrama de blocos exemplificativo do sistema 100 para a pesquisa de padrões lógicos a partir de séries temporais de dados multissensores volumosos disponíveis a partir de sensores 10 integrados na internet industrial de acordo com uma modalidade da presente divulgação. A FIG. 3 é um fluxograma exemplificativo ilustrando um método 300 para a pesquisa de padrões lógicos a partir de séries temporais de dados multissensores volumosos usando o sistema da FIG. 1 de acordo com uma modalidade da presente divulgação. As etapas do método 300 da presente divulgação irão agora ser explicadas com referência aos componentes do sistema 100 como representado na FIG. 1.

[036] Na etapa 302, as séries temporais de dados de sensores 10 são recebidos no módulo de input 12 do sistema 100 para pesquisar e recuperar padrões lógicos.

[037] Na etapa 304, as séries temporais de dados recebidos são pré-processadas em sequências de símbolos lógicos, pelo pré-processador 14. As séries temporais de dados multissensores T são obtidas a partir de multissensores e registradas durante muitas sessões de operação do sistema mecânico subjacente tal como uma deslocaçâo de um carro, um dia de operação de uma usina, e similares. Para efeitos de explanação, sessões de operações tais como deslocações de veículos subjacentes são também referidas com segmentos de séries temporais T. Antes de processar os dados em bruto T, são divididos em múltiplos segmentos {Ti, T2, ...., TM}, os quais correspondem a diferentes deslocações de veículos. Cada segmento de séries temporais Τ2 é então convertido em uma ί ί i sequência de símbolos logicos Z2 = {Z Z2 ZN} .

[038] Na etapa 306, são extraídos padrões lógicos a partir de sequências de símbolos lógicos, pelo extrator 16. Para cada deslocaçâo Ti, são computadas inclinações que é a diferença entre valores de sensores adjacentes. Um número suficientemente grande de amostras é considerado e ordenado. Essa lista ordenada é depois dividida em três grupos, mantendo o número de pontos em cada grupo como o mesmo, e depois é computada a inclinação média para cada grupo. Com base no valor dessas inclinações médias esses grupos são representados por símbolos ' + ' , '0' e , representando padrões aumentando(+), estável(0), e decrescendo(-) em séries temporais. A inclinação de cada ponto nas séries temporais multivariadas Ti é depois comparada com os valores médios correspondentes de inclinações dos três símbolos, e com base em qual dessas distância é a menor aquele ponto das séries temporais é codificado como '+', '0', ou . Todas as ocorrências contínuas de um símbolo são substituídas por pares de termos incluindo o símbolo e seu comprimento. Nesse par de termos, a inclinação média de vários pontos que foram removidos para criar esse par é também incluída. O tríplice (símbolo lógico Z, contagem do símbolo k e contagem do segmento i) , é i representado como Z , i.e., símbolo k do segmento i de series temporais e inclui três termos: o símbolo, o seu comprimento i e a inclinação media de pontos representados por Z . Como um resultado, a série temporal é representada pela sequência de í ί i símbolos logícos Z± = {Z Z2 ZN} . De acordo com uma modalidade, a sequência lógica é ainda aperfeiçoada combinando tríplices que são de menor duração do que um limiar para acabar com ruído tal como indicado no Algoritmo 1 mencionado abaixo.

[039] Na etapa 308, os padrões lógicos extraídos são agrupados e armazenados no disco 20 e na memória 22, pelo organizador 18. Um padrão lógico é uma sequência de símbolos ' + ' , '0', ou sem qualquer par de símbolos idênticos adjacentes. Todos os padrões lógicos de símbolos de até um comprimento fixo (por exemplo 5 unidades) são extraídos. Depois de extrair os padrões lógicos a partir das sequências, os padrões que têm um desvio de magnitude menor do que um limiar predefinido são rejeitados. O desvio de magnitude de um padrão lógico é medido como a diferença entre valores máximo e mínimo das séries temporais correspondentes àquele padrão. Uma vez que sensores diferentes têm intervalos de valores diferentes, cada sensor necessitaria de um limiar diferente. Tendo em vista evitar limiares múltiplos, é efetuada a normalização-Z e é definido um único limiar para todos os sensores. Depois da eliminação de padrões tendo um desvio de magnitude menor do que um limiar predefinido, todos os exemplos que pertencem a um padrão lógico válido, por exemplo {-, 0, +} são compilados. Cada padrão de comprimento fixo de símbolos é representado com um vector. As dimensões dos vectores incluem comprimento (duração) de cada símbolo no padrão, inclinações médias de '+' e símbolos , e valor médio absoluto das séries temporais correspondentes ao símbolo '0' . A normalização é efetuada para livrar-se da tendência que aparece devido à elevada variação no intervalo de diferentes sensores. Os vectores são depois agrupados usando técnicas conhecidas na arte incluindo, mas não limitadas ao agrupamento Birch. De acordo com uma modalidade, se um padrão inicia ou termina com o símbolo '0', o seu comprimento é ignorado durante a etapa de agrupamento. Isto é baseado no fato de que o veículo permanece estacionário durante um intervalo de tempo maior depois/antes de vários eventos que podem não ser relevantes em muitos cenários práticos. Por exemplo, o tempo durante o qual o veiculo esteve a circular antes de a parada repentina ter sido aplicada pode não ser relevante para uma análise.

[040] É mantida uma pasta para cada sensor e a pasta pode conter um arquivo para cada padrão lógico desse sensor. Todos os clusters de um padrão são armazenados no mesmo arquivo. Vários clusters são escritos no arquivo de uma maneira sequencial. Cada descrição de cluster contém os vectores do padrão lógico, ordenados de acordo com a marcação temporal e têm segmentos de séries temporais marcadas. Para cada marcação temporal, são armazenadas as durações e valores de cada símbolo presentes juntamente com o índice em que começa o padrão lógico no segmento de séries temporais. Existe uma exceção para aqueles padrões lógicos que começam com '0'; para eles é armazenado o índice do próximo símbolo presente no padrão lógico.

[041] Além de armazenar os resultados obtidos após o agrupamento de padrões lógicos, são também computados e armazenados metadados destes clusters que têm de ser carregados antes da execução de qualquer consulta em estrutura TRIE (como ilustrado na FIG. 2) . A FIG. 2 ilustra uma estrutura de índice TRIE 200 implementada pelo sistema da presente divulgação de acordo com uma modalidade da presente divulgação. Na estrutura TRIE, o nó raiz da TRIE é definido como NÜLL, e tem três nós filhos, um para cada símbolo lógico que pode ocorrer no início de um padrão lógico. Em cada nível seguinte da TRIE também cada nó tem três nós filhos, dois deles são usados para símbolos seguintes de um padrão lógico e o terceiro nó (no meio, com forma de diamante na FIG. 2) é usado para armazenar informações sobre o padrão lógico que começa no nó raiz e termina no nó atual. 0 nó em diamante no final de cada padrão lógico contém três tipos de informações: informações sobre clusters, localizações de clusters e fatores de normalização usados durante o agrupamento. As informações de cluster incluem centróide, raio e índices de listas de passagens que ele contém e isto está sendo usado em computação de valores heurísticos, i.e., em fazer uma escolha de qual o cluster a carregar a seguir. A localização de cluster é armazenada usando dois números, que indicam o número de bytes a saltar, e o número de bytes a carregar a partir do arquivo de padrão lógico correspondente. São usados fatores de normalização para normalizar a duração e valores de consulta antes de compará-los com clusters durante a pesquisa.

[042] De acordo com uma modalidade, as etapas 302 a 308 do método da presente divulgação podem ser implementadas off-line e têm que ser executadas apenas uma vez e as etapas 310 a 316 podem ser uma implementação on-line e podem ser executadas iterativamente para cada consulta de pesquisa.

[043] Na etapa 310, os padrões a serem recuperados a partir dos clusters armazenados são descritos em uma consulta de pesquisa predefinida, pelo gerador de padrão 28. Um evento pode ser consultado, usando um padrão lógico de multissensores. Para cada símbolo do padrão, são também especificados a duração e um valor. Os valores de símbolo '+' e contêm suas inclinações médias enquanto para o símbolo '0' ele contém a magnitude média do símbolo. Esses valores e durações podem ter um dos três tipos de atributos seguintes: 1. Tipo livre: Este tipo de valor permite que as variáveis recuperadas tomem qualquer valor e é representado por '*'. 2. Tipo aproximado: esse tipo de valor é representado por um número e.g. '10'. Tal valor indica que o valor alvo deve ser aproximadamente próximo desse valor. 3. Tipo de intervalo: Este tipo de valor aplica um critério rigoroso para símbolos recuperados. Isso pode ser representado de três modos, o primeiro modo é estar vinculado ao máximo da média de símbolo e.g. '< 10', o segundo modo é estar vinculado ao mínimo da média do símbolo e.g. '> IO' e o terceiro modo é estar vinculado ao mínimo e ao máximo e.g. '8 - 12' .

[044] Portanto, a consulta para um evento em um sensor único, de acordo com a presente divulgação pode ser escrita como: [045] "Velocidade de Motor: 0-0: *, 3, * :> 30: 4-8 :< 10" em que, *, 3, * representa durações de símbolos e implica que a velocidade do motor deve ser estável '0' para qualquer duração de tempo e deve cair durante aproximadamente 3 segundos, e depois se tornar estável '0' novamente durante qualquer duração.

[046] Novamente, >30: 4-8 :< 10 representa informações sobre os símbolos e implica que a velocidade do motor deve ter um valor médio absoluto > 30 e depois disso deve cair com uma média 4-8 seguida por um estado estável com valor médio absoluto < 10. Desta maneira, a linguagem de consulta da presente divulgação permite descrever formas muito complexas com precisão muito elevada. Similarmente, uma consulta para padrões lógicos multissensores pode ser definida especificando uma consulta válida para cada sensor.

[047] Na etapa 312, pelo menos um cluster é pesquisado e recuperado a partir do disco referenciado na estrutura de índice TRIE (ilustrada na FIG. 2) na memória 22, se for considerado relevante para a consulta de pesquisa, pelo motor de pesquisa 24. O Algoritmo 2 para a pesquisa de ocorrências de padrões lógicos multissensores é indicado aqui abaixo.

[048] O Algoritmo 2 pode ser usado para encontrar índices de padrões com propriedades especificadas na consulta. Os padrões lógicos são armazenados em arquivos com clusters separados tal como descrito aqui acima na etapa 308. Para encontrar índices, primeiramente os clusters relevantes são carregados na memória por uma abordagem heurística predefinida. Dado um cluster a partir de cada sensor presente na consulta, são identificados os índices comuns com propriedades especificadas na consulta através de multissensores.

[049] Uma primeira etapa executada pelo Algoritmo 2 inclui inicializar uma lista de contêiner de cluster para cada sensor envolvido na consulta. Isto será usado para carregar clusters de padrões lógicos baseados nos nós na TRIE correspondente ao padrão lógico expresso para um sensor particular. A lista de contêiner de cluster é uma lista bidimensional em que uma dimensão é usada para armazenar índices de passagens e outra para índices de marcações temporais em que aquele padrão lógico particular apareceu naquela passagem. Ambos os índices de passagens e marcações temporais foram ordenados antes de armazená-los como explicado na etapa 308 de modo que as suas interseções podem ser detectadas mais rapidamente.

[050] Uma segunda etapa executada pelo Algoritmo 2 inclui dispor clusters no nó correspondente ao padrão lógico especificado dentro da estrutura TRIE para cada sensor. Os clusters C são ordenados pela sua distância da consulta Q como definido na equação 3 abaixo, que é o produto da distância aproximada descrita na equação 1 para atributos tipo aproximado e de intervalo de distância descrito na equação 2 para atributos tipo de intervalo. As medições de distância aproximada calculam a distância entre a distância aproximada (A) e as medições de intervalo de distância (R) calculam as chances de não ter marcações temporais no intervalo para aquele cluster. Na equação 1 e na equação 2, Ai/Ri (distância aproximada / distância de intervalo) é igual a 1 se a variável i em C é de tipo aproximado/intervalo e Qi /Ci são variáveis i de consulta/cluster. M é a contagem de símbolos presentes no padrão lógico para um sensor. O raio (C) representa o raio de cluster Cea sobreposiçãoi é a fração de cluster que está no intervalo para o primeiro atributo tipo de intervalo i. Por exemplo, se o cluster tem raio 2 e o centro em (2, 0) então, para a dimensão dimensão-x- i.e. a sobreposiçãoi será 0,25, 0,5, 0 correspondendo a > 3, 1 - 3, < 0 e para a dimensão-y a sobreposiçãoi será 0,25, 0,5, 0,75 correspondendo a > 1, (-1) - (1), > -1. Como é claro a partir da equação 3, a medição da distância é 00 se um cluster está fora do intervalo para qualquer dos atributos tipo de intervalo especificado. Se o cluster mais próximo tem distância 00 então não existe correspondência encontrada para a consulta. áist(Q, C) = AD(Q, C'i x C) (3) [051] Uma terceira etapa executada pelo Algoritmo 2 inclui carregar os clusters mais próximos na memória para cada sensor.

[052] A quinta etapa executada pelo Algoritmo 2 inclui encontrar marcações temporais que satisfaçam propriedades especificada pela consulta. Para fazer isso, primeiro a interseção na primeira dimensão do cluster que é índices de passagens é detectada. Se for encontrada qualquer correspondência, então a interseção em outra dimensão de marcações temporais é detectada. Enquanto marcações temporais correspondentes, mesmo se as marcações temporais iniciais de padrões lógicos através de sensores diferentes são inferiores a um limiar, elas são consideradas como correspondências relevantes. Isto é feito para levar em conta a diferença no tempo de resposta de sensores diferentes para um evento particular e em segundo lugar esta diferença pode existir devido ao processo de codificação do símbolo.

[053] A sexta etapa do Algoritmo 2 inclui uma verificação para o critério de término para terminar o processo de pesquisa.

[054] A sétima etapa do Algoritmo 2 inclui a computação de valores heurísticos tal como definido na equação 4 para todos os clusters relevantes a carregar. São preferidos valores heurísticos mais altos (HV) em primeiro lugar para a maior probabilidade de correspondência e em segundo lugar para um sucesso mais rápido.

[055] A oitava etapa do Algoritmo 2 inclui carregar o cluster com o maior valor heurístico. Depois desta etapa, as etapas 5 a 8 são repetidas a menos que o critério de término na sexta etapa seja cumprido. Em novas iterações na etapa 5 do Algoritmo 2, são consideradas todas as novas combinações de clusters tornadas devidas para clusters recém carregados com clusters anteriormente carregados a partir do resto dos sensores. Embora seja raro, existe uma pequena possibilidade de ter todos os clusters a voltar a um valor heurístico zero nas fases iniciais de pesquisa especialmente quando os clusters iniciais carregados são pequenos. Nesse caso é escolhido um cluster aleatório para carregar o resto dos sensores, e eles são mantidos na lista de espera e a seguir na lista de cluster para serem tomados outros sensores. Na iteração seguinte, estes clusters em espera são considerados uma escolha juntamente com o cluster que é o próximo na lista.

[056] Os clusters que estão fora do intervalo para uma ou mais variáveis virão em conjunto no final da lista. Quando qualquer cluster chega na lista esse sensor é considerado como tendo sido rastreado. Uma vez que os clusters associados a todos os sensores sejam rastreados, a pesquisa é terminada. Além disso, é mantida uma contagem do número de exemplos recuperados e a pesquisa é terminada quando o número de exemplos recuperados é igual ou maior do que o que foi consultado, o que sucede no cenário em que o usuário consulta pelos resultados 'top [057] Na etapa 314, os padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa são classificados com base no grau de relevância para a consulta de pesquisa, pelo motor de pesquisa 26. A consulta dada foi feita para sensores K que contêm um número Mi de símbolos no sensor ith o que implica um número total 2 χ Mi de atributos para o sensor ith. A semelhança de pontuação (SS) tal como descrito na equação 5 computa a similaridade entre exemplo recuperado I e consulta Q, em que Ni;j / Ri;j são um do atributo jth do sensor ith é de tipo aproximado / intervalo de atributo ou então igual a zero, Qi,j /li,j representa o valor do atributo jth de sensor ith para consulta / exemplo recuperado. Q*i,j é computado para atributos de intervalo que é o limite inferior/superior se a ligação é do tipo max/min ou a média dos limites superior e inferior se a ligação é de tipo entre. Tp é a mudança total permitida que o início de todas as marcações temporais pode ter e Ti é a diferença máxima nas marcações temporais iniciais de exemplo recuperado I através de todos os sensores. SS(Q ! . V] V «YM χ iQt., - 1;Μ ja + Λμ χ (Qíj - l,.j )a> * <S) 9 ·"« I T.~l Jp [058] Na etapa 316, pelo menos um dos padrões lógicos melhor classificados é detectado e recuperado em resposta à consulta de pesquisa, pelo recuperador de padrão 30 .

[059] A FIG. 4A é uma ilustração de output associado a um setup experimental com conjunto de dados de velocidade de veiculo e de pressão primária de cilindro obtidos para a condição de parada repentina que pode ser definida como queda repentina na velocidade do veiculo baseada nas rodas e aumento repentino na pressão primária de cilindro. Uma consulta multissensor exemplificativa é definida como "Velocidade de Veiculo Baseada nas Rodas: 0- : *, 3 :> 20 :< -5 & Pressão Primária de Cilindro Mestre: 0+ : *, 3 :< 10, > 200" o que significa que velocidade do veiculo baseada nas rodas deve ser estável aproximadamente a uma medida de 2 0 mph e depois deve cair com a taxa de 5 mph por segundo aproximadamente durante 3 segundos juntamente com a pressão primária de cilindro mestre que deve ser estável aproximadamente a uma média de 10 psi seguida por uma subida repentina a 200 psi por segundo aproximadamente durante 3 segundos. Na FIG. 4A, um tal exemplo recuperado é realçado. Vê-se que a pressão primária responde mais cedo e com uma duração mais curta em comparação com a velocidade do veiculo baseada nas rodas que indica que padrões através de sensores diferentes devem ser descritos e tratados separadamente. Cada pasta e cada arquivo que obteve quaisquer exemplos recuperados é levada para cima e cada arquivo com a maior classificação que ocorreu naquele arquivo ou pasta é solicitado para que exemplos melhor classificados possam ser localizados mais rapidamente.

[060] A FIG. 4B é uma ilustração de um output associado a um setup experimental com dados de sensor obtidos a partir de motores para a condição de carga que podem ser detectados determinando aqueles intervalos de tempo em que um elevado torque e baixa aceleração ocorrem juntamente. A FIG. 4B mostra que o comportamento de torque é similar à velocidade do motor durante a maior parte do tempo, como esperado. Mas para a condição de carga este comportamento de sensor fica invertido. Como pode ver-se a partir da FIG. 4B, o segmento realçado como devolvido pelo sistema da presente divulgação é o da condição de carga.

[061] De acordo com uma modalidade, antes de realizar qualquer processamento nas séries temporais T, pode ser realizada a suavização das séries temporais de dados se os dados forem ruidosos. Muitas vezes os dados recolhidos a uma taxa de amostragem mais elevada contêm muito ruido. A suavização ajuda a comprimir as séries temporais de dados. A suavização pode ser realizada por qualquer técnica conhecida na arte incluindo mas não limitada, a filtro de média móvel, uma vez que maior suavização por média móvel leva a mudanças lentas na inclinação e por isso a mais compressão nos dados. Esta vantagem, todavia, tem de ser pesada relativamente à perda de informações.

[062] De acordo com uma modalidade, o limiar de filtro de desvio pode ser ajustado para um valor baixo para possibilitar a recuperação de mais exemplos. Todavia, esta vantagem tem de ser pesada relativamente à geração de mais ruido.

[063] De acordo com uma modalidade, o valor de parâmetro Tp que é a mudança total permitida em marcações temporais iniciais de padrões lógicos tem de ser ajustada adequadamente uma vez que um alto valor de Tp pode levar a aumento de ruido.

[064] Em uma modalidade, o sistema e método da presente divulgação pode ser implementado em conjugação com abordagens baseadas em aprendizagem automática supervisionada ou semi supervisionada.

[065] De acordo com a presente divulgação, a linguagem de consulta descrita supramencionada pode descrever eventos de multissensores em termos de padrões lógicos de multissensores. A codificação e armazenamento de séries temporais de dados tal como descrita possibilita a pesquisa eficiente para tais padrões lógicos. Os sistemas e métodos da presente divulgação podem encontrar várias aplicações tais como a construção de uma ferramenta para anotar eventos e treinar um classificador de eventos em dados de sensor de veiculo ou para selecionar um número de subsequências para aplicar um tal classificador durante a fase de detecção, assim como para análise exploratória de dados. Os sistemas e métodos da presente divulgação são capazes de lidar com padrões lógicos multissensores que são de comprimento variável e forma similar juntamente com a mudança na sua ocorrência através de sensores diferente.

[066] A descrição escrita descreve o assunto aqui versado para possibilitar aos peritos na arte fazer e usar as modalidades da divulgação. O escopo das modalidades do assunto aqui definido pode incluir outras modificações que ocorram aos peritos na arte. Tais outras modificações destinam-se a ser incluídas no escopo se tiverem elementos similares que não diferem da linguagem literal das reivindicações ou se elas incluírem elementos equivalentes com diferenças não substanciais da linguagem literal.

[067] Todavia, deve ser entendido que o escopo da proteção é estendido a um tal programa e além disso a um suporte informático legível tendo uma mensagem incorporada no mesmo; esse meio de armazenamento informático legível contém meios de codificação de programa para implementação de uma ou mais etapas do método, quando o programa corre em um servidor ou dispositivo móvel ou qualquer dispositivo programável adequado. O dispositivo de hardware pode ser qualquer tipo de dispositivo que pode ser programado incluindo, e.g. qualquer tipo de computador como um servidor ou um computador pessoal, ou similares, ou qualquer combinação dos mesmos. O dispositivo pode também incluir meios que poderíam ser e.g. meios de hardware como e.g. um circuito integrado de aplicação específica (ASIC), uma Matriz de portas de campo programáveis (FPGA), ou uma combinação de meios de hardware e software, e.g. um ASIC e um FPGA, ou pelo menos um microprocessador e pelo menos uma memória com módulos de software localizados na mesma. Assim, os meios podem incluir tanto meios de hardware como meios de software. As modalidades de método aqui descritas podem ser implementadas em hardware e software. O dispositivo pode também incluir meios de software. Em alternativa, o sistema pode ser implementado em diferentes dispositivos de hardware, e.g. usando uma pluralidade de CPÜs.

[068] As modalidades aqui incorporadas podem compreender elementos de hardware e de software. As modalidades que são implementada em software incluem mas não estão limitadas a, firmware, software residente, microcódigo, etc. As funções efetuadas pelos vários módulos compreendendo o sistema da presente divulgação e aqui descritas podem ser implementadas em outros módulos ou combinações de outros módulos. Para efeitos desta descrição, um computador utilizável ou um suporte informático legível pode ser um aparelho que pode compreender, armazenar, comunicar, propagar, ou transportar o programa para uso por, ou em ligação com o sistema, aparelho, ou dispositivo de execução de instruções. Os vários módulos aqui descritos podem ser implementados tanto como módulos de software e/ou de hardware e podem ser armazenados em qualquer tipo de suporte informático legível duradouro ou outro dispositivo de armazenamento. Alguns exemplos não limitativos de suportes informáticos legíveis duradouros incluem CDs, DVDs, BLU-RAY, memória flash, drives de disco duro.

[069] Um sistema de processamento de dados adequado para ordenar e/ou executar um código de programa incluirá pelo menos um processador acoplado direta ou indiretamente a elementos de memória através de um bus de sistema. Os elementos de memória podem incluir memória local utilizada durante a execução real do código de programa, armazenamento de massa, e cache de memórias que fornecem armazenamento temporário de pelo menos algum código de programa para reduzir o número de vezes que o código tem de ser recuperado a partir do armazenamento de massa durante a execução.

[070] A descrição precedente foi apresentada com referência a várias modalidades. As pessoas com uma perícia vulgar na arte e tecnologia a quem este pedido é endereçado reconhecerão que podem ser praticadas alterações e mudanças nas estruturas e métodos de operação descritos sem saír-se sígnífícatívamente do princípio, espírito e escopo.

REIVINDICAÇÕES

Claims

1. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS A PARTIR DE SÉRIES TEMPORAIS DE DADOS MULTISSENSORES, caracterizado por compreender: receber pelo menos uma série temporal de dados de pelo menos um sensor para pesquisar e recuperar padrões lógicos, por um módulo de input; pré processar pelo menos uma das séries de dados temporais recebidas em pelo menos uma sequência de símbolos lógicos, por um pré processador; extrair padrões lógicos da pelo menos uma sequência de símbolos lógicos, por um extrator; agrupar e armazenar os padrões lógicos extraídos em um disco e em uma memória, por um organizador; e iterativamente efetuar: a descrição de um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida, por um gerador de padrão; a pesquisa e recuperação de pelo menos um cluster a partir do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para consulta de pesquisa, por um motor de pesquisa; a classificação dos padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa baseada no grau de relevância para a consulta de pesquisa, por um motor de classificação; e a recuperação de pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa, por um recuperador de padrão.

2. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela consulta de pesquisa ser uma consulta textual.

3. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela etapa de pré processar a pelo menos uma série temporal de dados recebidos compreender: dividir a pelo menos uma série temporal de dados recebidos em uma pluralidade de segmentos de série temporal que não se sobreponham; computar inclinações de cada segmento; ordenar e agrupar o conjunto de segmentos ordenados com base nas inclinações computadas, cada grupo tendo igual número de pontos de amostragem; computar inclinações médias para cada grupo de segmentos; anotar cada ponto de amostragem como aumentando ( + ) , estável (0) e decrescendo (-) comparando a inclinação com o valor médio de inclinação computado correspondente; e classificar a pelo menos uma série temporal de dados como uma sequência de simbolos lógicos em que os pontos de amostragem anotados, valor compreendendo magnitude média e comprimento do segmento.

4. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela etapa de pré processar a pelo menos uma série temporal de dados recebidos ser precedida pela etapa de suavização para eliminar ruído, a etapa de suavização sendo realizada pelo menos por uma técnica escolhida do grupo consistindo em filtro de média móvel, suavização aditiva, filtro de Butterworth, filtro digital, filtro de Kalman, suavização laplaciana, suavização exponencial, método de grelha estírada, filtro de passa baixo, filtro de suavização Savitzky-Golay, regressão local, suavização spline, algoritmo de Ramer-Douglas-Peucker, e filtro de Kolmogorov-Zurbenko.

5. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 3, caracterizado pela etapa de pré processar a pelo menos uma série temporal de dados recebidos compreender ainda a etapa de refinar a sequência de símbolos lógicos incorporando símbolos lógicos tendo comprimento do segmento inferior a um limiar predefinido.

6. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 3, caracterizado pelo valor e comprimento do segmento compreender pelo menos um de três atributos, tais como tipo livre, tipo aproximado e tipo de intervalo.

7. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela etapa de agrupar e armazenar os padrões lógicos extraídos compreender: predefinir um limiar comum para todos os sensores executando uma normalização-Z; rejeitar os padrões lógicos extraídos com desvio de magnitude menor do que o limiar predefinido; representar cada padrão lógico extraído de comprimento fixo de símbolos lógicos como um vetor; agrupar vetores semelhantes de acordo com marcação temporal, duração e valores de símbolos lógicos associados juntamente com o índice associado ou com o índice do símbolo seguinte no padrão lógico; armazenar os clusters num disco como banco de dados; e armazenar metadados dos clusters em uma memória em uma estrutura TRIE.

8. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela etapa de descrever um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida compreender definir pelo menos um atributo associado ao valor e comprimento do segmento para cada símbolo lógico.

9. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela etapa de pesquisar e recuperar pelo menos um cluster compreender: inicializar uma lista de contêiner de cluster para cada sensor envolvido na consulta de pesquisa, a lista de contêiner de cluster compreendendo uma primeira dimensão para armazenar índices de passagens e uma segunda dimensão para armazenar índice de marcações temporais em que o padrão lógico aparece no interior daquela passagem; ordenar os clusters no interior da estrutura TRIE para cada sensor com base na sua distância a partir da consulta de pesquisa; carregar os clusters mais próximos na lista de contêiner para cada sensor; executar iterativamente: a identificação de marcações temporais comuns que satisfazem propriedades especificadas pela consulta de pesquisa; computar valores heurísticos para todas as escolhas de clusters a carregar; carregar o cluster com o valor heurístico mais elevado; e terminar a pesquisa quando for alcançado um critério de término predefinido.

10. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 9, caracterizado pela etapa de identificar marcações temporais comuns compreender encontrar uma interseção de ocorrências de padrões lógicos através do pelo menos um sensor para marcações temporais comuns: detectando interseção na primeira dimensão da lista de contêiner de cluster; e detectando interseção na segunda dimensão da lista de contêiner de cluster, no caso de haver uma correspondência para interseção na primeira dimensão.

11. SISTEMA PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS A PARTIR DE SÉRIES TEMPORAIS DE DADOS MULTISSENSORES, caracterizado por compreender: um ou mais processadores; um dispositivo de interface de comunicação; um ou mais dispositivos de armazenamento interno operativamente acoplado(s) a um ou mais processadores para armazenar: um módulo de input configurado para receber pelo menos uma série temporal de dados a partir de pelo menos um sensor para pesquisar e recuperar padrões lógicos; um pré processador configurado para pré processar a pelo menos uma série temporal de dados recebidos em pelo menos uma sequência de símbolos lógicos; um extrator configurado para extrair padrões lógicos da pelo menos uma sequência de símbolos lógicos; um organizador configurado para agrupar e armazenar os padrões lógicos extraídos em um disco e em uma memória; um gerador de padrão configurado para descrever um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida; um motor de pesquisa configurado para pesquisar e recuperar pelo menos um cluster a partir do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para a consulta de pesquisa; um motor de classificação configurado para classificar os padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa com base no grau de relevância para a consulta de pesquisa; e um recuperador de padrão configurado para recuperar pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa.

12. PRODUTO DE PROGRAMA DE COMPUTADOR, compreendendo um meio de suporte informático legível duradouro tendo um suporte informático incorporado no mesmo, caracterizado pelo programa legível por computador, quando executado em um dispositivo informático, fazer com que o dispositivo informático: receba pelo menos uma série temporal de dados de pelo menos um sensor para pesquisar e recuperar padrões lógicos, por um módulo de input; pré processe a pelo menos uma série temporal de dados recebidos em pelo menos uma sequência de símbolos lógicos, por um pré processador; extraia padrões lógicos a partir da pelo menos uma sequência de símbolos lógicos, por um extrator; agrupe e armazene os padrões lógicos extraídos em um disco e em uma memória, por um organizador; descreva um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida, por um gerador de padrão; pesquise e recupere pelo menos um cluster do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para a consulta de pesquisa, por um motor de pesquisa; classifique os padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa com base no grau de relevância para a consulta de pesquisa, por um motor de classificação; e recupere pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa, por um recuperador de padrão.