BR102016005928A2 - método para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, sistema para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, e, produto de programa de computador - Google Patents

método para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, sistema para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, e, produto de programa de computador Download PDF

Info

Publication number
BR102016005928A2
BR102016005928A2 BR102016005928A BR102016005928A BR102016005928A2 BR 102016005928 A2 BR102016005928 A2 BR 102016005928A2 BR 102016005928 A BR102016005928 A BR 102016005928A BR 102016005928 A BR102016005928 A BR 102016005928A BR 102016005928 A2 BR102016005928 A2 BR 102016005928A2
Authority
BR
Brazil
Prior art keywords
logical
patterns
searching
search query
time series
Prior art date
Application number
BR102016005928A
Other languages
English (en)
Inventor
Ashwin Srinivasan
Ehtesham HASSAN
Gautam Shroff
Mohit Yadav
Puneet Agarwal
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of BR102016005928A2 publication Critical patent/BR102016005928A2/pt

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Fuzzy Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

são providenciados métodos e sistemas para pesquisar padrões lógicos em dados multissensores volumosos a partir da internet industrial. o método recupera exemplos de padrões em séries temporais de dados em que os padrões são especificados logicamente, usando uma sequência de símbolos. os símbolos lógicos usados são um subconjunto das abstrações qualitativas especificamente, os conceitos de estável, aumentando, decrescendo. os padrões podem incluir sequências de símbolos para multissensores, duração aproximada, assim como valores de inclinação para cada símbolo. para facilitar uma consulta eficiente, cada sensor de série temporal é pré processado em uma sequência de símbolos lógicos. cada posição na sequência comprimida resultante é registrada numa estrutura de índice trie correspondente aos múltiplos padrões lógicos a que pode pertencer. padrões multissensores lógicos são eficientemente recuperados e classificados utilizando uma tal estrutura. este método de indexar e pesquisar providencia um mecanismo eficiente para uma análise exploratória de dados multissensores volumosos.

Description

MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS A PARTIR DE SÉRIES TEMPORAIS DE DADOS MULTISSENSORES, SISTEMA PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS A PARTIR DE SÉRIES TEMPORAIS DE DADOS MULTISSENSORES, E, PRODUTO DE PROGRAMA DE COMPUTADOR
REFERÊNCIA CRUZADA A PEDIDOS E PRIORIDADE RELACIONADOS
[001] O presente pedido reivindica a prioridade do pedido de Patente indiana n.° 2351/MUM/2015, depositado em 19 de junho de 2015, a qual é aqui incorporada na sua totalidade a titulo de referência.
CAMPO TÉCNICO
[002] As modalidades aqui mencionadas se referem geralmente à pesquisa de padrões lógicos e, mais particularmente, à pesquisa de padrões lógicos que são volumosos e incluem dados distintos disponíveis a partir da internet industrial.
ANTECEDENTES
[003] A automatização atualmente é caracterizada por instrumentação disseminada com multissensores que resultam em dados volumosos no comportamento de maquinaria que vai de simples comutadores a sistemas complexos que incluem centenas de milhares de peças. O volume e diversidade de dados a partir de miríades de sensores instalados tem o potencial para ajudar a compreender melhor os ambientes em que estas máquinas estão a operar. Torna-se imperativo para engenheiros e técnicos trabalhar com tais dados para procurar eventos específicos tais como "paradas repentinas", "trocas de faixa", "sobrecarga do motor" etc. Cada padrão pode habitualmente ser expresso em termos da ocorrência simultânea de um conjunto de padrões lógicos através de multissensores. Por exemplo, uma parada repentina é uma queda súbita de velocidade juntamente com uma pressão de frenagem crescente em um curto espaço de tempo. Ocorrências especificas de tais padrões podem diferir em sua duração real, assim como a exata natureza de cada queda ou aumento em uma sequência especificada. Assim, técnicas tradicionais que assentam em correspondências de formas de onda quase exatas falham em muitos exemplos.
[004] Eventos de interesse são muitas vezes caracterizados por um conjunto de padrões em multissensores, ocorrendo simultaneamente. Além disso, a duração de cada ocorrência de um evento não é constante. Por exemplo, os condutores de veículos não aplicam sempre frenagens repentinas com uma duração fixa todas as vezes. Além disso, se observa que a duração do evento é diferente em cada sensor, envolvido no evento. Por exemplo, quando se aplica uma frenagem repentina em um veículo, o padrão em um sensor de freio é de duração mais longa do que em um sensor de velocidade. O problema fica ainda mais complexo porque os padrões não têm de ocorrer na mesma janela de tempo para cada um dos sensores. Por exemplo, pode existir um pequeno intervalo de tempo entre o padrão de início de uma 'frenagem repentina' em sensor de velocidade versus o sensor de freio. Valores em falta em leituras de sensor complicam ainda mais a questão fazendo da pesquisa de padrões multissensores um desafio.
[005] Muitas vezes eventos de interesse são baseados no domínio do conhecimento. Todavia, requer depois um esforço manual significativo anotar eventos em dados de sensor volumosos. Na prática, tais eventos são detectados programaticamente por pesquisa de condições codificadas que são observadas nos valores do sensor. Por exemplo, um evento poderia ser traduzido em uma regra codificada que procura situações em que o "sensor-1 é maior do que sl no tempo tl e o derivado do sensor-2 é mais do que d2 para a duração t2". Por causa dos desafios práticos, tais regras codificadas são muitas vezes ineficazes, e também difíceis de implementar. Técnicas alternativas para a detecção de séries temporais de eventos usam técnicas de aprendizagem automática, mas a maioria destes métodos trabalham em subsequências de séries temporais que já foram extraídas a partir de séries temporais completas. Todavia, esses métodos conhecidos na arte são minados por desafios que incluem mas não estão limitados a, duração variável de eventos, desalinhamento em tempo de ocorrências de padrões através de sensores e variação na resposta ao mesmo evento. Além disso, os métodos conhecidos na arte encontram correspondências com um padrão particular em vez de todos os exemplos que poderíam corresponder a um evento de interesse.
[006] Uma grande parte da arte anterior também se focou na classificação supervisionada para a identificação de eventos em séries temporais. Algumas usam uma mistura de métodos supervisionados e não supervisionados para descobrir padrões temporais a partir do conjunto de dados e podem discriminar estes padrões temporais dos restantes. Mas todos esses métodos requerem exemplos etiquetados de segmentos de séries temporais para treinar seus classificadores. Além disso, a maioria destas abordagens trabalha em segmentos de séries temporais de comprimento fixo. Todavia, esses métodos também lutam para detectar eventos práticos que são de comprimento variável e abrangem multissensores, uma vez que seria necessário explorar comprimentos múltiplos de janelas abrangendo todas as séries temporais, fazendo a detecção computacionalmente intensiva usando uma tal abordagem.
[007] Existe, portanto, uma necessidade de métodos e sistemas que abordem os inconvenientes acima e outros inconvenientes e limitações possíveis dos métodos e sistemas presentemente utilizados relacionados com o campo da pesquisa de padrões lógicos.
SUMÁRIO
[008] Modalidades da presente divulgação apresentam melhoramentos tecnológicos como soluções para um ou mais dos problemas técnicos acima descritos reconhecidos pelos inventores em sistemas convencionais.
[009] São descritos métodos e sistemas que possibilitam a pesquisa de padrões lógicos a partir de séries temporais de dados multissensores. A pesquisa e a consulta em séries temporais de dados multissensores de grande volume, séries temporais de dados compactação, formação de consulta para pesquisa em séries e indexação e armazenamento de séries temporais são alguns dos desafios colocados pelos sistemas e métodos da presente divulgação assegurando ao mesmo tempo eficácia e precisão.
[010] Em um aspecto, é fornecido um método para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores que podem incluir receber pelo menos uma série temporal de dados a partir de pelo menos um sensor para pesquisar e recuperar padrões lógicos, por um módulo de input; pré-processar a pelo menos uma séries temporal de dados recebidos em pelo menos uma sequência de símbolos lógicos, por um pré-processador; extrair padrões lógicos a partir da pelo menos uma sequência de símbolos lógicos, por um extrator; agrupar e armazenar os padrões lógicos extraídos em um disco e em uma memória, por um organizador; e íterativamente efetuar: a descrição de um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida, por um gerador de padrão; a pesquisa e recuperação de pelo menos um cluster a partir do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para consulta de pesquisa, por um motor de pesquisa; a classificação dos padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa baseada no grau de relevância para a consulta de pesquisa, por um motor de classificação; e a recuperação de pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa, por um recuperador de padrão.
[011] Em uma modalidade, a etapa de pré-processar a pelo menos uma série temporal de dados recebidos pode ainda incluir dividir a pelo menos uma série temporal de dados recebidos em uma pluralidade de segmentos de série temporal que não se sobreponham; computar inclinações de cada segmento; ordenar e agrupar o conjunto de segmentos ordenados com base nas inclinações computadas, cada grupo tendo igual número de pontos de amostragem; computar inclinações médias para cada grupo de segmentos; anotar cada ponto de amostragem como aumentando (+), estável (0) e decrescendo (-) comparando a inclinação com o valor médio de inclinação computado correspondente; e classificar a pelo menos uma série temporal de dados como uma sequência de símbolos lógicos caracterizada pelos pontos de amostragem anotados, valor compreendendo magnitude média e comprimento do segmento.
[012] Em uma modalidade, a etapa de pré-processar a pelo menos uma série temporal de dados recebidos é precedida pela etapa de suavização para eliminar ruído, a etapa de suavização sendo realizada pelo menos por uma técnica escolhida do grupo consistindo em filtro de média móvel, suavização aditiva, filtro de Butterworth, filtro digital, filtro de Kalman, suavização laplaciana, suavização exponencial, método de grelha estirada, filtro de passa baixo, filtro de suavização Savitzky-Golay, regressão local, suavização spline, algoritmo de Ramer-Douglas-Peucker, e filtro de Kolmogorov-Zurbenko.
[013] De acordo com uma modalidade, a etapa de pré-processar a pelo menos uma série temporal de dados recebidos compreende ainda a etapa de refinar a sequência de símbolos lógicos incorporando símbolos lógicos tendo comprimento do segmento inferior a um limiar predefinido.
[014] De acordo com uma modalidade, o valor e comprimento do segmento pode incluir pelo menos um de três atributos, tais como tipo livre, tipo aproximado e tipo de intervalo.
[015] Em uma modalidade, a etapa de agrupar e armazenar os padrões lógicos extraídos pode ainda compreender: predefinir um limiar comum para todos os sensores executando uma normalização-Z; rejeitar os padrões lógicos extraídos com desvio de magnitude menor do que o limiar predefinido; representar cada padrão lógico extraído de comprimento fixo de símbolos lógicos como um vetor; agrupar vetores semelhantes de acordo com marcação temporal, duração e valores de símbolos lógicos associados juntamente com o índice associado ou com o índice do símbolo seguinte no padrão lógico; armazenar os clusters em um disco como banco de dados; e armazenar metadados dos clusters em uma memória em uma estrutura TRIE.
[016] Em uma modalidade, a etapa de descrever um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida pode ainda compreender definir pelo menos um atributo associado ao valor e comprimento do segmento para cada símbolo lógico.
[017] Em uma modalidade, a etapa de pesquisar e recuperar pelo menos um cluster pode ainda compreender: inicializar uma lista de contêiner de cluster para cada sensor envolvido na consulta de pesquisa, a lista de contêiner de cluster compreendendo uma primeira dimensão para armazenar índices de passagens e uma segunda dimensão para armazenar índice de marcações temporais em que o padrão lógico aparece no interior daquela passagem; ordenar os clusters no interior da estrutura TRIE para cada sensor com base na sua distância a partir da consulta de pesquisa; carregar os clusters mais próximos na lista de contêiner para cada sensor; executar iterativamente: a identificação de marcações temporais comuns que satisfazem propriedades especificadas pela consulta de pesquisa; computar valores heurísticos para todas as escolhas de clusters a carregar; carregar o cluster com o valor heurístico mais elevado; e terminar a pesquisa quando for alcançado um critério de término predefinido.
[018] De acordo com uma modalidade, a consulta de pesquisa é uma consulta textual.
[019] De acordo com uma modalidade, a etapa de identificar marcações temporais comuns pode compreender encontrar uma interseção de ocorrências de padrões lógicos através do pelo menos um sensor para marcações temporais comuns: detectando interseção na primeira dimensão da lista de contêiner de cluster; e detectando interseção na segunda dimensão da lista de contêiner de cluster, no caso de haver uma correspondência para interseção na primeira dimensão.
[020] Em um outro aspecto, é fornecido um sistema para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores compreendendo: um ou mais processadores; um dispositivo de interface de comunicação; um ou mais dispositivos de armazenamento interno operativamente acoplado(s) a um ou mais processadores para armazenar: um módulo de input configurado para receber pelo menos uma série temporal de dados a partir de pelo menos um sensor para pesquisar e recuperar padrões lógicos; um pré-processador configurado para pré-processar a pelo menos uma série temporal de dados recebidos em pelo menos uma sequência de símbolos lógicos; um extrator configurado para extrair padrões lógicos da pelo menos uma sequência de símbolos lógicos; um organizador configurado para agrupar e armazenar os padrões lógicos extraídos em um disco e em uma memória; um gerador de padrão configurado para descrever um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida; um motor de pesquisa configurado para pesquisar e recuperar pelo menos um cluster a partir do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para a consulta de pesquisa; um motor de classificação configurado para classificar os padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa com base no grau de relevância para a consulta de pesquisa; e um recuperador de padrão configurado para recuperar pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa.
[021] Ainda em um outro aspecto, é fornecido um produto de programa de computador compreendendo um meio de suporte informático legível duradouro tendo um suporte informático incorporado no mesmo, em que o programa de computador legível, quando executado em um dispositivo informático, faça com que o dispositivo informático: receba pelo menos uma série temporal de dados de pelo menos um sensor para pesquisar e recuperar padrões lógicos, por um módulo de input; pré-processe a pelo menos uma série temporal de dados recebidos em pelo menos uma sequência de símbolos lógicos, por um pré-processador; extraia padrões lógicos a partir da pelo menos uma sequência de símbolos lógicos, por um extrator; agrupe e armazene os padrões lógicos extraídos em um disco e em uma memória, por um organizador; descreva um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida, por um gerador de padrão; pesquise e recupere pelo menos um cluster do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para a consulta de pesquisa, por um motor de pesquisa; classifique os padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa com base no grau de relevância para a consulta de pesquisa, por um motor de classificação; e recupere pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa, por um recuperador de padrão.
[022] Deve ser compreendido que tanto a descrição geral supracitada como a descrição detalhada seguinte são apenas exemplificativas e explicativas e não são restritivas da invenção, tal como reivindicada.
BREVE DESCRIÇÃO DOS DESENHOS
[023] As modalidades aqui referidas serão melhor compreendidas a partir da descrição detalhada que se segue com referência aos desenhos, nos quais: [024] A FIG. 1 ilustra um diagrama de blocos exemplificativo de um sistema para pesquisar padrões lógicos a partir de séries temporais de dados multissensores volumosos disponíveis a partir da internet industrial de acordo com uma modalidade da presente divulgação;
[025] A FIG. 2 ilustra uma estrutura de índice TRIE implementada pelo sistema da presente divulgação de acordo com uma modalidade da presente divulgação;
[026] A FIG. 3 é um diagrama de fluxo exemplificativo ilustrando um método para a pesquisa de padrões lógicos a partir de séries temporais de dados multissensores volumosos usando o sistema da FIG. 1 de acordo com uma modalidade da presente divulgação;
[027] A FIG. 4A é uma ilustração de output associado a um setup experimental com o conjunto de dados de velocidade do veículo e pressão primária de cilindro obtidos para condição de parada repentina; e [028] A FIG. 4B é uma ilustração de um output associado a um setup experimental com dados de sensor obtidos a partir de motores para a condição de carga.
[029] Deve ser reconhecido pelos peritos na arte que qualquer diagrama de blocos aqui mencionado representa vistas conceptuais de sistemas ilustrativos incorporando os princípios do presente assunto. De modo semelhante, será reconhecido que quaisquer diagramas de fluxo, fluxogramas, diagramas de transição de estado, pseudo código, e similares representam vários processos que podem ser substancialmente representados em meio de suporte informático legível e assim executados por um processador ou dispositivo informático, quer esse dispositivo informático dispositivo ou processador seja ou não explicitamente mostrado.
DESCRIÇÃO DETALHADA
[030] As modalidades aqui referidas e suas várias características e detalhes vantajosos são explicados mais completamente com referência às modalidades não limitativas que são ilustradas nos desenhos anexados e na descrição detalhada seguinte. Os exemplos aqui usados são destinados meramente a facilitar um entendimento dos modos como as modalidades aqui mencionadas podem ser praticadas e a permitir ainda que os peritos na arte pratiquem as modalidades aqui incorporadas. Consequentemente, os exemplos não devem ser interpretados como limitando o escopo das modalidades aqui incorporadas.
[031] A expressão internet industrial tal como referida na presente divulgação diz respeito à integração de maquinaria física com sensores e software em rede. Dados volumosos capturados a partir do grande número de sensores geralmente associados a máquinas de todos os tipos incluindo motores, equipamento fabril e similares são transmitidos para ulterior análise comportamental das máquinas associadas sob várias condições. Tais dados recebidos a partir de sensores, quer estejam direta ou indiretamente acoplados ao sistema na forma de séries temporais de dados servem como input ao sistema da presente divulgação.
[032] As modalidades aqui mencionadas fornecem sistemas e métodos para pesquisar padrões lógicos a partir de séries temporais de dados multissensores volumosos disponíveis a partir da internet industrial. Os sistemas para a pesquisa de padrões lógicos são confrontados com desafios práticos particularmente quando os padrões se referem a durações variáveis de eventos, existe mudança no tempo de ocorrências de padrões através de sensores diferentes e existe uma variação no tempo de resposta de sensores diferentes ao mesmo evento real. Os padrões caracterizam eventos e é imperativo poder pesquisar eficazmente padrões e identificar eventos associados para se poderem usar eficazmente os dados volumosos disponíveis. Os sistemas e métodos da presente divulgação abordam particularmente estas questões da arte encontrando ocorrências de um padrão dada a sua descrição em termos lógicos em vez de descobrir padrões temporais que caracterizam o comportamento do sistema subj acente.
[033] Por facilidade de explanação, a descrição de sistemas e métodos da presente divulgação é fornecida com referência a exemplo não limitativo de sessões de operação de um sistema mecânico exemplificativo, por exemplo a deslocação de um veículo. Pode ser compreendido que os sistemas e métodos da presente divulgação podem encontrar aplicabilidade em qualquer domínio em que é requerida a análise de dados exploratórios, marcando ocorrências de eventos candidatos para treinar um sistema de aprendizagem automática, por análise humana de exemplos recuperados em resposta a uma consulta de padrão lógico e selecionar subsequências nas quais aplicar um classificador.
[034] Embora os sistemas e métodos da presente divulgação sejam aqui a seguir explicados com referência a duas ou mais séries temporais de dados recebidos pelo sistema da presente divulgação, pode ser entendido por um perito no ramo que os sistemas e métodos da presente divulgação podem encontrar aplicabilidade mesmo quando apenas está envolvida uma série temporal de dados.
[035] Fazendo agora referência aos desenhos, a FIG. 1 ilustra um diagrama de blocos exemplificativo do sistema 100 para a pesquisa de padrões lógicos a partir de séries temporais de dados multissensores volumosos disponíveis a partir de sensores 10 integrados na internet industrial de acordo com uma modalidade da presente divulgação. A FIG. 3 é um fluxograma exemplificativo ilustrando um método 300 para a pesquisa de padrões lógicos a partir de séries temporais de dados multissensores volumosos usando o sistema da FIG. 1 de acordo com uma modalidade da presente divulgação. As etapas do método 300 da presente divulgação irão agora ser explicadas com referência aos componentes do sistema 100 como representado na FIG. 1.
[036] Na etapa 302, as séries temporais de dados de sensores 10 são recebidos no módulo de input 12 do sistema 100 para pesquisar e recuperar padrões lógicos.
[037] Na etapa 304, as séries temporais de dados recebidos são pré-processadas em sequências de símbolos lógicos, pelo pré-processador 14. As séries temporais de dados multissensores T são obtidas a partir de multissensores e registradas durante muitas sessões de operação do sistema mecânico subjacente tal como uma deslocaçâo de um carro, um dia de operação de uma usina, e similares. Para efeitos de explanação, sessões de operações tais como deslocações de veículos subjacentes são também referidas com segmentos de séries temporais T. Antes de processar os dados em bruto T, são divididos em múltiplos segmentos {Ti, T2, ...., TM}, os quais correspondem a diferentes deslocações de veículos. Cada segmento de séries temporais Τ2 é então convertido em uma ί ί i sequência de símbolos logicos Z2 = {Z Z2 ZN} .
[038] Na etapa 306, são extraídos padrões lógicos a partir de sequências de símbolos lógicos, pelo extrator 16. Para cada deslocaçâo Ti, são computadas inclinações que é a diferença entre valores de sensores adjacentes. Um número suficientemente grande de amostras é considerado e ordenado. Essa lista ordenada é depois dividida em três grupos, mantendo o número de pontos em cada grupo como o mesmo, e depois é computada a inclinação média para cada grupo. Com base no valor dessas inclinações médias esses grupos são representados por símbolos ' + ' , '0' e , representando padrões aumentando(+), estável(0), e decrescendo(-) em séries temporais. A inclinação de cada ponto nas séries temporais multivariadas Ti é depois comparada com os valores médios correspondentes de inclinações dos três símbolos, e com base em qual dessas distância é a menor aquele ponto das séries temporais é codificado como '+', '0', ou . Todas as ocorrências contínuas de um símbolo são substituídas por pares de termos incluindo o símbolo e seu comprimento. Nesse par de termos, a inclinação média de vários pontos que foram removidos para criar esse par é também incluída. O tríplice (símbolo lógico Z, contagem do símbolo k e contagem do segmento i) , é i representado como Z , i.e., símbolo k do segmento i de series temporais e inclui três termos: o símbolo, o seu comprimento i e a inclinação media de pontos representados por Z . Como um resultado, a série temporal é representada pela sequência de í ί i símbolos logícos Z± = {Z Z2 ZN} . De acordo com uma modalidade, a sequência lógica é ainda aperfeiçoada combinando tríplices que são de menor duração do que um limiar para acabar com ruído tal como indicado no Algoritmo 1 mencionado abaixo.
[039] Na etapa 308, os padrões lógicos extraídos são agrupados e armazenados no disco 20 e na memória 22, pelo organizador 18. Um padrão lógico é uma sequência de símbolos ' + ' , '0', ou sem qualquer par de símbolos idênticos adjacentes. Todos os padrões lógicos de símbolos de até um comprimento fixo (por exemplo 5 unidades) são extraídos. Depois de extrair os padrões lógicos a partir das sequências, os padrões que têm um desvio de magnitude menor do que um limiar predefinido são rejeitados. O desvio de magnitude de um padrão lógico é medido como a diferença entre valores máximo e mínimo das séries temporais correspondentes àquele padrão. Uma vez que sensores diferentes têm intervalos de valores diferentes, cada sensor necessitaria de um limiar diferente. Tendo em vista evitar limiares múltiplos, é efetuada a normalização-Z e é definido um único limiar para todos os sensores. Depois da eliminação de padrões tendo um desvio de magnitude menor do que um limiar predefinido, todos os exemplos que pertencem a um padrão lógico válido, por exemplo {-, 0, +} são compilados. Cada padrão de comprimento fixo de símbolos é representado com um vector. As dimensões dos vectores incluem comprimento (duração) de cada símbolo no padrão, inclinações médias de '+' e símbolos , e valor médio absoluto das séries temporais correspondentes ao símbolo '0' . A normalização é efetuada para livrar-se da tendência que aparece devido à elevada variação no intervalo de diferentes sensores. Os vectores são depois agrupados usando técnicas conhecidas na arte incluindo, mas não limitadas ao agrupamento Birch. De acordo com uma modalidade, se um padrão inicia ou termina com o símbolo '0', o seu comprimento é ignorado durante a etapa de agrupamento. Isto é baseado no fato de que o veículo permanece estacionário durante um intervalo de tempo maior depois/antes de vários eventos que podem não ser relevantes em muitos cenários práticos. Por exemplo, o tempo durante o qual o veiculo esteve a circular antes de a parada repentina ter sido aplicada pode não ser relevante para uma análise.
[040] É mantida uma pasta para cada sensor e a pasta pode conter um arquivo para cada padrão lógico desse sensor. Todos os clusters de um padrão são armazenados no mesmo arquivo. Vários clusters são escritos no arquivo de uma maneira sequencial. Cada descrição de cluster contém os vectores do padrão lógico, ordenados de acordo com a marcação temporal e têm segmentos de séries temporais marcadas. Para cada marcação temporal, são armazenadas as durações e valores de cada símbolo presentes juntamente com o índice em que começa o padrão lógico no segmento de séries temporais. Existe uma exceção para aqueles padrões lógicos que começam com '0'; para eles é armazenado o índice do próximo símbolo presente no padrão lógico.
[041] Além de armazenar os resultados obtidos após o agrupamento de padrões lógicos, são também computados e armazenados metadados destes clusters que têm de ser carregados antes da execução de qualquer consulta em estrutura TRIE (como ilustrado na FIG. 2) . A FIG. 2 ilustra uma estrutura de índice TRIE 200 implementada pelo sistema da presente divulgação de acordo com uma modalidade da presente divulgação. Na estrutura TRIE, o nó raiz da TRIE é definido como NÜLL, e tem três nós filhos, um para cada símbolo lógico que pode ocorrer no início de um padrão lógico. Em cada nível seguinte da TRIE também cada nó tem três nós filhos, dois deles são usados para símbolos seguintes de um padrão lógico e o terceiro nó (no meio, com forma de diamante na FIG. 2) é usado para armazenar informações sobre o padrão lógico que começa no nó raiz e termina no nó atual. 0 nó em diamante no final de cada padrão lógico contém três tipos de informações: informações sobre clusters, localizações de clusters e fatores de normalização usados durante o agrupamento. As informações de cluster incluem centróide, raio e índices de listas de passagens que ele contém e isto está sendo usado em computação de valores heurísticos, i.e., em fazer uma escolha de qual o cluster a carregar a seguir. A localização de cluster é armazenada usando dois números, que indicam o número de bytes a saltar, e o número de bytes a carregar a partir do arquivo de padrão lógico correspondente. São usados fatores de normalização para normalizar a duração e valores de consulta antes de compará-los com clusters durante a pesquisa.
[042] De acordo com uma modalidade, as etapas 302 a 308 do método da presente divulgação podem ser implementadas off-line e têm que ser executadas apenas uma vez e as etapas 310 a 316 podem ser uma implementação on-line e podem ser executadas iterativamente para cada consulta de pesquisa.
[043] Na etapa 310, os padrões a serem recuperados a partir dos clusters armazenados são descritos em uma consulta de pesquisa predefinida, pelo gerador de padrão 28. Um evento pode ser consultado, usando um padrão lógico de multissensores. Para cada símbolo do padrão, são também especificados a duração e um valor. Os valores de símbolo '+' e contêm suas inclinações médias enquanto para o símbolo '0' ele contém a magnitude média do símbolo. Esses valores e durações podem ter um dos três tipos de atributos seguintes: 1. Tipo livre: Este tipo de valor permite que as variáveis recuperadas tomem qualquer valor e é representado por '*'. 2. Tipo aproximado: esse tipo de valor é representado por um número e.g. '10'. Tal valor indica que o valor alvo deve ser aproximadamente próximo desse valor. 3. Tipo de intervalo: Este tipo de valor aplica um critério rigoroso para símbolos recuperados. Isso pode ser representado de três modos, o primeiro modo é estar vinculado ao máximo da média de símbolo e.g. '< 10', o segundo modo é estar vinculado ao mínimo da média do símbolo e.g. '> IO' e o terceiro modo é estar vinculado ao mínimo e ao máximo e.g. '8 - 12' .
[044] Portanto, a consulta para um evento em um sensor único, de acordo com a presente divulgação pode ser escrita como: [045] "Velocidade de Motor: 0-0: *, 3, * :> 30: 4-8 :< 10" em que, *, 3, * representa durações de símbolos e implica que a velocidade do motor deve ser estável '0' para qualquer duração de tempo e deve cair durante aproximadamente 3 segundos, e depois se tornar estável '0' novamente durante qualquer duração.
[046] Novamente, >30: 4-8 :< 10 representa informações sobre os símbolos e implica que a velocidade do motor deve ter um valor médio absoluto > 30 e depois disso deve cair com uma média 4-8 seguida por um estado estável com valor médio absoluto < 10. Desta maneira, a linguagem de consulta da presente divulgação permite descrever formas muito complexas com precisão muito elevada. Similarmente, uma consulta para padrões lógicos multissensores pode ser definida especificando uma consulta válida para cada sensor.
[047] Na etapa 312, pelo menos um cluster é pesquisado e recuperado a partir do disco referenciado na estrutura de índice TRIE (ilustrada na FIG. 2) na memória 22, se for considerado relevante para a consulta de pesquisa, pelo motor de pesquisa 24. O Algoritmo 2 para a pesquisa de ocorrências de padrões lógicos multissensores é indicado aqui abaixo.
[048] O Algoritmo 2 pode ser usado para encontrar índices de padrões com propriedades especificadas na consulta. Os padrões lógicos são armazenados em arquivos com clusters separados tal como descrito aqui acima na etapa 308. Para encontrar índices, primeiramente os clusters relevantes são carregados na memória por uma abordagem heurística predefinida. Dado um cluster a partir de cada sensor presente na consulta, são identificados os índices comuns com propriedades especificadas na consulta através de multissensores.
[049] Uma primeira etapa executada pelo Algoritmo 2 inclui inicializar uma lista de contêiner de cluster para cada sensor envolvido na consulta. Isto será usado para carregar clusters de padrões lógicos baseados nos nós na TRIE correspondente ao padrão lógico expresso para um sensor particular. A lista de contêiner de cluster é uma lista bidimensional em que uma dimensão é usada para armazenar índices de passagens e outra para índices de marcações temporais em que aquele padrão lógico particular apareceu naquela passagem. Ambos os índices de passagens e marcações temporais foram ordenados antes de armazená-los como explicado na etapa 308 de modo que as suas interseções podem ser detectadas mais rapidamente.
[050] Uma segunda etapa executada pelo Algoritmo 2 inclui dispor clusters no nó correspondente ao padrão lógico especificado dentro da estrutura TRIE para cada sensor. Os clusters C são ordenados pela sua distância da consulta Q como definido na equação 3 abaixo, que é o produto da distância aproximada descrita na equação 1 para atributos tipo aproximado e de intervalo de distância descrito na equação 2 para atributos tipo de intervalo. As medições de distância aproximada calculam a distância entre a distância aproximada (A) e as medições de intervalo de distância (R) calculam as chances de não ter marcações temporais no intervalo para aquele cluster. Na equação 1 e na equação 2, Ai/Ri (distância aproximada / distância de intervalo) é igual a 1 se a variável i em C é de tipo aproximado/intervalo e Qi /Ci são variáveis i de consulta/cluster. M é a contagem de símbolos presentes no padrão lógico para um sensor. O raio (C) representa o raio de cluster Cea sobreposiçãoi é a fração de cluster que está no intervalo para o primeiro atributo tipo de intervalo i. Por exemplo, se o cluster tem raio 2 e o centro em (2, 0) então, para a dimensão dimensão-x- i.e. a sobreposiçãoi será 0,25, 0,5, 0 correspondendo a > 3, 1 - 3, < 0 e para a dimensão-y a sobreposiçãoi será 0,25, 0,5, 0,75 correspondendo a > 1, (-1) - (1), > -1. Como é claro a partir da equação 3, a medição da distância é 00 se um cluster está fora do intervalo para qualquer dos atributos tipo de intervalo especificado. Se o cluster mais próximo tem distância 00 então não existe correspondência encontrada para a consulta. áist(Q, C) = AD(Q, C'i x C) (3) [051] Uma terceira etapa executada pelo Algoritmo 2 inclui carregar os clusters mais próximos na memória para cada sensor.
[052] A quinta etapa executada pelo Algoritmo 2 inclui encontrar marcações temporais que satisfaçam propriedades especificada pela consulta. Para fazer isso, primeiro a interseção na primeira dimensão do cluster que é índices de passagens é detectada. Se for encontrada qualquer correspondência, então a interseção em outra dimensão de marcações temporais é detectada. Enquanto marcações temporais correspondentes, mesmo se as marcações temporais iniciais de padrões lógicos através de sensores diferentes são inferiores a um limiar, elas são consideradas como correspondências relevantes. Isto é feito para levar em conta a diferença no tempo de resposta de sensores diferentes para um evento particular e em segundo lugar esta diferença pode existir devido ao processo de codificação do símbolo.
[053] A sexta etapa do Algoritmo 2 inclui uma verificação para o critério de término para terminar o processo de pesquisa.
[054] A sétima etapa do Algoritmo 2 inclui a computação de valores heurísticos tal como definido na equação 4 para todos os clusters relevantes a carregar. São preferidos valores heurísticos mais altos (HV) em primeiro lugar para a maior probabilidade de correspondência e em segundo lugar para um sucesso mais rápido.
[055] A oitava etapa do Algoritmo 2 inclui carregar o cluster com o maior valor heurístico. Depois desta etapa, as etapas 5 a 8 são repetidas a menos que o critério de término na sexta etapa seja cumprido. Em novas iterações na etapa 5 do Algoritmo 2, são consideradas todas as novas combinações de clusters tornadas devidas para clusters recém carregados com clusters anteriormente carregados a partir do resto dos sensores. Embora seja raro, existe uma pequena possibilidade de ter todos os clusters a voltar a um valor heurístico zero nas fases iniciais de pesquisa especialmente quando os clusters iniciais carregados são pequenos. Nesse caso é escolhido um cluster aleatório para carregar o resto dos sensores, e eles são mantidos na lista de espera e a seguir na lista de cluster para serem tomados outros sensores. Na iteração seguinte, estes clusters em espera são considerados uma escolha juntamente com o cluster que é o próximo na lista.
[056] Os clusters que estão fora do intervalo para uma ou mais variáveis virão em conjunto no final da lista. Quando qualquer cluster chega na lista esse sensor é considerado como tendo sido rastreado. Uma vez que os clusters associados a todos os sensores sejam rastreados, a pesquisa é terminada. Além disso, é mantida uma contagem do número de exemplos recuperados e a pesquisa é terminada quando o número de exemplos recuperados é igual ou maior do que o que foi consultado, o que sucede no cenário em que o usuário consulta pelos resultados 'top [057] Na etapa 314, os padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa são classificados com base no grau de relevância para a consulta de pesquisa, pelo motor de pesquisa 26. A consulta dada foi feita para sensores K que contêm um número Mi de símbolos no sensor ith o que implica um número total 2 χ Mi de atributos para o sensor ith. A semelhança de pontuação (SS) tal como descrito na equação 5 computa a similaridade entre exemplo recuperado I e consulta Q, em que Ni;j / Ri;j são um do atributo jth do sensor ith é de tipo aproximado / intervalo de atributo ou então igual a zero, Qi,j /li,j representa o valor do atributo jth de sensor ith para consulta / exemplo recuperado. Q*i,j é computado para atributos de intervalo que é o limite inferior/superior se a ligação é do tipo max/min ou a média dos limites superior e inferior se a ligação é de tipo entre. Tp é a mudança total permitida que o início de todas as marcações temporais pode ter e Ti é a diferença máxima nas marcações temporais iniciais de exemplo recuperado I através de todos os sensores. SS(Q ! . V] V «YM χ iQt., - 1;Μ ja + Λμ χ (Qíj - l,.j )a> * <S) 9 ·"« I T.~l Jp [058] Na etapa 316, pelo menos um dos padrões lógicos melhor classificados é detectado e recuperado em resposta à consulta de pesquisa, pelo recuperador de padrão 30 .
[059] A FIG. 4A é uma ilustração de output associado a um setup experimental com conjunto de dados de velocidade de veiculo e de pressão primária de cilindro obtidos para a condição de parada repentina que pode ser definida como queda repentina na velocidade do veiculo baseada nas rodas e aumento repentino na pressão primária de cilindro. Uma consulta multissensor exemplificativa é definida como "Velocidade de Veiculo Baseada nas Rodas: 0- : *, 3 :> 20 :< -5 & Pressão Primária de Cilindro Mestre: 0+ : *, 3 :< 10, > 200" o que significa que velocidade do veiculo baseada nas rodas deve ser estável aproximadamente a uma medida de 2 0 mph e depois deve cair com a taxa de 5 mph por segundo aproximadamente durante 3 segundos juntamente com a pressão primária de cilindro mestre que deve ser estável aproximadamente a uma média de 10 psi seguida por uma subida repentina a 200 psi por segundo aproximadamente durante 3 segundos. Na FIG. 4A, um tal exemplo recuperado é realçado. Vê-se que a pressão primária responde mais cedo e com uma duração mais curta em comparação com a velocidade do veiculo baseada nas rodas que indica que padrões através de sensores diferentes devem ser descritos e tratados separadamente. Cada pasta e cada arquivo que obteve quaisquer exemplos recuperados é levada para cima e cada arquivo com a maior classificação que ocorreu naquele arquivo ou pasta é solicitado para que exemplos melhor classificados possam ser localizados mais rapidamente.
[060] A FIG. 4B é uma ilustração de um output associado a um setup experimental com dados de sensor obtidos a partir de motores para a condição de carga que podem ser detectados determinando aqueles intervalos de tempo em que um elevado torque e baixa aceleração ocorrem juntamente. A FIG. 4B mostra que o comportamento de torque é similar à velocidade do motor durante a maior parte do tempo, como esperado. Mas para a condição de carga este comportamento de sensor fica invertido. Como pode ver-se a partir da FIG. 4B, o segmento realçado como devolvido pelo sistema da presente divulgação é o da condição de carga.
[061] De acordo com uma modalidade, antes de realizar qualquer processamento nas séries temporais T, pode ser realizada a suavização das séries temporais de dados se os dados forem ruidosos. Muitas vezes os dados recolhidos a uma taxa de amostragem mais elevada contêm muito ruido. A suavização ajuda a comprimir as séries temporais de dados. A suavização pode ser realizada por qualquer técnica conhecida na arte incluindo mas não limitada, a filtro de média móvel, uma vez que maior suavização por média móvel leva a mudanças lentas na inclinação e por isso a mais compressão nos dados. Esta vantagem, todavia, tem de ser pesada relativamente à perda de informações.
[062] De acordo com uma modalidade, o limiar de filtro de desvio pode ser ajustado para um valor baixo para possibilitar a recuperação de mais exemplos. Todavia, esta vantagem tem de ser pesada relativamente à geração de mais ruido.
[063] De acordo com uma modalidade, o valor de parâmetro Tp que é a mudança total permitida em marcações temporais iniciais de padrões lógicos tem de ser ajustada adequadamente uma vez que um alto valor de Tp pode levar a aumento de ruido.
[064] Em uma modalidade, o sistema e método da presente divulgação pode ser implementado em conjugação com abordagens baseadas em aprendizagem automática supervisionada ou semi supervisionada.
[065] De acordo com a presente divulgação, a linguagem de consulta descrita supramencionada pode descrever eventos de multissensores em termos de padrões lógicos de multissensores. A codificação e armazenamento de séries temporais de dados tal como descrita possibilita a pesquisa eficiente para tais padrões lógicos. Os sistemas e métodos da presente divulgação podem encontrar várias aplicações tais como a construção de uma ferramenta para anotar eventos e treinar um classificador de eventos em dados de sensor de veiculo ou para selecionar um número de subsequências para aplicar um tal classificador durante a fase de detecção, assim como para análise exploratória de dados. Os sistemas e métodos da presente divulgação são capazes de lidar com padrões lógicos multissensores que são de comprimento variável e forma similar juntamente com a mudança na sua ocorrência através de sensores diferente.
[066] A descrição escrita descreve o assunto aqui versado para possibilitar aos peritos na arte fazer e usar as modalidades da divulgação. O escopo das modalidades do assunto aqui definido pode incluir outras modificações que ocorram aos peritos na arte. Tais outras modificações destinam-se a ser incluídas no escopo se tiverem elementos similares que não diferem da linguagem literal das reivindicações ou se elas incluírem elementos equivalentes com diferenças não substanciais da linguagem literal.
[067] Todavia, deve ser entendido que o escopo da proteção é estendido a um tal programa e além disso a um suporte informático legível tendo uma mensagem incorporada no mesmo; esse meio de armazenamento informático legível contém meios de codificação de programa para implementação de uma ou mais etapas do método, quando o programa corre em um servidor ou dispositivo móvel ou qualquer dispositivo programável adequado. O dispositivo de hardware pode ser qualquer tipo de dispositivo que pode ser programado incluindo, e.g. qualquer tipo de computador como um servidor ou um computador pessoal, ou similares, ou qualquer combinação dos mesmos. O dispositivo pode também incluir meios que poderíam ser e.g. meios de hardware como e.g. um circuito integrado de aplicação específica (ASIC), uma Matriz de portas de campo programáveis (FPGA), ou uma combinação de meios de hardware e software, e.g. um ASIC e um FPGA, ou pelo menos um microprocessador e pelo menos uma memória com módulos de software localizados na mesma. Assim, os meios podem incluir tanto meios de hardware como meios de software. As modalidades de método aqui descritas podem ser implementadas em hardware e software. O dispositivo pode também incluir meios de software. Em alternativa, o sistema pode ser implementado em diferentes dispositivos de hardware, e.g. usando uma pluralidade de CPÜs.
[068] As modalidades aqui incorporadas podem compreender elementos de hardware e de software. As modalidades que são implementada em software incluem mas não estão limitadas a, firmware, software residente, microcódigo, etc. As funções efetuadas pelos vários módulos compreendendo o sistema da presente divulgação e aqui descritas podem ser implementadas em outros módulos ou combinações de outros módulos. Para efeitos desta descrição, um computador utilizável ou um suporte informático legível pode ser um aparelho que pode compreender, armazenar, comunicar, propagar, ou transportar o programa para uso por, ou em ligação com o sistema, aparelho, ou dispositivo de execução de instruções. Os vários módulos aqui descritos podem ser implementados tanto como módulos de software e/ou de hardware e podem ser armazenados em qualquer tipo de suporte informático legível duradouro ou outro dispositivo de armazenamento. Alguns exemplos não limitativos de suportes informáticos legíveis duradouros incluem CDs, DVDs, BLU-RAY, memória flash, drives de disco duro.
[069] Um sistema de processamento de dados adequado para ordenar e/ou executar um código de programa incluirá pelo menos um processador acoplado direta ou indiretamente a elementos de memória através de um bus de sistema. Os elementos de memória podem incluir memória local utilizada durante a execução real do código de programa, armazenamento de massa, e cache de memórias que fornecem armazenamento temporário de pelo menos algum código de programa para reduzir o número de vezes que o código tem de ser recuperado a partir do armazenamento de massa durante a execução.
[070] A descrição precedente foi apresentada com referência a várias modalidades. As pessoas com uma perícia vulgar na arte e tecnologia a quem este pedido é endereçado reconhecerão que podem ser praticadas alterações e mudanças nas estruturas e métodos de operação descritos sem saír-se sígnífícatívamente do princípio, espírito e escopo.
REIVINDICAÇÕES

Claims (12)

1. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS A PARTIR DE SÉRIES TEMPORAIS DE DADOS MULTISSENSORES, caracterizado por compreender: receber pelo menos uma série temporal de dados de pelo menos um sensor para pesquisar e recuperar padrões lógicos, por um módulo de input; pré processar pelo menos uma das séries de dados temporais recebidas em pelo menos uma sequência de símbolos lógicos, por um pré processador; extrair padrões lógicos da pelo menos uma sequência de símbolos lógicos, por um extrator; agrupar e armazenar os padrões lógicos extraídos em um disco e em uma memória, por um organizador; e iterativamente efetuar: a descrição de um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida, por um gerador de padrão; a pesquisa e recuperação de pelo menos um cluster a partir do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para consulta de pesquisa, por um motor de pesquisa; a classificação dos padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa baseada no grau de relevância para a consulta de pesquisa, por um motor de classificação; e a recuperação de pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa, por um recuperador de padrão.
2. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela consulta de pesquisa ser uma consulta textual.
3. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela etapa de pré processar a pelo menos uma série temporal de dados recebidos compreender: dividir a pelo menos uma série temporal de dados recebidos em uma pluralidade de segmentos de série temporal que não se sobreponham; computar inclinações de cada segmento; ordenar e agrupar o conjunto de segmentos ordenados com base nas inclinações computadas, cada grupo tendo igual número de pontos de amostragem; computar inclinações médias para cada grupo de segmentos; anotar cada ponto de amostragem como aumentando ( + ) , estável (0) e decrescendo (-) comparando a inclinação com o valor médio de inclinação computado correspondente; e classificar a pelo menos uma série temporal de dados como uma sequência de simbolos lógicos em que os pontos de amostragem anotados, valor compreendendo magnitude média e comprimento do segmento.
4. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela etapa de pré processar a pelo menos uma série temporal de dados recebidos ser precedida pela etapa de suavização para eliminar ruído, a etapa de suavização sendo realizada pelo menos por uma técnica escolhida do grupo consistindo em filtro de média móvel, suavização aditiva, filtro de Butterworth, filtro digital, filtro de Kalman, suavização laplaciana, suavização exponencial, método de grelha estírada, filtro de passa baixo, filtro de suavização Savitzky-Golay, regressão local, suavização spline, algoritmo de Ramer-Douglas-Peucker, e filtro de Kolmogorov-Zurbenko.
5. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 3, caracterizado pela etapa de pré processar a pelo menos uma série temporal de dados recebidos compreender ainda a etapa de refinar a sequência de símbolos lógicos incorporando símbolos lógicos tendo comprimento do segmento inferior a um limiar predefinido.
6. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 3, caracterizado pelo valor e comprimento do segmento compreender pelo menos um de três atributos, tais como tipo livre, tipo aproximado e tipo de intervalo.
7. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela etapa de agrupar e armazenar os padrões lógicos extraídos compreender: predefinir um limiar comum para todos os sensores executando uma normalização-Z; rejeitar os padrões lógicos extraídos com desvio de magnitude menor do que o limiar predefinido; representar cada padrão lógico extraído de comprimento fixo de símbolos lógicos como um vetor; agrupar vetores semelhantes de acordo com marcação temporal, duração e valores de símbolos lógicos associados juntamente com o índice associado ou com o índice do símbolo seguinte no padrão lógico; armazenar os clusters num disco como banco de dados; e armazenar metadados dos clusters em uma memória em uma estrutura TRIE.
8. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela etapa de descrever um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida compreender definir pelo menos um atributo associado ao valor e comprimento do segmento para cada símbolo lógico.
9. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 1, caracterizado pela etapa de pesquisar e recuperar pelo menos um cluster compreender: inicializar uma lista de contêiner de cluster para cada sensor envolvido na consulta de pesquisa, a lista de contêiner de cluster compreendendo uma primeira dimensão para armazenar índices de passagens e uma segunda dimensão para armazenar índice de marcações temporais em que o padrão lógico aparece no interior daquela passagem; ordenar os clusters no interior da estrutura TRIE para cada sensor com base na sua distância a partir da consulta de pesquisa; carregar os clusters mais próximos na lista de contêiner para cada sensor; executar iterativamente: a identificação de marcações temporais comuns que satisfazem propriedades especificadas pela consulta de pesquisa; computar valores heurísticos para todas as escolhas de clusters a carregar; carregar o cluster com o valor heurístico mais elevado; e terminar a pesquisa quando for alcançado um critério de término predefinido.
10. MÉTODO PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS, de acordo com a reivindicação 9, caracterizado pela etapa de identificar marcações temporais comuns compreender encontrar uma interseção de ocorrências de padrões lógicos através do pelo menos um sensor para marcações temporais comuns: detectando interseção na primeira dimensão da lista de contêiner de cluster; e detectando interseção na segunda dimensão da lista de contêiner de cluster, no caso de haver uma correspondência para interseção na primeira dimensão.
11. SISTEMA PARA PESQUISAR E RECUPERAR PADRÕES LÓGICOS A PARTIR DE SÉRIES TEMPORAIS DE DADOS MULTISSENSORES, caracterizado por compreender: um ou mais processadores; um dispositivo de interface de comunicação; um ou mais dispositivos de armazenamento interno operativamente acoplado(s) a um ou mais processadores para armazenar: um módulo de input configurado para receber pelo menos uma série temporal de dados a partir de pelo menos um sensor para pesquisar e recuperar padrões lógicos; um pré processador configurado para pré processar a pelo menos uma série temporal de dados recebidos em pelo menos uma sequência de símbolos lógicos; um extrator configurado para extrair padrões lógicos da pelo menos uma sequência de símbolos lógicos; um organizador configurado para agrupar e armazenar os padrões lógicos extraídos em um disco e em uma memória; um gerador de padrão configurado para descrever um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida; um motor de pesquisa configurado para pesquisar e recuperar pelo menos um cluster a partir do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para a consulta de pesquisa; um motor de classificação configurado para classificar os padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa com base no grau de relevância para a consulta de pesquisa; e um recuperador de padrão configurado para recuperar pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa.
12. PRODUTO DE PROGRAMA DE COMPUTADOR, compreendendo um meio de suporte informático legível duradouro tendo um suporte informático incorporado no mesmo, caracterizado pelo programa legível por computador, quando executado em um dispositivo informático, fazer com que o dispositivo informático: receba pelo menos uma série temporal de dados de pelo menos um sensor para pesquisar e recuperar padrões lógicos, por um módulo de input; pré processe a pelo menos uma série temporal de dados recebidos em pelo menos uma sequência de símbolos lógicos, por um pré processador; extraia padrões lógicos a partir da pelo menos uma sequência de símbolos lógicos, por um extrator; agrupe e armazene os padrões lógicos extraídos em um disco e em uma memória, por um organizador; descreva um padrão a ser recuperado a partir dos clusters armazenados em uma consulta de pesquisa predefinida, por um gerador de padrão; pesquise e recupere pelo menos um cluster do disco referenciado na estrutura de índice TRIE na memória, se for considerado relevante para a consulta de pesquisa, por um motor de pesquisa; classifique os padrões lógicos recuperados no pelo menos um cluster considerado relevante para a consulta de pesquisa com base no grau de relevância para a consulta de pesquisa, por um motor de classificação; e recupere pelo menos um dos padrões lógicos melhor classificados detectados em resposta à consulta de pesquisa, por um recuperador de padrão.
BR102016005928A 2015-06-19 2016-03-17 método para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, sistema para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, e, produto de programa de computador BR102016005928A2 (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IN2351MU2015 2015-06-19

Publications (1)

Publication Number Publication Date
BR102016005928A2 true BR102016005928A2 (pt) 2016-12-27

Family

ID=56134235

Family Applications (1)

Application Number Title Priority Date Filing Date
BR102016005928A BR102016005928A2 (pt) 2015-06-19 2016-03-17 método para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, sistema para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, e, produto de programa de computador

Country Status (7)

Country Link
US (1) US9996617B2 (pt)
EP (1) EP3107036A1 (pt)
JP (1) JP6807649B2 (pt)
AU (1) AU2016201689B2 (pt)
BR (1) BR102016005928A2 (pt)
CA (1) CA2923908C (pt)
MX (1) MX364165B (pt)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10296616B2 (en) 2014-07-31 2019-05-21 Splunk Inc. Generation of a search query to approximate replication of a cluster of events
JP2019095878A (ja) * 2017-11-20 2019-06-20 株式会社デンソー 車両用検索装置
KR102104295B1 (ko) 2018-02-20 2020-04-24 주식회사 아이오티큐브 탐색 전략을 자동으로 생성하는 방법 및 자동으로 생성된 탐색 전략을 사용한 콘콜릭 테스팅 수행 방법
EP3537338B1 (en) * 2018-03-07 2021-11-03 Tata Consultancy Services Limited Method and system for pattern recognition in a signal using morphology aware symbolic representation
US11022511B2 (en) 2018-04-18 2021-06-01 Aron Kain Sensor commonality platform using multi-discipline adaptable sensors for customizable applications
US11204905B2 (en) * 2018-06-27 2021-12-21 Datastax, Inc. Trie-based indices for databases
US10831631B2 (en) * 2018-06-28 2020-11-10 International Business Machines Corporation Continuous time alignment of a collection of independent sensors
CN109784380A (zh) * 2018-12-27 2019-05-21 西安交通大学 一种基于生成对抗学习的多维度田间杂草识别方法
JP7010861B2 (ja) * 2019-02-07 2022-01-26 ファナック株式会社 状態判定装置及び状態判定方法
US11294921B2 (en) * 2019-03-12 2022-04-05 General Electric Company Multivariate time-series data search
US11321406B2 (en) 2019-07-31 2022-05-03 Walmart Apollo, Llc Personalized ranking using deep attribute extraction and attentive user interest embeddings
US20210034945A1 (en) * 2019-07-31 2021-02-04 Walmart Apollo, Llc Personalized complimentary item recommendations using sequential and triplet neural architecture
US11500932B2 (en) * 2020-05-19 2022-11-15 International Business Machines Corporation Change-point driven feature selection for multi-variate time series clustering
DE102021130938A1 (de) 2021-11-25 2023-05-25 Dr. Ing. H.C. F. Porsche Aktiengesellschaft Verfahren, System und Computerprogrammprodukt zur Analyse von Zeitreihendatensätzen einer Entität

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03288963A (ja) * 1990-04-06 1991-12-19 Hitachi Ltd 投資支援システム
JP3204154B2 (ja) * 1997-02-21 2001-09-04 日本電気株式会社 時系列データ解析装置
US6766316B2 (en) * 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
WO2008154029A1 (en) * 2007-06-11 2008-12-18 The Trustees Of Columbia University In The City Of New York Data classification and hierarchical clustering
US8676802B2 (en) * 2006-11-30 2014-03-18 Oracle Otc Subsidiary Llc Method and system for information retrieval with clustering
JP2008220511A (ja) 2007-03-09 2008-09-25 Toshiba Corp 時系列パターン発見装置、方法およびプログラム
JP2011065504A (ja) * 2009-09-18 2011-03-31 Tokyo Univ Of Science ユーザの選好関係についての予測モデルを生成する選好予測サーバ及びその方法
JP5678620B2 (ja) * 2010-12-03 2015-03-04 株式会社日立製作所 データ処理方法、データ処理システム、及びデータ処理装置
US9674058B2 (en) 2011-11-07 2017-06-06 Hitachi, Ltd. Time series data processing device, time series data processing method, and computer-readable recording medium storing time series data processing program
US20130226966A1 (en) * 2012-02-27 2013-08-29 Technion Research & Development Foundation Limited Processing a hierarchical structure to respond to a query
US9355170B2 (en) 2012-11-27 2016-05-31 Hewlett Packard Enterprise Development Lp Causal topic miner
US9152671B2 (en) 2012-12-17 2015-10-06 General Electric Company System for storage, querying, and analysis of time series data
WO2014149027A1 (en) 2013-03-18 2014-09-25 Ge Intelligent Platforms, Inc. Apparatus and method for optimizing time series data storage based upon prioritization

Also Published As

Publication number Publication date
EP3107036A1 (en) 2016-12-21
CA2923908A1 (en) 2016-12-19
CA2923908C (en) 2023-08-29
US9996617B2 (en) 2018-06-12
JP6807649B2 (ja) 2021-01-06
MX2016003370A (es) 2017-01-18
MX364165B (es) 2019-04-15
US20160371376A1 (en) 2016-12-22
AU2016201689A1 (en) 2017-01-12
AU2016201689B2 (en) 2017-11-23
JP2017010523A (ja) 2017-01-12

Similar Documents

Publication Publication Date Title
BR102016005928A2 (pt) método para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, sistema para pesquisar e recuperar padrões lógicos a partir de séries temporais de dados multissensores, e, produto de programa de computador
Hamooni et al. Logmine: Fast pattern recognition for log analytics
US10423624B2 (en) Event log analysis
JP6815480B2 (ja) 時系列内の前兆部分列を発見する方法及びシステム
US10288653B2 (en) Time series analytics
CN104123448A (zh) 基于上下文的多数据流异常检测方法
US20210263979A1 (en) Method, system and device for identifying crawler data
US9613271B2 (en) Determining severity of a geomagnetic disturbance on a power grid using similarity measures
CN111368163B (zh) 一种爬虫数据的识别方法、系统及设备
US20180173687A1 (en) Automatic datacenter state summarization
Singh et al. Detection of file level clone for high level cloning
CN112597539A (zh) 一种基于无监督学习的时间序列异常检测方法及系统
US20130226941A1 (en) System and method for classifying signals using the bloom filter
Fargus Optimisation of Correlation Matrix Memory Prognostic and Diagnostic Systems
Bakshi et al. An efficient iris code storing and searching technique for Iris Recognition using non-homogeneous Kd tree
KR101971553B1 (ko) 사물인터넷 기반 기기 관리 시스템 및 방법
Liu et al. A new methodology for condition monitoring based on perceptual hashing
WO2020026428A1 (en) Periodicity analysis apparatus, method and program recording medium
CN111382041B (zh) 一种故障检测、数据处理方法、装置及设备
Deppe et al. Discovery of Ill-Known Motifs in Time Series Data
CN110738083B (zh) 基于视频处理的串并案分析方法及装置
Chamoso Internet Data Extraction and Analysis for Profile Generation
Choi Usability of docker-based container system health monitoring by memory dump visualization
CN115827615A (zh) 一种数据质量检测方法、装置和存储介质
Huang et al. Application of the CEMS on Fault Diagnosis for Rotary Machine

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]