BR102016005511A2 - Summary of multisensor data - Google Patents

Summary of multisensor data Download PDF

Info

Publication number
BR102016005511A2
BR102016005511A2 BR102016005511A BR102016005511A BR102016005511A2 BR 102016005511 A2 BR102016005511 A2 BR 102016005511A2 BR 102016005511 A BR102016005511 A BR 102016005511A BR 102016005511 A BR102016005511 A BR 102016005511A BR 102016005511 A2 BR102016005511 A2 BR 102016005511A2
Authority
BR
Brazil
Prior art keywords
sensor
variety
groups
sensor groups
rules
Prior art date
Application number
BR102016005511A
Other languages
English (en)
Other versions
BR102016005511B1 (pt
Inventor
Srinivasan Ashwin
Shroff Gautam
Agarwal Puneet
Saikia Sarmimala
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of BR102016005511A2 publication Critical patent/BR102016005511A2/pt
Publication of BR102016005511B1 publication Critical patent/BR102016005511B1/pt

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q9/00Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

resumo da patente de invenção para: “resumo dos dados multisensor”. é fornecido um sistema 200 e um método para resumir os dados multisensor. numa versão, o método inclui o cálculo de uma variedade de histogramas dos dados do sensor associados a uma variedade de sensores. os respetivos histogramas de cada sensor são agrupados numa primeira variedade de grupos de sensores e um primeiro conjunto de regras é daí extraído. o primeiro conjunto de regras define os padrões dos histogramas de um conjunto de sensores que ocorrem com frequência ao longo de um período de tempo. dois ou mais grupos de sensores entre a primeira variedade de grupos de sensores são misturados seletivamente para obter uma segunda variedade de grupos de sensores. o segundo conjunto de regras é extraído a partir da segunda variedade de grupos de sensores e um conjunto de sensores correlacionados é aí identificado com base no segundo conjunto de regras. o terceiro conjunto de regras é extraído a partir do conjunto de sensores correlacionados, em que o terceiro conjunto de regras resume os dados multisensor para representar os comportamentos proeminentes concorrentes do sensor.

Description

Relatório Descritivo da Patente de Invenção para: “RESUMO DOS DADOS MULTISENSOR”.
[001] REFERÊNCIA CRUZADA PARA OS PEDIDOS E PRIORIDADE RELACIONADAS
[002] A presente invenção reivindica prioridade do pedido indiano (Título: Resumir os Dados Multisensor) NQ 3945/MUM/2015, arquivada na índia a 17 de outubro de 2015. O conteúdo completo do pedido acima mencionado está aqui incluído por referência.
[003] ÂMBITO TÉCNICO
[004] As versões aqui apresentadas referem-se no geral ao resumo dos dados multisensor e, mais em particular, ao agrupamento baseado no resumo dos dados multisensor.
[005] HISTÓRICO
[006] Os equipamentos industriais modernos estão equipados com um vasto número de sensores que monitorizam continuamente o comportamento dos componentes e seus subsistemas. Por exemplo, as máquinas industriais, incluindo os veículos comerciais e de consumo, aviões, centrais elétricas e fábricas estão geralmente equipados com um vasto número de sensores que transmitem continuamente as suas leituras de forma remota. Devido a uma ligação cada vez mais omnipresente da internet, com frequência através de redes Wifi móveis e metropolitanas, os equipamentos modernos de todos os tipos transmitem regularmente as leituras dos sensores aos seus fabricantes (ex.: automóvel, motor ou componentes originais) bem como aos operadores (ex.: linhas aéreas, fábricas, centrais elétricas). Os dados transmitidos pelo equipamento industrial podem ser utilizados para determinar diferentes padrões de utilização e comportamento de máquinas similares. Contudo, os dados dos sensores das máquinas são de uma natureza bastante dimensional e o agrupamento desses dados para encontrar padrões relativos ao comportamento da máquina é frequentemente complexo.
[007] Os inventores reconheceram aqui vários problemas técnicos com esses sistemas convencionais, como a seguir explicado. Os dados dos sensores das máquinas são de uma natureza bastante dimensional e o agrupamento desses dados para encontrar padrões relativos ao comportamento da máquina é frequentemente complexo. Adicionalmente, os padrões atuais de utilização das máquinas são visualizados ao longo de um dia ou, em alternativa, em um ciclo contínuo através da distribuição dos valores obtidos por cada dezena ou mesmo centena de possíveis sensores, geralmente visualizados como histogramas. O número desses histogramas, que pode estar com frequência em centenas ou milhares, de modo a resumir sucintamente esses dias de funcionamento em padrões dominantes, é complexo.
[008] RESUMO
[009] Em seguida é apresentado um resumo simplificado de algumas versões da invenção de modo a fornecer um entendimento básico das versões. Este resumo não é uma descrição extensiva das versões. Não se pretende identificar os elementos chave/críticos ou delinear o âmbito das versões. Tem como único propósito apresentar algumas versões de uma forma simplificada como um prelúdio para a descrição mais pormenorizada que é a seguir apresentada.
[010] Em vista do precedente, uma versão aqui fornece métodos e sistemas para resumir os dados multisensor. Em um aspeto, é fornecido um método implementado em computador para resumir os dados multisensor. O método inclui o cálculo, através de um ou mais processadores de hardware, de uma variedade de histogramas dos dados do sensor associados a uma variedade de sensores. Além do mais, o método inclui o agrupamento através de um ou mais processadores de hardware e a partir de uma variedade de histogramas, sendo que os respetivos histogramas de cada variedade de sensores pretendem obter uma primeira variedade de grupos de sensores com base na forma dos respetivos histogramas. Cada grupo de sensores da primeira variedade de grupos de sensores inclui um histograma central representativo do comportamento do sensor distinto para um sensor distinto da variedade de sensores. Além do mais, o método inclui a realização, através de um ou mais processadores de hardware, da exploração frequente do padrão na primeira variedade de grupos de sensores para extrair um primeiro conjunto de regras. Uma regra do primeiro conjunto de regras está associada a um conjunto de sensores da variedade de sensores e inclui um conjunto de grupos de sensores que ocorre frequentemente na primeira variedade de grupos de sensores ao longo de um período de tempo.
[011] Além do mais, o método inclui a mistura seletiva, através de um ou mais processadores de hardware, de dois ou mais grupos de sensores entre a primeira variedade de grupos de sensores para obter uma segunda variedade de grupos de sensores. Os dois ou mais grupos sensores são selecionados em relação a um sensor do conjunto de sensores. Os dois ou mais grupos sensores são misturados com base em duas ou mais regras entre o primeiro conjunto de regras associadas a dois ou mais grupos de sensores e a uma medida da distância entre os dois ou mais grupos de sensores. Adicionalmente, o método inclui a extração, através de um ou mais processadores de hardware, de um segundo conjunto de regras a partir da segunda variedade de grupos de sensores. O segundo conjunto de regras é indicativo dos comportamentos de sensor distintos associados à segunda variedade de grupos de sensores. O método inclui também a identificação de uma variedade de conjuntos de sensores correlacionados de uma segunda variedade de grupos de sensores com base no segundo conjunto de regras. O método inclui ainda a extração, através de um ou mais processadores de hardware, de um terceiro conjunto de regras a partir de um ou mais conjuntos de sensores correlacionados, em que o terceiro conjunto de regras resume os dados multisensor para representar comportamentos proeminentes concorrentes do sensor.
[012] Em outra versão, é fornecido um sistema implementado em computador para resumir os dados multisensor. O sistema inclui uma memória para guardar instruções e pelo menos um processador acoplado à referida memória. Pelo menos o referido processador é configurado pelas referidas instruções para calcular uma variedade de histogramas dos dados do sensor associados a uma variedade de sensores. Além do mais, pelo menos o processador é configurado pelas referidas instruções para agrupar, a partir de uma variedade de histogramas, os respetivos histogramas de cada variedade de sensores para obter uma primeira variedade de grupos de sensor com base na forma dos respetivos histogramas. Cada grupo de sensores da primeira variedade de grupos de sensores inclui um histograma central representativo do comportamento do sensor distinto para um sensor distinto da variedade de sensores. Além do mais, pelo menos o processador é configurado pelas referidas instruções para efetuar a exploração de padrões frequentes na primeira variedade de grupos de sensores para extrair um primeiro conjunto de regras. Uma regra do primeiro conjunto de regras está associada a um conjunto de sensores da variedade de sensores e inclui um conjunto de grupos de sensores que ocorre frequentemente na primeira variedade de grupos de sensores ao longo de um período de tempo.
[013] Al ém do mais, pelo menos o processador é configurado pelas referidas instruções para misturar seletivamente dois ou mais grupos de sensores entre a primeira variedade de grupos de sensores para obter uma segunda variedade de grupos de sensores. Os dois ou mais grupos sensores são selecionados em relação a um sensor do conjunto de sensores. Os dois ou mais grupos sensores são misturados com base em duas ou mais regras entre o primeiro conjunto de regras associadas a dois ou mais grupos de sensores e a uma medida da distância entre os dois ou mais grupos de sensores. Adicionalmente, pelo menos um processador é configurado pelas referidas instruções para extrair um segundo conjunto de regras a partir da segunda variedade de grupos de sensores. O segundo conjunto de regras é indicativo dos comportamentos de sensor distintos associados à segunda variedade de grupos de sensores. Pelo menos um processador é também configurado pelas referidas instruções para identificar uma variedade de conjuntos de sensores correlacionados a partir da segunda variedade de grupos de sensores baseados no segundo conjunto de regras. Pelo menos um processador é configurado pelas referidas instruções para extrair um terceiro conjunto de regras a partir de um ou mais conjuntos de sensores correlacionados, onde o terceiro conjunto de regras resume os dados multisensor para representar os comportamentos proeminentes concorrentes do sensor.
[014] Em outro aspeto, é fornecido um meio de leitura por computador não transitório que integra um programa de computador para executar um método para resumir os dados multisensor. O método inclui o cálculo de uma variedade de histogramas dos dados do sensor associados a uma variedade de sensores. Além do mais, o método inclui o agrupamento da variedade de histogramas, em que os respetivos histogramas de cada variedade de sensores pretendem obter uma primeira variedade de grupos de sensores com base na forma dos respetivos histogramas. Cada grupo de sensores da primeira variedade de grupos de sensores inclui um histograma central representativo do comportamento do sensor distinto para um sensor distinto da variedade de sensores. Além do mais, o método inclui a realização da exploração de padrões frequentes na primeira variedade de grupos de sensores para extrair um primeiro conjunto de regras. Uma regra do primeiro conjunto de regras está associada a um conjunto de sensores da variedade de sensores e inclui um conjunto de grupos de sensores que ocorre frequentemente na primeira variedade de grupos de sensores ao longo de um período de tempo.
[015] Além do mais, o método inclui a mistura seletiva de dois ou mais grupos de sensores entre a primeira variedade de grupos de sensores para obter uma segunda variedade de grupos de sensores. Os dois ou mais grupos sensores são selecionados em relação a um sensor do conjunto de sensores. Os dois ou mais grupos sensores são misturados com base em duas ou mais regras entre o primeiro conjunto de regras associadas a dois ou mais grupos de sensores e a uma medida da distância entre os dois ou mais grupos de sensores. Adicionalmente, o método inclui a extração de um segundo conjunto de regras a partir de uma segunda variedade de grupos de sensores. O segundo conjunto de regras é indicativo dos comportamentos de sensor distintos associados à segunda variedade de grupos de sensores. O método inclui também a identificação de uma variedade de conjuntos de sensores correlacionados de uma segunda variedade de grupos de sensores com base no segundo conjunto de regras. O método inclui ainda a extração de um terceiro conjunto de regras a partir de um ou mais conjuntos de sensores correlacionados, em que o terceiro conjunto resume os dados multisensor para representar os comportamentos proeminentes concorrentes do sensor.
[016] BREVE DESCRIÇÃO DAS FIGURAS
[017] A descrição pormenorizada é efetuada com referência às figuras anexas. Nas figuras, o(s) dígito(s) mais à esquerda de uma referência identifica o desenho no qual a referência aparece em primeiro lugar. Os mesmos números são utilizados ao longo dos desenhos para referenciar características e módulos similares.
[018] AF igura 1 ilustra a implementação de uma rede de um sistema para resumo dos dados multisensor, de acordo com uma versão do presente assunto;
[019] A FIG. 2 ilustra um diagrama de blocos de um sistema para resumo dos dados multisensor de acordo com uma versão;
[020] A FIG. 3 ilustra um exemplo de histogramas para uma variedade de sensores em relação a uma variedade de dias para resumir os dados multisensor, de acordo com um exemplo da versão;
[021] A FIG. 4 ilustra um gráfico criado a partir dos histogramas da FIG. 3, de acordo com um exemplo da versão;
[022] A FIG. 5 ilustra um fluxograma de um método para resumo dos dados multisensor, de acordo com um exemplo da versão; e [023] As FIGS. 6A-6C ilustram exemplos de resultados obtidos no resumo dos dados multisensor, de acordo com o exemplo da versão.
[024] Será apreciado pelos especialistas que todos os diagramas de bloco representem vistas conceptuais dos sistemas ilustrativos e dispositivos que incorporamos princípios do presente assunto. De modo similar, será apreciado que todos os fluxogramas e similares representem vários processos que possam ser substancialmente representados no meio legível em computador e, desse modo, executados por um computador ou processador, quer esse computador ou processador esteja ou não ilustrado explicitamente.
[025] DESCRIÇÃO PORMENORIZADA
[026] Os sistemas e métodos para resumir os dados multisensor são apresentados no presente assunto. Os dados multisensor podem ser recebidos a partir de máquinas industriais, tais como equipamentos de produção. Os dados multisensor podem ser analisados para determinar os padrões reais de utilização aos quais os produtos ou máquinas industriais estão sujeitos neste âmbito. Compreender os padrões reais de utilização é importante para desenvolver e melhorar planos de manutenção operacional (por exemplo, no caso de operadoras), e podem ser valiosos para seguros de elevado valor, ex.: de ativos dispendiosos, tais como, aviões ou centrais nucleares. Várias versões aqui apresentadas fornecem métodos e sistemas para resumir os dados multisensor para determinar diferentes padrões de utilização dominantes e uma correlação entre outras características relacionadas com a utilização da máquina. Por exemplo, os métodos e os sistemas apresentados poderão facilitar a análise sobre se um determinado padrão de utilização de um motor corresponde ao tipo de equipamento no qual está instalado, ou se um determinado comportamento de condução é particular de determinados modelos de veículos ou geografias, etc.
[027] Os padrões (por exemplo, padrões de utilização de uma máquina) poderão ser determinados ao longo de um período de tempo de funcionamento, como um dia ou, em alternativa, um ‘ciclo contínuo’, através da distribuição dos valores obtidos por cada sensor. As versões aqui apresentadas facilitam o resumo sucinto desse período de tempo de funcionamento nos padrões dominantes, ou seja, organiza a maioria dos dias da máquina para a data disponível em um ou mais grupos, em que diferentes grupos são caracterizados por padrões de comportamento distintos em termos de distribuição (por exemplo, histogramas) observados para os dados do sensor. Os diferentes padrões de comportamento poderão ser caracterizados por diferentes subconjuntos de sensores.
[028] Várias versões aqui apresentadas fornecem métodos e sistemas para resumir um vasto número de dias de funcionamento da máquina através de um conjunto relativamente pequeno de regras, em que cada regra inclui associações de grupos de sensores possivelmente diferentes. Em uma versão, o sistema aqui apresentado agrupa primeiro os dias de acordo com cada sensor separadamente e combina depois os grupos utilizando comunidades em um gráfico especialmente construído que considera os dias comuns dentro dos grupos dos diferentes sensores, bem como a similaridade do histograma entre grupos do mesmo sensor. No processo, alguns grupos de um único sensor são misturados. O sistema identifica ainda as regras definidas em termos de associações de grupos de um único sensor, em que cada regra utiliza possivelmente diferentes conjuntos de grupos de sensores. É determinado um pequeno conjunto dessas regras que cobrem também uma vasta fração de dias através de regras de agrupamento com base em sobreposições mútuas.
[029] As versões aqui apresentadas e as suas várias características e pormenores vantajosos são explicados em mais pormenor com referência às versões não limitativas ilustradas nos desenhos anexos e descritas na seguinte descrição. Os exemplos aqui utilizados pretendem apenas facilitar a compreensão sobre quais as versões poderão ser praticadas e permitir aos especialistas praticar as versões aqui apresentadas. De modo similar, os exemplos não devem ser construídos como limitando o âmbito das versões aqui apresentadas.
[030] Os métodos e sistemas não estão limitados às versões específicas aqui descritas. Adicionalmente, o método e sistema podem ser praticados de forma independente e separada de outros módulos e métodos aqui descritos.
Cada elemento/módulo e método do dispositivo pode ser utilizado em combinação com outros elementos/módulos e outros métodos.
[031] O modo, pelo qual o sistema e método para resumir os dados multisensor deve ser implementado, foi explicado em pormenor em relação às FIGS. 1 a 6C. Embora os aspetos dos métodos e sistemas descritos para resumo dos dados multisensor podem ser implementados em qualquer número de sistemas diferentes, ambientes utilitários e/ou configurações, as versões são descritas no contexto do(s) seguinte(s) sistema(s) exemplificativo(s).
[032] Em relação agora à FIG. 1, é ilustrada a implementação de uma rede 100 do sistema 102 para resumo dos dados multisensor, de acordo com uma versão do presente assunto. Em uma versão, o sistema 102 deve resumir sucintamente a utilização e os padrões comportamentais de uma coleção de máquinas utilizando dados multisensor observados durante vários dias (ou ‘ciclos’), na forma de um conjunto de regras. Cada regra é descrita pela associação em grupos de possíveis conjuntos diferentes de sensores. Cada grupo de sensores identifica uma determinada distribuição dos dados/valores do sensor ao longo de um período de tempo (por exemplo, ao longo de um dia).
[033] Embora o presente assunto seja explicado considerando que o sistema 102 é implementado para resumir os dados multisensor, poderá ser entendido que o sistema 102 poderá não estar limitado a qualquer máquina ou ambiente em particular. O sistema 102 pode ser utilizado para uma variedade de domínios, bem como para os dados do sensor que envolva dados altamente dimensionais (como dados multisensor). O sistema 102 está configurado para efetuar o agrupamento de subespaço múltiplo dos dados altamente dimensionais através de um agrupamento cooperativo em um subconjunto de dados altamente dimensionais utilizando técnicas baseadas em um gráfico incluindo, mas não estando limitado à detecção comunitária, exploração frequente do padrão e agrupamento dos histogramas. O sistema 102 poderá ser implementado em uma variedade de sistemas de computador, como um computador de secretária, um computador portátil, uma estação de trabalho, um computador principal, um servidor, um servidor de rede, e similares.
[034] Aqui, o sistema 102 poderá receber os dados do sensor a partir de vários dispositivos, em que um ou mais dispositivos e/ou máquinas 104-1, 104-2...104-N, são coletivamente referidos como dispositivos do sensor 104 daqui em diante. Os exemplos dos dispositivos do sensor 104 poderão incluir, mas não estão limitados as máquinas industriais, computador portátil, assistente digital pessoal, dispositivo móvel, estação de trabalho, dispositivos com sensores, dispositivos de armazenamento equipados nas máquinas para guardar as leituras do sensor, etc. Os dispositivos do sensor 104 são comunicativamente acoplados ao sistema 102 através de uma rede 106. Os termos ‘dispositivos do sensor’ e ‘sensores’ poderão referir-se aos dispositivos que possam fornecer dados do sensor ao sistema 102, e desse modo, os termos ‘dispositivo do sensor’ e ‘sensor’ poderão ser utilizados de forma intercambiável através da descrição. Em uma versão, os dispositivos do sensor 104 poderão incluir máquinas industriais reforçadas que incluam leituras/dados dos vários sensores (velocidade do motor, consumo de combustível, e similares) observados em intervalos regulares de tempo.
[035] Em uma implementação, a rede 106 poderá ser uma rede sem fios, uma rede por cabo ou uma combinação das duas. A rede 106 pode ser implementada como um dos diferentes tipos de redes, como intranet, rede local (LAN), rede de área ampla (WAN), internet, e similares. A rede 106 poderá ser uma rede dedicada ou uma rede partilhada. A rede partilhada representa uma associação dos diferentes tipos de redes que utilizam uma variedade de protocolos, por exemplo, Protocolo de Transferência de Hipertexto (HTTP), Protocolo de Controlo da Transmissão/Protocolo de Internet (TCP/IP), Protocolo de Aplicação Sem Fios (WAP), e similares, para comunicar uns com os outros. A rede 106 poderá também incluir uma variedade de dispositivos de rede, incluindo routers, pontes, servidores, computadores, dispositivos de armazenamento, e similares.
[036] Os dispositivos do sensor 104 poderão enviar os dados do sensor para o sistema 102 através da rede 106. O sistema 102 deve analisar os dados do sensor para resumir a utilização da máquina. Aqui, os dados do sensor que são recebidos a partir dos múltiplos sensores para o período de tempo especificado podem ser referidos como ‘dados multisensor’. O comportamento de um sensor ao longo de um período de tempo pode ser representado por um histograma que possa capturar a distribuição dos diferentes valores desses dados do sensor para um período de tempo específico ao longo do qual a máquina funciona. O período de tempo pode ser um ciclo único da máquina, um dia, uma semana, etc.
[037] Em uma versão, o sistema 102 deve calcular múltiplos histogramas (ou perfis de intensidade) a partir dos dados do sensor. O sistema 102 deve calcular os histogramas representativos de cada um dos comportamentos dos sensores para cada dia. Um exemplo de uma variedade de histogramas correspondentes aos múltiplos sensores para vários dias é descrito com referência à FIG. 3. O sistema 102 deve resumir sistematicamente os dados multisensor para determinar o comportamento da máquina. É descrito um exemplo de implementação do sistema 102 para resumo dos dados multisensor com referência ao FIG. 2.
[038] A FIG. 2 ilustra um diagrama de blocos de um sistema 200 para resumo dos dados multisensor, de acordo com uma versão da presente invenção. O sistema 200 inclui ou está em comunicação com pelo menos um processador como um processador 202, pelo menos uma memória como a memória 204, e uma unidade de interface de rede como a unidade de interface de rede 206. Em uma versão, o processador 202, memória 204, e a unidade de interface de rede 206 poderão ser acoplados por um sistema bus como um sistema bus 208 ou um mecanismo similar.
[039] O processador 202 poderá incluir a implementação de circuitos, entre outros, funções áudio e lógicas associadas à comunicação. Por exemplo, o processador 202 poderá incluir, mas não está limitado a um ou mais processadores do sinal digital (DSPs), um ou mais microprocessadores, um ou mais chips de computador de função especial, uma ou mais redes de portas lógicas programáveis (FPGAs), um ou mais circuitos integrados específicos da aplicação (ASICs), um ou mais computadores, vários conversores analógico para digital, conversores digital para analógico, e/ou outros circuitos de apoio. O processador 202 poderá incluir também a funcionalidade de codificar mensagens e/ou dados ou informação. O processador 202 poderá incluir, entre outras coisas, um relógio, uma unidade lógica aritmética (ALU) e portas lógicas configurados para apoiar o funcionamento do processador 202. Além do mais, o processador 202 poderá incluir a funcionalidade de executar um ou mais programas de software, que podem ser guardados na memória 204 ou estarem acessíveis ao processador 202.
[040] Pelo menos uma memória como a memória 204, poderá guardar um número qualquer de partes de informação e dados utilizados pelo sistema para implementar as funções do sistema. A memória 204 poderá incluir por exemplo, a memória volátil e/ou a memória não volátil. Os exemplos da memória volátil poderão incluir, mas não estão limitados a memória de acesso aleatório volátil (RAM). A memória não volátil poderá adicionalmente ou em alternativa, incluir uma memória de leitura apenas programável eliminável eletricamente (EEPROM), memória flash, disco rígido, ou similares. Alguns exemplos da memória volátil incluem, mas não estão limitados a memória de acesso aleatório, memória de acesso aleatório dinâmica, memória de acesso aleatório estática, e similares. Alguns exemplos da memória não volátil incluem, mas não estão limitados a discos rígidos, fitas magnéticas, discos óticos, memória de leitura apenas programável, memória de leitura apenas programável eliminável, memória de leitura apenas programável eliminável eletricamente, memória flash, e similares. A memória 204 pode estar configurada para guardar informação, dados, aplicações, instruções ou similares para ativar o sistema 200 para efetuar várias funções de acordo com os vários exemplos de versões. Adicionalmente ou em alternativa, a memória 204 poderá estar configurada para guardar instruções que quando executadas pelo processador 202 fazem com que o sistema se comporte do modo descrito nas várias versões.
[041] A unidade de interface de rede 206 está configurada para facilitar a comunicação entre os sensores (ou os dispositivos que integram os sensores) e o sistema 200. A unidade de interface de rede 206 poderá estar na forma de uma ligação sem fios ou de uma ligação por cabo. Os exemplos do elemento de interface da rede sem fios 206 poderá incluir, mas não está limitado a, IEEE 802.11 (Wifi), BLUETOOTH®, ou uma ligação sem fios de área ampla. O exemplo do elemento de interface de rede por cabo 206 inclui, mas não está limitado a Ethernet.
[042] O sistema 200 deve receber, através da unidade de interface de rede 206, dados do sensor (7) associados a uma variedade de sensores recolhidos ao longo de um período de tempo. Por exemplo, para os dados série de tempo do multisensor, T, é representado como segue, Tj= {v(t>: t(t>€ {1,2,..., m}}, [043] em que, v ; de modo a que' : . ‘ [044] em que, N é o número da variedade de sensores e m é o comprimento total da série de tempo. Os dados multisensor poderão incluir várias dessas séries de tempo durante um período de tempo (como vários dias de funcionamento), [045] isto é, T = {Ti: T2, ..., 7b}, em que D é o número de dias de funcionamento.
[046] Em uma versão, o processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 para dividir os dados do sensor T em uma variedade de porções de modo a que cada variedade de porções inclua os dados do sensor para o funcionamento de um dia da máquina. O sistema 200 deve originar também o cálculo de uma variedade de histogramas de cada uma das porções para a variedade de sensores, gerando assim um conjunto de histogramas Hk. Para um sensor k e máquina / por dia de funcionamento d-h é calculado um histograma Hki a partir dos seus valores1:ífc [047] Aqui, Sé o número de intervalos, um intervalo bjk é definido pelos limites [ljk, ujk), e [048] · é a fração dos valores que residem no intervalo bjk.
[049] Em uma versão, o processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 calcule os histogramas para todos os sensores para cada dia de funcionamento. O sistema 200 poderá calcular N histogramas para N sensores diferentes de um dia d/como: [050] Também para D dias de funcionamento, o conjunto de histogramas poderá ser representado como Hk· [051] Hk ={Hki, Hk2,.... HkD} para cada sensor k.
[052] Em uma versão, o sistema 200 deve calcular uma variedade de histogramas (Hk) a partir dos dados do sensor de modo a que cada histograma da variedade de histogramas seja representativo do comportamento do sensor ao longo de um período de tempo (por exemplo, cada dia de uma variedade de dias). Os histogramas são calculados com um conjunto fixo de caixas B para cada sensor. Um dia (dl) pode ser representado por um conjunto de histogramas de todos os sensores para esse dia, [053] isto é,di={H1i,H2i,...,HNl· [054] Aqui, cada um dos histogramas é um vetor dimensional B.
[055] O processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 agrupe os histogramas de cada variedade de sensores em uma primeira variedade de grupos de sensores, de modo a que cada grupo de sensores inclua histogramas com forma similar. Cada grupo de sensores da primeira variedade de grupos de sensores inclui um grupo de histogramas correspondentes a um sensor para um ou mais dias. Em uma versão, o sistema 200 deve agrupar o conjunto de histogramas similares em um grupo de sensores de modo a que uma medida da distância entre os histogramas do conjunto de histogramas similares seja inferior à medida da distância limite. Por exemplo, um conjunto de histogramas (ou histogramas similares), % poderá formar um grupo de sensores, Ckn, de modo a que D(Hki, Hkj) < τηι<, para qualquer par Hki, Hkj e Ckn, em que D(Hki, Hkj) é a distância entre o conjunto de histogramas Hki e Hkj. Assim, dois histogramas Hki e Hkj do sensor k para diferentes dias de funcionamento poderão ser designados como similares se a medida da distância D(Hki, Hkj) entre os histogramas for inferior ao primeiro valor limite da medida da distância (τηκ). Aqui, a distância entre os histogramas é representativa da similaridade de forma entre os histogramas. Em uma versão, a distância entre os histogramas poderá ser uma distância Euclidiana, uma distância do motor da Terra, divergência de Kullback-Leibler, distância de Bhattacharyya, distância de Manhattan, métrica de Wasserstein (: também conhecida como a métrica de Kantorovich), etc.
[056] Em uma versão, poderá ser utilizado um modelo de agrupamento como o modelo de agrupamento esférico, Redução e Agrupamento Iterativo Equilibrado utilizando Hierarquias (BIRCH), para agrupar os histogramas em grupos de sensores. O modelo de agrupamento BIRCH toma um valor inicial do limite da medida da distância "n como um parâmetro. Em uma versão, o processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 utilize o valor do raio (τ·ι/2) dos grupos de sensores esféricos como o primeiro valor limite da medida da distância. O primeiro valor limite da medida da distância poderá depender da qualidade e número de grupos associados ao sensor. Em uma versão, poderá ser utilizado um índice DB como uma medida estatística da qualidade dos grupos de sensores. O sistema 200 deve efetuar o agrupamento BIRCH para vários valores de Ti e selecionar esse valor de ^/2 para o qual o calor do índice DB é ideal. O índice DB consiste em uma métrica para avaliar os modelos de agrupamento, nos quais é feita a validação sobre o quão bem foi efetuado o agrupamento utilizando as quantidades e características inerentes a um conjunto de dados. Em uma versão, o valor de Ti poderá ser selecionado para ser o mais baixo possível para o valor ideal do índice DB enquanto garante que o centro de um grupo de sensores representa os histogramas nesse grupo. O agrupamento dos sensores individualmente gera um conjunto de grupos de sensores, € N. Em uma versão, o sistema 200 deve representar os dias pelo conjunto de grupos de sensores do sensor diferente no qual residem os histogramas do sensor. Aqui, um dia poderá ser representado como {Cn, Cz, ..., Cm} em que i e 1,2,..., n.
[057] Em uma versão, o processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 extraia um primeiro conjunto de regras a partir de uma variedade de grupos de sensores de modo a que essa regra do primeiro conjunto de regras seja associado a um conjunto de sensores da variedade sensores e inclua um conjunto de grupos de sensores que ocorrem frequentemente na primeira variedade de grupos de sensores ao longo de um período de tempo. Doravante, os padrões dos histogramas que ocorrem frequentemente ao longo de um período de tempo poderão ser referidos como 'padrões que ocorrem frequentemente'. Em uma versão, para extrair o primeiro jogo de regras, o sistema 200 deve identificar a primeira variedade de grupos de sensores associados a diferentes sensores que possuem muitos dias em comum. Em uma versão, a primeira variedade de grupos de sensores com muitos dias em comum poderá ser determinada efetuando a exploração de padrões frequentes na primeira variedade dos grupos de sensores. A exploração de padrões frequentes poderá ser efetuada pelo modelo de exploração de padrões frequentes, por exemplo, um Modelo de Crescimento FP.
[058] Em uma versão, o processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, para fazer com que o sistema 200 corrija a primeira variedade de grupos de sensores alargando o valor limite da medida da distância (τηκ) associada aos grupos de sensores. Em uma versão, o sistema 200 poderá ter que incluir mais dias em um grupo de sensores de forma cooperativa com base no compartimento de outros sensores para o mesmo período de tempo. Em uma versão, o sistema 200 deve misturar seletivamente dois ou mais grupos de sensores de um sensor a partir da primeira variedade de grupos de sensores de modo a incluir mais dias em um grupo de sensores de forma cooperativa com base no comportamento de outros sensores para os mesmos dias. Em uma versão, embora misture seletivamente dois ou mais grupos de sensores, o sistema 200 poderá ter que misturar grupos de sensores similares de um sensor quando os referidos grupos de sensores possuem a maioria dos dias comuns em relação ao(s) grupo(s) de sensores de outro(s) sensor(es) da variedade de sensores. Os grupos de sensores dos diferentes sensores possuindo na maioria o mesmo conjunto de dias poderão doravante ser referidos como 'grupos de sensores concorrentes', e os sensores que ocorram nesses 'grupos de sensores concorrentes' poderão ser referidos como 'sensores concorrentes'.
[059] Em uma versão, os dois ou mais grupos de sensores de um sensor são misturados com base na determinação da concorrência dos sensores nos dois ou mais grupos de sensores para o mesmo conjunto de dias, de modo a identificar grupos de sensores candidatos para a mistura que possuam a maioria dos dias em comum com um grupo de sensores de outro sensor, enquanto a medida da distância (por exemplo, distância Euclidiana) entre os centros dos grupos de sensores permanecem unidos por um segundo limite t2. Em uma versão, o processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, para fazer com que o sistema 200 determine a concorrência dos sensores nos dois ou mais grupos de sensores com base em duas ou mais regras entre o primeiro conjunto de regras associadas a dois ou mais grupos de sensores e uma medida da distância entre os dois ou mais grupos de sensores. Em uma versão, o processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 utilize uma técnica baseada no gráfico para identificação dos grupos de sensores candidatos a serem misturados. A técnica baseada no gráfico poderá incluir a representação da variedade de grupos de sensores e o primeiro conjunto de regras na forma de um primeiro gráfico com uma variedade de pontos e uma variedade de ligações que ligam a variedade de pontos. A variedade de pontos representa a variedade dos grupos de sensores associados a um conjunto de sensores presentes no conjunto de padrões frequentes. É efetuada uma ligação entre dois pontos do gráfico se os dois grupos de sensores pertencerem ao mesmo sensor e se a distância entre os referidos grupos de sensores for menor do que o segundo limite τ2. O sistema 200 deve também codificar a distância pelo peso dessa ligação. É também efetuada uma ligação entre dois pontos do gráfico se os dois grupos de sensores estiverem presentes em um padrão frequente/regra. O sistema 200 deve também codificar o suporte do padrão frequente como o peso dessa ligação. Assim, a variedade de ligações i8nclui um conjunto de ligação intragrupo e um conjunto de ligação intergrupo. Aqui, uma ligação intergrupo inclui uma ligação entre os grupos de sensores associados a uma regra entre o primeiro conjunto de regras e uma ligação intergrupo inclui uma ligação entre os grupos de sensores de um sensor com a distância entre os grupos de sensores inferior ao segundo limite da medida da distância. É descrito um exemplo de um gráfico com ligação intergrupo e ligações intragrupos com referência à FIG. 4. Aqui, os pesos associados à intraligação e à interligação estão em escalas diferentes, por isso, o sistema 200 deve normalizar os pesos da intraligação e da interligação.
[060] O processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 identifique uma variedade de subgráficos no primeiro gráfico de modo a que cada subgráfico possua grupos de sensores fortemente relacionados. O primeiro gráfico está configurado de modo a que os pontos de um subgráfico no primeiro gráfico sejam densamente ligados uns aos outros e escassamente ligados com outros pontos. Em uma versão, os subgráficos no primeiro gráfico são identificados com base na modularidade utilizando técnicas standard, tais como modularidade do gráfico ou detecção comunitária. Se dois ou mais grupos de sensores de um sensor estiverem presentes em um subgráfico, então os dois ou mais grupos de sensores são aplicáveis para a mistura dos grupos. Por outras palavras, se dois ou mais grupos de sensores do mesmo sensor ocorrerem no mesmo subgráfico, os dois ou mais grupos de sensores são misturados em conjunto resultando em uma segunda variedade de grupo de sensores (ou grupos de sensores misturados). O processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 calcule limites Tnk revistos da medida da distância para esses grupos de sensores misturados. Em uma versão, os grupos de sensores que não são misturados mantêm os seus limites iniciais da medida da distância (isto é, o primeiro limite da medida da distância).
[061] Após misturar os grupos de sensores dos mesmos sensores, o sistema 200 deve atualizar os grupos de sensores para todos os sensores e voltar a codificar os dias utilizando a segunda variedade de grupos de sensores ou seus centros. Como a segunda variedade de grupos de sensores foi criada de forma cooperativa com base na concorrência com os grupos de sensores de outros sensores, a segunda variedade dos grupos de sensores possui maior probabilidade de facilitar a identificação de comportamentos de sensor que ocorrem com frequência com maior suporte.
[062] Em uma versão, o sistema 200 deve extrair um segundo conjunto de regras a partir da segunda variedade de grupos de sensores de modo a que o segundo conjunto de regras seja indicativo dos comportamentos de sensor distintos associados à segunda variedade de grupos de sensores. O segundo conjunto de regras poderá ser determinado efetuando a exploração de padrões frequentes na segunda variedade de grupos de sensores.
[063] O processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 identifique uma variedade de conjuntos de sensores correlacionados a partir de uma segunda variedade de grupos de sensores com base no segundo conjunto de regras. Em uma versão, para identificação da variedade de conjuntos de sensores correlacionados, o segundo conjunto de regras é representado na forma de um segundo gráfico. O segundo gráfico inclui uma variedade de pontos e uma variedade de ligações que ligam a variedade de pontos, de modo a que a variedade de pontos represente a segunda variedade de grupos de sensores e a variedade de ligações inclua um conjunto de ligações intergrupo s. O segundo gráfico poderá ser utilizado para identificar a variedade de conjuntos de sensores correlacionados com base na técnica de modularidade do gráfico ou detecção comunitária, sendo que o segundo gráfico poderá ser dividido em uma variedade de subgráficos de modo a que um subgráfico do segundo gráfico possa representar um conjunto de sensores correlacionados. Será compreendido que no segundo gráfico, existe apenas um tipo de ligação, nomeadamente, a ligação intergrupo. Com base na detecção comunitária, o sistema 200 deve identificar a variedade de conjuntos de sensores correlacionados a partir dos grupos de sensores presentes na variedade de subgráficos (ou comunidades). Em uma versão, o sistema 200 deve identificar uma variedade de sensores únicos/distintos associados à segunda variedade de grupos de sensores dos subgráficos a partir do segundo gráfico, de modo a que a variedade de sensores únicos represente o conjunto de sensores correlacionados. Por exemplo, uma comunidade ou um subgráfico {C11, C12, C24, C35} poderá gerar um conjunto de sensores correlacionados {si, S2, S3}. O conjunto de sensores correlacionados Scor poderá ser determinado como: [064] Scor = {Cri, Cr2, ... , Crp} em que [065] Crp =< Sj, Sj, Sr . . . > é 0 conjunto pth dos sensores correlacionados.
[066] O processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 extrair um terceiro conjunto de regras a partir da variedade de conjuntos de sensores correlacionados, em que o terceiro conjunto de regras resume os dados multisensor para representar os comportamentos proeminentes concorrentes do sensor. Em uma versão, o sistema 200 deve extrair o terceiro conjunto de regras dos conjuntos de sensores correlacionados efetuando a exploração dos padrões frequentes para cada conjunto de sensores correlacionados. Aqui, como o número de sensores a serem considerados para cada fase da exploração do padrão frequente é reduzido, o número de itens únicos em cada fase é também reduzido, por isso, o sistema 200 deve identificar o terceiro conjunto de regras (ou padrões) com um baixo suporte. Em uma versão, a exploração do padrão frequente nos conjuntos p dos sensores correlacionados poderá resultar na identificação de um conjunto de sensores correlacionados.
[067] em que, Crp é um conjunto de sensores correlacionados, e [068] Fap é o conjunto de itens frequentes (ou padrões) gerado a partir do conjunto de sensores correlacionados Crp .
[069] O processador 202 está configurado para, com o conteúdo da memória 204, e opcionalmente com outros componentes aqui descritos, fazer com que o sistema 200 agrupar (ou combine) o conjunto de padrões frequentes gerados a partir de uma variedade de conjuntos de sensores correlacionados para gerar o terceiro conjunto de regras. O terceiro conjunto de regras representa um conjunto dos padrões frequentes candidatos. Em uma versão, o sistema 200 deve gerar o terceiro conjunto de regras a partir do conjunto de padrões frequentes candidatos em uma técnica de agrupamento de regras. Na técnica de agrupamento baseada nas regras, o sistema 200 deve definir uma medida da distância entre cada par de regras no terceiro conjunto de regras. A medida da distância é inversamente proporcional à sobreposição mútua nos dados que a regra cobre (isto é, as transações que cobrem). O conjunto de padrões frequentes é agrupado através de uma técnica baseada na densidade, como DBSCAN, de acordo com esta medida da distância. Como resultado, as regras no mesmo grupo sobrepõem-se bastante, sendo que a inclusão de mais do que uma regra de cada grupo provavelmente não aumentará a cobertura do conjunto global de regras. O sistema 200 deve selecionar a regra mais frequente de cada grupo de regras que formem em conjunto o conjunto final de regras que resumem os dados sucintamente enquanto garantem uma elevada cobertura.
[070] A FIG. 3 ilustra um exemplo de histogramas para uma variedade de sensores em relação a uma variedade de dias, de acordo com um exemplo da versão. A variedade de sensores poderá registar os dados do sensor ao longo de um período de tempo e esses dados do sensor poderão ser utilizados para gerar uma variedade de histogramas. Por exemplo, os dados do sensor poderão derivar de máquinas industriais reforçadas que contêm leituras dos vários sensores (velocidade do motor, consumo de combustível, e similares) observados em intervalos regulares de tempo. A variedade de histogramas aqui ilustrados representa o comportamento do sensor de uma variedade de sensores. Será notado que o histograma captura a distribuição dos diferentes valores do sensor a partir dos dados do sensor para um período de tempo específico durante o qual a máquina funciona. O período de tempo pode ser um ciclo único da máquina, um dia, uma semana, etc. Por exemplo, aqui, o período de tempo é selecionado como um 'dia' para calcular os histogramas.
[071] Conforme ilustrado na FIG. 3, é ilustrado através dos dados do sensor, o comportamento do sensor (histograma) dos quatro sensores (S1, S2, S3 e S4) para cinco dias (D1, D2, D3, D4 e D5). Aqui, os histogramas podem ser unicamente identificados por Hjj. Para o dia D1, os histogramas correspondentes aos sensores S1, S2, S3 e S4 são ilustrados como 312 (/-/«), 314 (H2i), 316 (H31) e 318 (H41). Para o dia D2, os histogramas correspondentes aos sensores S1, S2, S3 e S4 são ilustrados como 322, 324, 326 e 328. Para o dia D3, os histogramas correspondentes aos sensores S1, S2, S3 e S4 são ilustrados como 332, 334, 336 e 338. Para o dia D4, os histogramas correspondentes aos sensores S1, S2, S3 e S4 são ilustrados como 342, 344, 346 e 348. Para o dia D5, os histogramas correspondentes aos sensores S1, S2, S3 e S4 são ilustrados como 352, 354, 356 e 358. Aqui, os histogramas são ilustrados como linhas contínuas, já que utilizado um grande número de caixas (por exemplo, 1000 caixas) para capturar a distribuição dos valores dos sensores nos histogramas.
[072] Em vários cenários, um histograma de um sensor para um dia de funcionamento poderá ser similar ao de muitos outros dias do mesmo, bem como outras instâncias de máquinas. Todos esses histogramas podem ser agrupados em conjunto para forma um grupo de sensores utilizando, por exemplo, uma medida da distância entre os histogramas. Podem ser agrupados os dias para os quais o comportamento de muitos sensores é similar, de uma forma que todos esses grupos cubram coletivamente a maioria dos dados observados. Os histogramas similares estão marcados pela mesma identificação do grupo de sensores Qk. Por exemplo, os histogramas de S1 e S2 são similares no Dia 1 e no Dia 2 (os histogramas 312, 322 são similares e os histogramas 314, 324 são similares). No Dia 3, o histograma S1 é ligeiramente diferente enquanto o S2 é similar. No dia 4 é bastante diferente para S1 e S2 dos restantes dias, enquanto os histogramas S3 e S4 são similares aos do Dia 1. Como também observado na FIG. 3, não existem dois dias similares um ao outro em relação aos comportamentos de todos os sensores para esse dia e, desse modo, deve ser determinado um subconjunto de sensores para o qual alguns dos dias são similares em termos de comportamento do sensor.
[073] Várias versões da presente divulgação fornecem um método e sistema para agrupamento dos histogramas dos sensores de modo a que um histograma central do grupo de sensores represente os histogramas incluídos nesse grupo de sensores. Esses grupos de sensores são em numerados como padrões que ocorrem com frequência dos histogramas do sensor e resumem os dados dos sensores multivariados volumosos. Conforme ilustrado na FIG. 3, o conjunto de histogramas {/-/??, Hi2, H13} são similares, enquanto H13 é ligeiramente diferente dos outros dois. Assim, o sistema (por exemplo o sistema 200 da FIG. 2) poderá ter que os colocar a todos em um ou mais grupos dependendo da seleção de um limite dos grupos de sensores. Em uma versão, o sistema poderá determinar os limites do grupo de forma cooperativa com os grupos de sensores de outros sensores. Por exemplo, o sistema poderá ter que colocar esses conjuntos de histogramas em um grupo se os dias correspondentes estiverem em um grupo de sensores para outro(s) sensor(es) de modo a agrupar os dias de funcionamento. Como resultado, no presente exemplo, {Hu (312,), H12(322), H13 (332)} poderão formar um grupo porque o Dia 1, Dia 2 e Dia 3 estão em um grupo de sensores (C21) de S2. De modo similar, devido ao fato do Dia 2, Dia 3 e Dia 5 não estarem juntos em qualquer outro grupo de sensores, {H32 (326), H33 (336)} e H35 (346) poderão estar em dois diferentes grupos de sensores.
[074] Após formar os grupos de sensores dos histogramas, os dias que fazem parte do mesmo grupo de sensores poderão ser agrupados para muitos (mas não todos) sensores. O agrupamento dos dias de acordo com um subconjunto de sensores poderá ser equivalente ao agrupamento do subespaço. O sistema deve selecionar vários subconjuntos diferentes de sensores para agrupamento dos dias, referindo-se ao agrupamento como agrupamento de múltiplo subespaço. Estes grupos de sensores podem ser então descritos na forma de um conjunto de regras (de padrões que ocorrem com frequência). Em relação à FIG.3, dois padrões podem descrever a maioria dos dias; {(C11+C12); C21} descreve 0 Dia 1, Dia 2 e Dia 3, e {C31; (C41+C44)} descreve 0 Dia 1 e Dia 4. O sistema 200 deve identificar essas regras ou padrões de um modo não supervisionado.
[075] A FIG. 4 ilustra um gráfico 400 criado a partir dos histogramas observados na FIG. 3, de acordo com um exemplo da versão. O gráfico 400 é um exemplo do primeiro gráfico descrito em relação à FIG. 2. O gráfico 400 pode ser utilizado para identificar grupos de sensores concorrentes (ou, os grupos de sensores de diferentes sensores que incluem na maior parte o mesmo conjunto de dias). Cada dia pode ser representado por um conjunto de identificadores dos grupos dos diferentes grupos de sensores nos quais residem os seus histogramas do sensor. Podem ser misturados dois ou mais grupos de sensores do mesmo sensor quando é determinado que os dois ou mais grupos de sensores possuem a maioria dos dias em comum com um grupo de outro sensor, enquanto a distância (por exemplo, distância Euclidiana) entre os centros dos grupos de sensores permanece limitada por um segundo limite. Para o exemplo descrito em relação à FIG. 3, os grupos de sensores Cn e C12 podem ser misturados porque Cn, C12 partilham dias com outro grupo C21, e a distância entre os centros de Cn, C12 é também pequena.
[076] Os grupos estão modelados como pontos no gráfico 400. Para 0 exemplo de grupos de sensores descrito em relação à FIG. 3, 0 gráfico 400 inclui uma variedade de grupos de sensores, como os grupos de sensores Cn, C12, C13, C14, C21, C22. C23, C31, C32, C33, C41, C42. C43. C44, θ C45. O gráfico 400 inclui ainda uma variedade de ligações entre a variedade de pontos (grupos de sensores). As ligações são efetuadas entre dois pontos do gráfico se os dois pontos pertencerem ao mesmo sensor e se a distância (por exemplo, distância Euclidiana) entre eles for menor do que um segundo valor limite da medida da distância. Aqui, a medida da distância é codificada como o peso dessa ligação. Essas ligações são referidas como ligações intragrupo e são representadas por linhas a tracejado no gráfico 400. Por exemplo, as ligações são ligações intragrupo 402, 404. De notar que todas as ligações representadas por linhas a tracejado no gráfico 400 são ligações intragrupo, contudo, para abreviar a descrição e a clareza da compreensão, marcamos apenas três ligações intragrupo (406, 408, 410) na FIG. 4.
[077] O gráfico 400 inclui também ligações intergrupo. Uma ligação intergrupo é uma ligação entre grupos de sensores dos diferentes sensores e está representada como linhas sólidas na FIG. 4. Uma ligação intergrupo existe entre grupos de dois sensores e ocorrerem ambos em uma regra do primeiro conjunto de regras (ou um padrão único frequente). Por exemplo, as ligações 402, 404 representam ligações intergrupo s no gráfico 400. Conforme descrito em relação à FIG. 2, a mistura dos grupos de sensores nos subgráficos resulta na formação de grupos de sensores misturados (segundo conjunto de grupos de sensores). Assim, os dados codificados ao nível do dia são atualizados com os grupos de sensores misturados para determinar padrões frequentes.
[078] A FIG. 5 ilustra um fluxograma de um método 500 para resumo dos dados multisensor, de acordo com a presente divulgação. O método 500 facilita o resumo sucinto de uma vasta coleção de dados multisensor utilizando o agrupamento de vários subespaços. Em particular, o sistema pode resumir os padrões de utilização e de comportamento de várias máquinas que incluem vários sensores, utilizando os dados multisensor recolhidos a partir das máquinas. Os dados multisensor, ou os dados do sensor poderão incluir valores/leituras do sensor de uma variedade de sensores recolhidos ao longo de um período de tempo ou durante o funcionamento das máquinas que incluem esses sensores. Por exemplo, os dados do sensor poderão pertencer a uma variedade de dias.
[079] Em 502, o método inclui o cálculo de uma variedade de histogramas dos dados do sensor associados a uma variedade de sensores. Em uma versão, cada histograma é representativo do comportamento de um sensor de uma variedade de sensores para um dia. Em 504, são agrupados os respetivos histogramas a partir da variedade de histogramas de cada uma das variedades de sensores para obter uma primeira variedade de grupos de sensores. Em uma versão, os respetivos histogramas podem ser agrupados em um grupo de sensores com base na forma similar dos respetivos histogramas. É descrito um exemplo de agrupamento da variedade de histogramas com referência à FIG. 4. Cada grupo de sensores da primeira variedade de grupos de sensores inclui um histograma central representativo do comportamento do sensor distinto para um sensor da variedade de sensores. Em uma versão, os respetivos histogramas associados aos grupos de sensores da primeira variedade de grupos de sensores são limitados por um primeiro limite da medida da distância.
[080] Em 506, é extraído um primeiro conjunto de regras a partir da primeira variedade de grupos de sensores. Em uma versão, o primeiro conjunto de regras define os padrões dos histogramas entre a variedade de histogramas de um conjunto de sensores, onde os padrões dos histogramas ocorrem com frequência ao longo de um período de tempo. Em uma versão, é extraído o primeiro conjunto de regras utilizando uma técnica de exploração do padrão frequente. Em uma versão, uma regra do primeiro conjunto de regras inclui grupos de sensores de diferentes sensores, de modo a que apenas um grupo de sensores de um sensor possa estar presente em uma regra e não mais.
[081] Em 508, o método inclui a mistura seletiva, correspondente a um sensor da variedade de sensores, de dois ou mais grupos de sensores entre a primeira variedade de grupos de sensores para obter uma segunda variedade de grupos de sensores. Os dois ou mais grupos sensores são misturados com base em duas ou mais regras entre o primeiro conjunto de regras associadas a dois ou mais grupos de sensores e a uma medida da distância entre os dois ou mais grupos de sensores. Em uma versão, os dois ou mais grupos de sensores do sensor são seletivamente misturados com base em uma determinação da concorrência de um ou mais outros sensores da variedade de sensores nos dois ou mais grupos de sensores para um mesmo período de tempo. Em uma versão, a determinação da concorrência de um ou mais grupos de sensores inclui a representação da primeira variedade de grupos de sensores e o primeiro conjunto de regras na forma de um primeiro gráfico. O primeiro gráfico é descrito em pormenor com referência à FIG. 4. O primeiro gráfico inclui uma variedade de pontos e uma variedade de ligações que ligam a variedade de pontos. A variedade de pontos inclui a primeira variedade de grupos de sensores e a variedade de ligações inclui um conjunto de ligações intragrupo e um conjunto de ligações intergrupo , de modo a que uma ligação intergrupo inclua uma ligação entre os grupos de sensores associados a uma regra entre o primeiro conjunto de regras e uma ligação intragrupo inclua uma ligação entre grupos de sensores de um sensor com a medida da distância entre os grupos de sensores inferior a um segundo limite da medida da distância. A segunda variedade de grupos de sensores é identificada a partir do primeiro gráfico. Em uma versão, o segundo conjunto de grupos de sensores é formado após a mistura dos grupos de sensores a partir do primeiro gráfico. O primeiro gráfico inclui um ou mais subgráficos com grupos de sensores associados ao conjunto de sensores. Um ou mais subgráficos são determinados com base na técnica de detecção comunitária. Um subgráfico no primeiro gráfico representa um grupo de grupos de sensores fortemente ligado com base na concorrência derivada do primeiro conjunto de regras e da similaridade determinada pela distância entre os intragrupos de sensores. Os dois ou mais grupos de sensores associados ao sensor são misturados ao determinar a presença de uma intraligação entre dois ou mais grupos de sensores.
[082] Em 510, o método inclui a extração de um segundo conjunto de regras a partir da segunda variedade de grupos de sensores. O segundo conjunto de regras é indicativo dos comportamentos de sensor distintos associados à segunda variedade de grupos de sensores. Em uma versão, é extraído o segundo conjunto de regras com base na técnica de exploração do padrão frequente.
[083] Em 512, é identificado um conjunto de sensores correlacionados a partir da segunda variedade de grupos de sensores com base no segundo conjunto de regras. O segundo conjunto de regras é representado na forma de um segundo gráfico. O segundo gráfico inclui uma variedade de pontos e uma variedade de ligações que ligam a variedade de pontos, de modo a que a variedade de pontos inclua a segunda variedade de grupos de sensores e a variedade de ligações inclua um conjunto de ligações intergrupo s. É identificada uma variedade de sensores únicos associados à segunda variedade de grupos de sensores a partir dos subgráficos no segundo gráfico, de modo a que a variedade de sensores únicos inclua o conjunto de sensores correlacionados, [084] Em 514, é extraído um terceiro conjunto de regras a partir do conjunto de sensores correlacionados. O terceiro conjunto de regras resume os dados multisensor para representar os comportamentos proeminentes do sensor concorrente. Para extração do terceiro conjunto de regras é aplicada uma técnica de exploração do padrão frequente em cada conjunto de sensores correlacionados para obter um conjunto de padrões frequentes e o conjunto de padrões frequentes é agrupado com base na sobreposição mútua entre a variedade de padrões frequentes para obter o terceiro conjunto de regras. Em uma versão, o agrupamento da variedade de padrões frequentes é agrupado com base na sobreposição mútua utilizando uma técnica designada por Coberturas Alternativas de Regras e Exceções (ACRE). ACRE é uma técnica para a interpretação de um conjunto de dados com uma variedade de conjuntos de itens. A técnica inclui o cálculo da variedade de conjuntos de regras que pertencem ao conjunto de dados. A variedade de conjuntos de regras é calculada com base em uma técnica de exploração da regra de associação. A técnica poderá incluir também regras de agrupamento e sobreposição no conjunto de dados. As regras de sobreposição pertencem a transações comuns a partir do conjunto de dados. Adicionalmente, a técnica ACRE poderá incluir a seleção de pelo menos uma regra a partir de cada grupo. Pelo menos uma regra interpreta os conjuntos de itens incluídos em cada grupo.
[085] É fornecido abaixo um exemplo da aplicação do modelo de agrupamento de vários subespaços divulgado com referência às FIGS. 6A-6C.
[086] As FIGS. 6A-6C ilustram um exemplo de resultados obtidos no resumo dos dados multisensor, de acordo com o exemplo da versão. Aqui, os dados do sensor são obtidos a partir de máquinas industriais reforçadas. Os referidos dados do sensor são obtidos a partir do funcionamento de diferentes modelos de motores, cada um em diferentes tipos de equipamentos para mais de três anos. Em cada momento de tempo (por exemplo, em um segundo) são registadas as leituras do sensor de mais de 200 sensores, tais como, temperatura do óleo, velocidade, temperatura do refrigerante, etc. Os dados pertencem a um período de tempo de 3 anos (850 dias) para um tipo de motor que foi instalado em três tipos diferentes de equipamento (também designados por 'aplicação' na linguagem do domínio). Várias versões do modelo de agrupamento de vários subespaços divulgado facilitam a determinação dos comportamentos de sensor distintos e também dos comportamentos de sensor concorrentes que cobrem uma fração significativa dos dias de modo a resumir sucintamente os comportamentos diários destes motores descobrindo um pequeno conjunto de regras que cobrem uma vasta fração (50%) dos dados. São geradas 1000 caixas de histogramas para cada um dos sensores individualmente.
[087] O modelo BIRCH aplicado ao sistema em todos os sensores, resulta em um problema de agrupamento com 10.000 dimensões (1000 caixas por sensor, 10 sensores). É ilustrada uma distribuição dos grupos dos 10 melhores grupos obtida aplicando o BIRCH com referência à FIG. 6A. A FIG. 5A ilustra uma variação dos identificadores do grupo (tracejado no eixo X) com o número de dias incluídos em cada grupo de sensores (tracejado no eixo Y) obtida através da aplicação do modelo BIRCH. A aplicação do BIRCH aos dados de todos os sensores, resultou em um problema de agrupamento com 10.000 dimensões (1000 caixas por sensor, 10 sensores). Em relação à FIG. 6B, são ilustrados os padrões de histograma (612, 614) dos 2 melhores grupos entre os grupos ilustrados na FIG. 6A. Conforme observado, a cobertura total dos 10 melhores grupos é 101 em 850 dias, o que representa apenas 12% dos dados totais.
[088] A aplicação do DBSCAN nos dados do sensor produziu resultados similares. O DBSCAN requer dois parâmetros, nomeadamente e e minPts para agrupamento. É a seguir apresentado um quadro (Quadro I) que inclui a cobertura dos dias com base nos diferentes valores de e e minPts = 1: Quadre L Resultados de agrupamento DBScan [089] Conforme observado no quadro (quadro I) acima, para um valor menor de e (e = 3), são obtidos 606 grupos, dos quais os 10 melhores cobrem 15% dos dias, enquanto para um valor maior de e (e = 10), são obtidos 39 grupos, dos quais um grupo inclui 711 dias. Embora a cobertura de dias seja maior, os grupos obtidos pelo modelo DBSCAN são mais ruidosos do que os determinados na FIG. 6A. Assim, o agrupamento de todos os sensores não facilita o resumo dos dados do sensor de forma eficiente, já que os métodos disponíveis produzem grupos ruidosos ou demasiados grupos com um número pequeno de dias resultando em uma cobertura baixa dos dados.
[090] É calculada uma matriz de covariação para 10 sensores e são identificados 3 conjuntos de sensores correlacionados utilizando a detecção comunitária. Para a detecção comunitária, a matriz de covariação é codificada como um gráfico (por exemplo, o primeiro gráfico) onde cada ponto é um sensor e uma ligação entre dois pontos é representada pelo valor de covariação dos sensores. 2 dos conjuntos de sensores correlacionados incluíam 2 sensores cada e o terceiro conjunto de sensores correlacionados incluía 6 sensores. Os dados do sensor que são agrupados consistem nestes 6 sensores utilizando apenas o BIRCH com dois raios (τηκ = 30 e τηκ = 25). Para Tnk = 30, são obtidos 400 grupos de sensores dos quais o melhor grupo de sensores inclui 60 dias. A cobertura dos melhores 10 grupos foi de 27% (234 dias) dos dias. Para τηκ = 25, são obtidos 478 grupos, sendo que o melhor grupo inclui 43 dias e a cobertura dos 10 melhores grupos foi de 22% (188 dias). Assim, poderá não ser obtido um agrupamento sucinto que cobriu também uma grande fração de dados selecionando um subespaço de grupos com base na covariação do intra sensor.
[091] Os sistemas e métodos propostos para resumo dos dados do sensor fornecem uma abordagem do agrupamento de vários subespaços, onde, os histogramas do sensor são primeiro agrupados individualmente, de modo a agrupar todos os comportamentos de sensor similares em grupos, de modo a que cada grupo central represente um comportamento do sensor distinto. É apresentado no quadro (quadro II) abaixo um exemplo do comportamento do sensor similar determinado pela variedade de grupos de sensores. QUÀ35G II. C ;m£í ortamcíitü · it=tiHK>= lo =cn=ca· [092] Quadro II
[093] Conforme ilustrado no quadro II acima, são encontrados diferentes números de comportamentos distintos para todos os sensores. Para agrupar os histogramas do sensor, é selecionado um pequeno valor do raio (que produz também um índice DB baixo), mesmo que isto tenha resultado em muitos casos onde comportamentos similares de histogramas/sensores tenham sido expandidos por diferentes grupos. Da mesma forma, o sistema divulgado deve organizar os dados do sensor na forma de registos de modo a que cada dia (uma linha nos dados do sensor) seja representado com comportamentos de sensor distintos que os sensores seguiram nesse dia, isto é, os identificadores do grupo pertencentes a cada dia. É efetuada uma exploração do padrão frequente com apoio mínimo, superior = 5% nestes dados do sensor para encontrar padrões de elevado apoio que ocorrem com frequência (um primeiro conjunto de regras) que consistem em diferentes comportamentos de sensor.
[094] O sistema deve misturar os grupos de sensores que concorrem com um grupo de outro sensor. Para encontrar esses grupos similares para mistura, o sistema deve codificar a informação para sobrepor entre os grupos de sensores identificados pela exploração de padrão frequente (ou primeiro conjunto de regras) juntamente com as distâncias intragrupo dos grupos de sensores do mesmo sensor como um gráfico, seguido da detecção comunitária. O sistema identificou 8 comunidades e efetuou a mistura de grupos nessas comunidades. O resultado da mistura de grupos a partir das comunidades obtidas é descrito no Quadro IV abaixo: QLADRO Γ\ . Comunidades para fusão de grupos [095] Conforme ilustrado no quadro (quadro IV), a 2- coluna contém o nome dos sensores para os quais vai ser efetuada a mistura do grupo, a 3ã coluna contém as identificações do grupo que são identificadas a partir das comunidades para mistura, a 4§ coluna contém os dias totais incluídos nos grupos a serem misturados e a 5- coluna contém os dias que são misturados dependendo do segundo limite, já que os grupos selecionados serão misturados, conforme a seguir descrito.
[096] Em relação agora à FIG. 6C, são ilustrados os histogramas centrais para os dois grupos de sensores, APP_3 (representado como 632) e APP_4 (representado como 634), para o sensor APP que são selecionados pelo sistema para mistura. O APP_3 possui 87 dias dos quais 80 estão incluídos no grupo misturado (APP_M_67) enquanto o APP_4 possui 107 dias e 105 foram incluídos para mistura. Os dias que não estão incluídos no grupo misturado são deixados nos seus grupos originais. Na FIG. 6C, são ilustrados os histogramas centrais dos dias deixados por APP 3(rem) (representado como 636) e APP 4(rem) (representado como 638). Conforme é aqui observado, os dias com histogramas ligeiramente diferentes não são incluídos no grupo misturado e apenas os histogramas similares são misturados, deixando os restantes nos seus grupos originais.
[097] Após misturar os grupos, os dados codificados ao nível do dia são atualizados com os grupos misturados. Como para 10 sensores são recuperados 2466 comportamentos de sensor distintos após a mistura do grupo, a exploração do padrão frequente pode ser efetuada identificando um conjunto de sensores correlacionados e depois explorar os padrões frequentes para esses sensores correlacionados, aumentando a velocidade do processo de exploração do padrão frequente e para descobrir os padrões com um suporte ainda menor. O conjunto de sensores correlacionados é determinado utilizando a detecção comunitária, que resulta na geração de comunidades de sensores fortemente correlacionados. O segundo conjunto de padrões frequentes (ou regras) é representado na forma de um gráfico e as comunidades (ou subgráficos) são deletadas nesse gráfico utilizando o algoritmo de modularidade. Para 10 sensores são identificadas 6 comunidades, conforme ilustrado no Quadro III abaixo: QUADRO III. Comunidades para sensores correlacionados [098] Conforme ilustrado no quadro III acima, 3 comunidades possuem 3, 3 e 4 grupos de sensores respetivamente, enquanto as restantes comunidades são comunidades únicas. O sistema explora então os padrões frequentes para o conjunto de sensores correlacionados, reduzindo assim o número de itens distintos para um ciclo de exploração do padrão. A exploração do padrão frequente nestes 3 conjuntos de sensores correlacionados resulta em 3 conjuntos de padrões frequentes que são combinados (utilizando a técnica de agrupamento da regra) para identificar os padrões de sobreposição que cobriram uma fração significativa dos dias. É descrito no quadro abaixo o resultado do agrupamento de vários subespaços nos dados do sensor: QUADRO V. Top de padrões obtidos dos dados do motor [099] Conforme ilustrado no quadro acima, as três regras ou melhores padrões são definidos em termos de grupos de sensores misturados. Cada padrão dos grupos de sensores pertenceu predominantemente a uma diferente aplicação dos três tipos conhecidos de equipamento nos quais os motores funcionaram, isto é, A1, A2 e A3. Os três melhores comportamentos de cada grupo explicam o funcionamento da máquina para 50% do número total de dias. |CIT_M_237, OPSV_M_29} teve uma sobreposição de 23% com {OPSV M 29, APP 51} e 19% com {NBT_42, NET_109}, {NBT_42, NET_109} e {OPSV_M_29, APP_51} tem uma sobreposição de 12%. Para os melhores padrões, o quadro (4ã coluna) contém também a quantidade de dias em que o padrão foi observado para cada aplicação. Os 3 padrões específicos da aplicação não são disponíveis e cobriram 35% dos dias.
[100] Várias versões do método e sistema divulgado fornecem um resumo sucinto da utilização e dos padrões comportamentais de uma coleção de máquinas similares utilizando dados multisensor observados durante vários dias na forma de um conjunto de regras. Cada regra do conjunto de regras é descrita pela associação em grupos de possíveis conjuntos diferentes de sensores. Cada grupo de sensores identifica uma distribuição em particular dos valores do sensor ao longo do dia. O método divulgado apresenta um procedimento para descobrir automaticamente um pequeno conjunto de regras, bem como os grupos de sensor único que incluem, de modo a que essas regras cubram coletivamente a maioria dos dados do sensor observados.
[101] A descrição escrita descreve este assunto para permitir que qualquer especialista execute e utiliza as versões. O âmbito das versões realizadas no assunto é definido peças reivindicações e poderá incluir outras modificações que ocorram para os especialistas. Essas outras modificações pretendem estar dentro do âmbito das reivindicações se tiverem elementos similares que não difiram da linguagem literal das reivindicações ou se incluírem elementos equivalentes com diferenças substanciais da linguagem literal das reivindicações.
[102] Contudo, deve-se entender que o âmbito da proteção é extensível a esse programa e adicionalmente a um meio legível no computador com uma mensagem no mesmo; esse meio de armazenamento legível no computador contém meios de codificação do programa para implementação de uma ou mais fases do método, quando o programa é executado em um servidor ou em um dispositivo móvel ou qualquer dispositivo programável adequado. O dispositivo de hardware pode ser um dispositivo de qualquer tipo que pode ser programado incluindo, por exemplo, qualquer tipo de computador como um servidor ou um computador pessoal, ou similar, ou qualquer combinação dos mesmos. O dispositivo poderá incluir também meios que poderão ser, por exemplo, meios de hardware como, por exemplo, um circuito integrado específico da aplicação (ASIC), uma porta lógica programável (FPGA), ou uma combinação dos meios de hardware e software, por exemplo, um ASIC e um FPGA, ou pelo menos um microprocessador e pelo menos uma memória com módulos de software aí localizados. Assim, o meio poderá incluir meios de hardware e meios de software. As versões do método aqui descritas poderão ser implementadas no hardware e software. O dispositivo poderá incluir também meios de software. Em alternativa, as versões poderão ser implementadas em diferentes dispositivos de hardware, por exemplo, utilizando uma variedade de CPUs.
[103] As versões podem incluir elementos de hardware e software. As versões que são implementadas no software incluem, mas não estão limitadas a, firmware, software residente, microcódigo, etc. As funções efetuadas pelos vários módulos aqui descritos poderão ser implementadas noutros módulos ou combinações de outros módulos. Para objeto desta descrição, um meio utilizável no computador ou legível no computador poderá ser qualquer aparelho que possa incluir, guardar, comunicar, divulgar ou transportar o programa para utilização através de ou em ligação com o sistema, aparelho ou dispositivo de execução da instrução.
[104] Um sistema de processamento dos dados adequado para guardar e/ou executar o código do programa irá incluir pelo menos um processador acoplador direta ou indiretamente aos elementos da memória através de um bus do sistema. Os elementos da memória podem incluir a memória local utilizada durante a execução real do código do programa, armazenamento em massa e memórias cache que permite o armazenamento temporário de pelo menos alguns códigos do programa para reduzir o número de vezes que o código deve ser recuperado para o armazenamento em massa durante a execução.
[105] Os dispositivos de entrada/saída (l/O) (incluindo, mas não estando limitado a teclados, visores, dispositivos apontadores, etc.) podem ser acoplados ao sistema diretamente ou através de controladores l/O intervenientes. Os adaptadores de rede poderão ser também acoplados ao sistema para permitir que o sistema de processamento de dados fique acoplado a outros sistemas de processamento de dados ou impressoras remotas ou dispositivos de armazenamento através de redes privadas ou públicas intervenientes. Os modems, cabo modem e cartões de Ethernet são apenas alguns dos tipos atualmente disponíveis de adaptadores de rede.
[106] O sistema inclui ainda um adaptador de interface do utilizador que liga um teclado, rato, coluna, microfone e/ou outros dispositivos de interface do utilizador, tais como um dispositivo de ecrã tátil (não ilustrado) ao bus para juntar as entradas do utilizador. Adicionalmente, um adaptador de comunicação liga o bus a uma rede de processamento de dados e um adaptador do visor liga o bus a um dispositivo de visualização que pode ser um dispositivo de saída, como um monitor, impressora ou transmissor, por exemplo.
[107] A descrição acima mencionada das implementações e versões específicas irá revelar totalmente a natureza geral das implementações e versões que outros poderão, através da aplicação dos conhecimentos atuais, alterar e/ou adaptar prontamente para várias aplicações essas versões específicas sem se afastar do conceito genérico e, desse modo, essas adaptações e modificações devem e pretendem ser compreendidas dentro do significado e gama de equivalentes das versões divulgadas. Deve-se entender que as frases ou terminologia aqui utilizadas destinam-se à descrição e não são limitativas. Desse modo, embora as versões tenham sido aqui descritas em termos de versões preferenciais, os especialistas irão reconhecer que as versões podem ser praticadas como modificação dentro do espírito e âmbito das versões aqui descritas.
[108] A descrição anterior foi apresentada com referência a várias versões. As pessoas com conhecimentos especializados e tecnologias às quais esta aplicação pertence, irão apreciar que as alterações e modificações nas estruturas e métodos descritos de funcionamento possam ser praticadas sem se afastarem significativamente do princípio, espírito e âmbito.
REIVINDICAÇÕES

Claims (16)

1. Método implementado em um computador para resumir os dados multisensor caracterizado por incluir: o cálculo de uma variedade de histogramas dos dados do sensor associados a uma variedade de sensores; o agrupamento, a partir de uma variedade de histogramas, dos respetivos histogramas de cada uma das variedades de sensores para obter uma primeira variedade de grupos de sensores com base nos respetivos histogramas, sendo que cada grupo de sensores da primeira variedade de grupos de sensores inclui um histograma central representativo do comportamento do sensor distinto para um sensor distinto da variedade de sensores; efetuar uma exploração do padrão frequente na primeira variedade de grupos de sensores para extrair um primeiro conjunto de regras, estando uma regra do primeiro conjunto de regras associada a um conjunto de sensores da variedade de sensores e incluindo um conjunto de grupos de sensores que ocorre frequentemente na primeira variedade de grupos de sensores ao longo de um período de tempo; a mistura seletiva de dois ou mais grupos de sensores entre a primeira variedade de grupos de sensores para obter uma segunda variedade de grupos de sensores, sendo que dois ou mais grupos de sensores selecionados correspondem a um sensor do conjunto de sensores, e dois ou mais grupos de sensores são misturados com base em duas ou mais regras entre o primeiro conjunto de regras associadas a dois ou mais grupos de sensores e uma medida da distância entre dois ou mais grupos de sensores do sensor; a extração de um segundo conjunto de regras a partir da segunda variedade de grupos de sensores, em que o segundo conjunto de regras é indicativo dos comportamentos de sensor distintos associados à segunda variedade de grupos de sensores; a identificação de uma variedade de conjuntos de sensores correlacionados de uma segunda variedade de grupos de sensores com base no segundo conjunto de regras; e a extração de um terceiro conjunto de regras a partir de um ou mais conjuntos de sensores correlacionados, em que o terceiro conjunto resume os dados multisensor para representar os comportamentos proeminentes concorrentes do sensor.
2. Método de acordo com a reivindicação 1, caracterizado por os respetivos histogramas associados a um grupo de sensores da primeira variedade de grupos de sensores estarem limitados por um primeiro limite da medida da distância e em que o primeiro limite da medida da distância inclui uma da distância Euclidiana, uma distância do motor da Terra, divergência de Kullback-Leibler, distância de Bhattacharyya, distância de Manhattan e métrica de Wasserstein
3. Método de acordo com a reivindicação 1, caracterizado por fato do segundo conjunto de regras ser extraído utilizando uma técnica de exploração do padrão frequente.
4. Método de acordo com a reivindicação 1, caracterizado oor a mistura seletiva de dois ou mais grupos de sensores do sensor ser efetuada com base em uma determinação da concorrência de um ou mais outros sensores da variedade de sensores nos dois ou mais grupos de sensores para um mesmo período de tempo.
5. Método de acordo com a reivindicação 4, caracterizado oor a determinação da concorrência de um ou mais outros sensores incluir: a representação da primeira variedade de grupos de sensores e o primeiro conjunto de regras na forma de um primeiro gráfico, em que o primeiro gráfico inclui uma variedade de pontos e uma variedade de ligações que ligam a variedade de pontos, sendo que a variedade de pontos representa a primeira variedade de grupos de sensores e a variedade de ligações inclui um conjunto de ligações intragrupo e um conjunto de ligações intergrupo , sendo que uma ligação intergrupo inclui uma ligação entre os grupos de sensores associados a uma regra do primeiro conjunto de regras e uma ligação intragrupo inclui uma ligação entre os grupos de sensores de um sensor com a medida da distância entre os grupos de sensores inferior ao segundo limite da medida da distância; e a identificação da segunda variedade de grupos de sensores a partir do primeiro gráfico, sendo que um grupo de sensores da segunda variedade de grupos de sensores é identificado a partir de um subgráfico do primeiro gráfico, sendo que o subgráfico inclui os dois ou mais grupos de sensores associados ao conjunto de sensores, e sendo que os dois ou mais grupos de sensores associados a um sensor do conjunto de sensores no subgráfico são misturados ao determinar a presença da ligação intragrupo entre os dois ou mais grupos de sensores.
6. Método de acordo com a reivindicação 1, caracterizado por a identificação da variedade de conjuntos de sensores correlacionados associados à segunda variedade de grupos de sensores incluir: a representação do segundo conjunto de regras e da segunda variedade de grupos de sensores na forma de um segundo gráfico, em que o segundo gráfico inclui uma variedade de pontos e uma variedade de ligações que ligam a variedade de pontos, sendo que a variedade de pontos representa a segunda variedade de grupos de sensores e a variedade de ligações inclui ligações intergrupo entre a segunda variedade de grupos de sensores; e a identificação da variedade de conjuntos de sensores correlacionados associados à segunda variedade de grupos de sensores a partir de um ou mais subgráficos do segundo gráfico, sendo que a variedade de sensores únicos associados a cada de um ou mais subgráficos representa o conjunto de sensores correlacionados.
7. Método de acordo com a reivindicação 1, caracterizado por a extração do terceiro conjunto de regras incluir: a aplicação da exploração do padrão frequente a cada variedade de conjuntos de sensores correlacionados para obter um conjunto de padrões frequentes; e o agrupamento do conjunto de padrões frequentes com base na sobreposição mútua entre a variedade de padrões frequentes para obter o terceiro conjunto de regras.
8. Sistema 200 implementado em computador para resumir os dados multisensor, caracterizado por o sistema 200 incluir: pelo menos uma memória 204; e pelo menos um processador 202, em que a memória 204 está acoplada pelo menos ao processador 202, sendo que pelo menos um processador é capaz de executar instruções programadas guardadas na memória 204 para: calcular uma variedade de histogramas dos dados do sensor associados a uma variedade de sensores, agrupar, a partir de uma variedade de histogramas, dos respetivos histogramas de cada uma das variedades de sensores para obter uma primeira variedade de grupos de sensores com base nos respetivos histogramas, sendo que cada grupo de sensores da primeira variedade de grupos de sensores inclui um histograma central representativo do comportamento do sensor distinto para um sensor distinto da variedade de sensores, efetuar uma exploração do padrão frequente na primeira variedade de grupos de sensores para extrair um primeiro conjunto de regras, estando uma regra do primeiro conjunto de regras associada a um conjunto de sensores da variedade de sensores e incluindo um conjunto de grupos de sensores que ocorre frequentemente na primeira variedade de grupos de sensores ao longo de um período de tempo, misturar seletivamente dois ou mais grupos de sensores entre a primeira variedade de grupos de sensores para obter uma segunda variedade de grupos de sensores, sendo que dois ou mais grupos de sensores selecionados correspondem a um sensor do conjunto de sensores, e dois ou mais grupos de sensores são misturados com base em duas ou mais regras entre o primeiro conjunto de regras associadas a dois ou mais grupos de sensores e uma medida da distância entre dois ou mais grupos de sensores do sensor, extrair um segundo conjunto de regras a partir da segunda variedade de grupos de sensores, em que o segundo conjunto de regras é indicativo dos comportamentos de sensor distintos associados à segunda variedade de grupos de sensores, identificar uma variedade de conjuntos de sensores correlacionados de uma segunda variedade de grupos de sensores com base no segundo conjunto de regras, e extrair um terceiro conjunto de regras a partir de um ou mais conjuntos de sensores correlacionados, em que o terceiro conjunto resume os dados multisensor para representar os comportamentos proeminentes concorrentes do sensor,
9. Sistema 200 de acordo com a reivindicação 8, caracterizado por os respetivos histogramas associados a um grupo de sensores da primeira variedade de grupos de sensores estar limitado por um primeiro limite da medida da distância e em que o primeiro limite da medida da distância inclui uma da distância Euclidiana, uma distância do motor da Terra, divergência de Kullback-Leibler, distância de Bhattacharyya, distância de Manhattan e métrica de Wasserstein.
10. Sistema 200 de acordo com a reivindicação 8, caracterizado por pelo menos um processador 202 ser configurado através das instruções para efetuar o agrupamento com base em uma redução e Agrupamento Iterativo Equilibrado utilizando o modelo de agrupamento por Hierarquias (BIRCH).
11. Sistema 200 de acordo com a reivindicação 8, caracterizado por pelo menos um processador 202 ser configurado através das instruções para extrair o segundo conjunto de regras utilizando uma técnica de exploração do padrão frequente.
12. Sistema 200 de acordo com a reivindicação 8, caracterizado oor pelo menos um processador 202 ser configurado pelas instruções para misturar seletivamente dois ou mais grupos de sensores do sensor com base em uma determinação da concorrência de um ou mais outros sensores da variedade de sensores nos dois ou mais grupos de sensores para um mesmo período de tempo.
13. Sistema 200 de acordo com a reivindicação 12, caracterizado por, para determinar a concorrência de um ou mais outros sensores, pelo menos um processador 202 ser configurado pelas instruções para: representar a primeira variedade de grupos de sensores e o primeiro conjunto de regras na forma de um primeiro gráfico, em que o primeiro gráfico inclui uma variedade de pontos e uma variedade de ligações que ligam a variedade de pontos, sendo que a variedade de pontos representa a primeira variedade de grupos de sensores e a variedade de ligações inclui um conjunto de ligações intragrupo e um conjunto de ligações intergrupo , sendo que uma ligação intergrupo inclui uma ligação entre os grupos de sensores associados a uma regra do primeiro conjunto de regras e uma ligação intragrupo inclui uma ligação entre os grupos de sensores de um sensor com a medida da distância entre os grupos de sensores inferior ao segundo limite da medida da distância; e identificar a segunda variedade de grupos de sensores a partir do primeiro gráfico, sendo que um grupo de sensores da segunda variedade de grupos de sensores é identificado a partir de um subgráfico do primeiro gráfico, sendo que o subgráfico inclui os dois ou mais grupos de sensores associados ao conjunto de sensores, e sendo que os dois ou mais grupos de sensores associados a um sensor do conjunto de sensores no subgráfico são misturados ao determinar a presença da ligação intragrupo entre os dois ou mais grupos de sensores.
14. Sistema 200 de acordo com a reivindicação 8, caracterizado por, para identificar a variedade de conjuntos de sensores correlacionados associados à segunda variedade de grupos de sensores, pelo menos um processador 202 ser configurado pelas instruções para: representar o segundo conjunto de regras e da segunda variedade de grupos de sensores na forma de um segundo gráfico, em que o segundo gráfico inclui uma variedade de pontos e uma variedade de ligações que ligam a variedade de pontos, sendo que a variedade de pontos representa a segunda variedade de grupos de sensores e a variedade de ligações inclui ligações intergrupo entre a segunda variedade de grupos de sensores; e identificar a variedade de conjuntos de sensores correlacionados associados à segunda variedade de grupos de sensores a partir de um ou mais subgráficos do segundo gráfico, sendo que a variedade de sensores únicos associados a cada de um ou mais subgráficos representa o conjunto de sensores correlacionados.
15. Sistema 200 de acordo com a reivindicação 8, caracterizado por, para extrair o terceiro conjunto de regras, pelo menos um processador 202 ser configurado pelas instruções para: aplicar a exploração do padrão frequente a cada variedade de conjuntos de sensores correlacionados para obter um conjunto de padrões frequentes; e agrupar o conjunto de padrões frequentes com base na sobreposição mútua entre a variedade de padrões frequentes para obter o terceiro conjunto de regras.
16. Meio de leitura por computador não transitório que integra um programa de computador para executar um método para resumir os dados multisensor caracterizado por que incluir: o cálculo de uma variedade de histogramas dos dados do sensor associados a uma variedade de sensores; o agrupamento, a partir de uma variedade de histogramas, dos respetivos histogramas de cada uma das variedades de sensores para obter uma primeira variedade de grupos de sensores com base nos respetivos histogramas, sendo que cada grupo de sensores da primeira variedade de grupos de sensores inclui um histograma central representativo do comportamento do sensor distinto para um sensor distinto da variedade de sensores; efetuar uma exploração do padrão frequente na primeira variedade de grupos de sensores para extrair um primeiro conjunto de regras, estando uma regra do primeiro conjunto de regras associada a um conjunto de sensores da variedade de sensores e incluindo um conjunto de grupos de sensores que ocorre frequentemente na primeira variedade de grupos de sensores ao longo de um período de tempo; a mistura seletiva de dois ou mais grupos de sensores entre a primeira variedade de grupos de sensores para obter uma segunda variedade de grupos de sensores, sendo que dois ou mais grupos de sensores selecionados correspondem a um sensor do conjunto de sensores, e dois ou mais grupos de sensores são misturados com base em duas ou mais regras entre o primeiro conjunto de regras associadas a dois ou mais grupos de sensores e uma medida da distância entre dois ou mais grupos de sensores do sensor; a extração de um segundo conjunto de regras a partir da segunda variedade de grupos de sensores, em que o segundo conjunto de regras é indicativo dos comportamentos de sensor distintos associados à segunda variedade de grupos de sensores; a identificação de uma variedade de conjuntos de sensores correlacionados de uma segunda variedade de grupos de sensores com base no segundo conjunto de regras; e a extração de um terceiro conjunto de regras a partir de um ou mais conjuntos de sensores correlacionados, em que o terceiro conjunto resume os dados multisensor para representar os comportamentos proeminentes concorrentes do sensor.
BR102016005511-3A 2015-10-17 2016-03-11 Resumo dos dados multisensor BR102016005511B1 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN3945MU2015 2015-10-17
IN3945/MUM/2015 2015-10-17

Publications (2)

Publication Number Publication Date
BR102016005511A2 true BR102016005511A2 (pt) 2017-05-30
BR102016005511B1 BR102016005511B1 (pt) 2021-04-13

Family

ID=55453051

Family Applications (1)

Application Number Title Priority Date Filing Date
BR102016005511-3A BR102016005511B1 (pt) 2015-10-17 2016-03-11 Resumo dos dados multisensor

Country Status (7)

Country Link
US (1) US10332030B2 (pt)
EP (1) EP3157264B1 (pt)
JP (1) JP6219428B2 (pt)
AU (1) AU2016201330B2 (pt)
BR (1) BR102016005511B1 (pt)
CA (1) CA2923563C (pt)
MX (1) MX368053B (pt)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2973071B1 (en) * 2013-03-15 2020-05-06 Fluke Corporation Automatic recording and graphing of measurement data
US10380204B1 (en) 2014-02-12 2019-08-13 Pinterest, Inc. Visual search
US10506380B2 (en) * 2016-12-22 2019-12-10 Nokia Solutions And Networks Oy User motion profiling based on user equipment cell location
US10755198B2 (en) * 2016-12-29 2020-08-25 Intel Corporation Data class analysis method and apparatus
US11519628B2 (en) * 2018-01-19 2022-12-06 Robert Bosch Gmbh System and method for optimizing energy use of a structure using a clustering-based rule-mining approach
US10929505B1 (en) * 2018-03-19 2021-02-23 EMC IP Holding Company LLC Method and system for implementing histogram-based alarms in a production system
JP7176385B2 (ja) * 2018-12-06 2022-11-22 富士通株式会社 分析プログラム、分析方法および分析装置
JP7298870B2 (ja) * 2019-03-15 2023-06-27 慶應義塾 分子動力学データ解析装置及びプログラム
US10887928B2 (en) 2019-04-24 2021-01-05 Here Global B.V. Lane aware clusters for vehicle to vehicle communication
US11693924B2 (en) * 2019-06-06 2023-07-04 Hitachi, Ltd. System and method for maintenance recommendation in industrial networks
CN113282645A (zh) * 2021-07-23 2021-08-20 广东粤港澳大湾区硬科技创新研究院 一种卫星时序参数分析方法、系统、终端以及存储介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7580912B2 (en) 2001-06-12 2009-08-25 Alcatel-Lucent Usa Inc. Performance data mining based on real time analysis of sensor data
US7143352B2 (en) * 2002-11-01 2006-11-28 Mitsubishi Electric Research Laboratories, Inc Blind summarization of video content
US7715961B1 (en) * 2004-04-28 2010-05-11 Agnik, Llc Onboard driver, vehicle and fleet data mining
US7937167B1 (en) * 2006-08-12 2011-05-03 Hewlett-Packard Development Company L. P. Methodology to program sensors into collaborative sensing groups
JP4686438B2 (ja) 2006-11-28 2011-05-25 日本電信電話株式会社 データ分類装置、データ分類方法およびデータ分類プログラムならびに記録媒体
US9270518B2 (en) * 2010-05-17 2016-02-23 Hitachi, Ltd. Computer system and rule generation method
US20120224711A1 (en) 2011-03-04 2012-09-06 Qualcomm Incorporated Method and apparatus for grouping client devices based on context similarity
JP5301717B1 (ja) 2012-08-01 2013-09-25 株式会社日立パワーソリューションズ 設備状態監視方法およびその装置
JP6057786B2 (ja) 2013-03-13 2017-01-11 ヤフー株式会社 時系列データ解析装置、時系列データ解析方法、およびプログラム
CN103344941B (zh) * 2013-06-13 2015-08-12 北京空间飞行器总体设计部 基于无线传感器网络的实时目标检测方法
JP6082341B2 (ja) 2013-12-05 2017-02-15 株式会社日立ソリューションズ 異常検出装置及び異常検出方法
JP6207405B2 (ja) 2014-01-10 2017-10-04 三菱電機株式会社 データ処理装置
EP2916260A1 (en) * 2014-03-06 2015-09-09 Tata Consultancy Services Limited Time series analytics
JP6154542B2 (ja) 2014-03-26 2017-06-28 株式会社日立製作所 時系列データ管理方法及び時系列データ管理システム

Also Published As

Publication number Publication date
EP3157264B1 (en) 2019-02-20
BR102016005511B1 (pt) 2021-04-13
MX2016003107A (es) 2017-04-17
US20170109653A1 (en) 2017-04-20
US10332030B2 (en) 2019-06-25
AU2016201330A1 (en) 2017-05-04
MX368053B (es) 2019-09-18
JP6219428B2 (ja) 2017-10-25
CA2923563C (en) 2020-04-21
JP2017076359A (ja) 2017-04-20
AU2016201330B2 (en) 2018-05-10
EP3157264A1 (en) 2017-04-19
CA2923563A1 (en) 2017-04-17

Similar Documents

Publication Publication Date Title
BR102016005511A2 (pt) Summary of multisensor data
Zhang et al. Repocoder: Repository-level code completion through iterative retrieval and generation
Bennin et al. Mahakil: Diversity based oversampling approach to alleviate the class imbalance issue in software defect prediction
Kodandaramaiah Use of dispersal–vicariance analysis in biogeography–a critique
Hartmanns et al. The Modest Toolset: An integrated environment for quantitative modelling and verification
US10671061B2 (en) Devices, methods, and systems for a distributed rule based automated fault detection
Feitosa et al. Investigating the effect of design patterns on energy consumption
Zeng et al. Estimation of software defects fix effort using neural networks
CN113609008B (zh) 测试结果分析方法、装置和电子设备
US8245084B2 (en) Two-level representative workload phase detection
Stojanovic et al. A data-driven approach for multivariate contextualized anomaly detection: Industry use case
Aksar et al. Prodigy: Towards unsupervised anomaly detection in production hpc systems
Song et al. Autonomous selection of the fault classification models for diagnosing microservice applications
Eblen et al. The maximum clique enumeration problem: Algorithms, applications and implementations
Islam et al. A Package Based Clustering for enhancing software defect prediction accuracy
Zhang et al. An efficient hierarchy algorithm for community detection in complex networks
Shao et al. Research on Cross‐Company Defect Prediction Method to Improve Software Security
Mandal et al. Improved topology extraction using discriminative parameter mining of logs
Cameron et al. Bias in Algorithm Portfolio Performance Evaluation.
Gill et al. ProvFL: Client-Driven Interpretability of Global Model Predictions in Federated Learning
Aksar et al. Towards Practical Machine Learning Frameworks for Performance Diagnostics in Supercomputers
Zhai et al. A Recommendation Approach Based on Bayesian Networks for Clone Refactor.
Marian Aggregated metrics guided software restructuring
Xin Towards effective performance diagnosis for distributed applications
Khan et al. Random cluster sampling on x-machines test cases

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 11/03/2016, OBSERVADAS AS CONDICOES LEGAIS.

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 6A ANUIDADE.

B24D Patent annual fee: restoration after fee payment