BR102012002812A2 - Pata method determining the influence of a variable in a phenomena - Google Patents
Pata method determining the influence of a variable in a phenomena Download PDFInfo
- Publication number
- BR102012002812A2 BR102012002812A2 BR102012002812-3A BR102012002812A BR102012002812A2 BR 102012002812 A2 BR102012002812 A2 BR 102012002812A2 BR 102012002812 A BR102012002812 A BR 102012002812A BR 102012002812 A2 BR102012002812 A2 BR 102012002812A2
- Authority
- BR
- Brazil
- Prior art keywords
- variable
- nodes
- variable nodes
- influence
- variables
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
"método para determinar a influência de uma variável em um fenômeno" método para determinar a influência de uma variável em um fenômeno que inclui a extração de uma variável selecionada a partir de um meio não transitório para a análise e a condução em um processador de uma sequência de operações gráficas que inclui outras variáveis no fenômeno. calcular um indicador de influência da variável para a variável selecionada e repetir as etapas para outras variáveis selecionadas permite uma avaliação entre as variáveis selecionadas para determinar a influência das mesmas no fenômeno.
Description
“MÉTODO PARA DETERMINAR A INFLUÉNCJA DE UMA VARIÁVEL EM UM FENÔMENO” Antecedentes Da Invenção A tecnologia descrita na presente invenção refere-se ao Método para determinar a influência de uma dada variável em um fenômeno. A detecção de padrões que se referem a doenças ou os modos de falha em particular em máquinas ou eventos observados podem ser muito desafiadores. É geralmente mais fácil determinar quando os sintomas (ou medições) sào anormais. Sabendo que uma situação é anormal pode ser bem valioso. No entanto, há ainda mais valor se a anormalidade pode ser etiquetada com uma classificação de severidade e/ou associada com uma condição específica ou modo de falha. A informação de diagnóstico está contida no padrão de associação entre as variáveis de entrada (por exemplo, os parâmetros de medição) e a anomalia. No entanto, esse padrão pode ser muito difícil de extrair.
Na indústria de processo, A Análise de Componentes Principais (PCA) é frequentemente usada para detecção de anomalias ou diagnose de defeitos. As contribuições variáveis para os componentes residuais ou principais podem ser calculadas. Esse método fornece uma indicação de quais variáveis contribuem mais para a medição da anormalidade. No entanto, A PCA tem restrições A mesma é unimodal, o que significa que sua utilidade é [imitada quando os dados são gerados a partir de densidades complexas e a mesma não fornece um método intuitivo para manejar dados ausentes.
Outra abordagem para a detecção da contribuição de variáveis é para calcular os residuais. Para uma variável específica, uma técnica de regressão é usada para predizer o valor da variável que é então subtraído do valor medido para derivar o residual. A magnitude do residual fornece uma medida de sua contribuição para um estado anômalo. No entanto, isso ainda pode ser difícil de comparar dl retamente variáveis diferentes. E, se variáveis múltiplas estão contribuindo para a anomalia, as saídas dos residuais podem ser equivocadas. A técnica de regressão é frequentemente unimodaí e sofrerá restrições similares ao PC A.
Breve Descrição Da Invenção Em um aspecto, um Método para determinar a influência de uma variável em um fenômeno compreende o fornecimento de um modelo de mistura em forma gráfica que inclui componentes modeío, pelo menos um nó de ciasse que representa uma classe associada com os componentes modelo, e uma pluralidade de nós variáveis que representa os valores associados com as variáveis dentro da classe, todas representam dados físicos dentro de um sistema experimentando o fenômeno, a seleção de um ou de um subconjunto de nós variáveis, que executam uma operação na forma gráfica pelo estabelecimento de evidência nos nós variáveis outro que aquele já selecionado, calcular uma distribuição conjunta para o nó de variável selecionado e um ou mais classes de nós mediante a marginalização para gerar um novo gráfico, calcular um indicador de influência da variável para o nó de variável selecionado a partir do novo gráfico, repetir a seleção que executa e calcula as etapas para outras nós variáveis selecionadas, e avaliar a magnitude do indicador de influência das variáveis para as nós variáveis em relação entre si.
Em outro aspecto, o novo gráfico é uma transformação descrita por f:P(Xi, l\ex.xj, es) —» P(Xi,l), em que / representa os componentes modelo, X representa as variáveis, S representa estados ou distribuições por uma classe, e e denota a evidência.
Em um aspecto adicional, o indicador de influência da variável representa uma mudança direcional nos valores do nó de variável. Da mesma maneira, a seleção pode ser dependente de aplicação. Ademais, a etapa de execução pode incluir estabelecer a evidência por padrão e pelo sequenciamento para determinar o tipo de indicador de influência da variável. Em uma realização, o fenômeno ocorre no sistema de um motor de aeronave e o modelo de mistura representa o desempenho do motor de aeronave.
Breve Descrição Dos Desenhos Nos desenhos: A Figura 1A mostra as plotagens dos dados para diversas variáveis diferentes de entrada em um dado fenômeno. A Figura tB é uma marcação de possibilidade para um histórico de tempo das variáveis de entrada na Figura 1A. A Figura 2 é um modelo de mistura de um fenômeno que mostra tanto uma distribuição Gaussiana e nós discretos que agem como filtros. A Figura 3 é uma possibilidade de log exemplificadora de um modelo com base nos dados Iris. A Figura 4 é um fluxograma que ilustra um Método para determinar a influência de uma variável em um fenômeno de acordo com uma realização da presente invenção. A Figura 5 é um exemplo de indicador de influência das variáveis calculados de acordo com o método da Figura 4 para os dados da Figura 1A.
Descrição Detalhada No seguinte relatório descritivo, para os propósitos de explicação, numerosos detalhes específicos são estabelecidos com a finalidade de fornecer um entendimento abrangente da tecnologia descrita neste. Será evidente para uma pessoa versada na técnica, no entanto, que as realizações exemplificadoras possam ser praticadas sem esses detalhes específicos. Em outros casos, as estruturas e dispositivos são mostrados na forma de diagrama com a finalidade de facilitar o relatório descritivo das realizações exemplificadoras.
As realizações exemplifica d oras são descritas abaixo com referência aos desenhos. Esses desenhos ilustram certos detalhes de realizações específicas que implantam o módulo, método, e produto de programa de computador descrito neste. No entanto, os desenhos não deveríam ser interpretados como impondo quaisquer limitações que possam estar presentes nos desenhos. Os método e produto de programa de computador podem ser fornecidos em qualquer meio legível por máquina para executar essas operações, As realizações podem ser implantadas pelo uso de um processador de computador existente, ou por um processador de computador de propósito específico incorporado para esse ou outro propósito, ou por um sistema com fios, Conforme observado acima, as realizações descritas neste incluem um produto de programa de computador que compreende um meio legível por máquina não transitório para transportar ou ter instruções executáveis por máquina ou estruturas de dados armazenadas no mesmo. Tal meio íegíve! por máquina pode ser qualquer meio disponível, que pode ser acessado por um computador de propósito geral ou de propósito especial ou outra máquina com um processador, Como forma de exemplo, tal meio legível por máquina pode compreender RAM, ROM, EPROM, EEPROM, CD-ROM ou outro armazenamento de disco óptico, armazenamento de disco magnético ou outro dispositivos de armazenamento magnético, ou qualquer outro meio que possa ser usado para transportar ou armazenar código de programa desejado na forma de instruções executáveis por máquina ou estruturas de dados e que podem ser acessadas por um computador de propósito geral ou de propósito especial ou outra máquina com um processador. Quando á informação é transferida ou fornecida através de uma rede ou outra conexão de comunicação (ou com fio, ou sem fio, ou uma combinação de com fio ou sem fio) para uma máquina, a máquina vê apropriadamente a conexão como um meio legível por máquina. Assim, qualquer conexão é apropriadamente chamada como um meio legível por máquina, As combinações do acima também estão incluídas dentro do escopo do meio íegivel por máquina. As instruções executáveis por máquina compreendem, por exemplo, instruções e dados, que causam que um computador de propósito geral, computador de propósito especial, ou máquinas de processamento de propósito especial para executar uma certa função ou grupo de funções.
As realizações serão descritas no contexto geral das etapas do método que podem ser implantadas em uma realização por um produto de programa que inclui instruções executáveis por máquina, tal como código de programa, por exemplo, na forma de módulos de programa executados por máquinas em ambientes com rede. Geralmente, os módulos de programa incluem rotinas, programas, objetos, componentes, estruturas de dados, etc. que tem o efeito da técnica que executa tarefas em particular ou implanta particular tipos de dados abstratos. As instruções executáveis por máquina, estruturas de dados associadas, e módulos de programa que representam exemplos de códigos de programa para a execução das etapas do método apresentado neste, A sequência em particular de tais instruções executáveis ou estruturas de dados associadas representam exemplos de atos correspondentes para implantar as funções descritas em tais etapas.
As realizações podem ser praticadas em um ambiente com rede pelo uso de conexões lógicas para um ou mais computadores remotos que tem processadores. As conexões lógicas podem incluir uma rede de área local (LAN) e uma rede de área ampla (WAN) que são apresentadas aqui como forma de exemplo e não como limitação. Tais ambientes com rede são comuns redes de computador em empresas e escritórios, intranets e a internet e pode usar uma variedade ampla de protocolos de comunicação diferentes. Os versados na técnica apreciarão que tais ambientes de computação de rede irão abranger tipicamente muitos tipos de configuração de sistema de computador, que inclui computadores pessoais, dispositivos portáteis, sistemas de multiprocessador, com base em microprocessador ou produtos eletrônicos programáveis pelo consumidor, um PCs de rede, minicomputadores, computadores de grande porte, e similares.
As realizações também podem ser praticadas em ambientes de computação distribuídos em que as tarefas são executadas por dispositivos de processamento local e remoto que são ligados (ou por ligações com fio, ligações sem fio, ou por uma combinação de ligações com fio ou sem fio) através de uma rede de comunicação. Em um ambiente de computação distribuído, os módulos de programa podem ser localizados tanto nos dispositivos de armazenamento de memória locais quanto remotos.
Um sistema exemplificador para implantar a totalidade ou partes das realizações exemplificadoras pode incluir um dispositivo de computação de propósito geral na forma de um computador, que incluí uma unidade de processamento, uma memória do sistema, e um barramento de sistema, que acopla vários componentes de sistema que incluem a memória do sistema à unidade de processamento A memória do sistema pode incluir memória apenas de leitura (ROM) e memória de acesso aleatório (RAM). O computador também pode incluir uma unidade de disco rígido magnético para ler e escrever em um disco rígido magnético, uma unidade de disco magnético para íer ou escrever em um disco magnético removível, e um disco magnético óptico para ler ou escrever em um disco óptico removível tal como um CD-ROM ou outro meio óptico. As unidades e o meio legível por máquina associada fornecem armazenamento não volátil de instruções executáveis por máquina, estruturas de dados, módulos de programa e outros dados para o computador.
Efeitos técnicos do método apresentado nas realizações inclui a detecção de padrões de maneira mais eficiente que se referem a doenças ou a modos de falha em máquinas em particular, reduzindo o tempo de diagnose e de reparo e permite melhor planejamento de saúde e manutenção.
Os Indicadores de influência das variáveis são usados para dar uma indicação de um comportamento "interessante" de uma variável. Uma aplicação exemplificadora do indicador de influência das variáveis é a determinação de quais variáveis são responsáveis por comportamento anormal. Os indicadores de influência das variáveis são calculados pelo uso de um tipo de dados modelo construído ativado conhecido como um modelo de mistura. Presume-se que esse modelo foi treinado pelo uso de dados históricos de uma maneira a destacar o comportamento de interesse para uma aplicação específica. O modelo de misturas fornece um recurso rico para modelar uma faixa ampla de fenômenos físicos como descrita por G. McLachlan e D. Peel em Finite Mixture Models, John Wiley & Sons, (2000). O Modelo de misturas pode ser usado para modelar o comportamento normal em um fenômeno e, assim, também para detectar comportamento anormal. A marcação de possibilidade de um modelo de mistura pode ser usada para monitorar o comportamento anormal. Em essência, um indicador de influência da variável é uma marcação de possibilidade. O comportamento interessante neste contexto significa que uma variável reside em uma região de espaço que repousa na borda de uma modelo de densidade de mistura. O modelo é mais sensível aos dados que residem nessas regiões. Para muitas aplicações, tal como monitoramento de saúde, as regiões de espaço de densidade baixa frequentemente representam as regiões de mais interesse, pois as máquinas que operam nessas regiões estão funcionando fora dos seus limites designados.
As marcações de possibilidade podem fornecer informações de diagnóstico úteis quando os dados transitam através de regiões de densidade baixa. As possibilidades irão frequentemente revelar características de tendência que fornecem informações sobre o comportamento (tal como se a saude está se deteriorando, ou a detecção parece aleatória e possivelmente associada com instrumentação deficiente). Isso é ilustrado nas Figuras 1A e 1B. A Figura 1A mostra as plotagens dos dados dos valores de oito variáveis diferentes em um dado fenômeno. A Figura 1B é um plotagem de histórico de tempo da marcação de possibilidade para todas as variáveis de entrada na Figura 1A. Neste ê visto que a possibilidade para dados completos espelha o formato de diversas variáveis de entrada - isto fornece uma forma de fusão e resume o comportamento sobre todas as variáveis de entrada (note que a possibilidade está sempre mostrada no espaço de log). Se o histórico completo para todas as variáveis de entrada que residem em regiões de alta densidade não havería formato (tendência à jusante) na marcação de possibilidade. Além disso, a magnitude da marcação de possibilidade depende do número de variáveis de entrada que se comportam de maneira anormal. A marcação de possibilidade revela que o modelo de mistura tem pouca experiência dos dados que operam em níveis associados com a parte final do histórico de tempo dos dados. Se o modelo de mistura fosse treinado para representar comportamento normal, a marcação de possibilidade estaria revelando comportamento crescentemente anômalo. No entanto, embora a marcação de possibilidade mostre um comportamento anormal o mesmo não mostra que a combinação de variáveis de entrada está se comportando de maneira anormal. Ademais, não é fácil derivar essa informação quando trabalhando diretamente com as variáveis de entrada. Isso é porque a escalas e natureza estatística dessas variáveis de entrada pode diferir significantemente. O indicador de influência das variáveis pode revelar quais variáveis estão contribuindo significativamente para uma anomalia.
Embora o indicador de influência das variáveis seja marcação de possibilidades de log estes são calculados de uma maneira específica para revelar informação. Isso significa que o modelo de mistura tem que ser gerado de uma maneira a revelar comportamento interessante. Isso é conveniente mente explicado quando é descrito um modelo de mistura em forma gráfica.
Um modelo de mistura padrão tem distribuições Gaussianas conectadas a um nó parente discreto que representa os componentes da mistura (também conhecidos às vezes como ‘ agrupamentos'). Isso é ilustrado na Figura 2. Em uma realização da Invenção, o modelo para calcular o indicador de influência das variáveis contém nós adicionais que agem como filtros. Esses nós são frequentemente discretos mas podem ser contínuos, Esses filtros podem ser ajustados para mudar os pesos de misturação dos componentes modelo quando executa predíções. Se, por exemplo, diferentes componentes (ou combinações de componentes) são associados a classes individuais, e a classe de um caso é conhecida, seria possível remover a representação da classe atual e ter uma visão do caso atual da perspectiva de todas as outras classes. Um exemplo específico que mostra o efeito de tal filtração em uma marcação de possibilidade é mostrado na Figura 3. Isso é de um modelo construído no bem conhecido conjunto de dados Flor de Iris - um conjunto de dados simples que compreendem um conjunto de medições sépala e pétala de três espécies de Iris com 50 casos em cada espécie. Uma possibilidade de log pelo uso de todas as variáveis de entrada é mostrado para cada espécie. As predíções são executadas pelo uso de um filtro que garante que os componentes associados com as espécies atuais não sejam usadas nos cálculos. Esse tipo de predição pode indicar quais das espécies (se qualquer) é mais diferente. A Figura 3 mostra as espécies como sendo Setosa que para dados simples como esses, podem ser facilmente confirmados mediante gráficos de dispersão de plotagem (as marcações de possibilidades são ordenadas por espécies com Setosa plotadas primeiramente seguidas por Versicolore, então, Virginica).
Na Figura 2, / representa os componentes modelo e X é uma Gaussiana que possui muitas variáveis que compreende Χι, X2, X3 Χν· O nó C representa uma classe variável. Em uma realização, os nós SL denotam valores variáveis dentro da classe (isto é, classes individuais). O nó C tem inúmeros estados, equivalentes à quantidade de classes (um estado para cada SL). A distnbuição de cada SL é tipicamente binária e codificada de uma maneira que todas as outras classes permaneçam ativas quando a classe atual (que corresponde a SL) é desativada (isto é, removido das predições modelo). A distribuição também pode ser codificada para executar o inverso dessa filtração. Em outra realização, os nós S*. podem ser nós contínuos, cada um codificando uma forma de evidência “suave" sobre os valores do nó C.
Um fluxograma exemplificador de um método para avaliar o indicador de influência das variáveis pelo uso de um modelo de mistura tal como o que é ilustrado na Figura 2 é mostrado na Figura 4. Nesse método, um indicador de influência da variável pode ser calculado pelo uso de transformações gráficas e interferência. Uma transformação é uma operação em uma estrutura de gráfico que resulta em uma nova estrutura de gráfico. A interferência envolve a evidência de entrada (designando valores para um ou mais nós) e calcular as probabilidades conjuntas ou probabilidades dos nós individuais, etapas de transformação e interferência diferentes dão variantes diferentes de indicador de influência das variáveis que revelam traços de comportamento diferentes. Por exemplo, considerando um modelo de um comportamento de motor de aeronave. A temperatura de gás de exaustão irá ter regiões normais de operação para uma fase em particular em voo e um valor muito alto ou muito baixo pode sinalizar comportamento anormal. Um tipo de indicador de influência da variável pode ser usado para monitorar esse comportamento anormal “fora da faixa". Outro tipo de indicador de influência da variável pode ser usado para monitorar um padrão diferente de comportamento anormal quando existe correlação entre os parâmetros de medição (tal como fluxo de combustível e a velocidade de bobina de pressão baixa). Enquanto as medições individuais podem estar dentro da faixa normal, o padrão através dos parâmetros pode ser anormal (por exemplo, quando existe uma perda de correlação).
Na Figura 4, uma lista Y é inicializada para estar vazia em 100.
Essa lista manterá o registro dos nós de medição que foram processados. Um modelo de mistura tal como descrito na Figura 2 é definido graficamente em 102. Um dos nós variáveis Xj é selecionado em 104, e a evidência é gerada em 106 para todos nós de medição variáveis mas Xj . A evidência é apenas inserida quando este existe e é considerada válida (por exemplo, uma medição pode ser considerada como sendo um valor impossível). Se requerido, a evidência é estabelecida em variáveis que pertencem a S em 108. A distribuição conjunta para Xy e / é então calculada em 110. Um novo gráfico é então gerado em 112 que contém novos nós X/ e /' codificando a distribuição conjunta calculada em 110. Uma transformação exemplificadora para o novo gráfico pode ser denotada como se segue: em que / representa os componentes modelo. X representa as variáveis. S representa os estados ou as distribuições por uma classe, e e denota a evidência. A evidência é estabelecida em X/ em 114 (essa evidência é denotada como xjí e p(xy) é calculada em 116. Em 118 X; é adicionada para a 1 lista completa Y e um novo nó é selecionado e o processo é repetido de 104. O log de p(x,) é o indicador básico de influência da variável para Xy. Como um exemplo, considera-se o gráfico na Figura 2. Deseja-se calcular o indicador de influência da variável para Xi e no contexto de X2, X3 e X4. Também, sabe-se que esse caso é da classe S2 (nesse exemplo todos os nós em S são discretos. í mas estes podem ser contínuos ou uma combinação de discretos e contínuos). Denotam-se os valores para o caso como se segue: A evidência é inserida e um novo gráfico é gerado em 112 mediante a requisição da distribuição conjunta para (Xi, f): A função f se refere à marginalização para gerar o novo gráfico. O sobrescrito f denota uma nova variável com uma nova distribuição. A marginalização é um método padrão aplicado aos gráficos conforme ensinado em Bayesian Networks e Decision Graphs, Finn V. Jensen e Thomas D. Nielsen, Springer (2007). Instanciar o novo gráfico permite que predições adicionais sejam executadas. O indicador básico de influência da variável para Xi nesse exemplo é: P(*i) e é calculado a partir do novo gráfico em 116. O processo para estabelecer uma evidência que determina a variante do indicador de influência da variável produzida. Por exemplo, para calcular um indicador de influência da variável que é sensível para fora da faixa de dados univariados, a evidência em outras variáveis não é estabelecida. No entanto, a evidência de outras variáveis contínuas pode ainda ser usada como evidência para determinar uma pesagem posterior no nó / que é transportada no novo modelo gráfico. Ademais, esse estabelecimento da evidência para calcular a pesagem posterior pode ser repetitiva quando os nós Xn estão sendo considerados como independentes. Essa repetição envolve a evidência de entrada para um dos nós de evidência, gravando a distribuição em /, repetindo para todos os outros nós de evidência e então computando o produto das distribuições gravadas para cada estado em /. Assim, na etapa 120, o processo de seleção, geração, execução e cálculo do indicador de influência das variáveis para outros nós variáveis é repetido de modo que suas magnitudes {como plotadas) possam ser avaliadas umas contra as outras em 122 para determinar a influência das variáveis selecionadas de nós. A avaliação em 122 pode ser automatizada mediante a comparação de critérios pré-determinados, ou esta pode ser manuai mediante um exame visual das distribuições plotadas. Constata-se, portanto, que existe flexibilidade no cálculo da variante de um indicador de influência da variável e a{s) variante(s) mais adequada(s) é dependente de aplicação.
Os indicadores de influência das variáveis também podem ser marcados de modo que os mesmos reflitam a mudança direcional na variável original. Se, por exemplo, um parâmetro de medição estivesse tendendo para baixo este pode ser útil para ter a mesma direção da tendência no indicador de influência da variável. Uma maneira simples de marcar um indicador de influência da variávei é o de seguir a mesma trajetória dos estabelecimentos de evidência para gerar o novo gráfico. O valor real (por exemplo, xt) pode então ser comparado com o valor médio da distribuição marginai. Se o valor estivesse abaixo do médio, o indicador de influência da variável tem um sinal negativo e sinal positivo se estiver acima da média.
Os indicadores de influência das variáveis também podem ser colocados em escala em relação à marcação de aptidão e ao limite do modelo.
Quando as variáveis XN são consideradas como um conjunto dependente, uma variável anormal pode ter uma grande influência no indicador de influência das variáveis de outras variáveis. Nessas situações, um laço externo pode ser colocado no fluxo de dados mostrado na Figura 4. O processo na Figura 4 é então executado para detectar a variável com a maior influência. Essa variável é estabelecida em NULL para ser tratada como ausente e o processo na Figura 4 é repetido. O processo termina quando as variáveis restantes {isto é, as que não foram estabelecidas em NULL) tem uma marcação de possibilidade coletiva que é considerada normal. Em outra variação da repetição do processo na Figura 4, subconjuntos diferentes (combinações) de variáveis em XN podem ser estabelecidos para NULL.
Quando N é pequeno seria possível executar de maneira exaustiva o processo na Figura 4 para todas as combinações de XN. A definição de N pequeno é dependente de aplicação e seria definidos pela consideração dos recursos de computação disponíveis, a carga dos dados e o tempo de resposta de sistema requerido pela aplicação.
Um exemplo de indicadores de influência das variáveis calculadas para os dados de entrada mostrados na Figura 1A é mostrado na Figura 5.
Será entendido que tipos diferentes de indicador de influência das variáveis podem fornecer informações a cerca de tipos diferentes de anomalias tal como delineadores univariados e delineadores multivariados ou descorrelaçâo. O tipo de indicador de influência da variável pode ser determinado pelo padrão de evidência inserido e o sequenciamento de evidência inserida.
Esta descrição por escrito usa exemplos para apresentar a invenção, que inclui o melhor modo. e também para permitir que qualquer pessoa versada na técnica realize e use a invenção. O escopo patenteável da invenção é definido pelas reivindicações, e pode incluir outros exemplos que ocorram aos versados na técnica. Tais outros exemplos têm a intenção de estarem dentro do escopo das reivindicações se estes tiverem elementos estruturais que não difiram da linguagem iiierai das reivindicações, ou se estas incluírem elementos estruturais equivalentes com diferenças não substanciais em relação às linguagens literais das reivindicações. i Reivindicações
Claims (9)
1. MÉTODO PARA DETERMINAR A INFLUÊNCIA DE UMA VARIÁVEL EM UM FENÔMENO, que compreende: fornecer um modelo de mistura em um meio não transitório em forma gráfica, que inclui componentes de modelo, pelo menos um nó de classe que representa uma classe associada aos componentes modelo, e uma pluralidade de nós variáveis, todos representando dados físicos dentro de um sistema que experimenta o fenômeno, em um processor, selecionar dentre o meio não transitório pelo menos uma dentre a pluralidade de nós variáveis, executar uma operação sob a forma gráfica mediante o estabelecimento de evidência sobre a pluralidade nós variáveis além do pelo menos um da pluralidade de nós variáveis, calcular uma distribuição conjunta para o nó selecionado dentre a pluralidade de nós variáveis e o pelo menos um nó de classe através de marginalização para gerar um novo gráfico, calcular um indicador de influência da variável para o nó selecionado dentre a pluralidade de nós variáveis a partir do novo gráfico, repetir a seleção que executa e calcula as etapas para outros nós selecionados dentre a pluralidade nós variáveis, e avaliar a magnitude dos indicadores de influência de variável para a pluralidade nós variáveis entre si.
2. MÉTODO, de acordo com a reivindicação 1, em que o novo gráfico é uma transformação descrita por f:P(Xi, !\ex.xj, es) —► P(Xi, /), em que / representa os componentes modelo, X representa as variáveis, S representa os estados ou distribuições sobre uma classe, e e denota a evidência.
3. MÉTODO, de acordo com a reivindicação 1, em que o indicador de influência da variável representa uma mudança direciona! nos valores do nó de variável.
4. MÉTODO, de acordo de acordo com a reivindicação 1, em que a seleção é dependente de aplicação,
5, MÉTODO, de acordo com a reivindicação 1, em que a seleção inclui um subconjunto da pluralidade de nós variáveis.
6. MÉTODO, de acordo de acordo com a reivindicação 1, em que a etapa de execução inclui estabelecer uma evidência pelo padrão e pelo sequência mento para determinar um tipo de indicador de influência de variável.
7. MÉTODO, de acordo de acordo com a reivindicação 1, em que o sistema é um motor de aeronave, e o modelo de mistura representa o desempenho do motor de aeronave.
8, MÉTODO, de acordo de acordo com a reivindicação 1, em que os nós variáveis incluem uma pluralidade de primeiros nós variáveis que representam parâmetros contínuos, e uma pluralidade de segundos nós variáveis que representam os valores ou as distribuições associadas ás variáveis dentro da classe, e em que a etapa de seleção incíui a seleção de um dentre os primeiros nós variáveis.
9. MÉTODO, de acordo com a reivindicação 1, em que a distribuição conjunta é calculada para o primeiro e segundo nós variáveis,
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/023,181 | 2011-02-08 | ||
US13/023,181 US8560279B2 (en) | 2011-02-08 | 2011-02-08 | Method of determining the influence of a variable in a phenomenon |
Publications (2)
Publication Number | Publication Date |
---|---|
BR102012002812A2 true BR102012002812A2 (pt) | 2017-11-07 |
BR102012002812A8 BR102012002812A8 (pt) | 2017-11-21 |
Family
ID=45655393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR102012002812A BR102012002812A8 (pt) | 2011-02-08 | 2012-02-07 | método para determinar a influência de uma variável em um fenômeno |
Country Status (7)
Country | Link |
---|---|
US (1) | US8560279B2 (pt) |
EP (1) | EP2492829A1 (pt) |
JP (1) | JP2012164314A (pt) |
CN (1) | CN102693262B (pt) |
BR (1) | BR102012002812A8 (pt) |
CA (1) | CA2766560A1 (pt) |
IN (1) | IN2012DE00312A (pt) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9940405B2 (en) | 2011-04-05 | 2018-04-10 | Beyondcore Holdings, Llc | Automatically optimizing business process platforms |
US8560279B2 (en) * | 2011-02-08 | 2013-10-15 | General Electric Company | Method of determining the influence of a variable in a phenomenon |
US20120209575A1 (en) * | 2011-02-11 | 2012-08-16 | Ford Global Technologies, Llc | Method and System for Model Validation for Dynamic Systems Using Bayesian Principal Component Analysis |
US10796232B2 (en) * | 2011-12-04 | 2020-10-06 | Salesforce.Com, Inc. | Explaining differences between predicted outcomes and actual outcomes of a process |
US10802687B2 (en) * | 2011-12-04 | 2020-10-13 | Salesforce.Com, Inc. | Displaying differences between different data sets of a process |
EP2645257A3 (en) * | 2012-03-29 | 2014-06-18 | Prelert Ltd. | System and method for visualisation of behaviour within computer infrastructure |
CA2932069A1 (en) * | 2013-11-29 | 2015-06-04 | Ge Aviation Systems Limited | Method of construction of anomaly models from abnormal data |
CN106156067B (zh) * | 2015-03-30 | 2019-11-01 | 日本电气株式会社 | 用于为关系数据创建数据模型的方法和系统 |
US11232175B2 (en) | 2019-03-28 | 2022-01-25 | Nec Corporation | Method, system, and computer program product for determining causality |
KR102700731B1 (ko) * | 2019-10-17 | 2024-08-30 | 한국전력공사 | 배전설비 관리 방법 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60171507A (ja) * | 1984-02-16 | 1985-09-05 | Nippon Atom Ind Group Co Ltd | プラントの異常診断方法 |
US6671661B1 (en) * | 1999-05-19 | 2003-12-30 | Microsoft Corporation | Bayesian principal component analysis |
US7636651B2 (en) * | 2003-11-28 | 2009-12-22 | Microsoft Corporation | Robust Bayesian mixture modeling |
US7519564B2 (en) * | 2004-11-16 | 2009-04-14 | Microsoft Corporation | Building and using predictive models of current and future surprises |
US8032340B2 (en) * | 2007-01-04 | 2011-10-04 | Fisher-Rosemount Systems, Inc. | Method and system for modeling a process variable in a process plant |
JP5130851B2 (ja) * | 2007-09-27 | 2013-01-30 | 富士通株式会社 | モデル作成支援システム、モデル作成支援方法、モデル作成支援プログラム |
WO2009070536A1 (en) | 2007-11-30 | 2009-06-04 | Massachusetts Institute Of Technology | Method and apparatus for performing probabilistic inference and providing related solution methods |
US9598947B2 (en) * | 2009-08-07 | 2017-03-21 | Exxonmobil Upstream Research Company | Automatic drilling advisory system based on correlation model and windowed principal component analysis |
US8306791B2 (en) * | 2009-12-21 | 2012-11-06 | United Technologies Corporation | Method and system for modeling the performance of a gas turbine engine |
US8560279B2 (en) * | 2011-02-08 | 2013-10-15 | General Electric Company | Method of determining the influence of a variable in a phenomenon |
-
2011
- 2011-02-08 US US13/023,181 patent/US8560279B2/en active Active
-
2012
- 2012-02-02 CA CA2766560A patent/CA2766560A1/en not_active Abandoned
- 2012-02-03 IN IN312DE2012 patent/IN2012DE00312A/en unknown
- 2012-02-06 EP EP12154062A patent/EP2492829A1/en not_active Ceased
- 2012-02-07 JP JP2012023565A patent/JP2012164314A/ja active Pending
- 2012-02-07 BR BR102012002812A patent/BR102012002812A8/pt not_active IP Right Cessation
- 2012-02-08 CN CN201210034651.3A patent/CN102693262B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012164314A (ja) | 2012-08-30 |
US8560279B2 (en) | 2013-10-15 |
CA2766560A1 (en) | 2012-08-08 |
IN2012DE00312A (pt) | 2015-04-10 |
CN102693262B (zh) | 2017-01-18 |
BR102012002812A8 (pt) | 2017-11-21 |
EP2492829A1 (en) | 2012-08-29 |
US20120203517A1 (en) | 2012-08-09 |
CN102693262A (zh) | 2012-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR102012002812A2 (pt) | Pata method determining the influence of a variable in a phenomena | |
Ge | Review on data-driven modeling and monitoring for plant-wide industrial processes | |
Giordano et al. | The value of monitoring a structural health monitoring system | |
US20200143292A1 (en) | Signature enhancement for deviation measurement-based classification of a detected anomaly in an industrial asset | |
JP2017004509A (ja) | 機械学習のための高度解析インフラストラクチャ | |
US8650137B2 (en) | Method and apparatus for creating state estimation models in machine condition monitoring | |
US20130060524A1 (en) | Machine Anomaly Detection and Diagnosis Incorporating Operational Data | |
JP6097517B2 (ja) | 状態診断方法、および、状態診断装置 | |
JP2009289262A (ja) | 資産システムの高性能条件監視のためのシステムおよび方法 | |
CN105934765B (zh) | 从异常数据构造反常模型的方法 | |
BR112015009029B1 (pt) | Sistema e processo de monitoramento de um conjunto de componentes de um equipamento | |
BR102016005511B1 (pt) | Resumo dos dados multisensor | |
Patel et al. | Doctor for machines: a failure pattern analysis solution for industry 4.0 | |
Bhowmik et al. | Real-time structural health monitoring of vibrating systems | |
KR102024829B1 (ko) | Cart 기반의 입력변수 랭킹을 이용한 산업공정의 고장변수 식별을 위한 장치 및 방법 | |
Chen et al. | Petri-net based approach to configure online fault diagnosis systems for batch processes | |
US11320813B2 (en) | Industrial asset temporal anomaly detection with fault variable ranking | |
Zhu et al. | Generic process visualization using parametric t-SNE | |
Boussif | Contributions to model-based diagnosis of discrete-event systems | |
Reed et al. | Verification and validation of system health management models using parametric testing | |
Zhou et al. | Process-quality monitoring using semi-supervised probability latent variable regression models | |
Zhou et al. | Multiple fault detection using multi-rate probability principal component analysis models | |
Danancher et al. | A comparative study of three model-based FDI approaches for Discrete Event Systems | |
McKenzie et al. | An integrated model-based approach for real-time on-line diagnosis of complex systems | |
JP2010122133A (ja) | 故障箇所特定システム、故障箇所特定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B03A | Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette] | ||
B03H | Publication of an application: rectification [chapter 3.8 patent gazette] | ||
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B08F | Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette] |
Free format text: REFERENTE A 8A ANUIDADE. |
|
B08K | Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette] |
Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2552 DE 03-12-2019 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013. |