JP2005141591A - Quality evaluation device and product evaluation system - Google Patents

Quality evaluation device and product evaluation system Download PDF

Info

Publication number
JP2005141591A
JP2005141591A JP2003379090A JP2003379090A JP2005141591A JP 2005141591 A JP2005141591 A JP 2005141591A JP 2003379090 A JP2003379090 A JP 2003379090A JP 2003379090 A JP2003379090 A JP 2003379090A JP 2005141591 A JP2005141591 A JP 2005141591A
Authority
JP
Japan
Prior art keywords
frequency spectrum
frequency
sound
learning
vector quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003379090A
Other languages
Japanese (ja)
Inventor
Yoshihito Hashimoto
良仁 橋本
Heishin O
丙辰 王
Toshiro Abe
敏郎 阿部
Shigeru Daimatsu
繁 大松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP2003379090A priority Critical patent/JP2005141591A/en
Publication of JP2005141591A publication Critical patent/JP2005141591A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To make it possible to judge similarity even when a distribution pattern of a frequency spectrum is deviated to a frequency axis direction. <P>SOLUTION: A learning vector quantization means 22 finds out deflection quantity obtained when a frequency spectrum already learned by a learning sample and included in a sound wave from an object is deviated to the frequency axis direction so that the degree of coincidence with the frequency spectrum of the learning sample is increased and deviates the frequency spectrum obtained from a feature sound extraction device 1 to the frequency axis direction only by the found deviation quantity. The deviated frequency spectrum is inputted to a sorting neural network 23 to sort the distribution pattern of the frequency spectrum obtained as an output from the learning vector quantization means 22 and evaluate the quality of the object. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、品質評価装置、製品評価システムに関するものである。   The present invention relates to a quality evaluation apparatus and a product evaluation system.

従来から、ニューラルネットワークを分類器として用いることにより、文字や音声の認識を行う技術が知られている(たとえば、特許文献1参照)。
特公平7−113943号公報
Conventionally, a technique for recognizing characters and speech by using a neural network as a classifier is known (see, for example, Patent Document 1).
Japanese Patent Publication No.7-113943

上述した特許文献には、ニューラルネットワークの学習によって文字認識を可能とする技術が記載されており、この種の技術は音声認識において周波数スペクトルの分布パターンの照合にも転用可能である。しかしながら、たとえばモータにより動作する電気装置ないし機械装置において動作音に基づいて装置の品質を判別するような場合には、周波数スペクトルの分布パターンがモータの回転速度の変化に伴って周波数軸方向に偏移することが知られており、このような周波数軸方向の偏移を伴う場合に、上述した特許文献に記載されているような技術を単に転用したとしても、周波数スペクトルの分布パターンの類似性を判断するのが困難であるという問題がある。   The above-described patent document describes a technology that enables character recognition by learning of a neural network, and this type of technology can also be used for matching frequency spectrum distribution patterns in speech recognition. However, for example, when the quality of a device is determined based on operation sound in an electric device or a mechanical device that is operated by a motor, the distribution pattern of the frequency spectrum is shifted in the frequency axis direction as the rotational speed of the motor changes. In the case of such a shift in the frequency axis direction, even if the technique described in the above-mentioned patent document is simply diverted, the similarity of the frequency spectrum distribution pattern There is a problem that it is difficult to judge.

本発明は上記事由に鑑みて為されたものであり、その目的は、周波数スペクトルの分布パターンが周波数軸方向に偏移していても類似性を判断することを可能とした品質評価装置を提供するとともに、この品質評価装置を用いて製品を評価する製品評価システムを提供することにある。   The present invention has been made in view of the above reasons, and an object thereof is to provide a quality evaluation apparatus that can determine similarity even if the distribution pattern of the frequency spectrum is shifted in the frequency axis direction. In addition, an object of the present invention is to provide a product evaluation system for evaluating a product using this quality evaluation apparatus.

請求項1の発明は、品質評価装置であって、対象物からの音波に含まれる周波数スペクトルを学習サンプルの周波数スペクトルとの一致度が高くなるように周波数軸方向に偏移させたときの偏移量を求め、前記対象物から得られた周波数スペクトルを当該偏移量だけ周波数軸方向に偏移させる学習済みの学習ベクトル量子化手段と、学習ベクトル量子化手段の出力として得られる周波数スペクトルの分布パターンを分類することにより対象物の品質を評価する分類用ニューラルネットワークとを備えることを特徴とする。   The invention according to claim 1 is a quality evaluation device, wherein the frequency spectrum contained in the sound wave from the object is shifted in the frequency axis direction so that the degree of coincidence with the frequency spectrum of the learning sample is high. A learning vector quantization unit that obtains a shift amount, shifts the frequency spectrum obtained from the object in the frequency axis direction by the shift amount, and a frequency spectrum obtained as an output of the learning vector quantization unit. And a classification neural network that evaluates the quality of the object by classifying the distribution pattern.

この構成によれば、学習サンプルの周波数スペクトルの分布パターンに対して対象物の音波に含まれる周波数スペクトルの分布パターンが周波数軸方向に偏移していても、当該偏移量を求めて重ね合わせるから、分布パターンの類似度を容易に評価することができる。その結果、たとえばモータの動作音に基づいてモータの異常の有無や異常の種類を判別するような場合に、モータの回転数が学習サンプルを得たときの回転数とは異なっていることによって、周波数スペクトルの分布パターンが周波数軸方向に偏移していたとしても、学習サンプルと類似しているか否かを評価することができる。さらに、対象物から得た周波数スペクトルの分布パターンを分類用ニューラルネットワークにより分類するから、短時間かつ正確に異常の有無や異常の種類を判別することが可能であり、しかも人の官能によらずに特徴音の種類を判別することができるから、結果のばらつきが少なくなる。   According to this configuration, even if the distribution pattern of the frequency spectrum included in the sound wave of the target object is shifted in the frequency axis direction with respect to the distribution pattern of the frequency spectrum of the learning sample, the shift amount is obtained and superimposed. Therefore, the similarity of the distribution pattern can be easily evaluated. As a result, for example, when the presence or absence of a motor abnormality or the type of abnormality is determined based on the operation sound of the motor, the motor rotation speed is different from the rotation speed when the learning sample is obtained, Even if the distribution pattern of the frequency spectrum is shifted in the frequency axis direction, it is possible to evaluate whether or not it is similar to the learning sample. Furthermore, since the frequency spectrum distribution pattern obtained from the object is classified by the neural network for classification, it is possible to determine the presence or absence of abnormality and the type of abnormality accurately in a short time, and regardless of human sensuality. Since the type of the characteristic sound can be discriminated from each other, the variation in results is reduced.

請求項2の発明では、請求項1の発明において、前記学習ベクトル量子化手段の前段に、前記対象物から得られる周波数スペクトルの特徴を学習ベクトル量子化手段よりも粗く絞り込む前置量子化手段を付加したことを特徴とする。   According to a second aspect of the present invention, in the first aspect of the present invention, a pre-quantization unit that narrows down the characteristics of the frequency spectrum obtained from the object more coarsely than the learning vector quantization unit is provided before the learning vector quantization unit. It is characterized by having been added.

この構成によれば、学習ベクトルの周波数スペクトルのうちで対象物から得られる周波数スペクトルの特徴との類似性の高い候補を前記量子化手段において絞り込むことができるから、学習ベクトル量子化手段における処理の負荷を軽減することができ、結果的に品質の評価を短時間で行うことが可能になる。   According to this configuration, candidates having high similarity to the characteristics of the frequency spectrum obtained from the object in the frequency spectrum of the learning vector can be narrowed down by the quantization unit. The load can be reduced, and as a result, the quality can be evaluated in a short time.

請求項3の発明では、請求項1または請求項2の発明において、前記学習ベクトル量子化手段は、前記対象物から得られる周波数スペクトルと学習サンプルの周波数スペクトルとを周波数軸方向において1/2(nは自然数)に圧縮した状態で両周波数スペクトルの偏移量の候補を求め、次に両周波数スペクトルを1/2n−1に圧縮した状態で前記候補を基準とした所定範囲内における両周波数スペクトルの偏移量の候補を求める処理を繰り返し、最終的に両周波数スペクトルを圧縮しない状態で求めた偏移量の候補を前記偏移量として用いることを特徴とする。 In the invention of claim 3, in the invention of claim 1 or claim 2, the learning vector quantization means divides the frequency spectrum obtained from the object and the frequency spectrum of the learning sample by 1/2 n in the frequency axis direction. (N is a natural number) The candidate of the deviation amount of both frequency spectrum is calculated | required in the state compressed, and both in the predetermined range on the basis of the said candidate in the state which compressed both frequency spectrum to 1/2 n-1. The process of obtaining the frequency spectrum deviation amount candidates is repeated, and finally the deviation amount candidates obtained without compressing both frequency spectra are used as the deviation amount.

この構成によれば、偏移量を求めるデータを周波数軸方向に圧縮した状態で偏移量の範囲を絞り込み、圧縮率を徐々に低下させながら偏移量の存在範囲を狭めるから、最終的に圧縮しない状態で偏移量を求める際に偏移量の存在範囲が小範囲に絞り込まれることになり、偏移量を短時間で求めることが可能になる。   According to this configuration, the range of the deviation amount is narrowed down while the data for obtaining the deviation amount is compressed in the frequency axis direction, and the existence range of the deviation amount is narrowed while gradually reducing the compression rate. When the deviation amount is obtained without compression, the existence range of the deviation amount is narrowed down to a small range, and the deviation amount can be obtained in a short time.

請求項4の発明では、請求項1または請求項2の発明において、前記学習ベクトル量子化手段は、前記対象物から得られる周波数スペクトルと学習サンプルの周波数スペクトルとについてピークを持つ領域の重心をそれぞれ求め、対象物から得られる周波数スペクトルと学習サンプルの周波数スペクトルとからそれぞれ得られる重心間の距離のうちの最小値を前記偏移量として用いることを特徴とする。   In the invention of claim 4, in the invention of claim 1 or claim 2, the learning vector quantization means calculates the center of gravity of the region having a peak in the frequency spectrum obtained from the object and the frequency spectrum of the learning sample, respectively. The minimum value of the distance between the centroids obtained from the frequency spectrum obtained from the object and the frequency spectrum of the learning sample is used as the shift amount.

この構成によれば、周波数スペクトルの重心位置の距離のうちの最小値を偏移量として用いるから、偏移量を短時間で求めることができる。   According to this configuration, since the minimum value among the distances of the centroid positions of the frequency spectrum is used as the shift amount, the shift amount can be obtained in a short time.

請求項5の発明は、製品評価システムであって、前記対象物からの音波が製品の動作音であって請求項1ないし請求項4のいずれか1項に記載の品質評価装置と、品質評価装置の前段に設けられ前記動作音の周波数スペクトルを抽出する特徴音抽出装置とを備え、前記学習ベクトル量子化手段は、対象物の品質として製品の正常と異常との判別および異常時における異常の種類を判別することを特徴とする。   The invention of claim 5 is a product evaluation system, wherein the sound wave from the object is an operation sound of the product, and the quality evaluation apparatus according to any one of claims 1 to 4, and the quality evaluation A feature sound extraction device that is provided in a front stage of the device and extracts the frequency spectrum of the operation sound, and the learning vector quantization means determines whether the product is normal or abnormal as the quality of the object, and the abnormality at the time of abnormality The type is distinguished.

この構成によれば、製品の動作音の周波数スペクトルを用いることにより、製品について正常と異常との判別および異常時における異常の種類を判別することができる。   According to this configuration, by using the frequency spectrum of the operation sound of the product, it is possible to determine whether the product is normal or abnormal and the type of abnormality at the time of abnormality.

請求項6の発明では、請求項5の発明において、前記特徴音抽出装置は、前記対象物からの音波を検出する音声入力手段と、音声入力手段により得られた信号を最初の入力信号とし入力信号にウェーブレット変換を行うことにより低周波成分と高周波成分とを分離するウェーブレット変換手段と、ウェーブレット変換手段により分離された低周波成分に目的とする特徴音が含まれているときに当該低周波成分をウェーブレット変換手段に次の入力信号として与え前記特徴音が含まれなくなった時点のウェーブレット変換手段の入力信号の周波数帯域を抽出する監視手段と、監視手段により抽出された周波数帯域が通過周波数帯域として設定され前記特徴音が含まれなくなった時点でのウェーブレット変換手段への入力信号が入力されるフィルタ手段と、フィルタ手段を通過した信号の周波数スペクトルを検出するベクトル抽出手段とを備えることを特徴とする。   According to a sixth aspect of the present invention, in the fifth aspect of the present invention, the characteristic sound extraction device receives a sound input unit that detects a sound wave from the object and a signal obtained by the sound input unit as a first input signal. Wavelet transform means for separating a low-frequency component and a high-frequency component by performing wavelet transform on the signal, and when the target characteristic sound is included in the low-frequency component separated by the wavelet transform means, the low-frequency component As a next input signal to the wavelet transform means, and a monitoring means for extracting the frequency band of the input signal of the wavelet transform means when the characteristic sound is no longer included, and the frequency band extracted by the monitoring means as the passing frequency band Fill in which the input signal to the wavelet transform means when it is set and no longer includes the characteristic sound is input Characterized in that it comprises means, and vector extracting means for detecting a frequency spectrum of the signal passed through the filter means.

この構成によれば、ウェーブレット変換手段への入力信号から低周波成分を抽出する処理を繰り返して、低周波成分に特徴音が含まれなくなった時点でのウェーブレット変換手段への入力信号を取り出し、この入力信号の周波数帯域のみをフィルタ手段で抽出するから、特徴音に関わる周波数成分を抽出することが可能になる。さらに、フィルタ手段で抽出した周波数帯域について周波数スペクトルを求めるから、特徴音に関わりのない不要成分が除去された周波数スペクトルを用いて特徴音の種類を容易に判別することができる。   According to this configuration, the process of extracting the low frequency component from the input signal to the wavelet transform unit is repeated, and the input signal to the wavelet transform unit at the time when the characteristic sound is no longer included in the low frequency component is extracted. Since only the frequency band of the input signal is extracted by the filter means, it becomes possible to extract the frequency component related to the characteristic sound. Furthermore, since the frequency spectrum is obtained for the frequency band extracted by the filter means, the type of the characteristic sound can be easily determined using the frequency spectrum from which unnecessary components not related to the characteristic sound are removed.

本発明によれば、学習サンプルの周波数スペクトルの分布パターンに対して対象物の音波に含まれる周波数スペクトルの分布パターンが周波数軸方向に偏移していても、当該偏移量を求めて重ね合わせるから、分布パターンの類似度を容易に評価することができるという利点がある。さらに、対象物から得た周波数スペクトルの分布パターンを分類用ニューラルネットワークにより分類するから、短時間かつ正確に異常の有無や異常の種類を判別することが可能であり、しかも人の官能によらずに特徴音の種類を判別することができるから、結果のばらつきが少なくなるという利点がある。   According to the present invention, even if the distribution pattern of the frequency spectrum included in the sound wave of the object is shifted in the frequency axis direction with respect to the distribution pattern of the frequency spectrum of the learning sample, the shift amount is obtained and superimposed. Therefore, there is an advantage that the similarity of the distribution pattern can be easily evaluated. Furthermore, since the frequency spectrum distribution pattern obtained from the object is classified by the neural network for classification, it is possible to determine the presence or absence of abnormality and the type of abnormality accurately in a short time, and regardless of human sensuality. Since the type of characteristic sound can be discriminated, there is an advantage that variation in results is reduced.

以下に説明する実施形態では、本発明の技術をモータの品質を評価する製品評価システムに適用する例を示す。この製品評価システムは、図2に示すように、モータを運転する際に生じる動作音からモータの品質に関わる特徴音を抽出する特徴音抽出装置1と、特徴音抽出装置1により抽出した特徴音に基づいてモータの品質を評価する品質評価装置2とにより構成される。   In the embodiment described below, an example in which the technology of the present invention is applied to a product evaluation system for evaluating the quality of a motor will be described. As shown in FIG. 2, the product evaluation system includes a feature sound extraction device 1 that extracts feature sounds related to motor quality from operation sounds generated when the motor is operated, and a feature sound extracted by the feature sound extraction device 1. And a quality evaluation device 2 that evaluates the quality of the motor based on the above.

特徴音抽出装置1は、モータの動作音を入力するための音声入力手段11を備え、音声入力手段11から入力された音声信号はA/D変換手段12によりデジタル信号に変換され、図示しない作業用の記憶部に記憶される。音声入力手段11としては、マイクロホンのほか、モータに接触させて用いる振動ピックアップも用いることができる。   The feature sound extraction apparatus 1 includes a voice input unit 11 for inputting motor operation sounds. A voice signal input from the voice input unit 11 is converted into a digital signal by an A / D conversion unit 12 and is not shown in the drawing. Is stored in the storage unit. As the voice input means 11, a vibration pickup used in contact with a motor can be used in addition to a microphone.

A/D変換手段12の出力である原信号はウェーブレット変換手段13に入力され、ウェーブレット変換手段13ではウェーブレット変換を行って得られた低周波成分に、さらにウェーブレット変換を行うことを繰り返す。この種の処理は多重解像度解析として知られている。すなわち、ウェーブレット変換手段13では、変換前の信号を、低周波成分fj−1と高周波成分wj−1とに分離し、得られた低周波成分fj−1を次の入力として、さらに低周波成分fj−2と高周波成分wj−2とに分離するという変換処理を繰り返す。すなわち、原信号が1回目の変換処理の入力fになり、入力fは高周波成分f−1と低周波成分w−1とに分離される。この処理過程で得られる低周波成分fは、数1のように表すことができる。 The original signal that is the output of the A / D conversion unit 12 is input to the wavelet conversion unit 13, and the wavelet conversion unit 13 repeats further performing wavelet conversion on the low-frequency component obtained by performing wavelet conversion. This type of processing is known as multiresolution analysis. That is, the wavelet transform unit 13 separates the signal before conversion into a low frequency component f j−1 and a high frequency component w j−1, and uses the obtained low frequency component f j−1 as the next input. The conversion process of separating the low frequency component f j-2 and the high frequency component w j-2 is repeated. That is, the original signal becomes the input f 0 of the first conversion process, and the input f 0 is separated into a high frequency component f −1 and a low frequency component w −1 . The low frequency component f j obtained in this processing process can be expressed as shown in Equation 1.

Figure 2005141591
Figure 2005141591

数1において、Φ(x)はスケーリング関数であり、Ψ(x)はウェーブレット関数である。ウェーブレット変換手段13において数1の変換処理を1回行うたびに、高周波成分wj−1を除去して低周波成分fj−1のみを抽出するから、数1の変換処理を複数回繰り返すと、特徴音を含んでいた変換前の入力に対して、変換後の低周波成分fj−1には特徴音が含まれなくなる状態が生じると考えられる。このときの変換前の低周波成分fは、
ウェブレット変換手段13での変換処理により得られる低周波成分f(i=0,1,2,……)のうちで、全周波数成分に対して目的とする特徴音の周波数成分の占める割合がもっとも高いと推定できる。
In Equation 1, Φ (x) is a scaling function, and ψ (x) is a wavelet function. Each time the wavelet transform unit 13 performs the conversion process of Formula 1 once, the high frequency component w j-1 is removed and only the low frequency component f j-1 is extracted. Therefore, when the conversion process of Formula 1 is repeated a plurality of times It is considered that a state in which the characteristic sound is not included in the low-frequency component f j−1 after the conversion occurs with respect to the input before the conversion including the characteristic sound. The low frequency component f j before conversion at this time is
Of the low frequency components f i (i = 0, 1, 2,...) Obtained by the conversion processing in the weblet conversion means 13, the ratio of the frequency components of the target characteristic sound to the total frequency components Can be estimated to be the highest.

そこで、ウェーブレット変換手段13における変換処理毎の低周波成分fを監視する監視手段14を設け、ウェーブレット変換手段13から出力される低周波成分fに特徴音が含まれるか否かを監視手段14において判断する。監視手段14は、たとえばフィルタバンク(周波数の異なる複数個のバンドパスフィルタを備え、入力信号を周波数帯域ごとの成分に分割するフィルタ)あるいは高速フーリエ変換器と、後述する学習ベクトル量子化手段22と同様の判断機能を備えるニューラルネットワークを用いて構成することができる。つまり、ニューラルネットワークに、種々の特徴音を学習させておき、特徴音の有無を判断させるのである。ただし、このニューラルネットワークでは特徴音の有無のみを判別すればよく、特徴音の種類については問わない。また、監視手段14ではウェーブレット変換手段13から出力される低周波成分fj−1に特徴音が含まれなくなったときに、ウェーブレット変換手段13に入力されている低周波成分fの周波数帯域をFFTなどによって抽出する機能も備える。なお、監視手段14において特徴音が含まれるか否かの判断の部分については、人が特徴音を聞き分けるようにしてもよい。この場合に人が介在するものの、特徴音の有無を聞き分けるとともに特徴音が聞こえないときにウェーブレット変換手段13に通知するだけの作業であるから、人が介在することによる判断のばらつきはほとんど生じない。 Therefore, monitoring means 14 for monitoring the low frequency component f j for each conversion process in the wavelet transform means 13 is provided, and monitoring means for checking whether or not a characteristic sound is included in the low frequency component f j output from the wavelet transform means 13. 14 to determine. The monitoring means 14 includes, for example, a filter bank (a filter having a plurality of bandpass filters having different frequencies and dividing an input signal into components for each frequency band) or a fast Fourier transformer, and a learning vector quantization means 22 described later. A neural network having a similar determination function can be used. In other words, the neural network is made to learn various characteristic sounds and determine the presence or absence of characteristic sounds. However, in this neural network, it is only necessary to determine the presence or absence of a characteristic sound, and the type of characteristic sound is not questioned. Further, when the low frequency component f j−1 output from the wavelet transform unit 13 does not include the characteristic sound in the monitoring unit 14, the frequency band of the low frequency component f j input to the wavelet transform unit 13 is changed. It also has a function of extracting by FFT or the like. In addition, as for the part of the judgment whether or not the characteristic sound is included in the monitoring unit 14, a person may recognize the characteristic sound. In this case, although there is human intervention, since it is only an operation to recognize whether there is a characteristic sound and to notify the wavelet transform means 13 when the characteristic sound is not heard, there is almost no variation in judgment due to human intervention. .

上述のように、ウェーブレット変換手段13を用いることによって、全周波数成分に対して目的とする特徴音の周波数成分の占める割合がもっとも高い低周波成分fを抽出することができる。特徴音抽出装置1では、モータの品質に関わる特徴音を抽出することが目的であるから、品質の評価に用いる特徴音として上述した低周波成分fを用いると、評価に不要な周波数成分が大部分除去されていることになり、評価の精度を高めることができると考えられる。そこで、監視手段14によって通過周波数帯域を制御可能なフィルタ手段15にウェーブレット変換手段13で得られた低周波成分fを通すことにより、特徴音の周波数成分の占める割合が高い低周波成分fの近辺の周波数成分の信号を抽出する。ここに、ウェーブレット変換手段13で得られた低周波成分fの信号をさらにフィルタ手段15に通すから、ウェーブレット変換手段13の出力に含まれる不要成分を除去することができる。フィルタ手段15により抽出された信号はベクトル抽出手段16に入力され、ベクトル抽出手段16ではFFT(高速フーリエ変換)などの技術を用いて周波数スペクトルを求める。このようにしてベクトル抽出手段16で得られる周波数スペクトルが、特徴音抽出装置1の出力になる。 As described above, by using a wavelet transform unit 13, it is possible to proportion of the frequency component of the feature sounds of interest with respect to all frequency components to extract the highest low frequency component f i. The feature sound extraction device 1, since the aim is to extract features sounds relating to the quality of the motor, the use of low-frequency components f i described above as the characteristic sound used for evaluation of quality, unnecessary frequency component evaluation It is considered that the accuracy of evaluation can be improved because most of the information has been removed. Therefore, by passing a low frequency component f i obtained by the wavelet transform unit 13 to the controllable filter means 15 to pass the frequency band by the monitoring means 14, the low-frequency component ratio is high occupied frequency component of the feature tone f i The signal of the frequency component in the vicinity of is extracted. Here, since through the low-frequency component f i signal further filter means 15 obtained by the wavelet transformation unit 13, it is possible to remove the unnecessary component included in the output of the wavelet transform unit 13. The signal extracted by the filter unit 15 is input to the vector extraction unit 16, and the vector extraction unit 16 obtains a frequency spectrum using a technique such as FFT (Fast Fourier Transform). The frequency spectrum obtained by the vector extraction means 16 in this way becomes the output of the feature sound extraction device 1.

特徴音抽出装置1の動作をさらに具体的に説明する。モータの動作音において、たとえば正常時には含まれていない「オンオン」という音が含まれているときには、何らかの不良があると考えることができる。本実施形態では、特徴音抽出装置1において音声入力手段11から入力された原信号から「オンオン」という音を含む特定の周波数帯域を抽出し、この比較的狭い周波数帯域のみに着目して「オンオン」という音から良否を判断するようにしている。上述のように音声入力手段11から入力された原信号は、作業用の記憶部に記憶されているから、たとえば図2(a)のように4〜4.5秒の区間における原信号の波形を読み出すことができる。図2(b)は同じ原信号のうち4.2〜4.4秒の区間にける波形を読み出したものである。   The operation of the feature sound extraction device 1 will be described more specifically. It can be considered that there is some defect when the operation sound of the motor includes, for example, an “on / on” sound that is not included during normal operation. In the present embodiment, the characteristic sound extraction apparatus 1 extracts a specific frequency band including a sound “ON / ON” from the original signal input from the voice input unit 11, and pays attention only to this relatively narrow frequency band to “ON / ON”. The sound is judged from the sound. Since the original signal input from the voice input means 11 is stored in the working storage unit as described above, the waveform of the original signal in a section of 4 to 4.5 seconds, for example, as shown in FIG. Can be read out. FIG. 2B shows a waveform read out in the section of 4.2 to 4.4 seconds of the same original signal.

ウェーブレット変換手段13に図2(a)(b)の原信号を入力し、適宜回数の変換処理を行うと、変換前に存在していた「オンオン」という特徴音が、変換後の低周波成分には含まれなくなると考えられる。上述した監視手段14では、ウェーブレット変換手段13から出力される低周波成分の監視によって目的とする特徴音の有無を判断し、低周波成分から特徴音が消滅したときに、変換前の低周波成分を通過させるようにフィルタ手段15の通過帯域を指示する。この時点での変換前の信号には「オンオン」という特徴音の周波数成分が含まれ、図3(a)(b)のような波形になる。図3に示す信号では、「オンオン」という特徴音と無関係な周波数成分はほとんど除去されているから、この信号について周波数スペクトルを抽出すると、「オンオン」という特徴音を定量化することが可能になると予測できる。   When the original signal of FIGS. 2A and 2B is input to the wavelet transform unit 13 and the conversion process is performed an appropriate number of times, the characteristic sound “on-on” that existed before the conversion is converted into a low-frequency component after the conversion. It is considered that it will not be included. The monitoring means 14 described above determines the presence or absence of the target characteristic sound by monitoring the low-frequency component output from the wavelet transform means 13, and when the characteristic sound disappears from the low-frequency component, the low-frequency component before conversion The pass band of the filter means 15 is instructed to pass. The signal before conversion at this point includes the frequency component of the characteristic sound “ON / ON”, and has a waveform as shown in FIGS. In the signal shown in FIG. 3, since the frequency component unrelated to the characteristic sound “ON / ON” is almost removed, when the frequency spectrum is extracted for this signal, the characteristic sound “ON / ON” can be quantified. Predictable.

ここに、「オンオン」という特徴音を含む原信号の周波数スペクトルの例を示すと図4(a)のようになり、「オンオン」という特徴音を含まない原信号の周波数スペクトルの例を示すと図5(a)のようになる。いずれも、30〜1500Hzの帯域における周波数スペクトルを示しており、両者を比較すると周波数スペクトルに相違があることはわかるものの、有意の差があるようには見えず、これらの波形を比較しても差異を明確に認識することは困難である。   Here, an example of the frequency spectrum of the original signal including the characteristic sound “ON / ON” is as shown in FIG. 4A, and an example of the frequency spectrum of the original signal not including the characteristic sound “ON / ON” is illustrated. As shown in FIG. Both show the frequency spectrum in the 30 to 1500 Hz band, and comparing the two shows that there is a difference in the frequency spectrum, but there does not appear to be a significant difference. Even if these waveforms are compared, It is difficult to clearly recognize the differences.

一方、図4(b)は、図4(a)に示した原信号をウェーブレット変換手段13に与え、ウェーブレット変換手段13から出力される低周波成分を80〜160Hzの通過周波数帯域(図4(a)に示す丸付近の周波数帯域)であるフィルタ手段15に通して得た信号の周波数スペクトルの例を示し、図5(b)は、図5(a)に示した原信号に同様の処理を施して(フィルタ手段15の通過周波数帯域は図5(a)に示す丸付近の周波数帯域になる)得た信号の周波数スペクトルの例を示している。図4(b)と図5(b)とを比較するとわかるように、周波数スペクトルには一見してわかる差異が生じている。つまり、「オンオン」という特徴音の大部分は80〜160Hzの周波数帯域に含まれていると考えられる。したがって、フィルタ手段15の出力を用いて両者を比較することによって「オンオン」という特徴音が含まれている信号か、「オンオン」という特徴音が含まれていない信号であるかを容易に識別できることがわかる。   On the other hand, FIG. 4B gives the original signal shown in FIG. 4A to the wavelet transforming means 13, and the low frequency component output from the wavelet transforming means 13 is passed through a frequency band of 80 to 160 Hz (FIG. 4 ( FIG. 5B shows an example of the frequency spectrum of the signal obtained through the filter means 15 (frequency band near the circle shown in FIG. 5A), and FIG. 5B shows the same processing as the original signal shown in FIG. (The pass frequency band of the filter means 15 is a frequency band in the vicinity of the circle shown in FIG. 5A). As can be seen by comparing FIG. 4B and FIG. 5B, there is a difference that can be seen at a glance in the frequency spectrum. That is, it is considered that most of the characteristic sound “ON / ON” is included in the frequency band of 80 to 160 Hz. Therefore, by comparing the two using the output of the filter means 15, it is possible to easily identify whether the signal includes the characteristic sound “ON / ON” or does not include the characteristic sound “ON / ON”. I understand.

ウェーブレット変換手段13から出力された「オンオン」という特徴音が含まれている信号を80〜160Hzの通過周波数帯域を有するフィルタ手段15に通すことによって得られる信号波形の例を図6に示す。図によれば1秒間に約3周期で振幅の変化があり、この振幅変化が「オンオン」という特徴音に対応していることがわかる。ここで、図4に示した周波数成分から「オンオン」という特徴音がモータのブラシの不良に起因すると考え、良品のブラシに取り替えたところ、「オンオン」という特徴音がほぼ生じなくなった。つまり、上述した「オンオン」という特徴音はモータのブラシの不良に起因していると推測できる。   FIG. 6 shows an example of a signal waveform obtained by passing the signal containing the “ON / ON” characteristic sound output from the wavelet transform unit 13 through the filter unit 15 having a pass frequency band of 80 to 160 Hz. According to the figure, there is a change in amplitude in about 3 cycles per second, and it can be seen that this change in amplitude corresponds to the characteristic sound “ON / ON”. Here, it is considered that the characteristic sound “ON / ON” from the frequency component shown in FIG. 4 is caused by a defective brush of the motor, and when it is replaced with a non-defective brush, the characteristic sound “ON / ON” hardly occurs. That is, it can be inferred that the above-mentioned characteristic sound “ON / ON” is caused by a defective brush of the motor.

上述した知見に基づいて、特徴音抽出装置1から出力される周波数スペクトルのパターンを分類すれば、モータが正常か否かを判定することができ、また正常ではないと判定したときに異常の内容を推定することができることがわかる。そこで、本実施形態では、特徴音抽出装置1から出力される周波数スペクトルのパターンを分類するために、ニューラルネットワークを備えた品質評価装置2を用いている。ただし、モータの回転速度が変化すると、同種の異常が生じている場合であっても、周波数スペクトルのパターンが周波数軸方向に偏移するから、周波数が偏移しても同パターンか否かを判断する技術が要求される。そこで、本実施形態では、学習ベクトル量子化(以下、LVQと呼ぶ)法を採用し、特徴音抽出手段1から出力される周波数スペクトルのパターンにおける特徴をLVQ法によって抽出し、抽出された特徴に分類用ニューラルネットワーク23を適用することによって、周波数の偏移に関わりなく周波数スペクトルのパターンの分類を可能にしている。また、LVQ法を採用するにあたり、特徴音抽出手段1から出力された周波数スペクトルの大まかな特徴を抽出するために前置量子化手段21に通し、前置量子化手段21によって得られた大まかな結果を、学習ベクトル量子化手段22に与えることによって、周波数スペクトルの細かい特徴を抽出するようにしてある。   Based on the knowledge described above, if the pattern of the frequency spectrum output from the feature sound extraction device 1 is classified, it can be determined whether or not the motor is normal, and the content of the abnormality when it is determined that the motor is not normal It can be seen that can be estimated. Therefore, in this embodiment, in order to classify the pattern of the frequency spectrum output from the feature sound extraction device 1, the quality evaluation device 2 provided with a neural network is used. However, if the rotational speed of the motor changes, even if the same kind of abnormality occurs, the frequency spectrum pattern shifts in the frequency axis direction. Judgment technology is required. Therefore, in the present embodiment, a learning vector quantization (hereinafter referred to as LVQ) method is adopted, features in the frequency spectrum pattern output from the feature sound extraction means 1 are extracted by the LVQ method, and the extracted features are converted into the extracted features. By applying the classification neural network 23, it is possible to classify the frequency spectrum pattern regardless of the frequency shift. Further, in adopting the LVQ method, in order to extract a rough feature of the frequency spectrum output from the feature sound extraction means 1, the rough quantization obtained by the prequantization means 21 is passed through the prequantization means 21. By giving the result to the learning vector quantization means 22, fine features of the frequency spectrum are extracted.

すなわち、本実施形態における品質抽出装置2は、特徴音抽出装置1から出力される周波数スペクトルの特徴を大まかに抽出する前置量子化手段21と、前置量子化手段21により得られた結果からさらに細かい特徴を抽出する学習ベクトル量子化手段22と、学習ベクトル量子化手段22により得られた周波数スペクトルの特徴を分類する分類用ニューラルネットワーク23とにより構成してある。   That is, the quality extraction device 2 in this embodiment is based on the result obtained by the prequantization means 21 that roughly extracts the characteristics of the frequency spectrum output from the feature sound extraction device 1 and the prequantization means 21. Further, the learning vector quantization means 22 for extracting fine features and the classification neural network 23 for classifying the characteristics of the frequency spectrum obtained by the learning vector quantization means 22 are configured.

前置量子化手段21および学習ベクトル量子化手段23は、ともにLVQネットワークからなる。ただし、学習ベクトル量子化手段23は、周波数の偏移があってもパターンの特徴を抽出することができるようにLVQネットワークを改良してある。LVQネットワークは、基本的には、図7に示すように、入力データ群X,…,X,…,Xが与えられる複数個のノード(ニューロン)Neを備える入力層Linと、入力層Linの各ノードNeとそれぞれ結合された複数個のノード(ニューロン)Neを備える競合層Lcmとからなる2層のニューラルネットワークである。LVQネットワークでは、学習によって入力層Linの各ノードNeと競合層Lcmの各ノードNeとの結合の重み係数を調整した状態で使用され、上述した入力データ群X,…,X,…,Xが与えられると、競合層Lcmの各ノードNeに重み係数に従った出力データ群d,…,d,…,dが得られるというものである。たとえば、図7における競合層Lcmの左半分のノードNeには「オンオン」という特徴音のない場合の出力データ群d,…,dが得られ、右半分のノードNeには「オンオン」という特徴音を含む場合の出力データ群dj+1,…,dが得られ、「オンオン」という特徴音を含むか否かの2分類が可能になる。 Both the pre-quantization means 21 and the learning vector quantization means 23 are composed of LVQ networks. However, the learning vector quantization means 23 has improved the LVQ network so that the feature of the pattern can be extracted even if there is a frequency shift. LVQ network is basically as shown in FIG. 7, the input data group X 1, ..., X j, ..., an input layer Lin comprising X n plurality of nodes is given (neurons) Ne, an input This is a two-layer neural network including a competitive layer Lcm having a plurality of nodes (neurons) Ne respectively coupled to each node Ne of the layer Lin. In the LVQ network, learning is used in a state in which the weighting coefficient of coupling between each node Ne of the input layer Lin and each node Ne of the competitive layer Lcm is adjusted, and the above-described input data groups X 1 ,..., X j,. If X n is given, competitive layer output data group d 1 in accordance with the weighting factor to each node Ne of Lcm, ..., d j, ..., is that d n is obtained. For example, output data groups d 1 ,..., D j in the case where there is no characteristic sound “ON / ON” are obtained at the left half node Ne of the competitive layer Lcm in FIG. 7, and “ON / ON” is obtained at the right half node Ne. output data group d j + 1 when including the features sound that, ..., d n is obtained, it is possible to whether 2 classification including features sound "On'on".

LVQネットワークの動作についてさらに詳しく説明する。いま、入力層Linの各ノードNeに与えられる入力データ群X,…,X,…,Xと競合層Lcmの各ノードNe(出力データdに対応するノード)との距離Eを数2のように定義する。数2においてwijは、入力データXを与える入力層LinのノードNeと競合層Lcmにおける出力データdに対応するノードNeとの間の重み係数である。 The operation of the LVQ network will be described in more detail. Now, the input data group X 1 given to each node Ne of the input layer Lin, ..., X j, ..., a distance between each node of competitive layer Lcm and X n Ne (node corresponding to the output data d i) E i Is defined as Equation 2. W ij in Equation 2 is a weighting factor between the node Ne which corresponds to the output data d i at the node Ne and the competitive layer Lcm input layer Lin providing input data X j.

Figure 2005141591
Figure 2005141591

競合層LcmにおけるノードNeのうち入力データ群X,…,X,…,X対して数2で定義した距離Eが最小になるノードNeを発火したノードNeという。LVQネットワークを学習させるには、学習サンプルを与えて競合層Lcmの所望のノードNeを発火させるように重み係数wijを調整する。このような学習を行った後には、適宜の入力データ群X,…,X,…,Xに対して、学習内容に従ったパターンの出力データ群d,…,d,…,dを得ることができる。 Input data group X 1 of the node Ne in the competitive layer Lcm, ..., X j, ... , X n that node Ne the distance E i defined by the number 2 has fired the node Ne which minimizes for. In order to learn the LVQ network, the weighting factor w ij is adjusted so as to fire a desired node Ne of the competitive layer Lcm by giving a learning sample. After performing such learning, appropriate input data group X 1, ..., X j, ..., output data group d 1 with respect to X n, in accordance with the learning content patterns, ..., d j, ... , can be obtained d n.

ところで、上述したように、モータの回転速度は変化するから、特徴音抽出装置1から出力される周波数スペクトルには、モータの回転速度の変化に応じて周波数軸方向の偏移が生じる。特徴音抽出装置1から出力される周波数スペクトルは、LVQネットワークである前置量子化手段21への入力データ群X,…,X,…,Xであるから、周波数スペクトルが周波数軸方向に偏移すると、前置量子化手段21の出力データ群d,…,d,…,dが変化し、所望の結果を得ることができなくなる。そこで、本実施形態では、前置量子化手段21の後段に数3の形で定義した距離Eを求め、距離Eを最小にする偏移量stだけ周波数スペクトルを周波数軸方向に偏移させる学習ベクトル量子化手段22を設けている。数3においてstは、周波数軸方向の偏移量を表している。 By the way, as described above, since the rotational speed of the motor changes, the frequency spectrum output from the characteristic sound extraction device 1 undergoes a shift in the frequency axis direction according to the change in the rotational speed of the motor. Since the frequency spectrum output from the feature sound extraction apparatus 1 is the input data group X 1 ,..., X j ,..., X n to the pre-quantization means 21 that is an LVQ network, the frequency spectrum is in the frequency axis direction. When deviation in the output data group d 1 before置量Coca means 21, ..., d j, ... , d n is changed, it becomes impossible to obtain the desired result. Therefore, in the present embodiment, the distance E i defined in the form of Equation 3 is obtained after the pre-quantization means 21 and the frequency spectrum is shifted in the frequency axis direction by the shift amount st that minimizes the distance E i. Learning vector quantization means 22 is provided. In Equation 3, st represents the shift amount in the frequency axis direction.

Figure 2005141591
Figure 2005141591

数3を数2と比較すればわかるように、数3では入力データ群X,…,X,…,Xを周波数軸方向に偏移させる偏移量stを付加してあり、入力データ群X,…,X,…,Xを偏移させることによって、同じ分布パターンを持つ周波数スペクトルであれば、個々の入力データ群X,…,X,…,Xが周波数軸方向に偏移していても、ほぼ一致するように重ね合わせることが可能になる。偏移量stは、学習後の学習ベクトル量子化手段22において求められる。つまり、学習ベクトル量子化手段22の学習時には、標準的な学習サンプルを与えて重み係数wijを調整しておき、実際の入力データ群X,…,X,…,Xを与えるときに、距離Eを最小にするように偏移量stを決定するのであって、偏移量stが最小になったときに、当該距離Eが得られた出力データ群d,…,d,…,dのパターンを求めるべき出力データ群d,…,d,…,dとみなすのである。 Number 3 As can be seen compared to the number 2, number 3 the input data set X 1, ..., X j, ..., Yes adds the shift amount st to shift in the frequency axis direction X n, input If the frequency spectrum has the same distribution pattern by shifting the data groups X 1 , ..., X j , ..., X n , the individual input data groups X 1 , ..., X j , ..., X n Even if there is a deviation in the frequency axis direction, it is possible to superimpose them so as to almost coincide. The shift amount st is obtained by the learning vector quantization means 22 after learning. In other words, at the time of learning of the learning vector quantization means 22, previously to adjust the weighting coefficients w ij is given a standard learning samples, actual input data group X 1, ..., X j, ..., when giving X n to the distance E i a than determining the shift amount st to minimize, shift amount when the st is minimized, the output data group d 1 that the distance E i is obtained, ..., d j, ..., output data group d 1 should seek pattern of d n, ..., d j, ..., it is to regard as d n.

任意の入力データ群X,…,X,…,Xに対して数3における偏移量stを決定するには、規定した範囲内で偏移量stを少しずつ変化させすべての偏移量stの中から距離Eが最小になった偏移量stを求める方法が考えられるが、このような総当たり法では偏移量stが得られるまでに多くの時間を要する。そこで、本実施形態では、遺伝的アルゴリズムを用いることによって偏移量stを求める時間を短縮している。 In order to determine the deviation amount st in Equation 3 for an arbitrary input data group X 1 ,..., X j ,..., X n , the deviation amount st is changed little by little within the specified range. A method for obtaining the shift amount st in which the distance E i is minimized from the shift amount st can be considered. However, such a round robin method requires a long time until the shift amount st is obtained. Therefore, in this embodiment, the time for obtaining the shift amount st is shortened by using a genetic algorithm.

上述のように、学習ベクトル量子化手段22において、入力データ群X,…,X,…,Xを周波数軸方向に偏移させ、適正な偏移量stを探し出すことによって距離Eが最小になる出力データ群d,…,d,…,dを求めているから、入力データ群X,…,X,…,Xにモータの回転速度に応じた周波数軸方向の偏移が生じていても、周波数スペクトルの分布パターンがほぼ一致していれば、出力データ群d,…,d,…,dの分布パターンもほぼ一致することになる。換言すれば、入力データ群X,…,X,…,Xとして与えられる周波数スペクトルと、学習サンプルとして与えられた周波数スペクトルとの一致度がもっとも高くなるような偏移量stを求めたことになる。 As described above, the learning vector quantization means 22 shifts the input data group X 1 ,..., X j ,..., X n in the frequency axis direction and searches for the appropriate shift amount st to find the distance E i. output data group d 1 but which minimizes, ..., d j, ..., from seeking d n, the input data group X 1, ..., X j, ..., the frequency axis corresponding to the rotation speed of the motor to X n even if occurring the direction of shift, if consistent distribution pattern of the frequency spectrum is substantially the output data group d 1, ..., d j, ..., distribution pattern of d n also to substantially coincide. In other words, the input data group X 1, ..., X j, ..., and the frequency spectrum given, a shift amount st as degree of coincidence between the frequency spectrum given as a learning sample is the highest determined as X n That's right.

学習ベクトル量子化手段22の出力は学習済みの分類用ニューラルネットワーク23に与えられ、特徴音抽出装置1から出力された周波数スペクトルに基づいて、モータが正常か異常かの判別がなされ、さらに異常であれば異常の内容も判別される。つまり、分類用ニューラルネットワーク23では、上述した例のように「オンオン」という特徴音に対応した周波数スペクトルからブラシの異常という判別を行うことが可能になる。しかも、学習済みの分類用ネットワーク23では、学習ベクトル量子化器22の出力データ群d,…,d,…,dを入力データ群としているから、モータの回転速度の相違による周波数軸方向の偏移の影響が除去されており、結果的にモータの回転速度に関係なく異常の内容を判別することができる。 The output of the learning vector quantization means 22 is given to the learned classification neural network 23, and based on the frequency spectrum output from the feature sound extraction apparatus 1, it is determined whether the motor is normal or abnormal. If so, the contents of the abnormality are also determined. That is, the classification neural network 23 can determine that the brush is abnormal from the frequency spectrum corresponding to the characteristic sound “ON / ON” as in the above-described example. Moreover, the trained classification network 23, the output data group d 1 of the learning vector quantizer 22, ..., d j, ..., since as input data set to d n, the frequency axis due to the difference in rotational speed of the motor The influence of the direction shift is eliminated, and as a result, the content of the abnormality can be determined regardless of the rotational speed of the motor.

なお、分類用ニューラルネットワーク23の学習にあたっては、良品と不良品との学習サンプルを与える。このようにして学習を行った分類用ニューラルネットワーク23を前置量子化手段21および学習ベクトル量子化手段22と併用することによって、モータの良否判定に際して人のような官能のばらつきを生じることなく安定した判定結果を得ることが可能になる。また、学習ベクトル量子化手段22の前段に前置量子化手段21を設けていることによって、特徴音抽出装置1から出力される周波数スペクトルの特徴と、前置量子化手段21および学習ベクトル量子化手段22の学習に用いる学習サンプルの周波数スペクトルの特徴とのうち類似度の比較的高いものを絞り込むことができ、学習ベクトル量子化手段22での処理の負荷を軽減することが可能になる。   In the learning of the neural network for classification 23, learning samples of good products and defective products are given. By using the classification neural network 23 thus learned in combination with the pre-quantization means 21 and the learning vector quantization means 22, stable determination can be made without causing sensory variations when determining the quality of the motor. It is possible to obtain the determined result. Further, by providing the pre-quantization means 21 in the preceding stage of the learning vector quantization means 22, the characteristics of the frequency spectrum output from the feature sound extraction device 1, the pre-quantization means 21 and the learning vector quantization Of the features of the frequency spectrum of the learning sample used for learning by the means 22, those having a relatively high similarity can be narrowed down, and the processing load on the learning vector quantization means 22 can be reduced.

ところで、上述した構成例では、学習ベクトル量子化手段22において、偏移量stを適正化するために遺伝的アルゴリズムを用いているが、遺伝的アルゴリズムは総当たり法に比較すると適正な偏移量stを探し出すまでの時間を短縮することができるものの、依然として適正な偏移量stの決定には比較的長い時間を要する。製造ラインのように製造と検査とを並行して行う必要があるときには、偏移量stの決定に時間を要すると、製造工程のタクトタイムが長くなるという問題が生じる。そこで、以下では適正な偏移量stを求める時間を遺伝的アルゴリズムよりも短縮できる技術について説明する。なお、以下では学習済みの学習ベクトル量子化手段22において学習に用いた学習サンプルの集合をコードブックベクトルと呼び、入力データ群X,…,X,…,Xを検査データと呼ぶ。また、偏移量stを求める時間を短縮する技術として、データを圧縮する方法と、偏移量stを探索する領域を制限する方法とを示す。 By the way, in the configuration example described above, the learning vector quantization means 22 uses a genetic algorithm to optimize the shift amount st. However, the genetic algorithm is more appropriate than the brute force method. Although the time required to find st can be shortened, it still takes a relatively long time to determine an appropriate shift amount st. When it is necessary to perform manufacturing and inspection in parallel as in the manufacturing line, if it takes time to determine the shift amount st, there is a problem that the tact time of the manufacturing process becomes long. Thus, hereinafter, a technique that can shorten the time for obtaining an appropriate shift amount st as compared with the genetic algorithm will be described. In the following description referred to as a codebook vector set of learning samples used for learning in the learning already learning vector quantization means 22, an input data group X 1, ..., X j, ..., is referred to as the inspection data X n. In addition, as a technique for shortening the time for obtaining the shift amount st, a method of compressing data and a method of limiting a region for searching for the shift amount st are shown.

データを圧縮することにより偏移量stの探索時間を短縮するには、図8に示すように、まずコードブックベクトルと検査データとをそれぞれ周波数軸方向において1/2(nは適宜の自然数)に圧縮する(S1,S2)。このようにデータを1/2に圧縮すれば、偏移量stも1/2に圧縮されるから、比較的少ない回数で偏移量stを求めることができる(S3)。ただし、偏移量stとしては距離Eを最小にするものだけではなく、距離Eの小さいほうから所定個数(j個)の偏移量stを求める(S4)。ここで、データを1/2に圧縮して求めた偏移量stをst(n)と表記する。また、データの圧縮の際には2Hzの区間のスペクトルの平均値または最大値を当該区間の代表値として用いる。 In order to shorten the search time for the shift amount st by compressing the data, as shown in FIG. 8, first, the codebook vector and the test data are respectively divided into 1/2 n (n is an appropriate natural number) in the frequency axis direction. ) (S1, S2). If the data is compressed to 1/2 n in this way, the shift amount st is also compressed to 1/2 n , so that the shift amount st can be obtained with a relatively small number of times (S3). However, the offset of not only those that the distance E i to a minimum as st, obtaining the shift amount st of the distance E less a predetermined number of more of i (j-number) (S4). Here, the shift amount st obtained by compressing the data to 1/2 n is expressed as st (n). Further, when compressing data, an average value or maximum value of a spectrum in a 2 n Hz section is used as a representative value of the section.

次に、圧縮率を小さくしデータを1/2(n−1)に圧縮し、偏移量st(n)の近傍領域である2・st(n)±1の範囲内で偏移量st(n−1)を距離Eの小さいほうから所定個数(j個)求める(S5〜S9)。さらに、同様の処理をn=0になるまで繰り返す(S10、S11)。 Next, the compression rate is reduced and the data is compressed to ½ (n−1) , and the deviation amount st is within the range of 2 · st (n) ± 1, which is the vicinity of the deviation amount st (n). (n-1) predetermined from the smaller of the distance E i number (j-number) obtaining (S5 to S9). Further, the same processing is repeated until n = 0 (S10, S11).

上述のように、圧縮率を高めて求めた偏移量stの近傍領域において、圧縮率を小さくして偏移量stを求める処理を繰り返すことによって、偏移量stの存在範囲がしだいに収束し、n=0とした状態、つまり圧縮しない状態で求めたj個の偏移量st(0)の中で距離Eを最小にする偏移量st(0)を求めることができ、この偏移量st(0)を周波数スペクトルの偏移量stに用いる(S12)。 As described above, the range in which the deviation amount st exists gradually converges by repeating the process of obtaining the deviation amount st by reducing the compression rate in the vicinity of the deviation amount st obtained by increasing the compression rate. The deviation amount st (0) that minimizes the distance E i can be obtained from the j deviation amounts st (0) obtained in the state where n = 0, that is, in the uncompressed state. The deviation amount st (0) is used as the deviation amount st of the frequency spectrum (S12).

上述のようにして偏移量stを決定すると、総当たり法で偏移量st求める場合に比較すると探索に要する時間が1/22nになる。つまり、データを圧縮することによって偏移量を探索する領域を狭くした上で、偏移量stの候補をj個求めていることによって、偏移量stの候補の範囲について信頼性を保ちながらも比較的少ない範囲の候補に絞り込むことになり、信頼性よく少ない回数で偏移量stを求めることが可能になる。また、入力される周波数スペクトルにおいてピークには広がりがあることを考慮して、一定の幅を有した近傍領域で偏移量stの候補を探索しているから、信頼性よく偏移量stを求めることが可能になる。 When the deviation amount st is determined as described above, the time required for the search is 1 / 22n as compared with the case where the deviation amount st is obtained by the brute force method. In other words, by compressing the data, the area for searching for the shift amount is narrowed, and j candidates for the shift amount st are obtained, thereby maintaining the reliability of the range of candidates for the shift amount st. Therefore, the shift amount st can be obtained with a small number of times with high reliability. In addition, in consideration of the fact that the peak is broad in the input frequency spectrum, a candidate for the deviation amount st is searched for in a neighboring region having a certain width. It becomes possible to ask.

ところで、偏移量stを探索する領域を制限することにより偏移量stの探索時間を短縮するには、図9に示すように、まずコードブックベクトルと検査データとを適宜の閾値で2値化する(S1、S2)。また、2値化により抽出される領域のうち距離が近いもの同士(ピーク間の距離が閾値内のもの同士)は一括して1領域として扱う。次に、得られた各領域ごとの重心の位置を求める。たとえば、図10(a)のように、閾値Thを越える領域があるときに、当該領域の重心G1,G2を求める。また、図10(a)の右側の領域D1,D2は閾値Thを越える部分が2領域に分かれているが、両領域D1,D2のピーク間の距離が短いから1領域としてまとめて扱う。一方、図10(b)の右側の領域のように、閾値Thを越えない領域については採用しない。   By the way, in order to shorten the search time for the shift amount st by limiting the search area for the shift amount st, first, as shown in FIG. 9, the codebook vector and the inspection data are binarized with an appropriate threshold value. (S1, S2). Also, regions extracted by binarization that are close to each other (those whose distance between peaks is within a threshold value) are collectively treated as one region. Next, the position of the center of gravity for each obtained area is obtained. For example, as shown in FIG. 10A, when there is a region exceeding the threshold Th, the centroids G1 and G2 of the region are obtained. In addition, the areas D1 and D2 on the right side of FIG. 10A are divided into two areas where the threshold value Th is exceeded. However, since the distance between the peaks of both areas D1 and D2 is short, they are treated as one area. On the other hand, a region that does not exceed the threshold Th, such as the region on the right side of FIG.

次に、図10(c)のようにコードブックベクトルおよび検査データから得た重心G1,G2を一致させるための偏移量stを求め(S5)、この偏移量stを初期値とし、初期値の偏移量stの近傍において距離Eを求める(S6)。通常はコードブックベクトルと検査データとから重心が複数個得られるから、得られた重心の数だけ組み合わせて同様の演算を行うことによって(S3、S4、S7〜S10)、偏移量stの候補を複数個求め、そのうち距離Eを最小にする偏移量stを採用する(S11)。この方法も偏移量stの範囲を絞り込んで探索するから、比較的短時間で信頼性よく偏移量stを求めることができる。 Next, as shown in FIG. 10C, a deviation amount st for matching the centroids G1 and G2 obtained from the codebook vector and the inspection data is obtained (S5), and this deviation amount st is set as an initial value. A distance E i is obtained in the vicinity of the value shift amount st (S6). Usually, since a plurality of centroids are obtained from the code book vector and the inspection data, the same amount of the obtained centroids is combined and the same calculation is performed (S3, S4, S7 to S10), and the deviation amount st candidates. And a shift amount st that minimizes the distance E i is employed (S11). Since this method also searches by narrowing down the range of the deviation amount st, the deviation amount st can be obtained with high reliability in a relatively short time.

なお、上述した例では、前置量子化手段21にLVQネットワークを用いているが、前置量子化手段21としては、学習なしの競合型ニューラルネットワーク(いわゆる、SOM型ネットワーク)を用いることも可能である。いずれにしても、前置量子化手段21では、特徴音抽出装置1から得られる周波数スペクトルの分布パターンから不要成分を除去することができ、学習ベクトル量子化手段22での処理の負荷を軽減することができればよい。このような前置量子化手段21を付加していることにより、特徴音抽出装置1から出力される周波数スペクトルを学習ベクトル量子化手段22に直接入力する場合に比較すると、学習ベクトル量子化手段22での負荷を大幅に軽減することができ、結果的に処理時間の短縮につながる。   In the above-described example, an LVQ network is used for the pre-quantization means 21, but a competitive neural network without learning (so-called SOM type network) can be used as the pre-quantization means 21. It is. In any case, the pre-quantization means 21 can remove unnecessary components from the distribution pattern of the frequency spectrum obtained from the feature sound extraction device 1, and the processing load on the learning vector quantization means 22 is reduced. I can do it. By adding such a pre-quantization means 21, the learning vector quantization means 22 is compared with the case where the frequency spectrum output from the feature sound extraction device 1 is directly input to the learning vector quantization means 22. Can significantly reduce the load on the network, resulting in a reduction in processing time.

上述した特徴音抽出装置1のうちの音声入力手段11およびA/D変換手段12を除く部分と品質評価装置2とは、パーソナルコンピュータで適宜のプログラムを実行することにより実現される。また、パーソナルコンピュータではなく、マイクロプロセッサを用いた専用の装置を構成し、ソフトウェア処理では処理時間が長くなるウェーブレット変換手段13や学習ベクトル量子化手段22などの部分を専用のハードウェアで構成することにより、処理時間を短縮するようにしてもよい。   Of the characteristic sound extraction apparatus 1 described above, the part excluding the voice input means 11 and the A / D conversion means 12 and the quality evaluation apparatus 2 are realized by executing an appropriate program on a personal computer. In addition, a dedicated device using a microprocessor is configured instead of a personal computer, and the parts such as the wavelet transform unit 13 and the learning vector quantization unit 22 that require a long processing time in software processing are configured by dedicated hardware. Thus, the processing time may be shortened.

上述の実施形態では、モータの回転時に発生する音に基づいてモータの良否を判定する例を示したが、モータを用いる装置以外に音や振動を発生する電気装置ないし機械装置であれば、本発明の技術を適用可能であって、良否検査や故障解析などを行うことができる。また、高架道路、トンネル、建物などの対象物の良否検査を行う場合には、対象物に振動や音波を与える装置を別途に設け、対象物を伝達される音波や振動を本発明装置によって解析すればよい。なお、上述の例では特徴音抽出装置1においてウェーブレット変換を行っているが、ウェーブレット変換を行わずに音声入力手段11で得た信号からフィルタによって雑音を除去した後にベクトル抽出手段16において周波数スペクトルを求めるようにしてもよい。この場合には、ウェーブレット変換手段13を設ける場合に比較して品質評価装置2での処理量が増加し判定結果が得られるまでの時間が長くなるが、品質の評価は可能である。   In the above-described embodiment, an example in which the quality of the motor is determined based on the sound generated when the motor rotates is shown. However, if the electric device or the mechanical device generates sound or vibration in addition to the device using the motor, the present embodiment can be used. The technology of the invention can be applied, and pass / fail inspection and failure analysis can be performed. In addition, when performing pass / fail inspection of objects such as elevated roads, tunnels, buildings, etc., a separate device for applying vibrations and sound waves to the objects is provided, and the sound waves and vibrations transmitted through the objects are analyzed by the device of the present invention. do it. In the above example, the feature sound extraction apparatus 1 performs wavelet transformation. However, after removing noise from the signal obtained by the voice input means 11 without performing wavelet transformation by a filter, the vector extraction means 16 obtains the frequency spectrum. You may make it ask. In this case, as compared with the case where the wavelet transform means 13 is provided, the amount of processing in the quality evaluation apparatus 2 increases and the time until the determination result is obtained becomes longer, but the quality can be evaluated.

実施形態を示すブロック図である。It is a block diagram which shows embodiment. 同上において原信号の波形の例を示す図である。It is a figure which shows the example of the waveform of an original signal in the same as the above. 同上においてウェーブレット変換後の波形の例を示す図である。It is a figure which shows the example of the waveform after wavelet transformation in the same as the above. 同上において原信号の周波数スペクトルの例を示す図である。It is a figure which shows the example of the frequency spectrum of an original signal in the same as the above. 同上においてフィルタ手段を通過した信号の周波数スペクトルの例を示す図である。It is a figure which shows the example of the frequency spectrum of the signal which passed the filter means in the same as the above. 同上においてフィルタ手段を通過した信号の波形の例を示す図である。It is a figure which shows the example of the waveform of the signal which passed the filter means in the same as the above. 同上に用いるLVQネットワークの構成例を示す図である。It is a figure which shows the structural example of the LVQ network used for the same as the above. 同上において変位量を求める手順の一例を示す動作説明図である。It is operation | movement explanatory drawing which shows an example of the procedure which calculates | requires a displacement amount in the same as the above. 同上において変化量を求める手順の他例を示す動作説明図である。It is operation | movement explanatory drawing which shows the other example of the procedure which calculates | requires variation | change_quantity in the same as the above. 図9に示した手順における概念を示す図である。It is a figure which shows the concept in the procedure shown in FIG.

符号の説明Explanation of symbols

1 特徴音抽出装置
2 品質評価装置
11 音声入力手段
13 ウェーブレット変換手段
14 監視手段
15 フィルタ手段
16 ベクトル抽出手段
21 前置量子化手段
22 学習ベクトル量子化手段
23 分類用ニューラルネットワーク
DESCRIPTION OF SYMBOLS 1 Feature sound extraction apparatus 2 Quality evaluation apparatus 11 Voice input means 13 Wavelet transformation means 14 Monitoring means 15 Filter means 16 Vector extraction means 21 Prequantization means 22 Learning vector quantization means 23 Classification neural network

Claims (6)

対象物からの音波に含まれる周波数スペクトルを学習サンプルの周波数スペクトルとの一致度が高くなるように周波軸方向に偏移させたときの偏移量を求め、前記対象物から得られた周波数スペクトルを当該偏移量だけ周波数軸方向に偏移させる学習済みの学習ベクトル量子化手段と、学習ベクトル量子化手段の出力として得られる周波数スペクトルの分布パターンを分類することにより対象物の品質を評価する分類用ニューラルネットワークとを備えることを特徴とする品質評価装置。   The frequency spectrum obtained from the object is obtained by obtaining the amount of deviation when the frequency spectrum included in the sound wave from the object is shifted in the frequency axis direction so that the degree of coincidence with the frequency spectrum of the learning sample is high. The learning vector quantization means that has been shifted in the direction of the frequency axis by the amount of deviation and the frequency spectrum distribution pattern obtained as the output of the learning vector quantization means are classified to evaluate the quality of the object. A quality evaluation apparatus comprising a neural network for classification. 前記学習ベクトル量子化手段の前段に、前記対象物から得られる周波数スペクトルの特徴を学習ベクトル量子化手段よりも粗く絞り込む前置量子化手段を付加したことを特徴とする請求項1記載の品質評価装置。   2. The quality evaluation according to claim 1, wherein a pre-quantization unit that narrows down the characteristics of the frequency spectrum obtained from the object more roughly than the learning vector quantization unit is added before the learning vector quantization unit. apparatus. 前記学習ベクトル量子化手段は、前記対象物から得られる周波数スペクトルと学習サンプルの周波数スペクトルとを周波数軸方向において1/2(nは自然数)に圧縮した状態で両周波数スペクトルの偏移量の候補を求め、次に両周波数スペクトルを1/2n−1に圧縮した状態で前記候補を基準とした所定範囲内における両周波数スペクトルの偏移量の候補を求める処理を繰り返し、最終的に両周波数スペクトルを圧縮しない状態で求めた偏移量の候補を前記偏移量として用いることを特徴とする請求項1または請求項2記載の品質評価装置。 The learning vector quantization means compresses the frequency spectrum obtained from the object and the frequency spectrum of the learning sample to ½ n (n is a natural number) in the frequency axis direction, and the amount of deviation of both frequency spectra. Next, a process for obtaining candidates, and then obtaining candidates for the deviation amounts of both frequency spectra within a predetermined range based on the candidates in a state where both frequency spectra are compressed to ½ n−1 is repeated. The quality evaluation apparatus according to claim 1, wherein a candidate for a deviation amount obtained without compressing a frequency spectrum is used as the deviation amount. 前記学習ベクトル量子化手段は、前記対象物から得られる周波数スペクトルと学習サンプルの周波数スペクトルとについてピークを持つ領域の重心をそれぞれ求め、対象物から得られる周波数スペクトルと学習サンプルの周波数スペクトルとからそれぞれ得られる重心間の距離のうちの最小値を前記偏移量として用いることを特徴とする請求項1または請求項2記載の品質評価装置。   The learning vector quantization means obtains centroids of regions having peaks for the frequency spectrum obtained from the object and the frequency spectrum of the learning sample, respectively, and from the frequency spectrum obtained from the object and the frequency spectrum of the learning sample, respectively. The quality evaluation apparatus according to claim 1, wherein a minimum value among the obtained distances between the centers of gravity is used as the shift amount. 前記対象物からの音波が製品の動作音であって請求項1ないし請求項4のいずれか1項に記載の品質評価装置と、品質評価装置の前段に設けられ前記動作音の周波数スペクトルを抽出する特徴音抽出装置とを備え、前記学習ベクトル量子化手段は、対象物の品質として製品の正常と異常との判別および異常時における異常の種類を判別することを特徴とする製品評価システム。   The sound wave from the object is an operation sound of a product, and the quality evaluation apparatus according to any one of claims 1 to 4 and a frequency spectrum of the operation sound provided in a front stage of the quality evaluation apparatus are extracted. A product evaluation system, wherein the learning vector quantization means discriminates whether the product is normal or abnormal and the type of abnormality at the time of abnormality as the quality of the object. 前記特徴音抽出装置は、前記対象物からの音波を検出する音声入力手段と、音声入力手段により得られた信号を最初の入力信号とし入力信号にウェーブレット変換を行うことにより低周波成分と高周波成分とを分離するウェーブレット変換手段と、ウェーブレット変換手段により分離された低周波成分に目的とする特徴音が含まれているときに当該低周波成分をウェーブレット変換手段に次の入力信号として与え前記特徴音が含まれなくなった時点のウェーブレット変換手段の入力信号の周波数帯域を抽出する監視手段と、監視手段により抽出された周波数帯域が通過周波数帯域として設定され前記特徴音が含まれなくなった時点でのウェーブレット変換手段への入力信号が入力されるフィルタ手段と、フィルタ手段を通過した信号の周波数スペクトルを検出するベクトル抽出手段とを備えることを特徴とする請求項5記載の製品評価システム。   The feature sound extraction device includes a sound input unit that detects sound waves from the object, and a low-frequency component and a high-frequency component by performing wavelet transform on the input signal using the signal obtained by the sound input unit as a first input signal. And when the target characteristic sound is included in the low frequency component separated by the wavelet conversion means, the low frequency component is given to the wavelet conversion means as the next input signal and the characteristic sound A monitoring means for extracting the frequency band of the input signal of the wavelet transform means at the time when the sound is no longer included, and the wavelet at the time when the frequency band extracted by the monitoring means is set as a passing frequency band and the characteristic sound is no longer included Filter means to which the input signal to the conversion means is input, and the frequency of the signal that has passed through the filter means Product Evaluation system according to claim 5, characterized in that it comprises a vector extraction means for detecting the spectrum.
JP2003379090A 2003-11-07 2003-11-07 Quality evaluation device and product evaluation system Withdrawn JP2005141591A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003379090A JP2005141591A (en) 2003-11-07 2003-11-07 Quality evaluation device and product evaluation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003379090A JP2005141591A (en) 2003-11-07 2003-11-07 Quality evaluation device and product evaluation system

Publications (1)

Publication Number Publication Date
JP2005141591A true JP2005141591A (en) 2005-06-02

Family

ID=34689275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003379090A Withdrawn JP2005141591A (en) 2003-11-07 2003-11-07 Quality evaluation device and product evaluation system

Country Status (1)

Country Link
JP (1) JP2005141591A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733748A (en) * 2018-04-04 2018-11-02 浙江大学城市学院 A kind of cross-border product quality risk fuzzy prediction method based on comment on commodity public sentiment
JP2020129296A (en) * 2019-02-08 2020-08-27 富士通株式会社 Information processing device, arithmetic processing device, and control method for information processing device
TWI717096B (en) * 2019-04-17 2021-01-21 麥奇數位股份有限公司 Interactive quality analysis method of online interactive system and its server

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733748A (en) * 2018-04-04 2018-11-02 浙江大学城市学院 A kind of cross-border product quality risk fuzzy prediction method based on comment on commodity public sentiment
CN108733748B (en) * 2018-04-04 2022-01-14 浙江大学城市学院 Cross-border product quality risk fuzzy prediction method based on commodity comment public sentiment
JP2020129296A (en) * 2019-02-08 2020-08-27 富士通株式会社 Information processing device, arithmetic processing device, and control method for information processing device
JP7225876B2 (en) 2019-02-08 2023-02-21 富士通株式会社 Information processing device, arithmetic processing device, and control method for information processing device
US11756289B2 (en) 2019-02-08 2023-09-12 Fujitsu Limited Information processing apparatus, arithmetic processing device, and method of controlling information processing apparatus
TWI717096B (en) * 2019-04-17 2021-01-21 麥奇數位股份有限公司 Interactive quality analysis method of online interactive system and its server

Similar Documents

Publication Publication Date Title
Ittichaichareon et al. Speech recognition using MFCC
JP3277398B2 (en) Voiced sound discrimination method
US10706857B1 (en) Raw speech speaker-recognition
Singh et al. Vector quantization approach for speaker recognition using MFCC and inverted MFCC
KR950013552B1 (en) Voice signal processing device
JP2005140707A (en) Apparatus for extracting feature sound, feature sound extraction method, and product evaluation system
JP2009511954A (en) Neural network discriminator for separating audio sources from mono audio signals
JP4572218B2 (en) Music segment detection method, music segment detection device, music segment detection program, and recording medium
JP2004528599A (en) Audio Comparison Using Auditory Event-Based Characterization
WO2013124862A1 (en) Modified mel filter bank structure using spectral characteristics for sound analysis
CN114596879B (en) False voice detection method and device, electronic equipment and storage medium
KR101228821B1 (en) Method of generating a footprint for an audio signal
CN101042870B (en) Method and apparatus for estimating degree of similarity between voices
Ntalampiras et al. Automatic recognition of urban soundscenes
JP4760614B2 (en) Method for selecting learning data of signal identification device
CN113160852A (en) Voice emotion recognition method, device, equipment and storage medium
Hwang et al. Application of cepstrum and neural network to bearing fault detection
Van Truong et al. Unsupervised Detection of Anomalous Sound for Machine Condition Monitoring using Fully Connected U-Net.
Imran et al. An analysis of audio classification techniques using deep learning architectures
Fonseca et al. Discrete wavelet transform and support vector machine applied to pathological voice signals identification
Prabavathy et al. An enhanced musical instrument classification using deep convolutional neural network
JP2005141591A (en) Quality evaluation device and product evaluation system
Abualadas et al. Speaker identification based on hybrid feature extraction techniques
Ravindran et al. Audio classification and scene recognition and for hearing aids
KR100766170B1 (en) Music summarization apparatus and method using multi-level vector quantization

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070109