JP7253721B2 - Abnormal noise determination device, abnormal noise determination method, and abnormal noise determination system - Google Patents

Abnormal noise determination device, abnormal noise determination method, and abnormal noise determination system Download PDF

Info

Publication number
JP7253721B2
JP7253721B2 JP2019088442A JP2019088442A JP7253721B2 JP 7253721 B2 JP7253721 B2 JP 7253721B2 JP 2019088442 A JP2019088442 A JP 2019088442A JP 2019088442 A JP2019088442 A JP 2019088442A JP 7253721 B2 JP7253721 B2 JP 7253721B2
Authority
JP
Japan
Prior art keywords
sound
stationary
sound data
data
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019088442A
Other languages
Japanese (ja)
Other versions
JP2020183904A (en
Inventor
亮太 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2019088442A priority Critical patent/JP7253721B2/en
Priority to PCT/JP2020/014717 priority patent/WO2020226002A1/en
Publication of JP2020183904A publication Critical patent/JP2020183904A/en
Application granted granted Critical
Publication of JP7253721B2 publication Critical patent/JP7253721B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H17/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H3/00Measuring characteristics of vibrations by using a detector in a fluid
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Description

本開示は、対象機器から発せられた異音を判定する異音判定装置、異音判定方法および異音判定システムに関する。 The present disclosure relates to an abnormal noise determination device, an abnormal noise determination method, and an abnormal noise determination system that determine abnormal noise emitted from a target device.

建物内の設備機器あるいは工場の機器など、営業時間中に常時稼働している機器が異常の発生により停止した場合、生産ができなくなることによる生産効率の低下やもしくは害の発生など、甚大な被害が起きる場合がある。このような機器の異常を事前に発見するために、異常傾向を電流、振動、音などを検知可能なセンサを用いて監視することは有効であると考えられている。 If equipment that is always in operation during business hours, such as facility equipment in a building or equipment in a factory, stops due to an abnormality, production will not be possible, resulting in serious damage such as a decrease in production efficiency or the occurrence of harm. may occur. In order to detect such abnormalities in equipment in advance, it is considered effective to monitor abnormalities using sensors capable of detecting current, vibration, sound, and the like.

例えば特許文献1には、鉄塔もしくは送電線などの対象機器から発せられる異音を判定する異音判定装置が示される。通常、風切り音などによって発生する外乱音は、異音でない。この異音判定装置は、外乱音がある中で異音を効率良く判断するために、異音を含む複数の音データと異音を含まない複数の音データとの2種類のサンプルデータを用いて、異音の有無を判定する。 For example, Japanese Unexamined Patent Application Publication No. 2002-100000 discloses an abnormal noise determination device that determines abnormal noise emitted from a target device such as a steel tower or a power transmission line. Disturbance noise generated by wind noise and the like is not usually an abnormal noise. This abnormal noise determination device uses two types of sample data, a plurality of sound data including abnormal sounds and a plurality of sound data not including abnormal sounds, in order to efficiently determine abnormal sounds in the presence of disturbance sounds. to determine the presence or absence of abnormal noise.

特開2014-145645号公報JP 2014-145645 A

しかし、特許文献1の異音判定装置では、不定期に発生する、多様な音を含む外乱音が検査の対象機器から発せられた異音と類似した周波数スペクトルを有する場合に、検査の対象機器から発せられた音に異音が含まれるか否かの識別が困難となる。 However, in the abnormal noise determination apparatus of Patent Document 1, when disturbance noise including various sounds that occur irregularly has a frequency spectrum similar to the abnormal sound emitted from the device to be inspected, the device to be inspected It becomes difficult to identify whether or not the sound emitted from the device contains an abnormal sound.

また、異音の有無の識別のために、異音を含む複数の音データと異音を含まない複数の音データとをそれぞれサンプルデータとして収音する場合、多くの手間がかかる。また、異音の有無の識別精度を確保する上で、十分なサンプルデータの量は、検査の対象機器の種類あるいはその設置環境によって大きく変動するので、サンプルデータの的確な量の判断が困難である。 Further, in order to identify the presence or absence of abnormal sounds, it takes a lot of time and effort to collect a plurality of sound data containing abnormal sounds and a plurality of sound data not containing abnormal sounds as sample data. In addition, the amount of sample data that is sufficient to ensure the accuracy of identifying the presence or absence of abnormal noise varies greatly depending on the type of equipment to be inspected or its installation environment, so it is difficult to determine the appropriate amount of sample data. be.

本開示は、上述した従来の状況に鑑みて案出され、対象機器から収音される音に定常音だけでなく突発音などの外乱音が含まれる場合でも、収音された音に異音が含まれるか否かの識別精度を向上し、対象機器の異常の有無を適切に検知する異音判定装置、異音判定方法および異音判定システムを提供することを目的とする。 The present disclosure has been devised in view of the conventional situation described above. It is an object of the present invention to provide an abnormal noise determination device, an abnormal noise determination method, and an abnormal noise determination system that can improve the accuracy of identifying whether or not there is an abnormality and appropriately detect the presence or absence of an abnormality in a target device.

本開示は、対象機器から発せられる音を収音するマイクに接続される入力部と、前記対象機器から発せられる音の所定期間分の音データを記憶するメモリと、前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するプロセッサと、を備え、前記メモリは、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶し、前記プロセッサは、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに記憶された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、異音判定装置を提供する。 The present disclosure includes an input unit connected to a microphone that picks up sound emitted from a target device, a memory that stores sound data for a predetermined period of the sound emitted from the target device, and sound data for the predetermined period. and a processor that determines whether the sound corresponding to the sound data in the one frame period is a stationary sound or a sudden sound for each one frame period shorter than the predetermined period, and the memory is stored in the learning mode during the learning mode. Stores at least one stationary sound as a normal sound from among the one or more of the one-frame-period sound data determined to be the stationary sound, and the processor stores the stationary sound as a normal sound during an operation mode different from the learning mode. identifying whether or not the sound emitted from the target device includes an abnormal sound in accordance with a comparison between the determined sound data of the one frame period and the sound data of the normal sound stored in the memory; An abnormal noise determination device is provided.

また、本開示は、異常判定装置により実行される異音判定方法であって、対象機器から発せられる音を収音するマイクから、前記対象機器から発せられる音の所定期間分の音データを入力するステップと、入力された前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するステップと、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から正常音として記憶された少なくとも1つの定常音を取得するステップと、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと取得された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別するステップと、を有する、異音判定方法を提供する。 Further, the present disclosure is an abnormal noise determination method executed by an abnormality determination device, wherein sound data for a predetermined period of sound emitted from the target device is input from a microphone that picks up the sound emitted from the target device. and determining whether the sound corresponding to the sound data for the one-frame period is a stationary sound or a sudden sound for each one-frame period shorter than the predetermined period, using the input sound data for the predetermined period. a step of obtaining at least one stationary sound stored as a normal sound from among the one or more of the one-frame-period sound data determined to be the stationary sound during the learning mode; Whether or not abnormal sound is included in the sound emitted from the target device in accordance with a comparison between the sound data of the one-frame period determined to be the stationary sound and the sound data of the normal sound acquired during the operation mode. and identifying whether the noise is abnormal.

また、本開示は、対象機器から発せられる音を収音するマイクに接続される入力部と、前記対象機器から発せられる音の所定期間分の音データを記憶するメモリと、前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するプロセッサと、を備え、前記メモリは、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶し、前記プロセッサは、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに記憶された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、異音判定システムを提供する。 Further, the present disclosure includes an input unit connected to a microphone that collects sound emitted from a target device, a memory that stores sound data for a predetermined period of sound emitted from the target device, and a sound data for the predetermined period. a processor that uses sound data and determines, for each frame period shorter than the predetermined period, whether the sound corresponding to the sound data in the one frame period is a stationary sound or a sudden sound, wherein the memory is in a learning mode. store as a normal sound at least one stationary sound from among the sound data of one or more frame periods determined as the stationary sound during the operation mode, and the processor stores the stationary sound during the operation mode different from the learning mode. Identifying whether or not the sound emitted from the target device includes an abnormal sound in accordance with a comparison between the sound data of the one frame period determined to be a sound and the sound data of the normal sound stored in the memory. To provide an abnormal noise determination system.

本開示によれば、対象機器から収音される音に定常音だけでなく突発音などの外乱音が含まれる場合でも、収音された音に異音が含まれるか否かの識別精度を向上させ、対象機器の異常の有無を適切に検知することができる。 According to the present disclosure, even if the sound collected from the target device includes not only the stationary sound but also the disturbance sound such as a sudden sound, the accuracy of identifying whether or not the collected sound includes an abnormal sound is improved. It is possible to appropriately detect the presence or absence of an abnormality in the target device.

実施の形態1に係る異音判定システムの概略構成の一例を示す図1 is a diagram showing an example of a schematic configuration of an abnormal noise determination system according to Embodiment 1. FIG. 異音判定システムのハードウェア構成を示す図Diagram showing the hardware configuration of the abnormal noise determination system 音データの学習動作手順を示すフローチャートFlowchart showing sound data learning operation procedure ステップS4における定常音抽出手順を示すフローチャートFlowchart showing steady sound extraction procedure in step S4 ステップS5における最小定常検出手順を示すフローチャートFlowchart showing the minimum stationary detection procedure in step S5 学習モード時に収音された音の音圧レベルおよび周波数分布の時間変化を表す特性図Characteristic diagram showing temporal changes in sound pressure level and frequency distribution of sound picked up in learning mode 音データの運用動作手順を示すフローチャートFlowchart showing operation procedure of sound data ステップS16における正常異常識別手順を示すフローチャートFlowchart showing normal/abnormal identification procedure in step S16 運用モード時に収音された正常状態および異常状態のそれぞれにおける音の音圧レベルと周波数分布との時間変化をそれぞれ表す特性図Characteristic diagrams showing temporal changes in the sound pressure level and frequency distribution of sound in normal and abnormal states picked up in operation mode. 実施の形態2に係る異音判定システムの概略構成の一例を示す図A diagram showing an example of a schematic configuration of an abnormal noise determination system according to a second embodiment. 異音判定システムのハードウェア構成を示す図Diagram showing the hardware configuration of the abnormal noise determination system 音データの学習動作手順を示すフローチャートFlowchart showing sound data learning operation procedure 音データの運用動作手順を示すフローチャートFlowchart showing operation procedure of sound data ステップS65における正常異常識別手順を示すフローチャートFlowchart showing normal/abnormal identification procedure in step S65

以下、適宜図面を参照しながら、本開示に係る異音判定装置、異音判定方法および異音判定システムを具体的に開示した実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。 Hereinafter, embodiments specifically disclosing an abnormal noise determination device, an abnormal noise determination method, and an abnormal noise determination system according to the present disclosure will be described in detail with reference to the drawings as appropriate. However, more detailed description than necessary may be omitted. For example, detailed descriptions of well-known matters and redundant descriptions of substantially the same configurations may be omitted. This is to avoid unnecessary verbosity in the following description and to facilitate understanding by those skilled in the art. It should be noted that the accompanying drawings and the following description are provided for a thorough understanding of the present disclosure by those skilled in the art and are not intended to limit the claimed subject matter.

(実施の形態1)
図1は、実施の形態1に係る異音判定システム5の概略構成の一例を示す図である。異音判定システム5は、マイク10と、AD変換器20と、情報処理装置30とを含む構成である。マイク10は、監視などの目的のために定常的に行われる検査の対象機器100から発せられる音を収音する。検査の対象機器として、例えば企業もしくはデータセンタなどに設置されたサーバ、工場などに設置されたコンプレッサ、モータなどが挙げられる。検査の対象機器100から異音が頻繁に発せられる場合、情報処理装置30は、対象機器100が異常状態にあると判断する。
(Embodiment 1)
FIG. 1 is a diagram showing an example of a schematic configuration of an abnormal noise determination system 5 according to Embodiment 1. As shown in FIG. The abnormal sound determination system 5 includes a microphone 10 , an AD converter 20 and an information processing device 30 . The microphone 10 picks up sound emitted from the device 100 to be inspected regularly for purposes such as monitoring. Devices to be inspected include, for example, servers installed in companies or data centers, and compressors and motors installed in factories. When abnormal noise is frequently emitted from the target device 100 to be inspected, the information processing device 30 determines that the target device 100 is in an abnormal state.

マイク10は、検査の対象機器100が設置された、例えば機械室に設置される。マイク10は、対象機器100に受音面を向けて対象機器100が発する音を収音し、入力した音波を電気信号に変換して音信号として出力する。マイク10は、1つであってもよいし、複数であってもよい。例えばマイクは、高音質小型エレクトレットコンデンサーマイクロホン(ECM:Electret Condenser Microphone)の単体や、複数のECMで構成されるマイクアレイでもよい。 The microphone 10 is installed, for example, in a machine room where the device 100 to be inspected is installed. The microphone 10 has its sound receiving surface facing the target device 100, picks up the sound emitted by the target device 100, converts the input sound wave into an electric signal, and outputs the electric signal as a sound signal. The number of microphones 10 may be one or plural. For example, the microphone may be a single high-quality electret condenser microphone (ECM) or a microphone array composed of a plurality of ECMs.

AD変換器20は、マイク10と同じ機械室に設置される。AD変換器20は、1つもしくは複数のマイク10で収音された音を入力し、アナログ形式の音信号を同時にあるいは時分割でアナログデジタル変換し、デジタル形式の音データを出力する。AD変換器20は、所定の量子化ビットおよびサンプリング周波数でアナログ信号をデジタル信号に変換する。AD変換器20の数は、マイク10の数と同数であってもよいし、マイク10の数よりも少なくてもよい。 The AD converter 20 is installed in the same machine room as the microphone 10 . The AD converter 20 receives sounds picked up by one or a plurality of microphones 10, analog-to-digital converts analog sound signals simultaneously or in a time-division manner, and outputs digital sound data. The AD converter 20 converts an analog signal into a digital signal with a predetermined quantization bit and sampling frequency. The number of AD converters 20 may be the same as the number of microphones 10 or may be less than the number of microphones 10 .

情報処理装置30は、検査の対象機器100の状態を定常的に監視する監視装置である。情報処理装置30は、例えばPC(Personal Computer)もしくはタブレット端末で構成される。情報処理装置30は、対象機器が設置された機械室と異なる監視室に設置される。 The information processing device 30 is a monitoring device that constantly monitors the state of the inspection target device 100 . The information processing device 30 is configured by, for example, a PC (Personal Computer) or a tablet terminal. The information processing device 30 is installed in a monitoring room different from the machine room in which the target device is installed.

情報処理装置30は、機械室とは別室である監視室に配置される。なお、マイク10、AD変換器20および情報処理装置30のいずれも、同じ室内である機械室あるいは監視室に配置されてもよい。 The information processing device 30 is placed in a monitoring room that is separate from the machine room. All of the microphone 10, the AD converter 20 and the information processing device 30 may be arranged in the same machine room or monitoring room.

図2は、異音判定システム5のハードウェア構成を示す図である。情報処理装置30は、AD変換器20と接続され、AD変換器20から出力されるデジタル形式の音データを入力する。情報処理装置30は、入力した音データを基に、検査の対象機器100が発する音に異音が含まれているか否かを判定する(異音判定処理)。 FIG. 2 is a diagram showing the hardware configuration of the abnormal noise determination system 5. As shown in FIG. The information processing device 30 is connected to the AD converter 20 and receives digital sound data output from the AD converter 20 . Based on the input sound data, the information processing apparatus 30 determines whether or not the sound emitted by the inspection target device 100 includes an abnormal sound (abnormal sound determination processing).

この異音判定処理において、情報処理装置30は、予めディープラーニングなどの機械学習を行って学習済みモデルを生成しておく。なお、情報処理装置30は、別のコンピュータが生成した学習済みモデルを複製して使用してもよい。ここでは、学習済みモデルは、所定時間分の音データの中からフレーム単位で定常音を抽出する定常音抽出処理(図4参照)を実行するプログラムとして生成される。また、学習済みモデルは、対象機器から発せられる音に異音が含まれるか否かを判定する正常異常識別処理(図8参照)を実行するプロクラムとして生成される。情報処理装置30は、生成した学習済みモデルを用いて、定常音抽出処理および正常異常識別処理を行う。なお、情報処理装置30は、機械学習による学習済みモデルを用いることなく、相互相関関数を用いて定常音抽出処理および正常異常識別処理を行ってもよい。また、情報処理装置30は、1つのコンピュータなどの装置によって処理を実行する構成であってもよいし、複数のコンピュータなどの装置によって処理を実行する構成であってもよく、物理的な装置構成に限定されない。 In this abnormal sound determination process, the information processing device 30 performs machine learning such as deep learning in advance to generate a learned model. Note that the information processing apparatus 30 may copy and use a trained model generated by another computer. Here, the trained model is generated as a program for executing a steady sound extraction process (see FIG. 4) for extracting a steady sound frame by frame from sound data for a predetermined time. Also, the learned model is generated as a program for executing the normal/abnormal identification process (see FIG. 8) for determining whether or not the sound emitted from the target device includes an abnormal sound. The information processing device 30 uses the generated trained model to perform steady sound extraction processing and normal/abnormal identification processing. Note that the information processing device 30 may perform the steady sound extraction process and the normal/abnormal identification process using a cross-correlation function without using a machine-learned model. Further, the information processing device 30 may be configured to execute processing by a device such as one computer, or may be configured to execute processing by devices such as a plurality of computers. is not limited to

情報処理装置30は、プロセッサ301と、メモリ302と、ストレージ303と、通信部304と、操作部305と、ディスプレイ306と、入力部307とを有する。 Information processing apparatus 30 includes processor 301 , memory 302 , storage 303 , communication section 304 , operation section 305 , display 306 , and input section 307 .

プロセッサ301は、例えばCPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)などの各種処理デバイスを用いて構成され、音データに関する処理を統括的に実行する。 The processor 301 is configured using various processing devices such as a CPU (Central Processing Unit), a DSP (Digital Signal Processor), and an FPGA (Field Programmable Gate Array), and comprehensively executes processing related to sound data.

メモリ302は、RAM(Random Access Memory)などのメモリデバイスを有し、プロセッサ301のワーキングメモリとして使用され、データ処理時の演算などにおいて一時記憶に利用する。また、メモリ302は、ROM(Read Only Memory)などのメモリデバイスを有し、プロセッサ301の処理を実行するための各種実行プログラム、機械学習などの処理に関する各種設定データを記憶する。 The memory 302 has a memory device such as a RAM (Random Access Memory), is used as a working memory of the processor 301, and is used for temporary storage in calculations during data processing. The memory 302 has a memory device such as a ROM (Read Only Memory), and stores various execution programs for executing the processing of the processor 301 and various setting data related to processing such as machine learning.

ストレージ303は、例えばHDD(Hard Disk Drive)、SSD(Solid State Drive)、光ディスクドライブなどの各種ストレージデバイスを用いて構成され、対象の音データ、機械学習により生成した学習モデルなどのデータを格納する。 The storage 303 is configured using various storage devices such as HDD (Hard Disk Drive), SSD (Solid State Drive), and optical disk drive, and stores data such as target sound data and learning models generated by machine learning. .

通信部304は、有線または無線の通信を行うインタフェースである。 A communication unit 304 is an interface that performs wired or wireless communication.

操作部305は、ユーザの操作を受付けるものであり、マウス、キーボード、タッチパッド、タッチパネル、マイクロホン、又はその他の入力デバイスを含んでよい。 The operation unit 305 receives user operations, and may include a mouse, keyboard, touch pad, touch panel, microphone, or other input device.

ディスプレイ306は、異音が含まれる旨の判定の結果、プロセッサ301により生成される異音検知通知を表示する。ディスプレイ306は、液晶表示デバイス、有機ELデバイス、又はその他の表示デバイスを含んでよい。なお、ディスプレイは、情報処理装置30によって制御可能な遠隔の監視モニタであってもよい。また、操作部305およびディスプレイ306は、一体化されたタッチパネルであってもよい。 The display 306 displays an abnormal sound detection notification generated by the processor 301 as a result of the determination that the abnormal sound is included. Display 306 may include a liquid crystal display device, organic EL device, or other display device. Note that the display may be a remote monitoring monitor that can be controlled by the information processing device 30 . Also, the operation unit 305 and the display 306 may be an integrated touch panel.

入力部307は、マイク10によって収音され、AD変換器20から出力されるデジタル形式の音データを入力する。 The input unit 307 inputs digital sound data picked up by the microphone 10 and output from the AD converter 20 .

次に、実施の形態1に係る異音判定システム5の動作を示す。 Next, the operation of the abnormal noise determination system 5 according to Embodiment 1 will be described.

異音判定システム5は、学習モードおよび運用モードで動作し、異音判定処理を行う。学習モードとは、対象機器から発せられる音に含まれる定常音のうち最小の定常音を学習して検出し、その検出結果を学習結果として情報処理装置30内に記憶する動作モードである。一方、運用モードとは、学習モード以外の実際の運用環境において、学習モードで記憶された学習結果を用いて、対象機器から発せられる音に異音が含まれるか否かを判定する動作モードである。 The abnormal noise determination system 5 operates in a learning mode and an operation mode to perform abnormal noise determination processing. The learning mode is an operation mode in which the smallest stationary sound among the stationary sounds contained in the sound emitted from the target device is learned and detected, and the detection result is stored in the information processing device 30 as the learning result. On the other hand, the operation mode is an operation mode in which, in an actual operating environment other than the learning mode, it is determined whether or not the sound emitted from the target device contains abnormal sounds using the learning results stored in the learning mode. be.

(学習モード)
プロセッサ301は、学習モード時、マイク10で収音された音に含まれる複数の定常音を抽出し、抽出した複数の定常音のうち、最小定常音の音データをストレージ303に記憶する。複数の定常音は、検査の対象機器100が正常状態である時に発する音を含む。学習は、検査の対象機器100が設置された初期状態において1回だけ行われてもよいし、メンテナンスなどにおいて定期的に行われてもよい。
(learning mode)
In the learning mode, the processor 301 extracts a plurality of stationary sounds included in the sounds picked up by the microphone 10 and stores sound data of the minimum stationary sound among the plurality of extracted stationary sounds in the storage 303 . The plurality of steady sounds include sounds emitted when the device 100 to be tested is in a normal state. The learning may be performed only once in the initial state in which the target device 100 to be inspected is installed, or may be performed periodically during maintenance or the like.

図3は、音データの学習動作手順を示すフローチャートである。マイク10は、検査の対象機器100から発せられる音を主に収音する。プロセッサ301は、マイク10で収音され、AD変換器20によってアナログデジタル変換された音データを入力する(S1)。プロセッサ301は、入力した音データをストレージ303に蓄積する。プロセッサ301は、所定時間が経過し、マイク10による録音が終了したか否かを判別する(S2)。マイク10による録音は、所定時間行われる。所定時間は、30分、1時間、1日などの任意の一定時間である。また、所定時間は、一定時間でなく、ユーザ(管理者を含む)が手動で停止するまでの時間であってもよい。また、所定時間は、運用モード時の録音時間(一定時間)に揃えることが、異音判定処理を行う上で好ましい。 FIG. 3 is a flow chart showing a learning operation procedure for sound data. The microphone 10 mainly picks up sounds emitted from the device 100 to be tested. The processor 301 inputs sound data picked up by the microphone 10 and analog-to-digital converted by the AD converter 20 (S1). The processor 301 accumulates the input sound data in the storage 303 . The processor 301 determines whether or not a predetermined period of time has elapsed and recording by the microphone 10 has ended (S2). Recording by the microphone 10 is performed for a predetermined time. The predetermined time is any fixed time such as 30 minutes, 1 hour, or 1 day. Also, the predetermined time may be the time until the user (including the administrator) manually stops, instead of the fixed time. Further, it is preferable to set the predetermined time to the recording time (fixed time) in the operation mode in order to perform the abnormal sound determination process.

ステップS2で録音が終了していない場合、プロセッサ301の処理は、ステップS1に戻る。一方、ステップS2で録音が終了した場合、プロセッサ301は、ストレージ303に蓄積された時系列の音データに対し、周波数解析を行う(S3)。この周波数解析は、例えばFFT(Fast Fourier Transform)で100ms単位の音データに対して行われる。プロセッサ301は、周波数解析の結果を基に、音データに含まれる定常音をフレーム単位に抽出する定常音抽出処理を行う(S4)。フレーム(1フレーム)は、例えば音データが定常音であるか突発音であるかを判定するための音の長さである。1フレームの長さは、検査の対象機器の種類などによって異なり、例えば10ms~500msの範囲で任意に設定される。また、1フレームは、突発音の時間幅(例えばパルス的な突発音の場合にパルス幅)より広く設定される。この定常音を抽出する処理は、機械学習による学習済みモデルを用いて行われる。なお、この処理は、相互相関関数を用いて行われてもよい。 If the recording is not finished in step S2, the process of processor 301 returns to step S1. On the other hand, when recording ends in step S2, the processor 301 performs frequency analysis on the time-series sound data accumulated in the storage 303 (S3). This frequency analysis is performed, for example, by FFT (Fast Fourier Transform) on sound data in units of 100 ms. Based on the result of frequency analysis, the processor 301 performs stationary sound extraction processing for extracting stationary sounds contained in the sound data on a frame-by-frame basis (S4). A frame (one frame) is, for example, a sound length for determining whether sound data is a stationary sound or a sudden sound. The length of one frame varies depending on the type of equipment to be inspected, and is arbitrarily set within a range of 10 ms to 500 ms, for example. Also, one frame is set wider than the time width of the sudden sound (for example, the pulse width in the case of a pulse-like sudden sound). The process of extracting this stationary sound is performed using a machine-learned model. Note that this process may be performed using a cross-correlation function.

プロセッサ301は、抽出した1つ以上の定常音の音データをストレージ303に蓄積する。プロセッサ301は、1つ以上の定常音の中から、音のスペクトルパワーが最小である定常音(以下、最小定常音という)を検出する最小定常音検出処理を行う(S5)。プロセッサ301は、この最小定常音を、検査の対象機器100が正常状態である時の定常音(正常音)であるとしてストレージ303に記憶する(S6)。なお、プロセッサ301は、通信部304を介して接続される外部のストレージに最小定常音の音データを記憶してもよい。この後、プロセッサ301は、学習モード時の動作を終了する。 The processor 301 accumulates the sound data of one or more extracted stationary sounds in the storage 303 . The processor 301 performs minimum stationary sound detection processing for detecting a stationary sound having the lowest spectral power (hereinafter referred to as minimum stationary sound) from one or more stationary sounds (S5). The processor 301 stores this minimum steady sound in the storage 303 as a steady sound (normal sound) when the device 100 to be inspected is in a normal state (S6). Note that the processor 301 may store sound data of the minimum stationary sound in an external storage connected via the communication unit 304 . After this, the processor 301 terminates the operation in the learning mode.

図4は、ステップS4における定常音抽出手順を示すフローチャートである。プロセッサ301は、ストレージ303に蓄積された音データのうち、一定時間分の音データを読み出す。一定時間は、例えば10秒、30分、所定フレーム分(20フレームや50フレーム)の時間であってもよい。プロセッサ301は、一定時間分の音データのスペクトルパワーを積算し、この積算値を1フレーム期間で除することで、1フレーム当たりの平均スペクトルパワーを算出する(S21)。 FIG. 4 is a flow chart showing the steady sound extraction procedure in step S4. The processor 301 reads sound data for a certain period of time from the sound data accumulated in the storage 303 . The fixed time may be, for example, 10 seconds, 30 minutes, or a time corresponding to a predetermined number of frames (20 frames or 50 frames). The processor 301 accumulates the spectral power of sound data for a certain period of time, and divides this accumulated value by one frame period to calculate the average spectral power per frame (S21).

プロセッサ301は、一定時間分の音データの中で、1フレーム期間の音データのスペクトルパワーが平均スペクトルパワーを上回っているか否かを順に判別する(S22)。1フレーム期間の音データのスペクトルパワーは、フレーム単位で各周波数の音響パワーを算出して平均化したものである。1フレーム期間の音データのスペクトルパワーが平均スペクトルパワー以下である場合、プロセッサ301は、1フレーム期間の音データが定常音であると判定する(S23)。 The processor 301 sequentially determines whether or not the spectral power of the sound data for one frame period exceeds the average spectral power among the sound data for a certain period of time (S22). The spectral power of sound data in one frame period is obtained by calculating and averaging the acoustic power of each frequency for each frame. If the spectral power of the sound data for one frame period is less than or equal to the average spectral power, the processor 301 determines that the sound data for one frame period is stationary sound (S23).

プロセッサ301は、定常音であると判定された1フレームの音データが、ストレージ303に既に記憶された定常音の音データと類似する周波数特性を有するか否かを判別する(S24)。この音データの類似性の判断は、機械学習による学習済みモデルを用いて行われる。なお、この類似性の判断は、相互相関関数を用いて行われてもよい。 The processor 301 determines whether or not the one-frame sound data determined to be stationary sound has frequency characteristics similar to the stationary sound data already stored in the storage 303 (S24). Judgment of the similarity of the sound data is performed using a trained model by machine learning. Note that this similarity determination may be made using a cross-correlation function.

1フレームの音データが、ストレージ303に記憶された定常音の音データと類似すると判別された場合、プロセッサ301は、ステップS26の処理に進む。一方、ステップS24で1フレームの音データが、ストレージ303に記憶された定常音の音データと類似しないと判別された場合、プロセッサ301は、この1フレームの音データを新規の定常音であるとしてストレージ303に記憶する(S25)。 If it is determined that one frame of sound data is similar to the sound data of the stationary sound stored in the storage 303, the processor 301 proceeds to the process of step S26. On the other hand, if it is determined in step S24 that one frame of sound data is not similar to the sound data of the stationary sound stored in the storage 303, the processor 301 regards this one frame of sound data as a new stationary sound. Store in the storage 303 (S25).

ステップS24,S25の処理後、プロセッサ301は、一定時間分のフレーム単位の音データを全て処理したか否かを判別する(S27)。例えば、1フレーム期間が0.5秒(500ms)、一定時間が30分である場合、プロセッサ301は、3600(=60/0.5×30)分のフレームの音データに対し、定常音の抽出処理を行うことになる。一定時間分のフレーム単位の音データを全て処理していない場合、プロセッサ301の処理は、ステップS22に戻る。一方、ステップS27で一定時間分のフレーム単位の音データを全て処理した場合、プロセッサ301は、本定常音抽出処理を終了し、メインの処理に復帰する。 After the processing of steps S24 and S25, the processor 301 determines whether or not all sound data in units of frames for a certain period of time have been processed (S27). For example, if one frame period is 0.5 seconds (500 ms) and the fixed time is 30 minutes, the processor 301 generates a stationary sound for 3600 (=60/0.5×30) frames of sound data. Extraction processing will be performed. If all the frame-by-frame sound data for the predetermined period of time have not been processed, the process of the processor 301 returns to step S22. On the other hand, when all the frame-by-frame sound data for the predetermined period of time have been processed in step S27, the processor 301 terminates the steady sound extraction process and returns to the main process.

また、ステップS22で1フレーム期間の音データのスペクトルパワーが平均スペクトルパワーを上回っている場合、プロセッサ301は、この1フレームの音データが突発音であると判定する(S26)。プロセッサ301の処理は、ステップS27に進む。 If the spectral power of the sound data for one frame period exceeds the average spectral power in step S22, the processor 301 determines that this one frame of sound data is a sudden sound (S26). Processing of the processor 301 proceeds to step S27.

なお、1フレームの音データが突発音を含んでいても、1つの突発音のパワーが小さく、ステップS22でスペクトルパワーが平均スペクトルパワー以下である場合、プロセッサ301は、定常音であると判定する。一方、1つの突発音のパワーが小さくても、1フレームの音データが多くの突発音を含み、スペクトルパワーが平均スペクトルパワーを上回っている場合、プロセッサ301は、突発音であると判定する。 Even if one frame of sound data includes a sudden sound, if the power of one sudden sound is small and the spectral power is equal to or less than the average spectral power in step S22, the processor 301 determines that the sound is a stationary sound. . On the other hand, even if the power of one sudden sound is small, if the sound data of one frame contains many sudden sounds and the spectral power exceeds the average spectral power, the processor 301 determines that it is a sudden sound.

図5は、ステップS5における最小定常音検出手順を示すフローチャートである。プロセッサ301は、ストレージ303に蓄積された、一定時間分の定常音の音データを読み出す。プロセッサ301は、1以上の定常音のスペクトルパワーを相互に比較する(S31)。プロセッサ301は、比較の結果、最もスペクトルパワーが最小である定常音を最小定常音としてストレージ303に記憶する(S32)。この後、プロセッサ301は、本処理を終了し、メインの処理に復帰する。 FIG. 5 is a flow chart showing the minimum stationary sound detection procedure in step S5. The processor 301 reads sound data of stationary sound for a certain period of time accumulated in the storage 303 . The processor 301 mutually compares the spectral powers of one or more stationary sounds (S31). As a result of the comparison, the processor 301 stores the stationary sound with the lowest spectral power in the storage 303 as the minimum stationary sound (S32). After that, the processor 301 ends this process and returns to the main process.

このように、プロセッサ301は、1つ以上の定常音のスペクトルパワーを相互に比較し、1以上の定常音の中から最小定常音を選択することで、外乱音を含む定常音を選択しないようにする。したがって、プロセッサ301は、運用モード時において正常異常識別処理における比較の対象から外乱音を含む定常音を排除できる。 In this way, the processor 301 compares the spectral powers of one or more stationary sounds and selects the minimum stationary sound from among the one or more stationary sounds so as not to select stationary sounds containing disturbance sounds. to Therefore, the processor 301 can exclude stationary sounds including disturbance sounds from comparison targets in the normal/abnormal identification process in the operation mode.

図6は、学習モード時に収音された音の音圧レベルおよび周波数分布の時間変化を表す特性図である。特性図gh1は音圧レベルの時間変化を表す。特性図gh2は周波数分布の時間変化を表す。特性図gh1,gh2の横軸は時間を表す。特性図gh1の縦軸は、音圧レベルを表す。特性図gh2の縦軸は周波数を表す。また、特性図gh2は、音圧レベルを色の変化で表わす。ここでは、音圧レベルが高い領域は黄色(図中、濃いドット)で表される。音圧レベルが中間の領域は赤色(図中、中間ドット)で表される。音圧レベルが低い領域は赤紫色(図中、淡いドット)で表される。 FIG. 6 is a characteristic diagram showing temporal changes in sound pressure level and frequency distribution of sound picked up in the learning mode. A characteristic diagram gh1 represents the time change of the sound pressure level. A characteristic diagram gh2 represents the time change of the frequency distribution. The horizontal axes of the characteristic diagrams gh1 and gh2 represent time. The vertical axis of the characteristic diagram gh1 represents the sound pressure level. The vertical axis of the characteristic diagram gh2 represents frequency. Also, the characteristic diagram gh2 expresses the sound pressure level by color changes. Here, regions with high sound pressure levels are represented in yellow (dark dots in the figure). A region with an intermediate sound pressure level is represented in red (intermediate dots in the figure). A region with a low sound pressure level is indicated by magenta (light dots in the figure).

学習モード時、音データは、一定時間(例えば30分)収音され、ストレージ303に蓄積される。特性図gh1,gh2は、30分のうち、10秒分の音データを示す。ここで、音データの状態を判定する区間を1フレームとし、1フレームを0.5秒(500msec)に設定する場合を想定する。なお、1フレームは、例えば10ms~500msの中で任意に設定可能である。1フレームが500msecである場合、10秒分の音データは、20フレーム分の音データで表される。 In the learning mode, sound data is collected for a certain period of time (for example, 30 minutes) and accumulated in the storage 303 . Characteristic diagrams gh1 and gh2 show sound data for 10 seconds in 30 minutes. Here, it is assumed that the interval for judging the state of sound data is one frame, and one frame is set to 0.5 seconds (500 msec). One frame can be arbitrarily set, for example, from 10 ms to 500 ms. If one frame is 500 msec, 10 seconds of sound data is represented by 20 frames of sound data.

第1フレームF1(0~500ms)では、音圧レベルが低い定常的な音データが継続している。したがって、第1フレームF1は、音のスペクトルパワーが極めて小さい定常音の区間である。第2フレームF2(500~1000ms)は、第1フレームF1(0~500ms)と同じ状況である。 In the first frame F1 (0 to 500 ms), stationary sound data with a low sound pressure level continues. Therefore, the first frame F1 is a section of stationary sound in which the spectral power of the sound is extremely small. The second frame F2 (500-1000 ms) is in the same situation as the first frame F1 (0-500 ms).

第3フレームF3(1000~1500ms)では、1000mを僅かに経過して時点で音圧レベルが高い突発音が発生している。したがって、第3フレームF3は、音のスペクトルパワーが大きい突発音の区間である。第4フレームF4(1500~2000ms)は、第1フレームF1(0~500ms)と同じ状況である。 In the third frame F3 (1000 to 1500 ms), a sudden sound with a high sound pressure level is generated just after 1000 m. Therefore, the third frame F3 is a section of a sudden sound in which the spectral power of the sound is large. The fourth frame F4 (1500-2000 ms) is in the same situation as the first frame F1 (0-500 ms).

第5フレームF5(2000~2500ms)では、音圧レベルが少し高い連続的な音データが発生している。このような連続的な音データとして、例えばモータ音が挙げられる。第5フレームF5は、連続的な音データによる音のスペクトルパワーはそれほど大きくなく、スペクトルパワーが少し大きな定常音の区間である。第6フレームF6(2500~3000ms)では、第5フレームF5に引き続き、音圧レベルが少し高い連続的な音データが発生している状態において、さらに、2500mを僅かに経過して時点で音圧レベルが高い突発音が発生している。したがって、第6フレームF6は、音のスペクトルパワーが大きい突発音の区間である。第7フレームF7(3000~3500ms)および第8フレームF8(3500~4000ms)は、第5フレームF5(2000~2500ms)と同じ状況である。 In the fifth frame F5 (2000 to 2500 ms), continuous sound data with a slightly higher sound pressure level is generated. Such continuous sound data includes, for example, motor sound. The fifth frame F5 is a section of stationary sound in which the spectral power of the continuous sound data is not so high and the spectral power is slightly high. In the sixth frame F6 (2500 to 3000 ms), following the fifth frame F5, continuous sound data with a slightly higher sound pressure level is generated. A high-level sudden sound is occurring. Therefore, the sixth frame F6 is a section of a sudden sound in which the spectral power of the sound is large. The seventh frame F7 (3000-3500 ms) and the eighth frame F8 (3500-4000 ms) are in the same situation as the fifth frame F5 (2000-2500 ms).

第9フレームF9(4000~4500ms)では、音圧レベルが少し高い連続的な音データが無くなり、第1フレームF1(0~500ms)と同様、音圧レベルが低い定常的な音データが継続している。したがって、第9フレームF9は、音のスペクトルパワーが極めて小さい定常音の区間である。第10フレームF10(4500~5000ms)は、第9フレームF9と同じ状況である。 In the ninth frame F9 (4000 to 4500 ms), there is no continuous sound data with a slightly high sound pressure level, and steady sound data with a low sound pressure level continues as in the first frame F1 (0 to 500 ms). ing. Therefore, the ninth frame F9 is a section of stationary sound in which the spectral power of the sound is extremely small. The tenth frame F10 (4500-5000 ms) is in the same situation as the ninth frame F9.

第11フレームF11(5000~5500ms)では、音圧レベルが極めて高い突発音が頻繁に発生している。したがって、第11フレームF11は、音のスペクトルパワーが極めて大きい突発音の区間である。第12フレームF12(5500~6000ms)では、音圧レベルがやや高い突発音が発生している。第12フレームF12は、音のスペクトルパワーが平均スペクトルパワーを超えて突発音の区間と判定される。平均スペクトルパワーは、例えば一定時間(30分)あるいは20フレーム分(10秒)内に算出される音のスペクトルパワーの平均値である。 In the eleventh frame F11 (5000 to 5500 ms), sudden sounds with extremely high sound pressure levels occur frequently. Therefore, the 11th frame F11 is a section of a sudden sound in which the spectral power of the sound is extremely large. In the twelfth frame F12 (5500 to 6000 ms), a sudden sound with a slightly high sound pressure level is generated. The twelfth frame F12 is determined to be a sudden sound section in which the spectral power of the sound exceeds the average spectral power. The average spectral power is, for example, an average value of spectral powers of sounds calculated within a certain period of time (30 minutes) or 20 frames (10 seconds).

第13フレームF13(6000~6500ms)および第14フレームF14(6500~7000ms)は、第9フレームF9と同じ状況である。 The 13th frame F13 (6000-6500 ms) and the 14th frame F14 (6500-7000 ms) are in the same situation as the 9th frame F9.

第15フレームF15(7000~7500ms)および第16フレームF16(7500~8000ms)は、音圧レベルが高い連続的な音データが発生している。第5フレームF5は、連続的な音データによる音のスペクトルパワーは大きく、スペクトルパワーが平均スペクトルパワーを超える大きな非定常音の区間である。 The 15th frame F15 (7000 to 7500 ms) and the 16th frame F16 (7500 to 8000 ms) generate continuous sound data with high sound pressure levels. The fifth frame F5 is a section of a large non-stationary sound in which the spectral power of continuous sound data is large and the spectral power exceeds the average spectral power.

第17フレーム(8000~8500ms)~第20フレーム(9500~10000ms)は、第14フレームF14と同じ状況である。 The 17th frame (8000 to 8500 ms) to the 20th frame (9500 to 10000 ms) are in the same situation as the 14th frame F14.

このように、各フレームにおいて、音のスペクトルパワーが平均スペクトルパワーを超えていない場合、連続的に少し高い音が発生しても、音データは、定常音であると判定される。一方、各フレームにおいて、音のスペクトルパワーが平均パワーを超えている場合、音データは、突発音であると判定される。プロセッサ301は、定常音であると判定された、複数の音データを全てストレージ303に蓄積し、正常状態の音データを取得する際に用いる。 As described above, when the spectral power of sound does not exceed the average spectral power in each frame, the sound data is determined to be a stationary sound even if a slightly high-pitched sound is continuously generated. On the other hand, if the spectral power of the sound exceeds the average power in each frame, the sound data is determined to be a sudden sound. The processor 301 accumulates in the storage 303 all of the plurality of sound data determined to be stationary sounds, and is used when acquiring sound data in a normal state.

(運用モード)
運用モード時、プロセッサ301は、一定時間(例えば、30分、1日)ごとに、学習モード時と同様の処理で最小定常音を検出する。プロセッサ301は、現時点の最小定常音と、ストレージ303に記憶された、検査の対象機器100が正常状態である時の最小定常音とを比較する。プロセッサ301は、この比較結果を基に、対象機器100の正常状態/異常状態を判定する。
(operation mode)
In the operational mode, the processor 301 detects the minimum stationary sound at regular time intervals (for example, 30 minutes, 1 day) in the same manner as in the learning mode. The processor 301 compares the current minimum stationary sound with the minimum stationary sound stored in the storage 303 when the inspection target device 100 is in a normal state. The processor 301 determines the normal state/abnormal state of the target device 100 based on this comparison result.

図7は、音データの運用動作手順を示すフローチャートである。運用動作は、定期あるいは不定期に行われる。運用モード時、マイク10は、検査の対象機器100から発せられる音を収音する。プロセッサ301は、マイク10で収音され、AD変換器20によってアナログデジタル変換された音データを入力する(S11)。プロセッサ301は、入力した音データをストレージ303に蓄積する。 FIG. 7 is a flow chart showing a procedure for operating sound data. Operational operations are performed regularly or irregularly. In the operation mode, the microphone 10 picks up sounds emitted from the device 100 to be tested. The processor 301 inputs sound data picked up by the microphone 10 and analog-to-digital converted by the AD converter 20 (S11). The processor 301 accumulates the input sound data in the storage 303 .

プロセッサ301は、マイク10による収音を開始してから一定時間が経過したか否かを判別する(S12)。一定時間は、定常音の抽出精度を上げるため長めの時間に設定され、例えば30分、1時間、1日などの任意の一定時間である。また、一定時間は、学習モード時の所定時間に揃えることが、異音判定処理を行う上で好ましい。一定時間が経過していない場合、プロセッサ301は、ステップS11の処理に戻る。なお、ここでは、プロセッサ301が自動(例えばタイマ開始)で運用動作を開始する場合を示したが、ユーザが任意の時期に手動で運用動作の開始を指示してもよい。ユーザ(管理者を含む)が運用開始を指示すると、プロセッサ301が操作部305を介してこの指示を受け付けてもよい。 The processor 301 determines whether or not a certain period of time has passed since the sound pickup by the microphone 10 was started (S12). The certain period of time is set to a longer period of time in order to increase the accuracy of extracting stationary sounds, and is an arbitrary certain period of time such as 30 minutes, one hour, or one day. Further, it is preferable that the predetermined period of time is equal to the predetermined period of time in the learning mode in order to perform the abnormal noise determination process. If the fixed time has not passed, the processor 301 returns to the process of step S11. Although a case where the processor 301 automatically starts the operation (for example, by starting a timer) is shown here, the user may manually instruct the start of the operation at any time. When a user (including an administrator) gives an instruction to start operation, the processor 301 may accept this instruction via the operation unit 305 .

ステップS12で一定時間が経過した場合、プロセッサ301は、ストレージ303に蓄積された時系列の音データに対し、周波数解析を行う(S13)。この周波数解析は、学習モード時と同様である。 When the predetermined time has passed in step S12, the processor 301 performs frequency analysis on the time-series sound data accumulated in the storage 303 (S13). This frequency analysis is the same as in the learning mode.

プロセッサ301は、周波数解析の結果を基に、音データに含まれる、フレーム単位に定常音を抽出する定常音抽出処理を行う(S14)。この定常音抽出処理は、学習モード時と同様である。プロセッサ301は、抽出した1つ以上の定常音の音データをストレージ303に蓄積する。プロセッサ301は、1つ以上の定常音の中から最小定常音を検出する最小定常音検出処理を行う(S15)。この最小定常音検出処理は、学習モード時と同様である。 Based on the result of the frequency analysis, the processor 301 performs stationary sound extraction processing for extracting stationary sounds in units of frames included in the sound data (S14). This stationary sound extraction processing is the same as in the learning mode. The processor 301 accumulates the sound data of one or more extracted stationary sounds in the storage 303 . The processor 301 performs minimum stationary sound detection processing for detecting the minimum stationary sound from among one or more stationary sounds (S15). This minimum stationary sound detection processing is the same as in the learning mode.

プロセッサ301は、ステップS15で検出された最小定常音を基に、検査の対象機器100が正常状態であるか異常状態であるかを識別する正常異常識別処理を行う(S16)。この正常異常識別処理では、最小定常音どうしを比較することで、連続的に発生する外乱音や頻度の少ない突発音が含まれる定常音は、比較の対象から外れる。したがって、正常異常の識別精度を高めることができる。この正常異常識別処理の詳細については後述する。 Based on the minimum steady sound detected in step S15, the processor 301 performs normal/abnormal identification processing for identifying whether the device 100 to be inspected is in a normal state or an abnormal state (S16). In this normal/abnormal identification process, by comparing the minimum stationary sounds, stationary sounds including continuously occurring disturbance sounds and infrequently occurring sudden sounds are excluded from comparison targets. Therefore, it is possible to improve the accuracy of normal/abnormal discrimination. The details of this normal/abnormal identification process will be described later.

プロセッサ301は、運用動作を終了するか否かを判別する(S17)。運用動作の終了は、ユーザ(管理者を含む)が手動で停止を指示し、プロセッサ301が操作部305を介してこの指示を受け付けることで認識される。なお、運用動作の終了は、プロセッサ301が自動(例えばタイマ終了)で行ってもよい。この場合、ユーザの手動操作を省くことができる。運用動作を終了しない場合、プロセッサ301は、ステップS11の処理に戻り、同様の処理を繰り返す。なお、プロセッサ301は、ステップS13の処理に戻り、同様の処理を繰り返してもよい。この場合、ステップS11,S12で蓄積された一定時間の音データに対し、繰り返し異音判定が行われることになる。一方、ステップS17で運用動作を終了する場合、プロセッサ301は本運用動作を終了する。 The processor 301 determines whether or not to end the operational operation (S17). The end of the operational operation is recognized when the user (including the administrator) manually instructs to stop and the processor 301 accepts this instruction via the operation unit 305 . Note that the operation operation may be terminated automatically by the processor 301 (for example, timer termination). In this case, manual operation by the user can be omitted. When not ending the operation operation, the processor 301 returns to the process of step S11 and repeats the same process. Note that the processor 301 may return to the process of step S13 and repeat the same process. In this case, abnormal sound determination is repeatedly performed on the sound data accumulated in steps S11 and S12 for a certain period of time. On the other hand, when ending the operation operation in step S17, the processor 301 ends this operation operation.

図8は、ステップS16における正常異常識別手順を示すフローチャートである。プロセッサ301は、学習モード時にストレージ303に正常音であるとして記憶された、最小定常音の音データを読み込む(S41)。プロセッサ301は、ステップS15で検出された、現時点の最小定常音の音データと、正常音の音データとの類似度を算出する(S42)。この類似度の算出は、機械学習による学習済みモデルや相互相関関数を用いて行われてよい。 FIG. 8 is a flow chart showing the normal/abnormal identification procedure in step S16. The processor 301 reads the sound data of the minimum stationary sound stored in the storage 303 as normal sound in the learning mode (S41). The processor 301 calculates the degree of similarity between the sound data of the current minimum stationary sound detected in step S15 and the sound data of the normal sound (S42). This degree of similarity calculation may be performed using a machine-learned model or a cross-correlation function.

プロセッサ301は、ステップS42で算出された類似度が閾値TH1以上であるか否かを判別する(S43)。閾値TH1は、プロセッサ301が定常音の音データが類似するか否かを判別するための値である。類似度が閾値TH1未満である場合、プロセッサ301は、検査の対象機器100が異常音を発していると判定する(S44)。プロセッサ301は、通知処理を行う(S45)。この通知処理では、プロセッサ301は、ディスプレイ306に異常状態である旨の異常検知通知を表示する。なお、プロセッサ301は、通信部304を介してネットワークに接続された遠隔の監視装置(図示せず)に対し、検査の対象機器100が異常音を発して異常状態にある旨の異常検知通知を通知してもよい。この後、プロセッサ301は、本運用動作を終了してメインの処理に復帰する。 The processor 301 determines whether or not the similarity calculated in step S42 is equal to or greater than the threshold TH1 (S43). The threshold TH1 is a value for the processor 301 to determine whether or not sound data of stationary sounds are similar. When the degree of similarity is less than the threshold TH1, the processor 301 determines that the device 100 to be inspected is emitting an abnormal sound (S44). The processor 301 performs notification processing (S45). In this notification process, the processor 301 displays an abnormality detection notification indicating an abnormality on the display 306 . Note that the processor 301 notifies a remote monitoring device (not shown) connected to the network via the communication unit 304 that the device 100 to be inspected is in an abnormal state by emitting an abnormal sound. may notify you. Thereafter, the processor 301 terminates this operational operation and returns to the main processing.

ステップS43で類似度が閾値TH1以上である場合、プロセッサ301は、検査の対象機器100が正常音を発していると判定する(S46)。この場合、検査の対象機器100が正常状態であるので、プロセッサ301は、通知処理を行わない。なお、検査の対象機器100が正常状態である場合、プロセッサ301は、ディスプレイ306に正常である旨を表示するなど、通知処理を行ってもよい。 When the degree of similarity is equal to or greater than the threshold TH1 in step S43, the processor 301 determines that the target device 100 under test is emitting normal sounds (S46). In this case, the device 100 to be inspected is in a normal state, so the processor 301 does not perform notification processing. Note that when the device 100 to be inspected is in a normal state, the processor 301 may perform notification processing, such as displaying on the display 306 that it is normal.

図9は、運用モード時に収音された正常状態および異常状態における音の音圧レベルおよび周波数分布の時間変化をそれぞれ表す特性図である。 FIG. 9 is a characteristic diagram showing temporal changes in the sound pressure level and frequency distribution of sounds in normal and abnormal states collected in the operation mode.

正常状態の特性図gh3は音圧レベルの時間変化を表す。正常状態の特性図gh4は周波数分布の時間変化を表す。正常状態の特性図gh3,gh4の横軸は時間を表す。正常状態の特性図gh3の縦軸は、音圧レベルを表す。正常状態の特性図gh4の縦軸は周波数を表す。また、正常状態の特性図gh4は、音圧レベルを色の変化で表わす。ここでは、音圧レベルが高い領域は黄色(図中、濃いドット)で表される。音圧レベルが中間の領域は赤色(図中、中間ドット)で表される。音圧レベルが低い領域は赤紫色(図中、淡いドット)で表される。 A characteristic diagram gh3 in the normal state represents the time change of the sound pressure level. A characteristic diagram gh4 in a normal state represents the time change of the frequency distribution. The horizontal axes of the characteristic diagrams gh3 and gh4 in the normal state represent time. The vertical axis of the normal state characteristic diagram gh3 represents the sound pressure level. The vertical axis of the normal state characteristic diagram gh4 represents the frequency. In addition, the characteristic diagram gh4 in the normal state represents the sound pressure level with a change in color. Here, regions with high sound pressure levels are represented in yellow (dark dots in the drawing). A region with an intermediate sound pressure level is represented in red (intermediate dots in the figure). A region with a low sound pressure level is indicated by magenta (light dots in the figure).

同様に、異常状態の特性図gh5は音圧レベルの時間変化を表す。異常状態の特性図gh6は周波数分布の時間変化を表す。異常状態の特性図gh5,gh6の横軸は時間を表す。異常状態の特性図gh5の縦軸は、音圧レベルを表す。異常状態の特性図gh6の縦軸は周波数を表す。また、異常状態の特性図gh6は、音圧レベルを色の変化で表わす。ここでは、音圧レベルが高い領域は黄色(図中、濃いドット)で表される。音圧レベルが中間の領域は赤色(図中、中間ドット)で表される。音圧レベルが低い領域は赤紫色(図中、淡いドット)で表される。 Similarly, the abnormal state characteristic diagram gh5 represents the time change of the sound pressure level. A characteristic diagram gh6 of an abnormal state represents the time change of the frequency distribution. The horizontal axes of the abnormal state characteristic diagrams gh5 and gh6 represent time. The vertical axis of the abnormal state characteristic diagram gh5 represents the sound pressure level. The vertical axis of the abnormal state characteristic diagram gh6 represents the frequency. A characteristic diagram gh6 of an abnormal state represents the sound pressure level with a change in color. Here, regions with high sound pressure levels are represented in yellow (dark dots in the drawing). A region with an intermediate sound pressure level is represented in red (intermediate dots in the figure). A region with a low sound pressure level is indicated by magenta (light dots in the figure).

なお、図9に示す音データの特性では、対象機器の正常状態と異常状態とで、突発音が同一のタイミングで発生しているが、この特性は、一例である。多くの場合、突発音の発生タイミングは、対象機器の正常状態と異常状態とで異なってもよい。 In addition, in the characteristic of the sound data shown in FIG. 9, the sudden sound is generated at the same timing in the normal state and the abnormal state of the target device, but this characteristic is an example. In many cases, the timing at which the sudden sound is generated may differ between the normal state and the abnormal state of the target device.

運用モード時、音データは、一定時間(例えば30分)収音され、ストレージ303に蓄積される。特性図gh3,gh4および特性図gh5,gh6は、30分のうち、10秒分の音データを示す。学習モード時と同様、1フレームが500msecである場合、10秒分の音データは、20フレーム分の音データで表される。 In the operation mode, sound data is collected for a certain period of time (for example, 30 minutes) and accumulated in the storage 303 . Characteristic diagrams gh3 and gh4 and characteristic diagrams gh5 and gh6 show sound data for 10 seconds in 30 minutes. As in the learning mode, when one frame is 500 msec, 10 seconds of sound data is represented by 20 frames of sound data.

図9では、一例として、運用モード時、対象機器の正常状態における音データは、学習モード時の図6に示す音データと同一である。したがって、正常状態で収音された音データの各フレームにおける音圧レベルおよび周波数分布の時間変化についての説明を省略する。ここでは、対象機器の異常状態における音データの特性を、正常状態における音データの特性とフレーム単位で比較して説明する。 In FIG. 9, as an example, the sound data in the normal state of the target device in the operational mode is the same as the sound data shown in FIG. 6 in the learning mode. Therefore, the description of the temporal changes in the sound pressure level and frequency distribution in each frame of the sound data picked up in the normal state will be omitted. Here, the characteristics of the sound data in the abnormal state of the target device will be compared with the characteristics of the sound data in the normal state on a frame-by-frame basis.

第1フレームF31(0~500ms)では、正常状態において、音圧レベルが低い定常的な音データが継続している。一方、異常状態においては、音圧レベルが少し高い異音が間欠的に発生し、音圧レベルが低い定常的な音データに重畳している。ただし、第1フレームF31において、異常状態の音データは、周辺のフレームと同等のスペクトルパワーを有するために定常音であると判定される。つまり、第1フレームF31は、正常状態において、音のスペクトルパワーが極めて小さい定常音の区間であり、異常状態においても、音のスペクトルパワーが小さい定常音の区間である。 In the first frame F31 (0 to 500 ms), steady sound data with a low sound pressure level continues in the normal state. On the other hand, in an abnormal state, an abnormal noise with a slightly high sound pressure level is intermittently generated and superimposed on steady sound data with a low sound pressure level. However, in the first frame F31, the abnormal state sound data is determined to be a stationary sound because it has spectral power equivalent to that of the surrounding frames. In other words, the first frame F31 is a section of steady sound in which the spectral power of the sound is extremely small in the normal state, and is a section of the stationary sound in which the spectral power of the sound is small even in the abnormal state.

第2フレームF32(500~1000ms)は、第1フレームF31(0~500ms)とほぼ同じ状況である。 The second frame F32 (500-1000 ms) is in almost the same situation as the first frame F31 (0-500 ms).

第3フレームF33(1000~1500ms)では、正常状態において、1000mを僅かに経過して時点で音圧レベルが高い突発音が発生している。また、異常状態においては、音圧レベルが少し高い異音が間欠的に発生している音データに、音圧レベルが高い突発音が重畳している。したがって、第3フレームF33は、正常状態および異常状態のいずれにおいても、音のスペクトルパワーが大きい突発音の区間である。第4フレームF34(1500~2000ms)は、第1フレームF31と同じ状況である。 In the third frame F33 (1000 to 1500 ms), in the normal state, a sudden sound with a high sound pressure level is generated just after 1000 m. Further, in an abnormal state, a sudden sound with a high sound pressure level is superimposed on sound data in which an abnormal sound with a slightly high sound pressure level is intermittently generated. Therefore, the third frame F33 is a section of a sudden sound in which the spectral power of the sound is large in both the normal state and the abnormal state. The fourth frame F34 (1500-2000 ms) is in the same situation as the first frame F31.

第5フレームF35(2000~2500ms)では、正常状態において、音圧レベルが少し高い連続的な音データが発生している。このような連続的な音データとして、例えばモータ音が挙げられる。第5フレームF35は、連続的な音データによる音のスペクトルパワーはそれほど大きくなく、スペクトルパワーが少し大きな定常音の区間である。また、異常状態においては、音圧レベルが少し高い異音が間欠的に発生し、音圧レベルが少し高い連続的な音データに重畳している。第5フレームF35は、正常状態および異常状態のいずれにおいても、定常音の区間である。 In the fifth frame F35 (2000 to 2500 ms), continuous sound data with a slightly high sound pressure level is generated in the normal state. Such continuous sound data includes, for example, motor sound. The fifth frame F35 is a section of stationary sound in which the spectral power of the continuous sound data is not so high and the spectral power is slightly high. In addition, in an abnormal state, an abnormal sound with a slightly high sound pressure level is intermittently generated and superimposed on the continuous sound data with a slightly high sound pressure level. The fifth frame F35 is a section of steady sound in both normal and abnormal states.

第6フレームF36(2500~3000ms)では、正常状態において、第5フレームF35に引き続き、音圧レベルが少し高い連続的な音データが発生している状態において、さらに、2500msを僅かに経過して時点で音圧レベルが高い突発音が発生している。また、異常状態においては、音圧レベルが少し高い異音が間欠的に発生している、音圧レベルが少し高い連続的な音データに、音圧レベルが高い突発音が重畳している。したがって、第6フレームF36は、正常状態および異常状態のいずれにおいても、音のスペクトルパワーが大きい突発音の区間である。第7フレームF37(3000~3500ms)および第8フレームF38(3500~4000ms)は、第5フレームF35と同じ状況である。 In the sixth frame F36 (2500 to 3000 ms), in the normal state, following the fifth frame F35, continuous sound data with a slightly higher sound pressure level is generated. At this point, a sudden sound with a high sound pressure level is generated. In the abnormal state, an abnormal sound with a slightly high sound pressure level is intermittently generated, and a sudden sound with a high sound pressure level is superimposed on continuous sound data with a slightly high sound pressure level. Therefore, the sixth frame F36 is a section of a sudden sound in which the spectral power of the sound is large in both the normal state and the abnormal state. The seventh frame F37 (3000-3500 ms) and the eighth frame F38 (3500-4000 ms) are in the same situation as the fifth frame F35.

第9フレームF39(4000~4500ms)では、正常状態において、音圧レベルが少し高い連続的な音データが無くなり、第1フレームF31(0~500ms)と同様、音圧レベルが低い定常的な音データが継続している。また、異常状態においては、音圧レベルが少し高い異音が間欠的に発生し、音圧レベルが低い定常的な音データに重畳している。第9フレームF39は、正常状態および異常状態のいずれにおいても、定常音の区間である。第10フレームF40(4500~5000ms)は、第9フレームF39とほぼ同じ状況である。 In the ninth frame F39 (4000 to 4500 ms), there is no continuous sound data with a slightly high sound pressure level in the normal state. data continues. In addition, in an abnormal state, an abnormal sound with a slightly high sound pressure level is intermittently generated and superimposed on steady sound data with a low sound pressure level. The ninth frame F39 is a stationary sound section in both the normal state and the abnormal state. The tenth frame F40 (4500 to 5000 ms) is in almost the same situation as the ninth frame F39.

第11フレームF41(5000~5500ms)では、正常状態において、音圧レベルが極めて高い突発音が頻繁に発生している。また、異常状態においては、音圧レベルが極めて高い突発音が頻繁に発生し、かつ音圧レベルが少し高い異音が間欠的に発生している。したがって、第11フレームF41は、正常状態および異常状態のいずれにおいても、音のスペクトルパワーが極めて大きい突発音の区間である。 In the eleventh frame F41 (5000 to 5500 ms), sudden sounds with extremely high sound pressure levels are frequently generated in the normal state. In addition, in an abnormal state, sudden sounds with extremely high sound pressure levels are frequently generated, and abnormal sounds with slightly high sound pressure levels are generated intermittently. Therefore, the 11th frame F41 is a section of a sudden sound in which the spectral power of the sound is extremely large in both the normal state and the abnormal state.

第12フレームF42(5500~6000ms)では、正常状態において、音圧レベルがやや高い突発音が発生している。また、異常状態においては、音圧レベルがやや高い突発音が発生し、かつ音圧レベルが少し高い異音が間欠的に発生している。したがって、第12フレームF42は、正常状態および異常状態のいずれにおいても、音のスペクトルパワーが平均スペクトルパワーを超えて突発音の区間と判定される。 In the twelfth frame F42 (5500 to 6000 ms), a sudden sound with a slightly high sound pressure level is generated in the normal state. In addition, in the abnormal state, a sudden sound with a slightly high sound pressure level is generated, and an abnormal sound with a slightly high sound pressure level is generated intermittently. Therefore, the twelfth frame F42 is determined to be a sudden sound section in which the spectral power of the sound exceeds the average spectral power in both the normal state and the abnormal state.

第13フレームF43(6000~6500ms)および第14フレームF44(6500~7000ms)は、第9フレームF9と同じ状況である。 The 13th frame F43 (6000-6500 ms) and the 14th frame F44 (6500-7000 ms) are in the same situation as the 9th frame F9.

第15フレームF45(7000~7500ms)および第16フレームF46(7500~8000ms)は、正常状態において、音圧レベルが高い連続的な音データが発生している。また、異常状態においては、音圧レベルが高い連続的な音データが発生し、かつ音圧レベルが少し高い異音が間欠的に発生している。第15フレームF45および第16フレームF46は、正常状態および異常状態のいずれにおいても、連続的な音データによる音のスペクトルパワーが平均スペクトルパワーを超えて大きく、非定常音の区間である。 In the 15th frame F45 (7000-7500 ms) and the 16th frame F46 (7500-8000 ms), continuous sound data with a high sound pressure level are generated in the normal state. In addition, in an abnormal state, continuous sound data with a high sound pressure level is generated, and abnormal noise with a slightly high sound pressure level is generated intermittently. The 15th frame F45 and the 16th frame F46 are sections of non-stationary sound in which the spectral power of continuous sound data exceeds the average spectral power in both the normal state and the abnormal state.

第17フレームF47(8000~8500ms)、第18フレームF48(8500~9000ms)および第19フレームF49(9000~9500ms)は、第13フレームF43および第14フレームF44と同じ状況である。 The 17th frame F47 (8000-8500 ms), the 18th frame F48 (8500-9000 ms) and the 19th frame F49 (9000-9500 ms) are in the same situation as the 13th frame F43 and 14th frame F44.

第20フレームF50(9500~10000ms)は、正常状態および異常状態のいずれにおいても、音圧レベルが低い定常的な音データが継続している。また、異常状態において、異音が発生していない。第20フレームF50は、正常状態および異常状態のいずれにおいても、音のスペクトルパワーが極めて小さい定常音の区間である。 In the twentieth frame F50 (9500 to 10000 ms), steady sound data with a low sound pressure level continues in both the normal state and the abnormal state. Also, no abnormal noise is generated in the abnormal state. The twentieth frame F50 is a section of stationary sound in which the spectral power of the sound is extremely small in both the normal state and the abnormal state.

ここで、プロセッサ301は、第20フレームF50の最小定常音を用いて正常異常識別処理を行った場合、対象機器が異常状態であっても、現時点の最小定常音と学習モード時に記憶した正常音との類似度が閾値TH1以上となり、正常状態であると判定してしまうことになる。この場合、プロセッサ301は、第20フレームF50を除くフレームの最小定常音を用いて正常異常識別処理を行うことが望ましい。また、第20フレームF50の音データが存在しても、異音判定処理は、ストレージ303に一定時間蓄積された音データを用いて、プロセッサ301によって繰り返し実行されており、別のタイミングで異音判定は可能である。 Here, when the processor 301 performs normal/abnormal identification processing using the minimum steady sound of the 20th frame F50, even if the target device is in an abnormal state, the current minimum steady sound and the normal sound stored in the learning mode becomes equal to or greater than the threshold value TH1, and it is determined that the state is normal. In this case, it is desirable that the processor 301 performs the normal/abnormal identification processing using the minimum stationary sound of the frames excluding the twentieth frame F50. Also, even if there is sound data in the twentieth frame F50, the abnormal sound determination process is repeatedly executed by the processor 301 using the sound data accumulated in the storage 303 for a certain period of time. Judgment is possible.

このように、実施の形態1における異音判定システム5では、プロセッサ301は、対象機器100が発する音の音データから定常音を抽出し、予め記憶しておいた正常状態における定常音と比較することで、対象機器100の正常異常識別処理を行う。定常音どうしを比較することで、マイクで収音される音に外乱音が含まれる環境においても、プロセッサ301は、正常異常の識別精度を向上できる。特に、プロセッサ301は、正常状態における最小定常音と現時点の最小定常音とを比較することで、対象機器100が発する音データに、外乱音(例えば突発音や音圧レベルが少し高い連続的なモータ音など)が含まれる場合においても、対象機器100の異常状態を適正に検出できる。また、プロセッサ301は、対象機器100の設置時など、始動初期における最小定常音を学習することで、対象機器100が良好な状態で正常音を学習できる。また、異音判定システム5は、対象機器100が様々な環境に設置されても対応可能である。なお、異音判定システムは、1つのマイクおよび1台のAD変換器を含む構成に限らず、任意の数のマイクおよび任意の数のAD変換器を含む構成であってもよい。 As described above, in the abnormal sound determination system 5 according to Embodiment 1, the processor 301 extracts the stationary sound from the sound data of the sound emitted by the target device 100, and compares it with the stationary sound in the normal state stored in advance. Thus, normal/abnormal identification processing of the target device 100 is performed. By comparing the stationary sounds, the processor 301 can improve the accuracy of normal/abnormal identification even in an environment where the sounds picked up by the microphone include disturbance sounds. In particular, the processor 301 compares the minimum steady sound in the normal state with the minimum steady sound at the present time, so that the sound data emitted by the target device 100 includes disturbance sounds (for example, sudden sounds and continuous sounds with a slightly high sound pressure level). The abnormal state of the target device 100 can be properly detected even when the target device 100 includes a motor sound or the like. In addition, the processor 301 learns the minimum stationary sound at the initial stage of startup, such as when the target device 100 is installed, so that the target device 100 can learn the normal sound in a favorable state. Moreover, the abnormal noise determination system 5 can cope with the installation of the target device 100 in various environments. Note that the abnormal sound determination system is not limited to the configuration including one microphone and one AD converter, and may be configured to include an arbitrary number of microphones and an arbitrary number of AD converters.

以上により、情報処理装置30(異音判定装置の一例)は、対象機器100から発せられる音を収音するマイク10に接続される入力部307と、対象機器100から発せられる音の所定期間分の音データを記憶するストレージ303(メモリの一例)と、所定期間分の音データを用い、所定期間より短い1フレーム期間ごとに1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するプロセッサ301と、を備える。ストレージ303は、学習モード中に定常音と判定された1以上の1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶する。プロセッサ301は、学習モード時と異なる運用モード中に定常音と判定された1フレーム期間の音データとストレージ303に記憶された正常音の音データとの比較に応じて、対象機器100から発せられる音に異音が含まれるか否かを判定(識別の一例)する。 As described above, the information processing device 30 (an example of the abnormal sound determination device) includes the input unit 307 connected to the microphone 10 that picks up the sound emitted from the target device 100, and the sound emitted from the target device 100 for a predetermined period. Using a storage 303 (an example of a memory) for storing sound data and sound data for a predetermined period, the sound corresponding to the sound data for one frame period shorter than the predetermined period is a stationary sound or a sudden sound. and a processor 301 for determining whether there is The storage 303 stores, as a normal sound, at least one stationary sound among the sound data of one or more frame periods determined as stationary sounds during the learning mode. The processor 301 compares the sound data of one frame period determined to be a steady sound during the operation mode different from the learning mode with the sound data of the normal sound stored in the storage 303 . It is determined (an example of identification) whether or not the sound contains an abnormal sound.

これにより、情報処理装置30は、対象機器100から収音される音に定常音だけでなく突発音などの外乱音が含まれる場合でも、収音された音に異音が含まれるか否かの識別精度を向上させ、対象機器の異常の有無を適切に検知できる。 As a result, even if the sound picked up from the target device 100 includes not only a stationary sound but also a disturbance sound such as a sudden sound, the information processing apparatus 30 can determine whether the picked-up sound includes an abnormal sound. It is possible to improve the identification accuracy of the target device and appropriately detect the presence or absence of anomalies in the target device.

また、プロセッサ301は、対象機器100から発せられる音に異音が含まれると識別した場合に、対象機器100から発せられる音に異音が含まれる旨の異音検知通知をディスプレイ306に表示する。これにより、ユーザ(管理者を含む)は、対象機器の異常状態に気付くことができる。 Further, when the processor 301 identifies that the sound emitted from the target device 100 includes an abnormal sound, the processor 301 displays on the display 306 an abnormal sound detection notification indicating that the sound emitted from the target device 100 includes an abnormal sound. . This allows the user (including the administrator) to notice the abnormal state of the target device.

また、プロセッサ301は、学習モード中に定常音と判定された1以上の1フレーム期間の音データのスペクトルパワーが最小となる最小定常音の音データを検出し、その検出された最小定常音の音データを正常音の音データとしてストレージ303に保存する。これにより、情報処理装置30は、学習モードにおいて、外乱音などが最も少ない状態でマイクにより収音された1フレーム期間の音を、対象機器が発する音の正常音として記憶できる。したがって、情報処理装置30は、対象機器から発せられる音に異音が含まれるか否かを識別する際、比較の対象となる正常音を、外乱音が最も少ない状態で得ることができる。 Further, the processor 301 detects sound data of the minimum stationary sound that minimizes the spectral power of the sound data of one or more frame periods determined to be the stationary sound during the learning mode, and detects the sound data of the detected minimum stationary sound. The sound data is stored in the storage 303 as normal sound sound data. Accordingly, in the learning mode, the information processing apparatus 30 can store the sound for one frame period, which is picked up by the microphone with the least disturbance sound, as the normal sound emitted by the target device. Therefore, the information processing apparatus 30 can obtain the normal sound to be compared with the least disturbance sound when identifying whether or not the sound emitted from the target device includes an abnormal sound.

また、プロセッサ301は、運用モード中に定常音と判定された1以上の1フレーム期間の音データのスペクトルパワーが最小となる最小定常音の音データを検出し、その検出された最小定常音の音データと正常音の音データとの比較に応じて、対象機器100から発せられる音に異音が含まれるか否かを識別する。これにより、情報処理装置30は、運用モードにおいて、外乱音などが抑えられた、現時点の最小定常音と正常音として記憶された最小定常音とを比較することで、対象機器の正常状態/異常状態の識別精度を向上できる。 In addition, the processor 301 detects the sound data of the minimum stationary sound that minimizes the spectral power of the sound data of one or more frame periods determined to be the stationary sound during the operation mode, and detects the sound data of the detected minimum stationary sound. Whether or not the sound emitted from the target device 100 includes an abnormal sound is identified according to the comparison between the sound data and the sound data of the normal sound. As a result, the information processing device 30 compares the current minimum stationary sound, in which disturbance sounds and the like are suppressed, with the minimum stationary sound stored as a normal sound in the operation mode, thereby determining whether the target device is in a normal state/abnormal state. The state identification accuracy can be improved.

(実施の形態2)
実施の形態1では、一定時間内で抽出された複数の定常音のうち最小定常音を用いて正常異常識別処理が行われたが、実施の形態2では、最小定常音だけを用いることなく1以上の定常音を用いて正常異常識別処理を行う場合を示す。
(Embodiment 2)
In the first embodiment, normal/abnormal identification processing is performed using the minimum stationary sound among a plurality of stationary sounds extracted within a certain period of time. A case will be shown in which normal/abnormal identification processing is performed using the above steady sounds.

また、実施の形態2の異音判定システムにおいて、実施の形態1と同一の構成要素については同一の符号を付すことで、その説明を省略する。 Further, in the abnormal noise determination system of the second embodiment, the same components as those of the first embodiment are denoted by the same reference numerals, and descriptions thereof are omitted.

図10は、実施の形態2における異音判定システム5Aの概略構成の一例を示す図である。異音判定システム5Aは、2つのマイク10A、10B、AD変換器20、情報処理装置30、およびクラウドサーバ50を含む構成である。2つのマイク10A、10BおよびAD変換器20は、検査の対象機器100A,100Bが設置された機械室に置かれる。情報処理装置30は、ユーザ(管理者を含む)が所在する監視室に置かれる。 FIG. 10 is a diagram showing an example of a schematic configuration of an abnormal noise determination system 5A according to the second embodiment. The abnormal sound determination system 5A includes two microphones 10A and 10B, an AD converter 20, an information processing device 30, and a cloud server 50. FIG. The two microphones 10A, 10B and the AD converter 20 are placed in a machine room in which the devices to be tested 100A, 100B are installed. The information processing device 30 is placed in a monitoring room where a user (including an administrator) is located.

図11は、異音判定システム5Aのハードウェア構成を示す図である。2つのマイク10A、10Bは、実施の形態1におけるマイク10と同一の仕様を有する。マイク10Aは、対象機器100Aが発する音を主に収音する。マイク10Bは、対象機器100Bが発する音を主に収音する。なお、マイクの数は、検査の対象機器の数に対応した任意の数であってよい。 FIG. 11 is a diagram showing the hardware configuration of the abnormal noise determination system 5A. The two microphones 10A and 10B have the same specifications as the microphone 10 in the first embodiment. The microphone 10A mainly picks up sounds emitted by the target device 100A. The microphone 10B mainly picks up sounds emitted by the target device 100B. Note that the number of microphones may be any number corresponding to the number of devices to be inspected.

AD変換器20は、2つのマイク10A、10Bで収音された音をそれぞれアナログデジタル変換し、デジタル形式の音データを出力する。このアナログデジタル変換は、2つのマイク10A、10Bからの音信号に対し、時分割あるいは同時に行われてよい。 The AD converter 20 analog-to-digital converts the sounds picked up by the two microphones 10A and 10B, and outputs digital sound data. This analog-to-digital conversion may be performed time-divisionally or simultaneously on the sound signals from the two microphones 10A and 10B.

情報処理装置30は、クラウドサーバ50に接続可能な端末装置であり、実施の形態1と同一の構成を有する。情報処理装置30は、AD変換器20から出力される音データを、ネットワーク機器41を介して受信する。情報処理装置30は、2つのマイク10A、10Bによる音データをストレージ303に一定時間(例えば、30分、1時間など)蓄積する。情報処理装置30は、ストレージ303に蓄積した一定時間分の音データを、ネットワーク機器45を介してクラウドサーバ50に送信する。なお、情報処理装置30は、ストレージ303に蓄積された一定時間分の音データのうち、正常異常識別処理に必要な長さ分の音データだけを送信してもよい。また、情報処理装置30は、正常異常識別つ処理の結果を表示可能なディスプレイとしても機能する。 The information processing device 30 is a terminal device connectable to the cloud server 50 and has the same configuration as that of the first embodiment. The information processing device 30 receives sound data output from the AD converter 20 via the network device 41 . The information processing device 30 accumulates sound data from the two microphones 10A and 10B in the storage 303 for a certain period of time (for example, 30 minutes, 1 hour, etc.). The information processing device 30 transmits the sound data for a certain period of time accumulated in the storage 303 to the cloud server 50 via the network device 45 . Note that the information processing apparatus 30 may transmit only sound data of a length required for normality/abnormality identification processing among the sound data for a certain period of time accumulated in the storage 303 . The information processing device 30 also functions as a display capable of displaying the results of normality/abnormality identification processing.

クラウドサーバ50は、プロセッサ501、メモリ502、ストレージ503、通信部504を有する。プロセッサ501は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)などの各種処理デバイスを有し、音データに関する処理を実行する。メモリ502は、RAM(Random Access Memory)などのメモリデバイスを有し、プロセッサ501のワーキングメモリとして使用され、データ処理時の演算などにおいて一時記憶に利用する。また、メモリ502は、ROM(Read Only Memory)などのメモリデバイスを有し、プロセッサ301の処理を実行するための各種実行プログラム、機械学習などの処理に関する各種設定データを記憶する。ストレージ503は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、光ディスクドライブなどの各種ストレージデバイスを有し、対象機器の音データや、機械学習により生成した学習済みモデルなどのデータを格納する。ストレージ503は、様々な環境で収音された音データを蓄積するために、情報処理装置30に内蔵されたストレージ303と比べ、大容量の記憶媒体である。通信部504は、有線又は無線の通信を行うインタフェースであり、クラウドNWに接続された情報処理装置30とネットワーク機器45を介して通信を行い、音データや学習済みモデルなどのデータを送受信する。 The cloud server 50 has a processor 501 , memory 502 , storage 503 and communication section 504 . The processor 501 has various processing devices such as a CPU (Central Processing Unit), a DSP (Digital Signal Processor), and an FPGA (Field Programmable Gate Array), and executes processing related to sound data. A memory 502 has a memory device such as a RAM (Random Access Memory), is used as a working memory of the processor 501, and is used for temporary storage in calculations during data processing. The memory 502 has a memory device such as a ROM (Read Only Memory), and stores various execution programs for executing the processing of the processor 301 and various setting data related to processing such as machine learning. The storage 503 has various storage devices such as HDD (Hard Disk Drive), SSD (Solid State Drive), and optical disk drive, and stores data such as sound data of the target device and learned models generated by machine learning. . The storage 503 is a large-capacity storage medium compared to the storage 303 incorporated in the information processing apparatus 30 in order to store sound data picked up in various environments. The communication unit 504 is an interface that performs wired or wireless communication, communicates with the information processing device 30 connected to the cloud NW via the network device 45, and transmits and receives data such as sound data and trained models.

ネットワーク機器41は、社内LAN(Local Area Network)などのイントラネットに接続された2つのマイク10A,10Bと情報処理装置30との間で送受信されるデータを中継する。なお、AD変換器20がネットワークI/F(Interface)を備える場合、ネットワーク機器41は省略可能である。 The network device 41 relays data transmitted and received between the two microphones 10A and 10B connected to an intranet such as an in-house LAN (Local Area Network) and the information processing device 30 . Note that if the AD converter 20 has a network I/F (Interface), the network device 41 can be omitted.

ネットワーク機器45は、イーサネット(登録商標)などの通信プロトコルに則って、情報処理装置30とクラウドサーバ50との間で送受信されるデータを中継する。 The network device 45 relays data transmitted and received between the information processing device 30 and the cloud server 50 according to a communication protocol such as Ethernet (registered trademark).

次に、異音判定システム5Aの動作を示す。 Next, the operation of the abnormal noise determination system 5A will be described.

(学習モード)
学習は、検査の対象機器100A,100Bが設置された初期状態において1回だけ行われてもよいし、メンテナンスなどにおいて定期的または不定期に行われてもよい。音データの学習モード時、マイク10A,10Bは、それぞれ検査の対象機器100A,100Bから発せられる音を主に収音する。マイク10A,10Bによる録音は、所定時間行われる。所定時間は、30分、1時間、1日などの任意の一定時間である。また、所定時間は、一定時間でなく、ユーザや管理者が手動で停止する時間であってもよい。
(learning mode)
The learning may be performed only once in the initial state in which the inspection target devices 100A and 100B are installed, or may be performed regularly or irregularly during maintenance or the like. In the sound data learning mode, the microphones 10A and 10B mainly pick up sounds emitted from the target devices 100A and 100B, respectively. Recording by the microphones 10A and 10B is performed for a predetermined time. The predetermined time is any fixed time such as 30 minutes, 1 hour, or 1 day. Also, the predetermined time may not be a fixed time but may be a time manually stopped by a user or an administrator.

図12は、音データの学習動作手順を示すフローチャートである。ステップS51~S54の処理は、前記実施の形態1の図3におけるステップS1~S4の処理と同様である。 FIG. 12 is a flow chart showing a learning operation procedure for sound data. The processing of steps S51 to S54 is the same as the processing of steps S1 to S4 in FIG. 3 of the first embodiment.

クラウドサーバ50のプロセッサ501は、マイク10A,10Bで収音され、AD変換器20によってアナログデジタル変換された音データを、情報処理装置30およびネットワーク機器45を介して受信する(S51)。 The processor 501 of the cloud server 50 receives sound data picked up by the microphones 10A and 10B and analog-to-digital converted by the AD converter 20 via the information processing device 30 and the network device 45 (S51).

プロセッサ501は、受信した音データをストレージ503に蓄積する。プロセッサ501は、所定時間が経過し、マイク10による録音が終了したか否かを判別する(S52)。録音が終了していない場合、プロセッサ501は、ステップS51の処理に戻る。 Processor 501 accumulates the received sound data in storage 503 . The processor 501 determines whether or not a predetermined period of time has elapsed and recording by the microphone 10 has ended (S52). If recording has not ended, the processor 501 returns to the process of step S51.

ステップS52で録音が終了した場合、プロセッサ501は、ストレージ503に蓄積された時系列の音データに対し、周波数解析を行う(S53)。この周波数解析は、前記実施の形態1と同様である。 When recording ends in step S52, the processor 501 performs frequency analysis on the time-series sound data accumulated in the storage 503 (S53). This frequency analysis is the same as in the first embodiment.

プロセッサ501は、周波数解析の結果を基に、音データに含まれる定常音をフレーム単位に抽出する定常音抽出処理を行う(S54)。この定常音抽出処理は、前記実施の形態1と同様である。 Based on the result of frequency analysis, the processor 501 performs stationary sound extraction processing for extracting stationary sounds contained in the sound data on a frame-by-frame basis (S54). This stationary sound extraction process is the same as that of the first embodiment.

プロセッサ501は、抽出した1以上の定常音の音データをストレージ503に全て蓄積する(S55)。この後、プロセッサ501は、本学習動作を終了する。 The processor 501 accumulates all the sound data of one or more extracted stationary sounds in the storage 503 (S55). After this, the processor 501 ends this learning operation.

(運用モード)
運用モード時、プロセッサ501は、学習モード時と同様の処理で定常音を検出する。プロセッサ501は、現時点の定常音と、ストレージ503に記憶された、検査の対象機器100A,100Bが正常状態である時の1以上の定常音とを比較する。プロセッサ501は、この比較結果を基に、対象機器100A,100Bの正常状態/異常状態を識別する。
(operation mode)
In the operational mode, the processor 501 detects stationary sounds by the same processing as in the learning mode. The processor 501 compares the current stationary sound with one or more stationary sounds stored in the storage 503 when the devices 100A and 100B to be inspected are in a normal state. Processor 501 identifies the normal state/abnormal state of target devices 100A and 100B based on this comparison result.

図13は、音データの運用動作手順を示すフローチャートである。運用動作は、定期あるいは不定期に行われる。運用モード時、マイク10A,10Bは、検査の対象機器100A,100Bから発せられる音を主に収音する。 FIG. 13 is a flow chart showing a procedure for operating sound data. Operational operations are performed regularly or irregularly. In the operation mode, the microphones 10A and 10B mainly pick up sounds emitted from the target devices 100A and 100B to be inspected.

運用動作において、ステップS61~S64,S65,S66の処理は、前記実施の形態1の図7におけるステップS11~S14,S16,S17の処理と同様である。 In the operational operation, the processes of steps S61 to S64, S65 and S66 are the same as the processes of steps S11 to S14, S16 and S17 in FIG. 7 of the first embodiment.

クラウドサーバ50のプロセッサ501は、マイク10A,10Bで収音され、AD変換器20によってアナログデジタル変換された音データを、情報処理装置30およびネットワーク機器45を介して受信する(S61)。プロセッサ501は、受信した音データをストレージ503に蓄積する。 The processor 501 of the cloud server 50 receives sound data picked up by the microphones 10A and 10B and analog-to-digital converted by the AD converter 20 via the information processing device 30 and the network device 45 (S61). Processor 501 accumulates the received sound data in storage 503 .

プロセッサ501は、マイク10A,10Bによる収音を開始してから一定時間(例えば30分、1日など)が経過したか否かを判別する(S62)。ステップS62で一定時間が経過した場合、プロセッサ501は、ストレージ503に蓄積された時系列の音データに対し、周波数解析を行う(S63)。この周波数解析は、学習モード時と同様である。 The processor 501 determines whether or not a certain period of time (for example, 30 minutes, 1 day, etc.) has passed since the microphones 10A and 10B started picking up sounds (S62). When the predetermined time has passed in step S62, the processor 501 performs frequency analysis on the time-series sound data accumulated in the storage 503 (S63). This frequency analysis is the same as in the learning mode.

プロセッサ501は、周波数解析の結果を基に、音データに含まれる定常音をフレーム単位に抽出する定常音抽出処理を行う(S64)。この定常音抽出処理は、学習モード時と同様である。 Based on the result of frequency analysis, the processor 501 performs stationary sound extraction processing for extracting stationary sounds contained in the sound data on a frame-by-frame basis (S64). This stationary sound extraction processing is the same as in the learning mode.

プロセッサ501は、ステップS64で抽出された1以上の定常音を基に、検査の対象機器100A,100Bが正常状態であるか異常状態であるかを識別する正常異常識別処理を行う(S65)。正常異常識別処理は、対象機器100A,100Bそれぞれに対して行われる。この正常異常識別処理の詳細については後述する。 The processor 501 performs normal/abnormal identification processing for identifying whether the target devices 100A and 100B to be inspected are in a normal state or an abnormal state based on one or more stationary sounds extracted in step S64 (S65). The normal/abnormal identification process is performed for each of the target devices 100A and 100B. The details of this normal/abnormal identification process will be described later.

プロセッサ501は、運用動作を終了するか否かを判別する(S66)。運用動作の終了は、ユーザ(管理者を含む)が手動で停止を指示し、プロセッサ301が操作部305を介してこの指示を受け付けることで認識される。プロセッサ501は、情報処理装置30から停止指示を受信する。なお、運用動作の終了は、プロセッサ501が自動(例えばタイマ終了)で行ってもよい。この場合、ユーザの手動操作を省くことができる。運用動作を終了しない場合、プロセッサ501は、ステップS61の処理に戻り、同様の処理を繰り返す。一方、運用動作を終了する場合、プロセッサ501は本運用動作を終了する。 The processor 501 determines whether or not to end the operational operation (S66). The end of the operational operation is recognized when the user (including the administrator) manually instructs to stop and the processor 301 accepts this instruction via the operation unit 305 . Processor 501 receives a stop instruction from information processing device 30 . Note that the operation operation may be terminated automatically by the processor 501 (for example, timer termination). In this case, manual operation by the user can be omitted. When not ending the operation operation, the processor 501 returns to the process of step S61 and repeats the same process. On the other hand, when ending the operational operation, the processor 501 ends this operational operation.

図14は、ステップS65における正常異常識別手順を示すフローチャートである。プロセッサ501は、学習モード時にストレージ503に記憶された、1以上の定常音の音データを読み込む(S71)。プロセッサ501は、ステップS64で抽出された、現時点の定常音の音データと、ストレージ503に記憶した定常音の音データとの類似度を算出する(S72)。この類似度の算出は、機械学習による学習済みモデルや相互相関関数を用いて行われる。 FIG. 14 is a flow chart showing the normal/abnormal identification procedure in step S65. The processor 501 reads sound data of one or more stationary sounds stored in the storage 503 in the learning mode (S71). The processor 501 calculates the degree of similarity between the current stationary sound data extracted in step S64 and the stationary sound data stored in the storage 503 (S72). This degree of similarity calculation is performed using a learned model and a cross-correlation function by machine learning.

プロセッサ501は、ステップS72で算出された類似度が閾値TH2以上となる定常音が少なくとも1つ以上あるか否かを判別する(S73)。閾値TH2は、プロセッサ501が定常音の音データが類似するか否かを判別するための値である。閾値TH2は、閾値TH1と同じ値であってもよいし、異なる値であってもよい。類似度が閾値TH2未満である場合、プロセッサ501は、検査の対象機器100A,100Bが異常音を発していると判定する(S74)。プロセッサ501は、通知処理を行う(S75)。 The processor 501 determines whether or not there is at least one stationary sound whose similarity calculated in step S72 is equal to or greater than the threshold TH2 (S73). The threshold TH2 is a value for the processor 501 to determine whether or not the sound data of stationary sounds are similar. The threshold TH2 may be the same value as the threshold TH1, or may be a different value. If the similarity is less than the threshold TH2, the processor 501 determines that the inspection target devices 100A and 100B are emitting abnormal sounds (S74). The processor 501 performs notification processing (S75).

この通知処理では、プロセッサ501は、通信部504、クラウドNWおよびネットワーク機器45を介して対象機器100A,100Bの少なくとも一方が異常状態である旨を表すデータを情報処理装置30に送信する。情報処理装置30は、クラウドサーバ50から対象機器100A,100Bの少なくとも一方が異常である旨を表すデータを受信すると、ディスプレイ306に対象機器100A,100Bの少なくとも一方が異常状態である旨を表示する。なお、クラウドサーバ50がディスプレイを備える場合、自装置のディスプレイに対象機器100A,100Bが異常状態である旨を表示してもよい。この後、プロセッサ501は、本運用動作を終了してメインの処理に復帰する。 In this notification process, processor 501 transmits data indicating that at least one of target devices 100A and 100B is in an abnormal state to information processing device 30 via communication unit 504, cloud NW, and network device 45. FIG. When information processing apparatus 30 receives data indicating that at least one of target devices 100A and 100B is abnormal from cloud server 50, information processing apparatus 30 displays on display 306 that at least one of target devices 100A and 100B is in an abnormal state. . Note that if the cloud server 50 has a display, it may display that the target devices 100A and 100B are in an abnormal state on the display of its own device. After that, the processor 501 terminates this operational operation and returns to the main processing.

ステップS73で類似度が閾値TH2以上である場合、プロセッサ501は、検査の対象機器100A,100Bが正常音を発していると判定する(S76)。この場合、検査の対象機器100A,100Bが正常状態であるので、プロセッサ501は、通知処理を行わない。なお、検査の対象機器100A,100Bが正常状態である場合、プロセッサ501は、通信部504、クラウドNWおよびネットワーク機器45を介して対象機器100A,100Bが正常状態である旨を表すデータを情報処理装置30に送信してもよい。情報処理装置30は、クラウドサーバ50から対象機器100A,100Bが正常状態である旨を表すデータを受信すると、ディスプレイ306に対象機器100A,100Bが正常状態である旨を表示する。 When the degree of similarity is equal to or greater than the threshold TH2 in step S73, the processor 501 determines that the target devices 100A and 100B to be inspected are emitting normal sounds (S76). In this case, since the target devices 100A and 100B to be inspected are in a normal state, the processor 501 does not perform notification processing. When target devices 100A and 100B to be inspected are in a normal state, processor 501 processes data indicating that target devices 100A and 100B are in a normal state via communication unit 504, cloud NW, and network device 45. It may be sent to device 30 . When information processing apparatus 30 receives data indicating that target devices 100A and 100B are in a normal state from cloud server 50, information processing apparatus 30 displays on display 306 that target devices 100A and 100B are in a normal state.

このように、実施の形態2における異音判定システム5Aでは、クラウドサーバ50のプロセッサ501は、学習モード時、1以上の定常音をストレージ503に蓄積しておく。プロセッサ501は、運用モード時、マイク10A,10Bにより収音された音データの定常音がストレージ503に蓄積された複数の定常音のいずれかと類似する場合、つまり、1以上の定常音の中に類似度が高い定常音が存在する場合、対象機器100A,100Bが正常状態であると判定する。また、クラウドサーバ50は、複数の定常音の中に類似度が高い定常音が存在しない場合、対象機器100A,100Bが異常状態であると判定する。したがって、クラウドサーバ50は、対象機器が他の環境に置かれた場合でも、いずれかの定常音と類似する場合、対象機器100A,100Bの正常異常を識別できる。 Thus, in the abnormal sound determination system 5A according to Embodiment 2, the processor 501 of the cloud server 50 accumulates one or more stationary sounds in the storage 503 during the learning mode. Processor 501, in the operation mode, if the stationary sound of the sound data picked up by microphones 10A and 10B is similar to any of a plurality of stationary sounds accumulated in storage 503, that is, if the stationary sound is similar to one or more of the stationary sounds If there is a stationary sound with a high degree of similarity, it is determined that the target devices 100A and 100B are in a normal state. Further, the cloud server 50 determines that the target devices 100A and 100B are in an abnormal state when there is no stationary sound with a high degree of similarity among the plurality of stationary sounds. Therefore, the cloud server 50 can identify the normality/abnormality of the target devices 100A and 100B when the target devices are placed in another environment and similar to any stationary sound.

以上により、プロセッサ501は、学習モード中に定常音と判定された1以上の1フレーム期間の音データの中から2つ以上の定常音を正常音としてストレージ503に保存する。これにより、クラウドサーバ50のプロセッサ501は、学習モードにおいて、1以上の定常音を正常音としてストレージ503に記憶できる。したがって、プロセッサ501は、対象機器100A,100Bから発せられる音に異音が含まれるか否かを識別する際、比較の対象となる正常音を多く得ることができる。この場合、クラウドサーバ50は、学習モード時に複数の定常音の中からスペクトルパワーが最小である最小定常音を選択する処理を省くことができる。 As described above, the processor 501 stores two or more stationary sounds in the storage 503 as normal sounds from among the one or more one-frame period sound data determined to be stationary sounds during the learning mode. Thereby, the processor 501 of the cloud server 50 can store one or more stationary sounds in the storage 503 as normal sounds in the learning mode. Therefore, the processor 501 can obtain many normal sounds to be compared when identifying whether or not the sounds emitted from the target devices 100A and 100B include abnormal sounds. In this case, the cloud server 50 can omit the process of selecting the minimum stationary sound having the lowest spectral power from among the plurality of stationary sounds in the learning mode.

また、プロセッサ501は、運用モード中に定常音と判定された1フレーム期間の音データとストレージ503に記憶された2つ以上の正常音の音データとの比較に応じて、対象機器100A,100Bから発せられる音に異音が含まれるか否かを識別する。これにより、クラウドサーバ50のプロセッサ501は、複数の定常音の中に類似度が高い定常音が存在する場合、対象機器100A,100Bが正常状態であると識別する。一方、プロセッサ501は、複数の定常音の中に類似度が高い定常音が存在しない場合、対象機器100A,100Bが異常状態であると識別する。この場合、クラウドサーバ50のプロセッサ501は、運用モード時に複数の定常音の中からスペクトルパワーが最小である最小定常音を選択する処理を省くことができる。 In addition, the processor 501 compares the sound data of one frame period determined to be a stationary sound during the operation mode with the sound data of two or more normal sounds stored in the storage 503, and determines whether the target devices 100A and 100B Identify whether or not the sound emitted from the device contains an abnormal sound. Thereby, the processor 501 of the cloud server 50 identifies that the target devices 100A and 100B are in a normal state when there is a stationary sound with a high degree of similarity among the plurality of stationary sounds. On the other hand, the processor 501 identifies that the target devices 100A and 100B are in an abnormal state when there is no stationary sound with a high degree of similarity among the plurality of stationary sounds. In this case, the processor 501 of the cloud server 50 can omit the process of selecting the minimum stationary sound having the lowest spectral power from among the plurality of stationary sounds in the operation mode.

なお、クラウドサーバは、前記実施の形態1と同様、抽出された複数の定常音の中から最小定常音を正常音として学習し、運用モード時、現時点の最小定常音と正常音とを比較することで、対象機器100A,100Bの正常異常を識別してもよい。 Note that the cloud server learns the minimum stationary sound from among the plurality of extracted stationary sounds as a normal sound, and compares the current minimum stationary sound with the normal sound in the operation mode, as in the first embodiment. Thus, the normality/abnormality of the target devices 100A and 100B may be identified.

また、実施の形態2では、クラウドサーバ50が学習動作および運用動作を行う場合を示したが、情報処理装置30が、クラウドサーバ50と同様の学習動作および運用動作を行ってもよい。この場合、クラウドサーバ50を省くことができる。 Moreover, although the case where the cloud server 50 performs the learning operation and the operating operation has been described in the second embodiment, the information processing device 30 may perform the same learning operation and operating operation as the cloud server 50 does. In this case, the cloud server 50 can be omitted.

(実施の形態2の変形例)
また、クラウドサーバ50のプロセッサ501は、学習モード時、様々な環境(例えば、対象機器が設置された種々の場所)でマイク10,10Bにより収音された正常音をストレージ503に蓄積してもよい。運用モード時、クラウドサーバ50のプロセッサ501は、ストレージ503に蓄積された多くの正常音の音データを用いて、様々な環境において、対象機器100A,100Bの正常異常状態を識別できる。
(Modification of Embodiment 2)
In addition, during the learning mode, the processor 501 of the cloud server 50 accumulates normal sounds picked up by the microphones 10 and 10B in various environments (for example, various places where the target device is installed) in the storage 503. good. During the operation mode, the processor 501 of the cloud server 50 can identify the normal/abnormal states of the target devices 100A and 100B in various environments using a large amount of normal sound data accumulated in the storage 503 .

このように、ストレージ503は、複数の異なる環境に置かれた、対象機器100A,100Bから発せられる音の所定期間分の音データを記憶すると共に、環境ごとに、学習モード中に定常音と判定された1以上の1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶する。プロセッサ501は、学習モード時と異なる運用モード中に定常音と判定された1フレーム期間の音データとストレージ503に環境ごとに記憶された正常音の音データとの比較に応じて、対象機器100A,100Bから発せられる音に異音が含まれるか否かを識別する。 In this way, the storage 503 stores sound data for a predetermined period of sounds emitted from the target devices 100A and 100B placed in a plurality of different environments, and determines that the sound is stationary during the learning mode for each environment. At least one stationary sound is stored as a normal sound from among the sound data of one or more one frame period. The processor 501 compares the sound data of one frame period determined to be a steady sound during the operation mode different from the learning mode with the sound data of the normal sound stored for each environment in the storage 503, and determines whether the target device 100A , 100B includes an abnormal sound.

これにより、対象機器が様々な環境に置かれた場合であっても、クラウドサーバ50は、様々な環境に対応して対象機器100A,100Bの異常状態または正常状態を識別できる。 As a result, even when the target devices are placed in various environments, the cloud server 50 can identify the abnormal state or normal state of the target devices 100A and 100B corresponding to various environments.

以上、図面を参照しながら実施の形態について説明したが、本開示はかかる例に限定されないことはいうまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても当然に本開示の技術的範囲に属するものと了解される。また、発明の趣旨を逸脱しない範囲において、上述した実施の形態における各構成要素を任意に組み合わせてもよい。 Although the embodiments have been described above with reference to the drawings, it goes without saying that the present disclosure is not limited to such examples. It is obvious that a person skilled in the art can conceive of various modifications, modifications, substitutions, additions, deletions, and equivalents within the scope of the claims. Naturally, it is understood that it belongs to the technical scope of the present disclosure. Also, the components in the above-described embodiments may be combined arbitrarily without departing from the spirit of the invention.

本開示は、異常判定装置において、対象機器から収音される音に定常音だけでなく突発音などの外乱音が含まれる場合でも、収音された音に異音が含まれるか否かの識別精度を向上させることができ、有用である。 The present disclosure provides an anomaly determination device for determining whether or not an abnormal sound is included in a sound picked up from a target device, even when the sound picked up from a target device includes not only a stationary sound but also an external noise such as a sudden sound. It is useful because it can improve identification accuracy.

5 異音判定システム
10、10A、10B マイク
20 AD変換器
30 情報処理装置
50 クラウドサーバ
100 対象機器
301、501 プロセッサ
302、502 メモリ
303、503 ストレージ
304、504 通信部
305 操作部
306 ディスプレイ
307 入力部
5 Abnormal Sound Determination System 10, 10A, 10B Microphone 20 AD Converter 30 Information Processing Device 50 Cloud Server 100 Target Equipment 301, 501 Processor 302, 502 Memory 303, 503 Storage 304, 504 Communication Unit 305 Operation Unit 306 Display 307 Input Unit

Claims (9)

対象機器から発せられる音を収音するマイクに接続される入力部と、
前記対象機器から発せられる音の所定期間分の音データを記憶するメモリと、
前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するプロセッサと、を備え、
前記メモリは、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶し、
前記プロセッサは、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに記憶された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、
異音判定装置。
an input unit connected to a microphone that picks up sound emitted from the target device;
a memory for storing sound data for a predetermined period of sound emitted from the target device;
a processor that uses the sound data for the predetermined period and determines whether the sound corresponding to the sound data for the one frame period is a stationary sound or a sudden sound for each one frame period shorter than the predetermined period,
The memory stores at least one stationary sound as a normal sound from among the one or more of the one-frame-period sound data determined to be the stationary sound during the learning mode;
The processor compares the sound data of the one-frame period determined to be the stationary sound during an operation mode different from the learning mode with the sound data of the normal sound stored in the memory, and performs the target identify whether or not the sound emitted from the device contains abnormal noise;
Abnormal sound judgment device.
前記プロセッサは、前記対象機器から発せられる音に異音が含まれると識別した場合に、前記対象機器から発せられる音に異音が含まれる旨の異音検知通知をディスプレイに表示する、
請求項1に記載の異音判定装置。
When the processor identifies that the sound emitted from the target device includes an abnormal sound, the processor displays on the display an abnormal sound detection notification indicating that the sound emitted from the target device includes the abnormal sound.
The abnormal noise determination device according to claim 1.
前記プロセッサは、前記学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データのパワーが最小となる音データを検出し、その検出された音データを前記正常音の音データとして前記メモリに保存する、
請求項1に記載の異音判定装置。
The processor detects sound data having a minimum power of one or more of the sound data of the one-frame period determined as the stationary sound during the learning mode, and converts the detected sound data to the sound of the normal sound. store as data in said memory;
The abnormal noise determination device according to claim 1.
前記プロセッサは、前記運用モード中に前記定常音と判定された1以上の前記1フレーム期間の音データのパワーが最小となる音データを検出し、その検出された音データと前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、
請求項3に記載の異音判定装置。
The processor detects sound data having a minimum power among the one or more of the one-frame-period sound data determined to be the stationary sound during the operation mode, and detects the detected sound data and the normal sound. Identifying whether or not the sound emitted from the target device includes an abnormal sound according to the comparison with the data;
The abnormal noise determination device according to claim 3.
前記プロセッサは、前記学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から2つ以上の定常音を前記正常音として前記メモリに保存する、
請求項1に記載の異音判定装置。
The processor stores, in the memory, two or more stationary sounds from among the one or more of the one-frame-period sound data determined as the stationary sounds during the learning mode, as the normal sounds.
The abnormal noise determination device according to claim 1.
前記プロセッサは、前記運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに記憶された2つ以上の前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、
請求項5に記載の異音判定装置。
The processor compares the one-frame-period sound data determined to be the stationary sound during the operation mode with the sound data of the two or more normal sounds stored in the memory. identify whether or not the sound emitted from the
The abnormal noise determination device according to claim 5.
前記メモリは、複数の異なる環境に置かれた、前記対象機器から発せられる音の所定期間分の音データを記憶すると共に、前記環境ごとに、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶し、
前記プロセッサは、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに前記環境ごとに記憶された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、
請求項1に記載の異音判定装置。
The memory stores sound data for a predetermined period of sounds emitted from the target device placed in a plurality of different environments, and at least one sound determined to be the stationary sound during the learning mode for each of the environments. storing at least one stationary sound as a normal sound from the sound data of the one frame period of
The processor compares the sound data of the one-frame period determined as the stationary sound during an operation mode different from the learning mode with the sound data of the normal sound stored in the memory for each environment. to identify whether or not the sound emitted from the target device includes an abnormal sound;
The abnormal noise determination device according to claim 1.
異常判定装置により実行される異音判定方法であって、
対象機器から発せられる音を収音するマイクから、前記対象機器から発せられる音の所定期間分の音データを入力するステップと、
入力された前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するステップと、
学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から正常音として記憶された少なくとも1つの定常音を取得するステップと、
前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと取得された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別するステップと、を有する、
異音判定方法。
An abnormal noise determination method executed by an abnormality determination device,
a step of inputting sound data for a predetermined period of sound emitted from the target device from a microphone that picks up the sound emitted from the target device;
a step of determining whether the sound corresponding to the sound data for the one-frame period is a stationary sound or a sudden sound for each one-frame period shorter than the predetermined period, using the input sound data for the predetermined period;
acquiring at least one stationary sound stored as a normal sound from among the one or more frame period sound data determined as the stationary sound during the learning mode;
According to a comparison between the sound data of the one-frame period determined to be the stationary sound and the sound data of the normal sound acquired during the operation mode different from the learning mode, the sound emitted from the target device is different. and identifying whether sounds are included.
Abnormal sound judgment method.
対象機器から発せられる音を収音するマイクに接続される入力部と、
前記対象機器から発せられる音の所定期間分の音データを記憶するメモリと、
前記所定期間分の音データを用い、前記所定期間より短い1フレーム期間ごとに前記1フレーム期間の音データに対応する音が定常音あるいは突発音であるかを判定するコントローラと、を備え、
前記メモリは、学習モード中に前記定常音と判定された1以上の前記1フレーム期間の音データの中から少なくとも1つの定常音を正常音として記憶し、
前記コントローラは、前記学習モード時と異なる運用モード中に前記定常音と判定された前記1フレーム期間の音データと前記メモリに記憶された前記正常音の音データとの比較に応じて、前記対象機器から発せられる音に異音が含まれるか否かを識別する、
異音判定システム。
an input unit connected to a microphone that picks up sound emitted from the target device;
a memory for storing sound data for a predetermined period of sound emitted from the target device;
A controller that uses the sound data for the predetermined period and determines whether the sound corresponding to the sound data for the one frame period is a steady sound or a sudden sound for each one frame period shorter than the predetermined period,
The memory stores at least one stationary sound as a normal sound from among the one or more of the one-frame-period sound data determined to be the stationary sound during the learning mode;
The controller compares the sound data of the one-frame period determined to be the stationary sound during an operation mode different from the learning mode with the sound data of the normal sound stored in the memory, and performs the target identify whether or not the sound emitted from the device contains abnormal noise;
Abnormal sound judgment system.
JP2019088442A 2019-05-08 2019-05-08 Abnormal noise determination device, abnormal noise determination method, and abnormal noise determination system Active JP7253721B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019088442A JP7253721B2 (en) 2019-05-08 2019-05-08 Abnormal noise determination device, abnormal noise determination method, and abnormal noise determination system
PCT/JP2020/014717 WO2020226002A1 (en) 2019-05-08 2020-03-30 Abnormal sound determination device, abnormal sound determination method, and abnormal sound determination system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019088442A JP7253721B2 (en) 2019-05-08 2019-05-08 Abnormal noise determination device, abnormal noise determination method, and abnormal noise determination system

Publications (2)

Publication Number Publication Date
JP2020183904A JP2020183904A (en) 2020-11-12
JP7253721B2 true JP7253721B2 (en) 2023-04-07

Family

ID=73044240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019088442A Active JP7253721B2 (en) 2019-05-08 2019-05-08 Abnormal noise determination device, abnormal noise determination method, and abnormal noise determination system

Country Status (2)

Country Link
JP (1) JP7253721B2 (en)
WO (1) WO2020226002A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113791727B (en) * 2021-08-10 2023-03-24 广东省科学院智能制造研究所 Edge acquisition equipment applied to industrial acoustic intelligent sensing

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000298058A (en) 1999-04-14 2000-10-24 Rion Co Ltd Apparatus for analyzing environment noise
JP2007199017A (en) 2006-01-30 2007-08-09 Omron Corp Method and apparatus for clearing abnormal noise, and abnormal noise inspection apparatus
JP2008008708A (en) 2006-06-28 2008-01-17 Omron Corp Judgment knowledge creation system, judgment knowledge creation method, program, and recording medium
JP2009236645A (en) 2008-03-27 2009-10-15 Toshiba Tec Corp Sound evaluation method, sound evaluation apparatus and sound evaluation program
JP2010197124A (en) 2009-02-24 2010-09-09 Tokyo Electric Power Co Inc:The Apparatus, method and program for detecting abnormal noise
JP2011185846A (en) 2010-03-10 2011-09-22 Mitsubishi Electric Corp Reference value creation device and reference value creation method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5435742Y2 (en) * 1978-06-13 1979-10-30
JP2533942B2 (en) * 1989-03-13 1996-09-11 株式会社日立製作所 Knowledge extraction method and process operation support system
KR20180098921A (en) * 2017-02-27 2018-09-05 전자부품연구원 Home appliance failure diagnosis apparatus and method therefor

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000298058A (en) 1999-04-14 2000-10-24 Rion Co Ltd Apparatus for analyzing environment noise
JP2007199017A (en) 2006-01-30 2007-08-09 Omron Corp Method and apparatus for clearing abnormal noise, and abnormal noise inspection apparatus
JP2008008708A (en) 2006-06-28 2008-01-17 Omron Corp Judgment knowledge creation system, judgment knowledge creation method, program, and recording medium
JP2009236645A (en) 2008-03-27 2009-10-15 Toshiba Tec Corp Sound evaluation method, sound evaluation apparatus and sound evaluation program
JP2010197124A (en) 2009-02-24 2010-09-09 Tokyo Electric Power Co Inc:The Apparatus, method and program for detecting abnormal noise
JP2011185846A (en) 2010-03-10 2011-09-22 Mitsubishi Electric Corp Reference value creation device and reference value creation method

Also Published As

Publication number Publication date
JP2020183904A (en) 2020-11-12
WO2020226002A1 (en) 2020-11-12

Similar Documents

Publication Publication Date Title
WO2021107342A1 (en) Device and method for monitoring state of vibration of rotating equipment using deep learning-based time series analysis
JP7385381B2 (en) Abnormal sound detection system, pseudo sound generation system, and pseudo sound generation method
JP5197853B2 (en) Monitoring device
JP6527187B2 (en) Learning model construction device, anomaly detection device, anomaly detection system and server
WO2015029362A1 (en) Device control method and device control system
US20180027430A1 (en) Techniques for locating distributed antenna locations
KR20210049555A (en) System and method for determining situation of facility by imaging seinsing data of facility
JP7253721B2 (en) Abnormal noise determination device, abnormal noise determination method, and abnormal noise determination system
KR20170053304A (en) Sound spectrum sensor for abnormal state detection of transformer
CN116381563B (en) Underground power cable monitoring method and device
JP2018124852A (en) Information processing system, information processing method, and program
CN112067323B (en) Automatic inspection system
CA2933805A1 (en) Systems and methods for verification and anomaly detection using a mixture of hidden markov models
WO2018216258A1 (en) Processing device, processing method, and program
WO2015104804A1 (en) Signal processing system, signal processing method, and signal processing program
US20170299533A1 (en) Control apparatus for rotating device
WO2019235035A1 (en) Sound acquisition and analysis system and sound acquisition and analysis method
KR100492882B1 (en) Apparatus for security using an environmental sound
WO2021220116A1 (en) System and method for the detection and predictive analysis "in process" of vibrations and other physical quantities of plants, machinery and infrastructures, for maintenance purposes
JP2012244508A (en) Device information discrimination device
KR20040025149A (en) Security apparatus using an image and a sound of an environmental object
US20230161334A1 (en) Automatic inspection system and wireless slave device
KR20190111629A (en) Integrated monitoring system for plant
TWI823684B (en) Learning device, abnormal sign detection device, abnormal sign detection system, learning method and recording medium
CN116343445B (en) Internet of things equipment safety protection system and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230316

R150 Certificate of patent or registration of utility model

Ref document number: 7253721

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150