WO2016208173A1 - 信号検知装置、信号検知方法および記録媒体 - Google Patents

信号検知装置、信号検知方法および記録媒体 Download PDF

Info

Publication number
WO2016208173A1
WO2016208173A1 PCT/JP2016/002939 JP2016002939W WO2016208173A1 WO 2016208173 A1 WO2016208173 A1 WO 2016208173A1 JP 2016002939 W JP2016002939 W JP 2016002939W WO 2016208173 A1 WO2016208173 A1 WO 2016208173A1
Authority
WO
WIPO (PCT)
Prior art keywords
cross
correlation function
signal
background noise
calculating
Prior art date
Application number
PCT/JP2016/002939
Other languages
English (en)
French (fr)
Inventor
友督 荒井
裕三 仙田
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2017524632A priority Critical patent/JP6729577B2/ja
Priority to US15/736,380 priority patent/US20180188104A1/en
Publication of WO2016208173A1 publication Critical patent/WO2016208173A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H3/00Measuring characteristics of vibrations by using a detector in a fluid
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M3/00Investigating fluid-tightness of structures
    • G01M3/02Investigating fluid-tightness of structures by using fluid or vacuum
    • G01M3/04Investigating fluid-tightness of structures by using fluid or vacuum by detecting the presence of fluid at the leakage point
    • G01M3/24Investigating fluid-tightness of structures by using fluid or vacuum by detecting the presence of fluid at the leakage point using infrasonic, sonic, or ultrasonic vibrations
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/001Acoustic presence detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • G10K11/34Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
    • G10K11/341Circuits therefor
    • G10K11/346Circuits therefor using phase variation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements

Definitions

  • the present invention relates to a signal detection device, a signal detection method, and a recording medium.
  • Patent Document 1 discloses, as an example of a technique for detecting a change in the sound field in order to acoustically identify an abnormal operation of the device, an abnormality in the sound field based on an input signal of a microphone array.
  • a technique for determining whether it has occurred has been disclosed. Specifically, in Patent Document 1, after estimating the sound source direction at each time, the temporal change of the histogram of the sound source direction is calculated, and when a sound source direction with a large change is detected, the sound field direction is detected in the sound source direction. It is determined that there was an abnormality.
  • An object of the present invention is to provide a technique for solving the above-described problems.
  • a signal detection device includes: Signal input means for inputting signals obtained by a plurality of sensors; Cross-correlation function calculating means for calculating a cross-correlation function for each predetermined number of samples based on the signal; A background noise model deriving means for deriving a background noise model based on the cross-correlation function; Detection means for detecting a change in the signal based on a comparison between the value of the cross-correlation function and the background noise model; Is provided.
  • a signal detection method includes: Input signals acquired by multiple sensors, Based on the signal, a cross-correlation function is calculated for each predetermined number of samples, A background noise model is derived based on the cross-correlation function, A change in the signal is detected based on a comparison between the value based on the cross-correlation function and the background noise model.
  • a computer-readable recording medium comprises: A signal input step for inputting signals acquired by a plurality of sensors; A cross-correlation function calculating step for calculating a cross-correlation function for each predetermined number of samples based on the signal; A background noise model derivation step for deriving a background noise model based on the cross-correlation function; A detection step of detecting a change in the signal based on a comparison between the value of the cross-correlation function and the background noise model; A signal detection program for causing the computer to execute is stored.
  • the signal detection device 100 is a device that detects a change in a signal based on signals acquired by a plurality of sensors. As shown in FIG. 1, the signal detection device 100 includes a signal input unit 101, a cross-correlation function calculation unit 102, a background noise model derivation unit 103, and a detection unit 104.
  • the signal input unit 101 inputs signals acquired by the plurality of sensors 120.
  • the cross-correlation function calculation unit 102 calculates a cross-correlation function for each predetermined number of samples based on the signal input from the signal input unit 101.
  • the background noise model deriving unit 103 derives a background noise model based on the calculated cross correlation function.
  • the detection unit 104 detects a change in the signal based on the comparison between the value based on the cross-correlation function and the background noise model.
  • the sound field abnormality is detected based on the temporal change of the volume histogram in the sound source direction. It was difficult to detect changes.
  • the histogram changes due to the change in the volume, so that it may be erroneously detected as an abnormality of a sound source other than the existing sound source or a newly generated sound source.
  • FIG. 2 is a diagram for explaining an outline of the operation of the signal detection device 200 according to the present embodiment.
  • the signal detection apparatus 200 does not detect a change in sound in units of sound source directions, but detects a change in sound based on the overall change in the cross-correlation function.
  • the signal detection apparatus 200 represents the fluctuation of the cross-correlation function generated from an existing sound source as a background noise model. If there is a change in the cross-correlation function that does not match the background noise model, even a small change can be appropriately detected.
  • the correlation value of the arrival direction of the direct sound and the correlation value of the arrival direction of the reflected sound There is a correlation between If there is no change in this correlation, that is, if the correlation is maintained, it falls within the range of the background noise model, so it can be determined that no change has occurred in the cross-correlation function. However, if either one of the correlation values becomes high and the correlation collapses, it can be determined that a new sound source has appeared even if it is within the range of fluctuation when viewed individually. Therefore, it is possible to accurately detect a small change in the sound field due to a newly generated sound source.
  • FIG. 3 is a block diagram illustrating a functional configuration of the signal detection device 200 according to the present embodiment.
  • the signal detection device 200 includes a signal input unit 301, a cross-correlation function calculation unit 302, a background noise model derivation unit 303, and a change detection unit 304.
  • the signal input unit 301 inputs, for example, signals x 1 (t) and x 2 (t) measured in a steady state using a microphone array 320 including two microphones installed in the room 230.
  • t is a sample number.
  • the cross-correlation function calculation unit 302 uses the signals x 1 (t) and x 2 (t) from the two microphones input from the signal input unit 301 for each fixed number of samples T (hereinafter referred to as “frame”).
  • the cross-correlation function is calculated sequentially. If the current frame number is k, the cross-correlation function of the k-th frame can be calculated as a function of the number of lag samples ⁇ s using equation (1).
  • t k represents the sample number at the start of the k-th frame.
  • processing may be performed by applying a window function in advance, or equivalent processing may be performed in the frequency domain using FFT (Fast Fourier Transform).
  • FFT Fast Fourier Transform
  • equation (2) obtained by converting c (k, ⁇ s ) into a complex number, or an equation that takes the absolute value of equation (2) (3) may be calculated.
  • H (c (k, ⁇ s )) represents a Hilbert transform of c (k, ⁇ s ).
  • the past l frames from the current frame k are used as the evaluation target section [k ⁇ l + 1, k]. Further, it is used as a background noise model generation section [k ⁇ 1 ⁇ m + 1, k ⁇ 1] for modeling stationary noise (background noise) for the past m frames from the frame of the evaluation target section.
  • the number of frames m is set to be sufficiently longer than the occurrence time of sudden noise in order to suppress the influence of sudden noise in the background noise section.
  • the number of frames l may be 0, or may be 1 or more, but is preferably the number of frames corresponding to the time of occurrence of a change in the sound field (acoustic event) to be detected or shorter.
  • the background noise model deriving unit 303 derives a background noise model from the cross-correlation functions for the past m frames calculated by the cross-correlation function calculating unit 302. From the cross-correlation function c (j, ⁇ s ) (k ⁇ 1 ⁇ m + 1 ⁇ j ⁇ k ⁇ 1) in the background noise model generation section, the mean vector ⁇ in Equation (4) and the variance-covariance matrix in Equation (5) Calculate ⁇ .
  • y T represents the transposition of the column vector y
  • ⁇ s, i represents the i-th lag sample number
  • n is the maximum value (number of dimensions) of i , and can be the number of lag samples ⁇ s, i such that the sound source direction is in a range of ⁇ 90 degrees. Or the correlation between more reflected sounds and a direct sound can be considered by including even the range outside ⁇ 90 degree
  • n is at most twice the number T of frames per frame.
  • ⁇ pq is a covariance between the cross-correlation function c (k, ⁇ s, p ) of dimension p and the cross-correlation function c (k, ⁇ s, q ) of dimension q.
  • Change detection unit 304 a background noise model derived background noise model derivation unit 303, the cross-correlation function c (k, ⁇ s) of the current frame k from the distance D k between the change of the sound field Detect.
  • the Mahalanobis distance MD k is representative and is calculated from the equation (6).
  • the sound field changes in the frame k ⁇ 1 + 1. Judge that there was. Alternatively, it may be determined that the sound field has changed, for example, when a frame exceeding the threshold value r continues for a certain period of time.
  • the signal detection device 200 determines that a change in the sound field (acoustic event) has occurred in the time frame. Detect this. Moreover, since the change in the correlation between the sound source directions can be detected by using the Mahalanobis distance as the distance, even a sound event with a small volume can be detected.
  • FIG. 11 shows a schematic diagram in which a cross-correlation function for each sound source direction is plotted in a two-dimensional space.
  • a cross indicates a cross-correlation function (evaluation data) of the current frame, and a black dot plots the value of the cross-correlation function in the background noise model generation section.
  • the distance 1101 light gray range
  • the background noise model because the distance is calculated with the original coordinate axis indicated by the solid arrow. For this reason, the evaluation data cannot be detected by determining that it is within the range of the background noise model.
  • the Mahalanobis distance is calculated as a sum of square distances normalized by the variance of each axis after being converted into uncorrelated coordinates indicated by dotted arrows by principal component analysis. That is, a range 1102 (dark gray range) surrounded by a solid oval is regarded as a background noise model, and evaluation data can be detected as an acoustic event.
  • the volume change of the existing sound source itself does not change because the correlation does not change. Furthermore, even in an environment where there is a correlation between the arrival direction of the direct sound from the acoustic event and the arrival direction of the reflected sound, such as an indoor reverberation environment, a change in the sound field can be detected with high accuracy.
  • FIG. 4A is a diagram illustrating an example of the configuration of the frame table 401 provided in the signal detection device 200 according to the present embodiment.
  • the frame table 401 stores a cross-correlation function and a background noise model corresponding to the frame in association with the frame ID (Identifier) 411.
  • the signal detection apparatus 200 may calculate a cross-correlation function and derive a background noise model each time, but may calculate a cross-correlation function and derive a background noise model using the frame table 401.
  • FIG. 4B is a diagram illustrating an example of the configuration of the sensor performance table 402 included in the signal detection device 200 according to the present embodiment.
  • the sensor performance table 402 stores a frequency characteristic 422, an input sensitivity 423, a directivity characteristic 424, and the like in association with the sensor ID 421.
  • the frequency characteristic 422 includes a low frequency (kHz) and a high frequency (kHz).
  • the signal detection device 200 uses the sensor performance table 402 to grasp the characteristics of a signal input from a sensor such as a microphone, and calculates a cross-correlation function or derives a background noise model.
  • FIG. 5 is a block diagram showing a hardware configuration of the signal detection device 200 according to the present embodiment.
  • the signal detection apparatus 200 includes a CPU (Central Processing Unit) 501, a ROM (Read Only Memory) 502, a RAM (Random Access Memory) 503, a storage 504, and a communication control unit 505.
  • CPU Central Processing Unit
  • ROM Read Only Memory
  • RAM Random Access Memory
  • the CPU 501 is a processor for arithmetic processing, and implements each functional component of the signal detection device 200 by executing a program. Note that the number of CPUs 501 is not limited to one, and a plurality of CPUs 501 may be included, or a GPU (GraphicsGraphProcessing Unit) for image processing may be included.
  • the ROM 502 is a read only memory and stores programs such as firmware.
  • the communication control unit 505 communicates with other devices via a network. Further, the communication control unit 505 may include a CPU independent of the CPU 501 and write or read transmission / reception data to / from the RAM 503.
  • the RAM 503 is a random access memory that the CPU 501 uses as a work area for temporary storage.
  • the RAM 503 has an area for storing data necessary for realizing the present embodiment.
  • the signal detection device 200 temporarily stores the signal 531, the cross-correlation function 532, the background noise model 533, and the Mahalanobis distance 534.
  • the RAM 503 has an application execution area 535 for executing various application modules.
  • the storage 504 is a storage device that stores programs and databases necessary for realizing the present embodiment.
  • the storage 504 stores a frame table 401, a sensor performance table 402, a signal detection program 541, and a control program 545.
  • the signal detection program 541 stores a cross-correlation function calculation module 542 and a background noise model derivation module 543. These modules 542 and 543 are read by the CPU 501 into the application execution area 535 and executed.
  • the control program 545 is a program for controlling the entire signal detection device 200. Also, it is desirable to provide a DMAC (Direct Memory Access Controller) that transfers data between the RAM 503 and the storage 504 (not shown).
  • DMAC Direct Memory Access Controller
  • the RAM 503 and the storage 504 shown in FIG. 5 do not show programs and data related to general-purpose functions and other realizable functions of the signal detection device 200.
  • the hardware configuration of the signal detection device 200 described here is merely an example, and is not limited to this hardware configuration, and various hardware configurations can be used.
  • FIG. 6 is a flowchart for explaining the processing procedure of the signal detection device 200 according to the present embodiment. This flowchart is executed by the CPU 501 in FIG. 5 using the RAM 503, and implements each functional component in FIG.
  • step S601 the signal detection device 200 inputs a signal acquired by a sensor.
  • step S603 the signal detection apparatus 200 calculates a cross-correlation function for each predetermined number of samples.
  • step S605 the signal detection apparatus 200 derives a background noise model based on the calculated cross correlation function.
  • step S607 the signal detection device 200 compares the cross-correlation function with the background noise model.
  • step S609 the signal detection device determines whether the comparison result satisfies a predetermined condition. If the comparison result satisfies a predetermined condition, in step S611, the signal detection device 200 detects a change in the signal. If the comparison result does not satisfy the predetermined condition in step S609, the signal detection device 200 ends the process.
  • the change in the cross-correlation function is captured instead of detecting the change in the sound source direction unit, the variation of the cross-correlation function generated from the existing sound source is represented as a background noise model and matches the model.
  • the change in the cross-correlation function not detected can be detected even if it is small. Further, it is possible to accurately detect a small change in the sound field caused by a newly generated sound source other than the existing sound source.
  • FIG. 7 is a block diagram for explaining a functional configuration of the signal detection device 700 according to the present embodiment.
  • the signal detection device 700 according to the present embodiment is different from the second embodiment in that it includes a noise subtraction unit, a weight calculation unit, a weighted cross-correlation function calculation unit, and a direction estimation unit. Since other configurations and operations are the same as those of the second embodiment, the same configurations and operations are denoted by the same reference numerals, and detailed description thereof is omitted.
  • the signal detection apparatus 700 further includes a noise subtraction unit 701, a weight calculation unit 702, a weighted cross-correlation function calculation unit 703, and a direction estimation unit 704.
  • the noise subtraction unit 701 uses the background noise model derived by the background noise model deriving unit 303 to calculate the cross correlation function calculation unit 302.
  • the background noise component is subtracted from the cross-correlation function for 1 frame.
  • the cross-correlation function c f (i, ⁇ s ), (k ⁇ l + 1 ⁇ i ⁇ k) after noise subtraction for the frame number i is calculated by the equation (9).
  • s is a real number of 0 or more. As s increases, the component of the cross-correlation function deviates greatly from the background noise. In order to estimate the direction of a sound (target sound) that is smaller in the cross-correlation function, it is necessary to reduce s.
  • the weight calculation unit 702 calculates weights w (i) and (k ⁇ 1 + 1 ⁇ i ⁇ k).
  • the weight w (i) is calculated such that the higher the frame, the higher the signal-to-noise ratio (Signal-to-Noise ratio) of the cross-correlation function of the signal to be evaluated.
  • the signal is a direct sound
  • the noise is a sound of a component other than the direct sound, and includes, for example, a reflected sound and a sudden noise.
  • a weight proportional to the SN ratio may be calculated from the equation (10).
  • H is a real number of 0 or more.
  • h may be determined so as to satisfy Expression (11).
  • SN (i) represents the SN ratio, and is calculated from, for example, Expression (12).
  • the weight can also be obtained from Expression (13), which is a power of Expression (10).
  • the weighted cross-correlation function calculating unit 703 calculates a weighted cross-correlation function obtained by multiplying the cross-correlation function calculated by the noise subtracting unit 701 by the weight calculated by the weight calculating unit 702 based on Expression (14).
  • D is the distance between the two microphones, and ⁇ is the speed of sound.
  • FIG. 8 is a flowchart for explaining the processing procedure of the signal detection apparatus 700 according to this embodiment. This flowchart is executed by the CPU 501 in FIG. 5 using the RAM 503, and implements each functional component in FIG. Steps similar to those in FIG. 6 are assigned the same step numbers and description thereof is omitted.
  • step S801 the signal detection device 700 subtracts background noise from the cross-correlation function.
  • step S803 the signal detection device 700 calculates a weight based on the SN ratio, and multiplies the calculated weight by the cross-correlation function to calculate a weighted cross-correlation function.
  • step S805 the signal detection device 700 estimates the direction of the signal based on the weighted cross-correlation function.
  • a weighted cross-correlation function is calculated by applying a greater weight to a frame having a larger SN ratio, that is, a frame having a larger direct sound than the reflected sound. Estimate the sound source direction. Therefore, the influence of erroneous detection due to reflected sound can be suppressed. Therefore, the direction and position of the sound source can be accurately estimated even in a reverberant environment such as a room.
  • FIG. 9 is a block diagram for explaining a functional configuration of the signal detection apparatus 900 according to the present embodiment.
  • the signal detection apparatus 900 according to the present embodiment is different from the third embodiment in that a weight calculation unit 902 is provided instead of the weight calculation unit 702. Since other configurations and operations are the same as those of the third embodiment, the same configurations and operations are denoted by the same reference numerals and detailed description thereof is omitted.
  • the signal detection apparatus 900 includes a weight calculation unit 902.
  • the weight calculation unit 902 uses the Mahalanobis distance MD i calculated by the change detection unit 304 to calculate a weight according to Expression (16).
  • P is a real number
  • h is a real number of 0 or more.
  • FIG. 10 is a flowchart for explaining the processing procedure of the signal detection apparatus 900 according to this embodiment. This flowchart is executed by the CPU 501 in FIG. 5 using the RAM 503, and implements each functional component in FIG. Steps similar to those in FIG. 6 are assigned the same step numbers and description thereof is omitted.
  • step S1001 the signal detection apparatus 900 calculates a weight based on the Mahalanobis distance calculated by the change detection unit 304, and multiplies the calculated weight by the cross-correlation function to calculate a weighted cross-correlation function.
  • the direction of the sound source can be estimated.
  • the present invention may be applied to a system composed of a plurality of devices, or may be applied to a single device. Furthermore, the present invention can also be applied to a case where an information processing program that implements the functions of the embodiments is supplied directly or remotely to a system or apparatus. Therefore, in order to realize the functions of the present invention on a computer, a program installed on the computer, a medium storing the program, and a WWW (World Wide Web) server that downloads the program are also included in the scope of the present invention. . In particular, at least a non-transitory computer readable medium storing a program for causing a computer to execute the processing steps included in the above-described embodiments is included in the scope of the present invention.

Abstract

ヒストグラムの変化が小さい、小さな音であっても精度よく検知すること。 信号検知装置であって、複数のセンサにより取得した信号を入力する信号入力手段と、前記信号に基づいて、所定サンプル数ごとに相互相関関数を算出する相互相関関数算出手段と、前記相互相関関数に基づいて、背景雑音モデルを導出する背景雑音モデル導出手段と、前記相互相関関数と前記背景雑音モデルとの比較に基づいて、前記信号の変化を検知する検知手段と、を備える。

Description

信号検知装置、信号検知方法および記録媒体
 本発明は、信号検知装置、信号検知方法および記録媒体に関する。
 上記技術分野において、特許文献1には、機器の異常動作を音響的に識別するために、音場の変化を検知する技術の一例として、マイクロホンアレイの入力信号に基づいて、音場に異常が生じたか否かを判定する技術が開示されている。具体的には、特許文献1では、音源方向を各時間で推定した後、音源方向のヒストグラムの時間変化を算出し、変化が大きい音源方向が検知された場合に、その音源方向に音場の異常があったと判定する。
特許第5452158号公報
 しかしながら、上記文献に記載の技術では、小さな音はヒストグラムの変化が小さいため、精度よく検知することができなかった。
 本発明の目的は、上述の課題を解決する技術を提供することにある。
 上記目的を達成するため、本発明に係る信号検知装置は、
 複数のセンサにより取得した信号を入力する信号入力手段と、
 前記信号に基づいて、所定サンプル数ごとに相互相関関数を算出する相互相関関数算出手段と、
 前記相互相関関数に基づいて、背景雑音モデルを導出する背景雑音モデル導出手段と、
 前記相互相関関数による値と前記背景雑音モデルとの比較に基づいて、前記信号の変化を検知する検知手段と、
 を備える。
 上記目的を達成するため、本発明に係る信号検知方法は、
 複数のセンサにより取得した信号を入力し、
 前記信号に基づいて、所定サンプル数ごとに相互相関関数を算出し、
 前記相互相関関数に基づいて、背景雑音モデルを導出し、
 前記相互相関関数による値と前記背景雑音モデルとの比較に基づいて、前記信号の変化を検知する。
 上記目的を達成するため、本発明に係るコンピュータが読み取り可能な記録媒体は、
 複数のセンサにより取得した信号を入力する信号入力ステップと、
 前記信号に基づいて、所定サンプル数ごとに相互相関関数を算出する相互相関関数算出ステップと、
 前記相互相関関数に基づいて、背景雑音モデルを導出する背景雑音モデル導出ステップと、
 前記相互相関関数による値と前記背景雑音モデルとの比較に基づいて、前記信号の変化を検知する検知ステップと、
 をコンピュータに実行させる信号検知プログラムを格納する。
 本発明によれば、ヒストグラムの変化が小さい、小さな音であっても精度よく検知することができる。
本発明の第1実施形態に係る信号検知装置の構成を示すブロック図である。 本発明の第2実施形態に係る信号検知装置の動作の概要を説明するための図である。 本発明の第2実施形態に係る信号検知装置の構成を示すブロック図である。 本発明の第2実施形態に係る信号検知装置の備えるフレームテーブルの構成を示す図である。 本発明の第2実施形態に係る信号検知装置の備えるセンサ性能テーブルの構成を示す図である。 本発明の第2実施形態に係る信号検知装置のハードウェア構成を示すブロック図である。 本発明の第2実施形態に係る信号検知装置の処理手順を説明するフローチャートである。 本発明の第3実施形態に係る信号検知装置の構成を示すブロック図である。 本発明の第3実施形態に係る信号検知装置の処理手順を説明するフローチャートである。 本発明の第4実施形態に係る信号検知装置の構成を示すブロック図である。 本発明の第4実施形態に係る信号検知装置の処理手順を説明するフローチャートである。 本発明の第2実施形態に係る信号検知装置においてマハラノビス距離を用いることの効果を説明する図である。
 以下に、本発明を実施するための形態について、図面を参照して、例示的に詳しく説明記載する。ただし、以下の実施の形態に記載されている、構成、数値、処理の流れ、機能要素などは一例に過ぎず、その変形や変更は自由であって、本発明の技術範囲を以下の記載に限定する趣旨のものではない。なお、以下の説明では、センサとしてマイクロホン(マイク)を用いて、音声信号を取得する場合について説明をするが、これらには限定されない。例えば、振動センサやアンテナを用いて、可聴域を超える帯域の信号を取得することも可能である。
 [第1実施形態]
 本発明の第1実施形態としての信号検知装置100について、図1を用いて説明する。信号検知装置100は、複数のセンサで取得した信号に基づいて、信号の変化を検知する装置である。図1に示すように、信号検知装置100は、信号入力部101と、相互相関関数算出部102と、背景雑音モデル導出部103と、検知部104とを含む。
 信号入力部101は、複数のセンサ120により取得した信号を入力する。相互相関関数算出部102は、信号入力部101により入力した信号に基づいて、所定サンプル数ごとに相互相関関数を算出する。背景雑音モデル導出部103は、算出した相互相関関数に基づいて、背景雑音モデルを導出する。検知部104は、相互相関関数による値と背景雑音モデルとの比較に基づいて、信号の変化を検知する。
 本実施形態によれば、ヒストグラムの変化が小さい、小さな音であっても精度よく検知することができる。
 [第2実施形態]
 次に本発明の第2実施形態に係る信号検知装置200について、図2~図6を用いて説明する。
 <前提技術>
 まず、本実施形態の前提技術について説明する。マイクロホンアレイの入力信号から、音場に異常が生じたか否かを判定する方法として、例えば、特許文献1に記載の音響監視システムにおいては、音源方向を各時間で推定した後、音源方向の音量のヒストグラムの時間変化を算出する。そして、当該音響監視システムは、ヒストグラムの時間変化が大きい音源方向が検知された場合に、その音源方向に音場の異常があったと判定する。
 しかしながら、当該音響監視システムにおいては、音源方向の音量のヒストグラムの時間変化に基づいて、音場の異常を検知しているので、小さい音のように音量のヒストグラムの時間変化の小さな音では、その変化を検知することが困難であった。
 また、既存音源の音量が変化した場合、その音量の変化によって、ヒストグラムが変化するので、既存音源以外の音源や新たに発生した音源の異常として誤検知することがあった。
 <本実施形態の技術>
 図2は、本実施形態に係る信号検知装置200の動作の概要を説明するための図である。信号検知装置200は、音源の方向単位で音の変化を検知するのではなく、相互相関関数の全体的な変化に基づいて、音の変化を検知する。例えば、信号検知装置200は、既存の音源から生じる相互相関関数の変動を背景雑音モデルとして表している。そして、この背景雑音モデルに一致しない相互相関関数の変化があれば、小さな変化であっても適切に検知することができる。例えば、室内230などの音が反響したり、残響が生じたりする環境においては、センサ220で取得した音などの信号について、直接音の到来方向の相関値と反射音の到来方向の相関値との間に相関がある。この相関に変化がなければ、つまり、相関が維持されていれば、背景雑音モデルの範囲内に収まるので、相互相関関数に変化は生じていないと判断できる。しかしながら、どちらか一方の相関値が高くなって、相関が崩れれば、個別的に見て変動の範囲内であったとしても、新たな音源が出現したものと判断できる。したがって、新たに発生した音源による小さな音場の変化を精度よく検知できる。
 図3は、本実施形態に係る信号検知装置200の機能構成を示すブロック図である。信号検知装置200は、信号入力部301と、相互相関関数算出部302と、背景雑音モデル導出部303と、変化検知部304とを備える。信号入力部301は、例えば、室内230に設置した2つのマイクロホンを備えたマイクロホンアレイ320を用いて、定常時に測定された信号x1(t)、x2(t)を入力する。ここで、tはサンプル番号である。
 相互相関関数算出部302は、信号入力部301で入力された2つのマイクロホンからの信号x1(t)、x2(t)から、一定のサンプル数T(以下、「フレーム」という)ごとに、逐次、相互相関関数を算出する。現在のフレーム番号をkとすると、k番目のフレームの相互相関関数は、ラグサンプル数τsの関数として、式(1)を用いて算出できる。
Figure JPOXMLDOC01-appb-M000001
 ここで、tkはk番目のフレームの始端のサンプル番号を表す。相互相関関数の算出では、事前に窓関数をかけて処理したり、FFT(Fast Fourier Transform)を用いて周波数領域で等価的に処理したりしてもよい。あるいは、式(1)の相互相関関数の代わりに、例えば、以下に示した、c(k,τs)を複素数に変換した式(2)や、式(2)の絶対値を取った式(3)を算出してもよい。これらの数式を用いることで、音場の微小な変動に影響されにくい、より安定した相関検出を行うことができる。
Figure JPOXMLDOC01-appb-M000002
Figure JPOXMLDOC01-appb-M000003
 ただし、jは虚数単位を表し、H(c(k,τs))は、c(k,τs)をヒルベルト変換したものを表す。
 以後の処理では、現在のフレームkから過去lフレーム分を評価対象区間[k-l+1,k]として利用する。また、評価対象区間のフレームよりも過去mフレーム分について、定常的な雑音(背景雑音)をモデル化する背景雑音モデル生成区間[k-l-m+1,k-l]として利用する。
 フレーム数mは、背景雑音区間における突発雑音の影響を抑制するため、突発雑音の発生時間より十分長くなるように設定する。フレーム数lは、0としてもよいし、1以上としてもよいが、検出したい音場の変化(音響イベント)の発生時間に相当するフレーム数か、またはそれよりも短くするのが望ましい。
 背景雑音モデル導出部303は、相互相関関数算出部302で算出された、過去mフレーム分の相互相関関数から、背景雑音モデルを導出する。背景雑音モデル生成区間の相互相関関数c(j,τs)(k-l-m+1≦j≦k-l)から、式(4)の平均ベクトルμと、式(5)の分散共分散行列Σを算出する。
Figure JPOXMLDOC01-appb-M000004
Figure JPOXMLDOC01-appb-M000005
 ここでyTは列ベクトルyの転置を表し、τs,iは、i番目のラグサンプル数を表す。nは、iの最大値(次元数)であり、音源方向が±90度の範囲となるようなラグサンプル数τs,iの個数とすることができる。あるいは、±90度より外側の範囲まで含めることで、より多くの反射音と直接音との間の相関を考慮することができる。
 nは、最大でも1フレームあたりのフレーム数Tの2倍である。また、νpqは、次元pの相互相関関数c(k,τs,p)と、次元qの相互相関関数c(k,τs,q)との間の共分散である。
 変化検知部304は、背景雑音モデル導出部303で導出された背景雑音モデルと、現在のフレームkの相互相関関数c(k,τs)との間の距離Dkから、音場の変化を検知する。距離Dkとしては、マハラノビス距離MDkが代表的であり、式(6)より算出する。
Figure JPOXMLDOC01-appb-M000006
 距離Dkが、評価対象区間[k-l+1,k]の全てのフレームで事前に設定した閾値rを超える場合、つまり、式(7)を満たす場合に、フレームk-l+1で音場の変化があったと判断する。また、閾値rを超えるフレームが一定時間以上継続した場合などに音場の変化があったと判断してもよい。
Figure JPOXMLDOC01-appb-M000007
 相互相関関数が次元nの正規分布をする場合、D2は、自由度nのχ2分布に従う。χ2分布の累積分布関数は、式(8)で表される。
Figure JPOXMLDOC01-appb-M000008
 ここで、γは、不完全ガンマ関数であり、Γは、ガンマ関数である。この性質を利用して、閾値rを音場の変化(音響イベント)の誤検知をどの程度許容できるかに応じて決めてもよい。例えば、閾値r=√zとすれば、(1-F(z;n))*100[%]の誤検知を許容することになる。
 以上のように、本実施形態に係る信号検知装置200は、背景雑音モデルからの距離(ズレ)が大きい場合に、その時間フレームにおいて、音場の変化(音響イベント)が発生したと判断して、これを検知する。また、距離としては、マハラノビス距離を利用することで、音源方向間の相関関係の変化を検知できるので、音量の小さな音響イベントであっても検知できる。
 マハラノビス距離の効果を詳細に説明するため、図11に音源方向ごとの相互相関関数を2次元空間にプロットした模式図を示す。×印は現フレームの相互相関関数(評価データ)であり、黒い点は背景雑音モデル生成区間の相互相関関数の値をプロットしたものである。例えばユークリッド距離の場合、実線の矢印で示した元の座標軸で距離を算出するため、点線の円で囲った範囲1101(薄いグレーの範囲)が背景雑音モデルとみなされる。そのため、評価データは背景雑音モデルの範囲内と判断して検知することができない。一方、マハラノビス距離は、主成分分析により点線の矢印で示す互いに無相関の座標に変換してから、各軸の分散で正規化した平方距離の和として算出される。つまり実線の楕円で囲った範囲1102(濃いグレーの範囲)が背景雑音モデルとみなされ、評価データを音響イベントとして検知することができる。
 また、既存音源自体の音量変化は、相関関係が変化しないので、これを誤って検知することがない。さらに、室内の残響環境のように、音響イベントからの直接音の到来方向と、反射音の到来方向との間に相関がある環境においても、精度よく音場の変化を検知することができる。
 図4Aは、本実施形態に係る信号検知装置200が備えるフレームテーブル401の構成の一例を示す図である。フレームテーブル401は、フレームID(Identifier)411に関連付けて、そのフレームに対応する相互相関関数と背景雑音モデルとを記憶する。信号検知装置200は、その都度相互相関関数を算出し、背景雑音モデルを導出してもよいが、フレームテーブル401を用いて、相互相関関数を算出し、背景雑音モデルを導出してもよい。
 図4Bは、本実施形態に係る信号検知装置200の備えるセンサ性能テーブル402の構成の一例を示す図である。センサ性能テーブル402は、センサID421に関連付けて、周波数特性422や入力感度423、指向特性424などを記憶する。周波数特性422には、低域(kHz)と高域(kHz)とが含まれている。信号検知装置200は、センサ性能テーブル402を用いて、例えば、マイクなどのセンサから入力される信号の特徴などを把握し、相互相関関数を算出したり、背景雑音モデルを導出したりする。
 図5は、本実施形態に係る信号検知装置200のハードウェア構成を示すブロック図である。信号検知装置200は、CPU(Central Processing Unit)501と、ROM(Read Only Memory)502と、RAM(Random Access Memory)503と、ストレージ504と、通信制御部505とを備える。
 CPU501は、演算処理用のプロセッサであり、プログラムを実行することにより信号検知装置200の各機能構成部を実現する。なお、CPU501は1個には限定されず、複数個あってもよく、また、画像処理用のGPU(Graphics Processing Unit)を含んでもよい。ROM502は、リードオンリメモリであり、ファームウェアなどのプログラムを記憶する。
 通信制御部505は、ネットワークを介して他の機器などと通信する。また、通信制御部505は、CPU501とは独立したCPUを備えて、RAM503に送受信データを書き込みまたは読み出ししてもよい。
 RAM503は、CPU501が一時記憶用のワークエリアとして使用するランダムアクセスメモリである。RAM503には、本実施形態の実現に必要なデータを記憶する領域がある。このようなデータとして、信号検知装置200は、信号531と、相互相関関数532と、背景雑音モデル533と、マハラノビス距離534とを一時的に保存する。また、RAM503は、各種アプリケーションモジュールを実行するためのアプリケーション実行領域535を有する。
 ストレージ504は、本実施形態の実現に必要なプログラムやデータベースなどを記憶する記憶デバイスである。ストレージ504は、フレームテーブル401と、センサ性能テーブル402と、信号検知プログラム541と、制御プログラム545と、を格納する。
 信号検知プログラム541は、相互相関関数算出モジュール542と、背景雑音モデル導出モジュール543とを格納している。これらのモジュール542、543は、CPU501によりアプリケーション実行領域535に読み出され、実行される。制御プログラム545は、信号検知装置200の全体を制御するためのプログラムである。また、RAM503とストレージ504との間でデータを転送するDMAC(Direct Memory Access Controller)を設けるのが望ましい(図示なし)。
 なお、図5に示したRAM503やストレージ504には、信号検知装置200が有する汎用の機能や他の実現可能な機能に関するプログラムやデータは図示されていない。また、ここで説明した信号検知装置200のハードウェア構成は一例に過ぎないので、このハードウェア構成には限定されず、様々なハードウェア構成とすることができる。
 図6は、本実施形態に係る信号検知装置200の処理手順を説明するフローチャートである。このフローチャートは、図5のCPU501が、RAM503を使用して実行し、図3の各機能構成部を実現する。
 ステップS601において、信号検知装置200は、センサにより取得した信号を入力する。ステップS603において、信号検知装置200は、所定サンプル数ごとに相互相関関数を算出する。ステップS605において、信号検知装置200は、算出した相互相関関数に基づいて、背景雑音モデルを導出する。ステップS607において、信号検知装置200は、相互相関関数と背景雑音モデルとを比較する。ステップS609において、信号検知装置は、比較の結果が所定の条件を満たすか否かを判断する。比較結果が所定の条件を満たす場合は、ステップS611において、信号検知装置200は、信号の変化を検知する。ステップS609において、比較結果が所定の条件を満たさない場合は、信号検知装置200は、処理を終了する。
 本実施形態によれば、音源方向単位に変化を検知するのではなく、相互相関関数の全体的変化を捉えるので、既存音源から生じる相互相関関数の変動は背景雑音モデルとして表され、モデルに一致しない相互相関関数の変化は、小さくても検知することができる。また、既存音源以外の新たに発生した音源による小さな音場の変化を精度よく検知できる。
 [第3実施形態]
 次に本発明の第3実施形態に係る信号検知装置700について、図7および図8を用いて説明する。図7は、本実施形態に係る信号検知装置700の機能構成を説明するためのブロック図である。本実施形態に係る信号検知装置700は、上記第2実施形態と比べると、雑音減算部、重み算出部、重み付き相互相関関数算出部および方向推定部を有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 信号検知装置700は、雑音減算部701と、重み算出部702と、重み付き相互相関関数算出部703と、方向推定部704とをさらに備える。
 雑音減算部701は、変化検知部304において、音場の変化(音響イベント)を検知した場合、背景雑音モデル導出部303で導出した背景雑音モデルを用いて、相互相関関数算出部302で算出したlフレーム分の相互相関関数から背景雑音成分を減算する。例えば、式(9)によりフレーム番号iの雑音減算後の相互相関関数cf(i,τs),(k-l+1≦i≦k)を算出する。
Figure JPOXMLDOC01-appb-M000009
 ただし、sは、0以上の実数である。sが大きいほど背景雑音から大きく外れた相互相関関数の成分を残すことになる。相互相関関数により小さい音(目的音)の方向を推定したい場合は、sを小さくする必要がある。
 重み算出部702は、重みw(i),(k-l+1≦i≦k)を算出する。重みw(i)は、評価対象の信号の相互相関関数の信号対雑音比(SN比:Signal-to-Noise ratio)が高いフレームほど大きくなるように算出される。ここでいう信号とは直接音であり、雑音とは直接音以外の成分の音であり、例えば、反射音や突発的な雑音を含む。
 例えば、単純な方法としては、SN比が不明として、全てのフレームでw(i)=1とする。あるいは、SN比があらかじめ定めた閾値以上の場合は、w(i)=1とし、閾値未満の場合は、w(i)=0とする。また、これとは異なり、SN比に比例する重みを式(10)から算出してもよい。
Figure JPOXMLDOC01-appb-M000010
 hは、0以上の実数である。例えば、hは、式(11)を満たすように決定してもよい。
Figure JPOXMLDOC01-appb-M000011
 SN(i)は、SN比を表し、例えば、式(12)から算出する。
Figure JPOXMLDOC01-appb-M000012
 重みは、式(10)の累乗である式(13)から求めることもできる。
Figure JPOXMLDOC01-appb-M000013
 重み付き相互相関関数算出部703は、雑音減算部701で算出した相互相関関数に、重み算出部702で算出した重みをかけた重み付き相互相関関数を、式(14)に基づいて算出する。
Figure JPOXMLDOC01-appb-M000014
 方向推定部704は、重み付き相互相関関数cw(k,τs)が、最大値または閾値以上の値をとるラグサンプル数τs=Γsを用いて、式(15)から音源方向θを推定する。
Figure JPOXMLDOC01-appb-M000015
 dは、2つのマイク間の距離であり、νは音速である。
 図8は、本実施形態に係る信号検知装置700の処理手順を説明するフローチャートである。このフローチャートは、図5のCPU501が、RAM503を使用して実行し、図7の各機能構成部を実現する。なお、図6と同様のステップに同じステップ番号を付けて説明を省略する。
 ステップS801において、信号検知装置700は、相互相関関数から背景雑音を減算する。ステップS803において、信号検知装置700は、SN比に基づいて、重みを算出し、算出した重みを相互相関関数に乗じて重み付き相互相関関数を算出する。ステップS805において、信号検知装置700は、重み付き相互相関関数に基づいて、信号の方向を推定する。
 本実施形態によれば、SN比が大きいフレーム、つまり、反射音に対して直接音が大きなフレームほど大きな重みをかけた重み付き相互相関関数を算出し、算出した重み付き相互相関関数に基づいて音源方向を推定する。したがって、反射音による誤検知の影響を抑制することができる。よって、室内などの残響環境においても、精度よく音源の方向や位置を推定することができる。
 [第4実施形態]
 次に本発明の第4実施形態に係る信号検知装置900について、図9および図10を用いて説明する。図9は、本実施形態に係る信号検知装置900の機能構成を説明するためのブロック図である。本実施形態に係る信号検知装置900は、上記第3実施形態と比べると、重み算出部702に代えて重み算出部902を備える点で異なる。その他の構成および動作は、第3実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 信号検知装置900は、重み算出部902を備える。重み算出部902は、変化検知部304で算出したマハラノビス距離MDiを用いて、式(16)により重みを算出する。
Figure JPOXMLDOC01-appb-M000016
 pは、実数であり、hは、0以上の実数である。
 図10は、本実施形態に係る信号検知装置900の処理手順を説明するフローチャートである。このフローチャートは、図5のCPU501が、RAM503を使用して実行し、図7の各機能構成部を実現する。なお、図6と同様のステップに同じステップ番号を付けて説明を省略する。
 ステップS1001において、信号検知装置900は、変化検知部304で算出したマハラノビス距離に基づいて、重みを算出し、算出した重みを相互相関関数に乗じて、重み付き相互相関関数を算出する。
 本実施形態によれば、マハラノビス距離が大きいフレームに対して大きな重みをかけた重み付き相互相関関数を用いるので、音源の方向を推定することができる。
 [他の実施形態]
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
 また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。特に、少なくとも、上述した実施形態に含まれる処理ステップをコンピュータに実行させるプログラムを格納した非一時的コンピュータ可読媒体(non-transitory computer readable medium)は本発明の範疇に含まれる。
 [実施形態の他の表現]
 上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
 複数のセンサにより取得した信号を入力する信号入力手段と、
 前記信号に基づいて、所定サンプル数ごとに相互相関関数を算出する相互相関関数算出手段と、
 前記相互相関関数に基づいて、背景雑音モデルを導出する背景雑音モデル導出手段と、
 前記相互相関関数による値と前記背景雑音モデルとの比較に基づいて、前記信号の変化を検知する検知手段と、
 を備える信号検知装置。
(付記2)
 前記検知手段で前記信号の変化を検出した場合に、前記背景雑音モデルに基づいて特定される背景雑音を前記相互相関関数から減算した、背景雑音減算相互相関関数を算出する背景雑音減算手段と、
 前記背景雑音減算相互相関関数から算出される信号対雑音比に基づいて、前記所定サンプル数ごとの重みを算出する重み算出手段と、
 前記背景雑音減算相互相関関数に前記重みを乗じて重み付き相互相関関数を算出する重み付き相互相関関数算出手段と、
 前記重み付き相互相関関数に基づいて、前記信号の方向を推定する方向推定手段と、
 をさらに備える付記1に記載の信号検知装置。
(付記3)
 前記検知手段で前記信号の変化を検出した場合に、前記背景雑音モデルに基づいて特定される背景雑音を前記相互相関関数から減算した、背景雑音減算相互相関関数を算出する背景雑音減算手段と、
 前記背景雑音減算相互相関関数と前記背景雑音モデルとの距離に基づいて、前記所定サンプル数ごとの重みを算出する重み算出手段と、
 前記背景雑音減算相互相関関数に前記重みを乗じて重み付き相互相関関数を算出する重み付き相互相関関数算出手段と、
 前記重み付き相互相関関数に基づいて、前記信号の方向を推定する方向推定手段と、
 をさらに備える付記1に記載の信号検知装置。
(付記4)
 前記距離は、前記背景雑音モデルと前記相互相関関数との間のマハラノビス距離である付記3に記載の信号検知装置。
(付記5)
 前記検知手段は、前記マハラノビス距離が所定の閾値を超えるフレームが一定時間以上継続した場合に信号の変化を検知する付記4に記載の信号検知装置。
(付記6)
 前記方向推定手段は、信号の変化が検知された場合、前記重み付き相互相関関数が最大になるラグサンプル数に基づいて、信号の方向を推定する付記2乃至5のいずれか1項に記載の信号検知装置。
(付記7)
 前記方向推定手段は、信号の変化が検知された場合、前記相互相関関数が最大になるラグサンプル数に基づいて、信号の方向を推定する請求項2乃至5のいずれか1項に記載の信号検知装置。
(付記8)
 前記重み算出手段は、前記背景雑音減算相互相関関数の最大値の二乗を信号パワーとし、前記背景雑音減算相互相関関数の二乗和を信号雑音パワーとした場合に、前記信号パワーを前記信号雑音パワーで除して得られる信号対雑音比基づいて、前記所定のサンプル数ごとの重みを算出する、付記2または6に記載の信号検知装置。
(付記9)
 前記重み算出手段は、前記信号対雑音比が所定の閾値以上の場合に重みを1とし、所定の閾値未満の場合に重みを0とする、付記2または6に記載の信号検知装置。
(付記10)
 前記背景雑音モデル導出手段は、前記背景雑音モデルに基づいて、平均および分散共分散行列を算出する付記1乃至9のいずれか1項に記載の信号検知装置。
(付記11)
 複数のセンサにより取得した信号を入力する信号入力ステップと、
 前記信号に基づいて、所定サンプル数ごとに相互相関関数を算出する相互相関関数算出ステップと、
 前記相互相関関数に基づいて、背景雑音モデルを導出する背景雑音モデル導出ステップと、
 前記相互相関関数による値と前記背景雑音モデルとの比較に基づいて、前記信号の変化を検知する検知ステップと、
 を含む信号検知方法。
(付記12)
 複数のセンサにより取得した信号を入力する信号入力ステップと、
 前記信号に基づいて、所定サンプル数ごとに相互相関関数を算出する相互相関関数算出ステップと、
 前記相互相関関数に基づいて、背景雑音モデルを導出する背景雑音モデル導出ステップと、
 前記相互相関関数による値と前記背景雑音モデルとの比較に基づいて、前記信号の変化を検知する検知ステップと、
 をコンピュータに実行させる信号検知プログラム。
 この出願は、2015年6月26日に出願された日本出願特願2015-128481を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (10)

  1.  複数のセンサにより取得した信号を入力する信号入力手段と、
     前記信号に基づいて、所定サンプル数ごとに相互相関関数を算出する相互相関関数算出手段と、
     前記相互相関関数に基づいて、背景雑音モデルを導出する背景雑音モデル導出手段と、
     前記相互相関関数による値と前記背景雑音モデルとの比較に基づいて、前記信号の変化を検知する検知手段と、
     を備える信号検知装置。
  2.  前記検知手段で前記信号の変化を検出した場合に、前記背景雑音モデルに基づいて特定される背景雑音を前記相互相関関数から減算した、背景雑音減算相互相関関数を算出する背景雑音減算手段と、
     前記背景雑音減算相互相関関数から算出される信号対雑音比に基づいて、前記所定サンプル数ごとの重みを算出する重み算出手段と、
     前記背景雑音減算相互相関関数に前記重みを乗じて重み付き相互相関関数を算出する重み付き相互相関関数算出手段と、
     前記重み付き相互相関関数に基づいて、前記信号の方向を推定する方向推定手段と、
     をさらに備える請求項1に記載の信号検知装置。
  3.  前記検知手段で前記信号の変化を検出した場合に、前記背景雑音モデルに基づいて特定される背景雑音を前記相互相関関数から減算した、背景雑音減算相互相関関数を算出する背景雑音減算手段と、
     前記背景雑音減算相互相関関数と前記背景雑音モデルとの距離に基づいて、前記所定サンプル数ごとの重みを算出する重み算出手段と、
     前記背景雑音減算相互相関関数に前記重みを乗じて重み付き相互相関関数を算出する重み付き相互相関関数算出手段と、
     前記重み付き相互相関関数に基づいて、前記信号の方向を推定する方向推定手段と、
     をさらに備える請求項1に記載の信号検知装置。
  4.  前記距離は、前記背景雑音モデルと前記相互相関関数との間のマハラノビス距離である請求項3に記載の信号検知装置。
  5.  前記検知手段は、前記マハラノビス距離が所定の閾値を超えるフレームが一定時間以上継続した場合に信号の変化を検知する請求項4に記載の信号検知装置。
  6.  前記方向推定手段は、信号の変化が検知された場合、前記重み付き相互相関関数が最大になるラグサンプル数に基づいて、信号の方向を推定する請求項2乃至5のいずれか1項に記載の信号検知装置。
  7.  前記重み算出手段は、前記背景雑音減算相互相関関数の最大値の二乗を信号パワーとし、前記背景雑音減算相互相関関数の二乗和を信号雑音パワーとした場合に、前記信号パワーを前記信号雑音パワーで除して得られる信号対雑音比に基づいて、前記所定サンプル数ごとの重みを算出する、請求項2に記載の信号検知装置。
  8.  前記背景雑音モデル導出手段は、前記背景雑音モデルに基づいて、平均および分散共分散行列を算出する請求項1乃至7のいずれか1項に記載の信号検知装置。
  9.  複数のセンサにより取得した信号を入力し、
     前記信号に基づいて、所定サンプル数ごとに相互相関関数を算出し、
     前記相互相関関数に基づいて、背景雑音モデルを導出し、
     前記相互相関関数による値と前記背景雑音モデルとの比較に基づいて、前記信号の変化を検知する、
     信号検知方法。
  10.  複数のセンサにより取得した信号を入力する信号入力ステップと、
     前記信号に基づいて、所定サンプル数ごとに相互相関関数を算出する相互相関関数算出ステップと、
     前記相互相関関数に基づいて、背景雑音モデルを導出する背景雑音モデル導出ステップと、
     前記相互相関関数による値と前記背景雑音モデルとの比較に基づいて、前記信号の変化を検知する検知ステップと、
     をコンピュータに実行させる信号検知プログラムを格納する、コンピュータが読み取り可能な記録媒体。
PCT/JP2016/002939 2015-06-26 2016-06-20 信号検知装置、信号検知方法および記録媒体 WO2016208173A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017524632A JP6729577B2 (ja) 2015-06-26 2016-06-20 信号検知装置、信号検知方法およびプログラム
US15/736,380 US20180188104A1 (en) 2015-06-26 2016-06-20 Signal detection device, signal detection method, and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015128481 2015-06-26
JP2015-128481 2015-06-26

Publications (1)

Publication Number Publication Date
WO2016208173A1 true WO2016208173A1 (ja) 2016-12-29

Family

ID=57585343

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/002939 WO2016208173A1 (ja) 2015-06-26 2016-06-20 信号検知装置、信号検知方法および記録媒体

Country Status (3)

Country Link
US (1) US20180188104A1 (ja)
JP (1) JP6729577B2 (ja)
WO (1) WO2016208173A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018159744A1 (ja) * 2017-03-02 2018-09-07 日本電気株式会社 計測時間特定装置、検知装置、計測時間特定方法及びコンピュータ読み取り可能記録媒体

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022501080A (ja) * 2018-06-06 2022-01-06 インサイテック・リミテッド 改良された反射自動集束
CN113984387B (zh) * 2021-08-10 2022-12-27 江苏大学 一种变转速工况下轴承故障特征提取的广义自相关方法
CN115586493A (zh) * 2022-12-12 2023-01-10 杭州兆华电子股份有限公司 一种基于gcc-path方法的噪声定位方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002062348A (ja) * 2000-08-24 2002-02-28 Sony Corp 信号処理装置及び信号処理方法
JP2010517047A (ja) * 2007-01-26 2010-05-20 マイクロソフト コーポレーション マルチセンサ音源定位
JP2012181280A (ja) * 2011-02-28 2012-09-20 Sogo Keibi Hosho Co Ltd 音処理装置および音処理方法
WO2014050923A1 (ja) * 2012-09-28 2014-04-03 日本電気株式会社 漏洩判定方法、漏洩判定システム、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002062348A (ja) * 2000-08-24 2002-02-28 Sony Corp 信号処理装置及び信号処理方法
JP2010517047A (ja) * 2007-01-26 2010-05-20 マイクロソフト コーポレーション マルチセンサ音源定位
JP2012181280A (ja) * 2011-02-28 2012-09-20 Sogo Keibi Hosho Co Ltd 音処理装置および音処理方法
WO2014050923A1 (ja) * 2012-09-28 2014-04-03 日本電気株式会社 漏洩判定方法、漏洩判定システム、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018159744A1 (ja) * 2017-03-02 2018-09-07 日本電気株式会社 計測時間特定装置、検知装置、計測時間特定方法及びコンピュータ読み取り可能記録媒体
JPWO2018159744A1 (ja) * 2017-03-02 2020-01-09 日本電気株式会社 計測時間特定装置、検知装置、計測時間特定方法及びプログラム
JP7070540B2 (ja) 2017-03-02 2022-05-18 日本電気株式会社 計測時間特定装置、検知装置、計測時間特定方法及びプログラム
US11448565B2 (en) 2017-03-02 2022-09-20 Nec Corporation Measurement time determination device, measurement time determination method, and computer-readable recording medium

Also Published As

Publication number Publication date
US20180188104A1 (en) 2018-07-05
JP6729577B2 (ja) 2020-07-22
JPWO2016208173A1 (ja) 2018-04-19

Similar Documents

Publication Publication Date Title
US11398235B2 (en) Methods, apparatuses, systems, devices, and computer-readable storage media for processing speech signals based on horizontal and pitch angles and distance of a sound source relative to a microphone array
JP6413741B2 (ja) 振動発生源推定装置、方法およびプログラム
US9560441B1 (en) Determining speaker direction using a spherical microphone array
WO2016208173A1 (ja) 信号検知装置、信号検知方法および記録媒体
Dorfan et al. Tree-based recursive expectation-maximization algorithm for localization of acoustic sources
CN104166804B (zh) 一种基于时频域单源点稀疏成分分析的工作模态辨识方法
JP5862023B2 (ja) 目標追跡システム及び目標追跡方法
JP2019502195A (ja) 時間的因果グラフにおける異常フュージョン
WO2021008000A1 (zh) 语音唤醒方法、装置及电子设备、存储介质
US11074344B2 (en) Methods and apparatus to detect side-channel attacks
JP7021053B2 (ja) 監視システム、プログラム、及び記憶媒体
US20160094812A1 (en) Method And System For Mobile Surveillance And Mobile Infant Surveillance Platform
WO2018008708A1 (ja) 震央距離推定装置、震央距離推定方法、及びコンピュータ読み取り可能な記録媒体
JP2017102085A (ja) 情報処理装置、情報処理方法及びプログラム
WO2020024816A1 (zh) 音频信号处理方法、装置、设备和存储介质
US11310593B2 (en) Voice input device and method for estimation of utterance direction
KR101817011B1 (ko) 군집화 특성 기반의 능동소나 클러터 제거 방법 및 장치
JPWO2018037643A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP4952950B2 (ja) 非日常音検出システム
JP2019066339A (ja) 音による診断装置、診断方法、および診断システム
KR20160128759A (ko) 무선 센서 네트워크 장치 및 그 제어방법
JP6545950B2 (ja) 推定装置、推定方法、およびプログラム
JP2011139409A (ja) 音響信号処理装置、音響信号処理方法、及びコンピュータプログラム
RU170249U1 (ru) Устройство для температурно-инвариантной аудиовизуальной локализации источника голоса
WO2019097412A1 (en) System and method for multimedia-based performance monitoring of an equipment

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16813945

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017524632

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16813945

Country of ref document: EP

Kind code of ref document: A1