WO2012042611A1 - 呼吸検出装置および呼吸検出方法 - Google Patents

呼吸検出装置および呼吸検出方法 Download PDF

Info

Publication number
WO2012042611A1
WO2012042611A1 PCT/JP2010/066959 JP2010066959W WO2012042611A1 WO 2012042611 A1 WO2012042611 A1 WO 2012042611A1 JP 2010066959 W JP2010066959 W JP 2010066959W WO 2012042611 A1 WO2012042611 A1 WO 2012042611A1
Authority
WO
WIPO (PCT)
Prior art keywords
frequency spectrum
respiration
cross
correlation
frequency
Prior art date
Application number
PCT/JP2010/066959
Other languages
English (en)
French (fr)
Inventor
鈴木 政直
田中 正清
大田 恭士
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to JP2012536058A priority Critical patent/JP5494813B2/ja
Priority to PCT/JP2010/066959 priority patent/WO2012042611A1/ja
Publication of WO2012042611A1 publication Critical patent/WO2012042611A1/ja
Priority to US13/780,274 priority patent/US20130178756A1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/08Detecting, measuring or recording devices for evaluating the respiratory organs
    • A61B5/0816Measuring devices for examining respiratory frequency
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/08Detecting, measuring or recording devices for evaluating the respiratory organs
    • A61B5/0826Detecting or evaluating apnoea events
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7246Details of waveform analysis using correlation, e.g. template matching or determination of similarity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7253Details of waveform analysis characterised by using transforms
    • A61B5/7257Details of waveform analysis characterised by using transforms using Fourier transforms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7282Event detection, e.g. detecting unique waveforms indicative of a medical condition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/003Detecting lung or respiration noise

Definitions

  • the present invention relates to a respiration detection device and a respiration detection method.
  • Other conventional techniques for detecting respiration include collecting sounds around the subject while the subject is sleeping, and determining a section where the subject is breathing as a section where the subject is breathing.
  • the period in which a section with sound appears is detected as the pace of breathing, and when silence occurs at the timing of breathing, the section with silence is detected as the apnea section.
  • the present invention has been made in view of the above, and an object thereof is to provide a respiration detection device and a respiration detection method capable of accurately detecting a respiration sound.
  • the disclosed respiratory detection device divides the input sound signal into a plurality of frames and converts the frequency of each frame, thereby obtaining a frequency and a signal intensity for each frequency.
  • a spectrum calculation unit for calculating the associated frequency spectrum is provided. Further, the disclosed respiratory detection device shifts the frequency spectrum of the predetermined frame calculated by the spectrum calculation unit in the frequency direction, and indicates how well the frequency spectrum before the shift and the frequency spectrum after the shift match.
  • a harmonic structure calculation unit for calculating the first similarity is provided.
  • the disclosed respiratory detection device includes a cross-correlation calculation unit that calculates a second similarity by calculating a cross-correlation between the frequency spectrum of the predetermined frame and the frequency spectrum of a frame past the predetermined frame.
  • the disclosed respiration detection apparatus includes a respiration determination unit that determines whether or not a frequency spectrum of a predetermined frame indicates respiration based on the first similarity and the second similarity.
  • the disclosed respiratory detection device has an effect of accurately detecting a respiratory sound.
  • FIG. 1 is a diagram illustrating a configuration of a respiration detection device according to the present embodiment.
  • FIG. 2 is a diagram for explaining an autocorrelation calculation method.
  • FIG. 3 is a diagram illustrating an example of autocorrelation.
  • FIG. 4 is a diagram showing a frequency spectrum of speech.
  • FIG. 5 is a diagram showing a frequency spectrum of respiratory sounds.
  • FIG. 6 is a diagram for explaining cross-correlation of speech.
  • FIG. 7 is a diagram for explaining the cross-correlation of respiratory sounds.
  • FIG. 8 is a diagram showing the relationship between autocorrelation and cross-correlation between voice and breathing sound.
  • FIG. 9 is a diagram illustrating an example of the relationship between time and cross-correlation.
  • FIG. 1 is a diagram illustrating a configuration of a respiration detection device according to the present embodiment.
  • FIG. 2 is a diagram for explaining an autocorrelation calculation method.
  • FIG. 3 is a diagram illustrating an example of autocor
  • FIG. 10 is a diagram illustrating an example of a frequency spectrum of speech and a frequency spectrum of respiration.
  • FIG. 11 is a diagram illustrating an example of speech autocorrelation and respiration autocorrelation.
  • FIG. 12 is a diagram illustrating an example of cross-correlation of speech and cross-correlation of respiration.
  • FIG. 13 is a flowchart illustrating a processing procedure of the respiration detection device.
  • FIG. 1 is a diagram illustrating a configuration of a respiration detection device according to the present embodiment.
  • the respiration detection device 100 includes a frame dividing unit 110, an FFT (Fast Fourier Transform) processing unit 120, a harmonic structure estimation unit 130, a cross-correlation estimation unit 140, and a respiration detection unit 150. And an average respiration spectrum estimation unit 160.
  • FFT Fast Fourier Transform
  • the frame dividing unit 110 is a processing unit that divides an input signal into a plurality of frames.
  • the frame dividing unit 110 outputs the divided frames to the FFT processing unit 120 in time series order.
  • the input signal is an audio signal obtained by collecting sounds around the subject with a microphone.
  • the frame dividing unit 110 divides the input signal into a plurality of frames having a predetermined number N of samples.
  • N is a natural number.
  • the FFT processing unit 120 is a processing unit that calculates a frequency spectrum by extracting how many frequency components are included in the input signal.
  • the FFT processing unit 120 outputs the frequency spectrum to the harmonic structure estimation unit 130, the cross-correlation estimation unit 140, and the average respiratory spectrum estimation unit 160.
  • the harmonic structure estimation unit 130 is a processing unit that calculates an autocorrelation of a frequency spectrum.
  • the harmonic structure estimation unit 130 obtains the autocorrelation Acor (d) based on the equation (2).
  • d is a variable representing delay.
  • the harmonic structure estimation unit 130 changes the value of d from 6 to 20, and obtains an autocorrelation Acor (d) for each different delay d.
  • the harmonic structure estimation unit 130 obtains the maximum autocorrelation Acor (d1) among the values of each autocorrelation Acor (d).
  • d1 indicates a delay at which autocorrelation is maximized.
  • the harmonic structure estimation unit 130 outputs the autocorrelation Acor (d1) to the respiration detection unit 150.
  • FIG. 2 is a diagram for explaining an autocorrelation calculation method.
  • autocorrelation means calculating the product sum of the frequency spectrum s (f + d) and the frequency spectrum s (f) delayed by d.
  • the range a in FIG. 2 corresponds to the autocorrelation calculation range.
  • FIG. 3 is a diagram showing an example of autocorrelation.
  • the vertical axis in FIG. 3 represents the autocorrelation value, and the horizontal axis corresponds to the delay d.
  • the autocorrelation Acor (d1) of the delay d1 is compared with the autocorrelation Acor (d2) of the delay d2, the autocorrelation Acor (d1) of the delay d1 is larger. For this reason, autocorrelation Acor (d1) becomes the maximum value.
  • the autocorrelation value differs between the case where the input signal includes sound and the case where respiration is included, as described below.
  • FIG. 4 is a diagram showing a frequency spectrum of voice.
  • the vertical axis in FIG. 4 represents the power corresponding to the magnitude of the frequency component, and the horizontal axis represents the frequency. Since voice is accompanied by vocal cord vibration, it has a harmonic structure. For this reason, the frequency spectrum shifted in the frequency direction and the frequency spectrum before the shift are well matched, and the autocorrelation value is increased.
  • FIG. 5 is a diagram showing a frequency spectrum of respiratory sounds.
  • the vertical axis in FIG. 5 represents the power corresponding to the magnitude of the frequency component, and the horizontal axis represents the frequency. Since respiration does not involve vocal cord vibration, there is no harmonic structure. For this reason, the frequency spectrum shifted in the frequency direction and the frequency spectrum before the shift do not match much, and the autocorrelation value becomes small.
  • the harmonic structure estimation unit 130 may obtain the autocorrelation based on the equation (3) instead of the equation (2).
  • Expression (3) it is possible to remove the influence of the offset of the frequency spectrum s (f).
  • s ( ⁇ 1) 0.
  • the cross-correlation estimation unit 140 is a processing unit that obtains a cross-correlation between an average of frequency spectra of past frames including respiratory sounds and a frequency spectrum of the current frame.
  • the cross-correlation estimating unit 140 obtains the cross-correlation Ccor (n) based on the equation (4).
  • the cross correlation estimation unit 140 outputs the cross correlation Ccor (n) to the respiration detection unit 150.
  • S ave (f) is a frequency spectrum obtained by averaging the frequency spectra of past frames including respiratory sounds.
  • the averaged frequency spectrum is expressed as an average respiratory spectrum.
  • the cross-correlation estimation unit 140 acquires the average respiration spectrum S ave (f) from the average respiration spectrum estimation unit 160.
  • the cross-correlation value is large when features with the same frequency spectrum appear periodically like respiration. On the other hand, when the characteristic of the same frequency spectrum does not appear periodically like speech, the value of cross-correlation becomes small.
  • FIG. 6 is a diagram for explaining the cross-correlation of speech.
  • the vertical axis in FIG. 6 represents the cross-correlation value, and the horizontal axis represents the delay of the past frame to be compared with the current frame.
  • the cross-correlation of speech is a small value.
  • FIG. 7 is a diagram for explaining the cross-correlation of respiratory sounds.
  • the vertical axis in FIG. 7 indicates the cross-correlation value, and the horizontal axis indicates the delay of the past frame to be compared with the current frame. As shown in FIG. 7, the cross-correlation of breathing sound has a large value.
  • the cross-correlation estimating unit 140 may obtain the cross-correlation based on the equation (5) instead of the equation (4).
  • Expression (5) it is possible to remove the influence of the offset of the frequency spectrum s (f).
  • the respiration detection unit 150 is a processing unit that determines whether or not a respiration sound is included in the current frame based on the autocorrelation Acor (d1) and the cross-correlation Ccor (n).
  • FIG. 8 is a diagram showing the relationship between autocorrelation and cross-correlation between voice and breathing sound. As shown in FIG. 8, the autocorrelation of the voice increases and the cross-correlation of the voice decreases. On the other hand, the autocorrelation of the respiratory sound is reduced and the cross correlation of the respiratory sound is increased.
  • the respiration detection unit 150 determines whether or not a respiration sound is included in the current frame using the relationship illustrated in FIG.
  • the respiration detection unit 150 has a magnitude relationship between the autocorrelation Acor (d1) and the cross-correlation Ccor (n).
  • Cross-correlation Ccor (n)> autocorrelation Acor (d1) Is determined to contain a breathing sound in the current frame.
  • the respiration detecting unit 150 obtains the determination threshold Th based on the formula (6).
  • is a constant and is set to a value of 1 to 10.
  • Th ⁇ ⁇ Acor (d1) (6)
  • the respiration detection unit 150 After obtaining the threshold value Th, the respiration detection unit 150 compares the value of Ccor (n) with the threshold value Th, and if the value of Ccor (n) is greater than the threshold value Th, the current frame includes a respiratory sound. It is determined that On the other hand, when the value of Ccor (n) is equal to or smaller than the threshold value Th, it is determined that no respiratory sound is included in the current frame.
  • FIG. 9 is a diagram showing an example of the relationship between time and cross-correlation.
  • the vertical axis in FIG. 9 indicates cross-correlation Ccor (n), and the horizontal axis in FIG. 9 indicates time.
  • the respiration detection unit 150 determines that the sound is a breathing sound in the region 2a that is larger than the threshold Th, and determines that the sound is other than the breathing in the region 2b that is equal to or less than the threshold Th.
  • the respiration detection unit 150 determines that the current frame contains a respiration sound, the respiration detection unit 150 outputs the current frame to the average respiration spectrum estimation unit 160.
  • the average respiratory spectrum estimation unit 160 is a processing unit that calculates an average respiratory spectrum S ave (f) by averaging frames including respiratory sounds.
  • the average respiratory spectrum estimation unit 160 updates the average respiratory spectrum S ave (f) based on Expression (7), and outputs the updated average respiratory spectrum to the cross-correlation estimation unit 140.
  • ⁇ in Expression (7) is a constant and is set to a value of 0 to 1.
  • FIG. 10 is a diagram illustrating an example of a frequency spectrum of speech and a frequency spectrum of respiration.
  • the upper part of FIG. 10 shows the frequency spectrum 5a of speech, and the lower part shows the frequency spectrum 6a of respiration.
  • the horizontal axis is the time axis, and the vertical axis indicates the magnitude of the frequency.
  • signals of each frequency are generated irregularly.
  • signals of each frequency are periodically generated.
  • signals of each frequency are generated in the time zones 7a to 7e.
  • FIG. 11 is a diagram illustrating an example of speech autocorrelation and respiration autocorrelation.
  • the left side of FIG. 11 shows speech autocorrelation 10a, and the right side shows respiration autocorrelation 10b.
  • the horizontal axis indicates the delay, and the vertical axis indicates the magnitude of the autocorrelation.
  • the maximum value of the autocorrelation is 0.4.
  • the maximum value of the autocorrelation is 0.2. For this reason, the maximum value of the speech autocorrelation 10a is larger than the maximum value of the respiration autocorrelation 10b.
  • FIG. 12 is a diagram illustrating an example of cross-correlation of speech and cross-correlation of respiration.
  • the upper part of FIG. 12 shows voice cross-correlation 11a, and the lower part shows respiration cross-correlation 11b.
  • the horizontal axis indicates the frame number, and the vertical axis indicates the magnitude of the cross correlation.
  • the threshold 12a of the voice cross-correlation 11a is a threshold calculated based on the autocorrelation of the voice. For example, if the maximum value of the autocorrelation of speech is 0.35 and the value of ⁇ is 5.0, the threshold 12a is 1.75. As shown in FIG. 12, the voice cross-correlation 11a does not exceed the threshold 12a.
  • the threshold 12b of the respiration cross-correlation 11b is a threshold calculated based on the autocorrelation of respiration. For example, when the maximum value of respiration autocorrelation is 0.20 and the value of ⁇ is 5.0, the threshold value 12b is 1.00. As shown in FIG. 12, the reciprocal correlation 11b exceeds the threshold value 12b at the timing of respiration.
  • FIG. 13 is a flowchart illustrating a processing procedure of the respiration detection device. The process illustrated in FIG. 13 is executed when an input signal is input to the respiration detection device 100, for example.
  • the respiration detection device 100 acquires an input signal (step S101), and divides the input signal into a plurality of frames (step S102).
  • the respiration detection apparatus 100 calculates a frequency spectrum (step S103) and calculates an autocorrelation (step S104).
  • the respiration detection apparatus 100 calculates the cross-correlation (step S105), and determines a threshold based on the maximum value of the autocorrelation (step S106). The respiration detection apparatus 100 compares the cross-correlation and the threshold value to detect whether a respiration sound is included (step S107), and outputs a detection result (step S108).
  • the respiration detection apparatus 100 determines whether or not a respiration sound is included in the frame based on the autocorrelation and cross-correlation of the input signal, so that the respiration can be accurately performed without being affected by noise. A frame containing sound can be detected.
  • the respiration detection apparatus 100 obtains an average respiration spectrum by weighted averaging of a frequency spectrum of a frame including a respiration sound, and obtains a cross-correlation between the frequency spectrum of the current frame and the average respiration spectrum. For this reason, the error of the frequency spectrum of the past frame including the breathing sound can be eliminated, and the cross-correlation can be accurately obtained.
  • the respiration detection apparatus 100 compares the value obtained by multiplying the autocorrelation value by ⁇ with the cross-correlation value, and determines whether or not a respiration sound is included in the current frame. By adjusting the value of ⁇ , it is possible to accurately determine whether or not a respiratory sound is included in the current frame under various environments.
  • each component of the respiration detection apparatus 100 shown in FIG. 1 is functionally conceptual, and does not necessarily need to be physically configured as illustrated. That is, the specific form of distribution and integration of the respiration detection device 100 is not limited to the illustrated one, and all or a part of the respiration detection device 100 can be functionally or physically functioned in an arbitrary unit according to various loads or usage conditions. It can be configured to be distributed and integrated.
  • the harmonic structure estimator 130, the cross-correlation estimator 140, the respiration detector 150, and the average respiration spectrum estimator 160 are implemented in different devices, and each device cooperates to include a respiratory sound in the frame. It may be determined whether or not.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Surgery (AREA)
  • Veterinary Medicine (AREA)
  • General Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Physiology (AREA)
  • Biophysics (AREA)
  • Pulmonology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

 呼吸音は、自己相関が小さく、相互相関が大きいという特性を利用して現フレームに呼吸音が含まれるか否かを判定する。具体的に、調波構造推定部(130)が、現フレームの周波数スペクトルに基づいて、自己相関を求める。相互相関推定部(140)は、現フレームの周波数スペクトルと呼吸音を含む過去のフレームの周波数スペクトルとの相互相関を求める。呼吸検出部(150)は、自己相関の値を定数倍した値と相互相関の値とを比較し、相互相関の値が大きい場合に現フレームに呼吸音が含まれていると判定する。

Description

呼吸検出装置および呼吸検出方法
 本発明は、呼吸検出装置および呼吸検出方法に関する。
 近年、睡眠中に呼吸が止まる「睡眠時無呼吸」が注目されており、正確かつ容易に睡眠中の呼吸状態を検出することが望まれている。呼吸を検出する従来技術には、対象者の入力音声を周波数変換し、各周波数成分の大きさと閾値とを比較することで、寝息、いびき、爆音などを検出するものがある。
 呼吸を検出するその他の従来技術としては、対象者が眠っている間に対象者周囲の音を集音し、有音となる区間を対象者が呼吸している区間として判定するものがある。この従来技術では、有音となる区間が現れる周期を呼吸のペースとして検出し、呼吸を行うべきタイミングで無音となった場合に、この無音となる区間を無呼吸区間として検出している。
特開2007-289660号公報 特開2009-219713号公報
 しかしながら、上述した従来の技術では、呼吸音を精度良く検出することができないという問題があった。
 周波数成分の大きさと固定の閾値とを比較して呼吸を検出する技術では、対象者周辺の雑音の影響により、対象者が呼吸をしていると誤って判定してしまう場合があった。また、有音、無音に基づいて対象者の呼吸を判定する技術では、対象者から集音した音に雑音が含まれていないことが前提になっているため、雑音が発生する環境下では、正確に呼吸音を検出することができない。
 本発明は、上記に鑑みてなされたものであって、正確に呼吸音を検出することができる呼吸検出装置および呼吸検出方法を提供することを目的とする。
 上述した課題を解決し、目的を達成するために、開示の呼吸検出装置は、入力音信号を複数のフレームに分割し各フレームを周波数変換することで、周波数と該周波数毎の信号強度とを対応づけた周波数スペクトルを算出するスペクトル算出部を備える。また、開示の呼吸検出装置は、前記スペクトル算出部が算出した所定のフレームの周波数スペクトルを周波数方向にシフトし、シフト前の周波数スペクトルとシフト後の周波数スペクトルとがどの程度よく整合するのかを示す第1類似度を算出する調波構造算出部を備える。また、開示の呼吸検出装置は、前記所定のフレームの周波数スペクトルと、該所定のフレームより過去のフレームの周波数スペクトルとの相互相関を求めることで第2類似度を算出する相互相関算出部を備える。また、開示の呼吸検出装置は、前記第1類似度および前記第2類似度を基にして、所定のフレームの周波数スペクトルが呼吸を示すものであるか否かを判定する呼吸判定部を備える。
 開示の呼吸検出装置は、正確に呼吸音を検出することができるという効果を奏する。
図1は、本実施例にかかる呼吸検出装置の構成を示す図である。 図2は、自己相関の算出方法を説明するための図である。 図3は、自己相関の例を示す図である。 図4は、音声の周波数スペクトルを示す図である。 図5は、呼吸音の周波数スペクトルを示す図である。 図6は、音声の相互相関を説明する図である。 図7は、呼吸音の相互相関を説明する図である。 図8は、音声および呼吸音の自己相関および相互相関の関係を示す図である。 図9は、時間と相互相関との関係の一例を示す図である。 図10は、音声の周波数スペクトルおよび呼吸の周波数スペクトルの一例を示す図である。 図11は、音声の自己相関および呼吸の自己相関の一例を示す図である。 図12は、音声の相互相関および呼吸の相互相関の一例を示す図である。 図13は、呼吸検出装置の処理手順を示すフローチャートである。
 以下に、本発明にかかる呼吸検出装置および呼吸検出方法の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
 本実施例にかかる呼吸検出装置の構成について説明する。図1は、本実施例にかかる呼吸検出装置の構成を示す図である。図1に示すように、この呼吸検出装置100は、フレーム分割部110と、FFT(Fast Fourier Transform)処理部120と、調波構造推定部130と、相互相関推定部140と、呼吸検出部150と、平均呼吸スペクトル推定部160とを有する。
 フレーム分割部110は、入力信号を複数のフレームに分割する処理部である。フレーム分割部110は、分割したフレームを時系列順にFFT処理部120に出力する。例えば、入力信号は、対象者周辺の音をマイクで集音した音声信号とする。
 フレーム分割部110は、入力信号を所定のサンプル数Nからなる複数のフレームに分割する。Nは自然数である。分割された第nフレーム目の入力信号をxn(t)とする。なお、t=0、1、・・・、N-1とする。
 FFT処理部120は、入力信号の中にどの周波数成分がどれだけ含まれているのかを抽出することで、周波数スペクトルを算出する処理部である。FFT処理部120は、周波数スペクトルを調波構造推定部130、相互相関推定部140、平均呼吸スペクトル推定部160に出力する。
 ここで、入力信号xn(t)の周波数スペクトルをs(f)とする。f=0、1、・・・、K-1とする。KはFFT点数である。入力信号のサンプリング周波数を16kHzとした場合には、Kの値は例えば256となる。
 FFT処理部120が算出する周波数スペクトルf(s)は、実数部をRe(f)、虚数部をIm(f)とすると、式(1)で表すことができる。
s(f)=|Re(f)+Im(f)|・・・(1)
 調波構造推定部130は、周波数スペクトルの自己相関を求める処理部である。調波構造推定部130は、式(2)に基づいて自己相関Acor(d)を求める。
Figure JPOXMLDOC01-appb-M000001
 式(2)において、dは遅延を表す変数である。入力信号のサンプリング周波数を16kHz、FFT点数を256とした場合には、とした場合には、遅延dの値は6~20となる。調波構造推定部130は、dの値を6~20まで変化させ、異なる遅延d毎に自己相関Acor(d)を求める。調波構造推定部130は、各自己相関Acor(d)の値のうち、最大となる自己相関Acor(d1)を求める。ここで、d1は自己相関が最大となる遅延を示す。調波構造推定部130は、自己相関Acor(d1)を呼吸検出部150に出力する。
 自己相関の算出方法について説明する。図2は、自己相関の算出方法を説明するための図である。図2に示すように、自己相関は、周波数スペクトルs(f+d)と、dだけ遅延させた周波数スペクトルs(f)との積和を計算することを意味する。図2の範囲aは、自己相関の計算範囲に対応する。
 図3は、自己相関の例を示す図である。図3の縦軸は自己相関の値を示し、横軸は遅延dに対応する。遅延d1の自己相関Acor(d1)と遅延d2の自己相関Acor(d2)とを比較すると、遅延d1の自己相関Acor(d1)の方が大きい。このため、自己相関Acor(d1)が最大値となる。入力信号に音声が含まれている場合と呼吸が含まれている場合とでは、下記に説明するように自己相関の値が異なる。
 図4は、音声の周波数スペクトルを示す図である。図4の縦軸は、周波数成分の大きさに対応する電力であり、横軸は周波数を示す。音声は声帯振動を伴うため、調波構造となる。このため、周波数方向にシフトした周波数スペクトルとシフトする前の周波数スペクトルとがよく整合し、自己相関の値が大きくなる。
 図5は、呼吸音の周波数スペクトルを示す図である。図5の縦軸は、周波数成分の大きさに対応する電力であり、横軸は周波数を示す。呼吸は声帯振動を伴わないので、調波構造がない。このため、周波数方向にシフトした周波数スペクトルとシフトする前の周波数スペクトルとがあまり整合せず、自己相関の値が小さくなる。
 ところで、調波構造推定部130は、式(2)の代わりに、式(3)を基にして自己相関を求めても良い。式(3)を利用することにより、周波数スペクトルs(f)のオフセットの影響を取り除くことができる。ただし、s(-1)=0とする。
Figure JPOXMLDOC01-appb-M000002
 図1の説明に戻る。相互相関推定部140は、呼吸音を含む過去のフレームの周波数スペクトルを平均したものと現在のフレームの周波数スペクトルとの相互相関を求める処理部である。相互相関推定部140は、式(4)に基づいて相互相関Ccor(n)を求める。相互相関推定部140は、相互相関Ccor(n)を呼吸検出部150に出力する。
Figure JPOXMLDOC01-appb-M000003
 式(4)において、Save(f)は、呼吸音を含む過去のフレームの周波数スペクトルを平均した周波数スペクトルである。平均した周波数スペクトルを平均呼吸スペクトルと表記する。相互相関推定部140は、平均呼吸スペクトルSave(f)を平均呼吸スペクトル推定部160から取得する。
 相互相関の値は、呼吸のように周期的に同じ周波数スペクトルの特徴が現れる場合には大きな値となる。これに対して、音声のように周期的に同じ周波数スペクトルの特徴が現れない場合には、相互相関の値が小さくなる。
 図6は、音声の相互相関を説明する図である。図6の縦軸は、相互相関の値を示し、横軸は、現在のフレームの比較対象となる過去フレームの遅延を示す。図6に示すように、音声の相互相関は小さい値となる。
 図7は、呼吸音の相互相関を説明する図である。図7の縦軸は、相互相関の値を示し、横軸は、現在のフレームの比較対象となる過去フレームの遅延を示す。図7に示すように、呼吸音の相互相関は大きな値となる。
 ところで、相互相関推定部140は、式(4)の代わりに、式(5)を基にして相互相関を求めても良い。式(5)を利用することにより、周波数スペクトルs(f)のオフセットの影響を取り除くことができる。ただし、s(-1)=save(-1)=0とする。
Figure JPOXMLDOC01-appb-M000004
 呼吸検出部150は、自己相関Acor(d1)と相互相関Ccor(n)とを基にして、現フレームに呼吸音が含まれるか否かを判定する処理部である。図8は、音声および呼吸音の自己相関および相互相関の関係を示す図である。図8に示すように、音声の自己相関は大きくなり、音声の相互相関は小さくなる。これに対して、呼吸音の自己相関は小さくなり、呼吸音の相互相関は大きくなる。呼吸検出部150は、図8に示した関係を利用して、現フレームに呼吸音が含まれるか否かを判定する。すなわち、呼吸検出部150は、自己相関Acor(d1)と相互相関Ccor(n)との大小関係が、
相互相関Ccor(n)>自己相関Acor(d1)
となる場合に、現フレームに呼吸音が含まれると判定する。以下に、呼吸検出部150の処理を詳細に説明する。
 呼吸検出部150は、式(6)に基づいて判定閾値Thを求める。式(6)のβは定数であり、1~10の値に設定される。
Th=β×Acor(d1)・・・(6)
 閾値Thを求めた後に、呼吸検出部150は、Ccor(n)の値と閾値Thとを比較し、Ccor(n)の値が閾値Thよりも大きい場合には、現フレームに呼吸音が含まれると判定する。これに対して、Ccor(n)の値が閾値Th以下の場合には、現フレームに呼吸音が含まれないと判定する。
 図9は、時間と相互相関との関係の一例を示す図である。図9の縦軸は、相互相関Ccor(n)を示し、図9の横軸は、時間を示す。呼吸検出部150は、閾値Thより大きい領域2aでは、呼吸音と判定し、閾値Th以下の領域2bでは、呼吸以外の音と判定する。
 また、呼吸検出部150は、現フレームに呼吸音が含まれていると判定した場合には、現フレームを平均呼吸スペクトル推定部160に出力する。
 平均呼吸スペクトル推定部160は、呼吸音を含むフレームを平均することで、平均呼吸スペクトルSave(f)を算出する処理部である。平均呼吸スペクトル推定部160は、式(7)に基づいて平均呼吸スペクトルSave(f)を更新し、更新した平均呼吸スペクトルを相互相関推定部140に出力する。式(7)のαは定数であり、0~1の値に設定される。
Figure JPOXMLDOC01-appb-M000005
 次に、音声の周波数スペクトルおよび呼吸の周波数スペクトルを比較して説明する。図10は、音声の周波数スペクトルおよび呼吸の周波数スペクトルの一例を示す図である。図10の上段は音声の周波数スペクトル5aを示し、下段は呼吸の周波数スペクトル6aを示す。また、横軸は時間軸であり、縦軸は周波数の大きさを示す。
 音声の周波数スペクトル5aでは、非定期に各周波数の信号が発生している。これに対して、呼吸の周波数スペクトル6aでは、定期的に各周波数の信号が発生している。図10に示す例では、時間帯7a~7eにおいて各周波数の信号が発生している。
 次に、音声の自己相関および呼吸の自己相関を比較して説明する。図11は、音声の自己相関および呼吸の自己相関の一例を示す図である。図11の左側は音声の自己相関10aを示し、右側は呼吸の自己相関10bを示す。また、横軸は遅延を示し、縦軸は自己相関の大きさを示す。
 音声の自己相関10aでは、自己相関の最大値が0.4である。これに対して、呼吸の自己相関10bでは、自己相関の最大値が0.2となる。このため、音声の自己相関10aの最大値のほうが、呼吸の自己相関10bの最大値よりも大きくなる。
 次に、音声の相互相関および呼吸の相互相関を比較して説明する。図12は、音声の相互相関および呼吸の相互相関の一例を示す図である。図12の上段は音声の相互相関11aを示し、下段は呼吸の相互相関11bを示す。また、横軸はフレーム番号を示し、縦軸は相互相関の大きさを示す。
 音声の相互相関11aの閾値12aは、音声の自己相関を基に算出される閾値である。例えば、音声の自己相関の最大値を0.35、βの値を5.0とすると、閾値12aは、1.75となる。図12に示すように、音声の相互相関11aは、閾値12aを超えることはない。
 呼吸の相互相関11bの閾値12bは、呼吸の自己相関を基に算出される閾値である。例えば、呼吸の自己相関の最大値を0.20、βの値を5.0とすると、閾値12bは、1.00となる。図12に示すように、呼吸の相互相関11bは、呼吸を行うタイミングで、閾値12bを超える。
 次に、呼吸検出装置100の処理手順について説明する。図13は、呼吸検出装置の処理手順を示すフローチャートである。図13に示す処理は、例えば、入力信号が呼吸検出装置100に入力されたことを契機に実行される。
 図13に示すように、呼吸検出装置100は、入力信号を取得し(ステップS101)、入力信号を複数のフレームに分割する(ステップS102)。呼吸検出装置100は、周波数スペクトルを算出し(ステップS103)、自己相関を算出する(ステップS104)。
 呼吸検出装置100は、相互相関を算出し(ステップS105)、自己相関の最大値に基づいて閾値を決定する(ステップS106)。呼吸検出装置100は、相互相関と閾値とを比較して呼吸音が含まれているか否かを検出し(ステップS107)、検出結果を出力する(ステップS108)。
 次に、本実施例に係る呼吸検出装置100の効果について説明する。入力信号に呼吸音が含まれる場合には、自己相関が小さくなり相互相関が大きくなる。この特性は、入力信号に雑音が含まれる場合でも同様のものとなる。このため、呼吸検出装置100は、入力信号の自己相関と相互相関とを基にして、フレームに呼吸音が含まれているか否かを判定することで、雑音の影響を受けることなく正確に呼吸音を含むフレームを検出することができる。
 本実施例に係る呼吸検出装置100は、呼吸音を含むフレームの周波数スペクトルを加重平均することで、平均呼吸スペクトルを求め、現フレームの周波数スペクトルと平均呼吸スペクトルとの相互相関を求める。このため、呼吸音を含む過去のフレームの周波数スペクトルの誤差をなくし、正確に相互相関を求めることができる。
 本実施例に係る呼吸検出装置100は、自己相関の値をβ倍した値と、相互相関の値とを比較して、現フレームに呼吸音が含まれているか否かを判定する。βの値を調整することで、様々な環境下において、正確に現フレームに呼吸音が含まれるか否かを判定することができる。
 ところで、図1に示した呼吸検出装置100の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、呼吸検出装置100の分散、統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、調波構造推定部130、相互相関推定部140、呼吸検出部150、平均呼吸スペクトル推定部160を別々の装置に実装し、各装置が協働して、フレームに呼吸音が含まれているか否かを判定しても良い。
 100  呼吸検出装置
 110  フレーム分割部
 120  FFT処理部
 130  調波構造推定部
 140  相互相関推定部
 150  呼吸検出部
 160  平均呼吸スペクトル推定部

Claims (8)

  1.  入力音信号を複数のフレームに分割し各フレームを周波数変換することで、周波数と該周波数毎の信号強度とを対応づけた周波数スペクトルを算出するスペクトル算出部と、
     前記スペクトル算出部が算出した所定のフレームの周波数スペクトルを周波数方向にシフトし、シフト前の周波数スペクトルとシフト後の周波数スペクトルとがどの程度よく整合するのかを示す第1類似度を算出する調波構造算出部と、
     前記所定のフレームの周波数スペクトルと、該所定のフレームより過去のフレームの周波数スペクトルとの相互相関を求めることで第2類似度を算出する相互相関算出部と、
     前記第1類似度および前記第2類似度を基にして、所定のフレームの周波数スペクトルが呼吸を示すものであるか否かを判定する呼吸判定部と
     を備えたことを特徴とする呼吸検出装置。
  2.  前記調波構造算出部は、所定のフレームの周波数スペクトルの自己相関を求めることで前記第1類似度を算出することを特徴とする請求項1に記載の呼吸検出装置。
  3.  前記相互相関算出部は、所定のフレームよりも過去のフレームのうち呼吸音を含むフレームの周波数スペクトルを加重平均した周波数スペクトルと、前記所定のフレームの周波数スペクトルとの相互相関を求めることで前記第2類似度を算出することを特徴とする請求項1または2に記載の呼吸検出装置。
  4.  前記呼吸判定部は、前記第1類似度を定数倍した値よりも前記第2類似度の値の方が大きい場合に、所定のフレームの周波数スペクトルが呼吸を示すものであると判定することを特徴とする請求項3に記載の呼吸検出装置。
  5.  呼吸検出装置が、
     入力音信号を複数のフレームに分割し各フレームを周波数変換することで、周波数と該周波数毎の信号強度とを対応づけた周波数スペクトルを算出するスペクトル算出ステップと、
     前記スペクトル算出ステップで算出した所定のフレームの周波数スペクトルにおいて、周波数帯域毎の信号強度を基にして、各周波数帯域の信号強度の類似度となる第1類似度を算出する調波構造算出ステップと、
     前記所定のフレームの周波数スペクトルと、該所定のフレームより過去のフレームの周波数スペクトルとの相互相関を求めることで第2類似度を算出する相互相関算出ステップと、
     前記第1類似度および前記第2類似度を基にして、所定のフレームの周波数スペクトルが呼吸を示すものであるか否かを判定する呼吸判定ステップと
     を実行することを特徴とする呼吸検出方法。
  6.  前記調波構造算出ステップは、所定のフレームの周波数スペクトルの自己相関を求めることで前記第1類似度を算出することを特徴とする請求項5に記載の呼吸検出方法。
  7.  前記相互相関算出ステップは、所定のフレームよりも過去のフレームのうち呼吸音を含むフレームの周波数スペクトルを加重平均した周波数スペクトルと、前記所定のフレームの周波数スペクトルとの相互相関を求めることで前記第2類似度を算出することを特徴とする請求項5または6に記載の呼吸検出方法。
  8.  前記呼吸判定ステップは、前記第1類似度を定数倍した値よりも前記第2類似度の値の方が大きい場合に、所定のフレームの周波数スペクトルが呼吸を示すものであると判定することを特徴とする請求項7に記載の呼吸検出方法。
PCT/JP2010/066959 2010-09-29 2010-09-29 呼吸検出装置および呼吸検出方法 WO2012042611A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012536058A JP5494813B2 (ja) 2010-09-29 2010-09-29 呼吸検出装置および呼吸検出方法
PCT/JP2010/066959 WO2012042611A1 (ja) 2010-09-29 2010-09-29 呼吸検出装置および呼吸検出方法
US13/780,274 US20130178756A1 (en) 2010-09-29 2013-02-28 Breath detection device and breath detection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/066959 WO2012042611A1 (ja) 2010-09-29 2010-09-29 呼吸検出装置および呼吸検出方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US13/780,274 Continuation US20130178756A1 (en) 2010-09-29 2013-02-28 Breath detection device and breath detection method

Publications (1)

Publication Number Publication Date
WO2012042611A1 true WO2012042611A1 (ja) 2012-04-05

Family

ID=45892115

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/066959 WO2012042611A1 (ja) 2010-09-29 2010-09-29 呼吸検出装置および呼吸検出方法

Country Status (3)

Country Link
US (1) US20130178756A1 (ja)
JP (1) JP5494813B2 (ja)
WO (1) WO2012042611A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2011155048A1 (ja) * 2010-06-10 2013-08-01 富士通株式会社 音声処理装置および呼吸検出方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11304624B2 (en) * 2012-06-18 2022-04-19 AireHealth Inc. Method and apparatus for performing dynamic respiratory classification and analysis for detecting wheeze particles and sources
JP6298527B2 (ja) * 2014-03-28 2018-03-20 パイオニア株式会社 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体
US11262354B2 (en) 2014-10-20 2022-03-01 Boston Scientific Scimed, Inc. Disposable sensor elements, systems, and related methods
JP6477295B2 (ja) * 2015-06-29 2019-03-06 株式会社Jvcケンウッド 雑音検出装置、雑音検出方法及び雑音検出プログラム
CN109310326B (zh) 2016-06-15 2022-03-01 波士顿科学国际有限公司 气体采样导管
JP2019536013A (ja) * 2016-10-21 2019-12-12 ボストン サイエンティフィック サイムド,インコーポレイテッドBoston Scientific Scimed,Inc. ガス採取用装置
CN108652658A (zh) * 2017-03-31 2018-10-16 京东方科技集团股份有限公司 爆裂音识别方法及系统
WO2018213564A1 (en) 2017-05-19 2018-11-22 Cardiac Pacemakers, Inc. Systems and methods for assessing the health status of a patient
US10852264B2 (en) 2017-07-18 2020-12-01 Boston Scientific Scimed, Inc. Systems and methods for analyte sensing in physiological gas samples
WO2020081834A1 (en) 2018-10-19 2020-04-23 Regents Of The University Of Minnesota Systems and methods for detecting a brain condition
WO2020112825A1 (en) 2018-11-27 2020-06-04 Boston Scientific Scimed, Inc. Systems and methods for detecting a health condition
WO2020131567A1 (en) 2018-12-18 2020-06-25 Boston Scientific Scimed, Inc. Systems and methods for measuring kinetic response of chemical sensor elements
US20230094608A1 (en) * 2021-09-27 2023-03-30 Koninklijke Philips N.V. Pendelluft detection by acoustic interferometry through an endotracheal tube
CN115120837A (zh) * 2022-06-27 2022-09-30 慕思健康睡眠股份有限公司 基于深度学习的睡眠环境调节方法、系统、装置及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007014501A (ja) * 2005-07-06 2007-01-25 Toshiba Corp 呼吸状態判定装置、呼吸状態判定方法および呼吸状態判定プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4383534A (en) * 1980-06-05 1983-05-17 Peters Jeffrey L Vital signs monitoring apparatus
US5771897A (en) * 1996-04-08 1998-06-30 Zufrin; Alexander Method of and apparatus for quantitative evaluation of current changes in a functional state of human organism
SE0103312D0 (sv) * 2001-10-04 2001-10-04 Siemens Elema Ab Method of and Apparatus for Deriving Indices Characterising Atrial Arrhythmias
JP4851447B2 (ja) * 2005-06-09 2012-01-11 株式会社エイ・ジー・アイ ピッチ周波数を検出する音声解析装置、音声解析方法、および音声解析プログラム
US20110021928A1 (en) * 2009-07-23 2011-01-27 The Boards Of Trustees Of The Leland Stanford Junior University Methods and system of determining cardio-respiratory parameters
WO2011150362A2 (en) * 2010-05-28 2011-12-01 Mayo Foundation For Medical Education And Research Sleep apnea detection system
JP5765338B2 (ja) * 2010-06-10 2015-08-19 富士通株式会社 音声処理装置および音声処理装置の作動方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007014501A (ja) * 2005-07-06 2007-01-25 Toshiba Corp 呼吸状態判定装置、呼吸状態判定方法および呼吸状態判定プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HIROKI HARA: "Snoring and Sleep Apnea Syndrome: Clinical Significance of Acoustic Analysis of Snoring Sound", YAMAGUCHI MEDICAL JOURNAL, vol. 53, no. 6, December 2004 (2004-12-01), pages 265 - 267 *
HIROO YANO: "Ibiki-On ni yoru Suimin Jikan Mukokyu Shokogun no Kan'i Shindan Hoho ni Kansuru Kenkyu", PROJECT KENKYU NENPO 2006 NEN, vol. 3, July 2006 (2006-07-01), pages 105 - 106 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2011155048A1 (ja) * 2010-06-10 2013-08-01 富士通株式会社 音声処理装置および呼吸検出方法
JP5765338B2 (ja) * 2010-06-10 2015-08-19 富士通株式会社 音声処理装置および音声処理装置の作動方法

Also Published As

Publication number Publication date
US20130178756A1 (en) 2013-07-11
JPWO2012042611A1 (ja) 2014-02-03
JP5494813B2 (ja) 2014-05-21

Similar Documents

Publication Publication Date Title
JP5494813B2 (ja) 呼吸検出装置および呼吸検出方法
US8611548B2 (en) Noise analysis and extraction systems and methods
US7912230B2 (en) Howling detection device and method
EP2881948A1 (en) Spectral comb voice activity detection
US8560308B2 (en) Speech sound enhancement device utilizing ratio of the ambient to background noise
US8509451B2 (en) Noise suppressing device, noise suppressing controller, noise suppressing method and recording medium
EP2773137B1 (en) Microphone sensitivity difference correction device
JP4886715B2 (ja) 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
WO2008041730A1 (en) Method and system for detecting wind noise
KR20080086298A (ko) 음성 신호의 하모닉스를 이용한 잡음 추정 방법 및 장치
US20120157870A1 (en) Noise reduction of breathing signals
CN108697328B (zh) 一种鼾声识别方法及止鼾装置
US20130006150A1 (en) Bruxism detection device and bruxism detection method
US20110150227A1 (en) Signal processing method and apparatus
JP2014122939A (ja) 音声処理装置および方法、並びにプログラム
CN109360585A (zh) 一种语音激活检测方法
WO2018069719A1 (en) Voice activity detection method and apparatus
JP2007212704A (ja) 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置
CN106356076B (zh) 基于人工智能的语音活动性检测方法和装置
EP3288030B1 (en) Gain adjustment apparatus and gain adjustment method
CN102737645A (zh) 一种语音信号的基音周期估计算法
CN108062959B (zh) 一种声音降噪方法及装置
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
CN111374819B (zh) 止鼾器及其鼾声识别方法、鼾声识别装置和存储介质
JP6631127B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声処理装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10857825

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2012536058

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10857825

Country of ref document: EP

Kind code of ref document: A1