WO2015145754A1 - 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体 - Google Patents

生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体 Download PDF

Info

Publication number
WO2015145754A1
WO2015145754A1 PCT/JP2014/059260 JP2014059260W WO2015145754A1 WO 2015145754 A1 WO2015145754 A1 WO 2015145754A1 JP 2014059260 W JP2014059260 W JP 2014059260W WO 2015145754 A1 WO2015145754 A1 WO 2015145754A1
Authority
WO
WIPO (PCT)
Prior art keywords
sound
spectrum
frequency
biological sound
biological
Prior art date
Application number
PCT/JP2014/059260
Other languages
English (en)
French (fr)
Inventor
隆真 亀谷
石戸谷 耕一
友博 三浦
英幸 大久保
長谷部 剛
Original Assignee
パイオニア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パイオニア株式会社 filed Critical パイオニア株式会社
Priority to PCT/JP2014/059260 priority Critical patent/WO2015145754A1/ja
Priority to JP2016509846A priority patent/JP6298527B2/ja
Priority to US15/129,940 priority patent/US10441243B2/en
Publication of WO2015145754A1 publication Critical patent/WO2015145754A1/ja

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/003Detecting lung or respiration noise
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/08Detecting, measuring or recording devices for evaluating the respiratory organs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7253Details of waveform analysis characterised by using transforms
    • A61B5/7257Details of waveform analysis characterised by using transforms using Fourier transforms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7282Event detection, e.g. detecting unique waveforms indicative of a medical condition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/74Details of notification to user or communication with user or patient ; user input means
    • A61B5/7405Details of notification to user or communication with user or patient ; user input means using sound
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/74Details of notification to user or communication with user or patient ; user input means
    • A61B5/742Details of notification to user or communication with user or patient ; user input means using visual displays
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Definitions

  • the present invention relates to a technical field of a biological sound analyzing apparatus and a biological sound analyzing method for analyzing a biological sound such as a respiratory sound, and a computer program and a recording medium.
  • Patent Document 1 proposes a method for dividing normal sound absorption and continuous rar based on a local dispersion value on a spectrum.
  • Patent Document 2 proposes a method for determining the degree of abnormality in the respiratory state based on the degree of correlation with a preset model.
  • Patent Document 3 proposes a method of determining an abnormal breathing sound type by approximating a spectrum shape with a mixed Gaussian distribution.
  • An object of the present invention is to provide a biological sound analysis device and a biological sound analysis method, a computer program, and a recording medium that can suitably analyze a plurality of types of sounds included in the biological sound.
  • the biological sound analysis apparatus for solving the above-described problem includes an acquisition unit that acquires information about a frequency corresponding to a predetermined feature of a spectrum of biological sound, and a plurality of reference spectra that serve as a reference for classifying the biological sound. Based on the shift means for acquiring a frequency shift reference spectrum by shifting according to the information on the frequency, and outputting the ratio of the plurality of reference spectra included in the biological sound based on the biological sound and the frequency shift reference spectrum Output means.
  • the biological sound analysis method for solving the above problems includes an acquisition step of acquiring information relating to a frequency corresponding to a predetermined characteristic of a spectrum of biological sound, and a plurality of reference spectra serving as a reference for classifying the biological sound, Based on the shift step of acquiring the frequency shift reference spectrum by shifting according to the information on the frequency, and the biological sound and the frequency shift reference spectrum, the ratio of the plurality of reference spectra included in the biological sound is output. An output step.
  • a computer program for solving the above-described problem relates to an acquisition step of acquiring information related to a frequency corresponding to a predetermined characteristic of a spectrum of a body sound, and a plurality of reference spectra that serve as a reference for classifying the body sound.
  • a shift step of shifting according to information to obtain a frequency shift reference spectrum, and an output step of outputting a ratio of the plurality of reference spectra included in the biological sound based on the biological sound and the frequency shift reference spectrum And let the computer run.
  • the recording medium for solving the above problem is recorded with the computer program described above.
  • the biological sound analysis apparatus relates to the acquisition means for acquiring information relating to a frequency corresponding to a predetermined characteristic of the spectrum of the biological sound, and a plurality of reference spectra serving as a reference for classifying the biological sound.
  • Shift means for shifting according to information and acquiring a frequency shift reference spectrum; and output means for outputting a ratio of the plurality of reference spectra included in the biological sound based on the biological sound and the frequency shift reference spectrum With.
  • the biological sound analysis apparatus at the time of operation, first, information on a frequency corresponding to a predetermined feature of the spectrum of the biological sound is acquired.
  • the “biological sound” here means sounds emitted from the living body such as breathing sounds, heartbeat sounds, and intestinal sounds.
  • the “predetermined feature” means a feature that occurs at a specific frequency according to the sound type included in the spectrum of the body sound, such as a peak that appears in the frequency-analyzed signal.
  • the “information about the frequency” is not limited to the information that directly indicates the frequency, but includes information that can indirectly derive the frequency.
  • a plurality of reference spectra serving as a reference for classifying the body sound are shifted according to the information about the frequency, and the frequency shift reference spectrum is acquired.
  • the “reference spectrum” here refers to each sound type in order to classify a plurality of sound types included in the body sound (for example, normal breathing sound, continuous rarity sound, haircut sound, etc.). This is a preset spectrum.
  • the reference spectrum is frequency-shifted according to, for example, a peak position, which is a predetermined feature acquired from a body sound, and becomes a frequency-shifted reference spectrum.
  • the ratio of a plurality of reference spectra included in the body sound is output based on the body sound and the frequency shift reference spectrum. Specifically, the proportion of sound types corresponding to a plurality of reference spectra is calculated in the body sound to be analyzed, and the result is output. More specifically, the ratio of the reference spectrum is calculated as a coupling coefficient by performing an operation based on a plurality of reference spectra, for example, for the spectrum of the body sound.
  • the biological sound analysis apparatus it is possible to suitably analyze biological sounds including a plurality of sound types. Especially in this embodiment, even when a plurality of sound types are mixed on the same frequency axis, the ratio of each sound type can be analyzed suitably.
  • the biological sound is a respiratory sound.
  • the ratio of a plurality of types of sound types (specifically, normal breath sounds, abnormal breath sounds such as continual ra sounds and haircut sounds) included in the breath sounds.
  • a more objective and accurate diagnosis can be performed in the case of diagnosing a health condition using a breathing sound.
  • more accurate diagnosis can be performed as compared with the case where the presence or absence of abnormal breathing sound is diagnosed only with the breathing sound heard with a stethoscope or the like.
  • the breathing sounds can be analyzed very suitably regardless of the skill of the user. More specifically, for example, not only skilled doctors but also inexperienced doctors and nurses can appropriately discriminate abnormal breathing sounds.
  • the plurality of reference spectra may include a reference spectrum corresponding to the sub-noise.
  • the reference spectrum may include a reference spectrum corresponding to a plurality of types of sub-noise, or may include a reference spectrum corresponding to a sound type other than the sub-noise.
  • the predetermined feature is a maximum value.
  • frequency analysis by fast Fourier transform FFT: Fourier ⁇ ⁇ ⁇ ⁇ Transform
  • FFT Fourier ⁇ ⁇ ⁇ ⁇ Transform
  • information on the frequency corresponding to the maximum value (ie, peak) of the analysis result Is acquired.
  • the information about the frequency is acquired as corresponding to the position of the maximum value, but even if the frequency is not completely coincident with the position of the maximum value, it is acquired as information about the frequency corresponding to the position near the maximum value. Also good.
  • the frequency-related information can be acquired more easily and accurately by using the maximum value as the predetermined characteristic of the spectrum of the body sound.
  • the output unit calculates a ratio of the plurality of reference spectra using a non-negative approximation method.
  • a non-negative approximation method that is, an approximation method in which the coupling coefficient does not become negative
  • examples of the non-negative approximation method include non-negative matrix factorization (NMF).
  • the ratio obtained by the calculation result may not be a value indicating the ratio of each reference spectrum. That is, even if the approximation can be appropriately performed, an inappropriate value may be calculated as the value indicating the component amount of the reference spectrum.
  • the biological sound analyzing apparatus further includes separation means for separating and outputting the spectrum of the biological sound into a plurality of spectra corresponding to the plurality of reference spectra.
  • the spectrum of the body sound is output after being separated into a plurality of spectra corresponding to the plurality of reference spectra. Therefore, for example, when breathing sounds are analyzed, normal breathing sounds and abnormal breathing sounds can be output separately.
  • a plurality of separated spectra can be output separately as a plurality of audio data, for example.
  • the biological sound analysis method relates to an acquisition step of acquiring information relating to a frequency corresponding to a predetermined characteristic of a spectrum of biological sound, and a plurality of reference spectra serving as a reference for classifying the biological sound.
  • the body sound analysis method it is possible to suitably analyze a body sound including a plurality of sound types as in the case of the body sound analysis apparatus according to the embodiment described above.
  • biological sound analysis method according to the present embodiment can also adopt various aspects similar to the various aspects of the biological sound analysis apparatus according to the present embodiment described above.
  • the computer program uses an acquisition step of acquiring information related to a frequency corresponding to a predetermined characteristic of a spectrum of biological sound, and a plurality of reference spectra serving as a reference for classifying the biological sound as information related to the frequency. And a shift step of acquiring a frequency shift reference spectrum, and an output step of outputting a ratio of the plurality of reference spectra included in the biological sound based on the biological sound and the frequency shift reference spectrum. Let the computer run.
  • the computer can execute the same processing as the biological sound analysis method according to the present embodiment described above, it is possible to suitably analyze a biological sound including a plurality of sound types.
  • the recording medium according to the present embodiment records the above-described computer program.
  • the recording medium it is possible to suitably analyze a biological sound including a plurality of sound types by causing the computer program described above to be executed by a computer.
  • FIG. 1 is a block diagram showing the overall configuration of the biological sound analysis apparatus according to this embodiment.
  • the biological sound analysis apparatus includes, as main components, a biological sound sensor 110, a signal storage unit 120, a signal processing unit 125, an audio output unit 130, and a base holding unit 140.
  • the display unit 150 and the processing unit 200 are provided.
  • the body sound sensor 110 is a sensor configured to be able to detect a breathing sound of a living body.
  • the biological sound sensor 110 includes, for example, an ECM (Electret Condenser Microphone), a microphone using a piezo, a vibration sensor, and the like.
  • the signal storage unit 120 is configured as a buffer such as a RAM (Random Access Memory), for example, and temporarily stores a signal indicating a respiratory sound detected by the biological sound sensor 110 (hereinafter, referred to as a “respiratory sound signal” as appropriate). To remember.
  • the signal storage unit 120 is configured to be able to output the stored signal to the audio output unit 130 and the processing unit 220, respectively.
  • the signal processing unit 125 processes the sound acquired by the biological sound sensor 110 and outputs the processed sound to the audio output unit 130.
  • the signal processing unit 125 functions as, for example, an equalizer or a filter, and processes the acquired sound so that it can be easily heard by a person.
  • the audio output unit 130 is configured as a speaker or a headphone, for example, and outputs a breathing sound detected by the biological sound sensor 110 and processed by the signal processing unit 125.
  • the base holding unit 140 is configured, for example, as a ROM (Read Only Memory) or the like, and stores a base corresponding to a predetermined sound type that can be included in the respiratory sound.
  • the basis according to the present embodiment is an example of the “reference spectrum” in the present invention.
  • the display unit 150 is configured as a display such as a liquid crystal monitor, for example, and displays image data output from the processing unit 200.
  • the processing unit 200 includes a plurality of arithmetic circuits and memories.
  • the processing unit 200 includes a frequency analysis unit 210, a frequency peak detection unit 220, a base set generation unit 230, a coupling coefficient calculation unit 240, a signal intensity calculation unit 250, and an image generation unit 260.
  • FIG. 2 is a flowchart showing the operation of the biological sound analysis apparatus according to this embodiment.
  • a simple description for grasping the overall flow of processing executed by the biological sound analysis apparatus according to the present embodiment will be given. Details of each process will be described later.
  • a respiratory sound is detected by the biological sound sensor 110, and a respiratory sound signal is acquired by the processing unit 200 (step S101).
  • the frequency analysis unit 210 performs frequency analysis (for example, fast Fourier transform) (step S102). Further, the frequency peak detection unit 220 detects a peak (maximum value) using the frequency analysis result.
  • frequency analysis for example, fast Fourier transform
  • a base set is generated in the base set generation unit 230 (step S103). Specifically, the base set generation unit 230 generates a base set using the base stored in the base holding unit 140. At this time, the basis set generation unit 230 shifts the basis based on the peak position (that is, the corresponding frequency) obtained from the frequency analysis result.
  • the coupling coefficient calculation unit 240 calculates the coupling coefficient based on the frequency analysis result and the basis set (step S104).
  • the signal intensity calculation unit 250 calculates the signal intensity corresponding to the coupling coefficient (step S105). In other words, the ratio of each sound type included in the respiratory sound signal is calculated.
  • the image generation unit 260 When the signal strength is calculated, the image generation unit 260 generates image data indicating the signal strength. The generated image data is displayed as an analysis result on the display unit 150 (step S106).
  • step S107 it is determined whether or not to continue the analysis process. If it is determined to continue the analysis process (step S107: YES), the process from step S101 is executed again. If it is determined not to continue the analysis process (step S107: NO), the series of processes ends.
  • FIG. 3 is a spectrogram showing the frequency analysis result of the breathing sound including the haircut sound
  • FIG. 4 is a spectrogram showing the frequency analysis result of the breathing sound including the whistle sound.
  • the spectrogram pattern corresponding to the haircut sound in addition to the spectrogram pattern corresponding to the normal breathing sound, the spectrogram pattern corresponding to the haircut sound that is one of the abnormal breathing sounds is observed.
  • the spectrogram pattern corresponding to the haircut sound has a shape close to a rhombus, as shown in the enlarged portion in the figure.
  • the spectrogram pattern corresponding to the whistle voice which is one of the abnormal breathing sounds is observed.
  • the spectrogram pattern corresponding to the whistle voice is shaped like a bird's neck as shown in the enlarged portion of the figure.
  • the biological sound analysis apparatus executes analysis for separating a plurality of sound types mixed in this way.
  • FIG. 5 is a graph showing a spectrum at a predetermined timing of the breathing sound including the haircut sound
  • FIG. 6 is a conceptual diagram showing an approximation method of the spectrum of the breathing sound including the haircut sound.
  • FIG. 7 is a graph showing a spectrum of a breathing sound including a whistle sound at a predetermined timing
  • FIG. 8 is a conceptual diagram showing an approximation method of a spectrum of a breathing sound including a whistle sound.
  • the spectrum corresponding to the normal breathing sound and the spectrum corresponding to the haircut sound can be estimated in advance by experiments or the like. For this reason, if a pre-estimated pattern is used, it is possible to know in what ratio the component corresponding to the normal breathing sound and the component corresponding to the haircut sound are included in the above-described spectrum.
  • the spectrum corresponding to the whistle sound can be estimated in advance by experiments or the like in the same manner as the normal breathing sound and the haircut sound described above. For this reason, if a pre-estimated pattern is used, it is possible to know in what ratio the component corresponding to the normal breathing sound and the component corresponding to the whistle sound are included in the above-described spectrum.
  • FIG. 9 is a graph illustrating an example of the frequency analysis method
  • FIG. 10 is a diagram illustrating an example of the frequency analysis result
  • FIG. 11 is a conceptual diagram showing a spectrum peak detection result.
  • frequency analysis is first performed on the acquired respiratory sound signal.
  • the frequency can be obtained using an existing technique such as fast Fourier transform.
  • an amplitude value for each frequency (that is, an amplitude spectrum) is used as a frequency analysis result.
  • a window function for example, Hanning window etc.
  • the frequency analysis result is obtained as consisting of n values.
  • N is a value determined by a window size or the like in frequency analysis.
  • peak detection is performed for the spectrum obtained by frequency analysis.
  • peaks p1 to p4 are detected at positions of 100 Hz, 130 Hz, 180 Hz, and 320 Hz.
  • the peak detection process may be a simple process because it only needs to know at which frequency the peak exists. However, it is preferable that the peak detection parameters are set so that even a small peak is not missed.
  • N is a predetermined value
  • the maximum value is obtained from the point where the sign of the difference switches from positive to negative.
  • the second derivative is approximated by the difference.
  • N values having a value smaller than a predetermined threshold (negative value) are selected in order from the smallest, and the positions are stored.
  • FIG. 12 is a graph showing the normal alveolar respiratory sound base.
  • FIG. 13 is a graph showing the haircut sound base,
  • FIG. 14 is a graph showing the continuous ra sound base, and
  • FIG. 15 is a graph showing the white noise base.
  • FIG. 16 is a graph showing frequency-shifted continuous ra sound bases.
  • each base corresponding to each sound type has a specific shape.
  • Each base is composed of n numerical values (that is, amplitude values for each frequency) that are the same as the frequency analysis result.
  • Each base is normalized so that an area surrounded by a line indicating the amplitude value for each frequency and the frequency axis becomes a predetermined value (for example, 1).
  • the base corresponding to the continuous rale among the above-mentioned bases is frequency-shifted according to the peak position detected from the result of frequency analysis.
  • the continuous ra sound base is frequency-shifted in accordance with each of the peaks p1 to p4 shown in FIG.
  • the basis set is generated as a set of normal alveolar respiratory sound bases, hair hair sound bases, continuous ra sound bases corresponding to the number of detected peaks, and white noise bases.
  • FIG. 17 is a diagram showing the relationship between the spectrum, the basis, and the coupling coefficient
  • FIG. 18 is a diagram showing an example of the observed spectrum and the basis used for approximation
  • FIG. 19 is a diagram showing an approximation result by non-negative matrix factorization.
  • the spectrum y and each base h (f) have n values.
  • the coupling coefficient has m values. “M” is the number of bases included in the base set.
  • the coupling coefficient of each base included in the base set is calculated using non-negative matrix factorization. Specifically, u that minimizes the optimization criterion function D expressed by the following formula (2) (however, each component value of u is not negative) may be obtained.
  • general non-negative matrix factorization is a method for calculating both a base matrix representing a set of base spectra and an activation matrix representing a coupling coefficient.
  • the base matrix is fixed. Only the coupling coefficient is calculated.
  • an approximation method other than non-negative matrix factorization may be used as means for calculating the coupling coefficient.
  • the condition that it is non-negative is desired.
  • the reason for using the non-negative approximation method will be described with a specific example.
  • the expected coupling coefficient u under the condition of being non-negative is 1 for the base A, 1 for the base B, 0 for the base C, and 0 for the base D. It is 0 to do. That is, on the condition that it is non-negative, the observed spectrum is approximated as a spectrum obtained by adding the base A multiplied by 1 and the base B multiplied by 1.
  • the expected coupling coefficient u when the condition is not negative is 0 for the base A, 0 for the base B, 1 for the base C, and 1 for the base D. What to do is -0.5. That is, if the condition is not negative, the observed spectrum is approximated as a spectrum obtained by adding the base C multiplied by 1 and the base D multiplied by ⁇ 0.5.
  • the coupling coefficient u here represents the component amount for each spectrum, it must be obtained as a non-negative value. In other words, when the coupling coefficient u is obtained as a negative value, it cannot be interpreted as a component amount. On the other hand, if the approximation is performed under a non-negative condition, the coupling coefficient u corresponding to the component amount can be calculated.
  • the coupling coefficient u is calculated as having seven values from u 1 to u 7 .
  • the coupling coefficient u 1 corresponding to the normal alveolar respiratory sound base is a value indicating the ratio of the normal alveolar respiratory sound to the respiratory sound.
  • the coupling coefficient u 2 corresponding to the hair hair base the coupling coefficient u 3 corresponding to the white noise base, the continuous coefficient shifted to 100 Hz, the coupling coefficient u 4 corresponding to the sound base, and the continuous coefficient shifted to 130 Hz.
  • the coupling coefficient u 5 corresponding to the sound base the coupling coefficient u 6 corresponding to the continuous ra sound base shifted to 180 Hz
  • the coupling coefficient u 7 corresponding to the continuous ra sound base shifted to 320 Hz breathing is also performed. It can be said that the value indicates the ratio of each sound type to the sound. Therefore, the signal intensity of each sound type can be calculated from the coupling coefficient u.
  • FIG. 20 is a plan view showing a display example on the display unit.
  • FIG. 21 is a spectrogram diagram showing an example of extraction of whistle voice sounds.
  • the intensity of each sound type as an analysis result is displayed as a bar graph in the display area 155 of the display unit 150.
  • this display method is an example, and display may be performed in other display modes.
  • the ratio (content ratio) of each sound type may be calculated and displayed as a pie chart.
  • the intensity of each sound type may be digitized and displayed.
  • only a pattern corresponding to a predetermined sound type can be extracted and displayed from the spectrogram.
  • the example which extracted only the pattern corresponding to a whistle voice sound is shown.
  • output by audio data is also possible.
  • the sound can be output separately for each sound type.
  • the analysis result at each timing can be output dynamically by combining with a method of performing frequency analysis at a certain fixed time such as short time Fourier transform (STFT: Short Time Fourier Transform).
  • STFT Short Time Fourier Transform
  • the signal intensity is calculated as corresponding to the amplitude spectrum, but conversion processing may be performed so as to correspond to the power spectrum. Moreover, you may convert into dB value.
  • the present invention is not limited to the above-described embodiment, and can be appropriately changed without departing from the gist or concept of the invention that can be read from the claims and the entire specification.
  • the apparatus, the body sound analysis method, the computer program, and the recording medium are also included in the technical scope of the present invention.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Physiology (AREA)
  • Signal Processing (AREA)
  • Psychiatry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Pulmonology (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

 生体音解析装置は、生体音のスペクトルの所定の特徴に対応する周波数に関する情報を取得する取得手段(210,220)と、生体音を分類する基準となる複数の基準スペクトルを、周波数に関する情報に応じてシフトさせ、周波数シフト基準スペクトルを取得するシフト手段(230)と、生体音と周波数シフト基準スペクトルとに基づいて、生体音に含まれる複数の基準スペクトルの割合を出力する出力手段(240,250)とを備える。この生体音解析装置によれば、生体音に含まれる複数種類の音を好適に解析することが可能である。

Description

生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体
 本発明は、例えば呼吸音等の生体音を解析する生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体の技術分野に関する。
 この種の装置として、電子聴診器等によって検出される生体の呼吸音について、正常呼吸音と異常呼吸音とを判別するものが知られている。例えば特許文献1では、スペクトル上の局所分散値に基づいて正常吸音と連続性ラ音とを分割する手法が提案されている。特許文献2では、予め設定されたモデルとの相関度に基づいて呼吸状態の異常度を判定する手法が提案されている。特許文献3では、スペクトルの形状を混合ガウス分布で近似して異常呼吸音種を判定するという手法が提案されている。
特開2004-357758号公報 特開2012-120688号公報 特開2013-123495号公報
 しかしながら、上述した特許文献1から3に記載されているような技術では、複数の異常呼吸音が混ざって聞こえるような場合(特に、複数の異常呼吸音が同一の周波数軸上で重なっている場合)において、異常呼吸音同士を分離して検出することが難しいという技術的問題点がある。
 本発明が解決しようとする課題には、上記のようなものが一例として挙げられる。本発明は、生体音に含まれる複数種類の音を好適に解析可能な生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体を提供することを課題とする。
 上記課題を解決するための生体音解析装置は、生体音のスペクトルの所定の特徴に対応する周波数に関する情報を取得する取得手段と、前記生体音を分類する基準となる複数の基準スペクトルを、前記周波数に関する情報に応じてシフトさせ、周波数シフト基準スペクトルを取得するシフト手段と、前記生体音と前記周波数シフト基準スペクトルとに基づいて、前記生体音に含まれる前記複数の基準スペクトルの割合を出力する出力手段とを備える。
 上記課題を解決するための生体音解析方法は、生体音のスペクトルの所定の特徴に対応する周波数に関する情報を取得する取得工程と、前記生体音を分類する基準となる複数の基準スペクトルを、前記周波数に関する情報に応じてシフトさせ、周波数シフト基準スペクトルを取得するシフト工程と、前記生体音と前記周波数シフト基準スペクトルとに基づいて、前記生体音に含まれる前記複数の基準スペクトルの割合を出力する出力工程とを備える。
 上記課題を解決するためのコンピュータプログラムは、生体音のスペクトルの所定の特徴に対応する周波数に関する情報を取得する取得工程と、前記生体音を分類する基準となる複数の基準スペクトルを、前記周波数に関する情報に応じてシフトさせ、周波数シフト基準スペクトルを取得するシフト工程と、前記生体音と前記周波数シフト基準スペクトルとに基づいて、前記生体音に含まれる前記複数の基準スペクトルの割合を出力する出力工程とをコンピュータに実行させる。
 上記課題を解決するための記録媒体は、上述したコンピュータプログラムが記録されている。
本実施例に係る生体音解析装置の全体構成を示すブロック図である。 本実施例に係る生体音解析装置の動作を示すフローチャートである。 捻髪音を含む呼吸音の周波数解析結果を示すスペクトログラム図である。 笛声音を含む呼吸音の周波数解析結果を示すスペクトログラム図である。 捻髪音を含む呼吸音の所定タイミングにおけるスペクトルを示すグラフである。 捻髪音を含む呼吸音のスペクトルの近似方法を示す概念図である。 笛声音を含む呼吸音の所定タイミングにおけるスペクトルを示すグラフである。 笛声音を含む呼吸音のスペクトルの近似方法を示す概念図である。 周波数解析方法の一例を示すグラフである。 周波数解析結果の一例を示す図である。 スペクトルのピーク検出結果を示す概念図である。 正常肺胞呼吸音基底を示すグラフである。 捻髪音基底を示すグラフである。 連続性ラ音基底を示すグラフである。 ホワイトノイズ基底を示すグラフである。 周波数シフトされた連続性ラ音基底を示すグラフである。 スペクトルと、基底及び結合係数との関係を示す図である。 観測されたスペクトル及び近似に用いられる基底の一例を示す図である。 スペクトルを示す各基底及び結合係数を示す図である。 表示部における表示例を示す平面図である。 笛声音の抽出例を示すスペクトログラム図である。
 <1>
 本実施形態に係る生体音解析装置は、生体音のスペクトルの所定の特徴に対応する周波数に関する情報を取得する取得手段と、前記生体音を分類する基準となる複数の基準スペクトルを、前記周波数に関する情報に応じてシフトさせ、周波数シフト基準スペクトルを取得するシフト手段と、前記生体音と前記周波数シフト基準スペクトルとに基づいて、前記生体音に含まれる前記複数の基準スペクトルの割合を出力する出力手段とを備える。
 本実施形態に係る生体音解析装置によれば、その動作時には、先ず生体音のスペクトルの所定の特徴に対応する周波数に関する情報が取得される。なお、ここでの「生体音」とは、呼吸音や心拍音、腸音等の生体から発せられる音を意味している。また「所定の特徴」とは、生体音のスペクトルに含まれる音種に応じて特定の周波数に発生する特徴を意味しており、例えば周波数解析された信号に現れるピーク等である。更に、「周波数に関する情報」とは、周波数を直接的に示す情報に限定されず、その周波数を間接的に導き出すことができるような情報を含む趣旨である。
 周波数に関する情報が取得されると、生体音を分類する基準となる複数の基準スペクトルが、周波数に関する情報に応じてシフトされ、周波数シフト基準スペクトルが取得される。なお、ここでの「基準スペクトル」とは、生体音に含まれる複数の音種(例えば、正常呼吸音や連続性ラ音、捻髪音等)を分類するために、各音種に応じて予め設定されたスペクトルである。基準スペクトルは、例えば生体音から取得された所定の特徴であるピーク位置等に応じて周波数シフトされ、周波数シフト基準スペクトルとされる。
 周波数シフト基準スペクトルが取得されると、生体音と周波数シフト基準スペクトルとに基づいて、生体音に含まれる複数の基準スペクトルの割合が出力される。具体的には、解析対象である生体音に、複数の基準スペクトルに対応する音種がどのような割合で含まれているのかが算出され、その結果が出力される。より具体的には、例えば生体音のスペクトルに対して、複数の基準スペクトルを基底とする演算が実行されることで、基準スペクトルの割合が結合係数として算出される。
 以上の結果、本実施形態に係る生体音解析装置によれば、複数の音種を含む生体音を好適に解析できる。本実施形態では特に、複数の音種が同一の周波数軸上で混じり合っている場合においても、各音種の割合を好適に解析できる。
 <2>
 本実施形態に係る生体音解析装置の一態様では、前記生体音は、呼吸音である。
 この態様によれば、呼吸音に含まれる複数種類の音種(具体的には、正常呼吸音及び連続性ラ音や捻髪音などの異常呼吸音等)の割合を好適に解析できる。これにより、例えば呼吸音により健康状態を診断する場合等において、より客観的で正確な診断が行える。具体的には、聴診器等で聴いた呼吸音だけで異常呼吸音の有無を診断する場合と比べて、より正確な診断が行える。本態様では特に、混じり合った複数種類の呼吸音を聴き分けるための技術を要しないため、ユーザのスキルによらず、極めて好適に呼吸音の解析が行える。より具体的には、例えば熟練した医師だけでなく、経験の浅い医師や看護師等でも適切に異常呼吸音を判別することが可能となる。
 <3>
 上述した呼吸音を解析する態様では、前記複数の基準スペクトルは、副雑音に対応する基準スペクトルを含んでいてもよい。
 この場合、呼吸音に含まれる副雑音(即ち、異常呼吸音)の割合が出力されることになるため、健康状態の診断を好適に行える。なお、基準スペクトルは、複数種類の副雑音に対応する基準スペクトルを含んでいてもよいし、副雑音以外の音種に対応する基準スペクトルを含んでいてもよい。
 <4>
 本実施形態に係る生体音解析装置の他の態様では、前記所定の特徴は、極大値である。
 この態様によれば、例えば生体音を示す信号に対して、高速フーリエ変換(FFT:Fast Fourier Transform)等による周波数解析が実行され、解析結果の極大値(即ち、ピーク)に対応する周波数に関する情報が取得される。なお、周波数に関する情報は、極大値の位置に対応するものとして取得されるが、極大値の位置と完全に一致する周波数でなくとも、極大値の近傍位置に対応する周波数に関する情報として取得されてもよい。
 上述したように、生体音のスペクトルの所定の特徴として極大値を利用することで、より容易且つ的確に周波数に関する情報を取得できる。
 <5>
 本実施形態に係る生体音解析装置の他の態様では、前記出力手段は、非負の近似法を用いて、前記複数の基準スペクトルの割合を算出する。
 この態様によれば、複数の基準スペクトルの割合を算出する際に、非負の近似法(即ち、結合係数が負にならない近似法)が用いられる。なお、非負の近似法としては、例えば非負値行列因子分解(NMF:Non-negative Matrix Factorization)が挙げられる。
 ここで仮に、非負でない(即ち、結合係数が負となり得る近似法)を用いた場合、演算結果によって得られる割合は、各基準スペクトルの割合を示す値とはならないおそれがある。即ち、近似することに関しては適切に行えても、基準スペクトルの成分量を示す値としては不適切な値が算出されてしまうおそれがある。
 これに対し、上述した非負の近似法を用いれば、基準スペクトルの成分量を示す値を好適に演算できる。
 <6>
 本実施形態に係る生体音解析装置の他の態様では、前記生体音のスペクトルを、前記複数の基準スペクトルに対応する複数のスペクトルに分離して出力する分離手段を更に備える。
 この態様によれば、生体音のスペクトルが、複数の基準スペクトルに対応する複数のスペクトルに分離されて出力される。よって、例えば呼吸音を解析した場合、正常呼吸音と異常呼吸音とを別々に出力することができる。分離された複数のスペクトルは、例えば複数の音声データとして別々に出力可能である。或いは、複数の画像データ(例えば、スペクトルを示す画像)として別々に出力可能とされてもよい。
 <7>
 本実施形態に係る生体音解析方法は、生体音のスペクトルの所定の特徴に対応する周波数に関する情報を取得する取得工程と、前記生体音を分類する基準となる複数の基準スペクトルを、前記周波数に関する情報に応じてシフトさせ、周波数シフト基準スペクトルを取得するシフト工程と、前記生体音と前記周波数シフト基準スペクトルとに基づいて、前記生体音に含まれる前記複数の基準スペクトルの割合を出力する出力工程とを備える。
 本実施形態に係る生体音解析方法によれば、上述した本実施形態に係る生体音解析装置と同様に、複数の音種を含む生体音を好適に解析できる。
 なお、本実施形態に係る生体音解析方法においても、上述した本実施形態に係る生体音解析装置における各種態様と同様の各種態様を採ることが可能である。
 <8>
 本実施形態に係るコンピュータプログラムは、生体音のスペクトルの所定の特徴に対応する周波数に関する情報を取得する取得工程と、前記生体音を分類する基準となる複数の基準スペクトルを、前記周波数に関する情報に応じてシフトさせ、周波数シフト基準スペクトルを取得するシフト工程と、前記生体音と前記周波数シフト基準スペクトルとに基づいて、前記生体音に含まれる前記複数の基準スペクトルの割合を出力する出力工程とをコンピュータに実行させる。
 本実施形態に係るコンピュータプログラムによれば、上述した本実施形態に係る生体音解析方法と同様の処理をコンピュータに実行させることができるため、複数の音種を含む生体音を好適に解析できる。
 なお、本実施形態に係るコンピュータプログラムにおいても、上述した本実施形態に係る生体音解析装置における各種態様と同様の各種態様を採ることが可能である。
 <9>
 本実施形態に係る記録媒体は、上述したコンピュータプログラムが記録されている。
 本実施形態に係る記録媒体によれば、上述したコンピュータプログラムをコンピュータにより実行させることにより、複数の音種を含む生体音を好適に解析することが可能となる。
 本実施形態に係る生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体の作用及び他の利得については、以下に示す実施例において、より詳細に説明する。
 以下では、図面を参照して生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体の実施例について詳細に説明する。なお、以下の実施例では、本発明に係る生体音解析装置が、生体の呼吸音を解析する装置に適用される場合について説明する。
 <全体構成>
 先ず、本実施例に係る生体音解析装置の全体構成について、図1を参照して説明する。ここに図1は、本実施例に係る生体音解析装置の全体構成を示すブロック図である。
 図1において、本実施例に係る生体音解析装置は、主な構成要素として、生体音センサ110と、信号記憶部120と、信号処理部125と、音声出力部130と、基底保持部140と、表示部150と、処理部200とを備えて構成されている。
 生体音センサ110は、生体の呼吸音を検出可能に構成されたセンサである。生体音センサ110は、例えばECM(Electret Condenser Microphone)やピエゾを利用したマイク、振動センサ等で構成されている。
 信号記憶部120は、例えばRAM(Random Access Memory)等のバッファとして構成されており、生体音センサ110で検出された呼吸音を示す信号(以下、適宜「呼吸音信号」と称する)を一時的に記憶する。信号記憶部120は、記憶した信号を、音声出力部130及び処理部220に夫々出力可能に構成されている。
 信号処理部125は、生体音センサ110で取得した音を加工して音声出力部130に出力する。信号処理部125は、例えばイコライザーやフィルターとして機能し、取得した音を人が聴き易い状態に加工する。
 音声出力部130は、例えばスピーカやヘッドホンとして構成されており、生体音センサ110で検出され、信号処理部125で加工された呼吸音を出力する。
 基底保持部140は、例えばROM(Read Only Memory)等として構成されており、呼吸音に含まれ得る所定の音種に対応する基底を記憶している。なお、本実施例に係る基底は、本発明の「基準スペクトル」の一例である。
 表示部150は、例えば液晶モニタ等のディスプレイとして構成されており、処理部200から出力される画像データを表示する。
 処理部200は、複数の演算回路やメモリ等を含んで構成されている。処理部200は、周波数解析部210、周波数ピーク検出部220、基底集合生成部230、結合係数算出部240、信号強度算出部250及び画像生成部260を備えている。
 処理部200の各部の動作については後に詳述する。
 <動作説明>
 次に、本実施例に係る生体音解析装置の動作について、図2を参照して説明する。ここに図2は、本実施例に係る生体音解析装置の動作を示すフローチャートである。ここでは、本実施例に係る生体音解析装置が実行する処理の全体的な流れを把握するための簡単な説明を行う。各処理の詳細については、後述する。
 図2において、本実施例に係る生体音解析装置の動作時には、先ず生体音センサ110において呼吸音が検出され、処理部200による呼吸音信号の取得が行われる(ステップS101)。
 呼吸音信号が取得されると、周波数解析部210において周波数解析(例えば、高速フーリエ変換)が実行される(ステップS102)。また、周波数ピーク検出部220において、周波数解析結果を用いてピーク(極大値)の検出が実行される。
 続いて、基底集合生成部230において基底集合が生成される(ステップS103)。具体的には、基底集合生成部230は、基底保持部140に記憶されている基底を用いて基底集合を生成する。この際、基底集合生成部230は、周波数解析結果から得られたピーク位置(即ち、対応する周波数)に基づいて、基底をシフトさせる。
 基底集合が生成されると、結合係数算出部240において、周波数解析結果及び基底集合に基づく結合係数の算出が実行される(ステップS104)。
 結合係数が算出されると、信号強度算出部250において、結合係数に応じた信号強度が算出される(ステップS105)。言い換えれば、呼吸音信号に含まれる各音種の割合が算出される。
 信号強度が算出されると、画像生成部260において、信号強度を示す画像データが生成される。生成された画像データは、表示部150において解析結果として表示される(ステップS106)。
 その後、解析処理を継続するか否かの判定が実行される(ステップS107)。解析処理を継続すると判定された場合(ステップS107:YES)、ステップS101からの処理が再び実行される。解析処理を継続しないと判定された場合(ステップS107:NO)、一連の処理は終了する。
 <呼吸音信号の具体例>
 次に、本実施例に係る生体音解析装置で解析される呼吸音信号の具体例について、図3及び図4を参照して説明する。ここに図3は、捻髪音を含む呼吸音の周波数解析結果を示すスペクトログラム図であり、図4は、笛声音を含む呼吸音の周波数解析結果を示すスペクトログラム図である。
 図3に示す例では、正常呼吸音に対応するスペクトログラムパターンに加えて、異常呼吸音の1つである捻髪音に対応するスペクトログラムパターンが観測されている。捻髪音に対応するスペクトログラムパターンは、図中の拡大部分に示すように、菱形に近い形状である。
 図4に示す例では、正常呼吸音に対応するスペクトログラムパターンに加えて、異常呼吸音の1つである笛声音に対応するスペクトログラムパターンが観測されている。笛声音に対応するスペクトログラムパターンは、図中の拡大部分に示すように、鳥の首のような形状である。
 このように、異常呼吸音には複数の音種が存在し、その音種によって異なる形状のスペクトログラムパターンとして観測される。ただし、図を見ても分かるように、正常呼吸音及び異常呼吸音は互いに混じり合った状態で検出される。本実施例に係る生体音解析装置は、このように混じり合った複数の音種を分離するための解析を実行する。
 <呼吸音信号の近似方法>
 次に、本実施例に係る生体音解析装置による解析方法について、図5から図8を参照して簡単に説明する。ここに図5は、捻髪音を含む呼吸音の所定タイミングにおけるスペクトルを示すグラフであり、図6は、捻髪音を含む呼吸音のスペクトルの近似方法を示す概念図である。また図7は、笛声音を含む呼吸音の所定タイミングにおけるスペクトルを示すグラフであり、図8は、笛声音を含む呼吸音のスペクトルの近似方法を示す概念図である。
 図5において、捻髪音を含む呼吸音信号(図3参照)について、捻髪音に対応するスペクトログラムパターンが強く現れているタイミングでスペクトルを抽出すると、図に示すような結果が得られる。このスペクトルは、正常呼吸音と捻髪音とを含んでいると考えられる。
 図6において、正常呼吸音に対応するスペクトル及び捻髪音に対応するスペクトルは、予め実験等により推定できる。このため、予め推定したパターンを利用すれば、上述したスペクトルについて、正常呼吸音に対応する成分と捻髪音に対応する成分とがどのような割合で含まれているかを知ることができる。
 図7において、笛声音を含む呼吸音信号(図4参照)について、笛声音に対応するスペクトログラムパターンが強く現れているタイミングでスペクトルを抽出すると、図に示すような結果が得られる。このスペクトルは、正常呼吸音と笛声音とを含んでいると考えられる。
 図8において、上述した正常呼吸音及び捻髪音と同様に、笛声音に対応するスペクトルについても、予め実験等により推定できる。このため、予め推定したパターンを利用すれば、上述したスペクトルについて、正常呼吸音に対応する成分と笛声音に対応する成分とがどのような割合で含まれているかを知ることができる。
 以下では、このような解析を実現するための各処理について、より具体的に説明する。
 <周波数解析>
 呼吸音信号の周波数解析及び解析結果におけるピークの検出について、図9から図11を参照して詳細に説明する。ここに図9は、周波数解析方法の一例を示すグラフであり、図10は、周波数解析結果の一例を示す図である。また図11は、スペクトルのピーク検出結果を示す概念図である。
 図9において、取得された呼吸音信号に対しては、先ず周波数解析が実行される。周波数は、高速フーリエ変換等の既存の技術を利用して行うことができる。本実施例では、周波数毎の振幅値(即ち、振幅スペクトル)を周波数解析結果として用いている。なお、データ取得時のサンプリング周波数、窓サイズ、窓関数(例えば、ハニング窓等)については、適宜決定すればよい。
 図10に示すように、周波数解析結果は、n個の値で構成されるものとして得られる。なお、「n」は、周波数解析における窓サイズ等によって決まる値である。
 図11において、周波数解析によって得られたスペクトルについては、ピークの検出が実行される。図に示す例では、100Hz、130Hz、180Hz,及び320Hzの位置にピークp1~p4が検出されている。なお、ピークの検出処理については、どの周波数にピークが存在するかだけ分かればよいため、簡易的な処理でも構わない。ただし、小さなピークでも取りこぼしがないよう、ピーク検出のパラメータ設定されていることが好ましい。
 本実施例では、極大値を取る点を求め、更にその点の2階微分値の小さいもの(即ち、絶対値が大きいもの)から順に最大N個(Nは所定の値)を検出している。極大値は、差分の符号が正から負に切り替わる点から求められる。2階微分値は差分の差分で近似する。この値が所定の閾値(負の値)より小さいものを、小さいものから順に最大N個選び、その位置を記憶する。
 <基底集合の生成>
 次に、基底集合の生成について、図12から図16を参照して詳細に説明する。ここに図12は、正常肺胞呼吸音基底を示すグラフである。また図13は、捻髪音基底を示すグラフであり、図14は、連続性ラ音基底を示すグラフであり、図15は、ホワイトノイズ基底を示すグラフである。図16は、周波数シフトされた連続性ラ音基底を示すグラフである。
 図12から図15に示すように、各音種に対応する基底は、特有の形状を有している。なお、各基底は周波数解析結果と同じn個の数値(即ち、周波数ごとの振幅値)で構成されている。なお、各基底は、周波数毎の振幅値を示す線と周波数軸とで囲まれた面積が所定の値(例えば1)になるように正規化されている。
 ちなみに、ここでは正常肺胞呼吸音基底、捻髪音基底、連続性ラ音基底、ホワイトノイズ基底の4つの基底を示しているが、1つの基底しかない場合でも解析を実行することができる。また、ここで挙げた基底以外の基底を用いることもできる。なお、ここで挙げた呼吸音に対応する基底に代えて、例えば心拍音や腸音に対応する基底を用いれば、心拍音や腸音の解析を実行することが可能となる。
 図16において、上述した基底のうち連続性ラ音に対応する基底は、周波数解析の結果から検出されたピーク位置に合わせて周波数シフトされる。ここでは、図11で示したピークp1~p4の各々に合わせて、連続性ラ音基底を周波数シフトさせた例を示している。なお、連続性ラ音に対応する基底以外の基底を周波数シフトさせてもよい。
 以上の結果、基底集合は、正常肺胞呼吸音基底、捻髪音基底、ピーク検出個数分の連続性ラ音基底、及びホワイトノイズ基底の集合として生成される。
 <結合係数の算出>
 次に、結合係数の算出について、図17から図19を参照して詳細に説明する。ここに図17は、スペクトルと、基底及び結合係数との関係を示す図であり、図18は、観測されたスペクトル及び近似に用いられる基底の一例を示す図である。また図19は、非負値行列因子分解による近似結果を示す図である。
 解析対象であるスペクトルy、基底h(f)、及び結合係数uの関係は、以下の数式(1)で表すことができる。
Figure JPOXMLDOC01-appb-M000001
 図17に示すように、スペクトルy及び各基底h(f)は、n個の値を有している。他方、結合係数は、m個の値を有している。なお、「m」は、基底集合に含まれる基底の数である。
 本実施例に係る生体音解析装置では、非負値行列因子分解を利用して基底集合に含まれる各基底の結合係数を算出する。具体的には、以下の数式(2)で示される最適化基準関数Dを最小化するu(ただし、uの各成分値は非負)を求めればよい。
Figure JPOXMLDOC01-appb-M000002
 なお、一般的な非負値行列因子分解は、基底スペクトルの集合を表す基底行列と、結合係数を表すアクティベーション行列を共に算出する手法であるが、本実施例においては、基底行列を固定して結合係数のみを算出している。
 ちなみに、結合係数を算出するための手段として、非負値行列因子分解以外の近似法を用いてもよい。ただし、この場合においても非負であるという条件が望まれる。以下では、非負の近似法を用いる理由について、具体例を挙げて説明する
 図18に示すように、観測されたスペクトルを、基底A~Dの4つの基底で近似して結合係数を算出する場合を考える。なお、非負であることを条件とした場合の期待する結合係数uは、基底Aに対応するものが1、基底Bに対応するものが1、基底Cに対応するものが0、基底Dに対応するもの0である。即ち、非負であることを条件とした場合、観測されたスペクトルは、基底Aに1を乗じたものと、基底Bに1を乗じたものとを足し合わせたスペクトルとして近似される。
 一方、非負であることを条件としない場合の期待する結合係数uは、基底Aに対応するものが0、基底Bに対応するものが0、基底Cに対応するものが1、基底Dに対応するものが-0.5である。即ち、非負であることを条件としない場合、観測されたスペクトルは、基底Cに1を乗じたものと、基底Dに-0.5を乗じたものとを足し合わせたスペクトルとして近似される。
 上述した2つの例を比較した場合、非負であることを条件とする場合よりも、非負であることを条件としない場合の方が高い近似精度を得られることがある。しかしながら、ここでの結合係数uはスペクトルごとの成分量を表すものであるため、非負の値として得られなければならない。言い換えれば、結合係数uが負の値で得られた場合には、成分量としての解釈ができない。これに対し、非負の条件を課して近似を行えば、成分量に対応する結合係数uを算出することができる。
 図19において、本実施例に係る生体解析装置では、上述したように、正常肺胞呼吸音基底、捻髪音基底、4つの連続性ラ音基底、及びホワイトノイズ基底からなる基底集合を用いて結合係数uを算出するため、結合係数uは、uからuの7個の値を有するものとして算出される。
 ここで、正常肺胞呼吸音基底に対応する結合係数uは、呼吸音に対する正常肺胞呼吸音の割合を示す値であると言える。同様に、捻髪音基底に対応する結合係数u、ホワイトノイズ基底に対応する結合係数u、100Hzにシフトした連続性ラ音基底に対応する結合係数u、130Hzにシフトした連続性ラ音基底に対応する結合係数u、180Hzにシフトした連続性ラ音基底に対応する結合係数u、及び320Hzにシフトした連続性ラ音基底に対応する結合係数uの各々についても、呼吸音に対する各音種の割合を示す値であると言える。従って、結合係数uから各音種の信号強度を算出することができる。
 <解析結果の表示>
 次に、解析結果の表示について、図20及び図21を参照して詳細に説明する。ここに図20は、表示部における表示例を示す平面図である。また図21は、笛声音の抽出例を示すスペクトログラム図である。
 図20に示すように、解析結果である各音種の強度は、棒グラフとして表示部150の表示領域155に表示される。ただし、この表示方法は一例であり、他の表示態様で表示を行ってもよい。例えば、各音種の割合(含有比率)を算出して円グラフとして表示してもよい。或いは、各音種の強度を数値化して表示してもよい。
 図21に示すように、スペクトログラムから、所定の音種に対応するパターンだけを抽出して表示することもできる。ここでは、笛声音に対応するパターンだけを抽出した例を示している。
 なお、上述した画像としての出力に代えて或いは加えて、音声データによる出力も可能である。具体的には、音種毎に別々に音声を出力することができる。或いは、特定の音種だけを強調して音声を出力することができる。
 ちなみに、短時間フーリエ変換(STFT:Short Time Fourier Transform)のような、ある一定時間ごとに周波数解析を行う手法と組み合わせることで、動的に各タイミングでの解析結果を出力することができる。
 また、本実施例では、信号強度を振幅スペクトルに対応するものとして算出しているが、パワースペクトルに対応するように換算処理を行ってもよい。またdB値に換算してもよい。
 本発明は、上述した実施形態に限られるものではなく、特許請求の範囲及び明細書全体から読み取れる発明の要旨或いは思想に反しない範囲で適宜変更可能であり、そのような変更を伴う生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体もまた本発明の技術的範囲に含まれるものである。
 110 生体音センサ
 120 信号記憶部
 125 信号処理部
 130 音声出力部
 140 基底保持部
 150 表示部
 155 表示領域
 200 処理部
 210 周波数解析部
 220 周波数ピーク検出部
 230 基底集合生成部
 240 結合係数算出部
 250 信号強度算出部
 260 画像生成部
 y スペクトル
 h(f) 基底
 u 結合係数

Claims (9)

  1.  生体音のスペクトルの所定の特徴に対応する周波数に関する情報を取得する取得手段と、
     前記生体音を分類する基準となる複数の基準スペクトルを、前記周波数に関する情報に応じてシフトさせ、周波数シフト基準スペクトルを取得するシフト手段と、
     前記生体音と前記周波数シフト基準スペクトルとに基づいて、前記生体音に含まれる前記複数の基準スペクトルの割合を出力する出力手段と
     を備えることを特徴とする生体音解析装置。
  2.  前記生体音は、呼吸音であることを特徴とする請求項1に記載の生体音解析装置。
  3.  前記複数の基準スペクトルは、副雑音に対応する基準スペクトルを含むことを特徴とする請求項2に記載の生体音解析装置。
  4.  前記所定の特徴は、極大値であることを特徴とする請求項1から3のいずれか一項に記載の生体音解析装置。
  5.  前記出力手段は、非負の近似法を用いて、前記複数の基準スペクトルの割合を算出することを特徴とする請求項1から4のいずれか一項に記載の生体音解析装置。
  6.  前記生体音のスペクトルを、前記複数の基準スペクトルに対応する複数のスペクトルに分離して出力する分離手段を更に備えることを特徴とする請求項1から5のいずれか一項に記載の生体音解析装置。
  7.  生体音のスペクトルの所定の特徴に対応する周波数に関する情報を取得する取得工程と、
     前記生体音を分類する基準となる複数の基準スペクトルを、前記周波数に関する情報に応じてシフトさせ、周波数シフト基準スペクトルを取得するシフト工程と、
     前記生体音と前記周波数シフト基準スペクトルとに基づいて、前記生体音に含まれる前記複数の基準スペクトルの割合を出力する出力工程と
     を備えることを特徴とする生体音解析方法。
  8.  生体音のスペクトルの所定の特徴に対応する周波数に関する情報を取得する取得工程と、
     前記生体音を分類する基準となる複数の基準スペクトルを、前記周波数に関する情報に応じてシフトさせ、周波数シフト基準スペクトルを取得するシフト工程と、
     前記生体音と前記周波数シフト基準スペクトルとに基づいて、前記生体音に含まれる前記複数の基準スペクトルの割合を出力する出力工程と
     をコンピュータに実行させることを特徴とするコンピュータプログラム。
  9.  請求項8に記載のコンピュータプログラムが記録されていることを特徴とする記録媒体。
PCT/JP2014/059260 2014-03-28 2014-03-28 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体 WO2015145754A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2014/059260 WO2015145754A1 (ja) 2014-03-28 2014-03-28 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体
JP2016509846A JP6298527B2 (ja) 2014-03-28 2014-03-28 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体
US15/129,940 US10441243B2 (en) 2014-03-28 2014-03-28 Biological sound analyzing apparatus, biological sound analyzing method, computer program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/059260 WO2015145754A1 (ja) 2014-03-28 2014-03-28 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体

Publications (1)

Publication Number Publication Date
WO2015145754A1 true WO2015145754A1 (ja) 2015-10-01

Family

ID=54194340

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/059260 WO2015145754A1 (ja) 2014-03-28 2014-03-28 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体

Country Status (3)

Country Link
US (1) US10441243B2 (ja)
JP (1) JP6298527B2 (ja)
WO (1) WO2015145754A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3367908B1 (en) * 2015-10-30 2020-09-23 The Johns Hopkins University Programmable electronic stethoscope devices, algorithms, systems, and methods

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001505085A (ja) * 1996-10-04 2001-04-17 カーメル メディカル アコースティック テクノロジーズ リミテッド フォノニューモグラフ・システム
JP2004357758A (ja) * 2003-06-02 2004-12-24 Konica Minolta Medical & Graphic Inc 生体音検出データ処理装置、生体音検出データ処理方法及び生体音検出データ処理プログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2823660A1 (fr) * 2001-04-18 2002-10-25 Pneumopartners Dispositif d'aide a l'analyse de bruits adventices
US20060198533A1 (en) * 2005-03-04 2006-09-07 Wang Le Y Method and system for continuous monitoring and diagnosis of body sounds
JP4559540B2 (ja) * 2008-10-17 2010-10-06 サラヤ株式会社 流体容器ユニット
US8758262B2 (en) * 2009-11-25 2014-06-24 University Of Rochester Respiratory disease monitoring system
AU2010339554A1 (en) * 2009-12-29 2012-08-16 The Board Of Governors For Higher Education, State Of Rhode Island And Providence Plantations Systems for sleep apnea detection from breathing sounds
WO2012042611A1 (ja) * 2010-09-29 2012-04-05 富士通株式会社 呼吸検出装置および呼吸検出方法
JP5585428B2 (ja) 2010-12-08 2014-09-10 ソニー株式会社 呼吸状態分析装置、呼吸状態表示装置およびそれらにおけるプログラム
JP2013123495A (ja) 2011-12-13 2013-06-24 Sharp Corp 呼吸音解析装置、呼吸音解析方法、呼吸音解析プログラムおよび記録媒体
US9138199B2 (en) * 2012-12-03 2015-09-22 Cardiac Pacemakers, Inc. Method and apparatus for detecting subaudible cardiac vibrations
US20170135649A1 (en) * 2014-07-01 2017-05-18 Pioneer Corporation Breath sound analyzing apparatus, breath sound analyzing method, computer program, and recording medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001505085A (ja) * 1996-10-04 2001-04-17 カーメル メディカル アコースティック テクノロジーズ リミテッド フォノニューモグラフ・システム
JP2004357758A (ja) * 2003-06-02 2004-12-24 Konica Minolta Medical & Graphic Inc 生体音検出データ処理装置、生体音検出データ処理方法及び生体音検出データ処理プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TOMOYA SAKAI: "Extraction of Abnormal Lung Sounds via Sparse Representation", IEICE TECHNICAL REPORT, vol. 111, no. 27, 2011, pages 131 - 136 *

Also Published As

Publication number Publication date
US20170135670A1 (en) 2017-05-18
US10441243B2 (en) 2019-10-15
JPWO2015145754A1 (ja) 2017-04-13
JP6298527B2 (ja) 2018-03-20

Similar Documents

Publication Publication Date Title
JP5585428B2 (ja) 呼吸状態分析装置、呼吸状態表示装置およびそれらにおけるプログラム
JP6231681B2 (ja) 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体
US11116478B2 (en) Diagnosis of pathologies using infrasonic signatures
EP3678553B1 (en) Diagnosis of pathologies using infrasonic signatures
Grønnesby et al. Feature extraction for machine learning based crackle detection in lung sounds from a health survey
TWI572327B (zh) 利用音頻訊號判斷流體管路窄化的檢測裝置、電腦程式產品及電腦可讀取媒體
JP6467044B2 (ja) シャント音解析装置、シャント音解析方法、コンピュータプログラム及び記録媒体
JP6298527B2 (ja) 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体
US10368804B2 (en) Device, system and method for detection of fluid accumulation
CN105489228A (zh) 一种基于频域图处理的干罗音识别方法
JP7001806B2 (ja) 呼吸音解析装置、呼吸音解析方法、コンピュータプログラム及び記録媒体
JP6531187B2 (ja) 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体
WO2015145763A1 (ja) 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体
JP2015188642A (ja) 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体
JP6630149B2 (ja) 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体
JP6298339B2 (ja) 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体
JP2019150641A (ja) 呼吸音解析装置
JP7089648B2 (ja) 生体音解析装置、プログラム、及び生体音解析方法
JP2022058500A (ja) 呼吸音解析装置
JP2018167062A (ja) 呼吸音解析装置
JP2016030067A (ja) 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体
CA3233804A1 (en) Computer-assisted system and method of heart murmur classification
JP6857450B2 (ja) 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14887010

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016509846

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 15129940

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 14887010

Country of ref document: EP

Kind code of ref document: A1