JPWO2015060375A1 - 生体音信号処理装置、生体音信号処理方法および生体音信号処理プログラム - Google Patents

生体音信号処理装置、生体音信号処理方法および生体音信号処理プログラム Download PDF

Info

Publication number
JPWO2015060375A1
JPWO2015060375A1 JP2015543900A JP2015543900A JPWO2015060375A1 JP WO2015060375 A1 JPWO2015060375 A1 JP WO2015060375A1 JP 2015543900 A JP2015543900 A JP 2015543900A JP 2015543900 A JP2015543900 A JP 2015543900A JP WO2015060375 A1 JPWO2015060375 A1 JP WO2015060375A1
Authority
JP
Japan
Prior art keywords
sound
matrix
biological
sound signal
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015543900A
Other languages
English (en)
Inventor
智弥 酒井
智弥 酒井
千弥 善安
千弥 善安
末治 宮原
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nagasaki University
Original Assignee
Nagasaki University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nagasaki University filed Critical Nagasaki University
Publication of JPWO2015060375A1 publication Critical patent/JPWO2015060375A1/ja
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/02Stethoscopes
    • A61B7/04Electric stethoscopes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B7/00Instruments for auscultation
    • A61B7/003Detecting lung or respiration noise

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Acoustics & Sound (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Physics & Mathematics (AREA)
  • Pulmonology (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

【課題】人間などの肺音から連続性ラ音および断続性ラ音をより正確に分別できるようにする。【解決手段】生体音検出信号処理装置(90)は、ロバスト主成分分析部(40)と、連続性音処理部(20)と、非連続性音処理部(30)とを有している。ロバスト主成分分析部(40)は、生体音の原音を入力部(12)で受信しフーリエ変換部(14)でフーリエ変換して行列生成部(16)で生成した原音行列をロバスト主成分分析する。ロバスト主成分分析で得られたスパース行列を連続性音処理部(20)で処理すると原音から連続性の生体音が得られる。ロバスト主成分分析で得られた低ランク行列を非連続性音処理部(30)で処理すると原音から連続性の生体音を除外した生体音が得られる。

Description

本発明は、肺音などの生体音を処理する生体音信号処理装置、生体音信号処理方法および生体音信号処理プログラムに関する。
近年、電子聴診器などにより取得される肺音の信号(肺音信号)などをデジタルデータに変換してデータ解析し、その解析結果を診断(音診断)に活用するための診断支援装置の開発が進められている。
肺音は、呼吸音と異常音としての副雑音に大別される。副雑音はさらに、ラ音とその他に分けられ、ラ音はさらに断続性ラ音と連続性ラ音に分けられる。断続性ラ音には水泡音と捻髪音が含まれ、連続性ラ音には笛音といびき音が含まれる。
肺音を高速フーリエ変換およびその逆変換を用いて正常呼吸音と連続性ラ音に分別する方法が知られている(たとえば特許文献1参照)。この方法では、まず、肺音の時間波形を高速フーリエ変換(FFT)して振幅スペクトルおよびパワースペクトルを算出する。次に、このパワースペクトルの局所分散値が閾値を越えた点における振幅スペクトルを逆FFT処理する。このようにして、正常呼吸音と連続性ラ音が分別できる。
また、肺音から呼吸音と断続性ラ音を分別する技術が知られている(たとえば非特許文献1参照)。この技術では、肺音信号をフーリエ変換信号とウェーブレット信号との和で最も簡潔に肺音を構成するスパース(sparse)表現に基づき肺音を分離するものである。このスパース表現f(t)が呼吸音、w(t)が断続性ラ音として分別される。
特開2004−357758号公報
酒井智弥、里元はるか、喜安千弥、宮原末治、「スパース表現による異常肺音の抽出」、電子情報通信学会技術報告 SIP2011−23、ページ131−136、2011年5月 石原恒夫監修、川城丈夫、菊池功次、阿部直、米丸亮著、「CDによる聴診トレーニング 呼吸音編」、南江堂、1993年 E. J. Candes, X. Li, Y. Ma, and J. Wright、"Robustprincipal component analysis?"、Journal of the ACM、vol. 58、no. 3、p.11:1-11:37、2011年 Z. Lin, M. Chen, L. Wu, and Y. Ma、"Theaugmented Lagrange multiplier method for exact recovery of corrupted low-rankmatrices"、LILU-ENG-09-2215、UIUC、2009年
肺音を高速フーリエ変換およびその逆変換を用いて正常呼吸音と連続性ラ音に分別する方法は、周波数帯を適応的に選択したフィルタリングの一種である。このため、両者が同じ周波数成分を共有しているときには分別することができない。また、ここで正常呼吸音としている信号には、異常音である断続性ラ音が含まれている可能性がある。
また、肺音信号をフーリエ変換信号とウェーブレット信号との和で最も簡潔に肺音を構成するスパース表現に基づき肺音を分離する手法では、元々の肺音信号に連続性ラ音が含まれている場合には、連続性ラ音がf(t)とw(t)のどちらか一方に分別されるとは限らない。このため、連続性ラ音の解析処理には対応できない。
このように従来技術では、多様な異常音を含む肺音信号を正確に分別することができない。
そこで、本発明は、人間などの肺音から連続性ラ音および断続性ラ音をより正確に分別できるようにすることを目的とする。
上述の目的を達成するため、本発明は、生体音信号処理装置において、生体音信号の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析部と、前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理部と、前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る非連続性音処理部と、を有することを特徴とする。
また、本発明は、生体音信号処理方法において、生体音の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析工程と、前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理部を得る第2工程と、前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る第3工程と、を有することを特徴とする。
また、本発明は、生体音信号処理プログラムにおいて、コンピュータを、生体音の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析手段と、前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理手段と、前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る非連続性音処理手段として機能させることを特徴とする。
本発明によれば、人間などの連続性ラ音および断続性ラ音をより正確に分別できる。
本発明に係る生体音信号処理装置の第1の実施の形態のブロック図である。 本発明に係る生体音信号処理装置の第1の実施の形態における生体音信号処理方法のフローチャートである。 本発明に係る生体音信号処理装置の第1の実施の形態において処理を施す原音のグラフである。 本発明に係る生体音信号処理装置の第1の実施の形態において原音信号を短時間フーリエ変換して得られた原音スペクトログラムの値を要素に持つ行列の要素の値を濃淡で表した図である。 本発明に係る生体音信号処理装置の第1の実施の形態においてロバスト主成分分析で得た低ランク行列の要素の値を濃淡で表した図である。 本発明に係る生体音信号処理装置の第1の実施の形態においてロバスト主成分分析で得たスパース行列の要素の値を濃淡で表した図である。 本発明に係る生体音信号処理装置の第1の実施の形態においてスパース行列を逆フーリエ変換して得られた肺音信号のグラフである。 本発明に係る生体音信号処理装置の第1の実施の形態において低ランク行列を逆フーリエ変換して得られた肺音信号のグラフである。 本発明に係る生体音信号処理装置の第1の実施の形態において低ランク行列を逆フーリエ変換して得られた肺音信号から抽出したフーリエ成分のグラフである。 本発明に係る生体音信号処理装置の第1の実施の形態において低ランク行列を逆フーリエ変換して得られた肺音信号から抽出したウェーブレット成分のグラフである。 本発明に係る生体音信号処理装置の第2の実施の形態のブロック図である。 本発明に係る生体音信号処理装置の第2の実施の形態生体音信号処理方法のフローチャートである。 本発明に係る生体音信号処理装置の第3の実施の形態のブロック図である。 本発明に係る生体音信号処理装置の第3の実施の形態の生体音信号処理方法のフローチャートである。
本発明に係る生体音信号処理装置のいくつかの実施の形態を、図面を参照して説明する。なお、この実施の形態は単なる例示であり、本発明はこれに限定されない。同一または類似の構成には同一の符号を付し、重複する説明は省略する。
[第1の実施の形態]
図1は、本発明に係る生体音信号処理装置の第1の実施の形態のブロック図である。
生体音信号処理装置90は、予備処理部10とロバスト主成分分析部40とスパース行列格納部22と低ランク行列格納部32と連続性音処理部20と非連続性音処理部30とを有している。生体音信号処理装置90は、たとえば1台のコンピュータ上に構築される。生体音信号処理装置90は、ネットワークで結合された複数台のコンピュータ上に構築されていてもよい。
予備処理部10は、入力部12とフーリエ変換部14と行列生成部16とを有している。連続性音処理部20は、連続性音スペクトログラム生成部24と第1逆フーリエ変換部26とを有している。非連続性音処理部30は、非連続性音スペクトログラム生成部34と第2逆フーリエ変換部36と信号抽出部38とを有している。
予備処理部10は、生体音の原音スペクトログラムを表現した原音行列を生成する。生体音は、図示しない電子聴診器のような生体音検出装置で検出し、電気信号として生体音信号処理装置90に与えられる。
ロバスト主成分分析部40は、予備処理部10が生成した原音行列をロバスト主成分分析し、スパース行列と低ランク行列を得る。スパース行列は、スパース行列格納部22に格納される。低ランク行列は、低ランク行列格納部32に格納される。
連続性音処理部20は、スパース行列格納部22に格納されたスパース行列を処理して、原音中の連続性音を生成する。非連続性音処理部30は、低ランク行列格納部32に格納された低ランク行列を処理して、原音中の非連続性音を生成する。
連続性音処理部20および非連続性音処理部30が生成した連続性音および非連続性音は、たとえばD/A変換を施されて図示しないスピーカなどによって出力される。連続性音および非連続性音の波形をディスプレイに表示してもよい。あるいは、連続性音および非連続性音の信号を外部の装置に送信し、その外部装置で異常検知などを行ってもよい。
次に、この生体音信号処理装置90を用いた生体音信号処理方法を説明する。
図2は、本実施の形態における生体音信号処理方法のフローチャートである。
まず、入力部12が図示しない電子聴診器のような生体音検出装置からの生体音を検出した信号を取りこむ。検出された生体音を原音と呼ぶこととする。原音をたとえば電気的に表現した信号を原音信号s(t)と呼ぶこととする。生体音とは、たとえば人間の肺音である。入力部12は、原音信号がアナログ信号の場合は、A/D変換して原音信号をデジタルデータに変換する。
図3は、本実施の形態において処理を施す肺音信号のグラフである。図3において、横軸は経過時間(秒)、縦軸は信号強度(振幅)を示す。
本実施の形態では、非特許文献2の付録のCDの第60トラックに記録された肺音を原音として処理を行う。
次に、フーリエ変換部14が原音信号s(t)を短時間フーリエ変換し、時間周波数領域の複素量で表される複素サウンドスペクトログラム(以下、スペクトログラムと称する。)を得る(ステップ1)。
より具体的には、原音信号s(t)に時間窓関数をずらしながら掛けたものを離散フーリエ変換して、原音スペクトログラムS(ω,t)を得る。原音スペクトログラムS(ω,t)は、複素数の値を持ち、時間窓関数の位置を表す時刻tにおいて信号を構成している角周波数ωの成分の振幅と位相を表す。
時刻tは、時間窓関数をずらす時間幅Δt2で離散値をとる。この時間窓関数をずらす時間幅Δt2は、時間窓幅Δt1を超えないものとする。すなわち、Δt2<Δt1である。また、角周波数ωは時間窓幅Δt1の逆数に比例する間隔で離散化されている。
その後、行列生成部16が原音スペクトログラムS(ω,t)の振幅|S(ω,t)|を要素に持つ原音行列Dを作成する(ステップ2)。原音行列Dの行番号iと列番号jは、i番目の角周波数ω、j番目の時刻tに対応するものとする。行列Dの第i行j列の要素Dijは、原音スペクトログラムS(ω,t)を構成する複素数S(ω,t)の絶対値とする。
図4は、本実施の形態において原音信号を短時間フーリエ変換して得られた原音スペクトログラムの値を要素に持つ原音行列の要素の値を濃淡で表した図である。
ステップ3では、ロバスト主成分分析部40が原音行列Dを低ランク行列Aとスパース行列Eの和の形になるように分解する。ここでは、非特許文献3に倣って、このような行列の分解をロバスト主成分分析と呼ぶ。ある行列を低ランク行列とスパース行列の和の形になるように分解する算法としては、たとえば非特許文献4に、拡張ラグランジュ法を改良した収束の早い算法が提案されている。
通常の主成分分析では、与えられた行列を低ランク行列で近似する。その低ランク行列は、与えられた行列の主要な固有値(または特異値)のみに付随する固有ベクトルの積によって構成される。
一方、本実施の形態で用いるロバスト主成分分析では、与えられた原音行列Dを、その要素の一部にのみ修正を許しながら低ランク行列Aで近似する。原音行列Dは低ランク行列Aと修正量を表すスパース行列Eの和に分解される。その際、行列Aのランク(階数)と、修正する要素の数(行列Eの非ゼロ要素の数)は、可能な限り共に小さいものとする。この場合の解の一意性は非特許文献3に開示されている。
図5は、本実施の形態においてロバスト主成分分析で得た低ランク行列の要素の値を濃淡で表した図である。図6は、本実施の形態においてロバスト主成分分析で得たスパース行列の要素の値を濃淡で表した図である。
低ランク行列Aは、主要な固有ベクトルの積によって構成し易い行列Dの成分を要素に持つ。ゆえに、低ランク行列Aの行または列が呈する図5の模様は、原音行列の要素の値を濃淡で表した図4に見られる縦縞・横縞模様のように、類似の模様が複数現れる傾向がある。
一方、そのような低ランク行列Aによって原音行列Dを近似するために除外された成分をスパース行列Eは要素として持つ。ゆえに、図6に示されるように、スパース行列Eは、縦縞・横縞などの規則性を持たない、任意の曲線状または斑点状の模様を呈する。
ステップ4では、ステップ3で得られたスパース行列Eに対応する連続性音スペクトログラムE(ω,t)を生成する。連続性音スペクトログラムE(ω,t)は、連続性音スペクトログラム生成部24がスパース行列格納部22からスパース行列Eを読み込んで生成する。連続性音スペクトログラムE(ω,t)を構成する複素数E(ω,t)は、前記スパース行列の要素を振幅とし、前記原音スペクトログラの偏角を偏角とする複素数とする。すなわち複素数E(ω,t)は、行列Eの第i行j列の要素Eijと原音スペクトログラムS(ω,t)を構成する複素数S(ω,t)の偏角θijから次式によって得られる。
E(ω,t)=Eij (cos(θij)+ isin(θij))
ステップ5では、第1逆フーリエ変換部26が連続性音スペクトログラムE(ω,t)を短時間逆フーリエ変換し、肺音信号e(t)を得る。より具体的には、連続性音スペクトログラムE(ω,t)の各時刻t毎に複素スペクトルE(ω,t)を短時間逆フーリエ変換し、各時刻tにおける時間窓関数内の肺音信号を得る。時間窓関数の重なりに応じて肺音信号を平均化することで肺音信号e(t)を得る。
図7は、本実施の形態においてスパース行列を逆フーリエ変換して得られた肺音信号のe(t)グラフである。
図7は、デジタルデータとして第1逆フーリエ変換部26が出力した肺音信号e(t)をアナログ信号のように模擬して表示したものである。肺音信号e(t)を図示しない生体音出力部でD/A変換し、図示しないスピーカなどによって肺音として再現すると、連続性ラ音となる。
本実施の形態において、処理の入力として使用した原音信号s(t)は、非特許文献2に付録のCDの第60トラックから採用した連続性ラ音(高音性の笛音)を含む肺音である。この連続性ラ音は、原音信号s(t)のスペクトログラムを表す図4において曲線状の模様を呈しており、図6に示したスパース行列Eが表すスペクトログラムへ明確に分離されている。このことから、上記のステップ1からステップ5の処理により、連続性ラ音がステップ5の肺音信号e(t)として良好に分離されていることが分かる。
この例で使用した連続性ラ音は、高音性の笛音であるが、低音性のいびき音についても分離することが可能である。本実施例と同様に、連続性ラ音以外の音(呼吸音や断続性ラ音)のスペクトログラムが低ランク行列Aによって表され易ければ、ステップ3のロバスト主成分分析において、低ランク行列Aで行列Dを近似するために除外された成分(スパース行列E)として連続性ラ音のスペクトログラムが分離される。
ステップ6では、ステップ3にて分離した低ランク行列Aに対応する非連続性音スペクトログラムA(ω,t)を非連続性音スペクトログラム生成部34が生成する。生成の方法はステップ4と同様である。すなわち、非連続性音スペクトログラムA(ω,t)を構成する複素数A(ω,t)は、前記低ランク行列の要素を振幅とし、前記原音スペクトログラの偏角を偏角とする複素数とし、行列Aの第i行j列の要素Aijと原音スペクトログラムS(ω,t)を構成する複素数S(ω,t)の偏角θijから次式によって得られる。
A(ω,t)=Aij (cos(θij)+ isin(θij))
ステップ7では、第2逆フーリエ変換部36が非連続性音スペクトログラムA(ω,t)を短時間逆フーリエ変換し、肺音信号a(t)を得る。この方法は、ステップ5と同様である。すなわち、非連続性音スペクトログラムA(ω,t)の各時刻t毎に複素スペクトルA(ω,t)を短時間逆フーリエ変換し、各時刻tにおける時間窓関数内の肺音信号を得る。窓関数の重なりに応じて肺音信号を平均化することで肺音信号a(t)を得る。
図8は、本実施の形態において低ランク行列Aを逆フーリエ変換して得られた肺音信号a(t)のグラフである。
図8は、デジタルデータとして第2逆フーリエ変換部36が出力した肺音信号をアナログ信号のように模擬して表示したものである。肺音信号a(t)を図示しない生体音出力部でD/A変換し、図示しないスピーカなどによって肺音として再現すると、原音信号s(t)から連続性音を除去した音となる。
ステップ8では、更に非特許文献1の手法で、信号抽出部38が肺音信号e(t)から肺音信号f(t)と肺音信号w(t)を抽出する。非特許文献1の手法は、スパース表現に基づき肺音を抽出するものである。ここでは、肺音信号a(t)を、フーリエ合成信号(f(t))とウェーブレット合成信号(w(t))との和で表現する。その際、非ゼロのフーリエ成分の数と非ゼロのウェーブレット成分の数は、可能な限り共に小さいものとする。このための算法としては、たとえば非特許文献1に開示されている。
図9は、本実施の形態において肺音信号e(t)から抽出したフーリエ成分である肺音信号f(t)のグラフである。
図9は、デジタルデータとして信号抽出部38が出力した肺音信号f(t)をアナログ信号のように模擬して表示したものである。肺音信号f(t)を図示しない生体音出力部でD/A変換し、図示しないスピーカなどによって肺音として再現すると、原音信号s(t)中の呼吸音が出力される。
図10は、本実施の形態において肺音信号e(t)から抽出したウェーブレット成分である肺音信号w(t)のグラフである。
図10は、デジタルデータとして信号抽出部38が出力した肺音信号w(t)をアナログ信号のように模擬して表示したものである。肺音信号w(t)を図示しない生体音出力部でD/A変換し、図示しないスピーカなどによって肺音として再現すると、原音信号s(t)中の断続性ラ音が出力される。
本実施の形態において、原音信号s(t)は、非特許文献2付録のCDに第60トラックから採用した連続性ラ音データ(高音性の笛音)である。しかし、図3に示した原音信号s(t)の波形から、連続性ラ音以外にも、断続性の音が混入していることを確認できる。また、図4に示した原音信号s(t)を表すスペクトログラムから、曲線状の模様を呈する連続性ラ音以外にも、縦縞模様を呈する断続性の音(断続性ラ音)や、低周波帯に継続する音(呼吸音)の存在を確認できる。連続性ラ音以外のこれらの音は、図5に示した低ランク行列Aが表すスペクトログラムへ明確に分離されている。このことから、上記のステップ1からステップ3およびステップ6からステップ8の処理により、呼吸音と断続性ラ音が良好に抽出されていることが分かる。
このように、本実施の形態によれば、人間などの肺音から呼吸音、連続性ラ音、断続性ラ音をより正確に分別できる。
本実施の形態では、人間の肺音から呼吸音、連続性ラ音、断続性ラ音を分離・抽出したが、人間以外の動物であっても、その動物が発する生体音に呼吸音、連続性ラ音および断続性ラ音に類する音が含まれる場合には、本実施の形態と同様にそれらの音を分離・抽出することができる。
[第2の実施の形態]
図11は、本発明に係る生体音信号処理装置の第2の実施の形態のブロック図である。図12は、本実施の形態における生体音信号処理方法のフローチャートである。
本実施の形態は、第1の実施の形態と、プロセスの全体として複素行列を用いる点が異なる。このため、第1の実施の形態における行列生成部16は、本実施の形態の生体音信号処理装置には存在しない。
本実施の形態では、第1の実施の形態におけるステップ2を省略し、ステップ3においてロバスト主成分分析部40は原音スペクトログラムS(ω,t)を直接ロバスト主成分分析して低ランク行列Aとスパース行列Eを得る。分離した肺音信号を得るステップ5と7、およびステップ8以降は、第1の実施の形態と同じである。
第1の実施の形態における複素行列を実数行列に変換し、ロバスト主成分分析の後に、複素行列に再度変換するというステップを、本実施の形態では削除している。振幅と位相を表す複素数の行列を分離するので、振幅のみを分離する実施形態1よりも分離の性能向上を期待できる。なお、ロバスト主成分分析の対象の行列が複素行列であるため、計算時間が第1の実施の形態よりも若干長くなるものの、適切な解法を用いれば、十分、実用に耐える。
[第3の実施の形態]
図13は、本発明に係る生体音信号処理装置の第3の実施の形態のブロック図である。図14は、本実施の形態における生体音信号処理方法のフローチャートである。
本実施の形態は、第1の実施の形態と、短時間フーリエ変換および短時間逆フーリエ変換の代わりに、短時間コサイン変換および短時間逆コサイン変換を用いる点が異なる。本実施の形態の生体音信号処理装置では、第1の実施の形態における短時間フーリエ変換部14の代わりに、短時間コサイン変換部41が設けられている。
本実施の形態は、第1の実施の形態と、プロセスの全体として実数行列を用いる点が異なる。このため、第1の実施の形態における行列生成部16は、本実施の形態の生体音信号処理装置には存在しない。
本実施の形態では、第1の実施の形態におけるステップ2を省略し、ステップ3においてロバスト主成分分析部50は短時間コサイン変換部で得た実数の原音スペクトログラムS(ω,t)を直接ロバスト主成分分析して低ランク行列Aとスパース行列Eを得る。また、本実施の形態の生体音信号処理装置では、第1の実施の形態における第1短時間逆フーリエ変換部26の代わりに、短時間逆コサイン変換部52が設けられている。本実施の形態の生体音信号処理装置では、第1の実施の形態における第2短時間逆フーリエ変換部36の代わりに、短時間逆コサイン変換部53が設けられている。
コサイン変換は実信号のフーリエ変換に対して半分の記憶領域で処理できる利点がある。ただし、信号が偶関数であることを仮定した処理なので、他の実施形態より分離の性能がやや劣る可能性がある。
第1,第2,第3のいずれの実施の形態においても、低ランク行列Aからは、特異値分解によって
A=UKV
となる行列U、行列K、行列Vが求められる。低ランク行列Aのサイズがm×n、ランク(階数)がrであるとすると、行列Kは、特異値を対角にもつ対角のr次正方行列であり、行列UおよびVはそれぞれr本の左特異ベクトルと右特異ベクトルからなるm×r行列、n×r行列である。なお、Vは、行列Vが実行列の場合はVの転置行列であり、行列Vが複素行列の場合はVの共役転置行列である。
左特異ベクトルは、行列Aの列ベクトルを合成できる基底である。低ランク行列Aの列ベクトルは、連続性の生体音以外の音、特に呼吸音と断続音の瞬時周波数スペクトルを表している。ゆえに、左特異ベクトルは、これらの音の瞬時周波数スペクトルを構成するための基底である。また、右特異ベクトルは、任意の時刻における瞬時周波数スペクトルの内訳を示している。すなわち、j番目の右特異ベクトルの成分は、j番目の左特異ベクトルの基底がそれぞれどの時刻でどの程度現れるかを表している。
したがって、低ランク行列Aの特異値分解によって、瞬時周波数スペクトルの基底からなる行列U、その内訳を表すVが得られる。同じ種類の音は類似した瞬時周波数スペクトルの内訳を持つことから、左右特異ベクトルを利用して同種の呼吸音や断続音を判別する分類に応用できる。
なお、特異値分解は、行列を構成する行ベクトルの集合および列ベクトルの集合について、主成分を求める行列分解の一手法である。特異値分解によって、主成分の大きさを表す特異値および主成分の向きを表す正規直交基底が得られる。ただし、ゼロの特異値に付随する特異ベクトルは、一意に定まらない。また、対応する左右の特異ベクトルは、符号または大きさ1の複素数倍の任意性がある。しかし、本実施の形態で得られる低ランク行列Aは、非ゼロの特異値と、それらに付随する左右特異ベクトルによって構成されているため、一意に定まる。
10…予備処理部、12…入力部、14…フーリエ変換部、16…行列生成部、20…連続性音処理部、22…スパース行列格納部、24…連続性音スペクトログラム生成部、26…第1逆フーリエ変換部、30…非連続性音処理部、32…低ランク行列格納部、34…非連続性音スペクトログラム生成部、36…第2逆フーリエ変換部、38…信号抽出部、40…ロバスト主成分分析部、41…コサイン変換部、50…ロバスト主成分分析部、52…逆コサイン変換部、53…逆コサイン変換部、90…生体音信号処理装置

Claims (11)

  1. 生体音信号の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析部と、
    前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理部と、
    前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る非連続性音処理部と、
    を有することを特徴とする生体音信号処理装置。
  2. 前記生体音信号を短時間フーリエ変換して前記原音行列を得るフーリエ変換部と、
    前記非連続性音処理部は、前記低ランク行列から非連続性音スペクトログラムを生成する手段と、前記非連続性音スペクトログラムを短時間逆フーリエ変換して非連続性音信号を生成する手段と、前記非連続性音信号からフーリエ変換信号とウェーブレット信号とを抽出する信号抽出手段とを備えることを特徴とする請求項1に記載の生体音信号処理装置。
  3. 前記生体音信号を短時間フーリエ変換して前記原音行列を得るフーリエ変換部と、
    前記連続性音処理部は、前記スパース行列から連続性音スペクトログラムを生成する手段と、前記連続性音スペクトログラムを短時間逆フーリエ変換して連続性音信号を生成する手段を備えることを特徴とする請求項1または請求項2に記載の生体音処理装置。
  4. 前記生体音信号を短時間フーリエ変換して前記原音スペクトログラムを得るフーリエ変換部と、
    離散化した角周波数を行番号とし離散化した時刻を列番号として前記原音スペクトログラムの要素の絶対値を値とする要素からなる原音行列を生成する行列生成部と、
    をさらに有することを特徴とする請求項1に記載の生体音信号処理装置。
  5. 前記非連続性音処理部は、前記低ランク行列の要素を振幅とし、前記原音スペクトログラムの偏角を偏角とする複素数からなる非連続性音スペクトログラムを生成する手段と、前記非連続性音スペクトログラムを短時間逆フーリエ変換して非連続性音信号を生成する手段と、前記非連続性音信号からフーリエ変換信号とウェーブレット信号とを抽出する信号抽出手段とを備えることを特徴とする請求項4に記載の生体音信号処理装置。
  6. 前記連続性音処理部は、前記スパース行列の要素を振幅とし、前記原音スペクトログラムの偏角を偏角とする複素数からなる連続性音スペクトログラムを生成する手段と、前記連続性音スペクトログラムを短時間逆フーリエ変換して連続性音信号を生成する手段を備えることを特徴とする請求項4または請求項5に記載の生体音処理装置。
  7. 前記生体音信号を短時間コサイン変換して前記原音行列を得るコサイン変換部と、
    前記非連続性音処理部は、前記低ランク行列から非連続性音スペクトログラムを生成する手段と、前記非連続性音スペクトログラムを短時間逆コサイン変換して非連続性音信号を生成する手段と、前記非連続性音信号からフーリエ変換信号とウェーブレット信号とを抽出する信号抽出手段とを備えることを特徴とする請求項1に記載の生体音信号処理装置。
  8. 前記生体音信号を短時間コサイン変換して前記原音行列を得るコサイン変換部と、
    前記連続性音処理部は、前記スパース行列から連続性音スペクトログラムを生成する手段と、前記連続性音スペクトログラムを短時間逆コサイン変換して連続性音信号を生成する手段を備えることを特徴とする請求項1または請求項7に記載の生体音処理装置。
  9. 前記非連続性音処理部は、前記低ランク行列を特異値行列とそれを挟む2つの直交行列との積となるように特異値分解し、前記2つの直交行列から特定の非連続性音の特徴に合致する部分を取り出すことにより前記特定の非連続性音を抽出することを特徴とする請求項1または請求項2、請求項4、請求項7に記載の生体音信号処理装置。
  10. 生体音の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析工程と、
    前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理部を得る第2工程と、
    前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る第3工程と、
    を有することを特徴とする生体音信号処理方法。
  11. コンピュータを、
    生体音の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析手段と、
    前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理手段と、
    前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る非連続性音処理手段と、
    として機能させるための生体音信号処理プログラム。
JP2015543900A 2013-10-23 2014-10-23 生体音信号処理装置、生体音信号処理方法および生体音信号処理プログラム Pending JPWO2015060375A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013220240 2013-10-23
JP2013220240 2013-10-23
PCT/JP2014/078182 WO2015060375A1 (ja) 2013-10-23 2014-10-23 生体音信号処理装置、生体音信号処理方法および生体音信号処理プログラム

Publications (1)

Publication Number Publication Date
JPWO2015060375A1 true JPWO2015060375A1 (ja) 2017-03-09

Family

ID=52992964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015543900A Pending JPWO2015060375A1 (ja) 2013-10-23 2014-10-23 生体音信号処理装置、生体音信号処理方法および生体音信号処理プログラム

Country Status (2)

Country Link
JP (1) JPWO2015060375A1 (ja)
WO (1) WO2015060375A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021159772A1 (zh) * 2020-02-10 2021-08-19 腾讯科技(深圳)有限公司 语音增强方法及装置、电子设备和计算机可读存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017204226A1 (ja) * 2016-05-23 2017-11-30 国立大学法人京都大学 目的音響信号復元システム及び方法
CN107704885A (zh) * 2017-10-17 2018-02-16 四川长虹电器股份有限公司 在智能平台上实现心音与肺音分类的方法
US11036981B1 (en) 2020-02-26 2021-06-15 Sas Institute Inc. Data monitoring system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4310137B2 (ja) * 2003-06-02 2009-08-05 コニカミノルタエムジー株式会社 生体音検出データ処理装置、生体音検出データ処理方法及び生体音検出データ処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021159772A1 (zh) * 2020-02-10 2021-08-19 腾讯科技(深圳)有限公司 语音增强方法及装置、电子设备和计算机可读存储介质

Also Published As

Publication number Publication date
WO2015060375A1 (ja) 2015-04-30

Similar Documents

Publication Publication Date Title
US11238881B2 (en) Weight matrix initialization method to improve signal decomposition
Babadi et al. A review of multitaper spectral analysis
Li et al. Efficient source separation algorithms for acoustic fall detection using a microsoft kinect
Jin et al. Adventitious sounds identification and extraction using temporal–spectral dominance-based features
WO2015060375A1 (ja) 生体音信号処理装置、生体音信号処理方法および生体音信号処理プログラム
Millioz et al. Circularity of the STFT and spectral kurtosis for time-frequency segmentation in Gaussian environment
JP2013507174A5 (ja)
Guo et al. Edge effect elimination in single-mixture blind source separation
Tsai et al. Blind monaural source separation on heart and lung sounds based on periodic-coded deep autoencoder
JP6371516B2 (ja) 音響信号処理装置および方法
Guo et al. Single-mixture source separation using dimensionality reduction of ensemble empirical mode decomposition and independent component analysis
Mondal et al. A noise reduction technique based on nonlinear kernel function for heart sound analysis
Tong et al. Ridge-aware weighted sparse time-frequency representation
Cong et al. Validating rationale of group-level component analysis based on estimating number of sources in EEG through model order selection
Dey et al. Single channel blind source separation based on variational mode decomposition and PCA
Niegowski et al. Wavelet-based unsupervised learning method for electrocardiogram suppression in surface electromyograms
Liu et al. Lung sound classification based on Hilbert-Huang transform features and multilayer perceptron network
Looney et al. Subspace denoising of EEG artefacts via multivariate EMD
JP6036178B2 (ja) 呼吸音分析装置、呼吸音分析方法および呼吸音分析プログラム
Hedayioglu et al. Separating sources from sequentially acquired mixtures of heart signals
Shah et al. Separation of cardiorespiratory sounds using time-frequency masking and sparsity
Xie et al. A hybrid symplectic principal component analysis and central tendency measure method for detection of determinism in noisy time series with application to mechanomyography
Dubey et al. Does phase matter for monaural source separation?
Mordoh et al. Audio source separation to reduce sleeping partner sounds: a simulation study
KR101552660B1 (ko) 음성구간 검출 장치 및 방법