JPWO2015060375A1

JPWO2015060375A1 - 生体音信号処理装置、生体音信号処理方法および生体音信号処理プログラム

Info

Publication number: JPWO2015060375A1
Application number: JP2015543900A
Authority: JP
Inventors: 智弥酒井; 千弥善安; 末治宮原
Original assignee: Nagasaki University
Current assignee: Nagasaki University
Priority date: 2013-10-23
Filing date: 2014-10-23
Publication date: 2017-03-09
Also published as: WO2015060375A1

Abstract

【課題】人間などの肺音から連続性ラ音および断続性ラ音をより正確に分別できるようにする。【解決手段】生体音検出信号処理装置（９０）は、ロバスト主成分分析部（４０）と、連続性音処理部（２０）と、非連続性音処理部（３０）とを有している。ロバスト主成分分析部（４０）は、生体音の原音を入力部（１２）で受信しフーリエ変換部（１４）でフーリエ変換して行列生成部（１６）で生成した原音行列をロバスト主成分分析する。ロバスト主成分分析で得られたスパース行列を連続性音処理部（２０）で処理すると原音から連続性の生体音が得られる。ロバスト主成分分析で得られた低ランク行列を非連続性音処理部（３０）で処理すると原音から連続性の生体音を除外した生体音が得られる。

Description

本発明は、肺音などの生体音を処理する生体音信号処理装置、生体音信号処理方法および生体音信号処理プログラムに関する。

近年、電子聴診器などにより取得される肺音の信号（肺音信号）などをデジタルデータに変換してデータ解析し、その解析結果を診断（音診断）に活用するための診断支援装置の開発が進められている。

肺音は、呼吸音と異常音としての副雑音に大別される。副雑音はさらに、ラ音とその他に分けられ、ラ音はさらに断続性ラ音と連続性ラ音に分けられる。断続性ラ音には水泡音と捻髪音が含まれ、連続性ラ音には笛音といびき音が含まれる。

肺音を高速フーリエ変換およびその逆変換を用いて正常呼吸音と連続性ラ音に分別する方法が知られている（たとえば特許文献１参照）。この方法では、まず、肺音の時間波形を高速フーリエ変換（ＦＦＴ）して振幅スペクトルおよびパワースペクトルを算出する。次に、このパワースペクトルの局所分散値が閾値を越えた点における振幅スペクトルを逆ＦＦＴ処理する。このようにして、正常呼吸音と連続性ラ音が分別できる。

また、肺音から呼吸音と断続性ラ音を分別する技術が知られている（たとえば非特許文献１参照）。この技術では、肺音信号をフーリエ変換信号とウェーブレット信号との和で最も簡潔に肺音を構成するスパース（ｓｐａｒｓｅ）表現に基づき肺音を分離するものである。このスパース表現ｆ（ｔ）が呼吸音、ｗ（ｔ）が断続性ラ音として分別される。

特開２００４−３５７７５８号公報

酒井智弥、里元はるか、喜安千弥、宮原末治、「スパース表現による異常肺音の抽出」、電子情報通信学会技術報告ＳＩＰ２０１１−２３、ページ１３１−１３６、２０１１年５月石原恒夫監修、川城丈夫、菊池功次、阿部直、米丸亮著、「ＣＤによる聴診トレーニング呼吸音編」、南江堂、１９９３年 E. J. Candes, X. Li, Y. Ma, and J. Wright、"Robustprincipal component analysis?"、Journal of the ACM、vol. 58、no. 3、p.11:1-11:37、２０１１年 Z. Lin, M. Chen, L. Wu, and Y. Ma、"Theaugmented Lagrange multiplier method for exact recovery of corrupted low-rankmatrices"、LILU-ENG-09-2215、UIUC、２００９年

肺音を高速フーリエ変換およびその逆変換を用いて正常呼吸音と連続性ラ音に分別する方法は、周波数帯を適応的に選択したフィルタリングの一種である。このため、両者が同じ周波数成分を共有しているときには分別することができない。また、ここで正常呼吸音としている信号には、異常音である断続性ラ音が含まれている可能性がある。

また、肺音信号をフーリエ変換信号とウェーブレット信号との和で最も簡潔に肺音を構成するスパース表現に基づき肺音を分離する手法では、元々の肺音信号に連続性ラ音が含まれている場合には、連続性ラ音がｆ（ｔ）とｗ（ｔ）のどちらか一方に分別されるとは限らない。このため、連続性ラ音の解析処理には対応できない。

このように従来技術では、多様な異常音を含む肺音信号を正確に分別することができない。

そこで、本発明は、人間などの肺音から連続性ラ音および断続性ラ音をより正確に分別できるようにすることを目的とする。

上述の目的を達成するため、本発明は、生体音信号処理装置において、生体音信号の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析部と、前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理部と、前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る非連続性音処理部と、を有することを特徴とする。

また、本発明は、生体音信号処理方法において、生体音の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析工程と、前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理部を得る第２工程と、前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る第３工程と、を有することを特徴とする。

また、本発明は、生体音信号処理プログラムにおいて、コンピュータを、生体音の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析手段と、前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理手段と、前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る非連続性音処理手段として機能させることを特徴とする。

本発明によれば、人間などの連続性ラ音および断続性ラ音をより正確に分別できる。

本発明に係る生体音信号処理装置の第１の実施の形態のブロック図である。本発明に係る生体音信号処理装置の第１の実施の形態における生体音信号処理方法のフローチャートである。本発明に係る生体音信号処理装置の第１の実施の形態において処理を施す原音のグラフである。本発明に係る生体音信号処理装置の第１の実施の形態において原音信号を短時間フーリエ変換して得られた原音スペクトログラムの値を要素に持つ行列の要素の値を濃淡で表した図である。本発明に係る生体音信号処理装置の第１の実施の形態においてロバスト主成分分析で得た低ランク行列の要素の値を濃淡で表した図である。本発明に係る生体音信号処理装置の第１の実施の形態においてロバスト主成分分析で得たスパース行列の要素の値を濃淡で表した図である。本発明に係る生体音信号処理装置の第１の実施の形態においてスパース行列を逆フーリエ変換して得られた肺音信号のグラフである。本発明に係る生体音信号処理装置の第１の実施の形態において低ランク行列を逆フーリエ変換して得られた肺音信号のグラフである。本発明に係る生体音信号処理装置の第１の実施の形態において低ランク行列を逆フーリエ変換して得られた肺音信号から抽出したフーリエ成分のグラフである。本発明に係る生体音信号処理装置の第１の実施の形態において低ランク行列を逆フーリエ変換して得られた肺音信号から抽出したウェーブレット成分のグラフである。本発明に係る生体音信号処理装置の第２の実施の形態のブロック図である。本発明に係る生体音信号処理装置の第２の実施の形態生体音信号処理方法のフローチャートである。本発明に係る生体音信号処理装置の第３の実施の形態のブロック図である。本発明に係る生体音信号処理装置の第３の実施の形態の生体音信号処理方法のフローチャートである。

本発明に係る生体音信号処理装置のいくつかの実施の形態を、図面を参照して説明する。なお、この実施の形態は単なる例示であり、本発明はこれに限定されない。同一または類似の構成には同一の符号を付し、重複する説明は省略する。

［第１の実施の形態］
図１は、本発明に係る生体音信号処理装置の第１の実施の形態のブロック図である。

生体音信号処理装置９０は、予備処理部１０とロバスト主成分分析部４０とスパース行列格納部２２と低ランク行列格納部３２と連続性音処理部２０と非連続性音処理部３０とを有している。生体音信号処理装置９０は、たとえば１台のコンピュータ上に構築される。生体音信号処理装置９０は、ネットワークで結合された複数台のコンピュータ上に構築されていてもよい。

予備処理部１０は、入力部１２とフーリエ変換部１４と行列生成部１６とを有している。連続性音処理部２０は、連続性音スペクトログラム生成部２４と第１逆フーリエ変換部２６とを有している。非連続性音処理部３０は、非連続性音スペクトログラム生成部３４と第２逆フーリエ変換部３６と信号抽出部３８とを有している。

予備処理部１０は、生体音の原音スペクトログラムを表現した原音行列を生成する。生体音は、図示しない電子聴診器のような生体音検出装置で検出し、電気信号として生体音信号処理装置９０に与えられる。

ロバスト主成分分析部４０は、予備処理部１０が生成した原音行列をロバスト主成分分析し、スパース行列と低ランク行列を得る。スパース行列は、スパース行列格納部２２に格納される。低ランク行列は、低ランク行列格納部３２に格納される。

連続性音処理部２０は、スパース行列格納部２２に格納されたスパース行列を処理して、原音中の連続性音を生成する。非連続性音処理部３０は、低ランク行列格納部３２に格納された低ランク行列を処理して、原音中の非連続性音を生成する。

連続性音処理部２０および非連続性音処理部３０が生成した連続性音および非連続性音は、たとえばＤ／Ａ変換を施されて図示しないスピーカなどによって出力される。連続性音および非連続性音の波形をディスプレイに表示してもよい。あるいは、連続性音および非連続性音の信号を外部の装置に送信し、その外部装置で異常検知などを行ってもよい。

次に、この生体音信号処理装置９０を用いた生体音信号処理方法を説明する。

図２は、本実施の形態における生体音信号処理方法のフローチャートである。

まず、入力部１２が図示しない電子聴診器のような生体音検出装置からの生体音を検出した信号を取りこむ。検出された生体音を原音と呼ぶこととする。原音をたとえば電気的に表現した信号を原音信号ｓ（ｔ）と呼ぶこととする。生体音とは、たとえば人間の肺音である。入力部１２は、原音信号がアナログ信号の場合は、Ａ／Ｄ変換して原音信号をデジタルデータに変換する。

図３は、本実施の形態において処理を施す肺音信号のグラフである。図３において、横軸は経過時間（秒）、縦軸は信号強度（振幅）を示す。

本実施の形態では、非特許文献２の付録のＣＤの第６０トラックに記録された肺音を原音として処理を行う。

次に、フーリエ変換部１４が原音信号ｓ（ｔ）を短時間フーリエ変換し、時間周波数領域の複素量で表される複素サウンドスペクトログラム（以下、スペクトログラムと称する。）を得る（ステップ１）。

より具体的には、原音信号ｓ（ｔ）に時間窓関数をずらしながら掛けたものを離散フーリエ変換して、原音スペクトログラムＳ（ω，ｔ）を得る。原音スペクトログラムＳ（ω，ｔ）は、複素数の値を持ち、時間窓関数の位置を表す時刻ｔにおいて信号を構成している角周波数ωの成分の振幅と位相を表す。

時刻ｔは、時間窓関数をずらす時間幅Δｔ２で離散値をとる。この時間窓関数をずらす時間幅Δｔ２は、時間窓幅Δｔ１を超えないものとする。すなわち、Δｔ２＜Δｔ１である。また、角周波数ωは時間窓幅Δｔ１の逆数に比例する間隔で離散化されている。

その後、行列生成部１６が原音スペクトログラムＳ（ω，ｔ）の振幅｜Ｓ（ω，ｔ）｜を要素に持つ原音行列Ｄを作成する（ステップ２）。原音行列Ｄの行番号ｉと列番号ｊは、ｉ番目の角周波数ω_ｉ、ｊ番目の時刻ｔ_ｊに対応するものとする。行列Ｄの第ｉ行ｊ列の要素Ｄｉｊは、原音スペクトログラムＳ（ω，ｔ）を構成する複素数Ｓ（ω_ｉ，ｔ_ｊ）の絶対値とする。

図４は、本実施の形態において原音信号を短時間フーリエ変換して得られた原音スペクトログラムの値を要素に持つ原音行列の要素の値を濃淡で表した図である。

ステップ３では、ロバスト主成分分析部４０が原音行列Ｄを低ランク行列Ａとスパース行列Ｅの和の形になるように分解する。ここでは、非特許文献３に倣って、このような行列の分解をロバスト主成分分析と呼ぶ。ある行列を低ランク行列とスパース行列の和の形になるように分解する算法としては、たとえば非特許文献４に、拡張ラグランジュ法を改良した収束の早い算法が提案されている。

通常の主成分分析では、与えられた行列を低ランク行列で近似する。その低ランク行列は、与えられた行列の主要な固有値（または特異値）のみに付随する固有ベクトルの積によって構成される。

一方、本実施の形態で用いるロバスト主成分分析では、与えられた原音行列Ｄを、その要素の一部にのみ修正を許しながら低ランク行列Ａで近似する。原音行列Ｄは低ランク行列Ａと修正量を表すスパース行列Ｅの和に分解される。その際、行列Ａのランク（階数）と、修正する要素の数（行列Ｅの非ゼロ要素の数）は、可能な限り共に小さいものとする。この場合の解の一意性は非特許文献３に開示されている。

図５は、本実施の形態においてロバスト主成分分析で得た低ランク行列の要素の値を濃淡で表した図である。図６は、本実施の形態においてロバスト主成分分析で得たスパース行列の要素の値を濃淡で表した図である。

低ランク行列Ａは、主要な固有ベクトルの積によって構成し易い行列Ｄの成分を要素に持つ。ゆえに、低ランク行列Ａの行または列が呈する図５の模様は、原音行列の要素の値を濃淡で表した図４に見られる縦縞・横縞模様のように、類似の模様が複数現れる傾向がある。

一方、そのような低ランク行列Ａによって原音行列Ｄを近似するために除外された成分をスパース行列Ｅは要素として持つ。ゆえに、図６に示されるように、スパース行列Ｅは、縦縞・横縞などの規則性を持たない、任意の曲線状または斑点状の模様を呈する。

ステップ４では、ステップ３で得られたスパース行列Ｅに対応する連続性音スペクトログラムＥ（ω，ｔ）を生成する。連続性音スペクトログラムＥ（ω，ｔ）は、連続性音スペクトログラム生成部２４がスパース行列格納部２２からスパース行列Ｅを読み込んで生成する。連続性音スペクトログラムＥ（ω，ｔ）を構成する複素数Ｅ（ω_ｉ，ｔ_ｊ）は、前記スパース行列の要素を振幅とし、前記原音スペクトログラの偏角を偏角とする複素数とする。すなわち複素数Ｅ（ω_ｉ，ｔ_ｊ）は、行列Ｅの第ｉ行ｊ列の要素Ｅ_ｉｊと原音スペクトログラムＳ（ω，ｔ）を構成する複素数Ｓ（ω_ｉ，ｔ_ｊ）の偏角θ_ｉｊから次式によって得られる。

Ｅ（ω_ｉ，ｔ_ｊ）＝Ｅ_ｉｊ（cos(θ_ｉｊ)＋ｉsin(θ_ｉｊ)）

ステップ５では、第１逆フーリエ変換部２６が連続性音スペクトログラムＥ（ω，ｔ）を短時間逆フーリエ変換し、肺音信号ｅ（ｔ）を得る。より具体的には、連続性音スペクトログラムＥ（ω，ｔ）の各時刻ｔ_ｊ毎に複素スペクトルＥ（ω，ｔ_ｊ）を短時間逆フーリエ変換し、各時刻ｔ_ｊにおける時間窓関数内の肺音信号を得る。時間窓関数の重なりに応じて肺音信号を平均化することで肺音信号ｅ（ｔ）を得る。

図７は、本実施の形態においてスパース行列を逆フーリエ変換して得られた肺音信号のｅ（ｔ）グラフである。

図７は、デジタルデータとして第１逆フーリエ変換部２６が出力した肺音信号ｅ（ｔ）をアナログ信号のように模擬して表示したものである。肺音信号ｅ（ｔ）を図示しない生体音出力部でＤ／Ａ変換し、図示しないスピーカなどによって肺音として再現すると、連続性ラ音となる。

本実施の形態において、処理の入力として使用した原音信号ｓ（ｔ）は、非特許文献２に付録のＣＤの第６０トラックから採用した連続性ラ音（高音性の笛音）を含む肺音である。この連続性ラ音は、原音信号ｓ（ｔ）のスペクトログラムを表す図４において曲線状の模様を呈しており、図６に示したスパース行列Ｅが表すスペクトログラムへ明確に分離されている。このことから、上記のステップ１からステップ５の処理により、連続性ラ音がステップ５の肺音信号ｅ（ｔ）として良好に分離されていることが分かる。

この例で使用した連続性ラ音は、高音性の笛音であるが、低音性のいびき音についても分離することが可能である。本実施例と同様に、連続性ラ音以外の音（呼吸音や断続性ラ音）のスペクトログラムが低ランク行列Ａによって表され易ければ、ステップ３のロバスト主成分分析において、低ランク行列Ａで行列Ｄを近似するために除外された成分（スパース行列Ｅ）として連続性ラ音のスペクトログラムが分離される。

ステップ６では、ステップ３にて分離した低ランク行列Ａに対応する非連続性音スペクトログラムＡ（ω，ｔ）を非連続性音スペクトログラム生成部３４が生成する。生成の方法はステップ４と同様である。すなわち、非連続性音スペクトログラムＡ（ω，ｔ）を構成する複素数Ａ（ω_ｉ，ｔ_ｊ）は、前記低ランク行列の要素を振幅とし、前記原音スペクトログラの偏角を偏角とする複素数とし、行列Ａの第ｉ行ｊ列の要素Ａ_ｉｊと原音スペクトログラムＳ（ω，ｔ）を構成する複素数Ｓ（ω_ｉ，ｔ_ｊ）の偏角θ_ｉｊから次式によって得られる。

Ａ（ω_ｉ，ｔ_ｊ）＝Ａ_ｉｊ（cos(θ_ｉｊ)＋ｉsin(θ_ｉｊ)）

ステップ７では、第２逆フーリエ変換部３６が非連続性音スペクトログラムＡ（ω，ｔ）を短時間逆フーリエ変換し、肺音信号ａ（ｔ）を得る。この方法は、ステップ５と同様である。すなわち、非連続性音スペクトログラムＡ（ω，ｔ）の各時刻ｔ_ｊ毎に複素スペクトルＡ（ω，ｔ_ｊ）を短時間逆フーリエ変換し、各時刻ｔ_ｊにおける時間窓関数内の肺音信号を得る。窓関数の重なりに応じて肺音信号を平均化することで肺音信号ａ（ｔ）を得る。

図８は、本実施の形態において低ランク行列Ａを逆フーリエ変換して得られた肺音信号ａ（ｔ）のグラフである。

図８は、デジタルデータとして第２逆フーリエ変換部３６が出力した肺音信号をアナログ信号のように模擬して表示したものである。肺音信号ａ（ｔ）を図示しない生体音出力部でＤ／Ａ変換し、図示しないスピーカなどによって肺音として再現すると、原音信号ｓ（ｔ）から連続性音を除去した音となる。

ステップ８では、更に非特許文献１の手法で、信号抽出部３８が肺音信号ｅ（ｔ）から肺音信号ｆ（ｔ）と肺音信号ｗ（ｔ）を抽出する。非特許文献１の手法は、スパース表現に基づき肺音を抽出するものである。ここでは、肺音信号ａ（ｔ）を、フーリエ合成信号（ｆ（ｔ））とウェーブレット合成信号（ｗ（ｔ））との和で表現する。その際、非ゼロのフーリエ成分の数と非ゼロのウェーブレット成分の数は、可能な限り共に小さいものとする。このための算法としては、たとえば非特許文献１に開示されている。

図９は、本実施の形態において肺音信号ｅ（ｔ）から抽出したフーリエ成分である肺音信号ｆ（ｔ）のグラフである。

図９は、デジタルデータとして信号抽出部３８が出力した肺音信号ｆ（ｔ）をアナログ信号のように模擬して表示したものである。肺音信号ｆ（ｔ）を図示しない生体音出力部でＤ／Ａ変換し、図示しないスピーカなどによって肺音として再現すると、原音信号ｓ（ｔ）中の呼吸音が出力される。

図１０は、本実施の形態において肺音信号ｅ（ｔ）から抽出したウェーブレット成分である肺音信号ｗ（ｔ）のグラフである。

図１０は、デジタルデータとして信号抽出部３８が出力した肺音信号ｗ（ｔ）をアナログ信号のように模擬して表示したものである。肺音信号ｗ（ｔ）を図示しない生体音出力部でＤ／Ａ変換し、図示しないスピーカなどによって肺音として再現すると、原音信号ｓ（ｔ）中の断続性ラ音が出力される。

本実施の形態において、原音信号ｓ（ｔ）は、非特許文献２付録のＣＤに第６０トラックから採用した連続性ラ音データ（高音性の笛音）である。しかし、図３に示した原音信号ｓ（ｔ）の波形から、連続性ラ音以外にも、断続性の音が混入していることを確認できる。また、図４に示した原音信号ｓ（ｔ）を表すスペクトログラムから、曲線状の模様を呈する連続性ラ音以外にも、縦縞模様を呈する断続性の音（断続性ラ音）や、低周波帯に継続する音（呼吸音）の存在を確認できる。連続性ラ音以外のこれらの音は、図５に示した低ランク行列Ａが表すスペクトログラムへ明確に分離されている。このことから、上記のステップ１からステップ３およびステップ６からステップ８の処理により、呼吸音と断続性ラ音が良好に抽出されていることが分かる。

このように、本実施の形態によれば、人間などの肺音から呼吸音、連続性ラ音、断続性ラ音をより正確に分別できる。

本実施の形態では、人間の肺音から呼吸音、連続性ラ音、断続性ラ音を分離・抽出したが、人間以外の動物であっても、その動物が発する生体音に呼吸音、連続性ラ音および断続性ラ音に類する音が含まれる場合には、本実施の形態と同様にそれらの音を分離・抽出することができる。

［第２の実施の形態］
図１１は、本発明に係る生体音信号処理装置の第２の実施の形態のブロック図である。図１２は、本実施の形態における生体音信号処理方法のフローチャートである。

本実施の形態は、第１の実施の形態と、プロセスの全体として複素行列を用いる点が異なる。このため、第１の実施の形態における行列生成部１６は、本実施の形態の生体音信号処理装置には存在しない。

本実施の形態では、第１の実施の形態におけるステップ２を省略し、ステップ３においてロバスト主成分分析部４０は原音スペクトログラムＳ（ω，ｔ）を直接ロバスト主成分分析して低ランク行列Ａとスパース行列Ｅを得る。分離した肺音信号を得るステップ５と７、およびステップ８以降は、第１の実施の形態と同じである。

第１の実施の形態における複素行列を実数行列に変換し、ロバスト主成分分析の後に、複素行列に再度変換するというステップを、本実施の形態では削除している。振幅と位相を表す複素数の行列を分離するので、振幅のみを分離する実施形態１よりも分離の性能向上を期待できる。なお、ロバスト主成分分析の対象の行列が複素行列であるため、計算時間が第１の実施の形態よりも若干長くなるものの、適切な解法を用いれば、十分、実用に耐える。

［第３の実施の形態］
図１３は、本発明に係る生体音信号処理装置の第３の実施の形態のブロック図である。図１４は、本実施の形態における生体音信号処理方法のフローチャートである。

本実施の形態は、第１の実施の形態と、短時間フーリエ変換および短時間逆フーリエ変換の代わりに、短時間コサイン変換および短時間逆コサイン変換を用いる点が異なる。本実施の形態の生体音信号処理装置では、第１の実施の形態における短時間フーリエ変換部１４の代わりに、短時間コサイン変換部４１が設けられている。

本実施の形態は、第１の実施の形態と、プロセスの全体として実数行列を用いる点が異なる。このため、第１の実施の形態における行列生成部１６は、本実施の形態の生体音信号処理装置には存在しない。

本実施の形態では、第１の実施の形態におけるステップ２を省略し、ステップ３においてロバスト主成分分析部５０は短時間コサイン変換部で得た実数の原音スペクトログラムＳ（ω，ｔ）を直接ロバスト主成分分析して低ランク行列Ａとスパース行列Ｅを得る。また、本実施の形態の生体音信号処理装置では、第１の実施の形態における第１短時間逆フーリエ変換部２６の代わりに、短時間逆コサイン変換部５２が設けられている。本実施の形態の生体音信号処理装置では、第１の実施の形態における第２短時間逆フーリエ変換部３６の代わりに、短時間逆コサイン変換部５３が設けられている。

コサイン変換は実信号のフーリエ変換に対して半分の記憶領域で処理できる利点がある。ただし、信号が偶関数であることを仮定した処理なので、他の実施形態より分離の性能がやや劣る可能性がある。

第１，第２，第３のいずれの実施の形態においても、低ランク行列Ａからは、特異値分解によって
Ａ＝ＵＫＶ^Ｔ
となる行列Ｕ、行列Ｋ、行列Ｖが求められる。低ランク行列Ａのサイズがｍ×ｎ、ランク（階数）がｒであるとすると、行列Ｋは、特異値を対角にもつ対角のｒ次正方行列であり、行列ＵおよびＶはそれぞれｒ本の左特異ベクトルと右特異ベクトルからなるｍ×ｒ行列、ｎ×ｒ行列である。なお、Ｖ^Ｔは、行列Ｖが実行列の場合はＶの転置行列であり、行列Ｖが複素行列の場合はＶの共役転置行列である。

左特異ベクトルは、行列Ａの列ベクトルを合成できる基底である。低ランク行列Ａの列ベクトルは、連続性の生体音以外の音、特に呼吸音と断続音の瞬時周波数スペクトルを表している。ゆえに、左特異ベクトルは、これらの音の瞬時周波数スペクトルを構成するための基底である。また、右特異ベクトルは、任意の時刻における瞬時周波数スペクトルの内訳を示している。すなわち、ｊ番目の右特異ベクトルの成分は、ｊ番目の左特異ベクトルの基底がそれぞれどの時刻でどの程度現れるかを表している。

したがって、低ランク行列Ａの特異値分解によって、瞬時周波数スペクトルの基底からなる行列Ｕ、その内訳を表すＶが得られる。同じ種類の音は類似した瞬時周波数スペクトルの内訳を持つことから、左右特異ベクトルを利用して同種の呼吸音や断続音を判別する分類に応用できる。

なお、特異値分解は、行列を構成する行ベクトルの集合および列ベクトルの集合について、主成分を求める行列分解の一手法である。特異値分解によって、主成分の大きさを表す特異値および主成分の向きを表す正規直交基底が得られる。ただし、ゼロの特異値に付随する特異ベクトルは、一意に定まらない。また、対応する左右の特異ベクトルは、符号または大きさ１の複素数倍の任意性がある。しかし、本実施の形態で得られる低ランク行列Ａは、非ゼロの特異値と、それらに付随する左右特異ベクトルによって構成されているため、一意に定まる。

１０…予備処理部、１２…入力部、１４…フーリエ変換部、１６…行列生成部、２０…連続性音処理部、２２…スパース行列格納部、２４…連続性音スペクトログラム生成部、２６…第１逆フーリエ変換部、３０…非連続性音処理部、３２…低ランク行列格納部、３４…非連続性音スペクトログラム生成部、３６…第２逆フーリエ変換部、３８…信号抽出部、４０…ロバスト主成分分析部、４１…コサイン変換部、５０…ロバスト主成分分析部、５２…逆コサイン変換部、５３…逆コサイン変換部、９０…生体音信号処理装置

Claims

生体音信号の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析部と、
前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理部と、
前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る非連続性音処理部と、
を有することを特徴とする生体音信号処理装置。
前記生体音信号を短時間フーリエ変換して前記原音行列を得るフーリエ変換部と、
前記非連続性音処理部は、前記低ランク行列から非連続性音スペクトログラムを生成する手段と、前記非連続性音スペクトログラムを短時間逆フーリエ変換して非連続性音信号を生成する手段と、前記非連続性音信号からフーリエ変換信号とウェーブレット信号とを抽出する信号抽出手段とを備えることを特徴とする請求項１に記載の生体音信号処理装置。
前記生体音信号を短時間フーリエ変換して前記原音行列を得るフーリエ変換部と、
前記連続性音処理部は、前記スパース行列から連続性音スペクトログラムを生成する手段と、前記連続性音スペクトログラムを短時間逆フーリエ変換して連続性音信号を生成する手段を備えることを特徴とする請求項１または請求項２に記載の生体音処理装置。
前記生体音信号を短時間フーリエ変換して前記原音スペクトログラムを得るフーリエ変換部と、
離散化した角周波数を行番号とし離散化した時刻を列番号として前記原音スペクトログラムの要素の絶対値を値とする要素からなる原音行列を生成する行列生成部と、
をさらに有することを特徴とする請求項１に記載の生体音信号処理装置。
前記非連続性音処理部は、前記低ランク行列の要素を振幅とし、前記原音スペクトログラムの偏角を偏角とする複素数からなる非連続性音スペクトログラムを生成する手段と、前記非連続性音スペクトログラムを短時間逆フーリエ変換して非連続性音信号を生成する手段と、前記非連続性音信号からフーリエ変換信号とウェーブレット信号とを抽出する信号抽出手段とを備えることを特徴とする請求項４に記載の生体音信号処理装置。
前記連続性音処理部は、前記スパース行列の要素を振幅とし、前記原音スペクトログラムの偏角を偏角とする複素数からなる連続性音スペクトログラムを生成する手段と、前記連続性音スペクトログラムを短時間逆フーリエ変換して連続性音信号を生成する手段を備えることを特徴とする請求項４または請求項５に記載の生体音処理装置。
前記生体音信号を短時間コサイン変換して前記原音行列を得るコサイン変換部と、
前記非連続性音処理部は、前記低ランク行列から非連続性音スペクトログラムを生成する手段と、前記非連続性音スペクトログラムを短時間逆コサイン変換して非連続性音信号を生成する手段と、前記非連続性音信号からフーリエ変換信号とウェーブレット信号とを抽出する信号抽出手段とを備えることを特徴とする請求項１に記載の生体音信号処理装置。
前記生体音信号を短時間コサイン変換して前記原音行列を得るコサイン変換部と、
前記連続性音処理部は、前記スパース行列から連続性音スペクトログラムを生成する手段と、前記連続性音スペクトログラムを短時間逆コサイン変換して連続性音信号を生成する手段を備えることを特徴とする請求項１または請求項７に記載の生体音処理装置。
前記非連続性音処理部は、前記低ランク行列を特異値行列とそれを挟む２つの直交行列との積となるように特異値分解し、前記２つの直交行列から特定の非連続性音の特徴に合致する部分を取り出すことにより前記特定の非連続性音を抽出することを特徴とする請求項１または請求項２、請求項４、請求項７に記載の生体音信号処理装置。
生体音の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析工程と、
前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理部を得る第２工程と、
前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る第３工程と、
を有することを特徴とする生体音信号処理方法。
コンピュータを、
生体音の原音スペクトログラムを表現した原音行列をロバスト主成分分析でスパース行列と低ランク行列に分解するロバスト主成分分析手段と、
前記スパース行列を変換して前記生体音信号から連続性の生体音を得る連続性音処理手段と、
前記低ランク行列を変換して前記生体音信号から連続性の生体音を除外した生体音を得る非連続性音処理手段と、
として機能させるための生体音信号処理プログラム。