JP5190859B2 - 音源分離装置、音源分離方法、音源分離プログラム及び記録媒体 - Google Patents

音源分離装置、音源分離方法、音源分離プログラム及び記録媒体 Download PDF

Info

Publication number
JP5190859B2
JP5190859B2 JP2006311718A JP2006311718A JP5190859B2 JP 5190859 B2 JP5190859 B2 JP 5190859B2 JP 2006311718 A JP2006311718 A JP 2006311718A JP 2006311718 A JP2006311718 A JP 2006311718A JP 5190859 B2 JP5190859 B2 JP 5190859B2
Authority
JP
Japan
Prior art keywords
sound
directional
source separation
sound source
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006311718A
Other languages
English (en)
Other versions
JP2008131183A (ja
Inventor
哲則 小林
健三 赤桐
晋太郎 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Waseda University
Original Assignee
Waseda University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Waseda University filed Critical Waseda University
Priority to JP2006311718A priority Critical patent/JP5190859B2/ja
Publication of JP2008131183A publication Critical patent/JP2008131183A/ja
Application granted granted Critical
Publication of JP5190859B2 publication Critical patent/JP5190859B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は音源分離装置、音源分離方法、音源分離プログラム及び記録媒体に関し、例えば携帯電話機等の携帯通信端末や、カーナビゲーションシステムのような音声操作を行える車載機器等において種々の雑音を除去してユーザの音声のみをマイクロフォンで受音する必要がある場合に適用して好適なものである。
携帯電話を用いて画像情報を取り扱う機会が増えるにつれ、携帯電話を口元にあてる使い方よりも、口元から離して画像を見ながら会話したり音声認識を行う使い方が、使い勝手の上から望まれると考えられる。しかし、このためには、より高い対環境雑音性能が要求される。またロボットとの対話や、カーナビゲーションシステム等の車載機器についての音声による操作、会議の議事録作成等、接話型マイクロフォンの利用をユーザに課すことが不自然となる用途も多い。このような用途においては、システム側に設置したマイクロフォンによりユーザの音声を収音し、認識処理することが望まれる。
しかしながら、発話者(ユーザ)から離れたところに設置したマイクロフォンで収音し、音声認識を行う場合には、雑音音源からの妨害音が周壁等ではね返えることによりあらゆる方向に拡散して周囲一様から到来する雑音(以下、これを拡散性雑音と呼ぶ)によってS/N比(信号対雑音比)が悪化し、その結果、マイクロフォンでユーザの音声のみを収音し難くなり、音声認識の精度が極度に劣化してしまうという問題があった。
このような問題点を解決するために、ユーザの音声と拡散性雑音とを分離する技術として、2つの無指向性マイクロフォンからの受音信号を用いて二乗コヒーレンス(MSC:Magnitude Squared Coherence)関数を算出し、その算出結果であるMSC値に基づいて拡散性雑音を解析して目的音だけを抽出する音源分離装置が考えられている(例えば、非特許文献1参照)。
因みにこのMSC値は、低域から高域までの周波数帯域の間で「0」から「1」の範囲で変動し、「0」に近づくほどその周波数において信号が拡散性信号であり、「1」に近づくほど信号が指向性信号であることを表している。
そして、この音源分離装置では、MSC値に基づいたフィルタリングを行うことにより、マイクロフォンから出力された受音信号から拡散性雑音の混合分に相当する周波数成分を低減し、これにより拡散性雑音を除去した目的音を取得し得るようになされている。
Using the coherene function for noise reduction IEE Proceedings Vol.139 No3 June 1992 R.Le.Bouquin
しかしながら、かかる構成の音源分離装置では、MSC値が低域の周波数帯域において「1」に近づく値を示したままであることから、MSC値に基づいたフィルタリングを行っても、拡散性雑音の周波数帯域のうち低域成分について除去し難いという問題があった。
ここでMSC値を用いて拡散性雑音の周波数帯域のうち低域成分を除去するには、マイクロフォンの間隔を20cm以上離せば、低域成分において僅かにMSC値を下げることもできるが、この場合音源分離装置が大型化してしまい、携帯電話機等の小型通信端末に対して搭載し得ないという問題があった。
従って、携帯電話機等の小型通信端末においては、目的音の到来方向以外の任意方向から到来する指向性妨害音を除去しつつ、同時に拡散性雑音をも除去するような構成について未だ実現されていない。
本発明は以上の点を考慮してなされたもので、拡散性雑音の高域の周波数成分だけでなく、低域の周波数成分についても確実に除去し得るとともに、従来よりも一段と小型化を図ることができる音源分離装置、音源分離方法、音源分離プログラム及び記録媒体を提供することを目的とする。
本発明の請求項1記載の音源分離装置は、所定方向から到来する目的音と、前記所定方
向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する
音源分離装置において、間隔を置いて配置され、所定位置での目的音方向とヌル方向と
を異ならせ、前記目的音方向を軸として回転させたときに指向特性が同一である複数の指
向性マイクロフォンと、前記指向性マイクロフォンから出力された受音信号に基づいてク
ロスパワースペクトル強度値を算出する算出手段と、前記クロスパワースペクトル強度値
に基づいて前記受音信号の周波数成分の解析パラメータを算出して、前記解析パラメータ
により、前記拡散性雑音とその他の音を分離する分離手段とを備えた音源分離装置であって、
前記指向性マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号とを入力として、前記算出手段によってそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を使用し、
前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを前記分離手段の入力とすることを特徴とするものである。
本発明の請求項2記載の音源分離装置は、所定方向から到来する目的音と、前記所定方
向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する
音源分離装置において、間隔を置いて配置された、指向特性の最大感度方向に目的音を配
置し、かつ指向特性の最大感度軸が概略マイクロフォンを結ぶ軸と同一である複数の指向
性マイクロフォンと、前記指向性マイクロフォンから出力された受音信号に基づいてクロ
スパワースペクトル強度値を算出する算出手段と、前記クロスパワースペクトル強度値に
基づいて前記受音信号の周波数成分の解析パラメータを算出して、前記解析パラメータに
より、前記拡散性雑音とその他の音を分離する分離手段とを備えた音源分離装置であって、
前記指向性マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号とを入力として、前記算出手段によってそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を使用し、
前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを前記分離手段の入力とすることを特徴とするものである。
本発明の請求項3記載の音源分離装置は、前記解析パラメータが二乗コヒーレンス値であることを特徴とするものである。
本発明の請求項4記載の音源分離装置は、前記指向性マイクロフォンの指向特性が1次差分特性であることを特徴とするものである。
本発明の請求項5記載の音源分離装置は、前記指向性マイクロフォンの指向特性がカージオイド特性であることを特徴とするものである。
本発明の請求項6記載の音源分離装置は、前記指向性マイクロフォンの指向特性のヌル方向が目的音方向と直角をなすことを特徴とするものである。
本発明の請求項7記載の音源分離装置は、前記クロスパワースペクトル強度値を算出する前記指向性マイクロフォン対の指向特性が互いに逆方向であることを特徴とするものである。
本発明の請求項8記載の音源分離装置は、前記指向性マイクロフォンの配置位置が携帯機器の端面であることを特徴とするものである。
本発明の請求項9記載の音源分離装置は、前記指向性マイクロフォン配置が携帯機器の正面及び背面であることを特徴とするものである。
本発明の請求項10記載の音源分離装置は、前記複数の解析パラメータの補正操作値が
、前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と、前記無目的音状
態での受音信号から得られた二乗コヒーレンス値との差分値であることを特徴とするもの
である。
本発明の請求項11記載の音源分離装置は、前記複数の解析パラメータの補正操作値が
、前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態
での受音信号から得られた二乗コヒーレンス値の差分値と、最大値である1と前記無目的
音状態での受音信号から得られた二乗コヒーレンス値の差分値の比であることを特徴とす
るものである。
本発明の請求項12記載の音源分離装置は、前記分離手段は、前記受音信号の周波数成分に関する前記複数の指向性マイクロフォンの組み合わせから前記算出手段で算出された複数の解析パラメータと、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、最大値である1と前記無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値の比との中から少なくとも2個の前記解析パラメータもしくは該解析パラメータの補正操作値を選びだし、各周波数帯域毎の最小値及び線形結合値のうち少なくとも一方により前記拡散性雑音とその他の音を分離することを特徴とするものである。
本発明の請求項13記載の音源分離方法は、所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離方法において、間隔を置いて配置され、所定位置での目的音方向とヌル方向とを異ならせ、前記目的音方向を軸として回転させたときに指向特性が同一である複数の指向性マイクロフォンを用い、前記指向性マイクロフォンから出力された受音信号に基づいて、クロスパワースペクトル強度値を算出し、前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する音源分離方法であって、記マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号のそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて、前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを用いて前記拡散性雑音とその他の音を分離することを特徴とするものである。
本発明の請求項14記載の音源分離方法は、所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離方法において、間隔を置いて配置された、指向特性の最大感度方向に目的音を配置し、かつ指向特性の最大感度軸が概略マイクロフォンを結ぶ軸と同一である複数の指向性マイクロフォンを用い、記マイクロフォンから出力された受音信号に基づいて、クロスパワースペクトル強度値を算出し、前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する音源分離方法であって、前記指向性マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号のそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて、前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを用いて前記拡散性雑音とその他の音を分離することを特徴とする。
本発明の請求項15記載の音源分離方法は、前記解析パラメータが二乗コヒーレンス値であることを特徴とするものである。
本発明の請求項16記載の音源分離方法は、前記指向性マイクロフォンの指向特性が1次差分特性であることを特徴とするものである。
本発明の請求項17記載の音源分離方法は、前記指向性マイクロフォンの指向特性がカージオイド特性であることを特徴とするものである。
本発明の請求項18記載の音源分離方法は、前記指向性マイクロフォンの指向特性のヌル方向が前記目的音方向と直角をなすことを特徴とするものである。
本発明の請求項19記載の音源分離方法は、前記クロスパワースペクトル強度値を算出する前記指向性マイクロフォン対の指向特性が、互いに逆方向であることを特徴とするものである。
本発明の請求項20記載の音源分離方法は、前記指向性マイクロフォンの配置位置が携帯機器の端面であることを特徴とするものである。
本発明の請求項21記載の音源分離方法は、前記指向性マイクロフォンの配置が携帯機器表面及び背面であることを特徴とするものである。
本発明の請求項22記載の音源分離方法は、前記複数の解析パラメータの補正操作値が、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値であることを特徴とするものである。
本発明の請求項23記載の音源分離方法は、前記複数の解析パラメータの補正操作値が、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、最大値である1と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値の比であることを特徴とするものである。
本発明の請求項24記載の音源分離方法は、前記受音信号の周波数成分に関する複数のマイクロフォンの組み合わせから得られる複数の解析パラメータを算出して、前記複数の解析パラメータと、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、値1と前記無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値の比との中から、少なくとも2個の前記解析パラメータもしくは該解析パラメータの補正操作値を選びだし、各周波数帯域毎の最小値及び線形結合値のうち少なくとも一方により前記拡散性雑音とその他の音を分離することを特徴とするものである。
本発明の請求項25記載の音源分離プログラムは、請求項1324のうちいずれか1項記載の音源分離方法をコンピュータに実行させるためのものである
本発明の請求項26記載の記録媒体は、請求項1324のうちいずれか1項記載の音源分離方法をコンピュータに実行させるためのものである。
本発明の請求項1及び2記載の音源分離装置と、請求項13及び14記載の音源分離方法とによれば、指向性マイクロフォンから出力された受音信号を基に算出されたクロスパワースペクトル強度値を用いて解析パラメータを算出するようにしたことにより、低域の周波数帯域でも低くなった解析パラメータを得ることができ、この解析パラメータを用いて受音信号の周波数成分の解析を行なうことで、各指向性マイクロフォン間の間隔を所定以上の距離まで離さなくても拡散性雑音の低域の周波数成分も確実に除去できる。従って、低域の周波数成分についても確実に除去しつつ、従来よりも一段と小型化を図ることができると同時に目的音そのものは指向性特性のNULL方向にはないことによって、目的音のレベル低下による演算精度低下が起こらず、正確なMSCを求めることができる。
また本発明の請求項12記載の音源分離装置と、請求項23記載の音源分離方法によれば、複数の解析パラメータを基にして最小値もしくは線形結合による値を用いることによって、個々の解析パラメータを用いたときよりも、各周波数帯域毎に拡散性雑音の低減を最適に行うことができる。
また本発明の請求項24記載の音源分離方法によれば、拡散性雑音の低減に用いる受音信号を得るマイクロフォンの受音信号を用いて、指向性雑音も低減することができる。このことによって共用化したマイクロフォン、アンプ及びA/Dによって、指向性雑音及び拡散性雑音を同時に低減することができ、システム全体のコストを低減することができる。
以下図面に基づいて本発明の実施の形態を詳述する。
(1)第1の実施の形態
図1において、1は全体としてスティックタイプの携帯電話機を示し、ほぼ偏平矩形状に形成された筐体2の正面2a上部に日時等の各種情報を表示する表示部3が設けられているとともに、当該筐体2の正面2a下部に各種操作情報を入力し得る複数の操作キーからなる操作部4が設けられている。
この携帯電話機1は、テレビ電話モード時に通話相手から送信された映像信号及び音声信号を受信すると、その映像信号に基づく映像を表示部3に表示するとともに、その音声信号に基づく音声をスピーカ5から出力し得る。
これに加えてこの携帯電話機1では、筐体2の正面2aに設けられた撮像部6によってユーザ自身の顔を撮像しながら、筐体2の下端面2cの4隅近くに設けた無指向性の前部無指向性マイクロフォンMC1,MC3と、同じく無指向性の後部無指向性マイクロフォンMC2,MC4との合計4つの無指向性マイクロフォンによってユーザの音声を集音し、かくして通話相手とテレビ電話による通話を行なえ得る。
実際上、携帯電話機1の筐体面としての下端面2cには、一方の前部角側に設けた前部無指向性マイクロフォンMC1と対向させて一方の後部角側に後部無指向性マイクロフォンMC2が設けられており、これら前部無指向性マイクロフォンMC1と後部無指向性マイクロフォンMC2とが対として機能し、一つの指向性マイクロフォンを構成し得る。
また、筐体2の下端面2cには、前部無指向性マイクロフォンMC1に対向させて他方の前部角側に前部無指向性マイクロフォンMC3が設けられているとともに、当該前部無指向性マイクロフォンMC3と対向させて他方の後部角側に後部無指向性マイクロフォンMC4が設けられており、これら前部無指向性マイクロフォンMC3と後部無指向性マイクロフォンMC4とが対として機能し、一つの指向性マイクロフォンを構成し得る。
つまりこれら前部無指向性マイクロフォンMC1と後部無指向性マイクロフォンMC2のマイクロフォン対ならびに前部無指向性マイクロフォンMC3と後部無指向性マイクロフォンMC4のマイクロフォン対は、筐体2の正面2a及び背面2b方向にそれぞれ受音感度が高い双指向性パターン及びヌルを持つカージオイド(単一指向性パターン)を形成している。
そして、これら前部無指向性マイクロフォンMC1,MC3及び後部無指向性マイクロフォンMC2,MC4は、ユーザの音声を目的音として集音するとともに、当該目的音の到来方向とは異なる任意方向から到来する指向性雑音や、雑音音源からの各種雑音が周壁等ではね返えることによりあらゆる方向に拡散して周囲一様から到来する指向性のない拡散性雑音を同時に集音し得る。
かかる構成に加えて、この携帯電話機1には、図2に示すような音源分離装置10が内蔵されており、この音源分離装置10によって、前部無指向性マイクロフォンMC1から出力された受音信号X1(t)と、後部無指向性マイクロフォンMC2から出力された受音信号X2(t)と、前部無指向性マイクロフォンMC3から出力された受音信号X3(t)と、後部無指向性マイクロフォンMC4から出力された受音信号X4(t)とを用いて音源分離処理を実行することにより、指向性雑音及び拡散性雑音を除去し、これによりユーザの音声に相当する目的音スペクトルF15(ω)(後述する)を生成し得るようになされている。
これにより携帯電話機1では、目的音スペクトルF15(ω)だけを通話相手の携帯電話機へ送信して指向性雑音及び拡散性雑音を除去した目的音(すなわちユーザの音声)を、通話相手の携帯電話機のスピーカから出力させたり、或いは音声認識処理等の各種処理に目的音スペクトルF15(ω)を利用し得るようになされている。
実際上、この音源分離装置10は、第1雑音除去部7、第2雑音除去部8及び合成部9を備えており、これら第1雑音除去部7及び第2雑音除去部8において音源分離処理のうち指向性雑音除去処理を実行することにより、受音信号X1(t),X2(t)及び受音信号X3(t),X4(t)から指向性雑音を除去した指向性雑音除去音声スペクトルF5(ω)及び指向性雑音除去音声スペクトルF6(ω)をそれぞれ生成する。
そして、合成部9は、指向性雑音除去音声スペクトルF5(ω)と指向性雑音除去音声スペクトルF6(ω)とを合成することにより合成スペクトルF7(ω)を生成するようになされている。
また、音源分離装置10は、音源分離処理のうち拡散性雑音除去処理を実行することにより、出力信号としての受音信号X1(t),X2(t),X3(t),X4(t)に基づいて解析パラメータとしての二乗コヒーレンス(以下、これを単にMSC(Magnitude Squared Coherence)と呼ぶ)データを生成し、これを用いて合成スペクトルF7(ω)から拡散性雑音を除去した目的音スペクトルF15(ω)を生成するようになされている。
ここではまず始めに音源分離処理のうち、第1雑音除去部7及び第2雑音除去部8でそれぞれ行われる指向性雑音除去処理について以下説明する。
この場合、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2は、それぞれユーザの音声を集音し、かくして得られた受音信号X1(t),X2(t)を第1指向性制御部11に送出するようになされている。
第1指向性制御部11は、図3に示すように、加算回路12を備えており、当該加算回路12において、前部無指向性マイクロフォンMC1から出力された受音信号X1(t)と、後部無指向性マイクロフォンMC2から出力された受音信号X2(t)との差をとる処理を行ない双指向性信号D1(t)(すなわち、X1(t)−X2(t))を生成し、これを周波数分析部13(図2)へ送出する。
ここで、この双指向性信号D1(t)を周波数解析して得られるスペクトル(以下、これを双指向性スペクトルと呼ぶ)|F1(ω)|の指向特性は、図4に示す点線のように、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2を結んだx軸上を中心に横「8」の字状の双指向性パターンP1となる。
なお、この実施の形態の場合、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2は、筐体2の下端面2cに配置されていることにより、双指向性パターンP1により筐体2の正面2a及び背面2b側での受音感度が最大となり、筐体2の正面2a及び背面2b間の中間位置で、かつ正面2aと平行する平面上で受音感度が理論上0となり最小になる。
これに加えて、このとき第1指向性制御部11では、前部無指向性マイクロフォンMC1からの受音信号X1(t)を遅延回路14に送出し、当該遅延回路14で受音信号X1(t)を、前部無指向性マイクロフォンMC1から後部無指向性マイクロフォンMC2までの音波伝播時間だけ遅延させ、これにより得られた遅延信号X1’(t)を加算回路15に送出する。
加算回路15では、遅延信号X1’(t)と、後部無指向性マイクロフォンMC2からの受音信号X2(t)との差をとった単一指向性信号D2(t)(すなわち、1次差分特性となるX1’(t)−X2(t))を生成し、これを周波数分析部13へ送出する。
ここで単一指向性信号D2(t)を周波数分析部13で周波数解析して得られるスペクトル(以下、これを単一指向性スペクトルと呼ぶ)|F2(ω)|の指向特性は、図4に示す点線のように、x軸上を中心にして図中左側(筐体2の正面2a側)にヌルを有した単一指向性パターンP2となる。
このように単一指向性パターンP2では、筐体2の正面2a側にヌルが形成されることにより筐体2の正面2a方向から到来する音の受音感度が最小となる。
また、これに加えて第1指向性制御部11は、後部無指向性マイクロフォンMC2からの受音信号X2(t)を遅延回路20に送出し、当該遅延回路20で受音信号X2(t)を、前部無指向性マイクロフォンMC1から後部無指向性マイクロフォンMC2までの音波伝播時間だけ遅延させ、これにより得られた遅延信号X2’(t)を加算回路21に送出する。
加算回路21では、遅延信号X2’(t)と、前部無指向性マイクロフォンMC1からの受音信号X1(t)との差をとった単一指向性信号D3(t)(すなわち、1次差分特性となるX2’(t)−X1(t))を生成し、これを周波数分析部13へ送出する。
ここで単一指向性信号D3(t)を周波数分析部13で周波数解析して得られるスペクトル(以下、これを単一指向性スペクトルと呼ぶ)|F3(ω)|の指向特性は、図4に示す点線のように、x軸の図中右側(筐体2の背面2b側)にヌルを有した単一指向性パターンP3となる。
このように単一指向性パターンP3では、筐体2の背面2b側にヌルが形成されることにより筐体2の背面2b方向から到来する音の受音感度が最小となる。
周波数分析部13は、単一指向性信号D2(t)、単一指向性信号D3(t)及び双指向性信号D1(t)を高速フーリエ変換(FFT:First Fourier Transform)することにより周波数領域に変換し、これにより得られた単一指向性スペクトルF2(ω)、単一指向性スペクトルF3(ω)及び双指向性スペクトルF1(ω)を切替部16に送出する。
切替部16は、ユーザが操作部4を操作することにより得られる操作情報に基づいて切替動作し、周波数分析部13から受け取った単一指向性スペクトルF2(ω)及び単一指向性スペクトルF3(ω)のうちいずれか一方を選択し、選択した単一指向性スペクトルF2(ω)又は単一指向性スペクトルF3(ω)を指向性雑音分離部17に送出するようになされている。
具体的には、ユーザが筐体2の正面2aに顔を向け、表示部3を視認しながら自己の音声を前部無指向性マイクロフォンMC1,MC3及び後部無指向性マイクロフォンMC2,MC4で集音して通話相手とテレビ電話による通話を行なうテレビ電話モードの場合、指向性雑音除去用として筐体2の正面2a側から到来する目的音(すなわちユーザ自身の音声)をスペクトル・サブトラクション(SS:Spectral Subtraction)法等により、強調させる単一指向性パターンP2が切替部16で選択される。なおこの場合、目的音が到来する目的音方向とは、音源であるユーザから筐体2の正面2aへ向かう方向v(図1)となる
これにより切替部16は、筐体2の正面2a側から到来する目的音の受音感度が低く、かつ背面2b側から到来する指向性雑音の受音感度が高い単一指向性スペクトルF2(ω)のみを指向性雑音分離部17へ送出する。
またユーザーが前部無指向性マイクロフォンMC1,MC3及び後部無指向性マイクロフォンMC2,MC4で撮像対象からの音声等を集音しながら筐体2の背面2b側に有するカメラ(図示せず)により静止画もしくは動画を撮像する録画モードのときには、筐体2の背面2b側から到来する撮像対象からの目的音(例えば、撮像対象である友人の音声)をスペクトル・サブトラクション(SS)法等により、強調させる単一指向性パターンP3が切替部16で選択されるようにする。なお、この場合、目的音が到来する目的音方向とは、音源である撮像対象から筐体2の背面2bへ向かう方向(図示せず)となる。
これにより切替部16は、筐体2の背面2b側から到来する目的音の受音感度が低く、かつ正面2a側から到来する指向性雑音の受音感度が高い単一指向性スペクトルF3(ω)のみを指向性雑音分離部17へ送出する。
指向性雑音分離部17では、例えば切替部16において単一指向性スペクトルF2(ω)が選択された場合、スペクトラル・サブトラクション(SS)法を用いて、周波数帯域毎に、双指向性スペクトルF1(ω)のパワーγから、単一指向性スペクトルF2(ω)のパワーδに係数Kを乗じた値(K×δ)を減じ、これにより筐体2の背面2b側から到来する指向性雑音等を除去した指向性雑音除去音声スペクトルF5(ω)を生成し、これを合成部9に送出する。
一方、切替部16において単一指向性スペクトルF3(ω)が選択された場合、指向性雑音分離部17では、スペクトラル・サブトラクション(SS)法を用いて、周波数帯域毎に、双指向性スペクトルF1(ω)のパワーγから、単一指向性スペクトルF3(ω)のパワーδに係数Kを乗じた値(K×δ)を減じ、これにより筐体2の正面2a側から到来する指向性雑音等を除去した指向性雑音除去音声スペクトルF5(ω)を生成し、これを合成部9に送出する。
なお、係数Kは、例えば、双指向性スペクトルF1(ω)のパワーγと、単一指向性スペクトルF2(ω)のパワーδとの差の大きさや、双指向性スペクトルF1(ω)のパワーγと、単一指向性スペクトルF3(ω)のパワーδとの差の大きさに依存する係数等である。
また、例えば双指向性スペクトルF1(ω)のパワーγの方が、単一指向性スペクトルF2(ω)や単一指向性スペクトルF3(ω)のパワーδに係数Kを乗じた値(K×δ)よりも小さくなる周波数帯域においては、例えば、一定のルールで定められた最小値(各周波数帯域につき一定の値でもよく、単一指向性スペクトルF2(ω)や単一指向性スペクトルF3(ω)の周波数帯域毎の各パワーの値に比例する値等でもよい。)を算出値としてもよく、あるいはゼロとしてもよい。
以上では前部無指向性マイクロフォンMC1から出力される受音信号X1(t)と、後部無指向性マイクロフォンMC2から出力されるX2(t)とによって指向性雑音除去音声スペクトルF5(ω)を得る指向性雑音除去処理について説明したが、同様の指向性雑音除去処理は前部無指向性マイクロフォンMC3から出力される受音信号X3(t)と、後部無指向性マイクロフォンMC4から出力される受音信号X4(t)とを用いて周波数分析部25、切替部26及び指向性雑音分離部27によっても行なわれ、さらにもう1つの指向性雑音除去音声スペクトルF6(ω)を生成し、これを合成部9に送出するようになされている。
実際上、第2指向性制御部30は、図3に示したように、加算回路31において、前部無指向性マイクロフォンMC3から出力された受音信号X3(t)と、後部無指向性マイクロフォンMC4から出力された受音信号X4(t)との差をとる処理を行ない双指向性信号D8(t)(すなわち、X3(t)−X4(t))を生成し、これを第2雑音除去部8の周波数分析部25へ送出する。
なお、この双指向性信号D8(t)を周波数分析部25で周波数解析して得られる双指向性スペクトル|F8(ω)|の指向特性は、前部無指向性マイクロフォンMC3及び後部無指向性マイクロフォンMC4を結ぶy軸を中心とし、筐体2の正面2a及び背面2b側での受音感度が最大となる横「8」の字状の双指向性パターン(図4の双指向性パターンP1と同じ形状)となる。
これに加えて、このとき第2指向性制御部30では、前部無指向性マイクロフォンMC3からの受音信号X3(t)を、遅延回路32で前部無指向性マイクロフォンMC3から後部無指向性マイクロフォンMC4までの音波伝播時間だけ遅延させ、これにより得られた遅延信号X3’(t)を加算回路33に送出し、受音信号X4(t)との差をとった単一指向性信号D9(t)(すなわち、X3’(t)−X4(t))を生成して、これを第2雑音除去部8の周波数分析部25へ送出する。
なお、単一指向性信号D9(t)を周波数分析部25で周波数解析して得られる単一指向性スペクトル|F9(ω)|の指向特性は、y軸を中心とし、筐体2の正面2a側にヌルが形成されて筐体2の背面2b方向への受音感度が最大となる単一指向性パターン(図4の単一指向性パターンP2と同じカージオイド)となる。
また、これに加えて第2指向性制御部30は、後部無指向性マイクロフォンMC4からの受音信号X4(t)を、遅延回路34で前部無指向性マイクロフォンMC3から後部無指向性マイクロフォンMC4までの音波伝播時間だけ遅延させ、これにより得られた遅延信号X4’(t)を加算回路35に送出し、受音信号X3(t)との差をとった単一指向性信号D10(t)(すなわち、X4’(t)−X3(t))を生成して、これを第2雑音除去部8の周波数分析部25へ送出する。
なお、単一指向性信号D10(t)を周波数分析部25で周波数解析して得られる単一指向性スペクトル|F10(ω)|の指向特性は、y軸を中心とし、筐体2の背面2b側にヌルが形成されて筐体2の正面2a方向への受音感度が最大となる単一指向性パターンP3aとなる。
そして、切替部26は、第1雑音除去部7の切替部16と同様に動作し、テレビ電話モード時、筐体2の正面2a側から到来する目的音を減衰させる単一指向性パターンとなる単一指向性スペクトルF9(ω)を選択し得る。これにより切替部26は、筐体2の正面2a側から到来する目的音の受音感度が低い単一指向性スペクトルF9(ω)を指向性雑音分離部27へ送出する。
これに対して録画モード時には、筐体2の背面2b側から到来する撮像対象からの目的音を減衰させる単一指向性パターンとなる単一指向性スペクトルF10(ω)が切替部26で選択され得る。これにより切替部26は、筐体2の背面2b側から到来する撮像対象からの目的音の受音感度が低い単一指向性スペクトルF10(ω)のみを指向性雑音分離部27へ送出する。
指向性雑音分離部27では、スペクトラル・サブトラクション(SS:Spectral Subtraction)法を用いて、周波数帯域毎に、双指向性スペクトルF8(ω)のパワーγから、単一指向性スペクトルF9(ω)又は単一指向性スペクトルF10(ω)のパワーδに係数Kを乗じた値(K×δ)を減じ、これによりモード選択に応じて筐体2の背面2b側又は正面2a側から到来する指向性雑音等を除去した指向性雑音除去音声スペクトルF6(ω)を生成し、これを合成部9に送出する。
合成部9は、第1雑音除去部7からの指向性雑音除去音声スペクトルF5(ω)と、第2雑音除去部8からの指向性雑音除去音声スペクトルF6(ω)との和として合成スペクトルF7(ω)を得ることで、指向性雑音に比してユーザの音声を目的音として一段と強調して集音し得るようになされている。
次に音源分離処理のうち、例えば筐体2の正面2a方向から目的音が到来するテレビ電話モード時において指向性雑音成分を除去した合成スペクトルF7(ω)から拡散性雑音成分を除去する拡散性雑音除去処理について以下説明する。
第1指向性制御部11は、前部無指向性マイクロフォンMC1からの受音信号X1(t)と、後部無指向性マイクロフォンMC2からの受音信号X2(t)とに基づいて生成した単一指向性信号D3(t)を周波数分析部40へ送出する。
また、第2指向性制御部30は、前部無指向性マイクロフォンMC3からの受音信号X3(t)と、後部無指向性マイクロフォンMC4からの受音信号X4(t)とに基づいて生成され単一指向性信号D10(t)を周波数解析部40へ送出する。
なお、ここで単一指向性信号D10(t)を周波数分析部40で周波数解析して得られる単一指向性スペクトル|F10(ω)|の指向特性は、y軸を中心にして筐体2の背面2b側にヌルが形成されて筐体2の正面2a方向への受音感度が最大となり、かつ背面2b側の受音感度が最小となる単一指向性パターンP3a(図4)となる。
周波数分析部40は、第1指向制御部11から得られる単一指向性信号D3(t)と、第2指向制御部30から得られる単一指向性信号D10(t)とを、高速フーリエ変換することにより周波数領域に変換し、これにより得られた単一指向性スペクトルF3(ω)及び単一指向性スペクトルF10(ω)をMSC算出部41に送出する。
因みに、この場合、目的音が到来する目的音方向v側にヌルが形成されると、目的音の受音感度が低下するため、筐体2の正面2a側から目的音が到来するテレビ電話モード時においては、筐体2の正面2a側の受音感度が高い単一指向性スペクトルF3(ω)及び単一指向性スペクトルF10(ω)を用いるが、これら指向性の方向が同じ出力信号を用いてMSC算出部41でMSC関数の演算(後述する)を行なうと、この計算結果として低域まで含めて全周波数帯域で低いMSC値が得られない。
従って、周波数分析部40は、低域を含む全周波数帯域でMSC値を小さくするために、単一指向性スペクトルF3(ω)及び単一指向性スペクトルF10(ω)のうちいずれか一方に替えて、例えば前部無指向性マイクロフォンMC3から出力された受音信号X3(t)を周波数領域に変換し、これにより得られる無指向性スペクトルF11(ω)をMSC算出部41へ送出する。
なお、この実施の形態の場合には、前部無指向性マイクロフォンMC3から出力された受音信号X3(t)を用いているが、本発明はこれに限らず、前部無指向性マイクロフォンMC1から出力された受音信号X1(t)、後部無指向性マイクロフォンMC2から出力された受音信号X2(t)又は後部無指向性マイクロフォンMC4から出力された受音信号X4(t)のいずれかを用いるようにしても良い。
実際上、MSC算出部41は、単一指向性スペクトルF3(ω)及び単一指向性スペクトルF10(ω)を受け取ると、単一指向性スペクトルF3(ω)を自乗したパワースペクトル強度値Wxxと、単一指向性スペクトルF10(ω)を自乗したパワースペクトル強度値Wyyとを算出するとともに、単一指向性スペクトルF3(ω)及び単一指向性スペクトルF10(ω)間のクロスパワースペクトル強度値Wxyを算出する。
そして、MSC算出部41は、この計算結果を利用して、下記式(1)に基づき所定の観測周波数帯域におけるMSC関数の演算を行なうことにより、低域から高域までの各周波数帯域におけるMSC値を算出し、これらをMSCデータM1としてスムージング部42に送出する。因みに、ここで「」は複素共役を示している。
Figure 0005190859
この場合、MSC算出部41では、単一指向性スペクトルF3(ω)と、単一指向性スペクトルF10(ω)とを用いてMSC値を算出することにより、MSC値のうち高域成分について「1」以下に抑えることができる。
かかる構成に加えて、MSC算出部41は、単一指向性スペクトルF10(ω)に替えて前部無指向性マイクロフォンMC3の出力たる無指向性スペクトルF11(ω)を周波数分析部40から受け取ると、当該単一指向性スペクトルF10(ω)に替えて無指向性スペクトルF11(ω)を用いて上述したMSC関数の演算を行なう。
この場合、MSC算出部41は、単一指向性スペクトルF3(ω)を自乗したパワースペクトル強度値Wxxと、無指向性スペクトルF11(ω)を自乗したパワースペクトル強度値Wyyと、単一指向性スペクトルF3(ω)及び無指向性スペクトルF11(ω)間のクロスパワースペクトル強度値Wxyとを算出し、これら計算結果を利用して、上記式(1)に基づき所定の観測周波数帯域におけるMSC関数の演算を行なう。
これによりMSC算出部41は、低域から高域までの各周波数帯域におけるMSC値を算出し、これらをMSCデータM1としてスムージング部42に送出する。このようにして単一指向性スペクトルF3(ω)及び無指向性スペクトルF11(ω)を用いて算出したMSC値は、図5の実線で示すように、高域成分だけでなく低域成分も含めて全周波数帯域に亘って低い値に抑制され得る。すなわち、この場合、MSC算出部41では、特に低域の周波数帯域においてもMSC値を「1」よりも低い値に抑えるようになされている。
スムージング部42は、入力されたMSCデータM1について時間に関するスムージング処理を行なう。スムージング処理は以下の式(2)に基づいて行われる。
Figure 0005190859
ここでαは時間平均化の程度を変えるための乗数で、例えばα=0.8の値がとられる。またβは拡散性雑音低減に関する緩和乗数で、拡散性雑音低減の程度を調整する。
例えばβとしては、β=0.5の値がとられる。かくしてスムージング部42は、MSCデータm1に対して時間に関するスムージング処理を施したMSCデータm2を得、これを拡散性雑音分離部43に送出する。
拡散性雑音分離部43では、合成部9から受け取った合成スペクトルF7(ω)を自乗した後、スムージング部42から受け取ったスムージング処理されたMSCデータm2に基づいた値を、当該自乗した合成スペクトルF7(ω)に対して各周波数帯域毎に乗することにより、当該時間に関するスムージング処理を施したMSCデータm2でフィルタリングを行い、合成スペクトルF7(ω)を修正し、目的音のみの目的音スペクトルF15(ω)を得る。
このように拡散性雑音分離部43では、合成スペクトルF7(ω)のパワー値をMSC値に対応させて低減させ、高域での周波数帯域だけでなく、低域での周波数帯域においても拡散性雑音成分を除去した目的音スペクトルF15(ω)を生成し得る。
このようにして拡散性雑音と目的音とを分離した後には、会話を行う通話相手の携帯電話機等に送信したり、事前に適応処理又は学習処理を行って得られた音響モデルを用いて音声認識を行うことができる。
この際、拡散性雑音分離部43による処理で得られた周波数領域上の信号である目的音スペクトルF15(ω)を、時間領域上の信号である音声波形に変換する合成処理を行なった後、雑音を付与して周波数分析を行ない、その後、音声認識を行ってもよい。また、雑音の付与は、時間領域上ではなく、周波数領域上で行ってもよい。
以上の構成において、音源分離装置10では、単一指向性スペクトルF3(ω)と、単一指向性スペクトルF10(ω)とを用いてMSC値を算出するようにしたことにより、MSC値のうち高域成分について「1」以下に抑えることができる。
また、音源分離装置10では、単一指向性スペクトルF10(ω)に替えて無指向性スペクトルF11(ω)を用い、単一指向性スペクトルF3(ω)及び無指向性スペクトルF11(ω)を基にMSC値を算出するようにしたことにより、低域成分も含めてさらに全周波数帯域においてMSC値を従来よりも低い値にできる。
特に、低域の周波数帯域においては、従来のように無指向性マイクロフォンからのスペクトルのみを用いてMSC関数を演算すると、図5の点線で示すように、MSC値が「1」となり、このようなMSC値を用いても拡散性雑音を除去することができない。
これ対して本発明においては目的音方向vが既知であることを活用して、空間フィルタを用いる場合にも空間フィルタの指向特性が安定で大きな方向に目的音を設定でき、かくして良好な目的音をとりだせる。そして、低域の周波数帯域においてMSC値を最大値である「1」よりも低い値に抑えることができるので、当該MSC値を用いることにより低域の周波数帯域においても拡散性雑音を除去できる。
また、この音源分離装置10では、前部無指向性マイクロフォンMC1からの受音信号X1(t)及び後部無指向性マイクロフォンMC2からの受音信号X2(t)を用いてスペクトラル・サブトラクション(SS)法によって指向性雑音を除去するようにしたことにより、指向性雑音を除去するために別途マイクロフォン等を設ける必要がなく、その分だけ複雑な構成となることを防止し、装置全体として小型化を図ることができる。
さらに、この音源分離装置10では、指向性雑音を除去するために利用される前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2からの単一指向性信号D3(t)と、同じく指向性雑音を除去するために利用される前部無指向性マイクロフォンMC3からの受音信号X3(t)とを利用して、MSC算出部41、スムージング部42及び拡散性雑音分離部43によって拡散性雑音除去処理を行なうようにしたことにより、指向性雑音だけでなく、低域周波数帯域を含めて拡散性雑音を同時に除去できる統合的な装置を実現できる。
このように前部無指向性マイクロフォンMC1,MC3及び後部無指向性マイクロフォンMC2,MC4(アンプやA/Dも含め)を共用化して指向性雑音及び拡散性雑音を同時に低減することができるので、指向性雑音除去専用マイクロフォン及び拡散性雑音除去専用マイクロフォン等をそれぞれ個別に設けない分だけ、システム全体として簡易な構成とし、コスト低減を図ることができる。
さらに、この実施の形態においては、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2による単一指向性パターンP3の最大感度軸方向と、前部無指向性マイクロフォンMC3及び後部無指向性マイクロフォンMC4による単一指向性パターンP3aの最大感度軸方向とが、互いに同じ方向になるように形成され、当該最大感度軸方向から目的音(ユーザの音声)を到来させるようにしたことで、指向性雑音と同時に拡散性雑音の低減を行なうことができる。
また、MSC値の算出のために、単一指向性スペクトルF10(ω)に替えて無指向性スペクトルF11(ω)を用いることにより、さらに全周波数帯域においてMSC値を従来よりも低い値にでき、かくして低域周波数帯域も含めて全周波数帯域で拡散性雑音を除去することができる。
なお、この実施の形態の場合、前部無指向性マイクロフォンMC1,MC3及び後部無指向性マイクロフォンMC2,MC4は、無指向性であることから、振幅位相周波数特性の乱れを抑制できるとともに、風雑音の低減を図ることもできる。
以上の構成によれば、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフ
ォンMC2と、前部無指向性マイクロフォンMC3及び後部無指向性マイクロフォンMC4とを目的音が到来する目的音方向vに間隔を置いて配置し、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2を結ぶx軸がその指向特性の最大感度軸と同一となり、かつ前部無指向性マイクロフォンMC3及び後部無指向性マイクロフォンMC4を結ぶy軸がその指向特性の最大感度軸と同一となるようにした。
また、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2による単一指向性信号D3(t)と、前部無指向性マイクロフォンMC3及び後部無指向性マイクロフォンMC4からの単一指向性信号D10(t)との2個の出力信号を用いてクロスパワースペクトル強度値を算出し、このクロスパワースペクトル強度値に基づいて、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2の出力信号と、前部無指向性マイクロフォンMC3及び後部無指向性マイクロフォンMC4と出力信号とに基づいた周波数成分のMSCデータm1(解析パラメータ)をMSC算出部41で算出し、このMSCデータm1に基づいて拡散性雑音とその他の音を拡散性雑音分離部43で分離するようにした。これにより指向性雑音と同時に拡散性雑音の低減を行なうことができる。
また、単一指向性スペクトルF10(ω)に替えて無指向性スペクトルF11(ω)を用いてMSC値の算出を行なうようにしたことにより、低域も含めてさらに全周波数帯域においてMSC値を従来よりも一段と低い値にでき、かくして低域周波数帯域も含めて全周波数帯域で拡散性雑音を除去することができる。
従って、この音源分離装置10では、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2間の間隔や、前部無指向性マイクロフォンMC3及び後部無指向性マイクロフォンMC4間の間隔を従来のように所定以上の距離まで離さなくても、低域周波数帯域で低くなったMSC値により、拡散性雑音について高域の周波数成分だけでなく、低域の周波数成分についても確実に除去できるので、従来よりも前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2間の間隔や、前部無指向性マイクロフォンMC3及び後部無指向性マイクロフォンMC4間の間隔を狭めることができ、かくして一段と小型化を図ることができる。よって携帯電話機等の小型通信端末に対しても確実に搭載することができる。
なお、本発明は、上記の実施の形態に限定されるものではなく、種々の変形実施が可能である。例えば、上述した第1の実施の形態においては、スペクトラル・サブトラクション(SS)法を用いて指向性雑音を除去した指向性雑音除去音声スペクトルを生成するようにした場合について述べたが、本発明はこれに限らず、バイナリマスク法を用いて指向性妨害音を除去した指向性妨害音除去音声スペクトルを生成するようにしても良い。
実際上、スペクトラル・サブトラクション(SS)法の替わりにバイナリマスク法を用いた場合、指向性雑音分離部は、双指向性スペクトルF1(ω)と、例えば単一指向性スペクトルF2(ω)との間で同一の周波数帯域の各パワーの大小の比較を周波数帯域毎に行い、それぞれの周波数帯域で双指向性スペクトルF1(ω)の方が単一指向性スペクトルF2(ω)よりも大きい時、双指向性スペクトルF1(ω)の方のパワーを、分離して得られるスペクトルに帰属させる帯域選択を行なう。
なお、筐体2の背面2b側から目的音が到来する録画モードにおいては、筐体2の背面2b側の受音感度が高い単一指向性スペクトルF2(ω)及び単一指向性スペクトルF9(ω)と、例えば無指向性スペクトルF11(ω)をMSC算出部41に送出する構成とし、これら単一指向性スペクトルF2(ω)及び単一指向性スペクトルF9(ω)、若しくは単一指向性スペクトルF2(ω)及び単一指向性スペクトルF9(ω)のいずれかの替わり無指向性スペクトルF11(ω)を用いてMSCデータを算出すれば、上述した実施の形態と同様の効果を得ることができる。
(2)第2の実施の形態
図1との対応部分に同一符号を付して示す図6は第2の実施の形態による折り畳み式携帯電話機50を示すもので、この折り畳み式携帯電話機50は、表示部3、スピーカ5及びカメラ6が正面51aに設けられた表示部筐体51と、操作部4及び4つの無指向性マイクロフォンMC5,MC6,MC7,MC8が筐体面としての正面52aに設けられた操作部筐体52とがヒンジ部53を介して折り畳み及び展開可能に構成されている。
実際上、この折り畳み式携帯電話機50は、スティックタイプの携帯電話機1(図1)の筐体2に比べて表示部筐体51及び操作部筐体52の厚さ寸法が極力薄くなるように形成されていることから、無指向性マイクロフォンMC5,MC6,MC7,MC8が下端面52cではなく、ユーザの音声(目的音)が到来する目的音方向vと直角方向となる操作部筐体52の正面52a四隅にそれぞれ配置された構成を有する。
この実施の形態の場合には、無指向性マイクロフォンMC5,MC6,MC7,MC8
は、所定位置での目的音方向vとヌル方向とを異ならせ、所定位置での目的音方向vを軸として回転させたときに、同一となる指向性を形成するように、折り畳み式携帯電話機50の操作面としての操作部筐体52の正面52aに設けられている。なお、本発明はこれに限らず、所定位置での目的音方向vとヌル方向とを異ならせ、所定位置での目的音方向vを軸として回転させたときに、同一となる指向性を形成できれば、無指向性マイクロフォンMC5,MC6,MC7,MC8を折り畳み式携帯電話機50の表示面としての表示部筐体51の正面51aに設けるようにしても良い。
図2との対応部分に同一符号を付して示す図7のように、折り畳み式携帯電話機50に内蔵されている音源分離装置54は、テレビ電話モード及び表示部筐体52の背面側に有するカメラ(図示せず)で撮像する録画モードの両モード時において、上述した第1の実施の形態と同様に、無指向性マイクロフォンMC5,MC6から出力された受信信号X1(t),X2(t)を用いて、第1指向性制御部11により、双指向性信号D1(t)、単一指向性信号D2(t)及び単一指向性信号D3(t)を生成し、これらを第1雑音除去部54の周波数分析部13へ送出するとともに、単一指向性信号D3(t)を周波数解析部40にも送出する。
周波数分析部13は、これら双指向性信号D1(t)、単一指向性信号D2(t)及び単一指向性信号D3(t)の周波数解析を行い、双指向性スペクトルF1(ω)、単一指向性スペクトルF2(ω)及び単一指向性スペクトルF3(ω)を求めた後、これらを指向性雑音分離部56へ送出する。
ここで双指向性スペクトル|F1(ω)|の指向特性は、図8に示すように、無指向性マイクロフォンMC5及び無指向性マイクロフォンMC6を結ぶx´軸を中心として、操作部筐体52の両側面側での受音感度が最大となる縦「8」の字状の双指向性パターンP1となる。また、単一指向性スペクトル|F2(ω)|の指向特性は、x´軸を中心として、操作部筐体52の一側面側にヌルが形成されて受音感度が最小となる単一指向性パターンP2なり、単一指向性スペクトル|F3(ω)|の指向特性は、x´軸を中心として、単一指向性パターンP2とは逆方向に操作部筐体52の他側面側にヌルが形成されて受音感度が最小となる単一指向性パターンP3となる。
指向性雑音分離部56は、単一指向性スペクトルF3(ω)と、双指向性スペクトルF1(ω)とを用いて、スペクトラル・サブトラクション(SS)法を行ない、各周波数における単一指向性スペクトルF3(ω)の大きさから、双指向性スペクトルF1(ω)の大きさを差し引くことにより、図8に示すように、操作部筐体52の側面側から到来する雑音を低減したスペクトルを生成する。
この時同時に指向性雑音分離部56は、一方の無指向性マイクロフォンMC6の設置された側の空間(図8では右側空間)から到来する、目的音を含む音に対する利得が、目的音方向vから他方の無指向性マイクロフォンMC5の設置された側の空間(図8では左側空間)方向にずれるとき、急激に小さくなることを利用して、目的音に対する指向性を高めるように働く。
また、指向性雑音分離部56は、単一指向性スペクトルF2(ω)と、双指向性スペクトルF1(ω)とを用いて、スペクトラル・サブトラクション(SS)法を行ない、各周波数における単一指向性スペクトルF2(ω)の大きさから、双指向性スペクトルF1(ω)の大きさを差し引くことにより、操作部筐体52の側面側から到来する雑音を低減したスペクトルを生成する。
この時同時に指向性雑音分離部56は、他方の無指向性マイクロフォンMC5の設置された側の空間(図8では左側空間)から到来する、目的音を含む音に対する利得が、目的音方向vから一方の無指向性マイクロフォンMC6の設置された側の空間(図8では右側空間)方向にずれるとき、急激に小さくなることを利用して、目的音に対する指向性を高めるように働く。
また、これに加えて指向性雑音分離部56は、以上で作られた2種のスペクトルについてミニマイゼーション処理を行なうようになされている。
ここでミニマイゼーション処理は、周波数帯域毎に各パワーの大小を比較して劣勢な方のパワーを目的音のスペクトルとして帰属させる処理であり、これにより指向性雑音分離部56は、スペクトル統合処理を行い指向性雑音を除去した指向性雑音除去音声スペクトルF20(ω)を生成し、これを合成部57へ送出する。
因みに、ミニマイゼーションによるスペクトル統合処理では、同一の周波数帯域のパワー同士を比較し、各周波数帯域で劣勢の方のパワーが選択され、これらを音声の音声スペクトルとして帰属させることにより、音声と指向性雑音とを分離することができる。
なお、ミニマイゼーションによるスペクトル統合処理は、各周波数帯域毎の劣勢の方のパワーを捨てることなく、指向性雑音除去音声スペクトルF20(ω)として帰属させ得る。
かかる構成に加えて無指向性マイクロフォンMC6と対角線上に配置された無指向性マイクロフォンMC7は、無指向性マイクロフォンMC5とともに、第3指向性制御部58に接続されており、当該無指向性マイクロフォンMC5から出力された受音信号X1(ω)と、無指向性マイクロフォンMC7から出力された受音信号X3(ω)とが第3指向性制御部58に送出される。
周波数分析部59及び指向性雑音分離部60からなる第2雑音除去部55と、第3指向性制御部58とは、先に説明した第1雑音除去部54と第1指向性制御部11と同様の構成からなり、指向性雑音除去音声スペクトルF20(ω)の生成処理と同様の生成処理を実行し得ることにより、無指向性マイクロフォンMC5からの受音信号X1(ω)と、無指向性マイクロフォンMC7からの受音信号X3(ω)とに基づいて指向性雑音除去音声スペクトルF21(ω)を生成し得るようになされている。
なお、この場合、第3指向性制御部58は、第1指向性制御部11と同様に加算回路や遅延回路(図示せず)が設けられており、これら加算回路等により、無指向性マイクロフォンMC5からの受音信号X1(t)及び無指向性マイクロフォンMC7からの受音信号X3(t)との差をとる処理を行って双指向性信号D22(t)(すなわち、X1(t)−X3(t))を生成し、周波数分析部59を介して指向性雑音分離部60に送出する。
ここで双指向性信号D22(t)を周波数分析部59で周波数解析して得られる双指向性スペクトル|F22(ω)|の指向特性は、無指向性マイクロフォンMC5及び無指向性マイクロフォンMC7を結ぶ軸を中心として、操作部筐体52の上端(すなわちヒンジ部53側)及び下端面52c方向での受音感度が最大となる縦「8」の字状の双指向性パターン(図示せず)となる。
また、第3指向性制御部58は、遅延回路で無指向性マイクロフォンMC5から無指向性マイクロフォンMC7までの音波伝播時間だけ、当該無指向性マイクロフォンMC7からの受音信号X3(t)を遅延させた遅延信号X3’(t)と、受音信号X1(t)との差をとった単一指向性信号D23(t)(すなわち、X3’(t)−X1(t))を生成し、周波数分析部59を介して指向性雑音分離部60に送出する。
ここで単一指向性信号D23(t)を周波数分析部59で周波数解析して得られる単一指向性スペクトル|F23(ω)|の指向特性は、無指向性マイクロフォンMC5及び無指向性マイクロフォンMC7を結ぶ軸を中心として、操作部筐体52のヒンジ部53側にヌルが形成されて操作部筐体52のヒンジ部53方向への受音感度が最小となる単一指向性パターン(図示せず)となる。
さらに、第3指向性制御部58は、遅延回路で無指向性マイクロフォンMC5から無指向性マイクロフォンMC7までの音波伝播時間だけ、当該無指向性マイクロフォンMC5からの受音信号X1(t)を遅延させた遅延信号X1’(t)と、受音信号X3(t)との差をとった単一指向性信号D24(t)(すなわち、X1’(t)−X3(t))を生成し、周波数分析部59を介して指向性雑音分離部60に送出する。
ここで単一指向性信号D24(t)を周波数分析部59で周波数解析して得られる単一指向性スペクトル|F24(ω)|の指向特性は、無指向性マイクロフォンMC5及び無指向性マイクロフォンMC7を結ぶ軸を中心として、操作部筐体52の下端面52c側にヌルが形成されて操作部筐体52の下端面52c方向への受音感度が最小となる単一指向性パターン(図示せず)となる。
指向性雑音除去部60は、上述した指向性雑音除去部56と同様にスペクトラル・サブトラクション(SS)法を行ない、各周波数帯域毎に単一指向性スペクトルF23(ω)の大きさから、双指向性スペクトルF22(ω)の大きさを差し引くことにより、操作部筐体52の上下端方向(図8)から到来する雑音を低減したスペクトルを生成する。
また、指向性雑音分離部60は、スペクトラル・サブトラクション(SS)法を行ない、各周波数帯域毎に単一指向性スペクトルF24(ω)の大きさから、双指向性スペクトルF22(ω)の大きさを差し引くことにより、操作部筐体52の上下端方向から到来する雑音を低減したスペクトルを生成する。
これに加えて指向性雑音分離部60は、以上で作られた2種のスペクトルについて、上述と同じミニマイゼーション処理を行ない、スペクトル統合して指向性雑音を除去した指向性雑音除去音声スペクトルF21(ω)を生成し、これを合成部57へ送出する。
合成部57は、第1雑音除去部54からの指向性雑音除去音声スペクトルF20(ω)と、第2雑音除去部55からの指向性雑音除去音声スペクトルF21(ω)とをミ二マイゼーション処理して合成スペクトルF7(ω)を得ることで、指向性雑音に比してユーザの音声を目的音として一段と強調して集音し得るようになされている。
つまり、x´軸方向である無指向性マイクロフォンMC5及び無指向性マイクロフォンMC6を結ぶ軸方向からの指向性雑音を除去することと、無指向性マイクロフォンMC5及び無指向性マイクロフォンMC7を結ぶ軸方向からの指向性雑音を除去することとを、ミニマイゼーション処理によって同時に実現し、x´軸方向と、無指向性マイクロフォンMC5及び無指向性マイクロフォンMC7を結ぶ軸方向ともに利得が制限されたビーム状指向性とするように制限を加えるためである。
一方、音源分離処理のうち、合成スペクトルF7(ω)から拡散性雑音成分を除去する本発明の拡散性雑音除去処理については、上述した第1の実施の形態と同様にして実行され得る。
すなわち、周波数解析部40は、第2指向制御部61から得られる単一指向性信号D4(t)と、第1指向制御部11から得られる単一指向性信号D3(t)とを、高速フーリエ変換することにより周波数領域に変換し、これにより得られた単一指向性スペクトルF3(ω)及び単一指向性スペクトルF4(ω)をMSC算出部41に送出する。
MSC算出部41は、この計算結果を利用して、上記式(1)に基づき所定の観測周波数帯域におけるMSC値を算出し、この低域から高域までの周波数帯域において変化するMSC値をMSCデータm3としてスムージング部42に送出する。
スムージング部42は、MSCデータm3に対して時間に関するスムージング処理を施したMSCデータm4を得、これを拡散性雑音分離部43に送出する。
拡散性雑音分離部43では、合成部57からの合成スペクトルF7(ω)を自乗し、MSCデータm4を基にMSC値を各周波数帯域毎に乗することにより、当該MSCデータm4でフィルタリングを行い、目的音のパワースペクトルを修正する。
このように拡散性雑音分離部43では、合成スペクトルF7(ω)のパワー値をMSC値に対応させて低減させ、高域の周波数帯域だけでなく低域の周波数帯域においても拡散性雑音成分を除去した目的音スペクトルF15(ω)を生成し得る。
以上の構成によれば、目的音方向vと直角をなす方向である操作部筐体52の正面52aに、互いの位置関係が長方形の頂点の位置をなすように4つの無指向性マイクロフォンMC5,MC6,MC7,MC8を設けるようにした。
このように無指向性マイクロフォンMC5,MC6,MC7,MC8によって形成され
た指向特性を、所定位置での目的音方向vを軸として回転させたときに、同一となる無指向性マイクロフォンMC5,MC6,MC7,MC8によって、テレビ電話モード時及び録画モード時のとき、指向性雑音を除去する構成の携帯電話機50であっても、上述した第1の実施の形態と同様に、低域周波数帯域でも低くなったMSC値を算出し、このMSC値を用いて合成スペクトルF7(ω)の周波数成分の解析を行なえ、目的音と拡散性雑音とを分離することができる。
従って、音源分離装置54では、無指向性マイクロフォンMC5,MC6,MC7,MC8間の間隔を所定距離以上まで離さずに、低域周波数帯域でも低くなったMSC値により、拡散性雑音について高域の周波数成分とともに低域の周波数成分についても確実に除去できるので、従来よりも無指向性マイクロフォンMC5,MC6,MC7,MC8間の間隔を狭めることができ、かくして一段と小型化を図ることができる。
またこの実施の形態においては、無指向性マイクロフォンMC5及び無指向性マイクロフォンMC6による単一指向性パターンP3と、無指向性マイクロフォンMC7及び無指向性マイクロフォンMC8による単一指向性パターンP4とが、互いにヌルを対向させ、最大感度軸方向が互いに逆方向に形成され、当該最大感度軸方向と直交する方向から目的音(ユーザの音声)を到来させるようにしたことで、低域周波数帯域も含めて全周波数帯域で拡散性雑音を効率的に除去させることができる。
(3)第3の実施の形態
図2との対応部分に同一符号を付して示す図9は、第3の実施の形態による音源分離装置70を示し、この音源分離装置70は、上述した第1の実施の形態と異なり、筐体2(図1)の下端面2cに2つの無指向性の前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2のみを用いて、指向性雑音成分及び拡散性雑音成分を除去し得る点で異なるものである。
この場合、音源分離装置70は、先ず始めに通話時にユーザが声を発していない状態(以下、これを無目的音状態と呼ぶ)において、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2で周囲の指向性雑音や拡散性雑音を集音する。
音源分離装置70は、このとき前部無指向性マイクロフォンMC1から出力された受音信号X1n(t)と、後部無指向性マイクロフォンMC2から出力された受音信号X2n(t)とをそのまま周波数分析部13へ送出し、当該周波数分析部13において受音信号X1n(t)及び受音信号X2n(t)を高速フーリエ変換することにより周波数領域に変換し、当該受音信号X1n(t)から得られた無目的音スペクトルFX1n(ω)及び受音信号X2n(t)から得られた無目的音スペクトルFX2n(ω)をMSC算出部41に送出する。
MSC算出部41は、無目的音スペクトルFX1n(ω)を自乗したパワースペクトル強度値Wxxと、無目的音スペクトルFX2n(ω)を自乗したパワースペクトル強度値Wyyとを算出するとともに、この無目的音スペクトルFX1n(ω)及び無目的音スペクトルFX2n(ω)間のクロスパワースペクトル強度値Wxyを算出する。
MSC算出部41は、この計算結果を利用して、上記した第1の実施の形態の式(1)に基づき所定の観測周波数帯域におけるMSC関数の演算を行なうことにより、無目的音状態での低域から高域までの各周波数帯域におけるMSC値を算出し、これらをMSCデータm5として差分算出部72に送出する。
そして、その後、ユーザが声を発して通話相手と実際に通話が開始された状態(以下、これを目的音受音状態と呼ぶ)になると、この音源分離装置70は、ユーザの音声を目的音として前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2で集音し得る。
指向性制御部71は、前部無指向性マイクロフォンMC1からの受音信号X1(t)及び後部無指向性マイクロフォンMC2からの受音信号X2(t)をそのまま周波数分析部13へ送出し、当該周波数分析部13において受音信号X1(t)及び受音信号X2(t)を高速フーリエ変換することにより周波数領域に変換し、当該受音信号X1(t)から得られたMSC用音声スペクトルFX1(ω)及び受音信号X2(t)から得られたMSC用音声スペクトルFX2(ω)をMSC算出部41に送出する。
MSC算出部41は、MSC用音声スペクトルFX1(ω)を自乗したパワースペクトル強度値Wxxと、MSC用音声スペクトルFX2(ω)を自乗したパワースペクトル強度値Wyyとを算出するとともに、このMSC用音声スペクトルFX1(ω)及びMSC用音声スペクトルFX2(ω)間のクロスパワースペクトル強度値Wxyを算出する。
MSC算出部41は、この計算結果を利用して、上記した第1の実施の形態の式(1)に基づき所定の観測周波数帯域におけるMSC関数の演算を行なうことにより、目的音受音状態での低域から高域までの各周波数帯域におけるMSC値を算出し、これらをMSCデータm6として差分算出部72に送出する。
差分算出部72は、無目的音状態での受音信号X1n(t)及び受音信号X2n(t)から得られたMSCデータm5と、目的音受音状態での受音信号X1(t)及び受音信号X2(t)から得られた解析パラメータとしてのMSCデータm6との各周波数帯域毎に差分を算出し、目的音受音状態において算出したMSCデータm6を、無目的音状態において算出したMSCデータm5によって補正する。
そして、差分算出部72は、このようにして各周波数帯域毎に算出した補正操作値としての差分MSC値を差分MSCデータm7としてスムージング部42に送出する。
スムージング部42は、差分MSCデータm7について時間に関するスムージング処理を行ない、これにより得られた差分MSCデータm8を拡散性雑音分離部43に送出する。
そして、これと同時に指向性制御部71は、上述した第1の実施の形態と同様に、前部無指向性マイクロフォンMC1からの受音信号X1(t)及び後部無指向性マイクロフォンMC2からの受音信号X2(t)に基づいて加算回路や遅延回路等により双指向性信号D1(t)、単一指向性信号D2(t)及び単一指向性信号D3(t)を生成し、これらを周波数解析部13に送出する。
周波数解析部13は、双指向性信号D1(t)、単一指向性信号D2(t)及び単一指向性信号D3(t)を高速フーリエ変換することにより周波数領域に変換し、これにより得られた双指向性信号D1(t)の双指向性スペクトルF1(ω)を指向性雑音分離部17に送出するとともに、単一指向性信号D2(t)の単一指向性スペクトルF2(ω)と、単一指向性信号D3(t)の単一指向性スペクトルF3(ω)とを切替部16に送出する。
切替部16は、ユーザによるテレビ電話モード又は録画モードの選択により操作部4の操作に応じて切替動作し、周波数分析部13から受け取った単一指向性スペクトルF2(ω)及び単一指向性スペクトルF3(ω)のうちいずれか一方を選択して、単一指向性スペクトルF2(ω)又は単一指向性スペクトルF3(ω)を指向性雑音分離部17に送出する。
指向性雑音分離部17では、スペクトラル・サブトラクション(SS)法を用いて、周波数帯域毎に、双指向性スペクトルF1(ω)のパワーγから、例えばテレビ電話モード時では単一指向性スペクトルF2(ω)(録画モード時では単一指向性スペクトルF3(ω))のパワーδに係数Kを乗じた値(K×δ)を減じ、これにより筐体6の正面6a側から到来する指向性雑音を除去した指向性雑音除去音声スペクトルF5(ω)を生成し、これを拡散性雑音分離部43に送出する。
拡散性雑音分離部43では、指向性雑音除去音声スペクトルF5(ω)を指向性雑音分離部17から受け取ると、当該指向性雑音除去音声スペクトルF5(ω)を自乗した後、差分MSCデータm8を各周波数帯域毎に乗することにより、当該差分MSCデータm8でフィルタリングを行い、指向性雑音除去音声スペクトルF5(ω)を修正し、目的音のみの目的音スペクトルF15(ω)を生成し得る。
このようにして拡散性雑音分離部43では、指向性雑音除去音声スペクトルF5(ω)のパワー値を、無目的音状態と目的音受音状態とでのMSC値の差分をとった差分MSC値に対応させて低減させ、高域の周波数帯域だけでなく低域の周波数帯域においても拡散性雑音成分を除去した目的音スペクトルF15(ω)を生成し得るようになされている。
以上の構成によれば、無目的音状態での前部無指向性マイクロフォンMC1からの受音信号X1n(t)及び後部無指向性マイクロフォンMC2からの受音信号X2n(t)と、目的音受音状態での前部無指向性マイクロフォンMC1からの受音信号X1(t)及び後部無指向性マイクロフォンMC2からの受音信号X2(t)とを入力として、周波数分析部13を介してMSC算出部41で各周波数帯域毎にそれぞれMSC値を算出するとともに、差分算出部72においてこれらMSC値の各周波数帯域毎での差分MSC値を算出し、これら差分値としての差分MSC値を用いて拡散性除去処理を行なうようにした。
従って、音源分離装置70では、2つの前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2間の間隔を所定以上の距離まで離さなくても、低域周波数帯域で低くなった差分MSC値により、拡散性雑音について高域の周波数成分とともに低域の周波数成分についても確実に除去できるので、従来よりも前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2間の間隔を狭めることができ、かくして一段と小型化を図ることができる。
また、この音源分離装置70では、指向性雑音を除去するために用いられる前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2を用い、これら前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2から得られる無目的音状態での受音信号X1n(t)及び受音信号X2n(t)と、目的音受音状態での受音信号X1(t)及び受音信号X2(t)とに基づき差分MSCデータm8を生成して、この差分MSCデータm8を基に拡散性雑音除去処理を行なうようにしたことにより、前部無指向性マイクロフォンMC1及び後部無指向性マイクロフォンMC2のみで指向性雑音だけでなく、拡散性雑音をも同時に除去できる統合的な装置を実現できる。
(4)第4の実施の形態
図6との対応部分に同一符号を付して示す図10は、第4の実施の形態による折り畳み式携帯電話機80を示し、この折り畳み式携帯電話機80は、上述した第2の実施の形態における4つの無指向性マイクロフォンMC5,MC6,MC7,MC8に替えて、操作部筐体52の一方の側面52dに指向性マイクロフォンMC10を設けるとともに、当該一方の側面52dと対向した他方の側面52eに指向性マイクロフォンMC11が設けられている。
この場合、一方の指向性マイクロフォンMC10の指向特性は、図11に示すように、指向性マイクロフォンMC10及び指向性マイクロフォンMC11を結んだx´´軸と、指向特性の最大感度軸とが同一であり、図中右側(操作部筐体52の他方の側面52e側)にヌルを有した単一指向性パターンP10となるように配置されている。
また、他方の指向性マイクロフォンMC11の指向特性は、x´´軸と、指向特性の最大感度軸とが同一で、かつ図中左側(操作部筐体52の一方の側面52d側)にヌルを有した単一指向性パターンP11となるように配置されている。
このように指向性マイクロフォンMC10及び指向性マイクロフォンMC11は、互いに逆方向に指向特性の最大感度を有するように配置されている。
また、指向性マイクロフォンMC10及び指向性マイクロフォンMC11は、当該指向性マイクロフォンMC10からの受音信号X10(t)と、指向性マイクロフォンMC11からの受音信号X11(t)とに基づいて、x´´軸を指向特性の最大感度軸の中心とした横「8」の字状の双指向性パターンP11を形成し得るようになされている。
そして、上述した第2の実施の形態と同様にして、折り畳み式携帯電話機80では、単一指向性パターンP10の指向性マイクロフォンMC10から得た受音信号X10(t)に基づく単一指向性スペクトルと、単一指向性パターンP11の指向性マイクロフォンMC11から得た受音信号X11(t)に基づく単一指向性スペクトルと、双指向性パターンP11を形成する指向性マイクロフォンMC10及び指向性マイクロフォンMC11からの出力信号に基づく双指向性スペクトルとを生成する。
そして、折り畳み式携帯電話機80に内蔵した音源分離装置は、スペクトラル・サブトラクション(SS)法を行ない、各周波数における単一指向性スペクトルの大きさから、双指向性スペクトルの大きさを差し引くことにより、操作部筐体52の側面52e,52d方向にあたるx´´軸方向側から到来する雑音を低減した2種のスペクトルを生成した後、ミニマイゼーション処理を行なう。
かくしてこの折り畳み式携帯電話機80ではミニマイゼーション処理によって音声と指向性雑音とを分離した指向性雑音除去音声スペクトルを生成できる。
また、指向性雑音除去音声スペクトルから拡散性雑音成分を除去する本発明の拡散性雑音除去処理については、単一指向性パターンP10の指向特性信号と、単一指向性パターンP11の指向特性信号とを用いて、上述した第1の実施の形態と同様にして実行され、指向性雑音除去音声スペクトルのパワー値をMSC値に対応させて低減させ、高域の周波数帯域だけでなく低域の周波数帯域においても拡散性雑音成分を除去した目的音スペクトルF8(ω)を生成し得る。
以上の構成において、折り畳み式携帯電話機80では、上述した第2の実施の形態と同様に、指向性マイクロフォンMC10及び指向性マイクロフォンMC11を結んだx´´軸方向からの指向性雑音を除去できるとともに、高域から低域にかけて全周波数帯域で拡散性雑音を除去できる。
また、この折り畳み式携帯電話機80では、第2の実施の形態に比してマイクロフォンの数を低減することができるので、装置全体として簡易な構成にできる。
なお、上述した実施の形態においては、折り畳み式携帯電話機80の操作部筐体52における一方の側面52dに指向性マイクロフォンMC10を設け、他方の側面52eに指向性マイクロフォンMC11を設けるようにした場合について述べたが、本発明はこれに限らず、図6との対応部分に同一符号を付して示す図12のように、折り畳み式携帯電話機90の操作部筐体52の正面52a下部に指向性マイクロフォンMC13を設け、当該指向性マイクロフォンMC13に対向する背面52f下部に指向性マイクロフォンMC14を設ける等この他種々の位置に指向性マイクロフォンを設けるようにしても良い。
この場合、図13に示すように、一方の指向性マイクロフォンMC13の指向特性は、指向性マイクロフォンMC13及び指向性マイクロフォンMC14を結んだ、x´´´軸と、指向特性の最大感度軸とが同一で、かつ操作部筐体52の背面52f側にヌルを有した単一指向性パターンP13となるように配置される。
また、他方の指向性マイクロフォンMC14の指向特性は、x´´´軸と指向特性の最大感度軸とが同一で、かつ操作部筐体52の正面52aにヌルを有した単一指向性パターンP14となるように配置される。
このように指向性マイクロフォンMC13及び指向性マイクロフォンMC14は、互いに逆方向に指向特性の最大感度を有するように配置され、かつ受音信号X13(t)及び受音信号X14(t)に基づいて、x´´´軸を指向特性の最大感度軸の中心とし、正面52a側及び背面52f側が最大感度となる双指向性パターンP15を形成し得るようになされている。
これにより折り畳み式携帯電話機90では、上述した第1の実施の形態と同様に、音源分離処理のうち指向性雑音除去処理を実行することにより、受音信号X13(t)及び受音信号X14(t)から指向性雑音成分を除去した指向性雑音除去音声スペクトルを生成する。
また、指向性雑音除去音声スペクトルから拡散性雑音成分を除去する本発明の拡散性雑音除去処理については、単一指向性パターンP13の指向特性信号と、双指向性パターンP15の指向特性信号とを用いて、上述した第1の実施の形態と同様にして実行され、指向性雑音除去音声スペクトルのパワー値をMSC値に対応させて低減させ、高域の周波数帯域だけでなく低域の周波数帯域においても拡散性雑音成分を除去した目的音スペクトルF8(ω)を生成し得る。
以上の構成において、折り畳み式携帯電話機90では、操作部筐体52と側面方向(図12中の左右方向)及び正面52a背面52f方向から到来する指向性雑音を除去できるとともに、高域から低域にかけて全周波数帯域で拡散性雑音を除去できる。
(5)他の実施の形態
以上、本発明の第1〜第4の実施の形態について説明したが、本発明は、当該第1〜第
4の実施の形態に限定されるものではなく、種々の変形実施が可能である。例えば、第2
の実施の形態において表示部筐体51の正面51aや背面等のこの他種々の箇所にマイクロフ
ォンMC5等の各種マイクロフォンを設けるようにしても良い。所定位置での目的音方向vとヌル方向とを異ならせ、当該目的音方向vを軸として回転させたときに指向特性が同一となるように指向性マイクロフォン、またそのような指向性を形成する無指向性マイクロフォンを種々の箇所に設けるようにしても良い。
また、第2の実施の形態においては、マイクロフォンMC5,MC6,MC7,MC8から選択した2個の組み合わせのマイクロフォン対の出力信号2個に遅延差を与えた後、差をとることで得られた指向性信号を複数個生成し、この指向性信号2個づつで、複数のクロスパワースペクトル強度値を算出して、当該クロスパワースペクトル強度値に基づいて、マイクロフォンMC5,MC6,MC7,MC8の出力信号における周波数成分のMSCデータを複数個求め、複数個のMSCデータの各周波数最小値により目的音と拡散性雑音とを分離するようにしても良い。
このような場合には、複数個のMSCデータの各周波数最小値を用いることから、各周波数帯域毎に合成スペクトルF7(ω)に含まれる拡散性雑音成分を確実に除去することができる。
さらに、第2の実施の形態においては、複数の指向性信号を高速フーリエ変換することにより周波数スペクトルに変換して各周波数スペクトルを大きさ成分と位相成分とに分け、当該大きさ成分(以下、これをマグニチュードと呼ぶ)サンプルのうち最小のマグニチュードサンプル(以下、これを最小マグニチュードサンプルと呼ぶ)を選択して、これを利用して各周波数帯域毎に合成スペクトルF7(ω)に含まれる拡散性雑音成分を除去するようにしても良い。
この場合、最小マグニチュードサンプルを選択して、指向性信号の生成に用いた無指向性マイクロフォン対の出力信号の差分信号における各周波数スペクトルのマグニチュードサンプルとの間で、マグニチュード差分値を算出してこれを拡散性分離部の入力とし、マグニチュード差分値を用いて各周波数帯域毎に合成スペクトルF7(ω)に含まれる拡散性雑音成分を確実に除去することができる。
さらに、第2の実施の形態においては、複数の無指向性マイクロフォンで生成した複数の指向性信号を高速フーリエ変換し、これにより得られた各周波数スペクトルの最小マグニチュードサンプルを選択して、指向性信号の生成に用いた無指向性マイクロフォン対の出力信号の差分信号における各周波数スペクトルのマグニチュードサンプルとの間で、最小マグニチュードサンプル値の方が大きいときに、当該最小マグニチュードサンプル値を出力とし、それ以外は出力値を概略0として拡散性分離部の入力とするようにしても良い。
このような場合でも最小マグニチュードサンプル値及び概略0の出力値から、各周波数帯域毎に合成スペクトルF7(ω)に含まれる拡散性雑音成分を確実に除去することができる。
さらに、上述した実施の形態のうち任意に選択した実施の形態を組み合わせた音源分離装置を実現するようにしても良い。
例えば、第2の実施の形態による音源分離装置50においても、第3の実施の形態のように、無目的音状態のときに前部無指向性マイクロフォンMC5及び後部無指向性マイクロフォンMC6を無指向性として機能させ、このとき得られた受音信号に基づいて上記式(1)を用いMSCデータを生成し、その後、目的音受音状態で得られた受音信号に基づいてMSCデータを生成した後、これらMSCデータの差分でなる補正操作値としての差分MSCデータを得て拡散性雑音を除去するようにしても良い。
また、例えば、第2の実施の形態において、複数のMSCデータや差分MSCデータを同時に生成し、これらMSCデータや差分MSCデータのうち各周波数帯域毎に適宜最小値のものを選定し、これにより拡散性雑音を除去するようにしても良い。
すなわち、例えば閾値として所定周波数帯域を設定しておき、当該所定周波数帯域よりも高域の周波数帯域においては、差分MSC値を用いるとともに、当該所定周波数帯域よりも低い周波数帯域では、指向性を持たせたマイクロフォンMC5及びマイクロフォンMC6等によって生成したMSCデータm4を用い、これにより状況に応じた最適な拡張性雑音除去処理を行なうことができる。
さらに、上述した第2の実施の形態においては、マイクロフォンMC5及びマイクロフォンMC6と、マイクロフォンMC7及びマイクロフォンMC8とで2つの指向性マイクロフォンを構築するようにした場合について述べたが、本発明はこれに限らず、3つの第1〜第3マイクロフォンを設け、これら第1〜第3マイクロフォンによって2つの指向性マイクロフォンを構築するようにしても良い。
このように3つの第1〜第3マイクロフォンを用いる場合には、互いの位置関係が二等辺三角形や三角形の頂点の位置をなすように3つの第1〜第3マイクロフォンが配置され、これら第1〜第3マイクロフォンからそれぞれ出力される受音信号に対して適宜、遅延処理を施すことにより、第1マイクロフォン及び第2マイクロフォンにより指向性マイクロフォンを構築するとともに、第1マイクロフォン及び第3マイクロフォンにより他の指向性マイクロフォンを構築させるようにしても良く、この場合、拡散性雑音を除去できるという上述した効果と同様の効果を得ることができるとともに、マイクロフォン数を減らすことができ、一段と小型化を図ることができる。
さらに、この第2の実施の形態においては、目的音受音状態での受音信号から得られたMSC値と無目的音状態での受音信号から得られた無目的音MSC値の差分値と、MSC値の最大値である1と当該無目的音MSC値の差分値との比を求め、これを補正操作値としての差分MSC値として用いて各周波数帯域毎に合成スペクトルF7(ω)に含まれる拡散性雑音成分を除去するようにしても良い。
さらに、目的音受音状態での受音信号から得られたMSCデータと無目的音状態での受音信号から得られた無目的音MSCデータの差分MSC値を算出するとともに、当該差分MSC値と最大値である1及び無目的音MSC値の差分値の比とを算出し、これらを選択的に利用して拡散性雑音とその他の音を分離するようにしても良い。
実際上、この場合、複数の指向性マイクロフォンからの受音信号の組み合わせを基にMSC算出部で算出された複数のMSCデータと、目的音受音状態での受音信号から得られたMSCデータと無目的音状態での受音信号から得られた無目的音MSCデータの差分MSC値からなる差分MSCデータと、上述した差分値の比との中から少なくとも2個を選びだし、各周波数帯域毎の最小値を利用することにより拡散性雑音とその他の音を分離することができる。
さらに、上述した第1〜第4の実施の形態において、上述した例により複数個のMSCデータを算出し、これら複数のMSCデータの各周波数線形加算値により目的音と拡散性雑音とを分離するようにしても良い。このような場合には、複数個のMSCデータの各周波数線形加算値を用いて、MSCデータの重み付けすることで、各周波数帯域毎に合成スペクトルF7(ω)に対して最適な特性を与えて、各周波数帯域毎に合成スペクトルF7(ω)に含まれる拡散性雑音成分を確実に除去できる。
また、上述した第1〜第4の実施の形態においては、携帯電話機1や折り畳み式携帯電話機50,80,90内のHDDに予め格納された音源分離プログラムをCPUがRAM上に展開し、当該音源分離プログラムに従って音源分離処理を行なうようになされているが、本発明はこれに限らず、音源分離プログラムが格納されたプログラム格納媒体を用いて携帯電話機1や折り畳み式携帯電話機50,80,90にインストールすることにより上述の処理を行なうようにしても良い。
このように上述した一連の処理を実行するための音源分離プログラムをインストールして実行可能な状態にするためのプログラム格納媒体としては、例えばフロッピー(登録商標)ディスク、CD−ROM(Compact Disc-Read Only Memory )、DVD(Digital Versatile Disc )等のパッケージメディアのみならず、音源分離プログラムが一時的もしくは永続的に格納される半導体メモリや磁気ディスク等で実現しても良い。 またこれらプログラム格納媒体に音源分離プログラムを格納する手段としては、ローカルエリアネットワークやインターネット、ディジタル衛星放送等の有線及び無線通信媒体を利用しても良く、ルータやモデム等の各種通信インターフェースを介して格納するようにしても良い。特に半導体メモリや磁気ディスク等で実現した場合、インターネットを介してのデータのダウンロードによって不特定多数の顧客に対し販売を行なうビジネスモデルを構築できる。ダウンロードを行った顧客は、使用するPC(パーソナル・コンピュータ)やさらに転送した先の機器において、プログラムを使用し、音源分離を実行することができる。
さらに、上述した実施の形態においては、上述の処理を携帯電話機1や折り畳み式携帯電話機50,80,90に適用するようにした場合について述べたが、本発明はこれに限らず、PDA(Personal Data Assistant)等の小型通信端末や、ナビゲーションシステム等に搭載された音声認識装置、さらには補聴器等のような目的音と指向性雑音及び拡散性雑音とを分離する必要がある他の種々の装置に適用するようにしても良い。
第1の実施の形態による携帯電話機の外観構成を示す概略図である。 第1の実施の形態による本発明の音源分離装置の回路構成を示すブロック図である。 第1指向性制御部及び第2指向性制御部の詳細構成を示すブロック図である。 第1の実施の形態による第1指向性制御部及び第2指向性制御部で形成される単一指向性パターン及び双指向性パターンを示す概略図である。 MCS値と周波数帯域との関係を示すグラフである。 第2の実施の形態による折り畳み式携帯電話機の外観構成を示す概略図である。 第2の実施の形態による本発明の音源分離装置の回路構成を示すブロック図である。 第2の実施の形態による第1指向性制御部及び第2指向性制御部で形成される単一指向性パターン及び双指向性パターンを示す概略図である。 第3の実施の形態による本発明の音源分離装置の回路構成を示すブロック図である。 第4の実施の形態における折り畳み式携帯電話機に対する指向性マイクロフォンの配置を示す概略図である。 第4の実施の形態における指向性マイクロフォンの単一指向性パターン及び双指向性パターンの様子を示す概略図である。 第4の実施の形態における指向性マイクロフォンの他の配置を示す概略図である。 第4の実施の形態における他の配置位置での指向性マイクロフォンの単一指向性パターン及び双指向性パターンの様子を示す概略図である。
符号の説明
10、54、70 音源分離装置
41 MSC算出部(算出手段)
43 拡散性雑音分離部(分離手段)
MC1、MC3 前部無指向性マイクロフォン
MC2、MC4 後部無指向性マイクロフォン
MC5、MC6、MC7、MC8 無指向性マイクロフォン
MC10、MC11、MC13、MC14 指向性マイクロフォン

Claims (26)

  1. 所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離装置において、
    間隔を置いて配置され、所定位置での目的音方向とヌル方向とを異ならせ、前記目
    的音方向を軸として回転させたときに指向特性が同一である複数の指向性マイクロフォン
    と、
    前記指向性マイクロフォンから出力された受音信号に基づいてクロスパワースペクトル
    強度値を算出する算出手段と、
    前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメ
    ータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する拡散性雑音分離手段とを備えた音源分離装置であって、
    前記指向性マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号とを入力として、前記算出手段によってそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて
    前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを前記拡散性雑音分離手段の入力とすることを特徴とする音源分離装置。
  2. 所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離装置において、
    間隔を置いて配置された、指向特性の最大感度方向に目的音を配置し、かつ指向特性の
    最大感度軸が概略マイクロフォンを結ぶ軸と同一である複数の指向性マイクロフォンと、
    前記指向性マイクロフォンから出力された受音信号に基づいてクロスパワースペクトル
    強度値を算出する算出手段と、
    前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメ
    ータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する拡散性雑音分離手段とを備えた音源分離装置であって、
    前記指向性マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号とを入力として、前記算出手段によってそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて
    前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを前記拡散性雑音分離手段の入力とすることを特徴とする音源分離装置。
  3. 前記解析パラメータが二乗コヒーレンス値であることを特徴とする請求項1又は2記載の音源分離装置。
  4. 前記指向性マイクロフォンの指向特性が1次差分特性であることを特徴とする請求項1〜3のうちいずれか1項記載の音源分離装置。
  5. 前記指向性マイクロフォンの指向特性がカージオイド特性であることを特徴とする請求項4の音源分離装置。
  6. 前記指向性マイクロフォンの指向特性のヌル方向が目的音方向と直角をなすことを特徴とする請求項1〜5のうちいずれか1項記載の音源分離装置。
  7. 前記クロスパワースペクトル強度値を算出する前記指向性マイクロフォン対の指向特性が互いに逆方向であることを特徴とする請求項1〜6のうちいずれか1項記載の音源分離装置。
  8. 前記指向性マイクロフォンの配置位置が携帯機器の端面であることを特徴とする請求項1〜7のうちいずれか1項記載の音源分離装置。
  9. 前記指向性マイクロフォン配置が携帯機器の正面及び背面であることを特徴とする請求項1〜7のうちいずれか1項記載の音源分離装置。
  10. 前記複数の解析パラメータの補正操作値が、前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と、前記無目的音状態での受音信号から得られた二乗コヒーレンス値との差分値であることを特徴とする請求項1〜9のうちいずれか1項記載の音源分離装置。
  11. 前記複数の解析パラメータの補正操作値が、
    前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態
    での受音信号から得られた二乗コヒーレンス値の差分値と、
    最大値である1と前記無目的音状態での受音信号から得られた二乗コヒーレンス値の差
    分値の比であることを特徴とする請求項1〜9のうちいずれか1項記載の音源分離装置。
  12. 前記拡散性雑音分離手段は、
    前記受音信号の周波数成分に関する前記複数の指向性マイクロフォンの組み合わせから
    前記算出手段で算出された複数の解析パラメータと、
    目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音
    信号から得られた二乗コヒーレンス値の差分値と、
    前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態
    での受音信号から得られた二乗コヒーレンス値の差分値と、最大値である1と前記無目的
    音状態での受音信号から得られた二乗コヒーレンス値の差分値の比との中から少なくとも2個の前記解析パラメータもしくは該解析パラメータの補正操作値を選びだし、各周波数帯域毎の最小値及び線形結合値のうち少なくとも一方により前記拡散性雑音とその他の音を分離することを特徴とする請求項1〜9のうちいずれか1項記載の音源分離装置。
  13. 所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離方法において、
    間隔を置いて配置され、所定位置での目的音方向とヌル方向とを異ならせ、前記目的
    音方向を軸として回転させたときに指向特性が同一である複数の指向性マイクロフォンを
    用い、前記指向性マイクロフォンから出力された受音信号に基づいて、クロスパワースペ
    クトル強度値を算出し、
    前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する音源分離方法であって、
    記マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号のそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて
    前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを用いて前記拡散性雑音とその他の音を分離することを特徴とする音源分離方法。
  14. 所定方向から到来する目的音と、前記所定方向以外の方向から到来する指向性雑音及び周囲一様から到来する拡散性雑音とを分離する音源分離方法において、
    間隔を置いて配置された、指向特性の最大感度方向に目的音を配置し、かつ指向特性の
    最大感度軸が概略マイクロフォンを結ぶ軸と同一である複数の指向性マイクロフォンを用
    い、前記指向性マイクロフォンから出力された受音信号に基づいて、クロスパワースペク
    トル強度値を算出し、
    前記クロスパワースペクトル強度値に基づいて前記受音信号の周波数成分の解析パラメ
    ータを算出して、前記解析パラメータにより、前記拡散性雑音とその他の音を分離する源分離方法であって、
    記マイクロフォンから出力された目的音受音状態での受音信号と、無目的音状態での受音信号のそれぞれの入力に対応して得られた複数の前記解析パラメータの補正操作値を用いて
    前記複数の指向性マイクロフォンから出力された受音信号の各周波数スペクトルの最小マグニチュードサンプルを選択して、前記最小マグニチュードサンプルを用いて前記拡散性雑音とその他の音を分離することを特徴とする音源分離方法。
  15. 前記解析パラメータが二乗コヒーレンス値であることを特徴とする請求項13又は14の音源分離方法。
  16. 前記指向性マイクロフォンの指向特性が1次差分特性であることを特徴とする請求項1315のうちいずれか1項記載の音源分離方法。
  17. 前記指向性マイクロフォンの指向特性がカージオイド特性であることを特徴とする請求項16の音源分離方法。
  18. 前記指向性マイクロフォンの指向特性のヌル方向が前記目的音方向と直角をなすことを特徴とする請求項1317のうちいずれか1項記載の音源分離方法。
  19. 前記クロスパワースペクトル強度値を算出する前記指向性マイクロフォン対の指向特性が、互いに逆方向であることを特徴とする請求項1318のうちいずれか1項記載の音源分離方法。
  20. 前記指向性マイクロフォンの配置位置が携帯機器の端面であることを特徴とする請求項1319のうちいずれか1項記載の音源分離方法。
  21. 前記指向性マイクロフォンの配置が携帯機器表面及び背面であることを特徴とする請求項1319のうちいずれか1項記載の音源分離方法。
  22. 前記複数の解析パラメータの補正操作値が、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値であることを特徴とする請求項1321記載の音源分離方法。
  23. 前記複数の解析パラメータの補正操作値が、目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値と、最大値である1と無目的音状態での受音信号から得られた二乗コヒーレンス値の差分値の比であることを特徴とする請求項1321記載の音源分離方法。
  24. 前記受音信号の周波数成分に関する複数のマイクロフォンの組み合わせから得られる複数の解析パラメータを算出して、前記複数の解析パラメータと、
    目的音受音状態での受音信号から得られた二乗コヒーレンス値と無目的音状態での受音
    信号から得られた二乗コヒーレンス値の差分値と、
    前記目的音受音状態での受音信号から得られた二乗コヒーレンス値と前記無目的音状態
    での受音信号から得られた二乗コヒーレンス値の差分値と、値1と前記無目的音状態での
    受音信号から得られた二乗コヒーレンス値の差分値の比との中から、少なくとも2個の前記解析パラメータもしくは該解析パラメータの補正操作値を選びだし、各周波数帯域毎の最小値及び線形結合値のうち少なくとも一方により前記拡散性雑音とその他の音を分離することを特徴とする請求項1321のうちいずれか1項記載の音源分離方法。
  25. 請求項1324のうちいずれか1項記載の音源分離方法をコンピュータに実行させるための音源分離プログラム。
  26. 請求項1324のうちいずれか1項記載の音源分離方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2006311718A 2006-11-17 2006-11-17 音源分離装置、音源分離方法、音源分離プログラム及び記録媒体 Expired - Fee Related JP5190859B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006311718A JP5190859B2 (ja) 2006-11-17 2006-11-17 音源分離装置、音源分離方法、音源分離プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006311718A JP5190859B2 (ja) 2006-11-17 2006-11-17 音源分離装置、音源分離方法、音源分離プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2008131183A JP2008131183A (ja) 2008-06-05
JP5190859B2 true JP5190859B2 (ja) 2013-04-24

Family

ID=39556631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006311718A Expired - Fee Related JP5190859B2 (ja) 2006-11-17 2006-11-17 音源分離装置、音源分離方法、音源分離プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP5190859B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012238964A (ja) * 2011-05-10 2012-12-06 Funai Electric Co Ltd 音分離装置、及び、それを備えたカメラユニット
JP5849758B2 (ja) * 2012-02-20 2016-02-03 株式会社Jvcケンウッド 通信装置、状態通知方法
JP2014017645A (ja) * 2012-07-09 2014-01-30 Sony Corp 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
GB2521649B (en) * 2013-12-27 2018-12-12 Nokia Technologies Oy Method, apparatus, computer program code and storage medium for processing audio signals
JP7040198B2 (ja) * 2018-03-23 2022-03-23 沖電気工業株式会社 収音装置、プログラム及び方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3285533B2 (ja) * 1998-04-01 2002-05-27 三菱電機株式会社 可変指向性マイクロホンシステムを用いた音響装置
JP2000197180A (ja) * 1998-12-25 2000-07-14 Victor Co Of Japan Ltd マイクロホン装置における指向性制御装置
JP3484112B2 (ja) * 1999-09-27 2004-01-06 株式会社東芝 雑音成分抑圧処理装置および雑音成分抑圧処理方法
JP4286637B2 (ja) * 2002-11-18 2009-07-01 パナソニック株式会社 マイクロホン装置および再生装置
JP4247037B2 (ja) * 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
JP4873913B2 (ja) * 2004-12-17 2012-02-08 学校法人早稲田大学 音源分離システムおよび音源分離方法、並びに音響信号取得装置

Also Published As

Publication number Publication date
JP2008131183A (ja) 2008-06-05

Similar Documents

Publication Publication Date Title
KR101812862B1 (ko) 오디오 장치
JP6023779B2 (ja) オーディオ情報処理の方法及び装置
US8213633B2 (en) Sound source separation system, sound source separation method, and acoustic signal acquisition device
CN103004233B (zh) 基于两个或更多宽带麦克风信号生成修改宽带音频信号的电子设备
KR101456866B1 (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
EP3189521B1 (en) Method and apparatus for enhancing sound sources
KR20140089580A (ko) 근거리 널 및 빔 형성
JP5190859B2 (ja) 音源分離装置、音源分離方法、音源分離プログラム及び記録媒体
JP2007129373A (ja) マイクロフォン感度調整方法およびそのシステム
US11330368B2 (en) Portable microphone array apparatus and system and processing method
JP7067146B2 (ja) 収音装置、プログラム及び方法
WO2011099167A1 (en) Sound pickup apparatus, portable communication apparatus, and image pickup apparatus
CN113889135A (zh) 一种估计声源波达方向的方法、电子设备及芯片系统
JP2019068133A (ja) 収音装置、プログラム及び方法
CN110010117B (zh) 一种语音主动降噪的方法及装置
US20090034753A1 (en) Direction detection apparatus, direction detection method and direction detection program, and direction control apparatus, direction control method, and direction control program
JP5105336B2 (ja) 音源分離装置、プログラム及び方法
JP7176316B2 (ja) 収音装置、プログラム及び方法
WO2022140737A1 (en) Spatial audio wind noise detection
JP7067173B2 (ja) 収音装置、プログラム及び方法
WO2021070278A1 (ja) 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム
JP6973224B2 (ja) 収音装置、プログラム及び方法
JP2005236407A (ja) 音響処理装置、音響処理方法および製造方法
JP7176291B2 (ja) 収音装置、プログラム及び方法
WO2023065317A1 (zh) 会议终端及回声消除方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130123

R150 Certificate of patent or registration of utility model

Ref document number: 5190859

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160208

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees