JP2013201525A

JP2013201525A - ビームフォーミング処理装置

Info

Publication number: JP2013201525A
Application number: JP2012067567A
Authority: JP
Inventors: Tomoharu Awano; 智治粟野; Atsuhito Yano; 敦仁矢野; Takashi Mikami; 崇志三上; Atsushi Hotta; 厚堀田
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2012-03-23
Filing date: 2012-03-23
Publication date: 2013-10-03

Abstract

【課題】従来のビームフォーミング処理は、話者から各マイクへの伝達特性によるステアリングベクトルを用い、音声を歪ませず雑音を抑圧し、高いSN比の収音を可能にするが、車種による運転席位置の違いで伝達特性が異なるため車種毎にステアリングベクトルを測定、保持する必要があり車種数によってはデータ量が膨大で、記憶媒体のコストが嵩む。
【解決手段】音声信号を収音する複数のマイクと、複数のマイク夫々と話者との角度情報と、複数のマイク夫々と話者との距離情報及び複数のマイク夫々の指向性と感度を予め測定し得られるマイク特性データを用いてステアリングベクトルを算出するステアリングベクトル算出部と、複数のマイクからの音声信号とステアリングベクトル算出部からのステアリングベクトルを用いてビームフォーミング処理を行うビームフォーミング処理部を備える。
【選択図】図４

Description

この発明は、複数のマイクロフォン（以下マイクと称す）を用いて雑音を抑制した目的音を取得するためのビームフォーミング処理装置に関する。

マイクを二つ以上用いて信号対雑音比（SN比）の高い音声を収音する技術としてビームフォーミングがある。ビームフォーミングとは複数のマイクで観測された音声信号の位相差を利用して、雑音を抑圧しながら音声を強調する技術であり、例えば背景雑音が大きい中で行う音声認識処理や、車室内ハンズフリー通話など様々な場面で使われている。
ビームフォーミングの代表例としては最小分散無歪み（MVDR：Minimum Variance Distortionless Response）法（以下MVDR法と称す）がある。この方法は、マイクからの話者方向を表すステアリングベクトルを用いて、話者の音声信号を歪ませることなく、周囲雑音を抑圧し、結果として高いSN比の収音を可能にするアルゴリズムである（非特許文献１）。このステアリングベクトルは、一般的に、話者から各マイクへの伝達特性を測定したものを使用する。

浅野太「音のアレイ信号処理-音源の定位・追跡と分離」4．5章、p86-87 コロナ社

例えば、車室内ハンズフリー通話において、車種によって運転席の位置が違うことで、話者からマイクへの伝達特性が異なることがあり、それぞれの車種毎にステアリングベクトルを測定し、データとして保持することが考えられる。しかし、車種の数によってはそのデータ量は膨大となり、記憶媒体のコストが高くなるという課題がある。
この発明は、前記課題を解決するためのもので、ステアリングベクトルを計算により求めることで記憶媒体に掛かるコストを減じたビームフォーミング処理装置を提供することを目的としている。

この発明に係るビームフォーミング処理装置は、
話者の音声信号を収音する複数のマイクと、
前記複数のマイクそれぞれと話者との角度情報と、前記複数のマイクのそれぞれと話者との距離情報および前記複数のマイクそれぞれの指向性と感度を予め測定することで得られるマイク特性データとを用いてステアリングベクトルを算出するステアリングベクトル算出部と、
前記複数のマイクからの収音音声信号とステアリングベクトル算出部より得られるステアリングベクトルを用いてビームフォーミング処理を行うビームフォーミング処理部とを備える。

この発明に係るビームフォーミング処理装置によれば、
マイクと話者との角度情報、マイクと話者間の距離情報、マイクの指向性と感度のマイク特性によりステアリングベクトルを算出し、このステアリングベクトルを用い、前記複数のマイクからの収音音声信号とによりビームフォーミング処理を行うので、話者位置によらずにビームフォーミング処理を行うことができる構成になっており、話者位置に対応したステアリングベクトルを複数保持する必要がなく、記憶媒体のコストを下げられる効果がある。

この発明の実施の形態１の基本構成を表す図である。ステアリングベクトル算出用の角度情報と距離情報の説明図である。基準ステアリングベクトルについての説明図である。この発明の実施の形態２の基本構成を表す図である。。

実施の形態１．
図１はこの発明の実施の形態１による基本構成を表す図である。図１に示すようにビームフォーミング装置100は、二つ以上のマイク101、ビームフォーミング処理部102、ステアリングベクトル生成部103で構成される。ステアリングベクトル生成部103は、複数のマイクそれぞれと話者との基準線に対する角度情報104、複数のマイクそれぞれと話者との間の距離情報105、基準線上の任意の基準位置から複数のマイクそれぞれへのステアリングベクトルを事前に測定して基準ステアリングベクトルとする基準ステアリングベクトル106、前記複数のマイクロフォンそれぞれの指向性と感度を予め測定することで得られるマイク特性データ107を入力とするステアリングベクトル算出部108で構成される。

ステアリングベクトル生成部103ではステアリングベクトルを空間伝達特性（後述）とマイク特性を用いて算出する構成になっており、ステアリングベクトルの導出には角度情報104、距離情報105、基準ステアリングベクトル106、マイク特性107を用いる。

実施の形態１に係るビームフォーミング処理装置100について詳細な説明を行う。
マイク101はM個のマイクの集まりであり、それぞれのマイクで観測される観測信号がビームフォーミング処理部102に入力される。ビームフォーミング処理部102の動作は、ビームフォーミングの一例としてMVDR法を用いて説明する。

以降の説明においては、信号およびフィルタ係数を周波数領域で表現することにする。マイク数がM個の構成において、ビームフォーミングの出力をＹ(ω)，Ｍ個のマイクのうち、任意のマイクｍで観測される信号をＺ_ｍ(ω)、マイクｍに関するビームフォーミングのフィルタ係数をＷ_ｍ(ω)とすると、ビームフォーミング処理部102によるビームフォーミングの出力Ｙ(ω)は(式1)、(式2)、(式3)で表現できる。

ただし、記号Hはエルミート共役を示す。ここで、マイクｍから話者への伝達特性をＡ_ｍ(ω)、マイクｍからの観測信号の振幅項をａ_ｍ、入力信号間の遅延時間をτ_ｍとした場合、ステアリングベクトルａ(ω)は(式4)で表現できる。

MVDR法のフィルタ係数Ｗ_ＭＶ(ω)の更新式は(式5)の通りである。

ただし、Ｒ(ω) はマイク入力信号間の相互相関行列であり、(式6)のように定義される。

相互相関行列Ｒ(ω) を逐次更新し、フィルタ係数Ｗ_ＭＶ(ω) を求めることで雑音音源に死角を向けたビームフォーミングを得ることができる。（非特許文献１）

ステアリングベクトル生成部103について説明する。ステアリングベクトルは話者からマイクへの伝達特性（空間伝達特性と呼ぶ）とマイク特性の積として表すことができる。その特徴を利用して、ステアリングベクトル生成部103は角度情報104、距離情報105、基準ステアリングベクトル106を用いて空間伝達関数を算出し、マイク特性107との積を計算することによりステアリングベクトルを算出する。
空間伝達関数は周波数領域での話者からマイクｍへの空間伝達特性をＨ_ｍ(ω)とし、さらに各マイクから話者への空間伝達特性をベクトルの要素とする空間伝達特性ベクトルｈ(ω)とすると、(式7)で表現できる。

角度情報104、距離情報105について図２を用いて説明を行う。任意の基準線に対するマイクｍと話者を結ぶ直線との角度をθ_mとし、角度情報 θ＝{θ_１，θ_２，・・・，θ_Ｍ} を定義する。同様に、マイクmと話者との距離をＬ_ｍとし、距離情報Ｌ＝{Ｌ_１，Ｌ_２，・・・，Ｌ_Ｍ} を定義する。ステアリングベクトル生成部103は上記角度情報、距離情報を事前に測定し、データとして保持する。
また、基準ステアリングベクトル106については図３に示した基準ステアリングベクトルを測定する基準位置に基づき、マイクと任意の基準位置へのステアリングベクトルを事前に測定し、データとして保持しておく。

マイク特性107に関しても基準ステアリングベクトルと同様、事前に測定を行い、データとして保持しておく。マイク特性はマイクの指向性と感度を情報として持っており、マイク特性をMIC_ｍ(ω)、各マイクのマイク特性をベクトルの要素とするマイク特性ベクトルを mic(ω) と定義した場合、(式9)のように表現できる。

ステアリングベクトル算出部108でのステアリングベクトルの具体的な算出方法について説明を行う。

空間伝達関数の比Ｈ_ｍ(ω)/ Ｈ_１(ω) の算出方法は、例えば(式13)のように算出される。ここでｃは音速を表す。

以上の方法により、ステアリングベクトル生成部103はステアリングベクトルを算出し、算出結果であるステアリングベクトルをビームフォーミング処理部102に渡し、ビームフォーミング処理部102はマイク101の観測信号を用いて、ビームフォーミング処理を行う。ビームフォーミング処理部102ではMVDR法を例として説明を行ったが、ステアリングベクトルを用いるビームフォーミング処理であれば他の方法（例えば遅延和法）を用いてもよい。
なお、角度情報104、距離情報105、基準ステアリングベクトル106、マイク特性107については測定が必要であるが、角度情報、距離情報の測定については分度器、定規などを用いて簡易に測定することが可能であり、また、基準ステアリングベクトル、マイク特性のデータ量に関しては、ステアリングベクトルを数種類保持することと比較すれば、小さいデータ領域を使用するにとどめることが可能である。

以上がビームフォーミング処理装置100の説明である。
ビームフォーミング処理装置100は、角度情報、距離情報、基準ステアリングベクトル、マイク特性のみを記憶媒体に保持しておけば、話者位置によらずにビームフォーミング処理を行うことができる構成になっているので、話者位置に対応したステアリングベクトルを複数保持する必要がなく、結果として記憶媒体のコストを下げられる効果がある。

実施の形態２．
実施の形態１において基準ステアリングベクトルを用いることなくステアリングベクトルを算出することも可能であり、基準ステアリングベクトルを必要としないため、実施の形態１に加えてさらに記憶媒体のコストを下げることができる。

図４に実施の形態２の基本構成を表す。ビームフォーミング装置200は、二つ以上のマイク101、ビームフォーミング処理部102、ステアリングベクトル生成部201で構成される。ステアリングベクトル生成部201は角度情報104、距離情報105、マイク特性107を入力とするステアリングベクトル算出部202で構成される。
ステアリングベクトル算出部202について説明する。

伝達関数の比Ｈ_ｍ(ω)/ Ｈ_１(ω) の算出方法は(式13)と同様であり、(式15)のように算出される。

以上の構成にすることにより、実施の形態１と比較して、基準ステアリングベクトルを必要としないので、さらに記憶媒体のコストを下げられる効果がある。

この発明によるビームフォーミング処理装置は、音声認識によるカーナビゲータへの適用が可能である。

100；ビームフォーミング装置、101；マイク、102；ビームフォーミング処理部、103；ステアリングベクトル生成部、104；角度情報、105；距離情報、106；基準ステアリングベクトル、107；マイク特性データ、108；ステアリングベクトル算出部。

Claims

話者の音声信号を収音する複数のマイクロフォンと、
前記複数のマイクロフォンのそれぞれと話者との角度情報と、前記複数のマイクロフォンのそれぞれと話者との距離情報および前記複数のマイクロフォンそれぞれの指向性と感度を予め測定することで得られるマイク特性データを用いてステアリングベクトルを算出するステアリングベクトル算出部と、
前記複数のマイクロフォンからの収音音声信号とステアリングベクトル算出部より得られるステアリングベクトルを用いてビームフォーミング処理を行うビームフォーミング処理部とを備えることを特徴とするビームフォーミング処理装置。
前記ステアリングベクトル算出部はステアリングベクトル算出に用いる情報に、任意に定めた基準位置からマイクロフォンへの基準ステアリングベクトルデータをさらに追加することを特徴とする請求項１記載のビームフォーミング処理装置。