JP2013201525A - ビームフォーミング処理装置 - Google Patents
ビームフォーミング処理装置 Download PDFInfo
- Publication number
- JP2013201525A JP2013201525A JP2012067567A JP2012067567A JP2013201525A JP 2013201525 A JP2013201525 A JP 2013201525A JP 2012067567 A JP2012067567 A JP 2012067567A JP 2012067567 A JP2012067567 A JP 2012067567A JP 2013201525 A JP2013201525 A JP 2013201525A
- Authority
- JP
- Japan
- Prior art keywords
- steering vector
- microphones
- beam forming
- microphone
- forming processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
【課題】従来のビームフォーミング処理は、話者から各マイクへの伝達特性によるステアリングベクトルを用い、音声を歪ませず雑音を抑圧し、高いSN比の収音を可能にするが、車種による運転席位置の違いで伝達特性が異なるため車種毎にステアリングベクトルを測定、保持する必要があり車種数によってはデータ量が膨大で、記憶媒体のコストが嵩む。
【解決手段】音声信号を収音する複数のマイクと、複数のマイク夫々と話者との角度情報と、複数のマイク夫々と話者との距離情報及び複数のマイク夫々の指向性と感度を予め測定し得られるマイク特性データを用いてステアリングベクトルを算出するステアリングベクトル算出部と、複数のマイクからの音声信号とステアリングベクトル算出部からのステアリングベクトルを用いてビームフォーミング処理を行うビームフォーミング処理部を備える。
【選択図】図4
【解決手段】音声信号を収音する複数のマイクと、複数のマイク夫々と話者との角度情報と、複数のマイク夫々と話者との距離情報及び複数のマイク夫々の指向性と感度を予め測定し得られるマイク特性データを用いてステアリングベクトルを算出するステアリングベクトル算出部と、複数のマイクからの音声信号とステアリングベクトル算出部からのステアリングベクトルを用いてビームフォーミング処理を行うビームフォーミング処理部を備える。
【選択図】図4
Description
この発明は、複数のマイクロフォン(以下マイクと称す)を用いて雑音を抑制した目的音を取得するためのビームフォーミング処理装置に関する。
マイクを二つ以上用いて信号対雑音比(SN比)の高い音声を収音する技術としてビームフォーミングがある。ビームフォーミングとは複数のマイクで観測された音声信号の位相差を利用して、雑音を抑圧しながら音声を強調する技術であり、例えば背景雑音が大きい中で行う音声認識処理や、車室内ハンズフリー通話など様々な場面で使われている。
ビームフォーミングの代表例としては最小分散無歪み(MVDR:Minimum Variance Distortionless Response)法(以下MVDR法と称す)がある。この方法は、マイクからの話者方向を表すステアリングベクトルを用いて、話者の音声信号を歪ませることなく、周囲雑音を抑圧し、結果として高いSN比の収音を可能にするアルゴリズムである(非特許文献1)。このステアリングベクトルは、一般的に、話者から各マイクへの伝達特性を測定したものを使用する。
ビームフォーミングの代表例としては最小分散無歪み(MVDR:Minimum Variance Distortionless Response)法(以下MVDR法と称す)がある。この方法は、マイクからの話者方向を表すステアリングベクトルを用いて、話者の音声信号を歪ませることなく、周囲雑音を抑圧し、結果として高いSN比の収音を可能にするアルゴリズムである(非特許文献1)。このステアリングベクトルは、一般的に、話者から各マイクへの伝達特性を測定したものを使用する。
浅野太 「音のアレイ信号処理-音源の定位・追跡と分離」4.5章、p86-87 コロナ社
例えば、車室内ハンズフリー通話において、車種によって運転席の位置が違うことで、話者からマイクへの伝達特性が異なることがあり、それぞれの車種毎にステアリングベクトルを測定し、データとして保持することが考えられる。しかし、車種の数によってはそのデータ量は膨大となり、記憶媒体のコストが高くなるという課題がある。
この発明は、前記課題を解決するためのもので、ステアリングベクトルを計算により求めることで記憶媒体に掛かるコストを減じたビームフォーミング処理装置を提供することを目的としている。
この発明は、前記課題を解決するためのもので、ステアリングベクトルを計算により求めることで記憶媒体に掛かるコストを減じたビームフォーミング処理装置を提供することを目的としている。
この発明に係るビームフォーミング処理装置は、
話者の音声信号を収音する複数のマイクと、
前記複数のマイクそれぞれと話者との角度情報と、前記複数のマイクのそれぞれと話者との距離情報および前記複数のマイクそれぞれの指向性と感度を予め測定することで得られるマイク特性データとを用いてステアリングベクトルを算出するステアリングベクトル算出部と、
前記複数のマイクからの収音音声信号とステアリングベクトル算出部より得られるステアリングベクトルを用いてビームフォーミング処理を行うビームフォーミング処理部とを備える。
話者の音声信号を収音する複数のマイクと、
前記複数のマイクそれぞれと話者との角度情報と、前記複数のマイクのそれぞれと話者との距離情報および前記複数のマイクそれぞれの指向性と感度を予め測定することで得られるマイク特性データとを用いてステアリングベクトルを算出するステアリングベクトル算出部と、
前記複数のマイクからの収音音声信号とステアリングベクトル算出部より得られるステアリングベクトルを用いてビームフォーミング処理を行うビームフォーミング処理部とを備える。
この発明に係るビームフォーミング処理装置によれば、
マイクと話者との角度情報、マイクと話者間の距離情報、マイクの指向性と感度のマイク特性によりステアリングベクトルを算出し、このステアリングベクトルを用い、前記複数のマイクからの収音音声信号とによりビームフォーミング処理を行うので、話者位置によらずにビームフォーミング処理を行うことができる構成になっており、話者位置に対応したステアリングベクトルを複数保持する必要がなく、記憶媒体のコストを下げられる効果がある。
マイクと話者との角度情報、マイクと話者間の距離情報、マイクの指向性と感度のマイク特性によりステアリングベクトルを算出し、このステアリングベクトルを用い、前記複数のマイクからの収音音声信号とによりビームフォーミング処理を行うので、話者位置によらずにビームフォーミング処理を行うことができる構成になっており、話者位置に対応したステアリングベクトルを複数保持する必要がなく、記憶媒体のコストを下げられる効果がある。
実施の形態1.
図1はこの発明の実施の形態1による基本構成を表す図である。図1に示すようにビームフォーミング装置100は、二つ以上のマイク101、ビームフォーミング処理部102、ステアリングベクトル生成部103で構成される。ステアリングベクトル生成部103は、複数のマイクそれぞれと話者との基準線に対する角度情報104、複数のマイクそれぞれと話者との間の距離情報105、基準線上の任意の基準位置から複数のマイクそれぞれへのステアリングベクトルを事前に測定して基準ステアリングベクトルとする基準ステアリングベクトル106、前記複数のマイクロフォンそれぞれの指向性と感度を予め測定することで得られるマイク特性データ107を入力とするステアリングベクトル算出部108で構成される。
図1はこの発明の実施の形態1による基本構成を表す図である。図1に示すようにビームフォーミング装置100は、二つ以上のマイク101、ビームフォーミング処理部102、ステアリングベクトル生成部103で構成される。ステアリングベクトル生成部103は、複数のマイクそれぞれと話者との基準線に対する角度情報104、複数のマイクそれぞれと話者との間の距離情報105、基準線上の任意の基準位置から複数のマイクそれぞれへのステアリングベクトルを事前に測定して基準ステアリングベクトルとする基準ステアリングベクトル106、前記複数のマイクロフォンそれぞれの指向性と感度を予め測定することで得られるマイク特性データ107を入力とするステアリングベクトル算出部108で構成される。
ステアリングベクトル生成部103ではステアリングベクトルを空間伝達特性(後述)とマイク特性を用いて算出する構成になっており、ステアリングベクトルの導出には角度情報104、距離情報105、基準ステアリングベクトル106、マイク特性107を用いる。
実施の形態1に係るビームフォーミング処理装置100について詳細な説明を行う。
マイク101はM個のマイクの集まりであり、それぞれのマイクで観測される観測信号がビームフォーミング処理部102に入力される。ビームフォーミング処理部102の動作は、ビームフォーミングの一例としてMVDR法を用いて説明する。
マイク101はM個のマイクの集まりであり、それぞれのマイクで観測される観測信号がビームフォーミング処理部102に入力される。ビームフォーミング処理部102の動作は、ビームフォーミングの一例としてMVDR法を用いて説明する。
以降の説明においては、信号およびフィルタ係数を周波数領域で表現することにする。マイク数がM個の構成において、ビームフォーミングの出力をY(ω),M個のマイクのうち、任意のマイクmで観測される信号をZm(ω)、マイクmに関するビームフォーミングのフィルタ係数をWm(ω)とすると、ビームフォーミング処理部102によるビームフォーミングの出力Y(ω)は(式1)、(式2)、(式3)で表現できる。
ただし、記号Hはエルミート共役を示す。ここで、マイクmから話者への伝達特性をAm(ω)、マイクmからの観測信号の振幅項をam、入力信号間の遅延時間をτmとした場合、ステアリングベクトルa(ω)は(式4)で表現できる。
MVDR法のフィルタ係数 WMV(ω)の更新式は(式5)の通りである。
ただし、R(ω) はマイク入力信号間の相互相関行列であり、(式6)のように定義される。
相互相関行列 R(ω) を逐次更新し、フィルタ係数 WMV(ω) を求めることで雑音音源に死角を向けたビームフォーミングを得ることができる。(非特許文献1)
ステアリングベクトル生成部103について説明する。ステアリングベクトルは話者からマイクへの伝達特性(空間伝達特性と呼ぶ)とマイク特性の積として表すことができる。その特徴を利用して、ステアリングベクトル生成部103は角度情報104、距離情報105、基準ステアリングベクトル106を用いて空間伝達関数を算出し、マイク特性107との積を計算することによりステアリングベクトルを算出する。
空間伝達関数は周波数領域での話者からマイクmへの空間伝達特性をHm(ω)とし、さらに各マイクから話者への空間伝達特性をベクトルの要素とする空間伝達特性ベクトルh(ω)とすると、(式7)で表現できる。
空間伝達関数は周波数領域での話者からマイクmへの空間伝達特性をHm(ω)とし、さらに各マイクから話者への空間伝達特性をベクトルの要素とする空間伝達特性ベクトルh(ω)とすると、(式7)で表現できる。
角度情報104、距離情報105について図2を用いて説明を行う。任意の基準線に対するマイクmと話者を結ぶ直線との角度をθmとし、角度情報 θ={θ1,θ2,・・・,θM} を定義する。同様に、マイクmと話者との距離を Lm とし、距離情報 L={L1,L2,・・・,LM} を定義する。ステアリングベクトル生成部103は上記角度情報、距離情報を事前に測定し、データとして保持する。
また、基準ステアリングベクトル106については図3に示した基準ステアリングベクトルを測定する基準位置に基づき、マイクと任意の基準位置へのステアリングベクトルを事前に測定し、データとして保持しておく。
また、基準ステアリングベクトル106については図3に示した基準ステアリングベクトルを測定する基準位置に基づき、マイクと任意の基準位置へのステアリングベクトルを事前に測定し、データとして保持しておく。
マイク特性107に関しても基準ステアリングベクトルと同様、事前に測定を行い、データとして保持しておく。マイク特性はマイクの指向性と感度を情報として持っており、マイク特性をMICm(ω)、各マイクのマイク特性をベクトルの要素とするマイク特性ベクトルを mic(ω) と定義した場合、(式9)のように表現できる。
ステアリングベクトル算出部108でのステアリングベクトルの具体的な算出方法について説明を行う。
空間伝達関数の比 Hm(ω)/ H1(ω) の算出方法は、例えば(式13)のように算出される。ここでcは音速を表す。
以上の方法により、ステアリングベクトル生成部103はステアリングベクトルを算出し、算出結果であるステアリングベクトルをビームフォーミング処理部102に渡し、ビームフォーミング処理部102はマイク101の観測信号を用いて、ビームフォーミング処理を行う。ビームフォーミング処理部102ではMVDR法を例として説明を行ったが、ステアリングベクトルを用いるビームフォーミング処理であれば他の方法(例えば遅延和法)を用いてもよい。
なお、角度情報104、距離情報105、基準ステアリングベクトル106、マイク特性107については測定が必要であるが、角度情報、距離情報の測定については分度器、定規などを用いて簡易に測定することが可能であり、また、基準ステアリングベクトル、マイク特性のデータ量に関しては、ステアリングベクトルを数種類保持することと比較すれば、小さいデータ領域を使用するにとどめることが可能である。
なお、角度情報104、距離情報105、基準ステアリングベクトル106、マイク特性107については測定が必要であるが、角度情報、距離情報の測定については分度器、定規などを用いて簡易に測定することが可能であり、また、基準ステアリングベクトル、マイク特性のデータ量に関しては、ステアリングベクトルを数種類保持することと比較すれば、小さいデータ領域を使用するにとどめることが可能である。
以上がビームフォーミング処理装置100の説明である。
ビームフォーミング処理装置100は、角度情報、距離情報、基準ステアリングベクトル、マイク特性のみを記憶媒体に保持しておけば、話者位置によらずにビームフォーミング処理を行うことができる構成になっているので、話者位置に対応したステアリングベクトルを複数保持する必要がなく、結果として記憶媒体のコストを下げられる効果がある。
ビームフォーミング処理装置100は、角度情報、距離情報、基準ステアリングベクトル、マイク特性のみを記憶媒体に保持しておけば、話者位置によらずにビームフォーミング処理を行うことができる構成になっているので、話者位置に対応したステアリングベクトルを複数保持する必要がなく、結果として記憶媒体のコストを下げられる効果がある。
実施の形態2.
実施の形態1において基準ステアリングベクトルを用いることなくステアリングベクトルを算出することも可能であり、基準ステアリングベクトルを必要としないため、実施の形態1に加えてさらに記憶媒体のコストを下げることができる。
実施の形態1において基準ステアリングベクトルを用いることなくステアリングベクトルを算出することも可能であり、基準ステアリングベクトルを必要としないため、実施の形態1に加えてさらに記憶媒体のコストを下げることができる。
図4に実施の形態2の基本構成を表す。ビームフォーミング装置200は、二つ以上のマイク101、ビームフォーミング処理部102、ステアリングベクトル生成部201で構成される。ステアリングベクトル生成部201は角度情報104、距離情報105、マイク特性107を入力とするステアリングベクトル算出部202で構成される。
ステアリングベクトル算出部202について説明する。
ステアリングベクトル算出部202について説明する。
伝達関数の比 Hm(ω)/ H1(ω) の算出方法は(式13)と同様であり、(式15)のように算出される。
以上の構成にすることにより、実施の形態1と比較して、基準ステアリングベクトルを必要としないので、さらに記憶媒体のコストを下げられる効果がある。
この発明によるビームフォーミング処理装置は、音声認識によるカーナビゲータへの適用が可能である。
100;ビームフォーミング装置、101;マイク、102;ビームフォーミング処理部、103;ステアリングベクトル生成部、104;角度情報、105;距離情報、106;基準ステアリングベクトル、107;マイク特性データ、108;ステアリングベクトル算出部。
Claims (2)
- 話者の音声信号を収音する複数のマイクロフォンと、
前記複数のマイクロフォンのそれぞれと話者との角度情報と、前記複数のマイクロフォンのそれぞれと話者との距離情報および前記複数のマイクロフォンそれぞれの指向性と感度を予め測定することで得られるマイク特性データを用いてステアリングベクトルを算出するステアリングベクトル算出部と、
前記複数のマイクロフォンからの収音音声信号とステアリングベクトル算出部より得られるステアリングベクトルを用いてビームフォーミング処理を行うビームフォーミング処理部とを備えることを特徴とするビームフォーミング処理装置。 - 前記ステアリングベクトル算出部はステアリングベクトル算出に用いる情報に、任意に定めた基準位置からマイクロフォンへの基準ステアリングベクトルデータをさらに追加することを特徴とする請求項1記載のビームフォーミング処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012067567A JP2013201525A (ja) | 2012-03-23 | 2012-03-23 | ビームフォーミング処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012067567A JP2013201525A (ja) | 2012-03-23 | 2012-03-23 | ビームフォーミング処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013201525A true JP2013201525A (ja) | 2013-10-03 |
Family
ID=49521428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012067567A Pending JP2013201525A (ja) | 2012-03-23 | 2012-03-23 | ビームフォーミング処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013201525A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015106401A1 (zh) * | 2014-01-15 | 2015-07-23 | 宇龙计算机通信科技(深圳)有限公司 | 语音处理方法和语音处理装置 |
WO2015117343A1 (zh) * | 2014-08-26 | 2015-08-13 | 中兴通讯股份有限公司 | 一种提高语音音质的方法、系统及移动终端 |
WO2015196729A1 (zh) * | 2014-06-27 | 2015-12-30 | 中兴通讯股份有限公司 | 一种麦克风阵列语音增强方法及装置 |
JP2017212557A (ja) * | 2016-05-24 | 2017-11-30 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 制御装置、対話システム、制御方法及びコンピュータプログラム |
JPWO2019049276A1 (ja) * | 2017-09-07 | 2019-12-26 | 三菱電機株式会社 | 雑音除去装置および雑音除去方法 |
CN112216299A (zh) * | 2019-07-12 | 2021-01-12 | 大众问问(北京)信息科技有限公司 | 双麦克风阵列波束形成方法、装置及设备 |
JPWO2021124537A1 (ja) * | 2019-12-20 | 2021-06-24 | ||
CN113795881A (zh) * | 2019-03-10 | 2021-12-14 | 卡多姆科技有限公司 | 使用线索的聚类的语音增强 |
WO2022102322A1 (ja) | 2020-11-11 | 2022-05-19 | 株式会社オーディオテクニカ | 収音システム、収音方法及びプログラム |
-
2012
- 2012-03-23 JP JP2012067567A patent/JP2013201525A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015106401A1 (zh) * | 2014-01-15 | 2015-07-23 | 宇龙计算机通信科技(深圳)有限公司 | 语音处理方法和语音处理装置 |
WO2015196729A1 (zh) * | 2014-06-27 | 2015-12-30 | 中兴通讯股份有限公司 | 一种麦克风阵列语音增强方法及装置 |
WO2015117343A1 (zh) * | 2014-08-26 | 2015-08-13 | 中兴通讯股份有限公司 | 一种提高语音音质的方法、系统及移动终端 |
JP2017212557A (ja) * | 2016-05-24 | 2017-11-30 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 制御装置、対話システム、制御方法及びコンピュータプログラム |
JPWO2019049276A1 (ja) * | 2017-09-07 | 2019-12-26 | 三菱電機株式会社 | 雑音除去装置および雑音除去方法 |
JP2022533300A (ja) * | 2019-03-10 | 2022-07-22 | カードーム テクノロジー リミテッド | キューのクラスター化を使用した音声強化 |
JP7564117B2 (ja) | 2019-03-10 | 2024-10-08 | カードーム テクノロジー リミテッド | キューのクラスター化を使用した音声強化 |
CN113795881A (zh) * | 2019-03-10 | 2021-12-14 | 卡多姆科技有限公司 | 使用线索的聚类的语音增强 |
CN112216299A (zh) * | 2019-07-12 | 2021-01-12 | 大众问问(北京)信息科技有限公司 | 双麦克风阵列波束形成方法、装置及设备 |
CN112216299B (zh) * | 2019-07-12 | 2024-02-20 | 大众问问(北京)信息科技有限公司 | 双麦克风阵列波束形成方法、装置及设备 |
JPWO2021124537A1 (ja) * | 2019-12-20 | 2021-06-24 | ||
JP7004875B2 (ja) | 2019-12-20 | 2022-01-21 | 三菱電機株式会社 | 情報処理装置、算出方法、及び算出プログラム |
WO2021124537A1 (ja) * | 2019-12-20 | 2021-06-24 | 三菱電機株式会社 | 情報処理装置、算出方法、及び算出プログラム |
WO2022102322A1 (ja) | 2020-11-11 | 2022-05-19 | 株式会社オーディオテクニカ | 収音システム、収音方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2013201525A (ja) | ビームフォーミング処理装置 | |
JP6663009B2 (ja) | 音声強調のための全体最適化した最小二乗法ポストフィルタリング | |
JP6584930B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP6635903B2 (ja) | 音源位置推定装置、音源位置推定方法、及びプログラム | |
JP6318376B2 (ja) | 音源分離装置および音源分離方法 | |
US7710826B2 (en) | Method and apparatus for measuring sound source distance using microphone array | |
JP2015154207A (ja) | 音響処理装置、及び音響処理方法 | |
JP2010035044A (ja) | 伝達特性推定装置、雑音抑圧装置、伝達特性推定方法及びコンピュータプログラム | |
JP2008054071A (ja) | 紙擦れ音除去装置 | |
JP2010121975A (ja) | 音源定位装置 | |
Gala et al. | Three-dimensional sound source localization for unmanned ground vehicles with a self-rotational two-microphone array | |
US8416642B2 (en) | Signal processing apparatus and method for removing reflected wave generated by robot platform | |
CN112216295A (zh) | 一种声源定位方法、装置及设备 | |
JP2014525037A (ja) | 位相スペクトルを使った音源定位 | |
Hu et al. | Decoupled direction-of-arrival estimations using relative harmonic coefficients | |
Takashima et al. | HMM-based separation of acoustic transfer function for single-channel sound source localization | |
Jung et al. | Distance estimation of a sound source using the multiple intensity vectors | |
JP2015037207A (ja) | 音場収音再生装置、方法及びプログラム | |
US20130253923A1 (en) | Multichannel enhancement system for preserving spatial cues | |
JP5235723B2 (ja) | 発話向き推定装置、方法及びプログラム | |
JP5405130B2 (ja) | 音再生装置および音再生方法 | |
JP5235722B2 (ja) | 発話向き推定装置、方法及びプログラム | |
JP6433630B2 (ja) | 雑音除去装置、エコーキャンセリング装置、異音検出装置および雑音除去方法 | |
CN111157949A (zh) | 一种语音识别及声源定位方法 | |
JP6323901B2 (ja) | 収音装置および収音方法、並びにプログラム |