JP5633144B2 - 音信号処理装置 - Google Patents

音信号処理装置 Download PDF

Info

Publication number
JP5633144B2
JP5633144B2 JP2009289905A JP2009289905A JP5633144B2 JP 5633144 B2 JP5633144 B2 JP 5633144B2 JP 2009289905 A JP2009289905 A JP 2009289905A JP 2009289905 A JP2009289905 A JP 2009289905A JP 5633144 B2 JP5633144 B2 JP 5633144B2
Authority
JP
Japan
Prior art keywords
signal
sound
sound collection
unit
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009289905A
Other languages
English (en)
Other versions
JP2011135118A (ja
Inventor
亮 大内
亮 大内
訓史 鵜飼
訓史 鵜飼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2009289905A priority Critical patent/JP5633144B2/ja
Publication of JP2011135118A publication Critical patent/JP2011135118A/ja
Application granted granted Critical
Publication of JP5633144B2 publication Critical patent/JP5633144B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic Arrangements (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

複数の収音信号を用いて所望の指向性を有する音信号を生成する音信号処理装置に関するものである。
従来、複数人数で行う音声会議や当該音声会議の議事録の作成等では、複数のマイクを所定パターンで配置し、各マイクの収音信号に対して、各種の信号処理を行うことで、特定の話者の音声を含む音声信号を生成している。
この1つの方法として、遅延和アレイによる収音指向性の形成や特許文献1に示すような音源分離方法がある。
特開2006−197552号公報
従来の遅延和アレイによる収音指向性の形成では、マイク間隔を空間エイリアシング現象が起きない程度に狭く保つことが必要になる。また、アレイの全長が短いと、低域の指向性が小さくなるため、目的音を効率的に強調することが難しくなる。このような遅延和アレイの場合、目的音のみを明確に強調するためには、マイク間隔を狭く保ったまま、アレイの全長をながくしなければならず、マイク数が増加し、装置と内部演算の規模を大型化しなければならない。
一方、特許文献1に記載の音源分離のように、分離手段において、目的音優勢の信号のスペクトルと目的音劣勢のスペクトルとの間で同一の周波数帯域の各パワーの大小の比較を周波数別に行い、それぞれの周波数帯域で大きい方のパワーを分離して得られるスペクトルに帰属させるような二値的帯域選択を用いる方法もある。しかしながら、この方法では、目的音が設定された目的方向の中心部に近い位置に存在する場合には、特定の話者の音声を小規模な装置で効率的に強調できるが、目的音が設定された方向から外れて位置し、目的音優勢の信号のスペクトルと目的音劣勢の信号のスペクトルのパワーが略同じになるような状況下では、二値的帯域選択の結果が大きくふらつき、ミュージカルノイズが発生して音質が悪化する。
一方、特許文献1に記載の音源分離のように、分離手段においてスペクトラムサブトラクションを行う方法においても、雑音を大きく抑圧するためには、目的音劣勢の信号のスペクトルのパワーに乗じる係数を大きくしなければならず、特定の方向にて出力信号が急激に「0」になる特性を持つことになる。このため、その位置付近に目的音が存在するような状況下では、二値的帯域選択同様に増幅率が大きくふらつき、ミュージカルノイズが発生して音質が悪化する。
これらの課題を鑑み、本願発明の目的は、目的方向の音声を効率的に強調しつつ、且つ目的音が目的方向から外れている状況でも安定した音声品質を保ちながら収音が可能な音信号処理装置を実現することにある。
この発明は、音信号処理装置に関するものである。そして、この音信号処理装置は、メイン収音部、複数のサブ収音部、増幅率決定部、および増幅部を備える。メイン収音部は、メイン収音信号を生成する。各サブ収音部は、それぞれに異なる収音指向性からなるサブ収音信号を生成する。増幅率決定部は、複数のサブ収音部から出力される各サブ収音信号の振幅に基づいて増幅率を決定する。増幅部は、メイン収音信号に増幅率を乗算した結果を出力信号として出力する。
この構成では、サブ収音信号より設定される増幅率で、メイン収音信号の指向性の補正を行う。ここで、複数のサブ収音信号の指向性がそれぞれに異なっていることにより、音源の位置によって複数のサブ収音信号のレベル差や時間差などの特徴の隔たり方が異なる。この特徴の隔たり方の違いに応じて異なる増幅率を設定することで、音源の位置に対して所望の異なる増幅率を与えることができる。これにより、例えば、特定方向の信号を狭指向性で収音し、他の信号を所定のレベルで減衰させたような音信号を生成することができる。
また、この発明の音信号処理装置は、帯域分割部、複数の周波数別信号生成部、および信号再構成部をさらに備える。帯域分割部は、メイン収音信号および複数のサブ収音信号に対して、それぞれに異なる周波数成分からなる帯域別収音信号を生成する。各周波数別信号生成部は、帯域別収音信号毎に設定され、それぞれに増幅率決定部と増幅部とを備える。信号再構成部は、複数の周波数別信号生成部から出力される複数の帯域別の出力信号に基づき再構成された信号を出力する。
この構成では、上述のメイン収音信号の増幅処理を複数の周波数帯域で独立に実現する場合を示している。そして、このような構成とすることで、目的音に含まれる周波数帯域の増幅率のみを大きく、雑音が含まれる周波数帯域の増幅率を小さくすることが可能になる。これにより、目的音と雑音が同時に発音している状況においても、目的音のみを強調することができる。
また、この発明の音信号処理装置では、サブ収音部が第1サブ収音部と第2サブ収音部との2個からなる。そして、増幅率決定部は、第2サブ収音部で得られる第2サブ収音信号の振幅に対する、第1サブ収音部で得られる第1サブ収音信号の振幅の割合に基づいて、増幅率を決定する。
この構成では、より具体的な増幅率の決定方法を示している。そして、このような構成とすることで、音源の位置に応じて生じる第1サブ収音信号と第2サブ収音信号の振幅の違いを指標に、より目的方向に近いほど、より大きな増幅率を与えることができ、目的方向のみを簡単な演算で強調することができる。
また、この発明の音信号処理装置の第1サブ収音部は、目的方向に最大収音感度を有し、第2サブ収音部は全ての方向に均一な感度を有する。
この構成では、より具体的な第1サブ収音部および第2サブ収音部の組合せの例を示している。そして、このような構成とすることで、目的方向に近い方向ほど、第2サブ収音部で得られる第2サブ収音信号の振幅に対する第1サブ収音部で得られる第1サブ収音信号の振幅の割合が、より大きくなり、目的方向により近いほど大きな増幅率を設定することができる。これにより、目的方向を含む狭い方位角範囲に、他の方位角範囲よりも高い収音感度を有し、他の方位角範囲では所望レベルで収音感度が低い指向性の音信号を生成することができる。また、第1サブ収音部は、単一のカーディオイド指向性型マイクや、単純で小規模な遅延和アレイを用いた簡単に実現することができる。
また、この発明の音信号処理装置の増幅率決定部は、割合を底とするべき乗値を増幅率に設定する。
この構成では、より具体的な増幅率決定方法を示すものである。そして、このべき乗値を適宜設定することで、指向性を調整することができる。具体的には、べき乗値を小さくすることで、ほぼ最大収音感度の方位角範囲を広げて、他の方位角範囲の収音感度を向上させる方向へ調整できる。一方で、べき乗値を大きくすることで、ほぼ最大収音感度の方位角範囲をより狭くし、他の方位角範囲の収音感度をより抑圧させる方向へ調整できる。
この発明によれば、目的方向の音を効果的に強調し、他の方向の音を減衰することができる。また、音源方向の変化に対して増幅率を滑らかに連続的に変化させることができるため、目的音が目的方向から外れている状況でも、増幅率が過度に変化することが少なく、ミュージカルノイズが発生せず、安定した音声品質を保ちながら収音ができる。
第1の実施形態の音信号処理装置1の構成を示すブロック図である。 メイン収音信号生成部21、第1サブ収音信号生成部22A、および第2サブ収音信号生成部22Bの具体的な第1実施例を示す図である。 メイン収音信号生成部21、第1サブ収音信号生成部22A、および第2サブ収音信号生成部22Bの具体的な第2実施例の構成と、マイクロホンMIC101,MIC102,MIC103の具体的な配置パターンを示す図である。 本実施形態での指向性の整形概念を説明する為の図である。 本願発明の処理で形成される指向性と、従来の音源分離処理で形成される指向性との違いを説明するための図である。 第2の実施形態の音信号処理装置1Aの構成を示すブロック図である。 第3の実施形態の音信号処理装置1Bの構成を示すブロック図である。 第4の実施形態の音信号処理装置1Cの構成を示すブロック図である。 第5の実施形態の収音記憶装置の簡略構成図および音信号処理装置1Dの構成を示すブロック図である。 第6の実施形態の収音記憶装置の簡略構成図および音信号処理装置1Eの構成を示すブロック図である。
本発明の第1の実施形態に係る音信号処理装置について、図を参照して説明する。
図1は本実施形態の音信号処理装置1の構成を示すブロック図である。
音信号処理装置1は、メイン収音信号生成部21、第1サブ収音信号生成部22A、第2サブ収音信号生成部22B、増幅率決定部23、増幅部24を備える。
メイン収音信号生成部21は、目的方向を最大収音感度の方向とする単一指向性のメイン収音信号Y(t)を生成する。メイン収音信号生成部21は、メイン収音信号Y(t)を増幅部24へ出力する。
第1サブ収音信号生成部22Aは、メイン収音信号Y(t)と同様に目的方向を最大収音感度の方向とする単一指向性の第1サブ収音信号YS1(t)を生成する。第1サブ収音信号生成部22Aは、第1サブ収音信号YS1(t)を増幅率決定部23へ出力する。
第2サブ収音信号生成部22Bは、全方位方向に同じ収音感度を有する無指向性の第2サブ収音信号YS2(t)を生成する。第2サブ収音信号生成部22Bは、第2サブ収音信号YS2(t)を増幅率決定部23へ出力する。
これら、メイン収音信号生成部21、第1サブ収音信号生成部22A、第2サブ収音信号生成部22Bは、例えば、次に示す第1実施例や第2実施例に示す構成で実現される。
[各収音信号生成部の第1実施例]
図2は、メイン収音信号生成部21、第1サブ収音信号生成部22A、および第2サブ収音信号生成部22Bの具体的な第1実施例の構成を示す図である。
メイン収音信号生成部21、第1サブ収音信号生成部22A、第2サブ収音信号生成部22Bは、3個のマイクロホンMIC11,MIC12,MIC13のみから実現される。この際、マイクロホンMIC11およびマイクロホンMIC12は、単一指向性マイクであり、目的方向に最大収音感度方向が向くように配置されている。この構成により、例えばマイクロホンMIC11がメイン収音信号生成部21として機能し、メイン収音信号Y(t)を出力する。マイクロホンMIC12が第1サブ収音信号生成部22Aとして機能し、第1サブ収音信号YS1(t)を出力する。
マイクロホンMIC13は無指向性マイクであり、自身の収音面がマイクロホンMIC11,MIC13の収音面に略垂直になるように配置されている。この構成により、マイクロホンMIC12が第2サブ収音信号生成部22Bとして機能し、第2サブ収音信号YS2(t)を出力する。
なお、この際、マイクロホンMIC11,MIC13,MIC12は、略同じ位置に配置されるようにするとよい。例えば、図2に示すように、鉛直方向に対して、上側からマイクロホンMIC11,MIC13,MIC12が並び、且つ水平方向における位置が略同じになるように配置されている。
[各収音信号生成部の第2実施例]
図3は、メイン収音信号生成部21、第1サブ収音信号生成部22A、および第2サブ収音信号生成部22Bの具体的な第2実施例の構成を示す図である。図3(A)は第2実施例の具体的な回路構成を示すブロック図であり、図3(B)はマイクロホンMIC101,MIC102,MIC103の具体的な配置パターンを示す図である。
マイクロホンMIC101,MIC102,MIC103は、所定の指向性を有する。
マイクロホンMIC101は、収音信号X(t)を生成し、増幅率コントロールアンプ211,221A,221Bへ出力する。
マイクロホンMIC102は、収音信号X(t)を生成し、増幅率コントロールアンプ212,222A,222Bへ出力する。
マイクロホンMIC103は、収音信号X(t)を生成し、増幅率コントロールアンプ213,223A,223Bへ出力する。
増幅率コントロールアンプ211,212,213には、目的方向に最大収音感度方向を有する単一指向性のメイン収音信号Y(t)を形成するためのメイン増幅率情報210が与えられている。メイン増幅率情報210は、増幅率コントロールアンプ211,212,213毎に与えられる各増幅率から構成される。
増幅率コントロールアンプ211は、メイン増幅率情報210に基づく増幅率で収音信号X(t)を増幅し、加算器214へ出力する。増幅率コントロールアンプ212は、メイン増幅率情報210に基づく増幅率で収音信号X(t)を増幅し、加算器214へ出力する。増幅率コントロールアンプ213は、メイン増幅率情報210に基づく増幅率で収音信号X(t)を増幅し、加算器214へ出力する。加算器214は、メイン増幅率情報210に基づくそれぞれの増幅率で増幅された収音信号X(t)、収音信号X(t)、および収音信号X(t)を加算することで、図2に示すような目的方向(図4では0°方向)を最大感度方向としハイパーカーディオイド特性からなるメイン収音信号Y(t)を生成して、出力する。
このように、第2実施例では、マイクロホンMIC101,MIC102,MIC103、メイン増幅率情報210に準じた増幅率コントロールアンプ211,212,213、および加算器214により、メイン収音信号生成部21が構成される。
増幅率コントロールアンプ221A,222A,223Aには、目的方向に最大収音感度方向を有する単一指向性の第1サブ収音信号YS1(t)を形成するための第1サブ増幅率情報220Aが与えられている。第1サブ増幅率情報220Aは、増幅率コントロールアンプ221A,222A,223A毎に与えられる各増幅率から構成される。
増幅率コントロールアンプ221Aは、第1サブ増幅率情報220Aに基づく増幅率で収音信号X(t)を増幅し、加算器224Aへ出力する。増幅率コントロールアンプ222Aは、第1サブ増幅率情報220Aに基づく増幅率で収音信号X(t)を増幅し、加算器224Aへ出力する。増幅率コントロールアンプ223Aは、第1サブ増幅率情報220Aに基づく増幅率で収音信号X(t)を増幅し、加算器224Aへ出力する。加算器224Aは、第1サブ増幅率情報220Aに基づくそれぞれの増幅率で増幅された収音信号X(t)、収音信号X(t)、および収音信号X(t)を加算することで、図2に示すような目的方向(図4では0°方向)を最大感度方向としカーディオイド特性からなる第1サブ収音信号YS1(t)を生成して、出力する。
このように、第2実施例では、マイクロホンMIC101,MIC102,MIC103、第1サブ増幅率情報220Aに準じた増幅率コントロールアンプ221A,222A,223A、および加算器224Aにより、第1サブ収音信号生成部22Aが構成される。
増幅率コントロールアンプ221B,222B,223Bには、全方位方向に対して同じ収音感度を有する無指向性の第2サブ収音信号YS2(t)を形成するための第2サブ増幅率情報220Bが与えられている。第2サブ増幅率情報220Bは、ゲインコントロールアンプ221B,222B,223B毎に与えられる各増幅率から構成される。
増幅率コントロールアンプ221Bは、第2サブ増幅率情報220Bに基づく増幅率で収音信号X(t)を増幅し、加算器224Bへ出力する。増幅率コントロールアンプ222Bは、第2サブ増幅率情報220Bに基づく増幅率で収音信号X(t)を増幅し、加算器224Bへ出力する。増幅率コントロールアンプ223Bは、第2サブ増幅率情報220Bに基づく増幅率で収音信号X(t)を増幅し、加算器224Bへ出力する。加算器224Bは、第2サブ増幅率情報220Bに基づくそれぞれの増幅率で増幅された収音信号X(t)、収音信号X(t)、および収音信号X(t)を加算することで、図4に示すような全方位に対して同じ収音感度を有する無指向性からなる第2サブ収音信号YS2(t)を生成して、出力する。
このように、第2実施例では、マイクロホンMIC101,MIC102,MIC103、第2サブゲイン情報220Bに準じた増幅率コントロールアンプ221B,222B,223B、および加算器224Bにより、第2サブ収音信号生成部22Bが構成される。
ここで、図3(A)に示したマイクロホンMIC101,MIC102,MIC103の具体的な配置例を図3(B)を示して説明する。
マイクロホンMIC101,MIC102,MIC103は、それぞれ単一指向性の収音指向性を有する。そして、図3(B)に示すように、マイクロホンMIC101,MIC102,MIC103は、所定点を中心として、同心円状に略120°の間隔で配置される。そして、それぞれのマイクロホンMIC101,MIC102,MIC103の収音指向性の最大感度方向が前記所定点方向となるように、配置される。
そして、このような場合、増幅率コントロールアンプ211、212、213、211A、212A、213A、211B、212B、213Bの各増幅率G(211),G(212),G(213),G(211A),G(212A),G(213A),G(211B),G(212B),G(213B)を次のように設定する。
G(211)=+4/3,G(212)=−1/3,G(213)=−1/3,
G(211A)=1.0,G(212A)=0.0,G(213A)=0.0,
G(211B)=2/3,G(212B)=2/3,G(213B)=2/3
このような増幅率に設定することで、メイン収音信号生成部21はマイクロホンMIC101の最大収音感度方向に最大感度を持つハイパーカーディオイドの指向性を有する。第1サブ収音信号生成部22AはマイクロホンMIC101の最大収音感度方向に最大感度を持つカーディオイドの指向性を有する。第2サブ収音信号生成部22Bは全方位に同じ収音感度となる無指向性を有する。
なお、上述の配置例、各マイクの指向性および各増幅率の設定は一例であり、所望とするメイン収音信号、第1サブ収音信号および第2サブ収音信号の特性に応じて、適宜設定すればよい。
増幅率決定部23は、振幅算出部231,232および増幅率算出部233を備える。振幅算出部231は、第1サブ指向性信号YS1(t)の振幅|YS1(t)|を算出して、増幅率算出部233へ出力する。振幅算出部232は、第2サブ指向性信号YS2(t)の振幅|YS2(t)|を算出して、増幅率算出部233へ出力する。
増幅率算出部233は、第2サブ指向性信号YS2(t)の振幅に対する第1サブ指向性信号YS1(t)の振幅の割合を用いて、次式からメイン収音信号Y(t)用の増幅率G(t)を算出する。
Figure 0005633144
ここで、Eはべき乗係数であり、上述の指向性制御情報とともに、ユーザからの操作入力等により与えられる。そして、このべき乗係数Eを変更することで、増幅率G(t)の指向性パターンを制御することができる。
例えば、上述のように、第1サブ収音信号YS1(t)がカーディオイド特性で、第2サブ収音信号YS2(t)が無指向性であれば、べき乗係数Eを増加するほど、最大収音感度方向以外の方向の感度を抑圧する特性を得られる。すなわち、図4に示すような最大収音感度方向に鋭い指向性パターンの増幅率G(t)を設定することができる。さらに、この増幅率G(t)の指向性パターンは、方位によって非連続的に増幅率が変化するものではなく、連続的に増幅率が変化する特性となる。
増幅部24は、次式のようにメイン収音信号Y(t)に増幅率G(t)を乗算することで、出力信号Z(t)を生成する。
Figure 0005633144
このような処理を行う際に、上述のように、最大収音感度方向に鋭い指向性パターンの増幅率G(t)を設定することで、ハイパーカーディオイド特性であるメイン収音信号Y(t)から、さらに図4に示すような最大収音感度方向を中心とする狭い方位角範囲にのみ収音感度を有する指向性の出力信号Z(t)を得ることができる。
このような構成および処理を用いることで、単にメイン収音信号Y(t)を用いるよりも狭い方位範囲を主たる収音領域とする収音が可能になる。すなわち、収音に対する方位分解能を向上させることができる。これにより、従来のマイクアレイによる収音信号の遅延、合成処理ではできなかった、マイクアレイの配置間隔に依存する最高の方位分解能よりも、さらに高い方位分解能を実現することができる。
さらに、このような構成とすることで、従来の音源分離処理に対して、図5に示すような指向性の違いが生じる。なお、図5における本願発明の処理では、べき乗が3乗の場合を示している。
図5は、本願発明の処理と、従来の音源分離処理との指向性の違いを説明する為の図である。従来の音源分離処理の指向性の例として、+90度、−90度の方向にて目的音優勢の信号のパワーと目的音劣勢の信号のパワーが同じになるような二値的選択を用いた時に形成される指向性と、+90度、−90度の方向にて減算項と非減算項の大きさが同じになるようなスペクトラムサブトラクション法を用いた時に形成される指向性を示している。また、本願発明の処理において形成される指向性を示している。
図5に示すように、従来の音源分離処理では、この場合の+90度の方向や、−90度の方向のように、そこから増幅率が「0」になるような方向が存在する。このような特性では、目的音がその方向付近に位置している場合には、目的音の位置の誤差による揺らぎや内部演算の誤差による揺らぎなどによって、増幅率と出力信号の振幅が急激に変化する。これにより、ミュージカルノイズが生じて、音質が悪化する。
一方、本願発明の処理では、このような急激な変化が生じうる方向は存在せず、目的音の位置の誤差による揺らぎや内部演算の誤差による揺らぎに対して、増幅率はどの方向であっても滑らかに変化し、音質が悪化しない。
次に、第2の実施形態に係る音信号処理装置について、図を参照して説明する。図6は本実施形態の音信号処理装置1Aの構成を示すブロック図である。
上述の第1の実施形態では、メイン収音信号生成部21で生成されたメイン収音信号Y(t)、第1サブ収音信号生成部22Aで生成された第1サブ収音信号YS1(t)、および第2サブ収音信号生成部22Bで生成された第2サブ収音信号YS2(t)をそのまま利用して、メイン収音信号Y(t)の指向性を制御し出力信号Z(t)を得たが、本実施形態では、メイン収音信号Y(t)、第1サブ収音信号YS1(t)、および第2サブ収音信号YS2(t)のそれぞれを周波数分割した信号を用いて出力信号Zc(t)を生成する構成を示す。
音信号処理装置1Aは、メイン収音信号生成部21、第1サブ収音信号生成部22A、第2サブ収音信号生成部22B、帯域分割部10、周波数別信号生成部2F1〜2Fn、および信号再構成部30を備える。
帯域分割部10は、メイン収音信号生成部21、第1サブ収音信号生成部22A、第2サブ収音信号生成部22B毎に割り当てられた分割処理部101,102,103を備える。分割処理部101,102,103は、複数のバンドパスフィルタ(BPF)が組み合わされる構成等からなり、入力される各収音信号(メイン収音信号Y(t)、第1サブ収音信号YS1(t)、および第2サブ収音信号YS2(t))を、それぞれに異なる周波数帯域からなる複数(本実施形態ではn個)の個別周波数信号に分割して出力する。なお、帯域分割の方法は、BPFの組合せに限るものではなく、フーリエ変換等の周波数領域への信号変換処理を利用するものであってもよい。
具体的には、分割処理部101は、メイン収音信号生成部21のメイン収音信号Y(t)を、それぞれに周波数帯域(f1,・・・,fn)が異なるn個の個別周波数信号Y(f1,t)〜Y(fn,t)に帯域分割し、出力する。この際、分割処理部101は、個別周波数信号Y(f1,t)を周波数別信号生成部2F1へ出力し、図示を省略するが個別周波数信号Y(f2,t)を周波数別信号生成部2F2へ出力し、個別周波数信号Y(fn,t)を周波数別信号生成部2Fnへ出力するように、各個別周波数信号Y(f1,t)〜Y(fn,t)を、それぞれに対応する周波数別信号生成部2F1〜2Fnへ出力する。
同様に、分割処理部102は、第1サブ収音信号生成部22Aの第1サブ収音信号YS1(t)を、それぞれに周波数帯域(f1,・・・,fn)が異なるn個の個別周波数信号YS1(f1,t)〜YS1(fn,t)に帯域分割し、出力する。この際、分割処理部102は、個別周波数信号YS1(f1,t)を周波数別信号生成部2F1へ出力し、図示を省略するが個別周波数信号YS1(f2,t)を周波数別信号生成部2F2へ出力し、個別周波数信号YS1(fn,t)を周波数別信号生成部2Fnへ出力するように、各個別周波数信号YS1(f1,t)〜YS1(fn,t)を、それぞれに対応する周波数別信号生成部2F1〜2Fnへ出力する。
さらに、分割処理部103は、第2サブ収音信号生成部22Bの第2サブ収音信号YS2(t)を、それぞれに周波数帯域(f1,・・・,fn)が異なるn個の個別周波数信号YS2(f1,t)〜YS2(fn,t)に帯域分割し、出力する。この際、分割処理部103は、個別周波数信号YS2(f1,t)を周波数別信号生成部2F1へ出力し、図示を省略するが個別周波数信号YS2(f2,t)を周波数別信号生成部2F2へ出力し、個別周波数信号YS2(fn,t)を周波数別信号生成部2Fnへ出力するように、各個別周波数信号YS2(f1,t)〜YS2(fn,t)を、それぞれに対応する周波数別信号生成部2F1〜2Fnへ出力する。
周波数別信号生成部2F1〜2Fnは、増幅率決定部23、増幅部24をそれぞれに備える。各周波数別信号生成部2F1〜2Fnの増幅率決定部23、増幅部24は、第1の実施形態の増幅率決定部23、増幅部24と同じ構成であるので、第1の実施形態と異なる部分のみを、周波数別信号生成部2F1の構成および処理に関してのみ説明し、他の周波数別信号生成部2F2〜2Fnの構成および処理に関しては説明を省略する。
増幅率決定部23は、振幅算出部231,232および増幅率算出部233を備える。振幅算出部231は、周波数f1の第1サブ指向性信号YS1(f1,t)の振幅|YS1(f1,t)|を算出して、増幅率算出部233へ出力する。振幅算出部232は、周波数f1の第2サブ指向性信号YS2(f1,t)の振幅|YS2(f1,t)|を算出して、増幅率算出部233へ出力する。
増幅率算出部233は、周波数f1の第1サブ指向性信号YS1(f1,t)の振幅と、周波数f1の第2サブ指向性信号YS2(f1,t)の振幅との割合を用いて、次式から周波数f1の増幅率G(f1,t)を算出する。
Figure 0005633144
ここで、Eはべき乗係数であり、上述の指向性制御情報とともに、ユーザからの操作入力等により与えられる。そして、このべき乗係数Eを変更することで、周波数f1の増幅率G(f1,t)の指向性パターンを制御することができる。
増幅部24は、増幅率決定部23で算出された周波数f1の増幅率G(f1,t)に基づいて、周波数f1のメイン収音信号Y(f1,t)の指向性パターンを整形する。具体的には、増幅部24は、次式のように、周波数f1のメイン収音信号Y(f1,t)に周波数f1の増幅率G(f1,t)を乗算することで、周波数f1成分の出力信号Z(f1,t)を生成する。
Figure 0005633144
このように生成された周波数f1の出力信号Z(f1,t)は、信号再構成部30へ出力される。
同様に、それぞれの周波数f2〜fnに対応する周波数別信号生成部2F2〜2Fnのそれぞれからも、所望の形状にメイン収音信号Y(f2,t)〜Y(fn,t)の指向性が整形されてなる周波数f2〜fnの出力信号Z(f2,t)〜Z(fn,t)を得ることができる。具体的には、例えば、周波数別信号生成部2F2からは周波数f2の出力信号Z(f2,t)が出力され、周波数信号生成部2Fnからは周波数fnの出力信号Z(fn,t)が出力される。
信号再構成部30は、各周波数別信号生成部2F1〜2Fnからの周波数f1〜fn毎の出力信号Z(f1,t)〜Z(fn,t)を再構成し、再構成信号Zc(t)を出力する。例えば、具体的に、信号再構成部30は、次式を満たすように出力信号Z(f1,t)〜Z(fn,t)を加算することで、再構成信号Zc(t)を生成する。
Figure 0005633144
なお、再構成の方法は、加算に限るものではなく、逆フーリエ変換等の時間領域への信号変換処理を利用するものであってもよい。
次に、第3の実施形態に係る音信号処理装置について、図を参照して説明する。図7は本実施形態の音信号処理装置1Bの構成を示すブロック図である。
本実施形態の音信号処理装置1Bは、第1の実施形態の音信号処理装置1に対して制御部40、操作部41、およびスピーカ50を加えたものであり、他の構成は同じである。したがって、第1の実施形態の音信号処理装置1と異なる箇所のみを説明する。
音信号処理装置1Bの操作部41は、所定の操作子等を備え、ユーザからの操作入力を受け付けて、制御部40へ与える。具体的には、操作部41は、放音対象となる話者方位と、他の方位からの収音に対する抑圧レベルとを受け付ける。操作部41は、話者方位と抑圧レベルとを受け付けると、制御部40へ話者方位情報および抑圧レベル情報を与える。
制御部40は、操作部41から受け付けた話者方位情報および抑圧レベル情報に基づいて、上述のメイン収音信号Y(t)および第1サブ収音信号YS1(t)の最大収音感度の方位を設定する。制御部40は、設定された最大収音感度の方位に基づいて指向性制御情報を生成し、メイン収音信号生成部21、第1サブ収音信号生成部22A、へ出力する。メイン収音信号生成部21、第1サブ収音信号生成部22Aは、上述の[第1実施例]の場合、各マイクロホンの方向を機械的に変化させる。一方、メイン収音信号生成部21、第1サブ収音信号生成部22Aは、[第2実施例]の構成の場合、指向性制御情報として上述のメイン増幅率情報、第1サブ増幅率情報、および第2サブ増幅率情報を含む。メイン収音信号生成部21、第1サブ収音信号生成部22Aは、それぞれに与えられた指向性制御情報に基づいて増幅率コントロールアンプの増幅率を調整して、メイン収音信号Y(t)、第1サブ収音信号YS1(t)を出力する。
この際、第2サブ収音信号生成部22Bは、無指向性の第2サブ収音信号YS2(t)を出力するため、特に指向性制御情報を与えられていない。しかしながら、第2サブ収音信号生成部22Bへ、都度、無指向性を形成するための指向性制御情報を与えても良い。さらには、第2サブ収音信号YS2(t)に無指向性以外の収音指向性を与える場合にも、指向性制御情報を与えることができ、第2サブ収音信号生成部22Bは、与えられた指向性制御情報に基づいて第2サブ収音信号YS2(t)を生成することができる。
また、制御部40は、抑圧レベル情報に基づいて、上述の増幅率Gを決定するべき乗係数を設定し、増幅率決定部23へ出力する。増幅率決定部23は、与えられたべき乗係数を、上述の式(3)に代入することで、増幅率G(t)を算出する。
このような指向性制御情報やべき乗係数を用いることで、出力信号Z(t)は、指定した話者の音声を極狭い方位角範囲で強調し、他の方位角範囲の音を抑圧した音信号となる。そして、この出力信号Z(t)はスピーカ50へ入力され、スピーカ50は、出力信号Z(t)により放音する。
このような構成および処理を行うことで、放音音声は、指定した話者音声のみが強調され、他の方位角範囲の音が所望レベルで抑圧された音声となる。
また、指定した話者方向が方位角方向に、若干ずれるようなことがあっても、ミュージカルノイズが発生することなく、音質の悪化を抑制できる。
ここで、操作部41に対して抑圧レベルの調整操作を入力すれば、指定した話者音声はそのままで、他の方位角範囲の音の抑圧レベルを調整して放音することもできる。これにより、さらに操作者の所望する放音を実現しやすくすることができる。
次に、第4の実施形態に係る音信号処理装置について、図を参照して説明する。図8は本実施形態の音信号処理装置1Cの構成を示すブロック図である。
本実施形態の音信号処理装置1Cは、第3の実施形態に示した音信号処理装置1Bに対して、スピーカ50が記録部60に置き換わったものである。
このような構成とすることで、上述の第3の実施形態に示した放音される出力信号Z(t)が記録部60に記録される。すなわち、指定した話者音声のみが強調され、他の方位角範囲の音が所望レベルで抑圧された音声を録音することができる。
なお、上述の第3の実施形態に係る構成や第4の実施形態に係る構成を、上述の第2の実施形態に示した周波数成分毎に出力信号Z(f1,t)〜Z(fn,t)を生成し、再構成信号Zc(t)を出力する構成に適用することもできる。
次に、第5の実施形態に係る音信号処理装置について、図を参照して説明する。図9(A)は本実施形態の音信号処理装置1Dの構成を示すブロック図である。図9(B)は収音して記憶する収音記憶装置の簡略構成図である。
本実施形態の音信号処理装置1Dは、第2の実施形態に示した音信号処理装置1Bに対して、制御部40、操作部41、スピーカ50、および収音信号記録部70を備えたものであり、他の構成は第2の実施形態の音信号処理装置1Bと同じである。また、操作部41は、上述の第3の実施形態に示したものと同じであり、説明は省略する。したがって、第2の実施形態の音信号処理装置1Bや第3の実施形態の音信号処理装置1Cとは異なる箇所のみを説明する。
本実施形態の音信号処理装置1Dは、図9(B)に示す収音記録装置と、図9(A)に示す音再生装置とを備える。収音記録装置は、マイクロホンMIC201,202,MIC203と収音信号記録部70を備える。マイクロホンMIC201,202,MIC203は、上述のマイクロホンMIC101,MIC102,MIC103等と同様に、所定の指向性を有し、所定の位置関係で配置されている。マイクロホンMIC201,MIC202,MIC203の収音信号X(t),X(t),X(t)は、収音信号記録部70に、例えば所定のサンプリングタイムで順次記録される。
音再生装置は、上述の第2実施形態に示した音信号処理装置1Aのメイン収音信号生成部21、第1サブ収音信号生成部22A、第2サブ収音信号生成部22Bに代わり、上記収音信号記録部70、指向性制御部80を備える。また、上述の第3実施形態に示すように制御部40、操作部41を備える。
収音信号記録部70には、制御部40からの収音信号出力制御に応じて、収音信号X(t),X(t),X(t)を指向性制御部80へ出力する。
指向性制御部80は、メイン収音信号生成部251、第1サブ収音信号生成部252A、第2サブ収音信号生成部252Bを備える。
メイン収音信号生成部251は、第1実施形態の第2実施例(図3参照)に示した増幅率コントロールアンプ211,212,213、加算器214を備える。メイン収音信号生成部251には、制御部40からメイン収音信号を生成するための指向性制御情報が与えられる。メイン収音信号生成部251は、当該指向性制御情報に基づいて、各増幅率コントロールアンプの増幅率を設定し、メイン収音信号Y(t)を出力する。
第1サブ収音信号生成部252Aは、第1実施形態の第2実施例(図3参照)に示した増幅率コントロールアンプ221A,222A,223A、加算器224Aを備える。第1サブ収音信号生成部252Aには、制御部40から第1サブ収音信号を生成するための指向性制御情報が与えられる。第1サブ収音信号生成部252Aは、当該指向性制御情報に基づいて、各増幅率コントロールアンプの増幅率を設定し、第1サブ収音信号YS1(t)を出力する。
第2サブ収音信号生成部252Bは、第1実施形態の第2実施例(図3参照)に示した増幅率コントロールアンプ221B,222B,223B、加算器224Bを備える。第2サブ収音信号生成部252Bには、制御部40から第2サブ収音信号を生成するための指向性制御情報が与えられる。第2サブ収音信号生成部252Bは、当該指向性制御情報に基づいて、各増幅率コントロールアンプの増幅率を設定し、第2サブ収音信号YS2(t)を出力する。
指向性制御部80から出力された、メイン収音信号Y(t)、第1サブ収音信号YS1(t)、第2サブ収音信号YS2(t)は帯域分割部10へ出力される。
この際、上述のようにマイクロホンMIC201,MIC202,MIC203で収音された収音信号X(t)、収音信号X(t)、および収音信号X(t)を記録する構成を用いていれば、制御部40は、操作部41から受け付けた話者方位情報に基づいて、話者方位を最大収音感度方向とする単一指向性のメイン収音信号Y(t)、第1サブ収音信号YS1(t)と、無指向性の第2サブ収音信号YS2(t)を、指向性制御部80で生成し、帯域分割部10へ出力することができる。
また、制御部40は、操作部41から受け付けた抑圧レベル情報に基づいて、周波数別信号生成部2F1〜2Fnのそれぞれに対して、上述の増幅率G(f1,t)〜G(fn,t)を決定するべき乗係数を周波数f1〜fn毎に設定する。制御部40は、この周波数f1〜fn毎のべき乗係数を各周波数別信号生成部2F1〜2Fnへ出力する。
信号再構成部30は、このように記録されたメイン収音信号Y(t)、第1サブ収音信号YS1(t)および第2サブ収音信号YS2(t)や、収音信号X(t),X(t),X(t)に基づいて生成された周波数別の出力信号Z(f1,t)〜Z(fn,t)を用いて、上述のように信号再構成を行い、再構成信号Zc(t)を出力する。この再構成信号Zc(t)はスピーカ50に入力され、当該スピーカ50から放音される。
このような構成とすることで、上述の実施形態に示すように、収音しながらの処理ではなく、オフライン処理により、所望とする方向からの音のみを強調し、他の範囲の音を適宜抑圧してなる音信号を放音することができる。特に、一旦収音信号X(t),X(t),X(t)を記録する方法を用いれば、例えば、収音後に特定の話者の音声を指定して、当該話者音声を強調し、他の話者の音声を参考程度に聞くような状況に適した放音が可能になる。
次に、第6の実施形態に係る音信号処理装置について、図を参照して説明する。図10は本実施形態の音信号処理装置1Eの構成を示すブロック図である。本実施形態の音信号処理装置1Eは、第5の実施形態に示した音信号処理装置1Dに対して、スピーカ50が記録部60に置き換わったものである。
このような構成とすることで、上述の第5の実施形態に示した放音される出力信号Z(t)が記録部60に記録される。すなわち、オフライン処理で、話者音声のみが強調され、他の方位角範囲の音が所望レベルで抑圧された音声を録音することができる。特に、一旦収音信号X(t),X(t),X(t)を記録する方法を用いることで、例えば、収音後に議事録を作成するような場合に、特定の話者の音声を強調し、他の話者の音声が参考程度に含まれるような音信号を、新たに録音することができる。
なお、上述の第5の実施形態に係る構成や第6の実施形態に係る構成を、上述の第1の実施形態に示した出力信号Z(t)を生成する構成に適用することもできる。
また、上述の周波数帯域分割する実施形態では、メイン収音信号Y(t)、第1サブ収音信号YS1(t)および第2サブ収音信号YS2(t)を帯域分割する例を示したが、上述の[実施例2]の収音信号生成部を用いる場合であれば、各マイクロホンMIC101,MIC102,MIC103の収音信号を帯域分割してから、帯域毎にメイン収音信号Y(t)、第1サブ収音信号YS1(t)および第2サブ収音信号YS2(t)を生成することもできる。
1,1A〜1E−音信号処理装置、10−帯域分割部、101,102,103−分割処理部、20−収音信号生成部、21−メイン収音信号生成部、22A−第1サブ収音信号生成部、22B−第2サブ収音信号生成部、23−増幅率決定部、24−ゲイン補正部、211,212,213,221A,222A,223A,221B,222B,223B−増幅率コントロールアンプ、231,232−振幅算出部、233−増幅率算出部、214,224,234−加算器、2F1〜2FN−周波数別信号生成部、30−信号再構成部、40−制御部、41−操作部、50−スピーカ、60−記録部、70−収音信号記録部、80−指向性制御部

Claims (3)

  1. メイン収音信号を生成するメイン収音部と、
    目的方向に最大感度を有するサブ収音信号と、全ての方向に均一な感度を有するサブ収音信号とを生成する複数のサブ収音部と、
    該複数のサブ収音部から出力される各サブ収音信号の振幅に基づいて増幅率を決定する増幅率決定部と、
    前記メイン収音信号に前記増幅率を乗算した結果を出力信号として出力する増幅部と、
    を備え
    前記サブ収音部が第1サブ収音部と第2サブ収音部との2個からなり、
    前記増幅率決定部は、前記第2サブ収音部で得られる第2サブ収音信号の振幅に対する、前記第1サブ収音部で得られる第1サブ収音信号の振幅の割合に基づいて、前記増幅率を決定し、
    前記第1サブ収音部は、目的方向に最大収音感度を有し、前記第2サブ収音部は全ての方向に均一な感度を有する音信号処理装置。
  2. 前記メイン収音信号および前記複数のサブ収音信号に対してそれぞれに異なる周波数成分からなる帯域別収音信号を生成する帯域分割部と、
    前記帯域別収音信号毎に前記増幅率決定部と前記増幅部とを備える複数の周波数別信号生成部と、
    該複数の周波数別信号生成部から出力される複数の帯域別の出力信号を再構成した信号を出力する信号再構成部と、を備える請求項1に記載の音信号処理装置。
  3. 前記増幅率決定部は、前記割合を底とするべき乗値を前記増幅率に設定する、請求項1または請求項2に記載の音信号処理装置。
JP2009289905A 2009-12-22 2009-12-22 音信号処理装置 Expired - Fee Related JP5633144B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009289905A JP5633144B2 (ja) 2009-12-22 2009-12-22 音信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009289905A JP5633144B2 (ja) 2009-12-22 2009-12-22 音信号処理装置

Publications (2)

Publication Number Publication Date
JP2011135118A JP2011135118A (ja) 2011-07-07
JP5633144B2 true JP5633144B2 (ja) 2014-12-03

Family

ID=44347431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009289905A Expired - Fee Related JP5633144B2 (ja) 2009-12-22 2009-12-22 音信号処理装置

Country Status (1)

Country Link
JP (1) JP5633144B2 (ja)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH071959B2 (ja) * 1986-09-26 1995-01-11 松下電器産業株式会社 収音装置
JPH06284490A (ja) * 1993-03-24 1994-10-07 Sony Corp 適応型雑音低減システム及びこれを用いた未知の系の伝達特性同定方法
JPH07298387A (ja) * 1994-04-28 1995-11-10 Canon Inc ステレオ音声入力装置
JP2007096384A (ja) * 2005-09-27 2007-04-12 Yamaha Corp ノイズ除去装置およびノイズ除去プログラム
JP2007251801A (ja) * 2006-03-17 2007-09-27 Sony Corp 音響信号処理装置及び音響信号処理方法並びに音響信号処理用プログラム
JP4973287B2 (ja) * 2007-04-06 2012-07-11 ヤマハ株式会社 音処理装置およびプログラム
JP4336378B2 (ja) * 2007-04-26 2009-09-30 株式会社神戸製鋼所 目的音抽出装置,目的音抽出プログラム,目的音抽出方法

Also Published As

Publication number Publication date
JP2011135118A (ja) 2011-07-07

Similar Documents

Publication Publication Date Title
US11381906B2 (en) Conference system with a microphone array system and a method of speech acquisition in a conference system
JP4984683B2 (ja) 放収音装置
KR102214205B1 (ko) 공간 오디오 처리를 위한 2-스테이지 오디오 포커스
KR101555416B1 (ko) 음향 삼각 측량에 의한 공간 선택적 사운드 취득 장치 및 방법
KR101456866B1 (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
JP5050616B2 (ja) 放収音装置
JP6187626B1 (ja) 収音装置及びプログラム
JP4952396B2 (ja) スピーカアレイ装置、マイクアレイ装置および信号処理方法
JP5081245B2 (ja) 指向性マイクロホン装置
US9538288B2 (en) Sound field correction apparatus, control method thereof, and computer-readable storage medium
JP2001309483A (ja) 収音方法および収音装置
US8218787B2 (en) Microphone array signal processing apparatus, microphone array signal processing method, and microphone array system
JP2013236272A (ja) 音声処理装置および音声処理方法、並びにプログラム
JP5633145B2 (ja) 音信号処理装置
JP6147636B2 (ja) 演算処理装置、方法、プログラム及び音響制御装置
JP2019068133A (ja) 収音装置、プログラム及び方法
JP5633144B2 (ja) 音信号処理装置
JP6567216B2 (ja) 信号処理装置
JP5141442B2 (ja) 収音装置、及び放収音装置
JP2020053920A (ja) 収音装置、収音プログラム及び収音方法
JP5105336B2 (ja) 音源分離装置、プログラム及び方法
JP5331553B2 (ja) マルチチャンネル音響におけるインパルス応答測定システム、残響音生成装置、及び残響音生成システム
JP6879340B2 (ja) 収音装置、収音プログラム、及び収音方法
US10873805B2 (en) Sound processing apparatus and audio signals processing method thereof based on sound source position
JP2007318521A (ja) 放収音装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130806

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140711

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140916

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140929

LAPS Cancellation because of no payment of annual fees