JP6303385B2 - 収音解析装置および収音解析方法 - Google Patents

収音解析装置および収音解析方法 Download PDF

Info

Publication number
JP6303385B2
JP6303385B2 JP2013215709A JP2013215709A JP6303385B2 JP 6303385 B2 JP6303385 B2 JP 6303385B2 JP 2013215709 A JP2013215709 A JP 2013215709A JP 2013215709 A JP2013215709 A JP 2013215709A JP 6303385 B2 JP6303385 B2 JP 6303385B2
Authority
JP
Japan
Prior art keywords
sound collection
sound
index
state
acoustic signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013215709A
Other languages
English (en)
Other versions
JP2015080076A (ja
Inventor
祐 高橋
祐 高橋
近藤 多伸
多伸 近藤
田邑 元一
元一 田邑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2013215709A priority Critical patent/JP6303385B2/ja
Publication of JP2015080076A publication Critical patent/JP2015080076A/ja
Application granted granted Critical
Publication of JP6303385B2 publication Critical patent/JP6303385B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、収音装置による音響の収音状態を解析する技術に関する。
録音スタジオ等の音響空間で歌唱者による歌唱音や楽器の演奏音等を収録する場合、発音源に適度に接近した状態(オンマイク)に収音装置を保持することで、SN比が高い明瞭な音響を収録することが可能である。しかし、例えば音響収録に関する専門的な知識がない利用者にとって、収音装置の設置位置を適切に判断することは実際には困難である。
特許文献1には、超音波を発信および受信する超音波測距装置を利用して発音源と収音装置との距離を測定し、収音装置で収音された音響信号の周波数特性を測定結果に応じて補正する技術が開示されている。
特開2004−088610号公報
しかし、特許文献1の技術では、発音源からの音響を収録するための収音装置とは別個に超音波測距装置が必要であり、装置構成が複雑化するという問題がある。また、収音装置とは別個に設置された超音波測距装置が発信した超音波の反射波を受信することで距離が測定されるから、超音波測距装置による測距対象が実際に発音源である保証はない。したがって、適切な音響収録が実現できない可能性がある。以上の事情を考慮して、本発明は、装置構成の複雑化を抑制しながら収音状態を適切に評価することを目的とする。
以上の課題を解決するために、本発明の第1態様に係る収音解析装置は、収音装置が生成した音響信号の強度分布の非正規性に応じた収音状態指標を算定する指標算定手段と、指標算定手段が算定した収音状態指標に応じて収音装置による収音状態を利用者に報知する報知動作を、報知装置に実行させる報知制御手段とを具備する。以上の構成では、収音装置が生成する音響信号の解析により収音状態指標が算定されるから、収音装置とは別個の超音波測距装置が必要な特許文献1の技術と比較して、装置構成の複雑化を抑制しながら収音状態の良否を利用者に適切に報知できるという利点がある。第1態様における収音状態指標の好適例は、音響信号の強度分布の非正規性の指標となる高次統計量(例えば尖度)である。
本発明の第2態様に係る収音解析装置は、収音装置が生成した音響信号の残響成分を抑圧し、残響成分の抑圧後の音響信号と、残響成分の抑圧前の音響信号または残響成分との強度比に応じた収音状態指標を算定する指標算定手段と、指標算定手段が算定した収音状態指標に応じて収音装置による収音状態を利用者に報知する報知動作を、報知装置に実行させる報知制御手段とを具備する。以上の構成では、収音装置が生成する音響信号の解析により収音状態指標が算定されるから、第1態様の収音解析装置と同様に、装置構成の複雑化を抑制しながら収音状態の良否を利用者に適切に報知できるという利点がある。
第1態様に係る収音状態指標と第2態様に係る収音状態指標とは、発音源から収音装置に対して直接に到達する目的成分と目的成分以外の非目的成分との一方に対する他方の優勢度の指標として包括され得る。非目的成分の典型例は、発音源から放射されて音響空間の壁面で反射または散乱したうえで収音装置に到達する音響成分(間接音)や、目的の発音源とは別個の発音源から放射されて直接または間接に収音装置に到達する音響成分(妨害音)である。
本発明の好適な態様において、報知制御手段は、指標算定手段が算定した収音状態指標と閾値とを比較し、比較結果に応じた報知動作を報知装置に実行させる。以上の態様では、収音状態指標と閾値との比較結果に応じた報知動作が実行されるから、収音状態の良否を利用者が容易に確認できるという利点がある。
以上の各態様に係る収音解析装置は、収音状態の解析に専用されるDSP(Digital Signal Processor)等のハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラムとの協働によっても実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。また、本発明は、以上に説明した各態様に係る収音解析装置の動作方法(収音解析方法)としても特定される。
本発明の第1実施形態に係る音響装置の構成図である。 解析処理部の構成図である。 収音状態と音響信号の強度分布の尖度との関係のグラフである。 音響装置の動作のフローチャートである。 第2実施形態における指標算定部の動作のフローチャートである。
<第1実施形態>
図1は、本発明の第1実施形態に係る音響装置100の構成図である。第1実施形態の音響装置100は、音響空間内で歌唱者や楽器等の発音源200から放射された音響(例えば音声や楽音)を収音する録音機器である。図1に例示される通り、音響装置100は、演算処理装置12と記憶装置14と入力装置22と収音装置24と報知装置26とを具備するコンピュータシステムで実現される。第1実施形態では、可搬型の情報処理端末(例えばスマートフォンやタブレット端末)で音響装置100を実現した場合を想定する。なお、音響装置100の各要素を相互に別体とした構成(例えば収音装置24や報知装置26を外付けする構成)も採用され得る。
記憶装置14は、演算処理装置12が実行するプログラムや演算処理装置12が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置14として任意に採用される。入力装置22は、音響装置100に対する各種の指示のために利用者が操作する操作機器(例えば複数の操作子やタッチパネル)である。
収音装置24(マイクロホン)は、周囲の音響を収音して音響信号Xを生成する。なお、音響信号Xをアナログからデジタルに変換するA/D変換器の図示は便宜的に省略した。報知装置26は、各種の情報を利用者に報知する。第1実施形態の報知装置26は、画像表示により利用者に情報を報知する表示機器である。なお、音響の再生により利用者に情報を報知する放音機器(例えばスピーカ)を報知装置26として利用することも可能である。
演算処理装置12は、記憶装置14に記憶されたプログラムを実行することで、音響信号Xの収録に関する複数の機能(収録処理部32,解析処理部34)を実現する。なお、演算処理装置12の各機能を複数の装置に分散した構成や、専用の電子回路(例えばDSP)が演算処理装置12の一部の機能を実現する構成も採用され得る。
収録処理部32は、収音装置24が生成した音響信号Xを記憶装置14に記憶する収録処理を実行する。解析処理部34は、収音装置24による収音状態を解析して解析結果(収音状態の適否)を報知装置26から利用者に報知する解析処理を実行する。利用者は、入力装置22を適宜に操作することで収録処理または解析処理を音響装置100に指示することが可能である。報知装置26から報知される解析結果を考慮して利用者が音響装置100(収音装置24)を適切な位置に移動した状態で収録処理部32による収録処理が実行される。
図2は、解析処理部34の具体的な構成図である。図2に例示される通り、第1実施形態の解析処理部34は、指標算定部42と報知制御部44とを含んで構成される。指標算定部42は、収音装置24が生成する音響信号Xの解析で収音状態指標Qを算定する。収音状態指標Qは、収音状態の適否の評価尺度である。報知制御部44は、指標算定部42が算定した収音状態指標Qに応じた報知動作を報知装置26に実行させる。報知動作は、収音状態指標Qに応じた収音状態を利用者に報知する動作である。収音状態の評価(収音状態指標Q)について以下に詳述する。
収音装置24には、目的成分および非目的成分の双方が到達し得る。目的成分は、音響空間内の発音源200から放射されて直接に収音装置24に到達する音響成分(直接音)である。すなわち、目的成分は、収音装置24による本来的な収音対象に相当する。他方、非目的成分は、目的成分以外の音響成分(すなわち本来的には収音対象から除外されるべき音響成分)である。具体的には、発音源200から放射されて音響空間の壁面で反射または散乱したうえで収音装置24に到達する音響成分(間接音)や、収音対象の発音源200とは別個の発音源から放射されて直接または間接に収音装置24に到達する音響成分(妨害音)が非目的成分に包含される。
以上の通り、収音装置24による本来的な収音対象は目的成分であるから、目的成分のみが収音装置24に到達する状態(非目的成分が収音装置24に到達しない状態)が理想的な収音状態であり、目的成分が非目的成分に対して優勢であるほど収音状態は良好であると評価できる。以上の事情を考慮して、第1実施形態では、非目的成分に対する目的成分の優勢度に応じた収音状態指標Qを算定する。
目的成分と非目的成分との関係を評価する観点から、音響信号Xの強度分布(度数分布)に着目する。音響信号Xの強度分布は、周波数軸上の各周波数および時間軸上の各時点における音響信号Xの強度の度数分布に相当する。発音源200から放射された目的成分に多数の非目的成分が混合されるほど、音響信号Xの強度分布は正規分布に近付く(中心極限定理)という傾向がある。すなわち、音響信号Xの強度分布が正規分布から乖離する(非正規性が増加する)ほど、目的成分が非目的成分に対して優勢であると評価できる。以上の傾向を考慮して、第1実施形態では、音響信号Xの強度分布の非正規性に応じた収音状態指標Qを算定する。非正規性(非ガウス性)は、正規分布との相違の度合を意味する。すなわち、音響信号Xの強度分布が正規分布から乖離するほど非正規性は増加する。
第1実施形態の指標算定部42は、音響信号Xの非正規性の指標となる高次統計量に応じて収音状態指標Qを算定する。具体的には、指標算定部42は、音響信号Xの強度分布の尖度(kurtosis)κを収音状態指標Qとして算定する。尖度κは、音響信号Xの強度分布の2次モーメントμ2と4次モーメントμ4とを含む以下の数式(1)で表現される。
κ=μ4/μ2 2 ……(1)
具体的には、指標算定部42は、音響信号Xの周波数スペクトルを単位期間毎に算定し、時間軸上の複数の単位期間にわたる各周波数の強度(振幅またはパワー)の強度分布の尖度κを収音状態指標Qとして算定する。尖度κの算定には公知の方法が任意に採用される。例えば、音響信号Xの実際の強度から尖度κを算定する方法のほか、音響信号Xの強度分布を近似する確率分布(例えばガンマ分布)から尖度κを算定する方法も採用され得る。なお、音響信号Xの強度分布の尖度κの算定については、例えば特開2010−020013号公報や特開2012−163676号公報にも詳述されている。また、周波数軸上に画定された帯域毎に尖度κを算定し、複数の帯域にわたる尖度κの加重和を収音状態指標Qとして算定することも可能である。
音響信号Xの強度分布が正規分布に合致する場合の尖度κは3であり、音響信号Xの強度分布の非正規性が高いほど尖度κの数値は増加する。すなわち、収音状態指標Q(尖度κ)が大きいほど、音響信号Xの目的成分が非目的成分に対して優勢であるという傾向がある。以上の傾向から理解される通り、収音状態指標Qが大きいほど収音装置24による収音状態が良好であると評価できる。
図3は、発音源200と収音装置24との距離(横軸)と音響信号Xの強度分布の尖度κ(収音状態指標Q)との関係を示すグラフである。図3では、目的成分を放射する発音源200の近傍に非目的成分を放射する発音源を設置した環境での収音が想定されている。収音装置24が発音源200から離間する(理想的なオンマイクの収音状態から乖離する)ほど尖度κが減少するという傾向が図3からも確認できる。したがって、収音状態指標Qは、収音状態の適否の評価尺度として利用可能である。
収音装置24が発音源200に近付くほど音響信号Xにて目的成分が非目的成分に対して優勢となる(収音状態指標Qが増加する)から、収音状態指標Qは、収音装置24と発音源200との距離の指標としても観念される。すなわち、収音状態指標Qが大きいほど、収音装置24と発音源200とが近いと評価できる。また、収音装置24と発音源200とが充分に接近した状態は、収音状態として良好なオンマイクの状態と評価できる。以上の傾向を考慮すると、収音状態指標Qは、オンマイクの度合の指標としても利用され得る。すなわち、収音状態指標Qが大きいほどオンマイクの状態に近いと評価できる。
図4は、第1実施形態の音響装置100が実行する動作のフローチャートである。所定の時間毎に図4の処理が実行される。所望の発音源200からの音響を収録する収録処理に先立ち、利用者は、発音源200から音響が放射された状態(すなわち、収録処理と同様の状況)で収音装置24を任意の位置に保持し、入力装置22を適宜に操作することで音響装置100に解析処理を指示する。演算処理装置12は、解析処理が利用者から指示されたか否かを判定する(SA1)。解析処理が指示された場合(SA1:YES)、以下に例示される通り、解析処理部34による解析処理が実行される(SA2〜SA5)。解析処理が指示されない場合(SA1:NO)には解析処理は実行されない。
解析処理を開始すると、指標算定部42は、発音源200から放射された音響の収音により収音装置24が生成する音響信号Xを解析することで収音状態指標Qを算定する(SA2)。具体的には、指標算定部42は、数式(1)を参照して前述した通り、音響信号Xの強度分布の尖度κを収音状態指標Qとして算定する。報知制御部44は、以下に詳述する通り、指標算定部42が算定した収音状態指標Qに応じた収音状態を報知装置26から利用者に報知する(SA3〜SA5)。
報知制御部44は、指標算定部42が算定した収音状態指標Qと所定の閾値QTHとを比較して収音状態指標Qが閾値QTHを上回るか否かを判定する(SA3)。閾値QTHは、例えば経験的に良好と評価される収音状態における収音状態指標Qの数値を下回る(すなわち、良好な収音状態での収音状態指標Qが閾値QTHを上回る)ように実験的または統計的に事前に設定される。以上の説明から理解される通り、収音状態指標Qと閾値QTHとの比較(SA3)は、収音状態(収音装置24と発音源200との距離)の適否を評価する処理に相当する。
収音状態指標Qが閾値QTHを上回る場合(SA3:YES)、すなわち収音状態が良好である場合、報知制御部44は、収音状態が良好であることを利用者に報知する報知動作を報知装置26に実行させる(SA4)。具体的には、報知制御部44は、収音状態が良好であることや収音装置24を現在の位置に維持すべきことを意味する画像(メッセージ)を報知装置26に表示させる。他方、収音状態指標Qが閾値QTHを下回る場合(SA3:NO)、すなわち収音状態が良好でない場合、報知制御部44は、収音状態が良好でないことを利用者に報知する報知動作を報知装置26に実行させる(SA5)。具体的には、収音状態が良好でないことや収音装置24を発音源200に近付けるべきことを意味する画像を報知装置26に表示させる。
収音状態が良好でない場合、利用者は、収音装置24と発音源200との距離を適宜に調整したうえで(例えば収音装置24を発音源200に接近させたうえで)、入力装置22を操作して音響装置100に解析処理を指示する(SA1:YES)。以上のように収音状態指標Qの算定(SA2)や報知動作(SA3〜SA5)を含む解析処理と解析結果を加味した利用者による収音装置24の調整(移動)とが順次に反復され、解析結果が良好な収音状態に遷移すると、利用者は、収音装置24を直近の調整後の位置(すなわち良好な収音状態)に保持したまま、入力装置22を適宜に操作することで音響装置100に収録処理を指示する。
演算処理装置12は、収録処理が利用者から指示されたか否かを判定する(SA6)。収録処理が指示された場合(SA6:YES)、収録処理部32は収録処理を実行する(SA7)。すなわち、収録処理部32は、発音源200から放射された音響の収音により収音装置24が生成した音響信号Xを記憶装置14に格納する。すなわち、発音源200から放射された目的成分が非目的成分と比較して充分に優勢に収音装置24に到達する良好な収音状態(オンマイク)のもとで音響信号Xを収録することが可能である。
以上に説明した通り、第1実施形態では、収音装置24が生成する音響信号Xを解析することで、収音状態の評価に利用される収音状態指標Qが算定される。したがって、収音装置24とは別個の超音波測距装置が必要な特許文献1の技術と比較して音響装置100の複雑化が抑制されるという利点がある。また、発音源200が放射した音響を収音した音響信号Xから収音状態指標Qが算定されるから、実際に収音対象となる発音源200の収音状態が収音状態指標Qに忠実に反映される。したがって、超音波測距装置による測距対象が発音源200である保証がない特許文献1の技術と比較して適切な収録処理が実現されるという利点がある。
<第2実施形態>
本発明の第2実施形態を説明する。以下に例示する各構成において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図5は、第2実施形態の音響装置100の指標算定部42が収音状態指標Qを算定する処理(図4のステップSA2)のフローチャートである。第2実施形態の指標算定部42は、収音装置24が生成する音響信号Xから残響成分を抑圧することで音響信号Yを生成する。残響成分は、発音源200から放射されて音響空間の壁面で反射または散乱したうえで収音装置24に到達する非目的成分(初期反射成分および後部残響成分を含む間接音)である。残響成分の抑圧には公知の残響抑圧技術が任意に採用される。例えば特開2013−130857号公報や特開2009−212599号公報に開示された技術が、残響成分の抑圧に利用され得る。
第2実施形態の指標算定部42は、残響成分の抑圧結果を利用して収音状態指標Qを算定する(SB2)。具体的には、指標算定部42は、残響成分の抑圧後の音響信号Yと残響成分との強度比εを収音状態指標Qとして算定する。例えば以下の数式(2)で表現される通り、残響成分の抑圧後の音響信号Yの強度EYと残響成分の強度ERとの強度比ε(強度ERに対する強度EYの相対比)が収音状態指標Qとして算定される。強度EYおよび強度ERは、所定の期間にわたる振幅またはパワー(エネルギー)の平均や合計である。
ε=EY/ER ……(2)
収音装置24による収音状態が良好でない場合には、目的成分に対して残響成分が豊富に収音装置24に到達するから、残響成分の強度ERが音響信号Y(すなわち目的成分の推定結果)の強度EYに対して相対的に大きい数値となる。したがって、数式(2)の強度比ε(収音状態指標Q)は小さい数値となる。他方、収音装置24による収音状態が良好である場合には、音響信号Xにて残響成分と比較して目的成分が支配的となるから、音響信号Yの強度EYが残響成分の強度ERに対して相対的に大きい数値となる。したがって、強度比ε(収音状態指標Q)は大きい数値となる。以上の説明から理解される通り、第2実施形態においても第1実施形態と同様に、収音状態指標Qが大きいほど収音装置24による収音状態が良好であると評価できる。すなわち、第2実施形態の収音状態指標Qも、収音状態の適否の評価尺度として利用され得る。収音状態指標Qを利用した報知動作(SA3〜SA5)や収録処理部32が実行する収録処理(SA7)は第1実施形態と同様である。
第2実施形態においても、収音装置24が生成する音響信号Xを解析することで収音状態指標Qが算定されるから、第1実施形態と同様の効果が実現される。なお、第1実施形態にて尖度κ(収音状態指標Q)の信頼性を充分に担保するためには、比較的に長時間にわたる音響信号Xの強度分布が必要である。他方、第2実施形態では、残響成分の抑圧結果を利用して収音状態指標Qが算定されるから、残響成分の抑圧に適用される具体的な処理の内容にも依存するが、基本的には収音状態指標Qの算定に必要な音響信号Xの時間長が第1実施形態と比較して短縮されるという利点がある。他方、第1実施形態では、音響信号Xの強度分布の尖度κが収音状態指標Qとして算定されるから、発音源200から放射される音響自体に残響が重畳されている場合(目的成分が初期的に残響成分を包含する場合)にも収音状態を適切に評価できるという利点がある。
<第3実施形態>
第3実施形態の指標算定部42は、第1実施形態や第2実施形態と同様の収音状態指標Q(尖度κまたは強度比ε)に加えて直間比λを算定する。直間比λは、発音源200から収音装置24に直接に到達する直接音と音響空間内での反射や散乱後に収音装置24に到達する間接音との強度比(エネルギー比)である。直間比λの算定には公知の技術が任意に採用される。
具体的には、第3実施形態の収音装置24は、相異なる位置に配置されたM個(Mは2以上の自然数)の収音体(マイクロホン)で構成されるマイクロホンアレイである。指標算定部42は、以下に例示される通り、収音装置24の各収音体が生成するM系統の音響信号Xを解析することで直間比λを算定する。
M系統の音響信号Xの相互相関行列(空間相関行列)R(ω)は、以下の数式(3)で表現される。なお、数式(3)の記号ωは周波数を意味する。
R(ω)=PD(ω)RD(ω)+PR(ω)RR(ω) ……(3)
数式(3)の記号PD(ω)は直接音の強度(エネルギー)を意味し、記号PR(ω)は間接音の強度を意味する。また、数式(3)の記号RD(ω)は直接音の相互相関行列を意味し、記号RR(ω)は間接音の相互相関行列を意味する。収音装置24に対する発音源200の方向が既知であると仮定すると、直接音の相互相関行列RD(ω)と間接音の相互相関行列RR(ω)とは既知である。また、空間相関行列R(ω)は、収音装置24が生成するM系統の音響信号Xから算定される。したがって、数式(3)における直接音の強度PD(ω)と間接音の強度PR(ω)とは、例えば最小二乗法を利用して算定可能である。なお、直接音の強度PD(ω)と間接音の強度PR(ω)との算定は、収音装置24のM個の収音体を利用して発音源200の方向に収音の死角を形成する処理(死角制御型ビーム形成)に近似する。
第3実施形態の指標算定部42は、強度PD(ω)と強度PR(ω)とを適用した以下の数式(4)の演算で直間比λを算定する。数式(4)の記号Σωは、周波数軸上の全部の周波数ωにわたる総和を意味する。
λ=10・log10{ΣωD(ω)/ΣωR(ω)} ……(4)
以上の説明から理解される通り、直接音が間接音に対して相対的に優勢である(すなわち収音状態が良好である)ほど、直間比λは大きい数値に設定される。なお、以上に例示した直間比λの算定については、日岡等,“受音信号の直間比に基づく距離別収音の検討”,日本音響学会 2009年秋季研究発表会講演論文集,2-4-11,p.633-634にも記載されている。また、第3実施形態の指標算定部42は、M系統の音響信号Xの各々について第1実施形態または第2実施形態と同様の方法で収音状態指標Qを算定する。
報知制御部44は、指標算定部42が算定した収音状態指標Qと直間比λとに応じた報知動作を報知装置26に実行させる。具体的には、報知制御部44は、各音響信号Xに対応するM個の収音状態指標Qが閾値QTHを上回る場合、または、直間比λが所定の閾値λTHを上回る場合に(Q>QTH AND λ>λTH)、収音状態が良好であることを報知装置26から利用者に報知する。なお、各収音状態指標Qが閾値QTHを上回り、かつ、直間比λが閾値λTHを上回る場合に(Q>QTH OR λ>λTH)、収音状態が良好であることを報知することも可能である。
第3実施形態においても第1実施形態や第2実施形態と同様の効果が実現される。また、第3実施形態では、収音状態指標Qとは別個の方法で算定された直間比λが収音状態の評価に適用されるから、第1実施形態や第2実施形態と比較して収音状態を適切に評価できるという利点がある。
なお、第3実施形態の直間比λを単独で収音状態指標Qとして利用して収音状態を評価することも可能である。すなわち、第1実施形態の尖度κや第2実施形態の強度比εの算定は省略され得る。ただし、1系統の音響信号Xから直間比λを算定することは一般的に困難であるから、前述の例示の通り、複数(M系統)の音響信号Xを生成する収音装置24が収音状態指標Qの算定には必要である。他方、第1実施形態や第2実施形態によれば、1系統の音響信号Xから収音状態指標Qを算定できる(したがって装置構成が簡素化される)という利点がある。
<変形例>
前述の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
(1)第1実施形態では、音響信号Xの強度分布の非正規性に応じた収音状態指標Qを算定した。強度分布の非正規性の指標(収音状態指標Q)は、第1実施形態で例示した尖度κに限定されない。具体的には、尖度κに代表される高次統計量のほかに、公知の各種の情報量を強度分布の非正規性の指標として利用することが可能である。具体的には、エントロピー(平均情報量)やネゲントロピー等の統計量が非正規性の指標として好適である。エントロピーの算定には確率密度関数が必要であるから、例えば音響信号Xの強度分布が特定の確率分布(例えばガンマ分布)で近似される。ネゲントロピーは、音響信号Xの強度分布と分散および平均が共通する正規分布のエントロピーと音響信号Xのエントロピーとの差分を意味する。音響信号Xの強度分布の非正規性が高い(収音装置24による収音状態が良好である)ほど、エントロピーは小さい数値となり、ネゲントロピーは大きい数値となる。以上に例示したエントロピーやネゲントロピーのほか、KL(Kullback-Leibler)情報量や相互情報量等の各種の情報量を、音響信号Xの強度分布の非正規性の指標として収音状態指標Qの算定に適用することが可能である。
(2)前述の各形態では、収音状態指標Qと比較される閾値QTHを所定値に固定したが、閾値QTHを可変値とした構成も採用され得る。具体的には、過去の収音状態指標Qに応じて閾値QTHを制御する構成が想定される。例えば、過去の所定の期間にわたる収音状態指標Qの平均値に応じて閾値QTH(例えば収音状態指標Qの平均値の整数倍)が算定される。また、入力装置22に対する利用者からの指示に応じて閾値QTHを設定することも可能である。
(3)第3実施形態の例示からも理解される通り、収音状態指標Q(尖度κ,強度比ε)とは別個の指標を収音状態指標Qとともに収音状態の評価に利用することが可能である。例えば、収音装置24が生成した音響信号Xの強度(振幅やパワー)を順次に算定し、音響信号Xの強度が閾値を上回るという条件と、収音状態指標Qが閾値QTHを上回るという条件との双方が成立した場合に、収音状態を良好と判定(SA3:YES)する構成が想定される。
(4)前述の各形態では、収音装置24による収音状態が良好であるほど収音状態指標Qが大きい数値となるように収音状態指標Qを算定したが、収音状態の良否と収音状態指標Qの大小との関係は以上の例示に限定されない。すなわち、収音装置24による収音状態が良好であるほど収音状態指標Qが小さい数値となるように収音状態指標Qを算定することも可能である。例えば、音響信号Xの強度分布の尖度κの逆数を収音状態指標Qとして算定する構成や、残響成分の抑圧後の音響信号Yに対する残響成分の強度比ε(ε=ER/EY)を収音状態指標Qとして算定する構成(数式(2)の分子と分母とを逆転させた構成)も採用される。収音状態が良好であるほど収音状態指標Qが小さい数値となる構成では、図4のステップSA2において、収音状態指標Qが閾値QTHを下回るか否かが判定される。
(5)第2実施形態では、残響成分の抑圧後の音響信号Yの強度EYと残響成分の強度ERとの強度比εに応じて収音状態指標Qを算定したが、残響成分の抑圧結果を利用して収音状態指標Qを算定する方法は以上の例示に限定されない。例えば、残響成分の抑圧後の音響信号Yと抑圧前の音響信号Xとの強度比ε(例えば音響信号Xの強度EXに対する音響信号Yの強度EYの相対比EY/EX)に応じて収音状態指標Qを算定することも可能である。以上の説明から理解される通り、第2実施形態の指標算定部42は、残響成分の抑圧後の音響信号Yと、残響成分の抑圧前の音響信号Xまたは残響成分との強度比εに応じた収音状態指標Qを算定する要素として包括される。
(6)前述の各形態では、音響信号Xから算定される収音状態指標Qに応じて収音状態を評価したが、収音状態を撮像装置で撮像した画像(以下「収音画像」という)の解析結果を、収音状態指標Qを利用した収音状態の評価に加味することも可能である。具体的には、収音画像に対する画像認識処理で収音画像内の発音源200(例えば楽器のサウンドホールや歌唱者の口等)と収音装置24とを特定するとともに両者間の距離を推定し、推定結果と収音状態指標Qとに応じて収音状態を評価する。例えば、収音状態指標Qと収音画像の解析結果との双方または一方が所定の条件を充足する場合に収音状態を良好と判定することが可能である。また、複数の発音源200からの音響を複数の収音装置24で収録する場合には、収音画像を解析することで、相異なる発音源200に対して各収音装置24の収音状態が良好となる(すなわち複数の収音装置24が別個の発音源200に近接する)ように報知動作を実行することも可能である。
(7)前述の各形態では、収音状態の良否を利用者に報知する構成を例示したが(SA4,SA5)、解析処理の結果(収音状態指標Q)を利用した報知動作の内容は以上の例示に限定されない。例えば、収音状態が良好であることのみを利用者に報知する構成(図4のステップSA5を省略した構成)や、収音状態が良好でないことのみを利用者に報知する構成(図4のステップSA4を省略した構成)も採用される。また、収音状態指標Qに応じた収音状態の良否を報知する構成のほか、収音状態指標Qを収音状態の評価値(スコア)として利用者に報知する構成も好適である。所定の時間毎に解析処理を反復的に実行することで収音状態指標Qを時系列に算定し、単位時間内の収音状態指標Qの変化量(変化率)が閾値を上回る場合に利用者に報知(警告)することも可能である。以上の構成によれば、例えば収音状態の突発的な変動(例えば収録中の収音装置24のズレ等)を利用者が認識できるという利点がある。
(8)前述の各形態では、収音装置24が生成した音響信号Xを記憶装置14に格納する収録処理を例示したが、収録処理の内容は以上の例示に限定されない。例えば、収音装置24が生成した音響信号Xを他装置に送信する処理を収録処理部32が収録処理として実行することも可能である。
(9)携帯電話機等の端末装置と通信するサーバ装置により音響装置100を実現することも可能である。例えば、音響信号Xを生成する収音装置24と報知動作を実行する報知装置26とが端末装置に設置された構成を想定すると、音響装置100の指標算定部42は、端末装置から通信網を介して受信した音響信号Xの解析により収音状態指標Qを算定し、報知制御部44は、収音状態指標Qに応じた報知動作を端末装置の報知装置26に実行させる。
100……音響装置、200……発音源、12……演算処理装置、14……記憶装置、22……入力装置、24……収音装置、26……報知装置、32……収録処理部、34……解析処理部、42……指標算定部、44……報知制御部。

Claims (6)

  1. 収音装置が生成した音響信号の強度分布の非正規性に応じて、前記収音装置と発音源との距離を含む収音状態の指標である収音状態指標を算定する指標算定手段と、
    前記指標算定手段が算定した収音状態指標に応じて前記収音装置による収音状態を利用者に報知する報知動作を、報知装置に実行させる報知制御手段と
    を具備する収音解析装置。
  2. 前記指標算定手段は、前記音響信号の強度分布の非正規性の指標となる高次統計量に応じて前記収音状態指標を算定する
    請求項1の収音解析装置。
  3. 前記指標算定手段は、前記音響信号の強度分布の尖度に応じて前記収音状態指標を算定する
    請求項2の収音解析装置。
  4. 前記報知制御手段は、前記指標算定手段が算定した前記収音状態指標と、前記収音装置と前記発音源とを含む画像の解析により前記収音装置と前記発音源との距離を推定した結果とに応じて前記収音状態を利用者に報知する報知動作を、報知装置に実行させる
    請求項1から請求項3の何れかの収音解析装置。
  5. 前記報知制御手段は、前記指標算定手段が算定した収音状態指標と閾値とを比較し、前記比較の結果に応じた報知動作を前記報知装置に実行させる
    請求項1から請求項4の何れかの収音解析装置。
  6. コンピュータが、
    収音装置が生成した音響信号の強度分布の非正規性に応じて、前記収音装置と発音源との距離を含む収音状態の指標である収音状態指標を算定し、
    前記算定した収音状態指標に応じて前記収音装置による収音状態を利用者に報知する報知動作を、報知装置に実行させる
    収音解析方法。
JP2013215709A 2013-10-16 2013-10-16 収音解析装置および収音解析方法 Active JP6303385B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013215709A JP6303385B2 (ja) 2013-10-16 2013-10-16 収音解析装置および収音解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013215709A JP6303385B2 (ja) 2013-10-16 2013-10-16 収音解析装置および収音解析方法

Publications (2)

Publication Number Publication Date
JP2015080076A JP2015080076A (ja) 2015-04-23
JP6303385B2 true JP6303385B2 (ja) 2018-04-04

Family

ID=53011175

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013215709A Active JP6303385B2 (ja) 2013-10-16 2013-10-16 収音解析装置および収音解析方法

Country Status (1)

Country Link
JP (1) JP6303385B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6696140B2 (ja) 2015-09-30 2020-05-20 ヤマハ株式会社 音響処理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5277887B2 (ja) * 2008-11-14 2013-08-28 ヤマハ株式会社 信号処理装置およびプログラム
JP5402089B2 (ja) * 2009-03-02 2014-01-29 富士通株式会社 音響信号変換装置、方法、及びプログラム
JP5849758B2 (ja) * 2012-02-20 2016-02-03 株式会社Jvcケンウッド 通信装置、状態通知方法

Also Published As

Publication number Publication date
JP2015080076A (ja) 2015-04-23

Similar Documents

Publication Publication Date Title
US10665250B2 (en) Real-time feedback during audio recording, and related devices and systems
JP5290949B2 (ja) 音響処理装置及び方法
RU2626987C2 (ru) Устройство и способ для улучшения воспринимаемого качества воспроизведения звука путем объединения активного шумоподавления и компенсации воспринимаемого шума
JP5606234B2 (ja) 音響装置
US8971549B2 (en) Audio signal processing apparatus, audio signal processing method, and program
US10339953B2 (en) Howling detection method and apparatus
WO2016184138A1 (zh) 一种调整音频参数的方法、移动终端及计算机存储介质
Brooks et al. Investigation into the feasibility of using a parametric array control source in an active noise control system
JP2022089160A (ja) 電子機器におけるファンノイズを再形成するシステムおよび方法
JP5738218B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP5627440B2 (ja) 音響装置及びその制御方法、プログラム
JP6303385B2 (ja) 収音解析装置および収音解析方法
JP6003355B2 (ja) 残響時間解析装置
JP5609157B2 (ja) 係数設定装置および雑音抑圧装置
JPWO2006035776A1 (ja) 音場測定方法および音場測定装置
JP2013170936A (ja) 音源位置判定装置、音源位置判定方法、プログラム
JP4533126B2 (ja) 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
CN114627897A (zh) 音频信号异常监测方法、装置、设备、介质和程序产品
JP6299279B2 (ja) 音響処理装置および音響処理方法
JP6171558B2 (ja) 音響処理装置
JP5691866B2 (ja) マスキング解析装置,マスカー音選択装置,マスキング装置およびプログラム
JP2005062096A (ja) 話者位置検出方法、装置、プログラム、および記録媒体
JP2005352255A (ja) 雑音消去装置、音響再生システム、および雑音消去方法
JP6036141B2 (ja) 音響処理装置
JP2015169901A (ja) 音響処理装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150410

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170808

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180219

R151 Written notification of patent or utility model registration

Ref document number: 6303385

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151