JP2013085114A - 音声処理装置および音声処理方法、記録媒体、並びにプログラム - Google Patents

音声処理装置および音声処理方法、記録媒体、並びにプログラム Download PDF

Info

Publication number
JP2013085114A
JP2013085114A JP2011223448A JP2011223448A JP2013085114A JP 2013085114 A JP2013085114 A JP 2013085114A JP 2011223448 A JP2011223448 A JP 2011223448A JP 2011223448 A JP2011223448 A JP 2011223448A JP 2013085114 A JP2013085114 A JP 2013085114A
Authority
JP
Japan
Prior art keywords
measurement
measurement signal
output
unit
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011223448A
Other languages
English (en)
Inventor
Homare Kon
誉 今
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2011223448A priority Critical patent/JP2013085114A/ja
Publication of JP2013085114A publication Critical patent/JP2013085114A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音声出力を高音質化する。
【解決手段】計測部111は、スピーカを備える出力部112に音声信号を供給して音声を出力させる。マイクロフォン113は、出力部112の音声を計測して計測部111に供給する。計測部111は、計測結果に基づいて、出力部112の逆フィルタを生成し設定する。計測部111は、マイクロフォン113の位置を変えながら、出力部112に逆フィルタを設定し、それを介して音声を出力させ、計測信号を取得する。計測部111は、マイクロフォン113の位置を変えながら計測した計測信号による周波数振幅特性と、理想的な周波数振幅特性との差分からなる誤差評価関数を算出する。計測部111は、視聴想定位置にマイクロフォン113を設置して計測信号を取得し、誤差評価関数で補正して逆フィルタを算出し、出力部112の補正フィルタとして設定する。本技術は、オーディオプレイヤに適用することができる。
【選択図】図1

Description

本技術は、音声処理装置および音声処理方法、記録媒体、並びにプログラムに関し、特に、音声出力を高音質化できるようにした音声処理装置および音声処理方法、記録媒体、並びにプログラムに関する。
音響装置を設計するにあたり、音響装置全体の音響特性を予め測定し、逆フィルタやイコライジングにより出力される音声を高音質化する技術が普及している。
例えば、音声信号を帯域分割前に全帯域に渡った逆フィルタからなる補正フィルタにより補正する技術が提案されている(特許文献1参照)。
特開2005−184040号公報
しかしながら、スピーカユニット自体の逆フィルタからなる補正フィルタを生成するにあたり、インパルスレスポンスを測定する際、スピーカユニットの筐体や、その形状、または、スピーカユニットを含む筐体に設けられたボタン、スイッチ、スリット、若しくは固定ネジなどによって発生される干渉波の影響を受けるため、精度のよい補正フィルタを生成することができなかった。
本技術は、このような状況に鑑みてなされたものであり、特に、干渉波による影響を考慮した補正フィルタを生成できるようにすることで、音声出力を高音質化させるものである。
本技術の一側面の音声処理装置は、入力された音声信号に基づいて、スピーカより出力された音声出力を計測し、計測信号として出力する計測部と、前記計測部により計測された計測信号に基づいて、前記スピーカの逆フィルタを生成する逆フィルタ生成部と、前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測部により計測された音声出力の計測結果である計測信号と、理想的な計測信号との誤差を評価する誤差評価関数を算出する誤差評価関数算出部と、前記逆フィルタを介さずに入力された音声信号に基づいて、前記スピーカより出力され、視聴位置において、前記計測部により計測された計測信号を、前記誤差評価関数に基づいて補正する計測信号補正部とを含む。
前記逆フィルタ生成部には、前記計測信号補正部により補正された計測信号に基づいて、前記スピーカの逆フィルタを生成させるようにすることができる。
前記計測部には、前記音声信号に基づいて、前記スピーカより出力された音声出力を、前記スピーカからの位置を変更して複数回数計測して、計測信号を出力し、前記逆フィルタ生成部には、前記計測部により計測された回数分だけ、前記計測信号に基づいて、前記スピーカの逆フィルタを生成させ、前記誤差評価関数算出部には、前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測部により計測された音声出力の計測結果である計測信号について、計測された回数分の前記計測信号と、理想的な結果との誤差の、加算平均を誤差評価関数として算出させ、前記計測信号補正部には、前記誤差の加算平均からなる誤差評価関数に基づいて、前記計測信号を補正させるようにすることができる。
前記音声信号は、離散的な異なる複数の周波数からなる音声信号とすることができ、前記誤差評価関数は、前記音声信号の周波数と前記誤差の加算平均との関係が示された関数とすることができ、前記計測信号補正部には、前記誤差評価関数と所定の閾値との比較により、前記誤差評価関数が前記所定の閾値よりも高い周波数帯域について、その近傍の周波数帯域であって、前記誤差評価関数が所定の閾値よりも小さい計測信号を用いて、前記誤差評価関数が前記所定の閾値よりも高い周波数帯域の計測信号を補正させるようにすることができる。
本技術の一側面の音声処理方法は、入力された音声信号に基づいて、スピーカより出力された音声出力を計測し、計測信号として出力する計測処理をし、前記計測処理により計測された計測信号に基づいて、前記スピーカの逆フィルタを生成する逆フィルタ生成処理をし、前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測処理により計測された音声出力の計測結果である計測信号と、理想的な計測信号との誤差を評価する誤差評価関数を算出する誤差評価関数算出処理をし、前記逆フィルタを介さずに入力された音声信号に基づいて、前記スピーカより出力され、視聴位置において、前記計測部により計測された計測信号を、前記誤差評価関数に基づいて補正する計測信号補正処理するステップを含む。
本技術の一側面のプログラムは、コンピュータを、入力された音声信号に基づいて、スピーカより出力された音声出力を計測し、計測信号として出力する計測部と、前記計測部により計測された計測信号に基づいて、前記スピーカの逆フィルタを生成する逆フィルタ生成部と、前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測部により計測された音声出力の計測結果である計測信号と、理想的な計測信号との誤差を評価する誤差評価関数を算出する誤差評価関数算出部と、前記逆フィルタを介さずに入力された音声信号に基づいて、前記スピーカより出力され、視聴位置において、前記計測部により計測された計測信号を、前記誤差評価関数に基づいて補正する計測信号補正部として機能させる。
本技術の一側面の記録媒体は、請求項5に記載のプログラムが記録されている。
本技術の一側面においては、入力された音声信号に基づいて、スピーカより出力された音声出力が計測され、計測信号として出力され、計測された計測信号に基づいて、前記スピーカの逆フィルタが生成され、前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、計測された音声出力の計測結果である計測信号と、理想的な計測信号との誤差を評価する誤差評価関数が算出され、前記逆フィルタを介さずに入力された音声信号に基づいて、前記スピーカより出力され、視聴位置において、計測された計測信号が、前記誤差評価関数に基づいて補正される。
本技術の音声処理装置は、独立した装置であっても良いし、音声処理を行うブロックであっても良い。
本技術によれば、音声出力を高音質化することが可能となる。
本技術の音声処理装置を適用した計測システムの構成例を示す図である。 図1の計測部の構成例を説明する図である。 図1の出力部の構成例を説明する図である。 図1の計測システムによる誤差評価関数生成処理を説明するフローチャートである。 計測信号、および誤差評価関数の波形を説明する図である。 出力部による干渉波を説明する図である。 干渉波の伝搬遅延時間を説明する図である。 出力部とマイクロフォンとの位置関係を説明する図である。 図1の計測システムによるフィルタ係数特定処理を説明するフローチャートである。 汎用のパーソナルコンピュータの構成例を説明する図である。
[本技術の音声処理装置を適用した計測システムの構成例]
図1を参照して、本技術の音声処理装置を適用した計測部を含む計測システムの構成を説明する。図1の計測システムは、計測部111、出力部112、およびマイクロフォン113より構成される。計測部111は、音声信号を出力部112に対して供給し、音声として出力させる。また、計測部111は、音声信号に基づいて、出力部112が内蔵する逆フィルタからなる補正フィルタ173(図3)を使用せずに出力する音声を、マイクロフォン113で計測する。マイクロフォン113は、計測した音声に対応する計測信号を生成して、計測部111に供給する。計測部111は、この計測結果である計測信号に基づいて、出力部112に内蔵される逆フィルタからなる補正フィルタ173の係数を算出し、算出した係数を係数メモリ174(図3)に記憶させる。さらに、計測部111は、音声信号に基づいて、出力部112が内蔵する逆フィルタからなる補正フィルタ173を使用して出力する音声を計測する。計測部111は、マイクロフォン113の設置位置を変えながら、その度に、逆フィルタからなる補正フィルタ173を設定し、その補正フィルタ173を介して出力される音声の計測信号を取得する。
計測部111は、マイクロフォン113の位置を変えながら計測した計測結果により得られる周波数振幅特性と、目標とする周波数振幅特性との差分から、出力部112を構成する形状等により生じる干渉波による誤差を誤差評価関数として算出する。そして、計測部111は、最終的に視聴が想定される位置にマイクロフォン113を設置した状態で、補正フィルタ173を使用することなく計測した計測信号を、誤差評価関数で補正し、補正した計測信号に基づいて逆フィルタからなる補正フィルタ173の係数を特定し、係数メモリ174に記憶させる。
すなわち、計測部111は、マイクロフォン113の位置を変えながら計測信号を取得することで、出力部112を構成する形状等により生じる干渉波による影響を誤差評価関数として算出する。そして、計測部111は、最終的に視聴位置に設置されたマイクロフォン113により計測される、補正フィルタ173を介さずに出力部112より出力される音声信号の計測結果である計測信号から、視聴位置における視聴に最適な補正フィルタ173を生成する。結果として、出力部112を構成する形状等により生じる干渉波の影響を低減した補正フィルタを出力部112に設定できるので、音声出力を高音質化することが可能となる。
[計測部および出力部の構成例]
次に、図2,図3を参照して、計測部111、および出力部112の構成例について説明する。
計測部111は、ADC(Analog Digital Converter)131、演算部132、およびDAC(Digital Analog Converter)133を備えている。ADC131は、マイクロフォン113により計測された音声に対応する計測信号をアナログ信号からデジタル信号に変換して、演算部132に供給する。DAC133は、演算部132より供給される音声信号をデジタル信号からアナログ信号に変換して出力部112に供給し、音声を出力させる。
演算部132は、係数生成部151、信号生成部152、誤差評価関数算出部153、スイッチ制御部154、および計測信号補正部155を備えている。信号生成部152は、音声信号を生成して、DAC133を介して出力部112に供給し、音声として出力させる。スイッチ制御部154は、出力部112に設けられたスイッチ172を制御して、端子172aまたは172bに接続することで、補正フィルタ173のオン、またはオフを制御する。
係数生成部151は、スイッチ制御部154が補正フィルタ173をオフにした状態で出力部112より出力され、マイクロフォン113で計測された音声を計測信号として取得する。そして、係数生成部151は、信号生成部152から出力部112に供給した音声信号および計測信号から出力部112の補正フィルタ173の係数を算出し生成する。係数生成部151は、生成した補正フィルタ173に使用する係数を係数メモリ174に記憶させる。
誤差評価関数算出部153は、マイクロフォン113の位置を変化させながら設定された補正フィルタ173がオンの状態で、出力部112より出力された音声が、マイクロフォン113により計測されたときの計測信号と、理想的な計測信号との誤差の加算平均からなる誤差評価関数を算出する。誤差評価関数は、横軸に周波数をとり、縦軸に誤差評価をとる波形で示されるものである。したがって、誤差評価関数により、誤差評価が大きな周波数帯域が干渉波による影響を受けている周波数帯域であることがわかる。
計測信号補正部155は、スイッチ制御部154が補正フィルタ173をオフにした状態で出力部112より出力され、取得された視聴想定位置に設置されたマイクロフォン113で計測された音声の計測信号を誤差評価関数に基づいて補正する。より詳細には、計測信号補正部155は、誤差評価関数のうち、誤差評価が所定の閾値よりも大きな周波数、または、誤差評価が所定の閾値よりも大きな周波数帯域の計測信号については、その近傍の所定の閾値よりも小さな計測信号を用いて補正する。係数生成部151は、補正された計測信号に基づいて、逆フィルタである補正フィルタ173を算出し、その係数を生成する。そして、係数生成部151は、視聴想定位置で生成した補正フィルタ173の係数を係数メモリ174に記憶させる。
出力部112は、ADC171、スイッチ172、補正フィルタ173、係数メモリ174、増幅部175、およびスピーカ176を備えている。ADC171は、計測部111より供給されてくるアナログ信号からなる音声信号をデジタル信号に変換し、スイッチ172に供給する。スイッチ172は、計測部111のスイッチ制御部154により制御され、端子172aまたは172bに接続される。端子172aの後段には増幅部175が設けられており、増幅部175は、供給されてきた音声信号を増幅し、スピーカ176に供給し音声として出力させる。端子172bの後段には、補正フィルタ173が設けられており、補正フィルタ173は、計測部111により記憶され係数メモリ174に記憶されている係数を読み出して、供給されてきた音声信号にフィルタ処理を施し増幅部175に供給する。すなわち、スイッチ172が端子172aに接続されているとき、補正フィルタ173はオフの状態とされ、スイッチ172が端子172bに接続されているとき、補正フィルタ173はオンの状態とされる。
[誤差評価関数生成処理]
次に、図4のフローチャートを参照して、誤差評価関数生成処理について説明する。
ステップS1において、計測部111の演算部132は、未測定の測定位置にマイクロフォン113がセットされたか否かを判定し、未測定の測定位置にマイクロフォン113がセットされた場合、処理は、ステップS2に進む。
ステップS2において、演算部132は、スイッチ制御部154を制御して、出力部113の補正フィルタ173をオフに設定させる。すなわち、スイッチ制御部154は、スイッチ172を制御して、端子172aに接続させる。
ステップS3において、信号生成部151は、音声信号を発生し、DAC133を介してアナログ信号としての音声信号を出力部112に供給する。出力部112においては、音声信号がADC171より入力されると、スイッチ172および端子172aより、補正フィルタ173を介すことなく、音声信号が増幅部175に供給される。そして、増幅部175は、音声信号を増幅して、スピーカ176より音声を出力する。マイクロフォン113は、スピーカ176より出力される音声を計測し、計測結果である計測信号を計測部111に出力する。
ステップS4において、係数生成部151は、補正フィルタ173を介すことなく出力された音声に対応する計測信号に基づいて、出力部112に対応する逆フィルタの係数を算出する。
ステップS5において、係数生成部151は、算出した逆フィルタの係数を、出力部112の補正フィルタ173の補正係数として係数メモリ174に記憶させる。これにより、出力部112の補正フィルタ173は、係数メモリ174に記憶されている係数を読み出すことで、逆フィルタとして機能することが可能となる。
ステップS6において、演算部132は、スイッチ制御部154を制御して、出力部113の補正フィルタ173をオンに設定させる。すなわち、スイッチ制御部154は、スイッチ172を制御して、端子172bに接続させる。
ステップS7において、信号生成部151は、音声信号を発生し、DAC133に供給する。DAC133は、デジタル信号からなる音声信号をアナログ信号に変換し、出力部112に供給する。出力部112においては、デジタル信号からなる音声信号がADC171より入力されると、デジタル信号に変換されて、スイッチ172および端子172bより、補正フィルタ173が掛けられて、増幅部175を経て、スピーカ176より音声として出力される。マイクロフォン113は、スピーカ176より出力される音声を計測し、計測結果である計測信号を取得する。
ステップS8において、誤差評価関数算出部153は、補正フィルタ173が掛けられた状態でスピーカ176より出力されている音声に基づいた計測信号と、ターゲットとなる計測結果との差分から誤差評価関数を算出する。そして、誤差評価関数算出部153は、測定点毎に求められた誤差評価関数の加算平均を求めて順次誤差評価関数を更新し記憶する。
ステップS9において、演算部132は、誤差評価関数の算出処理が終了であるか否かを判定する。より具体的には、演算部132は、例えば、誤差評価関数が所定数の測定点の加算平均となったか否かに基づいて判定する。ステップS9において、誤差評価関数の算出が終了していないと判定された場合、処理は、ステップS1に戻り、それ以降の処理が繰り返される。そして、ステップS9において、所定数の測定点の加算平均となり、誤差評価関数の算出が終了したとみなされた場合、処理は、終了する。
すなわち、ステップS3の処理により、マイクロフォン113により計測される計測信号に基づいた周波数振幅特性は、出力部112の筐体や形状から発生する干渉波の影響がない理想的な状態であるとき、例えば、図5の最上段で示されるような波形となる。尚、図5においては、横軸が計測信号における周波数(角周波数)であり、縦軸が振幅である。そして、この図5の最上段で示されるような理想的な波形が取得される場合、この計測信号に基づいて、ステップS4において、逆フィルタが求められることにより、ステップS5,S6の処理で補正フィルタ173が設定され、この状態で、ステップS7の処理による計測信号に基づいた周波数振幅特性は、図5の2段目で示されるような波形となる。
すなわち、図5の2段目で示されるように、ターゲットとなる周波数振幅特性が得られることになる。この場合、全帯域において理想的な周波数振幅特性が得られるため誤差評価は必要のない状態となる。
しかしながら、ステップS3の処理により、マイクロフォン113により計測される計測信号に基づいた周波数振幅特性は、現実には、出力部112の筐体や形状から発生する干渉波の影響を受けるため、例えば、図5の3段目で示される波形となる。図5の3段目の波形の例においては、2kHz近傍に深いディップ(凹み波形)が生じている。ステップS4の処理において、図5の3段目の波形のような周波数振幅特性を持った計測信号から、逆フィルタが求められ、補正フィルタ173として設定された後、ステップS7の処理により計測される計測信号の周波数振幅特性は、例えば、図5の4段目で示されるような波形となる。すなわち、図5の4段目の波形で示されるように、補正フィルタ173の係数を設定したときの図5の3段目の波形と同様に、補正フィルタ173により波形が補正されているにもかかわらず、2kHz近傍にディップが生じている。
図5の最上段で示されるような理想的な周波数振幅特性が得られる条件は、スピーカ176を含む出力部112が、例えば、図6の上段で示されるように、無限大バッフルモデルと呼ばれる無限に続く壁に嵌め込まれているような場合や、図示しないが筐体がJIS(日本工業規格)箱と呼ばれるスピーカユニットの特性を測定するためにJIS規格によって定めれれた箱である場合などの特殊な条件に限られる。
現実には、図6の下段で示されているように、出力部112の筐体のエッジ112a,112bなどから干渉波V1,V2が発生し、マイクロフォン113においては、この干渉波の影響を受けた音声が計測される。
この干渉波は、スピーカ176を含む出力部112の筐体の物理的構造、および、筐体(エンクロージャ)の形状に起因するものであり、特に携帯端末などではボタン、スリット、スイッチなどの形状が影響して生じるものである。また、この干渉波は、測定対象となるスピーカ176を備えた出力部112の位置から測定点であるマイクロフォン113までの距離に比べて十分に波長が短い場合に生じる。
例えば、図7で示される出力部112から測定点であるマイクロフォン113までの直線距離が距離dであるものとし、出力部112の筐体のエッジ112bからマイクロフォン113までの距離がdrであるものとする。この場合の、スピーカ176より出力される音声がマイクロフォン113までの伝搬経路は距離dとなり、エッジ112bで発生する干渉波がマイクロフォン113までの伝搬経路は距離drとなる。このとき、スピーカ176からの音声がマイクロフォン113に到達するまでの時間はd/c(sec)(cは音速)であり、干渉波が到達するまでの時間は、出力部112の筐体幅がRであれば、(dr+R/2)/c(sec)となる。筐体幅Rに比べて距離dが十分に大きい場合、時間差は略(R/2)/c(sec)となる。このような時間差では、大抵の家庭用音響機器の場合、仮に48kHzでサンプリングし、データ収集したとしても、数十サンプル以内の伝搬時間差となため、この影響を窓関数などで取り除くことは非常に困難である。
そこで、ステップS8の処理において、誤差評価関数算出部153は、理想的な周波数振幅特性の波形と、算出された周波数特性の波形との差分を誤差評価関数として算出する。より具体的には、誤差評価関数とは、以下のように定義される。例えば、ステップS3の処理でマイクロフォン113により計測される音声である計測信号の周波数振幅特性が以下の式(1)で定義されるとき、ステップS7の処理で計測される計測信号の周波数振幅特性は以下の式(2)で定義される。
Y(ω,θ,r)=R(ω,r)G(ω,θ)S(ω)X(ω)
・・・(1)
(ω,θ,r)=R(ω,r)G(ω,θ)S(ω)H(ω,θ,r)X(ω)
・・・(2)
ここで、ωは角周波数を、θ,rは、それぞれ図8で示されるように、出力部112のスピーカ176の指向方向とマイクロフォン113との角度、および距離を表している。尚、図8においては、マイクロフォン113を所定の測定点mにおいた場合の例として添え字が付された角度θm,rmと表記されている。また、Y(ω,θ,r)は、ステップS2の処理で計測された計測信号の周波数振幅特性を、Y(ω,θ,r)は、ステップS7の処理で計測された計測信号の周波数振幅特性をそれぞれ表している。さらに、R(ω,r)は、球面波の伝搬特性を、G(ω,θ)は、出力部112のスピーカ176の指向特性を、S(ω)は、スピーカ176の角周波数特性を、X(ω)は、出力部112への角周波数入力を、H(ω,θ,r)は、補正フィルタ173を、それぞれ表している。
ここで、スピーカ176の角周波数特性S(ω)が、図5の2段目で示されるようなターゲットとなる理想的な特性である場合、特に、角周波数特性S(ω)であるものとすれば、補正フィルタH(ω,θ,r)は、以下の式(3)で表現されることになる。
H(ω,θ,r)=S(ω)/(R(ω,r)G(ω,θ)S(ω))
・・・(3)
したがって、所定の測定点mにおいて、式(3)で示される理想的な補正フィルタH(ω,θ,r)を用いた場合、以下の式(4)で示される関係が成立することになる。
(ω,θ,r)=S(ω)X(ω)
・・・(4)
ここで、Y(ω,θ,r)は、所定の測定点mにマイクロフォン113が設置された場合のステップS7の処理で計測される計測信号の周波数振幅特性である。
しかしながら、上述したように、一般的な構成の場合、式(4)で示されるような関係とはならないことから、ステップS8の処理により、誤差評価関数算出部153は、以下の式(5)で定義される誤差評価関数D(ω)を算出する。
Figure 2013085114
・・・(5)
ここで、式(5)の誤差評価関数D(ω)は、2点以上の複数点の測定点にマイクロフォン113が設置され、それぞれの位置で、ステップS7の処理で計測される計測信号のうち、離散化された角周波数がωであるものについての誤差評価関数である。また、Mは、測定点の点数である。誤差評価関数D(ω)は、2点以上の複数点の加算平均として求められているが、現実には1点でも求められるものである。しかしながら、複数の測定点における計測信号を用いることにより、スピーカ176の指向特性による影響や、測定誤差による影響を低減することが可能となる。
この式(5)で示される離散化された角周波数毎の誤差評価関数に基づいて、横軸に角周波数をとり、縦軸に誤差の振幅をとった波形が、例えば、図5の5段目に示される波形である。図5の5段目の波形によれば、誤差評価関数が大きな角周波数については、2kHz付近の帯域において、出力部112のエッジや筐体の形状による干渉波による影響を受けているものと予想される。
以上の処理により、図5の5段目で示されるような、出力部112のエッジや筐体の形状による干渉波が発生していることがわかる誤差評価関数を求めることが可能となる。
[補正フィルタ係数特定処理]
次に、図9のフローチャートを参照して、視聴想定位置にマイクロフォン113を設定したときに、誤差評価関数を利用して、干渉波による影響を考慮した補正フィルタ173の係数を特定する補正フィルタ係数特定処理について説明する。
ステップS21において、計測部111の演算部132は、視聴想定位置にマイクロフォン113がセットされたか否かを判定し、視聴想定位置にマイクロフォン113がセットされた場合、処理は、ステップS22に進む。
ステップS22において、演算部132は、スイッチ制御部154を制御して、出力部113の補正フィルタ173をオフに設定させる。すなわち、スイッチ制御部154は、スイッチ172を制御して、端子172aに接続させる。
ステップS23において、信号生成部151は、音声信号を発生し、DAC133を介してアナログ信号としての音声信号を出力部112に供給する。出力部112においては、音声信号がADC171より入力されると、スイッチ172および端子172aより、補正フィルタ173を介すことなく増幅部175を経て、スピーカ176より音声が出力される。マイクロフォン113は、スピーカ176より出力される音声を計測し、計測結果である計測信号を取得する。
ステップS24において、計測信号補正部155は、誤差評価関数算出部153に記憶されている誤差評価関数を読み出し、いずれかの角周波数において、または、いずれかの角周波数の範囲において、所定の閾値よりも大きいか否かを判定する。すなわち、計測信号補正部155は、誤差評価関数に基づいて、干渉波による影響を受けている角周波数、または各周波数の範囲が存在するか否かを判定する。ステップS24において、例えば、図5の5段目で示される波形のような誤差評価関数である場合、2kHz付近においてディップが存在し、すなわち、干渉波による影響を受けている範囲が存在するとみなされるので、処理は、ステップS25に進む。尚、所定の閾値としては、例えば、2乃至4dB程度である。
ステップS25において、計測信号補正部155は、視聴想定位置に設定されたマイクロフォン113により計測された計測信号により得られる周波数振幅特性を補正する。尚、指向特性G(ω,θ)については、スピーカ176を含む出力部112と、出力部112の筐体に依存するものであり、補正フィルタ173での補正は困難であるため、推定視聴位置の角度の補正が理想的である。また、伝搬特性R(ω,r)は、基本的に距離減衰するものであり、全帯域の音量に相当する変化になるため、距離rは特に規定しない。従って、補正は、原則的に想定される出力部112と視聴想定位置との設置角度θに基づいたものとなる。そこで、ここでは、計測信号補正部155が、例えば、最も基本的な推定方法として、設置角度が真正面(θ=0)であるときの計測信号に基づいて、角周波数ωn+jであるときに1次線形近似により補正する例について説明する。
例えば、図5の5段目で示されるように干渉波が、2kHz近傍の範囲となるので、計測信号補正部155は、この角周波数ω乃至ωn+kの範囲における各周波数ωn+jにおける計測信号を、以下の式(6)で示されるように補正する。
(ωn+j,θ,r
=Y(ω,θ,r)+j×(Y(ωn+k,θ,r)+Y(ω,θ,r))/k
・・・(6)
ここで、Y(ωn+j,θ,r)は、補正後の計測信号Yである。また、角周波数ωは、均等間隔で離散化されているものとする。すなわち、例えば、角周波数ω乃至ωn+kの範囲については、計測信号の波形が、図5の2段目であるような場合、図5の6段目の細線で示されるような直線Tで表される。結果として、図5の最上段で示される理想的な計測信号の周波数振幅特性に近い波形に補正することが可能となる。尚、角周波数ωが、均等間隔の離散化されたものではない場合、その離散された間隔の大きさによって重み付けするようにして補正するようにしてもよい。また、上記の近似の際に、直線的になるのが好ましくない場合、近傍の点を用いて、線形近似後に補間区域近傍のみで移動平均を取るようにして、変化を滑らかにしてもよい。さらに、前後の変化から曲線近似することで滑らかな曲線になるように補正してもよい。
尚、ステップS24において、干渉波の影響を受けていると思われる範囲が存在しない場合、補正処理の必要がないため、ステップS25の処理がスキップされる。
ステップS26において、係数生成部151は、補正フィルタ173を介すことなく出力された音声が計測された計測信号、または、計測信号補正部155により補正された計測信号に基づいて、出力部112に対応する逆フィルタである補正フィルタ173の係数を算出する。すなわち、図5の6段目で示されるような補正された計測信号の周波数振幅特性に基づいて、補正フィルタ173の係数を算出する場合、係数生成部151は、角周波数ω乃至ωn+kの範囲については、直線Tで示される値を利用して補正フィルタを生成し、角周波数ω乃至ωn+k以外の範囲については、計測信号により求められた値をそのまま利用して補正フィルタを生成する。
ステップS27において、係数生成部151は、算出した逆フィルタの係数を出力部112の補正フィルタ173の補正係数として係数メモリ174に記憶させる。これにより、出力部112の補正フィルタ173は、係数メモリ174に記憶されている係数を読み出すことにより、干渉波による影響が考慮された逆フィルタとして機能することが可能となる。
以上の処理により、計測信号のうち、干渉波による影響を受ける角周波数帯域については、干渉波による影響を受けていない範囲の計測信号を用いて逆フィルタを生成して、補正フィルタ173の係数として係数メモリ174に記憶させることが可能となり、結果として干渉波による影響を低減した逆フィルタを生成することが可能となり、理想的な周波数振幅特性に類似した特性を得ることが可能となる。
尚、本技術により、設置位置が頻繁に変わるようなモバイル機器に組み込まれるスピーカそのものの周波数振幅特性が補正されることになるので、設置位置に大きく左右されることのない、高音質のスピーカとして使用することが可能となる。
また、スピーカシステムが組み込まれた製品のデザインが途中で変更されたることにより、製品の筐体形状が変更すると、考慮すべき干渉波も変化することとなるため、デザインが変更される前の状態で得られるような補正効果が得られなくなってしまう。このような場合、従来は、製品デザインを変更する度に、試行錯誤で周波数振幅特性の補正方法が探索されていたが、効率的に補正方法を探し出すことができなかった。
しかしながら、本技術を用いることで、周波数振幅特性における筐体形状が変化したことにより生じる影響を、発生している干渉波の帯域を見極めることで対応することが可能となる。結果として、干渉波による影響を補正した周波数振幅特性を利用して逆フィルタを生成し、逆フィルタの係数を補正フィルタに適用することで、筐体形状が変化しても、効率よく筐体に設けられたスピーカの周波数振幅特性を改善することが可能となる。
さらに、近年、特にスピーカを内蔵するモバイル機器において、本体カバーを付けるなどアクセサリが充実してきている。ところが、アクセサリを付け替えるということで、モバイル機器の筐体形状が変化することとなるため、上述した計測信号の誤差評価関数が変化することになる。したがって、製品出荷状態では、本体に内蔵されるスピーカの周波数振幅特性を補正した状態となっていても、アクセサリが付加されることにより周波数振幅特性に何らかの影響が及ぶ可能性がある。しかしながら、本技術を適用することで、装着するアクセサリ毎に付加された状態の誤差評価関数に対応した逆フィルタからなる補正フィルタを生成することが可能となる。このため、アクセサリを付加した後、ネットワークから付加したアクセサリに応じた逆フィルタからなる補正フィルタをダウンロードして適用することにより、アクセサリが付加されて周りの筐体形状が変化しても適切に高音質化された音声により音楽を楽しむことも可能となる。
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図10は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)1001,ROM(Read Only Memory)1002,RAM(Random Access Memory)1003は、バス1004により相互に接続されている。
バス1004には、さらに、入出力インタフェース1005が接続されている。入出力インタフェース1005には、入力部1006、出力部1007、記憶部1008、通信部1009、及びドライブ1010が接続されている。
入力部1006は、キーボード、マウス、マイクロフォンなどよりなる。出力部1007は、ディスプレイ、スピーカなどよりなる。記憶部1008は、ハードディスクや不揮発性のメモリなどよりなる。通信部1009は、ネットワークインタフェースなどよりなる。ドライブ1010は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア1011を駆動する。
以上のように構成されるコンピュータでは、CPU1001が、例えば、記憶部1008に記憶されているプログラムを、入出力インタフェース1005及びバス1004を介して、RAM1003にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU1001)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア1011に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア1011をドライブ1010に装着することにより、入出力インタフェース1005を介して、記憶部1008にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部1009で受信し、記憶部1008にインストールすることができる。その他、プログラムは、ROM1002や記憶部1008に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
尚、本技術は以下のような構成を取ることができる。
(1) 入力された音声信号に基づいて、スピーカより出力された音声出力を計測し、計測信号として出力する計測部と、
前記計測部により計測された計測信号に基づいて、前記スピーカの逆フィルタを生成する逆フィルタ生成部と、
前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測部により計測された音声出力の計測結果である計測信号と、理想的な計測信号との誤差を評価する誤差評価関数を算出する誤差評価関数算出部と、
前記逆フィルタを介さずに入力された音声信号に基づいて、前記スピーカより出力され、視聴位置において、前記計測部により計測された計測信号を、前記誤差評価関数に基づいて補正する計測信号補正部と
を含む音声処理装置。
(2) 前記逆フィルタ生成部は、前記計測信号補正部により補正された計測信号に基づいて、前記スピーカの逆フィルタを生成する
(1)に記載の音声処理装置。
(3) 前記計測部は、前記音声信号に基づいて、前記スピーカより出力された音声出力を、前記スピーカからの位置を変更して複数回数計測して、計測信号を出力し、
前記逆フィルタ生成部は、前記計測部により計測された回数分だけ、前記計測信号に基づいて、前記スピーカの逆フィルタを生成し、
前記誤差評価関数算出部は、前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測部により計測された音声出力の計測結果である計測信号について、計測された回数分の前記計測信号と、理想的な結果との誤差の、加算平均を誤差評価関数として算出し、
前記計測信号補正部は、前記誤差の加算平均からなる誤差評価関数に基づいて、前記計測信号を補正する
(1)または(2)に記載の音声処理装置。
(4) 前記音声信号は、離散的な異なる複数の周波数からなる音声信号であり、前記誤差評価関数は、前記音声信号の周波数と前記誤差の加算平均との関係が示された関数であり、
前記計測信号補正部は、前記誤差評価関数と所定の閾値との比較により、前記誤差評価関数が前記所定の閾値よりも高い周波数帯域について、その近傍の周波数帯域であって、前記誤差評価関数が所定の閾値よりも小さい計測信号を用いて、前記誤差評価関数が前記所定の閾値よりも高い周波数帯域の計測信号を補正する
(1)乃至(3)に記載の音声処理装置。
(5) 入力された音声信号に基づいて、スピーカより出力された音声出力を計測し、計測信号として出力する計測処理をし、
前記計測処理により計測された計測信号に基づいて、前記スピーカの逆フィルタを生成する逆フィルタ生成処理をし、
前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測処理により計測された音声出力の計測結果である計測信号と、理想的な計測信号との誤差を評価する誤差評価関数を算出する誤差評価関数算出処理をし、
前記逆フィルタを介さずに入力された音声信号に基づいて、前記スピーカより出力され、視聴位置において、前記計測部により計測された計測信号を、前記誤差評価関数に基づいて補正する計測信号補正処理する
ステップを含む音声処理方法。
(6) コンピュータを、
入力された音声信号に基づいて、スピーカより出力された音声出力を計測し、計測信号として出力する計測部と、
前記計測部により計測された計測信号に基づいて、前記スピーカの逆フィルタを生成する逆フィルタ生成部と、
前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測部により計測された音声出力の計測結果である計測信号と、理想的な計測信号との誤差を評価する誤差評価関数を算出する誤差評価関数算出部と、
前記逆フィルタを介さずに入力された音声信号に基づいて、前記スピーカより出力され、視聴位置において、前記計測部により計測された計測信号を、前記誤差評価関数に基づいて補正する計測信号補正部と
して機能させるプログラム。
(7) (5)に記載のプログラムが記録されている記録媒体。
111 計測部, 112 出力部, 113 マイクロフォン, 131 ADC, 132 演算部, 133 DAC, 151 係数生成部, 152 信号生成部, 153 誤差評価関数算出部, 154 スイッチ制御部, 155 計測信号補正部, 171 ADC, 172 スイッチ, 172a,172b 端子, 173 補正フィルタ, 174 係数メモリ, 175 増幅部, 176 スピーカ

Claims (7)

  1. 入力された音声信号に基づいて、スピーカより出力された音声出力を計測し、計測信号として出力する計測部と、
    前記計測部により計測された計測信号に基づいて、前記スピーカの逆フィルタを生成する逆フィルタ生成部と、
    前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測部により計測された音声出力の計測結果である計測信号と、理想的な計測信号との誤差を評価する誤差評価関数を算出する誤差評価関数算出部と、
    前記逆フィルタを介さずに入力された音声信号に基づいて、前記スピーカより出力され、視聴位置において、前記計測部により計測された計測信号を、前記誤差評価関数に基づいて補正する計測信号補正部と
    を含む音声処理装置。
  2. 前記逆フィルタ生成部は、前記計測信号補正部により補正された計測信号に基づいて、前記スピーカの逆フィルタを生成する
    請求項1に記載の音声処理装置。
  3. 前記計測部は、前記音声信号に基づいて、前記スピーカより出力された音声出力を、前記スピーカからの位置を変更して複数回数計測して、計測信号を出力し、
    前記逆フィルタ生成部は、前記計測部により計測された回数分だけ、前記計測信号に基づいて、前記スピーカの逆フィルタを生成し、
    前記誤差評価関数算出部は、前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測部により計測された音声出力の計測結果である計測信号について、計測された回数分の前記計測信号と、理想的な結果との誤差の、加算平均を誤差評価関数として算出し、
    前記計測信号補正部は、前記誤差の加算平均からなる誤差評価関数に基づいて、前記計測信号を補正する
    請求項1に記載の音声処理装置。
  4. 前記音声信号は、離散的な異なる複数の周波数からなる音声信号であり、前記誤差評価関数は、前記音声信号の周波数と前記誤差の加算平均との関係が示された関数であり、
    前記計測信号補正部は、前記誤差評価関数と所定の閾値との比較により、前記誤差評価関数が前記所定の閾値よりも高い周波数帯域について、その近傍の周波数帯域であって、前記誤差評価関数が所定の閾値よりも小さい計測信号を用いて、前記誤差評価関数が前記所定の閾値よりも高い周波数帯域の計測信号を補正する
    請求項1に記載の音声処理装置。
  5. 入力された音声信号に基づいて、スピーカより出力された音声出力を計測し、計測信号として出力する計測処理をし、
    前記計測処理により計測された計測信号に基づいて、前記スピーカの逆フィルタを生成する逆フィルタ生成処理をし、
    前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測処理により計測された音声出力の計測結果である計測信号と、理想的な計測信号との誤差を評価する誤差評価関数を算出する誤差評価関数算出処理をし、
    前記逆フィルタを介さずに入力された音声信号に基づいて、前記スピーカより出力され、視聴位置において、前記計測部により計測された計測信号を、前記誤差評価関数に基づいて補正する計測信号補正処理する
    ステップを含む音声処理方法。
  6. コンピュータを、
    入力された音声信号に基づいて、スピーカより出力された音声出力を計測し、計測信号として出力する計測部と、
    前記計測部により計測された計測信号に基づいて、前記スピーカの逆フィルタを生成する逆フィルタ生成部と、
    前記逆フィルタを介して入力された音声信号に基づいて、前記スピーカより出力され、前記計測部により計測された音声出力の計測結果である計測信号と、理想的な計測信号との誤差を評価する誤差評価関数を算出する誤差評価関数算出部と、
    前記逆フィルタを介さずに入力された音声信号に基づいて、前記スピーカより出力され、視聴位置において、前記計測部により計測された計測信号を、前記誤差評価関数に基づいて補正する計測信号補正部と
    して機能させるプログラム。
  7. 請求項5に記載のプログラムが記録されている記録媒体。
JP2011223448A 2011-10-07 2011-10-07 音声処理装置および音声処理方法、記録媒体、並びにプログラム Pending JP2013085114A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011223448A JP2013085114A (ja) 2011-10-07 2011-10-07 音声処理装置および音声処理方法、記録媒体、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011223448A JP2013085114A (ja) 2011-10-07 2011-10-07 音声処理装置および音声処理方法、記録媒体、並びにプログラム

Publications (1)

Publication Number Publication Date
JP2013085114A true JP2013085114A (ja) 2013-05-09

Family

ID=48529864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011223448A Pending JP2013085114A (ja) 2011-10-07 2011-10-07 音声処理装置および音声処理方法、記録媒体、並びにプログラム

Country Status (1)

Country Link
JP (1) JP2013085114A (ja)

Similar Documents

Publication Publication Date Title
JP5070993B2 (ja) 音処理装置、位相差補正方法及びコンピュータプログラム
JP5092974B2 (ja) 伝達特性推定装置、雑音抑圧装置、伝達特性推定方法及びコンピュータプログラム
JP6427672B2 (ja) ビームフォーミングフィルタのためのfirフィルタ係数の算出
US20120245933A1 (en) Adaptive ambient sound suppression and speech tracking
US20090232318A1 (en) Output correcting device and method, and loudspeaker output correcting device and method
CN108293170B (zh) 波束成形应用中的自适应无相位失真幅度响应均衡的方法及装置
CN111031463B (zh) 麦克风阵列性能评测方法、装置、设备和介质
US9538288B2 (en) Sound field correction apparatus, control method thereof, and computer-readable storage medium
JP2011061422A (ja) 情報処理装置、情報処理方法およびプログラム
JPWO2006077745A1 (ja) 信号除去方法、信号除去システムおよび信号除去プログラム
US8259961B2 (en) Audio processing apparatus and program
JP2006517072A (ja) マルチチャネル信号を用いて再生部を制御する方法および装置
JP6221257B2 (ja) 信号処理装置、方法及びプログラム
JP5627440B2 (ja) 音響装置及びその制御方法、プログラム
JP5240026B2 (ja) マイクロホンアレイにおけるマイクロホンの感度を補正する装置、この装置を含んだマイクロホンアレイシステム、およびプログラム
JP5459220B2 (ja) 発話音声検出装置
JP6567216B2 (ja) 信号処理装置
JP2013085114A (ja) 音声処理装置および音声処理方法、記録媒体、並びにプログラム
US10362396B2 (en) Phase control signal generation device, phase control signal generation method, and phase control signal generation program
CN114420153A (zh) 音质调整方法、装置、设备及存储介质
JP2008289173A (ja) 測定方法、測定装置、プログラム
JP6304643B2 (ja) スピーカーの非線形歪低減装置、方法、及びプログラム
JP6221258B2 (ja) 信号処理装置、方法及びプログラム
JP2018032931A (ja) 音響信号処理装置、プログラム及び方法
WO2021075108A1 (ja) 信号処理装置および方法、並びにプログラム