JP5223595B2

JP5223595B2 - 音声処理回路及び音声処理方法

Info

Publication number: JP5223595B2
Application number: JP2008278923A
Authority: JP
Inventors: 直樹仁田
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2008-10-29
Filing date: 2008-10-29
Publication date: 2013-06-26
Anticipated expiration: 2028-10-29
Also published as: KR20100047804A; KR101093280B1; JP2010109624A; CN101727907A

Description

本発明は、聴きやすい音声を出力する音声処理技術に関する。

上記の音声処理に関連する技術としては、特許文献１に記載のものが挙げられる。特許文献１には、複数のパートからなる着信メロディをバランスよく再生するために、スピーカ（レシーバ）の周波数特性を平坦化するように、イコライザによって楽音信号の周波数特性を調整する携帯電話機が記載されている。
特許第３７７５１５６号公報

ところで、上記の平坦化の方法としては、スピーカの周波数特性のグラフにおける凹部の周波数帯域のゲインを上げるのが一般的である。したがって、イコライザへの入力信号のレベルを下げない場合には、イコライザや後段の回路には十分に高いレベルの信号を扱うことが要求される。つまり、高い性能の回路が必要となる。一方、イコライザへの入力信号のレベルを下げる場合には、Ｓ／Ｎ比が悪化してしまう。このように、特許文献１に記載の技術を上記の音声処理に適用するのは困難である。

本発明は、上述した事情に鑑みてなされたものであり、高い性能の回路を用いることなく、聴き易い音声を出力することができる音声処理技術を提供することを課題とする。

本発明に係る音声処理回路は、上述した課題を解決するため、入力信号を複数の周波数帯域に分割して複数の第１音声信号を生成する周波数分割回路と、前記複数の第１音声信号が各々供給され、非線形処理を施して第２音声信号を各々生成する複数の非線形処理回路と、前記複数の非線形処理回路から各々出力される前記第２音声信号を加算して出力信号を生成する加算回路とを備え、前記複数の非線形処理回路の各々は、前記第１音声信号のレベルを検出するレベル検出部と、前記レベル検出部で検出されたレベルに外部から指定可能な係数を乗算して出力する係数部と、入力レベルが所定値以下である場合には前記入力レベルが上がるほど小さいゲインを出力する入出力特性に従って、前記係数部が出力するレベルを前記入力レベルとして用いてゲインを決定するゲイン決定部と、前記ゲイン決定部で決定されたゲインを前記第１音声信号に乗算して前記第２音声信号を生成する乗算部と、を備え、前記係数は、前記出力信号を入力して音に変換して出力するスピーカの周波数特性に応じて定められる、ことを特徴とする。

この音声処理回路によれば、低いレベルに対するゲインを高くし、高いレベルに対するゲインを低くする非線形処理を採用可能であり、出力信号を音声に変換する手段の周波数特性を補正するための係数を指定することが可能であるから、聴きやすい音声を出力することが可能となる。また、この音声処理回路によれば、加算されて出力信号となる複数の第２音声信号の各々が、第１音声信号のレベルと外部から指定可能な係数とに基づいて決定されるゲインを第１音声信号に乗算して生成されるから、非線形処理後の音声信号に対して周波数特性を補正するためのゲインを乗算する形態（図４）に比較して、出力信号のＳ／Ｎ比を劣化させることなく歪を抑制できる。

また、上記の入出力特性は、前記入力レベルが前記所定値以上の場合には出力レベルを一定とする特性であってもよく、上記の非線形処理回路は、前記係数を書き換え可能に記憶する記憶部を備えてもよい。

また、本発明に係る音声処理方法は、入力信号を複数の周波数帯域に分割して複数の第１音声信号を生成する工程と、前記複数の第１音声信号の各々に非線形処理を施して複数の第２音声信号を生成する工程と、前記複数の第２音声信号を加算して出力信号を生成する工程とを備え、前記非線形処理では、前記出力信号を入力して音に変換して出力するスピーカの周波数特性に応じて定められる係数を前記第１音声信号のレベルに乗算し、入力レベルが所定値以下である場合には前記入力レベルが上がるほど小さいゲインを出力する入出力特性に従って、前記乗算して得られたレベルを前記入力レベルとして用いてゲインを決定し、前記決定したゲインを前記第１音声信号に乗算して前記第２音声信号を生成する、ことを特徴とする。

以下では、本発明に係る実施の形態について図面を参照して説明する。
図１は、本発明の実施の形態に係る音声処理装置１００の構成を示すブロック図である。この図に示すように、音声処理装置１００は音声処理回路１とスピーカ２とを備える。音声処理回路１は、音声信号である入力信号ＩＮに音声処理を施して出力信号ＯＵＴを生成する。スピーカ２は出力信号ＯＵＴを音に変換する。音声処理装置１００は携帯電話機であり、入力信号ＩＮは例えば遠端話者の音声信号である。また、音声処理回路１が行う音声処理は、スピーカ２から聴きやすい音声を出力するための信号処理である。

音声処理回路１は、周波数分割回路１０と圧縮回路群２０と加算回路３０とを備える。周波数分割回路１０は、入力信号ＩＮを複数の周波数帯域に分割して複数の第１音声信号を生成する。圧縮回路群２０は、これら複数の第１音声信号の各々にダイナミックレンジを圧縮するダイナミックレンジ圧縮（ＤＲＣ）等の処理を施して複数の第２音声信号を生成する。加算回路３０は、これら複数の第２音声信号を加算して出力信号ＯＵＴを生成する。

周波数分割回路１０はＢＰＦ（帯域通過フィルタ）１〜ＢＰＦ６を備える。本実施形態では、周波数分割回路が備えるＢＰＦの数を６個としているが、これに限らず、任意の複数としてもよい。各ＢＰＦには入力信号ＩＮが供給され、各ＢＰＦは、設定された中心周波数を含む周波数帯域の信号を通過させて第１音声信号を生成する。各ＢＰＦの通過帯域は入力信号ＩＮの周波数帯域よりも狭い。複数のＢＰＦの中心周波数は、互いに異なり、スピーカ２から聴きやすい音声を出力させる観点から、対数的に等間隔で設定されることが好ましい。本実施の形態では、ＢＰＦ１に１２５Ｈｚ、ＢＰＦ２に２５０Ｈｚ、ＢＰＦ３に５００Ｈｚ、ＢＰＦ４に１ｋＨｚ、ＢＰＦ５に２ｋＨｚ、ＢＰＦ６に４ｋＨｚが設定されている。

圧縮回路群２０は第１圧縮回路Ｕ１〜第６圧縮回路Ｕ６を備える。第１圧縮回路Ｕ１〜第６圧縮回路Ｕ６はそれぞれＢＰＦ１〜ＢＰＦ６と一対一で対応している。本実施形態では、圧縮回路群が備える圧縮回路の数を６個としているが、これは周波数分割回路１０が６個のＢＰＦを備えるためであり、これに限らず、周波数分割回路が備えるＢＰＦの数と同様に任意の複数としてもよい。各圧縮回路は、第１音声信号に対して、後述の非線形処理および補正処理を施して第２音声信号を生成する。

ところで、スピーカの周波数特性には個体差がある。そこで、本実施の形態では、スピーカ２から聴きやすい音声を出力させるために、スピーカ２の周波数特性を考慮して出力信号ＯＵＴに周波数特性を付与している。このため、各圧縮回路は、音声処理回路１外から供給される制御信号ＣＴＬを用いて補正処理を行う。制御信号ＣＴＬは、出力信号ＯＵＴに付与すべき周波数特性に応じて適宜決定される。この例の制御信号ＣＴＬは、スピーカ２の周波数特性に相当する係数を指定する。この係数によってゲイン算出部５２に供給される信号レベルが調整される。ゲイン算出部５２は供給される信号レベルに応じたゲインを算出するので、係数に応じた周波数特性が出力信号ＯＵＴに付与されることになる。すなわち、本実施形態では、出力信号ＯＵＴをスピーカ２に供給することによって、スピーカ２の周波数特性を補正するように係数が設定されている。なお、制御信号ＣＴＬは、音声処理回路１外から供給されるから、補正処理で用いられる係数は音声処理回路１外から指定される。くわえて、制御信号ＣＴＬの供給元は音声処理装置１００の外部であっても内部であってもよい。

次に、各圧縮回路の構成について説明する。ただし、各圧縮回路の構成は対応するＢＰＦを除いて共通であるから、ここでは第１圧縮回路Ｕ１の構成を説明することにより、各圧縮回路の構成の説明に代える。

図２に示すように、第１圧縮回路Ｕ１は、レベル検出部５０と係数部５１とゲイン算出部（ゲイン決定部）５２と乗算部５３とを備える。レベル検出部５０は、ＢＰＦ１で生成された第１音声信号のレベルを検出する。係数部５１は、レベル検出部５０に検出されたレベルに制御信号ＣＴＬで指定された係数を乗算して出力する。この乗算は、スピーカ２の周波数特性を補正するように行われる。なお、係数部５１は、係数を書き換え可能に記憶する記憶部を備えていてもよいし、備えていなくてもよい。後者の場合、制御信号ＣＴＬの供給元が係数を書き換え可能に記憶する記憶部を備えることになる。ゲイン算出部５２は、信号に応じたゲインを求めるためのゲインテーブルを有し、係数部５１の出力信号とゲインテーブルとに基づいてゲインを算出する。乗算部５３は、ＢＰＦ１で生成された第１音声信号にゲイン算出部５２で算出されたゲインを乗算して第２音声信号を生成する。このゲインは、スピーカ２の周波数特性を補正するように算出されたものであるから、補正処理は乗算部５３による乗算によって完了する。つまり、第１圧縮回路Ｕ１は、補正処理を行う補正処理回路でもある。

各圧縮回路の入出力レベル特性は図３中に実線で示す通りである。前述のゲインテーブルは、この特性が得られるように設計されている。この図において、横軸は入力レベル（ｄＢ）を示し、縦軸は出力レベル（ｄＢ）を示す。図中のＵＣＬは不快レベルに相当する。不快レベルは、人に不快感を与えない音圧範囲の上限値である。ＵＣＬの値は任意であるが、統計的な手法によって定めることが好ましい。図中の実線から明らかなように、各圧縮回路は、入力レベルがＵＣＬ以上の場合には出力レベルをＵＣＬ一定とする出力レベル制限を行う。したがって、第２音声信号は人に不快感を与えない音圧の信号となる。

また、図中のＨＴＬは聴覚閾値に相当する。聴覚閾値は、人が聴き取ることのできる音圧範囲の下限値である。ＨＴＬの値は任意であるが、統計的な手法によって定めることが好ましい。また、ＨＴＬ´はＨＴＬよりも予め定められた差分（ｄＢ）だけ高いレベルであり、ＨＴＬ´＜ＵＣＬである。図中の実線と破線（入力レベルおよび出力レベルが共にＵＣＬである点と原点とを結ぶ直線）とを比較すれば明らかなように、各圧縮回路の入出力特性は非線形である。

この入出力特性によれば、ＨＴＬからＵＣＬまでの第１音声信号のレベルが、ＨＴＬ´からＵＣＬまでの第２音声信号のレベルに圧縮されるから、聴覚閾値がＨＴＬ´の聴取者にも、ＨＴＬ以上かつＨＴＬ´未満のレベルの第１音声信号の音が聴こえるようになる。
ところで、補正処理においてはスピーカ２の周波数特性を補正するためにスピーカ２の周波数特性のグラフにおける凹部のゲインを上げる必要または凸部のゲインを下げる必要がある。このゲインを決定するのは係数部５１の後段のゲイン算出部５２である。ゲイン算出部５２では入力レベルが低いほどゲインが大きくなる圧縮増幅が行われるから、係数部５１は、レベル検出部５０に検出されたレベルと係数の乗算により、レベル検出部５０に検出されたレベルからスピーカ２における増減分だけ上下させたレベルを算出する。つまり、係数部５１の乗算は、スピーカ２において減衰する場合にはゲイン算出部５２の入力レベルが図３中の左方へずれ、逆の場合にはゲイン算出部５２の入力レベルが図３中の右方へずれるように行われる。

この圧縮回路の入出力特性は非線形であるが、非線形処理と補正処理が一挙に行われる点に特徴がある。これにより、加算回路３０におけるオーバーフローを防止すると共に出力信号ＯＵＴのＳ／Ｎ比を向上させることができる。以下、非線形処理の後に補正処理を行う音声処理装置２００を比較例として図４に示し、上述した特徴の利点を説明する。

図４に示すように、音声処理装置２００は、音声処理回路３とスピーカ２とを備える。音声処理回路３は、周波数分割回路１０と、圧縮回路群４０と、ゲイン乗算部Ｇ１〜Ｇ６と、加算回路３０とを備える。圧縮回路群４０は、第１１圧縮回路Ｕ１１〜第１６圧縮回路Ｕ１６を備える。第１１圧縮回路Ｕ１１〜第１６圧縮回路Ｕ１６は、それぞれ周波数分割回路１０のＢＰＦ１〜ＢＰＦ６と一対一で対応している。第１１圧縮回路Ｕ１１〜第１６圧縮回路Ｕ１６の各々は、図２に示す構成から係数部５１を除いた構成を有し、対応するＢＰＦで生成された第１音声信号に対して非線形処理を施して第３音声信号を生成する。

ゲイン乗算部Ｇ１〜Ｇ６は、例えばイコライザであり、それぞれ第１１圧縮回路Ｕ１１〜第１６圧縮回路Ｕ１６と一対一で対応している。各ゲイン乗算部には、前述の制御信号ＣＴＬが供給され、各ゲイン乗算部は、対応する圧縮回路で生成された第３音声信号に制御信号ＣＴＬで指定された係数を乗算して第２音声信号を生成する。この乗算は、スピーカ２の周波数特性を補正するように行われるものであり、具体的には、スピーカ２における増減分を打ち消すように行われる。このように、音声処理装置２００では、各ゲイン乗算部によって補正処理が行われる。加算回路３０は、ゲイン乗算部Ｇ１〜Ｇ６で生成された複数の第２音声信号を加算して出力信号ＯＵＴを生成する。

ゲイン乗算部による補正処理では、例えば、スピーカ２の周波数特性が図５に示す通りである場合、ゲイン乗算部Ｇ１は＋１０ｄＢ、ゲイン乗算部Ｇ２は＋５ｄＢ、ゲイン乗算部Ｇ３は０ｄＢ、ゲイン乗算部Ｇ４は＋５ｄＢ、ゲイン乗算部Ｇ５は＋７ｄＢ、ゲイン乗算部Ｇ６は＋１０ｄＢだけ第３音声信号を増幅する。このように、音声処理回路３では、各周波数帯域の音声信号がスピーカ２で減衰する分だけ予め増幅される。したがって、スピーカ２から放出される音におけるスピーカ２の周波数特性の影響が抑制（除去）される。

しかしながら、音声処理装置２００では、スピーカ２の周波数特性によっては、ゲイン乗算部の出力レベルが高くなり過ぎる虞がある。加算回路３０のダイナミックレンジには一定の限界がある。加算回路３０がアナログ回路で構成される場合には、ゲイン乗算部の出力レベルが高くなり過ぎると出力信号ＯＵＴがクリップする。また、加算回路３０がデジタル回路で構成される場合には、オーバーフローしてしまうので、同様に出力信号ＯＵＴがクリップしてしまう。この結果、出力信号ＯＵＴに歪が発生し音声の品質が劣化する。さらに、加算回路３０のダイナミックレンジ内であっても、後段のスピーカ２の入出力特性によっては、スピーカ２自体で歪が発生することもあり得る。

このような不都合を回避するために、各ゲイン乗算部へ入力される第３音声信号のレベルを下げることも考えられる。しかしながら、レベルを下げると出力信号ＯＵＴのＳ／Ｎ比が悪化してしまう。特に、入力信号ＩＮが小振幅の場合に問題となる。この点は、圧縮回路をアナログ回路で構成してもデジタル回路で構成も同様である。アナログ回路で構成する場合には、トランジスタの熱雑音や電源から回り込む雑音のレベルと信号レベルとが問題となり、デジタル回路で構成される場合には、ビットの丸め誤差が問題となる。

これに対して、上述した音声処理装置１００では、圧縮回路で非線形処理と補正処理とを実行している。具体的には、レベル検出部５０で検出した第１音声信号のレベルを係数部５１で補正し、補正されたレベルに基づいて、第１音声信号に付与するゲインをゲイン算出部５２で算出し、乗算部５３で算出されたゲインを第１音声信号に乗算して第２音声信号を生成する。ゲイン算出部５２は、例えば、図３に示される入出力特性に従ってゲインを決定する。すなわち、第１音声信号のレベルが大きい部分では、ゲインが小さくなるようにしてダイナミックレンジを圧縮している。このため、圧縮回路で補正処理を行っても加算回路３０でオーバーフローが発生することを抑制できる。特に、図３に示される入出力特性では、第２音声信号のレベルがＵＣＬを超えないようになっているから、第１乃至第６圧縮回路Ｕ１〜Ｕ６から各々出力される第２音声信号の最大レベルが確定している。このため、最大レベルを考慮して加算回路３０のダイナミックレンジを設定すれば、出力信号ＯＵＴがクリップして歪が発生することを確実に防止できる。その一方で、入力信号ＩＮが小振幅であっても、そのレベルをさらに絞る必要がないので、Ｓ／Ｎ比が低下することもない。

次に、音声処理装置１００と音声処理装置２００との作用効果の差異について、ＢＰＦ６に対応する信号経路に注目して説明する。この説明では、第６圧縮回路Ｕ６の非線形処理に係る入出力特性、第１６圧縮回路Ｕ１６の入出力特性、およびゲイン算出部５２の入力レベル−ゲイン特性は、図６に示す通りであるものとする。図６では、単位「ｄＢＳＰＬ」を用いて音圧レベルがデシベルで表記されており、ＨＴＬとＨＴＬ´との差分は４０ｄＢであり、ＨＴＬは−５ｄＢであり、ＵＣＬは１００ｄＢである。

まず、レベル検出部５０で検出されたレベルが６０ｄＢＳＰＬの場合について説明する。
この場合、音声処理装置２００の音声処理回路３では、第１６圧縮回路Ｕ１６のゲイン算出部５２で算出されるゲインが１５．２ｄＢとなる。したがって、音声処理回路３から出力される音圧は、スピーカ２の周波数特性が平坦であれば、６０＋１５．２＝７５．２ｄＢＳＰＬとなり、図５に示す通りであれば、ゲイン乗算部Ｇ６がスピーカ２における４ｋＨｚの減衰分（１０ｄＢ）だけゲインを持ち上げるから、７５．２＋１０−１０＝７５．２ｄＢＳＰＬとなる。このことは、音声処理回路３がスピーカ２の周波数特性を高い精度で補正可能であることを示している。

これに対して、音声処理装置１００の音声処理回路１から出力される音圧は、スピーカ２の周波数特性が平坦であれば、第６圧縮回路Ｕ６のゲイン算出部５２の入力レベルが６０ｄＢＳＰＬとなり、このゲイン算出部５２で算出されるゲインが１５．２ｄＢとなるから、６０＋１５．２＝７５．２ｄＢＳＰＬとなり、図５に示す通りであれば、係数部５１がレベル検出部５０で検出されたレベルをスピーカ２における４ｋＨｚの減衰分（１０ｄＢ）だけ小さくするから、その後段のゲイン算出部５２の入力レベルが６０−１０＝５０ｄＢＳＰＬとなり、このゲイン算出部５２で算出されるゲインが１９ｄＢとなるから、６０＋１９−１０＝６９ｄＢＳＰＬとなる。このことは、音声処理回路１がスピーカ２の周波数特性を音声処理回路３よりも低いある程度の精度で補正可能であることを示している。

次に、レベル検出部５０で検出されたレベルが１００ｄＢＳＰＬの場合について説明する。この場合、音声処理装置２００の音声処理回路３では、第１６圧縮回路Ｕ１６のゲイン算出部５２で算出されるゲインが０ｄＢとなる。したがって、音声処理回路３から出力される音圧は、スピーカ２の周波数特性が平坦であれば、１００＋０＝１００ｄＢＳＰＬとなり、図５に示す通りであれば、ゲイン乗算部Ｇ６がスピーカ２における４ｋＨｚの減衰分（１０ｄＢ）だけゲインを持ち上げるから、１００＋１０−１０＝１００ｄＢＳＰＬとなる。このことは、音声処理回路３がスピーカ２の周波数特性を高い精度で補正可能であることを示す一方、各ゲイン乗算部、加算回路３０およびスピーカ２として１１０ｄＢＳＰＬに相当するレベルの信号を扱うことができるものを用いる必要があることを示している。

これに対して、音声処理装置１００の音声処理回路１から出力される音圧は、スピーカ２の周波数特性が平坦であれば、第６圧縮回路Ｕ６のゲイン算出部５２の入力レベルが１００ｄＢＳＰＬとなり、このゲイン算出部５２で算出されるゲインが０ｄＢとなるから、１００＋０＝１００ｄＢＳＰＬとなり、図５に示す通りであれば、係数部５１がレベル検出部５０で検出されたレベルをスピーカ２における４ｋＨｚの減衰分（１０ｄＢ）だけ小さくするから、その後段のゲイン算出部５２の入力レベルは１００−１０＝９０ｄＢＳＰＬとなり、このゲイン算出部５２で算出されるゲインが３．８ｄＢとなるから、１００＋３．８−１０＝９３．８ｄＢＳＰＬとなる。このことは、音声処理回路１がスピーカ２の周波数特性を音声処理回路３よりも低いある程度の精度で補正可能であることを示す一方、乗算部５３、およびスピーカ２として１０３．８ｄＢＳＰＬに相当するレベルの信号を扱うことができるものを用いることができることを示している。

なお、上述した実施の形態では、各圧縮回路が行う非線形処理としてレベル制限、圧縮増幅および線形増幅を含む処理を例示したが、これに限るものではない。また、上述した実施の形態では、出力信号を音声に変換する手段としてスピーカを例示したが、これに限るものではない。また、本発明は上述した実施の形態に限定されるものではなく、本願の特許請求の範囲に記載された発明特定事項から本発明の解決課題に基づいて把握される任意の形態を含む。例えば、以下に述べる変形例を含む。

図７は、本発明の実施の形態の変形例に係る音声処理回路４の構成を示すブロック図である。音声処理回路４は、前述の音声処理回路１と同様に、入力信号ＩＮに音声処理を施して出力信号ＯＵＴを生成する。ただし、音声処理回路１が時間領域で音声処理を行うのに対し、音声処理回路４は周波数領域で音声処理を行う。

音声処理回路４は、フーリエ変換部６０と、帯域選択部１〜帯域選択部６と、レベル検出部６１〜６６と、係数部７１〜７６と、ゲイン算出部８１〜８６と、ゲイン補間部７０と、乗算部８０と、逆フーリエ変換部９０とを有する。帯域選択部１、レベル検出部６１、係数部７１及びゲイン算出部８１は互いに対応し、帯域選択部２、レベル検出部６２、係数部７２及びゲイン算出部８２は互いに対応し、…、帯域選択部６、レベル検出部６６、係数部７６及びゲイン算出部８６は互いに対応している。

フーリエ変換部６０は、入力信号ＩＮをフーリエ変換（例えば高速フーリエ変換）によって時間領域の信号から周波数領域の信号へ変換する。各帯域選択部は、変換後の信号のうち、対応する周波数帯域の信号を選択し、選択した信号をまとめて出力する。換言すれば、各帯域選択部は、対応する周波数帯域の入力スペクトルを算出する。つまり、フーリエ変換部６０および帯域選択部１〜帯域選択部６は、図１の周波数分割回路１０に相当する。

レベル検出部６１〜６６の各々は、図２のレベル検出部５０に相当し、対応する帯域選択回路から出力された信号の平均レベルを検出（算出）する。係数部７１〜７６にはそれぞれ制御信号ＣＴＬ１〜ＣＴＬ６が供給され、係数部７１〜７６の各々は、対応するレベル検出部に検出されたレベルに制御信号で指定された係数を乗算して出力する。この乗算は、スピーカ２の周波数特性を補正するように行われる。つまり、係数部７１〜７６の各々は、図２の係数部５１に相当する。

ゲイン算出部８１〜８６の各々は、図２のゲイン算出部５２に相当し、対応する係数部の出力信号とゲインテーブルとに基づいてゲインを算出する。ゲインテーブルは、ゲイン算出部８１〜８６間で共通であっても相違していてもよいが、本変形例では、ゲインテーブルをゲイン算出部８１〜８６間で相違させて精度の向上を図っている。

ゲイン補間部７０は、ゲイン算出部８１〜８６に算出されたゲインを補間して全周波数領域の信号（すなわち周波数領域の入力信号ＩＮ）に対するゲインを求める。ここで、「補間」について説明する。各ゲイン算出部で算出されるゲインは特定の周波数に対するゲインである。つまり、ゲイン算出部８１〜８６に算出されるのは、全周波数領域のうち、特定の６個の周波数の信号に対するゲインに過ぎない。しかし、入力信号ＩＮには、これら６個の周波数以外の周波数の信号が含まれている。そこで、本変形例では、周波数領域において、これら６個の周波数の信号に対するゲインを線形補間して全周波数領域の信号に対するゲインを求めている。これが「補間」である。

乗算部８０は、図２の乗算部５３に相当し、周波数領域の入力信号ＩＮにゲイン補間部７０で求められたゲインを乗算して信号を出力する。逆フーリエ変換部９０は、乗算部５３の出力信号を逆フーリエ変換によって周波数領域の信号から時間領域の信号（すなわち出力信号ＯＵＴ）へ変換する。

つまり、レベル検出部６１〜６６、係数部７１〜７６、ゲイン算出部８１〜８６、ゲイン補間部７０、乗算部８０及び逆フーリエ変換部９０は、図１の圧縮回路群２０に相当する。なお、この変形例の音声処理回路４を備えた音声処理装置では、加算回路３０は不要となる。

本発明の実施の形態に係る音声処理装置１００の構成を示すブロック図である。音声処理装置１００の第１圧縮回路Ｕ１の構成を示すブロック図である。音声処理装置１００の各圧縮回路の入出力レベル特性を示す図である。音声処理装置１００と対比される音声処理装置２００の構成を示すブロック図である。音声処理装置１００および音声処理装置２００のスピーカ２の周波数特性を示す図である。音声処理装置１００と音声処理装置２００との作用効果の差異を説明するための図である。本発明の実施の形態の変形例に係る音声処理回路４の構成を示すブロック図である。

符号の説明

１，３，４……音声処理回路、２……スピーカ、１０……ＢＰＦ、２０，４０……圧縮回路群、３０……加算回路、５０，６１〜６６……レベル検出部、５１，７１〜７６……係数部、５２，８１〜８６……ゲイン算出部、５３，８０……乗算部、６０……フーリエ変換部、７０……ゲイン補間部、９０……逆フーリエ変換部、１００，２００……音声処理装置、Ｇ１〜Ｇ６……ゲイン乗算部。

Claims

入力信号を複数の周波数帯域に分割して複数の第１音声信号を生成する周波数分割回路と、
前記複数の第１音声信号が各々供給され、非線形処理を施して第２音声信号を各々生成する複数の非線形処理回路と、
前記複数の非線形処理回路から各々出力される前記第２音声信号を加算して出力信号を生成する加算回路とを備え、
前記複数の非線形処理回路の各々は、
前記第１音声信号のレベルを検出するレベル検出部と、
前記レベル検出部で検出されたレベルに外部から指定可能な係数を乗算して出力する係数部と、
入力レベルが所定値以下である場合には前記入力レベルが上がるほど小さいゲインを出力する入出力特性に従って、前記係数部が出力するレベルを前記入力レベルとして用いてゲインを決定するゲイン決定部と、
前記ゲイン決定部で決定されたゲインを前記第１音声信号に乗算して前記第２音声信号を生成する乗算部と、を備え、
前記係数は、前記出力信号を入力して音に変換して出力するスピーカの周波数特性に応じて定められる
ことを特徴とする音声処理回路。
前記入出力特性は、前記入力レベルが前記所定値以上の場合には出力レベルを一定とする特性であることを特徴とする請求項１に記載の音声処理回路。
前記非線形処理回路は、前記係数を書き換え可能に記憶する記憶部を備えることを特徴とする請求項１または２に記載の音声処理回路。
入力信号を複数の周波数帯域に分割して複数の第１音声信号を生成する工程と、
前記複数の第１音声信号の各々に非線形処理を施して複数の第２音声信号を生成する工程と、
前記複数の第２音声信号を加算して出力信号を生成する工程とを備え、
前記非線形処理では、
前記出力信号を入力して音に変換して出力するスピーカの周波数特性に応じて定められる係数を前記第１音声信号のレベルに乗算し、
入力レベルが所定値以下である場合には前記入力レベルが上がるほど小さいゲインを出力する入出力特性に従って、前記乗算して得られたレベルを前記入力レベルとして用いてゲインを決定し、
前記決定したゲインを前記第１音声信号に乗算して前記第２音声信号を生成する
ことを特徴とする音声処理方法。