JP6160045B2

JP6160045B2 - 調整装置および調整方法

Info

Publication number: JP6160045B2
Application number: JP2012195173A
Authority: JP
Inventors: 遠藤　香緒里; 香緒里遠藤
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2012-09-05
Filing date: 2012-09-05
Publication date: 2017-07-12
Anticipated expiration: 2032-09-05
Also published as: EP2709104A1; US20140067383A1; US9245536B2; EP2709104B1; JP2014052418A

Description

本技術は、音声信号の調整技術に関する。

ノイズの軽減や音声の明瞭化のために、特定の周波数のゲインを調整することが行われている。ある特許文献には、受話音声を聞きやすくするために、周波数毎のノイズを推定し、背景ノイズを除去する技術が開示されている。ノイズは、傾きと切片をパラメータとする周波数に関する直線でモデル化される。モデル化は、中間周波数から低周波数と高周波数に分けて行われる。

また、他の特許文献には、受話音声を聞きやすくするために、フォルマントを強調する技術が開示されている。この技術は、入力音声のフォルマント周波数を分析し、フォルマント周波数を強調することで受話音声の明瞭度を向上させている。フォルマントは、言葉を発する場合の音に関する特性である。

受話音声の聞きやすさは、このように受話音声に混入する背景ノイズを抑圧することや、受話音声のフォルマントを強調させることで向上させることができる。

しかし、背景ノイズや言葉を発する場合の特性の他にも、音声信号の再生音声を聞き取りにくくする要因は存在する。

特開２００９−１０４１４０号公報特開２０１０−０９２０５７号公報

一側面では、再生音声の聞き取りにくさを解消することを目的とする。

一態様の調整装置は、（Ａ）音声信号の第１周波数帯域における周波数特性と音声信号の第１周波数帯域よりも高い周波数側の第２周波数帯域における周波数特性との比を求め、求めた比が所定の基準を満たさない場合に、比が所定の基準に近づくように、音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、（Ｂ）調整量に応じて、音声信号に含まれる周波数特性の少なくとも一部を修正する修正部とを有する。

一態様の調整装置は、（Ｃ）音声信号の第１周波数帯域における周波数特性と音声信号の第１周波数帯域よりも高い周波数側の第２周波数帯域における周波数特性との第１の比を求め、音声信号の第１周波数帯域における周波数特性と音声信号の第２周波数帯域よりも高い周波数側の第３周波数帯域における周波数特性との第２の比を求め、第１の比が第１の基準を満たさない場合に、第１の比が第１の基準に近づくように、且つ第２の比が第２の基準を満たさない場合に、第２の比が第２の基準に近づくように、音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、（Ｄ）調整量に応じて、音声信号に含まれる周波数特性の少なくとも一部を修正する修正部とを有する。

一態様によれば、再生音声の聞き取りにくさを解消できるようになる。

図１は、受話音声の音質を説明するための図である。図２は、「こもり感」が生じる場合の音声の周波数特性の一例を示す図である。図３は、「こもり感」が解消された場合の音声の周波数特性の一例を示す図である。図４は、「軽さ」が生じる場合の音声の周波数特性の一例を示す図である。図５は、「軽さ」が解消された場合の音声の周波数特性の一例を示す図である。図６は、通信端末装置の構成例を示す図である。図７は、調整部の構成例を示す図である。図８は、調整部の処理フロー例を示す図である。図９は、音声特性算出処理（Ａ）のフロー例を示す図である。図１０は、雑音特性算出処理のフロー例を示す図である。図１１は、調整量算出処理のフロー例を示す図である。図１２は、高域調整量算出処理のフロー例を示す図である。図１３は、中域調整量算出処理のフロー例を示す図である。図１４は、調整量補正処理のフロー例を示す図である。図１５は、ＳＮＲによる寄与係数を示す図である。図１６は、音声成分の大きさによる寄与係数を示す図である。図１７は、修正処理のフロー例を示す図である。図１８は、実施の形態２に係る通信端末装置の構成例を示す図である。図１９は、実施の形態２に係る調整部の構成例を示す図である。図２０は、マイク音処理のフロー例を示す図である。図２１は、騒音特性算出処理のフロー例を示す図である。図２２は、音声特性算出処理（Ｂ）のフロー例を示す図である。図２３は、抽出処理のフロー例を示す図である。

［実施の形態１］
最初に、図１を用いて受話音声の音質について説明する。ここでは、２つの通信端末間の通話を想定する。特に、通話相手の声質、相手端末の特性あるいは通信網の周波数特性など、自端末以外の条件に基づく周波数特性で決まる音質を、受信音の音質と呼ぶ。そして、受話音声の音質は、受信音の音質と自端末による周波数特性に影響される。

自端末による周波数特性は定常的であることが多いので、予め調整しておくことにより一定の効果を維持できる。これに対して、受信音の音質はその都度異なるので、所定の調整では一律に効果を上げることができるわけではない。

従って、受信音の音質に起因する再生音声の聞き取りにくさを解消するためには、受信音を調整することが求められる。本実施の形態では、特にクリア感が不足している音質である「こもり感」と、厚みが不足している音質である「軽さ」に着目する。「こもり感」と「軽さ」は、いずれも受信音に含まれ得る特性である。

続いて、「こもり感」と「軽さ」について説明する。まず、「こもり感」について説明する。クリア感の不足は、低域の音量に対する高域の音量の比率が小さい場合に生じる。

図２に、「こもり感」が生じる場合の音声の周波数特性の一例を示す。縦軸は、音声に含まれるパワーの値（ｄＢ値）を示す。横軸は、声の音域を周波数で示している。図中、ＦＬｓは、低域の下限を示す周波数であり、ＦＬｅは、低域の上限を示す周波数である。低域は、声の音域における低周波数側の帯域を指す。また、ＦＨｓは、高域の下限を示す周波数であり、ＦＨｅは、高域の上限を示す周波数である。高域は、声の音域における高周波数側の帯域を指す。ＦＬｓ、ＦＬｅ、ＦＨｓ及びＦＨｅは、いずれも定数である。

曲線２０１は、「こもり感」が生じる音声に含まれるパワーを模式的に示している。直線２０３は、低域におけるパワーの平均値を示している。直線２０５は、高域におけるパワーの平均値を示している。

パワーの差２０７は、「こもり感」の度合いを示すこもり指標ｍｕｆｆｌｅを示している。こもり指標ｍｕｆｆｌｅは、低域におけるパワーの平均値（ｄＢ値）から高域におけるパワーの平均値（ｄＢ値）を差し引くことにより求められる。こもり指標ｍｕｆｆｌｅが、判定の尺度となる基準値（この例では、３０ｄＢ）を越える場合に、「こもり感」が発生していると判定する。図２は、こもり指標ｍｕｆｆｌｅが基準値を越えている状態を示している。

続いて、「こもり感」を解消するための調整の概要を説明する。図３に、「こもり感」が解消された場合の音声の周波数特性の一例を示す。この例では、高域におけるパワーを増大させることにより、高域の音を強調する。破線３０１は、高域における元のパワーを示している。実線３０３は、修正されたパワーを示している。このように、高域の音を強調することにより「こもり感」は解消される。

実線３０５は、調整後の高域におけるパワーの平均値を示している。そして、低域におけるパワーの平均値（ｄＢ値）から調整後の高域におけるパワーの平均値（ｄＢ値）を差し引くことにより調整後のこもり指標ｍｕｆｆｌｅが求められる。こもり指標ｍｕｆｆｌｅが基準値に近づけば、「こもり感」が改善していることを意味する。また、こもり指標ｍｕｆｆｌｅが基準値に達すれば、「こもり感」が解消したことを意味する。

本実施の形態では、低域と高域のバランスに基づいて「こもり感」の発生を判定し、「こもり感」を改善あるいは解消するように高域におけるパワーを調整する。

続いて「軽さ」について説明する。音の厚みの不足は、低域の音量に対する中域の音量の比率が大きい場合に生じる。

図４に、「軽さ」が生じる場合の音声の周波数特性の一例を示す。図２と同様に、縦軸は、音声に含まれるパワーの値（ｄＢ値）を示し、横軸は、声の音域を周波数で示している。また、ＦＬｓとＦＬｅも、図２と同様である。

ＦＭｓは、中域の下限を示す周波数であり、ＦＭｅは、中域の上限を示す周波数である。中域は、声の音域における中央付近の周波数の帯域を指す。中域は、低域と高域の間の帯域とも言える。ＦＭｓとＦＭｅも、定数である。

曲線２０１は、「軽さ」が生じる音声に含まれるパワーを模式的に示している。直線２０３は、低域におけるパワーの平均値を示している。直線４０１は、中域におけるパワーの平均値を示している。

パワーの差４０３は、「軽さ」の度合いを示す軽さ指標ｌｉｇｈｔを示している。軽さ指標ｌｉｇｈｔは、低域におけるパワーの平均値（ｄＢ値）から中域におけるパワーの平均値（ｄＢ値）を差し引くことにより求められる。軽さ指標ｌｉｇｈｔが、判定の尺度となる基準値（この例では、１０ｄＢ）より小さい場合に、「軽さ」が発生していると判定する。図４は、軽さ指標ｌｉｇｈｔが基準値より小さい状態を示している。

続いて、「軽さ」を解消するための調整の概要を説明する。図５に、「軽さ」が解消された場合の音声の周波数特性の一例を示す。本実施の形態では、中域におけるパワーを減少させることにより、中域の音を抑制する。破線５０１は、中域における元のパワーを示している。実線５０３は、修正されたパワーを示している。このように、中域の音を抑制することにより「軽さ」は解消される。

直線５０５は、調整後の中域におけるパワーの平均値を示している。そして、低域におけるパワーの平均値（ｄＢ値）から調整後の中域におけるパワーの平均値（ｄＢ値）を差し引くことにより調整後の軽さ指標ｌｉｇｈｔが求められる。軽さ指標ｌｉｇｈｔが基準値に近づけば、「軽さ」が改善していることを意味する。また、軽さ指標ｌｉｇｈｔが基準値に達すれば、「軽さ」が解消したことを意味する。

本実施の形態では、低域と中域のバランスに基づいて「軽さ」の発生を判定し、「軽さ」を改善あるいは解消するように中域におけるパワーを調整する。

以下、音声信号を調整する装置の例である通信端末装置について説明する。図６に、通信端末装置の構成例を示す。通信端末装置は、アンテナ６０１、ＲＦ受信部６０３、Ａ／Ｄ変換部６０５、ベースバンド信号処理部６０７、復号部６０９、調整部６１１、Ｄ／Ａ変換部６１３、アンプ６１５及びスピーカ６１７を有している。アンテナ６０１は、ＲＦ（Radio Frequency）信号を受信する。ＲＦ受信部６０３は、アンテナより受信したＲＦ信号を復調する。Ａ／Ｄ変換部６０５は、アナログ信号をデジタル信号に変換する。ベースバンド信号処理部６０７は、デジタル信号に対するベースバンド処理を行う。復号部６０９は、ベースバンド信号を音信号に復号する。調整部６１１は、音信号の調整を行う。Ｄ／Ａ変換部６１３は、デジタル信号をアナログ信号に変換する。アンプ６１５は、アナログ信号を増幅する。スピーカ６１７は、再生音を出力する。

図７に、調整部６１１の構成例を示す。調整部６１１は、第１入力部７０１、第１変換部７０３、判定部７０５、音声特性算出部（Ａ）７０７、雑音特性算出部７０９、調整量算出部７１１、調整量補正部７１３、修正部７１５及び第２変換部７１７を有している。

第１入力部７０１は、順次フレームの信号を入力する。第１変換部７０３は、フレームの信号を時間領域の信号から周波数領域の信号へ変換する。判定部７０５は、フレームの信号が音声区間であるか否かを判定する。音声特性算出部（Ａ）７０７は、音声の周波数特性を算出する。雑音特性算出部７０９は、雑音の周波数特性を算出する。調整量算出部７１１は、音信号の周波数特性に対する調整量を算出する。調整量補正部７１３は、補正した調整量を算出する。修正部７１５は、補正した調整量に基づいて、音信号の周波数特性を修正する。第２変換部７１７は、周波数領域の信号から時間領域の信号への変換を行う。調整部６１１は、記憶部７１９を有するようにしてもよい。記憶部７１９は、各パラメータを記憶することに用いるようにしてもよい。各処理部は、記憶部７１９に、各パラメータを記憶させ、あるいは各パラメータを読み取らせるようにしてもよい。

図８に、調整部６１１の処理フロー例を示す。第１入力部７０１は、１フレーム分の信号を入力する（Ｓ８０１）。具体的には、復号部６０９により復号された所定の長さ（たとえば２０ｍｓ）の信号を入力する。以下の処理対象となるフレームの信号を、現フレームの信号という。第１入力部７０１は、フレームの信号の入力が終了したか否かを判定する（Ｓ８０３）。所定の長さの音信号を復号部６０９により得られない場合には、音信号の入力が終了したと判定する。

音信号の入力が終了しないと判定した場合には、第１変換部７０３は、時間周波数変換処理を行う（Ｓ８０５）。つまり、第１変換部７０３は、現フレームの信号を時間領域の信号から周波数領域の成分へ変換する。例えば、ＦＦＴ（Fast Fouriew Transform：高速フーリエ変換）の処理を行う。ＦＦＴと後述するＩＦＦＴ（Inverse Fast Fouriew Transform：高速逆フーリエ変換）による分析・合成における入力信号の処理手順については、例えば「信号解析入門電子・情報基礎シリーズ７」（越川常治著、近代科学社、４４頁〜５２頁）に詳細に説明されている。

続いて、判定部７０５は、現フレームが音声区間であるか非音声区間であるかを判定する（Ｓ８０７）。音声区間は、音声を含む区間であり、非音声区間は、音声を含まない区間である。非音声区間は、音声以外の雑音からなる区間である。尚、この場合の音声は、人の声による音であることを意味している。判定部７０５は、例えば現フレームの周波数成分に基づいて判定を行う。具体的な判定方法として、特許第４５１９１６９号公報等で知られる既知の方法を用いるようにしてもよい。

判定部７０５が判定した区間に応じて、処理は分岐する（Ｓ８０９）。現フレームが音声区間である場合に、長期にわたる音声の周波数特性を平均化した値を求める。そのため、判定部７０５が音声区間であると判定した場合には、音声特性算出部（Ａ）７０７は、音声特性算出処理（Ａ）を行う（Ｓ８１１）。尚、後述する実施の形態２では、音声特性算出処理（Ｂ）を行う。

図９に、音声特性算出処理（Ａ）のフロー例を示す。音声特性算出部（Ａ）７０７は、現フレームが、最初に処理するフレームであるか否かを判定する（Ｓ９０１）。尚、フレームには、フレームのインデックスが付されている。この例では、フレームのインデックスをｎで表す。ｎが１の場合には、最初のフレームであると判定する。以降入力順に従って、フレーム毎にｎは１ずつ増加する。

現フレームが、最初に処理するフレームであると判定された場合には、音声特性算出部（Ａ）７０７は、初期化処理を行う（Ｓ９０３）。まず、現フレームが長期平均に寄与する度合いを示す寄与係数αを設定する。寄与係数αには、０〜１の範囲の値が設定される。例えば、αに０．００１を設定する。この場合、１０００個のフレームについての平均値を得ることに相当する。尚、寄与係数αの値が大きいほど、現フレームの信号が長期平均に寄与する度合いは大きくなる。

音声特性算出部（Ａ）７０７は、初期化処理で、算出対象となるパワースペクトルＶａｖｅ（ｎ，ｆ）の初期値を設定する。Ｖａｖｅ（ｎ，ｆ）は、長期平均化された音声のパワースペクトルである。具体的には、Ｖａｖｅ（０，ｆ）に０を設定する。ｆは、周波数のインデックスである。この例では、ｆは０〜１２７の自然数を用いる。つまり、Ｖａｖｅ（０，０），Ｖａｖｅ（０，１），Ｖａｖｅ（０，２），・・・Ｖａｖｅ（０，１２７）の各変数に０を設定する。以上で初期化の説明を終える。

初期化を終えると、Ｓ９０５の処理へ移る。Ｓ９０１で最初に処理するフレームでないと判定した場合にも、初期化処理を行わずにＳ９０５の処理へ移る。

音声特性算出部（Ａ）７０７は、周波数ｆ（０〜１２７）毎に以下の処理を繰り返す（Ｓ９０５）。音声特性算出部（Ａ）７０７は、受信音のパワースペクトルＰ（ｎ，ｆ）を算出する（Ｓ９０７）。具体的には、音声特性算出部（Ａ）７０７は、現フレームの信号のフーリエスペクトル（実部Ｐ＿ｒｅ、虚部Ｐ＿ｉｍ）から、パワースペクトル（リニア値）を求める。尚、フーリエスペクトルとパワースペクトルは、いずれも周波数特性の例である。

次に、音声特性算出部（Ａ）７０７は、以下の式に従って長期平均化された音声のパワースペクトルＶａｖｅ（ｎ，ｆ）を算出する（Ｓ９０９）。以下、音声区間であることを識別するために、長期平均化された音声のパワースペクトルと呼ぶ。長期平均化された音声のパワースペクトルもリニア値である。長期平均化された音声のパワースペクトルも、周波数特性の例である。

尚、Ｖａｖｅ（ｎ−１，ｆ）が存在しない場合は、順次遡って存在するＶａｖｅ（ｎ−ｘ，ｆ）の値を用いるようにしてもよい。ｘは、１以降の自然数である。非音声区間においては、Ｖａｖｅ（ｎ−１，ｆ）が求められていないこともある。

上述の長期平均化された音声のパワースペクトルは、平滑化された音声のパワースペクトルの例である。他の算出方法によって、平滑化された音声のパワースペクトルを求めるようにしてもよい。

音声特性算出部（Ａ）７０７は、長期平均化された音声のパワースペクトルＶａｖｅ（ｎ，ｆ）を内部に保持する（Ｓ９１１）。そして、音声特性算出部（Ａ）７０７は、すべての周波数ｆについて処理したか否かを判定する（Ｓ９１３）。処理していない周波数ｆがある場合には、Ｓ９０５へ戻って処理を継続する。すべての周波数ｆについて処理したと判定した場合には、音声特性算出部（Ａ）７０７は処理を終え、図８の処理へ戻る。

図８の説明に戻る。Ｓ８０９の処理で、判定部７０５が非音声区間であると判定した場合には、雑音特性算出部７０９は、雑音特性算出処理を行う（Ｓ８１３）。この処理で、雑音特性算出部７０９は、長期にわたる雑音の周波数特性を平均化した値を求める。

図１０に、雑音特性算出処理のフロー例を示す。雑音特性算出部７０９は、現フレームの信号が、最初に処理するフレームの信号であるか否かを判定する（Ｓ１００１）。判定の方法は、音声特性算出部（Ａ）７０７の場合と同様である。

現フレームが、最初に処理するフレームであると判定した場合には、雑音特性算出部７０９は、初期化処理を行う（Ｓ１００３）。まず、現フレームが長期平均に寄与する度合いを示す寄与係数γを設定する。寄与係数γには、０〜１の範囲の値が設定される。例えば、γに０．００１を設定する。尚、寄与係数γの値が大きいほど、現フレームの信号が長期平均に寄与する度合いは大きくなる。

雑音特性算出部７０９は、初期化処理で、長期平均化された雑音のパワースペクトルＮａｖｅ（ｎ，ｆ）の初期値を設定する。具体的には、Ｎａｖｅ（０，ｆ）に０を設定する。つまり、Ｎａｖｅ（０，０），Ｎａｖｅ（０，１），Ｎａｖｅ（０，２），・・・Ｎａｖｅ（０，１２７）の各変数に０を設定する。

初期化を終えると、Ｓ１００５の処理へ移る。Ｓ１００１で最初に処理するフレームの信号でないと判定した場合にも、初期化は行わずにＳ１００５の処理へ移る。

雑音特性算出部７０９は、周波数ｆ（０〜１２７）毎に以下の処理を繰り返す（Ｓ１００５）。雑音特性算出部７０９は、受信音のパワースペクトルＰ（ｎ，ｆ）を算出する（Ｓ１００７）。

次に、雑音特性算出部７０９は、以下の式に従って長期平均化された雑音のパワースペクトルＮａｖｅ（ｎ，ｆ）を算出する（Ｓ１００９）。以下、非音声区間であることを識別するために、長期平均化された雑音のパワースペクトルと呼ぶ。長期平均化された雑音のパワースペクトルもリニア値である。長期平均化された雑音のパワースペクトルは、ＳＮＲ（ＳＮ比：Signal to Noise ratio）を求める際に用いられる。

尚、Ｎａｖｅ（ｎ−１，ｆ）が存在しない場合は、順次遡って存在するＮａｖｅ（ｎ−ｘ，ｆ）の値を用いるようにしてもよい。ｘは、１以降の自然数である。

上述の長期平均化された雑音のパワースペクトルは、平滑化された雑音のパワースペクトルの例である。他の算出方法によって、平滑化された雑音のパワースペクトルを求めるようにしてもよい。

雑音特性算出部７０９は、長期平均化された雑音のパワースペクトルＮａｖｅ（ｎ，ｆ）を内部に保持する（Ｓ１０１１）。そして、雑音特性算出部７０９は、すべての周波数ｆについて処理したか否かを判定する（Ｓ１０１３）。処理していない周波数ｆがある場合には、Ｓ１００５へ戻って処理を継続する。すべての周波数ｆについて処理したと判定し場合には、雑音特性算出部７０９は処理を終え、図８の処理へ戻る。

図８の処理に戻って、調整量算出部７１１は、調整量算出処理を行う（Ｓ８１５）。調整量は、音声の信号に含まれる周波数特性を調整するための値である。調整量は、例えば周波数毎に設定されるｄＢ値である。

図１１に、調整量算出処理のフロー例を示す。この例では、長期平均化された音声のパワースペクトルに関する低域成分の大きさと高域成分の大きさに基づいて、高域調整量を算出し、更に、長期平均化された音声のパワースペクトルに関する低域成分の大きさと中域成分の大きさに基づいて、中域調整量を算出する。

先に、低域成分の大きさと中域成分の大きさと高域成分の大きさを算出する。調整量算出部７１１は、以下の式に従って、長期平均化された音声のパワースペクトルに関する低域成分の大きさＰＬ（ｎ）を算出する（Ｓ１１０１）。

低域は、例えばＦＬｓ＝１００Ｈｚ〜ＦＬｅ＝１０００Ｈｚの範囲である。

次に、調整量算出部７１１は、以下の式に従って、長期平均化された音声のパワースペクトルに関する中域成分の大きさＰＭ（ｎ）を算出する（Ｓ１１０３）。

中域は、例えばＦＭｓ＝１０００Ｈｚ〜ＦＭｅ＝３０００Ｈｚの範囲である。

更に、調整量算出部７１１は、長期平均化された音声のパワースペクトルに関する高域成分の大きさＰＨ（ｎ）を算出する（Ｓ１１０５）。

高域は、例えばＦＨｓ＝３０００Ｈｚ〜ＦＨｅ＝４０００Ｈｚの範囲である。

この例では、成分の大きさとして、算術平均を求めている。これは、帯域に含まれるパワースペクトルの代表値の例である。幾何平均あるいは調和平均など他の平均を用いてもよい。更に、最頻値や中央値など他の代表値を算出するようにしてもよい。

続いて、調整量算出部７１１は、高域調整量算出処理を行う（Ｓ１１０７）。調整量算出部７１１は、以下の式に従って、高域調整量ＧａｉｎＨ（ｎ）を算出する。

ＴＨＡは、高域成分の大きさに対する低域成分の大きさの比率に関する基準値である。この例では、ＴＨＡは３０ｄＢである。上記の式によれば、１０ｌｏｇ_１０（ＰＬ（ｎ）／ＰＨ（ｎ））が３０ｄＢ以下であれば、高域調整量ＧａｉｎＨ（ｎ）は０ｄＢとなり、１０ｌｏｇ_１０（ＰＬ（ｎ）／ＰＨ（ｎ））が３０ｄＢより大きければ、高域調整量ＧａｉｎＨ（ｎ）は１０ｌｏｇ_１０（ＰＬ（ｎ）／ＰＨ（ｎ））から３０を引いた差（正の値）となる。尚、１０ｌｏｇ_１０（ＰＬ（ｎ）／ＰＨ（ｎ））は、図２に示したこもり指標ｍｕｆｆｌｅに相当する。

図１２に、高域調整量算出処理のフロー例を示す。調整量算出部７１１は、高域成分の大きさに対する低域成分の大きさの比率を求める（Ｓ１２０１）。具体的には、調整量算出部７１１は、１０ｌｏｇ_１０（ＰＬ（ｎ）／ＰＨ（ｎ））を算出してデシベル単位に変換している。そして、調整量算出部７１１は、比率から基準値ＴＨＡを引く（Ｓ１２０３）。調整量算出部７１１は、差が０より大きいか否かを判定する（Ｓ１２０５）。差が０より大きいと判定した場合には、調整量算出部７１１は、差を高域調整量ＧａｉｎＨ（ｎ）に設定する（Ｓ１２０７）。この高域調整量ＧａｉｎＨ（ｎ）によって、高域の音が強調される。差が０より大きくないと判定した場合には、調整量算出部７１１は、０を高域調整量ＧａｉｎＨ（ｎ）に設定する（Ｓ１２０９）。この場合、高域の音は強調されない。

図１１の処理に戻る。次に、調整量算出部７１１は、中域調整量算出処理を行う（Ｓ１１０９）。調整量算出部７１１は、以下の式に従って、中域調整量ＧａｉｎＭ（ｎ）を算出する。

ＴＨＢは、低域成分の大きさに対する中域成分の大きさの比率に関する基準値である。この例では、ＴＨＢは１０ｄＢである。上記の式によれば、１０ｌｏｇ_１０（ＰＭ（ｎ）／ＰＬ（ｎ））が１０ｄＢ以下であれば、中域調整量ＧａｉｎＭ（ｎ）は０ｄＢとなり、１０ｌｏｇ_１０（ＰＭ（ｎ）／ＰＬ（ｎ））が１０ｄＢより大きければ、中域調整量ＧａｉｎＭ（ｎ）は１０から１０ｌｏｇ_１０（ＰＭ（ｎ）／ＰＬ（ｎ））を引いた差（負の値）となる。

図１３に、中域調整量算出処理のフロー例を示す。調整量算出部７１１は、低域成分の大きさに対する中域成分の大きさの比率を求める（Ｓ１３０１）。具体的には、調整量算出部７１１は、１０ｌｏｇ_１０（ＰＭ（ｎ）／ＰＬ（ｎ））を算出して、デシベル単位に変換している。調整量算出部７１１は、基準値ＴＨＢから比率を引く（Ｓ１３０３）。調整量算出部７１１は、差が０より小さいか否かを判定する（Ｓ１３０５）。差が０より小さいと判定した場合には、調整量算出部７１１は、差を中域調整量ＧａｉｎＭ（ｎ）に設定する（Ｓ１３０７）。この中域調整量ＧａｉｎＭ（ｎ）によって、中域の音が抑制される。差が０より小さくないと判定した場合には、調整量算出部７１１は、０を中域調整量ＧａｉｎＭ（ｎ）に設定する（Ｓ１３０９）。この場合、中域の音は強調されない。

図１１に戻って、調整量算出部７１１は、調整量算出処理を終了する。

図８の処理に戻って、調整量補正部７１３は、調整量補正処理を行う（Ｓ８１７）。調整量補正処理では、調整量を補正する。この例では、ＳＮＲによる寄与係数と音声成分の大きさによる寄与係数を求め、ＳＮＲによる寄与係数と音声成分の大きさによる寄与係数を乗じて総合寄与係数を求める。更に、総合寄与係数に基づいて、中域の調整量と、高域の調整量を求める。

図１４に、調整量補正処理のフロー例を示す。調整量補正部７１３は、以下の式に従って、ＳＮＲ（ｎ）を算出する（Ｓ１４０１）。ＳＮＲ（ｎ）は、ｄＢ値である。

また、調整量補正部７１３は、以下の式に従ってＳＮＲによる寄与係数Ｃｏｅｆ＿ＳＮＲ（ｎ）を算出する（Ｓ１４０３）。

ＳＮＲ＿Ｌは、ＳＮＲによる寄与係数が０となる最大の値を示す定数である。ＳＮＲ＿Ｈは、ＳＮＲによる寄与係数が１となる最小の値を示す定数である。上記の式に従えば、ＳＮＲによる寄与係数Ｃｏｅｆ＿ＳＮＲ（ｎ）は図１５に示す値となる。

図１４に戻って、調整量補正部７１３は、以下の式に従って、音声成分の大きさを算出する（Ｓ１４０５）。

また、調整量補正部７１３は、以下の式に従って、音声成分の大きさによる寄与係数Ｃｏｅｆ＿Ｖ（ｎ）を算出する（Ｓ１４０７）。

Ｖ＿Ｌは、音声成分の大きさによる寄与係数が１となる最大の値を示す定数である。Ｖ＿Ｈは、音声成分の大きさによる寄与係数が０となる最小の値を示す定数である。上記の式に従えば、音声成分の大きさによる寄与係数Ｃｏｅｆ＿Ｖ（ｎ）は図１６に示す値となる。

図１４に戻って、調整量補正部７１３は、以下の式に従って、総合寄与係数βを算出する（Ｓ１４０９）。

調整量補正部７１３は、以下の式に従って、低域の調整量Ｇａｉｎ（ｎ，ｆ）に０を設定する（Ｓ１４１１）。

調整量補正部７１３は、以下の式に従って、中域調整量ＧａｉｎＭ（ｎ，ｆ）を補正した値を中域の調整量Ｇａｉｎ（ｎ，ｆ）に設定する（Ｓ１４１３）。

調整量補正部７１３は、以下の式に従って、高域調整量ＧａｉｎＨ（ｎ，ｆ）を補正した値を高域の調整量Ｇａｉｎ（ｎ，ｆ）に設定する（Ｓ１４１５）。

図８の処理に戻って、修正部７１５は、修正処理を行う（Ｓ８１９）。修正処理では、補正した調整量を音信号のフーリエスペクトルに適用する。

図１７に、修正処理のフロー例を示す。修正部７１５は、以下の式に従って、各周波数（ｆ：０〜１２７）について、調整した音信号のフーリエスペクトルの実部の値Ｐｏｕｔ＿ｒｅ（ｎ，ｆ）を算出する（Ｓ１７０１）。

Ｐ＿ｒｅ（ｎ，ｆ）は、入力した音信号のフーリエスペクトルの実部の値である。

修正部７１５は、以下の式に従って、各周波数（ｆ：０〜１２７）について、調整した音信号のフーリエスペクトルの虚部の値Ｐｏｕｔ＿ｉｍ（ｎ，ｆ）を算出する（Ｓ１７０３）。

Ｐ＿ｉｍ（ｎ，ｆ）は、入力した音信号のフーリエスペクトルの虚部の値である。

図８の処理に戻って、第２変換部７１７は、周波数時間変換処理を行う（Ｓ８２１）。調整した音信号を、周波数領域の信号から時間領域の信号に変換する。この変換は、例えばＩＦＦＴ（Inverse Fast Fouriew Transform：高速逆フーリエ変換）によって処理する。

上述のように、「こもり感」と「軽さ」の基準を満たすように受信音の周波数特性を修正することで、受話音を聞き取りやすくすることができる。例えば、「こもり感」と「軽さ」が自端末以外の条件に基づく周波数特性によって生じる場合にも、これらの聞き取りにくさを解消することができる。

また、長期平均の音声周波数特性を用いて補正量を算出するため、音声のゆらぎの影響を受けないようにできる。

また、受信音のＳＮＲに応じて調整量を補正するため、ＳＮＲが大きく調整によって音質劣化が起りにくい場合に限り、調整するようにできる。ＳＮＲが小さい場合には、調整によって音質が劣化することがある。

また、受信音に含まれる音声の大きさによって調整量を補正するため、音声が小さく補正が必要な場合に限り、補正するようにできる。

［実施の形態２］
本実施の形態では、通信端末装置の周囲における騒音（近端騒音という。）に埋もれていない音声成分を用いて、長期平均化された音声周波数特性を算出する。

図１８に、実施の形態２に係る通信端末装置の構成例を示す。アンテナ６０１、ＲＦ受信部６０３、Ａ／Ｄ変換部６０５、ベースバンド信号処理部６０７、復号部６０９、調整部６１１、Ｄ／Ａ変換部６１３、アンプ６１５及びスピーカ６１７は、図６と同様である。実施の形態２に係る通信端末装置は、更にマイク１８０１とＡ／Ｄ変換部１８０３を有している。マイク１８０１は、周囲の音を入力して、アナログ信号を生成する。Ａ／Ｄ変換部１８０３は、アナログ信号をデジタル信号に変換する。

図１９に、実施の形態２に係る調整部６１１の構成例を示す。第１入力部７０１、第１変換部７０３、判定部７０５、雑音特性算出部７０９、調整量算出部７１１、調整量補正部７１３、修正部７１５、第２変換部７１７及び記憶部７１９は、図７と同様である。実施の形態２に係る調整部６１１は、更に、第２入力部１９０１、第３変換部１９０３、騒音特性算出部１９０５を有している。また、実施の形態２に係る調整部６１１は、音声特性算出部（Ａ）７０７に代えて音声特性算出部（Ｂ）１９０７を有している。

第２入力部１９０１は、マイクから入力した音信号からのフレームの信号を順次入力する。第３変換部１９０３は、マイクからのフレームの信号を時間領域の信号から周波数領域の信号へ変換する。騒音特性算出部１９０５は、周囲の騒音に関する周波数特性を算出する。音声特性算出部（Ｂ）１９０７は、騒音に埋れていない音声の周波数特性を算出する。

図２０に、マイク音処理のフロー例を示す。マイクから入力した音信号に対する処理を行う。第２入力部１９０１は、順次音信号を入力する（Ｓ２００１）。具体的には、Ａ／Ｄ変換部１８０３から得た所定の長さ（たとえば２０ｍｓ）の信号を入力する。第２入力部１９０１は、処理を終了するか否か判定する（Ｓ２００３）。例えば、図８のＳ８０３で、第１入力部７０１よる音信号の入力が終了したと判定した場合に、Ｓ２００３でも処理を終了すると判定する。処理を終了しないと判定した場合には、第３変換部１９０３は、時間周波数変換処理を行う（Ｓ２００５）。具体的には、入力したフレームの信号を時間領域の信号から周波数領域の成分へ変換する。例えば、ＦＦＴ（Fast Fouriew Transform：高速フーリエ変換）の処理を行う。

判定部７０５は、入力したフレームが音声区間であるか非音声区間であるかを判定する（Ｓ２００７）。この判定は、図８のＳ８０７における判定方法と同様である。

入力したフレームが音声区間であると判定した場合には、Ｓ２００１の処理に戻り、次のフレームの信号を入力する。

入力したフレームが非音声区間であると判定した場合には、騒音特性算出部１９０５は、騒音特性算出処理を行う（Ｓ２０１１）。

図２１に、騒音特性算出処理のフロー例を示す。騒音特性算出部１９０５は、周波数ｆ毎に以下の処理を繰り返す（Ｓ２１０１）。騒音特性算出部１９０５は、マイク入力の騒音成分のパワースペクトルＮｎｅａｒ（ｎ，ｆ）を算出する（Ｓ２１０３）。具体的には、騒音特性算出部１９０５は、入力したフレームの信号のフーリエスペクトルからパワースペクトル（リニア値）を求める。騒音特性算出部１９０５は、すべての周波数ｆについて処理したか否かを判定する（Ｓ２１０５）。処理していない周波数ｆがあると判定した場合には、Ｓ２１０１に戻り処理を継続する。すべての周波数ｆについて処理したと判定した場合には、騒音特性算出部１９０５は、処理を終える。

実施の形態２では、図８のＳ８１１において、音声特性算出処理（Ａ）に代えて音声特性算出処理（Ｂ）を行う。

図２２に、音声特性算出処理（Ｂ）のフロー例を示す。Ｓ９０１〜Ｓ９０５及びＳ９１３の処理は、図９に示した音声特性算出処理（Ａ）の場合と同様である。

Ｓ９０５の処理に続いて、音声特性算出部（Ｂ）１９０７は、抽出処理（Ｓ２２０１）を行う。

図２３に、抽出処理のフロー例を示す。抽出処理では、以下の２つの式に従って、騒音超成分のパワースペクトルＰｖ（ｎ，ｆ）を算出する。騒音超成分のパワースペクトルＰｖ（ｎ，ｆ）は、現フレームの音声のパワースペクトルのうち、周囲の騒音に埋もれていない成分（リニア値）を示している。

音声特性算出部（Ｂ）１９０７は、受信音のパワースペクトルＰ（ｎ，ｆ）を算出する（Ｓ２３０１）。この処理は、図９のＳ９０７の場合と同様である。

音声特性算出部（Ｂ）１９０７は、騒音特性算出部１９０５から騒音成分のパワースペクトルＮｎｅａｒ（ｎ，ｆ）を取得する（Ｓ２３０３）。音声特性算出部（Ｂ）１９０７は、騒音成分のパワースペクトルよりも受信音のパワースペクトルが大きいか否かを判定する（Ｓ２３０５）。騒音成分のパワースペクトルよりも受信音のパワースペクトルが大きいと判定した場合には、音声特性算出部（Ｂ）１９０７は、（１）の式に従って、騒音超成分のパワースペクトルＰｖ（ｎ，ｆ）を算出する（Ｓ２３０７）。騒音超成分のパワースペクトルＰｖ（ｎ，ｆ）は、受信音のパワースペクトルＰ（ｎ，ｆ）から騒音成分のパワースペクトルＮｎｅａｒ（ｎ，ｆ）を差し引いた差となる。この値が、長期平均化された音声のパワースペクトルの算出に用いられる。一方、騒音成分のパワースペクトルよりも受信音のパワースペクトルが大きくないと判定した場合には、音声特性算出部（Ｂ）１９０７は、（２）の式に従って、騒音超成分のパワースペクトルＰｖ（ｎ，ｆ）に０を設定する（Ｓ２３０９）。

図２２の処理に戻って、音声特性算出部（Ｂ）１９０７は、以下の式に従って、長期平均化された音声のパワースペクトルＶａｖｅ（ｎ，ｆ）を算出する（Ｓ２２０３）。

そして、音声特性算出部（Ｂ）１９０７は、長期平均化された音声のパワースペクトルＶａｖｅ（ｎ，ｆ）を内部に保持する（Ｓ２２０５）。

長期平均化された音声のパワースペクトルＶａｖｅ（ｎ，ｆ）を用いる以後の処理は、実施の形態１と同様である。

本実施の形態によれば、音声のパワーが騒音のパワーを越える差分を音声の周波数特性とする。これにより、周囲が騒がしい環境においても、その環境に適した調整を行うことができる。

上述の通信端末装置は、例えば携帯電話端末である。無線による通信装置に限らず、有線による通信装置において上述の調整部を用いるようにしてもよい。例えばＶｏＩＰ（Voice over Internet Protocol）システムやテレビ会議システムなどの音声伝送システムに適用してもよい。また、通信を行わない音声再生装置において、上述の調整部を用いるようにしてもよい。例えば、記憶部に記憶されている音信号を再生する場合に、読み出した音信号を調整するようにしてもよい。

以上本技術の一実施の形態を説明したが、本技術はこれに限定されるものではない。例えば、上述の機能ブロック構成は実際のプログラムモジュール構成に対応するものではない。

また、上で説明した各記憶領域の構成は一例であって、上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。

以上述べた実施の形態をまとめると、以下のようになる。

本実施の形態に係る調整装置は、（Ａ）音声信号の第１周波数帯域における周波数特性と音声信号の第１周波数帯域よりも高い周波数側の第２周波数帯域における周波数特性との比を求め、求めた比が所定の基準を満たさない場合に、比が所定の基準に近づくように、音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、（Ｂ）調整量に応じて、音声信号に含まれる周波数特性の少なくとも一部を修正する修正部とを有する。

このようにすれば、音声信号に含まれる２つの周波数帯域における周波数特性のバランスに起因する音声の聞き取りにくさを、解消することができる。

また、第１周波数帯域は、声の音域における低周波数側の帯域であり、第２周波数帯域は、声の音域における中央付近の周波数の帯域であってもよい。更に、（ａ１）上記算出部は、第１周波数帯域に含まれるスペクトルの代表値に対する第２周波数帯域に含まれるスペクトルの代表値の比が、所定の基準よりも大きい場合に、比が小さくなるように調整するための調整量を算出するようにしてもよい。

このようにすれば、低周波数側の帯域に含まれるスペクトルの代表値に対する中央付近の周波数の帯域に含まれるスペクトルの代表値が大きい場合に生じる「軽さ」による聞き取りにくさを解消することができる。

また、第１周波数帯域は、声の音域における低周波数側の帯域であり、第２周波数帯域は、声の音域における高周波数側の帯域であってもよい。更に、（ａ２）上記算出部は、第２周波数帯域に含まれるスペクトルの代表値に対する第１周波数帯域に含まれるスペクトルの代表値の比が、所定の基準よりも大きい場合に、比が小さくなるように調整するための調整量を算出するようにしてもよい。

このようにすれば、高周波数側の帯域に含まれるスペクトルの代表値に対する低周波数側の帯域に含まれるスペクトルの代表値の比が大きい場合、つまり低周波数側の帯域に含まれるスペクトルの代表値に対する高周波数側の帯域に含まれるスペクトルの代表値が小さい場合に生じる「こもり感」による聞き取りにくさを解消することができる。

調整量は、第２周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量であってもよい。

このようにすれば、高い周波数側の帯域に含まれる周波数特性を調整するので、低い周波数側の帯域に含まれる周波数特性に対する調整を要しない。一般的に、低い周波数側の方が音量が大きいので、調整に伴う全体音量の変動を抑えることができる。

本実施の形態に係る調整装置は、（Ｃ）音声信号の第１周波数帯域における周波数特性と音声信号の第１周波数帯域よりも高い周波数側の第２周波数帯域における周波数特性との第１の比を求め、音声信号の第１周波数帯域における周波数特性と音声信号の第２周波数帯域よりも高い周波数側の第３周波数帯域における周波数特性との第２の比を求め、第１の比が第１の基準を満たさない場合に、第１の比が第１の基準に近づくように、且つ第２の比が第２の基準を満たさない場合に、第２の比が第２の基準に近づくように、音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、（Ｄ）調整量に応じて、音声信号に含まれる周波数特性の少なくとも一部を修正する修正部とを有する。

このようにすれば、第１周波数帯域と第１周波数帯域よりも高い周波数側の第２周波数帯域の間の周波数特性のバランスに起因する聞き取りにくさと、第１周波数帯域と第２周波数帯域よりも高い周波数側の第３周波数帯域の間の周波数特性のバランスに起因する聞き取りにくさとを、同時に解消することができる。

また、第１周波数帯域は、声の音域における低周波数側の帯域であり、第２周波数帯域は、声の音域における中央付近の周波数の帯域であり、第３周波数帯域は、声の音域における高周波数側の帯域であってもよい。更に、第１の比は、第１周波数帯域に含まれるスペクトルの代表値に対する第２周波数帯域に含まれるスペクトルの代表値の比であってもよい。第２の比は、第３周波数帯域に含まれるスペクトルの代表値に対する第１周波数帯域に含まれるスペクトルの代表値の比であってもよい。加えて、（ｃ１）上記算出部は、第１の比が第１の基準よりも大きい場合に、第１の比が小さくなるように第１の調整量を算出し、且つ第２の比が第２の基準よりも大きい場合に、第２の比が小さくなるように第２の調整量を算出するようにしてもよい。

このようにすれば、低周波数側の帯域に含まれるスペクトルの代表値に対する中央付近の周波数の帯域に含まれるスペクトルの代表値が大きい場合に生じる「軽さ」による聞き取りにくさを解消するとともに、高周波数側の帯域に含まれるスペクトルの代表値に対する低周波数側の帯域に含まれるスペクトルの代表値の比が大きい場合、つまり低周波数側の帯域に含まれるスペクトルの代表値に対する高周波数側の帯域に含まれるスペクトルの代表値が小さい場合に生じる「こもり感」による聞き取りにくさを解消することができる。

第１の調整量は、第２周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量であってもよい。第２の調整量は、第３周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量であってもよい。

このようにすれば、高い周波数側の帯域と中央付近の周波数の帯域の周波数特性を調整するので、低い周波数側の帯域の周波数特性に対する調整を要しない。一般的に、低い周波数側の方が音量が大きいので、調整に伴う全体音量の変動を抑えることができる。

上記代表値は、平均値であってもよい。

このようにすれば、各周波数帯域の音の強さを適正に評価できる。

上記算出部は、平滑化された値である周波数特性を用いて比の算出を行ってもよい。

このようにすれば、音声の揺らぎによる影響を排除することができる。

上記算出部は、音声信号の周波数特性が周囲の騒音信号の周波数特性を超える差分を用いて比の算出を行ってもよい。

このようにすれば、周囲の騒音による影響を排除して適正に音声を調整することができる。

更に、音声信号の区間と雑音信号の区間を含む入力信号のＳＮ比を算出し、算出されたＳＮ比に基づいて、調整量を補正する補正部を有してもよい。

このようにすれば、音質劣化の程度に応じて音声を調整することができる。

更に、音声信号に含まれる音声成分の大きさを算出し、算出された音声成分の大きさに基づいて、調整量を補正する補正部を有してもよい。

このようにすれば、声の音量に応じて音声を調整することができる。

なお、上記方法による処理をプロセッサに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、ＣＤ−ＲＯＭ、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納されるようにしてもよい。尚、中間的な処理結果は、一般的にメインメモリ等の記憶装置に一時保管される。

以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。

（付記１）
音声信号の第１周波数帯域における周波数特性と前記音声信号の前記第１周波数帯域よりも高い周波数側の第２周波数帯域における周波数特性との比を求め、求めた前記比が所定の基準を満たさない場合に、前記比が前記所定の基準に近づくように、前記音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、
前記調整量に応じて、前記音声信号に含まれる周波数特性の少なくとも一部を修正する修正部と
を有する調整装置。

（付記２）
前記第１周波数帯域は、声の音域における低周波数側の帯域であり、
前記第２周波数帯域は、声の音域における中央付近の周波数の帯域であり、
前記算出部は、前記第１周波数帯域に含まれるスペクトルの代表値に対する前記第２周波数帯域に含まれるスペクトルの代表値の比が、所定の基準よりも大きい場合に、前記比が小さくなるように調整するための調整量を算出する
付記１記載の調整装置。

（付記３）
前記第１周波数帯域は、声の音域における低周波数側の帯域であり、
前記第２周波数帯域は、声の音域における高周波数側の帯域であり、
前記算出部は、前記第２周波数帯域に含まれるスペクトルの代表値に対する前記第１周波数帯域に含まれるスペクトルの代表値の比が、所定の基準よりも大きい場合に、前記比が小さくなるように調整するための調整量を算出する
付記１記載の調整装置。

（付記４）
前記調整量は、前記第２周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量である
付記１乃至３のいずれか１つ記載の調整装置。

（付記５）
音声信号の第１周波数帯域における周波数特性と前記音声信号の前記第１周波数帯域よりも高い周波数側の第２周波数帯域における周波数特性との第１の比を求め、前記音声信号の前記第１周波数帯域における周波数特性と前記音声信号の前記第２周波数帯域よりも高い周波数側の第３周波数帯域における周波数特性との第２の比を求め、前記第１の比が第１の基準を満たさない場合に、前記第１の比が前記第１の基準に近づくように、且つ前記第２の比が前記第２の基準を満たさない場合に、前記第２の比が前記第２の基準に近づくように、前記音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、
前記調整量に応じて、前記音声信号に含まれる周波数特性の少なくとも一部を修正する修正部と
を有する調整装置。

（付記６）
前記第１周波数帯域は、声の音域における低周波数側の帯域であり、
前記第２周波数帯域は、声の音域における中央付近の周波数の帯域であり、
前記第３周波数帯域は、声の音域における高周波数側の帯域であり、
前記第１の比は、前記第１周波数帯域に含まれるスペクトルの代表値に対する前記第２周波数帯域に含まれるスペクトルの代表値の比であり、
前記第２の比は、前記第３周波数帯域に含まれるスペクトルの代表値に対する前記第１周波数帯域に含まれるスペクトルの代表値の比であり、
前記算出部は、前記第１の比が前記第１の基準よりも大きい場合に、前記第１の比が小さくなるように第１の調整量を算出し、且つ前記第２の比が前記第２の基準よりも大きい場合に、前記第２の比が小さくなるように第２の調整量を算出する
付記５記載の調整装置。

（付記７）
前記第１の調整量は、前記第２周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量であって、
前記第２の調整量は、前記第３周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量である
付記５又は６記載の調整装置。

（付記８）
前記代表値は、平均値である
付記２、３又は６のいずれか１つ記載の調整装置。

（付記９）
前記算出部は、平滑化された値である前記周波数特性を用いて比の算出を行う
付記１乃至８のいずれか１つ記載の調整装置。

（付記１０）
前記算出部は、前記音声信号の周波数特性が周囲の騒音信号の周波数特性を超える差分を用いて比の算出を行う
付記１乃至９のいずれか１つ記載の調整装置。

（付記１１）
更に、
前記音声信号の区間と雑音信号の区間を含む入力信号のＳＮ比を算出し、算出されたＳＮ比に基づいて、前記調整量を補正する補正部を有する
付記１乃至１０のいずれか１つ記載の調整装置。

（付記１２）
更に、
前記音声信号に含まれる音声成分の大きさを算出し、算出された音声成分の大きさに基づいて、調整量を補正する補正部を有する
付記１乃至１１のいずれか１つ記載の調整装置。

（付記１３）
音声信号の第１周波数帯域における周波数特性と前記音声信号の前記第１周波数帯域よりも高い周波数側の第２周波数帯域における周波数特性との比を求め、求めた前記比が所定の基準を満たさない場合に、前記比が前記所定の基準に近づくように、前記音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出し、
前記調整量に応じて、前記音声信号に含まれる周波数特性の少なくとも一部を修正する
調整方法。

（付記１４）
音声信号の第１周波数帯域における周波数特性と前記音声信号の前記第１周波数帯域よりも高い周波数側の第２周波数帯域における周波数特性との第１の比を求め、前記音声信号の前記第１周波数帯域における周波数特性と前記音声信号の前記第２周波数帯域よりも高い周波数側の第３周波数帯域における周波数特性との第２の比を求め、前記第１の比が第１の基準を満たさない場合に、前記第１の比が前記第１の基準に近づくように、且つ前記第２の比が前記第２の基準を満たさない場合に、前記第２の比が前記第２の基準に近づくように、前記音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出し、
前記調整量に応じて、前記音声信号に含まれる周波数特性の少なくとも一部を修正する
調整方法。

６０１アンテナ６０３ＲＦ受信部
６０５Ａ／Ｄ変換部６０７ベースバンド信号処理部
６０９復号部６１１調整部
６１３Ｄ／Ａ変換部６１５アンプ
６１７スピーカ７０１第１入力部
７０３第１変換部７０５判定部
７０７音声特性算出部（Ａ）７０９雑音特性算出部
７１１調整量算出部７１３調整量補正部
７１５修正部７１７第２変換部
７１９記憶部１８０１マイク
１８０３Ａ／Ｄ変換部１９０１第２入力部
１９０３第３変換部１９０５騒音特性算出部
１９０７音声特性算出部（Ｂ）

Claims

音声信号について、声の音域における高周波数側の第１周波数帯域に含まれるスペクトルの代表値に対する、前記音域における低周波数側の第２周波数帯域に含まれるスペクトルの代表値の比を求め、当該比が所定の基準よりも大きい場合に、前記第１周波数帯域に含まれる前記スペクトルを増加させる調整量を算出する算出部と、
前記調整量に応じて、前記音声信号に含まれる前記第１周波数帯域に含まれる前記スペクトルを修正する修正部と
を有する調整装置。
音声信号について、声の音域における低周波数側の第１周波数帯域に含まれるスペクトルの代表値に対する、前記音域における中央付近の第２周波数帯域に含まれるスペクトルの代表値の第１の比を求め、前記音域における高周波数側の第３周波数帯域に含まれるスペクトルの代表値に対する、前記第１周波数帯域に含まれる前記スペクトルの前記代表値の第２の比を求め、当該第１の比が第１の基準よりも大きい場合に、前記第２周波数帯域に含まれる前記スペクトルを減少させる第１の調整量を算出し、当該第２の比が第２の基準よりも大きい場合に、前記第３周波数帯域に含まれる前記スペクトルを増加させる第２の調整量を算出する算出部と、
前記第１の調整量及び／又は前記第２の調整量に応じて、前記音声信号に含まれる前記第２周波数帯域に含まれる前記スペクトル及び／又は前記第３周波数帯域に含まれる前記スペクトルを修正する修正部と
を有する調整装置。
前記算出部は、平滑化された値である前記スペクトルを用いて比の算出を行う
請求項１又は２記載の調整装置。
前記算出部は、前記音声信号のスペクトルが周囲の騒音信号のスペクトルを超える差分を用いて比の算出を行う
請求項１乃至３のいずれか１つ記載の調整装置。
更に、
前記音声信号の区間と雑音信号の区間を含む入力信号のＳＮ比を算出し、算出されたＳＮ比に基づいて、前記調整量を補正する補正部を有する
請求項１乃至４のいずれか１つ記載の調整装置。
更に、
前記音声信号に含まれる音声成分の大きさを算出し、算出された音声成分の大きさに基づいて、前記調整量を補正する補正部を有する
請求項１乃至５のいずれか１つ記載の調整装置。
音声信号について、声の音域における高周波数側の第１周波数帯域に含まれるスペクトルの代表値に対する、前記音域における低周波数側の第２周波数帯域に含まれるスペクトルの代表値の比を求め、当該比が所定の基準よりも大きい場合に、前記第１周波数帯域に含まれる前記スペクトルを増加させる調整量を算出し、
前記調整量に応じて、前記音声信号に含まれる前記第１周波数帯域に含まれる前記スペクトルを修正する
処理を含み、プロセッサにより実行される調整方法。
音声信号について、声の音域における低周波数側の第１周波数帯域に含まれるスペクトルの代表値に対する、前記音域における中央付近の第２周波数帯域に含まれるスペクトルの代表値の第１の比を求め、前記音域における高周波数側の第３周波数帯域に含まれるスペクトルの代表値に対する、前記第１周波数帯域に含まれる前記スペクトルの前記代表値の第２の比を求め、当該第１の比が第１の基準よりも大きい場合に、前記第２周波数帯域に含まれる前記スペクトルを減少させる第１の調整量を算出し、当該第２の比が第２の基準よりも大きい場合に、前記第３周波数帯域に含まれる前記スペクトルを増加させる第２の調整量を算出し、
前記第１の調整量及び／又は前記第２の調整量に応じて、前記音声信号に含まれる前記第２周波数帯域に含まれる前記スペクトル及び／又は前記第３周波数帯域に含まれる前記スペクトルを修正する
処理を含み、プロセッサにより実行される調整方法。