JP6160045B2 - 調整装置および調整方法 - Google Patents

調整装置および調整方法 Download PDF

Info

Publication number
JP6160045B2
JP6160045B2 JP2012195173A JP2012195173A JP6160045B2 JP 6160045 B2 JP6160045 B2 JP 6160045B2 JP 2012195173 A JP2012195173 A JP 2012195173A JP 2012195173 A JP2012195173 A JP 2012195173A JP 6160045 B2 JP6160045 B2 JP 6160045B2
Authority
JP
Japan
Prior art keywords
frequency band
frequency
ratio
adjustment amount
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012195173A
Other languages
English (en)
Other versions
JP2014052418A (ja
Inventor
遠藤 香緒里
香緒里 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012195173A priority Critical patent/JP6160045B2/ja
Priority to US13/923,844 priority patent/US9245536B2/en
Priority to EP13173160.6A priority patent/EP2709104B1/en
Publication of JP2014052418A publication Critical patent/JP2014052418A/ja
Application granted granted Critical
Publication of JP6160045B2 publication Critical patent/JP6160045B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Description

本技術は、音声信号の調整技術に関する。
ノイズの軽減や音声の明瞭化のために、特定の周波数のゲインを調整することが行われている。ある特許文献には、受話音声を聞きやすくするために、周波数毎のノイズを推定し、背景ノイズを除去する技術が開示されている。ノイズは、傾きと切片をパラメータとする周波数に関する直線でモデル化される。モデル化は、中間周波数から低周波数と高周波数に分けて行われる。
また、他の特許文献には、受話音声を聞きやすくするために、フォルマントを強調する技術が開示されている。この技術は、入力音声のフォルマント周波数を分析し、フォルマント周波数を強調することで受話音声の明瞭度を向上させている。フォルマントは、言葉を発する場合の音に関する特性である。
受話音声の聞きやすさは、このように受話音声に混入する背景ノイズを抑圧することや、受話音声のフォルマントを強調させることで向上させることができる。
しかし、背景ノイズや言葉を発する場合の特性の他にも、音声信号の再生音声を聞き取りにくくする要因は存在する。
特開2009−104140号公報 特開2010−092057号公報
一側面では、再生音声の聞き取りにくさを解消することを目的とする。
一態様の調整装置は、(A)音声信号の第1周波数帯域における周波数特性と音声信号の第1周波数帯域よりも高い周波数側の第2周波数帯域における周波数特性との比を求め、求めた比が所定の基準を満たさない場合に、比が所定の基準に近づくように、音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、(B)調整量に応じて、音声信号に含まれる周波数特性の少なくとも一部を修正する修正部とを有する。
一態様の調整装置は、(C)音声信号の第1周波数帯域における周波数特性と音声信号の第1周波数帯域よりも高い周波数側の第2周波数帯域における周波数特性との第1の比を求め、音声信号の第1周波数帯域における周波数特性と音声信号の第2周波数帯域よりも高い周波数側の第3周波数帯域における周波数特性との第2の比を求め、第1の比が第1の基準を満たさない場合に、第1の比が第1の基準に近づくように、且つ第2の比が第2の基準を満たさない場合に、第2の比が第2の基準に近づくように、音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、(D)調整量に応じて、音声信号に含まれる周波数特性の少なくとも一部を修正する修正部とを有する。
一態様によれば、再生音声の聞き取りにくさを解消できるようになる。
図1は、受話音声の音質を説明するための図である。 図2は、「こもり感」が生じる場合の音声の周波数特性の一例を示す図である。 図3は、「こもり感」が解消された場合の音声の周波数特性の一例を示す図である。 図4は、「軽さ」が生じる場合の音声の周波数特性の一例を示す図である。 図5は、「軽さ」が解消された場合の音声の周波数特性の一例を示す図である。 図6は、通信端末装置の構成例を示す図である。 図7は、調整部の構成例を示す図である。 図8は、調整部の処理フロー例を示す図である。 図9は、音声特性算出処理(A)のフロー例を示す図である。 図10は、雑音特性算出処理のフロー例を示す図である。 図11は、調整量算出処理のフロー例を示す図である。 図12は、高域調整量算出処理のフロー例を示す図である。 図13は、中域調整量算出処理のフロー例を示す図である。 図14は、調整量補正処理のフロー例を示す図である。 図15は、SNRによる寄与係数を示す図である。 図16は、音声成分の大きさによる寄与係数を示す図である。 図17は、修正処理のフロー例を示す図である。 図18は、実施の形態2に係る通信端末装置の構成例を示す図である。 図19は、実施の形態2に係る調整部の構成例を示す図である。 図20は、マイク音処理のフロー例を示す図である。 図21は、騒音特性算出処理のフロー例を示す図である。 図22は、音声特性算出処理(B)のフロー例を示す図である。 図23は、抽出処理のフロー例を示す図である。
[実施の形態1]
最初に、図1を用いて受話音声の音質について説明する。ここでは、2つの通信端末間の通話を想定する。特に、通話相手の声質、相手端末の特性あるいは通信網の周波数特性など、自端末以外の条件に基づく周波数特性で決まる音質を、受信音の音質と呼ぶ。そして、受話音声の音質は、受信音の音質と自端末による周波数特性に影響される。
自端末による周波数特性は定常的であることが多いので、予め調整しておくことにより一定の効果を維持できる。これに対して、受信音の音質はその都度異なるので、所定の調整では一律に効果を上げることができるわけではない。
従って、受信音の音質に起因する再生音声の聞き取りにくさを解消するためには、受信音を調整することが求められる。本実施の形態では、特にクリア感が不足している音質である「こもり感」と、厚みが不足している音質である「軽さ」に着目する。「こもり感」と「軽さ」は、いずれも受信音に含まれ得る特性である。
続いて、「こもり感」と「軽さ」について説明する。まず、「こもり感」について説明する。クリア感の不足は、低域の音量に対する高域の音量の比率が小さい場合に生じる。
図2に、「こもり感」が生じる場合の音声の周波数特性の一例を示す。縦軸は、音声に含まれるパワーの値(dB値)を示す。横軸は、声の音域を周波数で示している。図中、FLsは、低域の下限を示す周波数であり、FLeは、低域の上限を示す周波数である。低域は、声の音域における低周波数側の帯域を指す。また、FHsは、高域の下限を示す周波数であり、FHeは、高域の上限を示す周波数である。高域は、声の音域における高周波数側の帯域を指す。FLs、FLe、FHs及びFHeは、いずれも定数である。
曲線201は、「こもり感」が生じる音声に含まれるパワーを模式的に示している。直線203は、低域におけるパワーの平均値を示している。直線205は、高域におけるパワーの平均値を示している。
パワーの差207は、「こもり感」の度合いを示すこもり指標muffleを示している。こもり指標muffleは、低域におけるパワーの平均値(dB値)から高域におけるパワーの平均値(dB値)を差し引くことにより求められる。こもり指標muffleが、判定の尺度となる基準値(この例では、30dB)を越える場合に、「こもり感」が発生していると判定する。図2は、こもり指標muffleが基準値を越えている状態を示している。
続いて、「こもり感」を解消するための調整の概要を説明する。図3に、「こもり感」が解消された場合の音声の周波数特性の一例を示す。この例では、高域におけるパワーを増大させることにより、高域の音を強調する。破線301は、高域における元のパワーを示している。実線303は、修正されたパワーを示している。このように、高域の音を強調することにより「こもり感」は解消される。
実線305は、調整後の高域におけるパワーの平均値を示している。そして、低域におけるパワーの平均値(dB値)から調整後の高域におけるパワーの平均値(dB値)を差し引くことにより調整後のこもり指標muffleが求められる。こもり指標muffleが基準値に近づけば、「こもり感」が改善していることを意味する。また、こもり指標muffleが基準値に達すれば、「こもり感」が解消したことを意味する。
本実施の形態では、低域と高域のバランスに基づいて「こもり感」の発生を判定し、「こもり感」を改善あるいは解消するように高域におけるパワーを調整する。
続いて「軽さ」について説明する。音の厚みの不足は、低域の音量に対する中域の音量の比率が大きい場合に生じる。
図4に、「軽さ」が生じる場合の音声の周波数特性の一例を示す。図2と同様に、縦軸は、音声に含まれるパワーの値(dB値)を示し、横軸は、声の音域を周波数で示している。また、FLsとFLeも、図2と同様である。
FMsは、中域の下限を示す周波数であり、FMeは、中域の上限を示す周波数である。中域は、声の音域における中央付近の周波数の帯域を指す。中域は、低域と高域の間の帯域とも言える。FMsとFMeも、定数である。
曲線201は、「軽さ」が生じる音声に含まれるパワーを模式的に示している。直線203は、低域におけるパワーの平均値を示している。直線401は、中域におけるパワーの平均値を示している。
パワーの差403は、「軽さ」の度合いを示す軽さ指標lightを示している。軽さ指標lightは、低域におけるパワーの平均値(dB値)から中域におけるパワーの平均値(dB値)を差し引くことにより求められる。軽さ指標lightが、判定の尺度となる基準値(この例では、10dB)より小さい場合に、「軽さ」が発生していると判定する。図4は、軽さ指標lightが基準値より小さい状態を示している。
続いて、「軽さ」を解消するための調整の概要を説明する。図5に、「軽さ」が解消された場合の音声の周波数特性の一例を示す。本実施の形態では、中域におけるパワーを減少させることにより、中域の音を抑制する。破線501は、中域における元のパワーを示している。実線503は、修正されたパワーを示している。このように、中域の音を抑制することにより「軽さ」は解消される。
直線505は、調整後の中域におけるパワーの平均値を示している。そして、低域におけるパワーの平均値(dB値)から調整後の中域におけるパワーの平均値(dB値)を差し引くことにより調整後の軽さ指標lightが求められる。軽さ指標lightが基準値に近づけば、「軽さ」が改善していることを意味する。また、軽さ指標lightが基準値に達すれば、「軽さ」が解消したことを意味する。
本実施の形態では、低域と中域のバランスに基づいて「軽さ」の発生を判定し、「軽さ」を改善あるいは解消するように中域におけるパワーを調整する。
以下、音声信号を調整する装置の例である通信端末装置について説明する。図6に、通信端末装置の構成例を示す。通信端末装置は、アンテナ601、RF受信部603、A/D変換部605、ベースバンド信号処理部607、復号部609、調整部611、D/A変換部613 、アンプ615及びスピーカ617を有している。アンテナ601は、RF(Radio Frequency)信号を受信する。RF受信部603は、アンテナより受信したRF信号を復調する。A/D変換部605は、アナログ信号をデジタル信号に変換する。ベースバンド信号処理部607は、デジタル信号に対するベースバンド処理を行う。復号部609は、ベースバンド信号を音信号に復号する。調整部611は、音信号の調整を行う。D/A変換部613 は、デジタル信号をアナログ信号に変換する。アンプ615は、アナログ信号を増幅する。スピーカ617は、再生音を出力する。
図7に、調整部611の構成例を示す。調整部611は、第1入力部701、第1変換部703、判定部705、音声特性算出部(A)707、雑音特性算出部709、調整量算出部711、調整量補正部713、修正部715及び第2変換部717を有している。
第1入力部701は、順次フレームの信号を入力する。第1変換部703は、フレームの信号を時間領域の信号から周波数領域の信号へ変換する。判定部705は、フレームの信号が音声区間であるか否かを判定する。音声特性算出部(A)707は、音声の周波数特性を算出する。雑音特性算出部709は、雑音の周波数特性を算出する。調整量算出部711は、音信号の周波数特性に対する調整量を算出する。調整量補正部713は、補正した調整量を算出する。修正部715は、補正した調整量に基づいて、音信号の周波数特性を修正する。第2変換部717は、周波数領域の信号から時間領域の信号への変換を行う。調整部611は、記憶部719を有するようにしてもよい。記憶部719は、各パラメータを記憶することに用いるようにしてもよい。各処理部は、記憶部719に、各パラメータを記憶させ、あるいは各パラメータを読み取らせるようにしてもよい。
図8に、調整部611の処理フロー例を示す。第1入力部701は、1フレーム分の信号を入力する(S801)。具体的には、復号部609により復号された所定の長さ(たとえば20ms)の信号を入力する。以下の処理対象となるフレームの信号を、現フレームの信号という。第1入力部701は、フレームの信号の入力が終了したか否かを判定する(S803)。所定の長さの音信号を復号部609により得られない場合には、音信号の入力が終了したと判定する。
音信号の入力が終了しないと判定した場合には、第1変換部703は、時間周波数変換処理を行う(S805)。つまり、第1変換部703は、現フレームの信号を時間領域の信号から周波数領域の成分へ変換する。例えば、FFT(Fast Fouriew Transform:高速フーリエ変換)の処理を行う。FFTと後述するIFFT(Inverse Fast Fouriew Transform:高速逆フーリエ変換)による分析・合成における入力信号の処理手順については、例えば「信号解析入門 電子・情報基礎シリーズ7」(越川常治著、近代科学社、44頁〜52頁)に詳細に説明されている。
続いて、判定部705は、現フレームが音声区間であるか非音声区間であるかを判定する(S807)。音声区間は、音声を含む区間であり、非音声区間は、音声を含まない区間である。非音声区間は、音声以外の雑音からなる区間である。尚、この場合の音声は、人の声による音であることを意味している。判定部705は、例えば現フレームの周波数成分に基づいて判定を行う。具体的な判定方法として、特許第4519169号公報等で知られる既知の方法を用いるようにしてもよい。
判定部705が判定した区間に応じて、処理は分岐する(S809)。現フレームが音声区間である場合に、長期にわたる音声の周波数特性を平均化した値を求める。そのため、判定部705が音声区間であると判定した場合には、音声特性算出部(A)707は、音声特性算出処理(A)を行う(S811)。尚、後述する実施の形態2では、音声特性算出処理(B)を行う。
図9に、音声特性算出処理(A)のフロー例を示す。音声特性算出部(A)707は、現フレームが、最初に処理するフレームであるか否かを判定する(S901)。尚、フレームには、フレームのインデックスが付されている。この例では、フレームのインデックスをnで表す。nが1の場合には、最初のフレームであると判定する。以降入力順に従って、フレーム毎にnは1ずつ増加する。
現フレームが、最初に処理するフレームであると判定された場合には、音声特性算出部(A)707は、初期化処理を行う(S903)。まず、現フレームが長期平均に寄与する度合いを示す寄与係数αを設定する。寄与係数αには、0〜1の範囲の値が設定される。例えば、αに0.001を設定する。この場合、1000個のフレームについての平均値を得ることに相当する。尚、寄与係数αの値が大きいほど、現フレームの信号が長期平均に寄与する度合いは大きくなる。
音声特性算出部(A)707は、初期化処理で、算出対象となるパワースペクトルVave(n,f)の初期値を設定する。Vave(n,f)は、長期平均化された音声のパワースペクトルである。具体的には、Vave(0,f)に0を設定する。fは、周波数のインデックスである。この例では、fは0〜127の自然数を用いる。つまり、Vave(0,0),Vave(0,1),Vave(0,2),・・・Vave(0,127)の各変数に0を設定する。以上で初期化の説明を終える。
初期化を終えると、S905の処理へ移る。S901で最初に処理するフレームでないと判定した場合にも、初期化処理を行わずにS905の処理へ移る。
音声特性算出部(A)707は、周波数f(0〜127)毎に以下の処理を繰り返す(S905)。音声特性算出部(A)707は、受信音のパワースペクトルP(n,f)を算出する(S907)。具体的には、音声特性算出部(A)707は、現フレームの信号のフーリエスペクトル(実部P_re、虚部P_im)から、パワースペクトル(リニア値)を求める。尚、フーリエスペクトルとパワースペクトルは、いずれも周波数特性の例である。
次に、音声特性算出部(A)707は、以下の式に従って長期平均化された音声のパワースペクトルVave(n,f)を算出する(S909)。以下、音声区間であることを識別するために、長期平均化された音声のパワースペクトルと呼ぶ。長期平均化された音声のパワースペクトルもリニア値である。長期平均化された音声のパワースペクトルも、周波数特性の例である。
Figure 0006160045
尚、Vave(n−1,f)が存在しない場合は、順次遡って存在するVave(n−x,f)の値を用いるようにしてもよい。xは、1以降の自然数である。非音声区間においては、Vave(n−1,f)が求められていないこともある。
上述の長期平均化された音声のパワースペクトルは、平滑化された音声のパワースペクトルの例である。他の算出方法によって、平滑化された音声のパワースペクトルを求めるようにしてもよい。
音声特性算出部(A)707は、長期平均化された音声のパワースペクトルVave(n,f)を内部に保持する(S911)。そして、音声特性算出部(A)707は、すべての周波数fについて処理したか否かを判定する(S913)。処理していない周波数fがある場合には、S905へ戻って処理を継続する。すべての周波数fについて処理したと判定し場合には、音声特性算出部(A)707は処理を終え、図8の処理へ戻る。
図8の説明に戻る。S809の処理で、判定部705が非音声区間であると判定した場合には、雑音特性算出部709は、雑音特性算出処理を行う(S813)。この処理で、雑音特性算出部709は、長期にわたる雑音の周波数特性を平均化した値を求める。
図10に、雑音特性算出処理のフロー例を示す。雑音特性算出部709は、現フレームの信号が、最初に処理するフレームの信号であるか否かを判定する(S1001)。判定の方法は、音声特性算出部(A)707の場合と同様である。
現フレームが、最初に処理するフレームであると判定した場合には、雑音特性算出部709は、初期化処理を行う(S1003)。まず、現フレームが長期平均に寄与する度合いを示す寄与係数γを設定する。寄与係数γには、0〜1の範囲の値が設定される。例えば、γに0.001を設定する。尚、寄与係数γの値が大きいほど、現フレームの信号が長期平均に寄与する度合いは大きくなる。
雑音特性算出部709は、初期化処理で、長期平均化された雑音のパワースペクトルNave(n,f)の初期値を設定する。具体的には、Nave(0,f)に0を設定する。つまり、Nave(0,0),Nave(0,1),Nave(0,2),・・・Nave(0,127)の各変数に0を設定する。
初期化を終えると、S1005の処理へ移る。S1001で最初に処理するフレームの信号でないと判定した場合にも、初期化は行わずにS1005の処理へ移る。
雑音特性算出部709は、周波数f(0〜127)毎に以下の処理を繰り返す(S1005)。雑音特性算出部709は、受信音のパワースペクトルP(n,f)を算出する(S1007)。
次に、雑音特性算出部709は、以下の式に従って長期平均化された雑音のパワースペクトルNave(n,f)を算出する(S1009)。以下、非音声区間であることを識別するために、長期平均化された雑音のパワースペクトルと呼ぶ。長期平均化された雑音のパワースペクトルもリニア値である。長期平均化された雑音のパワースペクトルは、SNR(SN比:Signal to Noise ratio)を求める際に用いられる。
Figure 0006160045
尚、Nave(n−1,f)が存在しない場合は、順次遡って存在するNave(n−x,f)の値を用いるようにしてもよい。xは、1以降の自然数である。
上述の長期平均化された雑音のパワースペクトルは、平滑化された雑音のパワースペクトルの例である。他の算出方法によって、平滑化された雑音のパワースペクトルを求めるようにしてもよい。
雑音特性算出部709は、長期平均化された雑音のパワースペクトルNave(n,f)を内部に保持する(S1011)。そして、雑音特性算出部709は、すべての周波数fについて処理したか否かを判定する(S1013)。処理していない周波数fがある場合には、S1005へ戻って処理を継続する。すべての周波数fについて処理したと判定し場合には、雑音特性算出部709は処理を終え、図8の処理へ戻る。
図8の処理に戻って、調整量算出部711は、調整量算出処理を行う(S815)。調整量は、音声の信号に含まれる周波数特性を調整するための値である。調整量は、例えば周波数毎に設定されるdB値である。
図11に、調整量算出処理のフロー例を示す。この例では、長期平均化された音声のパワースペクトルに関する低域成分の大きさと高域成分の大きさに基づいて、高域調整量を算出し、更に、長期平均化された音声のパワースペクトルに関する低域成分の大きさと中域成分の大きさに基づいて、中域調整量を算出する。
先に、低域成分の大きさと中域成分の大きさと高域成分の大きさを算出する。調整量算出部711は、以下の式に従って、長期平均化された音声のパワースペクトルに関する低域成分の大きさPL(n)を算出する(S1101)。
Figure 0006160045
低域は、例えばFLs=100Hz〜FLe=1000Hzの範囲である。
次に、調整量算出部711は、以下の式に従って、長期平均化された音声のパワースペクトルに関する中域成分の大きさPM(n)を算出する(S1103)。
Figure 0006160045
中域は、例えばFMs=1000Hz〜FMe=3000Hzの範囲である。
更に、調整量算出部711は、長期平均化された音声のパワースペクトルに関する高域成分の大きさPH(n)を算出する(S1105)。
Figure 0006160045
高域は、例えばFHs=3000Hz〜FHe=4000Hzの範囲である。
この例では、成分の大きさとして、算術平均を求めている。これは、帯域に含まれるパワースペクトルの代表値の例である。幾何平均あるいは調和平均など他の平均を用いてもよい。更に、最頻値や中央値など他の代表値を算出するようにしてもよい。
続いて、調整量算出部711は、高域調整量算出処理を行う(S1107)。調整量算出部711は、以下の式に従って、高域調整量GainH(n)を算出する。
Figure 0006160045
THAは、高域成分の大きさに対する低域成分の大きさの比率に関する基準値である。この例では、THAは30dBである。上記の式によれば、10log10(PL(n)/PH(n))が30dB以下であれば、高域調整量GainH(n)は0dBとなり、10log10(PL(n)/PH(n))が30dBより大きければ、高域調整量GainH(n)は10log10(PL(n)/PH(n))から30を引いた差(正の値)となる。尚、10log10(PL(n)/PH(n))は、図2に示したこもり指標muffleに相当する。
図12に、高域調整量算出処理のフロー例を示す。調整量算出部711は、高域成分の大きさに対する低域成分の大きさの比率を求める(S1201)。具体的には、調整量算出部711は、10log10(PL(n)/PH(n))を算出してデシベル単位に変換している。そして、調整量算出部711は、比率から基準値THAを引く(S1203)。調整量算出部711は、差が0より大きいか否かを判定する(S1205)。差が0より大きいと判定した場合には、調整量算出部711は、差を高域調整量GainH(n)に設定する(S1207)。この高域調整量GainH(n)によって、高域の音が強調される。差が0より大きくないと判定した場合には、調整量算出部711は、0を高域調整量GainH(n)に設定する(S1209)。この場合、高域の音は強調されない。
図11の処理に戻る。次に、調整量算出部711は、中域調整量算出処理を行う(S1109)。調整量算出部711は、以下の式に従って、中域調整量GainM(n)を算出する。
Figure 0006160045
THBは、低域成分の大きさに対する中域成分の大きさの比率に関する基準値である。この例では、THBは10dBである。上記の式によれば、10log10(PM(n)/PL(n))が10dB以下であれば、中域調整量GainM(n)は0dBとなり、10log10(PM(n)/PL(n))が10dBより大きければ、中域調整量GainM(n)は10から10log10(PM(n)/PL(n))を引いた差(負の値)となる。
図13に、中域調整量算出処理のフロー例を示す。調整量算出部711は、低域成分の大きさに対する中域成分の大きさの比率を求める(S1301)。具体的には、調整量算出部711は、10log10(PM(n)/PL(n))を算出して、デシベル単位に変換している。調整量算出部711は、基準値THBから比率を引く(S1303)。調整量算出部711は、差が0より小さいか否かを判定する(S1305)。差が0より小さいと判定した場合には、調整量算出部711は、差を中域調整量GainM(n)に設定する(S1307)。この中域調整量GainM(n)によって、中域の音が抑制される。差が0より小さくないと判定した場合には、調整量算出部711は、0を中域調整量GainM(n)に設定する(S1309)。この場合、中域の音は強調されない。
図11に戻って、調整量算出部711は、調整量算出処理を終了する。
図8の処理に戻って、調整量補正部713は、調整量補正処理を行う(S817)。調整量補正処理では、調整量を補正する。この例では、SNRによる寄与係数と音声成分の大きさによる寄与係数を求め、SNRによる寄与係数と音声成分の大きさによる寄与係数を乗じて総合寄与係数を求める。更に、総合寄与係数に基づいて、中域の調整量と、高域の調整量を求める。
図14に、調整量補正処理のフロー例を示す。調整量補正部713は、以下の式に従って、SNR(n)を算出する(S1401)。SNR(n)は、dB値である。
Figure 0006160045
また、調整量補正部713は、以下の式に従ってSNRによる寄与係数Coef_SNR(n)を算出する(S1403)。
Figure 0006160045
SNR_Lは、SNRによる寄与係数が0となる最大の値を示す定数である。SNR_Hは、SNRによる寄与係数が1となる最小の値を示す定数である。上記の式に従えば、SNRによる寄与係数Coef_SNR(n)は図15に示す値となる。
図14に戻って、調整量補正部713は、以下の式に従って、音声成分の大きさを算出する(S1405)。
Figure 0006160045
また、調整量補正部713は、以下の式に従って、音声成分の大きさによる寄与係数Coef_V(n)を算出する(S1407)。
Figure 0006160045
V_Lは、音声成分の大きさによる寄与係数が1となる最大の値を示す定数である。V_Hは、音声成分の大きさによる寄与係数が0となる最小の値を示す定数である。上記の式に従えば、音声成分の大きさによる寄与係数Coef_V(n)は図16に示す値となる。
図14に戻って、調整量補正部713は、以下の式に従って、総合寄与係数βを算出する(S1409)。
Figure 0006160045
調整量補正部713は、以下の式に従って、低域の調整量Gain(n,f)に0を設定する(S1411)。
Figure 0006160045
調整量補正部713は、以下の式に従って、中域調整量GainM(n,f)を補正した値を中域の調整量Gain(n,f)に設定する(S1413)。
Figure 0006160045
調整量補正部713は、以下の式に従って、高域調整量GainH(n,f)を補正した値を高域の調整量Gain(n,f)に設定する(S1415)。
Figure 0006160045
図8の処理に戻って、修正部715は、修正処理を行う(S819)。修正処理では、補正した調整量を音信号のフーリエスペクトルに適用する。
図17に、修正処理のフロー例を示す。修正部715は、以下の式に従って、各周波数(f:0〜127)について、調整した音信号のフーリエスペクトルの実部の値Pout_re(n,f)を算出する(S1701)。
Figure 0006160045
P_re(n,f)は、入力した音信号のフーリエスペクトルの実部の値である。
修正部715は、以下の式に従って、各周波数(f:0〜127)について、調整した音信号のフーリエスペクトルの虚部の値Pout_im(n,f)を算出する(S1703)。
Figure 0006160045
P_im(n,f)は、入力した音信号のフーリエスペクトルの虚部の値である。
図8の処理に戻って、第2変換部717は、周波数時間変換処理を行う(S821)。調整した音信号を、周波数領域の信号から時間領域の信号に変換する。この変換は、例えばIFFT(Inverse Fast Fouriew Transform:高速逆フーリエ変換)によって処理する。
上述のように、「こもり感」と「軽さ」の基準を満たすように受信音の周波数特性を修正することで、受話音を聞き取りやすくすることができる。例えば、「こもり感」と「軽さ」が自端末以外の条件に基づく周波数特性によって生じる場合にも、これらの聞き取りにくさを解消することができる。
また、長期平均の音声周波数特性を用いて補正量を算出するため、音声のゆらぎの影響を受けないようにできる。
また、受信音のSNRに応じて調整量を補正するため、SNRが大きく調整によって音質劣化が起りにくい場合に限り、調整するようにできる。SNRが小さい場合には、調整によって音質が劣化することがある。
また、受信音に含まれる音声の大きさによって調整量を補正するため、音声が小さく補正が必要な場合に限り、補正するようにできる。
[実施の形態2]
本実施の形態では、通信端末装置の周囲における騒音(近端騒音という。)に埋もれていない音声成分を用いて、長期平均化された音声周波数特性を算出する。
図18に、実施の形態2に係る通信端末装置の構成例を示す。アンテナ601、RF受信部603、A/D変換部605、ベースバンド信号処理部607、復号部609、調整部611、D/A変換部613 、アンプ615及びスピーカ617は、図6と同様である。実施の形態2に係る通信端末装置は、更にマイク1801とA/D変換部1803を有している。マイク1801は、周囲の音を入力して、アナログ信号を生成する。A/D変換部1803は、アナログ信号をデジタル信号に変換する。
図19に、実施の形態2に係る調整部611の構成例を示す。第1入力部701、第1変換部703、判定部705、雑音特性算出部709、調整量算出部711、調整量補正部713、修正部715、第2変換部717及び記憶部719は、図7と同様である。実施の形態2に係る調整部611は、更に、第2入力部1901、第3変換部1903、騒音特性算出部1905を有している。また、実施の形態2に係る調整部611は、音声特性算出部(A)707に代えて音声特性算出部(B)1907を有している。
第2入力部1901は、マイクから入力した音信号からのフレームの信号を順次入力する。第3変換部1903は、マイクからのフレームの信号を時間領域の信号から周波数領域の信号へ変換する。騒音特性算出部1905は、周囲の騒音に関する周波数特性を算出する。音声特性算出部(B)1907は、騒音に埋れていない音声の周波数特性を算出する。
図20に、マイク音処理のフロー例を示す。マイクから入力した音信号に対する処理を行う。第2入力部1901は、順次音信号を入力する(S2001)。具体的には、A/D変換部1803から得た所定の長さ(たとえば20ms)の信号を入力する。第2入力部1901は、処理を終了するか否か判定する(S2003)。例えば、図8のS803で、第1入力部701よる音信号の入力が終了したと判定した場合に、S2003でも処理を終了すると判定する。処理を終了しないと判定した場合には、第3変換部1903は、時間周波数変換処理を行う(S2005)。具体的には、入力したフレームの信号を時間領域の信号から周波数領域の成分へ変換する。例えば、FFT(Fast Fouriew Transform:高速フーリエ変換)の処理を行う。
判定部705は、入力したフレームが音声区間であるか非音声区間であるかを判定する(S2007)。この判定は、図8のS807における判定方法と同様である。
入力したフレームが音声区間であると判定した場合には、S2001の処理に戻り、次のフレームの信号を入力する。
入力したフレームが非音声区間であると判定した場合には、騒音特性算出部1905は、騒音特性算出処理を行う(S2011)。
図21に、騒音特性算出処理のフロー例を示す。騒音特性算出部1905は、周波数f毎に以下の処理を繰り返す(S2101)。騒音特性算出部1905は、マイク入力の騒音成分のパワースペクトルNnear(n,f)を算出する(S2103)。具体的には、騒音特性算出部1905は、入力したフレームの信号のフーリエスペクトルからパワースペクトル(リニア値)を求める。騒音特性算出部1905は、すべての周波数fについて処理したか否かを判定する(S2105)。処理していない周波数fがあると判定した場合には、S2101に戻り処理を継続する。すべての周波数fについて処理したと判定した場合には、騒音特性算出部1905は、処理を終える。
実施の形態2では、図8のS811において、音声特性算出処理(A)に代えて音声特性算出処理(B)を行う。
図22に、音声特性算出処理(B)のフロー例を示す。S901〜S905及びS913の処理は、図9に示した音声特性算出処理(A)の場合と同様である。
S905の処理に続いて、音声特性算出部(B)1907は、抽出処理(S2201)を行う。
図23に、抽出処理のフロー例を示す。抽出処理では、以下の2つの式に従って、騒音超成分のパワースペクトルPv(n,f)を算出する。騒音超成分のパワースペクトルPv(n,f)は、現フレームの音声のパワースペクトルのうち、周囲の騒音に埋もれていない成分(リニア値)を示している。
Figure 0006160045
Figure 0006160045
音声特性算出部(B)1907は、受信音のパワースペクトルP(n,f)を算出する(S2301)。この処理は、図9のS907の場合と同様である。
音声特性算出部(B)1907は、騒音特性算出部1905から騒音成分のパワースペクトルNnear(n,f)を取得する(S2303)。音声特性算出部(B)1907は、騒音成分のパワースペクトルよりも受信音のパワースペクトルが大きいか否かを判定する(S2305)。騒音成分のパワースペクトルよりも受信音のパワースペクトルが大きいと判定した場合には、音声特性算出部(B)1907は、(1)の式に従って、騒音超成分のパワースペクトルPv(n,f)を算出する(S2307)。騒音超成分のパワースペクトルPv(n,f)は、受信音のパワースペクトルP(n,f)から騒音成分のパワースペクトルNnear(n,f)を差し引いた差となる。この値が、長期平均化された音声のパワースペクトルの算出に用いられる。一方、騒音成分のパワースペクトルよりも受信音のパワースペクトルが大きくないと判定した場合には、音声特性算出部(B)1907は、(2)の式に従って、騒音超成分のパワースペクトルPv(n,f)に0を設定する(S2309)。
図22の処理に戻って、音声特性算出部(B)1907は、以下の式に従って、長期平均化された音声のパワースペクトルVave(n,f)を算出する(S2203)。
Figure 0006160045
そして、音声特性算出部(B)1907は、長期平均化された音声のパワースペクトルVave(n,f)を内部に保持する(S2205)。
長期平均化された音声のパワースペクトルVave(n,f)を用いる以後の処理は、実施の形態1と同様である。
本実施の形態によれば、音声のパワーが騒音のパワーを越える差分を音声の周波数特性とする。これにより、周囲が騒がしい環境においても、その環境に適した調整を行うことができる。
上述の通信端末装置は、例えば携帯電話端末である。無線による通信装置に限らず、有線による通信装置において上述の調整部を用いるようにしてもよい。例えばVoIP(Voice over Internet Protocol)システムやテレビ会議システムなどの音声伝送システムに適用してもよい。また、通信を行わない音声再生装置において、上述の調整部を用いるようにしてもよい。例えば、記憶部に記憶されている音信号を再生する場合に、読み出した音信号を調整するようにしてもよい。
以上本技術の一実施の形態を説明したが、本技術はこれに限定されるものではない。例えば、上述の機能ブロック構成は実際のプログラムモジュール構成に対応するものではない。
また、上で説明した各記憶領域の構成は一例であって、上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。
以上述べた実施の形態をまとめると、以下のようになる。
本実施の形態に係る調整装置は、(A)音声信号の第1周波数帯域における周波数特性と音声信号の第1周波数帯域よりも高い周波数側の第2周波数帯域における周波数特性との比を求め、求めた比が所定の基準を満たさない場合に、比が所定の基準に近づくように、音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、(B)調整量に応じて、音声信号に含まれる周波数特性の少なくとも一部を修正する修正部とを有する。
このようにすれば、音声信号に含まれる2つの周波数帯域における周波数特性のバランスに起因する音声の聞き取りにくさを、解消することができる。
また、第1周波数帯域は、声の音域における低周波数側の帯域であり、第2周波数帯域は、声の音域における中央付近の周波数の帯域であってもよい。更に、(a1)上記算出部は、第1周波数帯域に含まれるスペクトルの代表値に対する第2周波数帯域に含まれるスペクトルの代表値の比が、所定の基準よりも大きい場合に、比が小さくなるように調整するための調整量を算出するようにしてもよい。
このようにすれば、低周波数側の帯域に含まれるスペクトルの代表値に対する中央付近の周波数の帯域に含まれるスペクトルの代表値が大きい場合に生じる「軽さ」による聞き取りにくさを解消することができる。
また、第1周波数帯域は、声の音域における低周波数側の帯域であり、第2周波数帯域は、声の音域における高周波数側の帯域であってもよい。更に、(a2)上記算出部は、第2周波数帯域に含まれるスペクトルの代表値に対する第1周波数帯域に含まれるスペクトルの代表値の比が、所定の基準よりも大きい場合に、比が小さくなるように調整するための調整量を算出するようにしてもよい。
このようにすれば、高周波数側の帯域に含まれるスペクトルの代表値に対する低周波数側の帯域に含まれるスペクトルの代表値の比が大きい場合、つまり低周波数側の帯域に含まれるスペクトルの代表値に対する高周波数側の帯域に含まれるスペクトルの代表値が小さい場合に生じる「こもり感」による聞き取りにくさを解消することができる。
調整量は、第2周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量であってもよい。
このようにすれば、高い周波数側の帯域に含まれる周波数特性を調整するので、低い周波数側の帯域に含まれる周波数特性に対する調整を要しない。一般的に、低い周波数側の方が音量が大きいので、調整に伴う全体音量の変動を抑えることができる。
本実施の形態に係る調整装置は、(C)音声信号の第1周波数帯域における周波数特性と音声信号の第1周波数帯域よりも高い周波数側の第2周波数帯域における周波数特性との第1の比を求め、音声信号の第1周波数帯域における周波数特性と音声信号の第2周波数帯域よりも高い周波数側の第3周波数帯域における周波数特性との第2の比を求め、第1の比が第1の基準を満たさない場合に、第1の比が第1の基準に近づくように、且つ第2の比が第2の基準を満たさない場合に、第2の比が第2の基準に近づくように、音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、(D)調整量に応じて、音声信号に含まれる周波数特性の少なくとも一部を修正する修正部とを有する。
このようにすれば、第1周波数帯域と第1周波数帯域よりも高い周波数側の第2周波数帯域の間の周波数特性のバランスに起因する聞き取りにくさと、第1周波数帯域と第2周波数帯域よりも高い周波数側の第3周波数帯域の間の周波数特性のバランスに起因する聞き取りにくさとを、同時に解消することができる。
また、第1周波数帯域は、声の音域における低周波数側の帯域であり、第2周波数帯域は、声の音域における中央付近の周波数の帯域であり、第3周波数帯域は、声の音域における高周波数側の帯域であってもよい。更に、第1の比は、第1周波数帯域に含まれるスペクトルの代表値に対する第2周波数帯域に含まれるスペクトルの代表値の比であってもよい。第2の比は、第3周波数帯域に含まれるスペクトルの代表値に対する第1周波数帯域に含まれるスペクトルの代表値の比であってもよい。加えて、(c1)上記算出部は、第1の比が第1の基準よりも大きい場合に、第1の比が小さくなるように第1の調整量を算出し、且つ第2の比が第2の基準よりも大きい場合に、第2の比が小さくなるように第2の調整量を算出するようにしてもよい。
このようにすれば、低周波数側の帯域に含まれるスペクトルの代表値に対する中央付近の周波数の帯域に含まれるスペクトルの代表値が大きい場合に生じる「軽さ」による聞き取りにくさを解消するとともに、高周波数側の帯域に含まれるスペクトルの代表値に対する低周波数側の帯域に含まれるスペクトルの代表値の比が大きい場合、つまり低周波数側の帯域に含まれるスペクトルの代表値に対する高周波数側の帯域に含まれるスペクトルの代表値が小さい場合に生じる「こもり感」による聞き取りにくさを解消することができる。
第1の調整量は、第2周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量であってもよい。第2の調整量は、第3周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量であってもよい。
このようにすれば、高い周波数側の帯域と中央付近の周波数の帯域の周波数特性を調整するので、低い周波数側の帯域の周波数特性に対する調整を要しない。一般的に、低い周波数側の方が音量が大きいので、調整に伴う全体音量の変動を抑えることができる。
上記代表値は、平均値であってもよい。
このようにすれば、各周波数帯域の音の強さを適正に評価できる。
上記算出部は、平滑化された値である周波数特性を用いて比の算出を行ってもよい。
このようにすれば、音声の揺らぎによる影響を排除することができる。
上記算出部は、音声信号の周波数特性が周囲の騒音信号の周波数特性を超える差分を用いて比の算出を行ってもよい。
このようにすれば、周囲の騒音による影響を排除して適正に音声を調整することができる。
更に、音声信号の区間と雑音信号の区間を含む入力信号のSN比を算出し、算出されたSN比に基づいて、調整量を補正する補正部を有してもよい。
このようにすれば、音質劣化の程度に応じて音声を調整することができる。
更に、音声信号に含まれる音声成分の大きさを算出し、算出された音声成分の大きさに基づいて、調整量を補正する補正部を有してもよい。
このようにすれば、声の音量に応じて音声を調整することができる。
なお、上記方法による処理をプロセッサに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納されるようにしてもよい。尚、中間的な処理結果は、一般的にメインメモリ等の記憶装置に一時保管される。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
音声信号の第1周波数帯域における周波数特性と前記音声信号の前記第1周波数帯域よりも高い周波数側の第2周波数帯域における周波数特性との比を求め、求めた前記比が所定の基準を満たさない場合に、前記比が前記所定の基準に近づくように、前記音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、
前記調整量に応じて、前記音声信号に含まれる周波数特性の少なくとも一部を修正する修正部と
を有する調整装置。
(付記2)
前記第1周波数帯域は、声の音域における低周波数側の帯域であり、
前記第2周波数帯域は、声の音域における中央付近の周波数の帯域であり、
前記算出部は、前記第1周波数帯域に含まれるスペクトルの代表値に対する前記第2周波数帯域に含まれるスペクトルの代表値の比が、所定の基準よりも大きい場合に、前記比が小さくなるように調整するための調整量を算出する
付記1記載の調整装置。
(付記3)
前記第1周波数帯域は、声の音域における低周波数側の帯域であり、
前記第2周波数帯域は、声の音域における高周波数側の帯域であり、
前記算出部は、前記第2周波数帯域に含まれるスペクトルの代表値に対する前記第1周波数帯域に含まれるスペクトルの代表値の比が、所定の基準よりも大きい場合に、前記比が小さくなるように調整するための調整量を算出する
付記1記載の調整装置。
(付記4)
前記調整量は、前記第2周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量である
付記1乃至3のいずれか1つ記載の調整装置。
(付記5)
音声信号の第1周波数帯域における周波数特性と前記音声信号の前記第1周波数帯域よりも高い周波数側の第2周波数帯域における周波数特性との第1の比を求め、前記音声信号の前記第1周波数帯域における周波数特性と前記音声信号の前記第2周波数帯域よりも高い周波数側の第3周波数帯域における周波数特性との第2の比を求め、前記第1の比が第1の基準を満たさない場合に、前記第1の比が前記第1の基準に近づくように、且つ前記第2の比が前記第2の基準を満たさない場合に、前記第2の比が前記第2の基準に近づくように、前記音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出する算出部と、
前記調整量に応じて、前記音声信号に含まれる周波数特性の少なくとも一部を修正する修正部と
を有する調整装置。
(付記6)
前記第1周波数帯域は、声の音域における低周波数側の帯域であり、
前記第2周波数帯域は、声の音域における中央付近の周波数の帯域であり、
前記第3周波数帯域は、声の音域における高周波数側の帯域であり、
前記第1の比は、前記第1周波数帯域に含まれるスペクトルの代表値に対する前記第2周波数帯域に含まれるスペクトルの代表値の比であり、
前記第2の比は、前記第3周波数帯域に含まれるスペクトルの代表値に対する前記第1周波数帯域に含まれるスペクトルの代表値の比であり、
前記算出部は、前記第1の比が前記第1の基準よりも大きい場合に、前記第1の比が小さくなるように第1の調整量を算出し、且つ前記第2の比が前記第2の基準よりも大きい場合に、前記第2の比が小さくなるように第2の調整量を算出する
付記5記載の調整装置。
(付記7)
前記第1の調整量は、前記第2周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量であって、
前記第2の調整量は、前記第3周波数帯域に含まれる周波数特性の少なくとも一部に対する調整量である
付記5又は6記載の調整装置。
(付記8)
前記代表値は、平均値である
付記2、3又は6のいずれか1つ記載の調整装置。
(付記9)
前記算出部は、平滑化された値である前記周波数特性を用いて比の算出を行う
付記1乃至8のいずれか1つ記載の調整装置。
(付記10)
前記算出部は、前記音声信号の周波数特性が周囲の騒音信号の周波数特性を超える差分を用いて比の算出を行う
付記1乃至9のいずれか1つ記載の調整装置。
(付記11)
更に、
前記音声信号の区間と雑音信号の区間を含む入力信号のSN比を算出し、算出されたSN比に基づいて、前記調整量を補正する補正部を有する
付記1乃至10のいずれか1つ記載の調整装置。
(付記12)
更に、
前記音声信号に含まれる音声成分の大きさを算出し、算出された音声成分の大きさに基づいて、調整量を補正する補正部を有する
付記1乃至11のいずれか1つ記載の調整装置。
(付記13)
音声信号の第1周波数帯域における周波数特性と前記音声信号の前記第1周波数帯域よりも高い周波数側の第2周波数帯域における周波数特性との比を求め、求めた前記比が所定の基準を満たさない場合に、前記比が前記所定の基準に近づくように、前記音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出し、
前記調整量に応じて、前記音声信号に含まれる周波数特性の少なくとも一部を修正する
調整方法。
(付記14)
音声信号の第1周波数帯域における周波数特性と前記音声信号の前記第1周波数帯域よりも高い周波数側の第2周波数帯域における周波数特性との第1の比を求め、前記音声信号の前記第1周波数帯域における周波数特性と前記音声信号の前記第2周波数帯域よりも高い周波数側の第3周波数帯域における周波数特性との第2の比を求め、前記第1の比が第1の基準を満たさない場合に、前記第1の比が前記第1の基準に近づくように、且つ前記第2の比が前記第2の基準を満たさない場合に、前記第2の比が前記第2の基準に近づくように、前記音声信号に含まれる周波数特性の少なくとも一部を調整するための調整量を算出し、
前記調整量に応じて、前記音声信号に含まれる周波数特性の少なくとも一部を修正する
調整方法。
601 アンテナ 603 RF受信部
605 A/D変換部 607 ベースバンド信号処理部
609 復号部 611 調整部
613 D/A変換部 615 アンプ
617 スピーカ 701 第1入力部
703 第1変換部 705 判定部
707 音声特性算出部(A) 709 雑音特性算出部
711 調整量算出部 713 調整量補正部
715 修正部 717 第2変換部
719 記憶部 1801 マイク
1803 A/D変換部 1901 第2入力部
1903 第3変換部 1905 騒音特性算出部
1907 音声特性算出部(B)

Claims (8)

  1. 音声信号について、声の音域における高周波数側の第1周波数帯域に含まれるスペクトルの代表値に対する、前記音域における低周波数側の第2周波数帯域に含まれるスペクトルの代表値の比を求め、当該比が所定の基準よりも大きい場合に、前記第1周波数帯域に含まれる前記スペクトルを増加させる調整量を算出する算出部と、
    前記調整量に応じて、前記音声信号に含まれる前記第1周波数帯域に含まれる前記スペクトルを修正する修正部と
    を有する調整装置。
  2. 音声信号について、声の音域における低周波数側の第1周波数帯域に含まれるスペクトルの代表値に対する、前記音域における中央付近の第2周波数帯域に含まれるスペクトルの代表値の第1の比を求め、前記音域における高周波数側の第3周波数帯域に含まれるスペクトルの代表値に対する、前記第1周波数帯域に含まれる前記スペクトルの前記代表値の第2の比を求め、当該第1の比が第1の基準よりも大きい場合に、前記第2周波数帯域に含まれる前記スペクトルを減少させる第1の調整量を算出し、当該第2の比が第2の基準よりも大きい場合に、前記第3周波数帯域に含まれる前記スペクトルを増加させる第2の調整量を算出する算出部と、
    前記第1の調整量及び/又は前記第2の調整量に応じて、前記音声信号に含まれる前記第2周波数帯域に含まれる前記スペクトル及び/又は前記第3周波数帯域に含まれる前記スペクトルを修正する修正部と
    を有する調整装置。
  3. 前記算出部は、平滑化された値である前記スペクトルを用いて比の算出を行う
    請求項1又は2記載の調整装置。
  4. 前記算出部は、前記音声信号のスペクトルが周囲の騒音信号のスペクトルを超える差分を用いて比の算出を行う
    請求項1乃至のいずれか1つ記載の調整装置。
  5. 更に、
    前記音声信号の区間と雑音信号の区間を含む入力信号のSN比を算出し、算出されたSN比に基づいて、前記調整量を補正する補正部を有する
    請求項1乃至のいずれか1つ記載の調整装置。
  6. 更に、
    前記音声信号に含まれる音声成分の大きさを算出し、算出された音声成分の大きさに基づいて、前記調整量を補正する補正部を有する
    請求項1乃至のいずれか1つ記載の調整装置。
  7. 音声信号について、声の音域における高周波数側の第1周波数帯域に含まれるスペクトルの代表値に対する、前記音域における低周波数側の第2周波数帯域に含まれるスペクトルの代表値の比を求め、当該比が所定の基準よりも大きい場合に、前記第1周波数帯域に含まれる前記スペクトルを増加させる調整量を算出し、
    前記調整量に応じて、前記音声信号に含まれる前記第1周波数帯域に含まれる前記スペクトルを修正する
    処理を含み、プロセッサにより実行される調整方法。
  8. 音声信号について、声の音域における低周波数側の第1周波数帯域に含まれるスペクトルの代表値に対する、前記音域における中央付近の第2周波数帯域に含まれるスペクトルの代表値の第1の比を求め、前記音域における高周波数側の第3周波数帯域に含まれるスペクトルの代表値に対する、前記第1周波数帯域に含まれる前記スペクトルの前記代表値の第2の比を求め、当該第1の比が第1の基準よりも大きい場合に、前記第2周波数帯域に含まれる前記スペクトルを減少させる第1の調整量を算出し、当該第2の比が第2の基準よりも大きい場合に、前記第3周波数帯域に含まれる前記スペクトルを増加させる第2の調整量を算出し、
    前記第1の調整量及び/又は前記第2の調整量に応じて、前記音声信号に含まれる前記第2周波数帯域に含まれる前記スペクトル及び/又は前記第3周波数帯域に含まれる前記スペクトルを修正する
    処理を含み、プロセッサにより実行される調整方法。
JP2012195173A 2012-09-05 2012-09-05 調整装置および調整方法 Active JP6160045B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012195173A JP6160045B2 (ja) 2012-09-05 2012-09-05 調整装置および調整方法
US13/923,844 US9245536B2 (en) 2012-09-05 2013-06-21 Adjustment apparatus and method
EP13173160.6A EP2709104B1 (en) 2012-09-05 2013-06-21 Adjustment apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012195173A JP6160045B2 (ja) 2012-09-05 2012-09-05 調整装置および調整方法

Publications (2)

Publication Number Publication Date
JP2014052418A JP2014052418A (ja) 2014-03-20
JP6160045B2 true JP6160045B2 (ja) 2017-07-12

Family

ID=48740862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012195173A Active JP6160045B2 (ja) 2012-09-05 2012-09-05 調整装置および調整方法

Country Status (3)

Country Link
US (1) US9245536B2 (ja)
EP (1) EP2709104B1 (ja)
JP (1) JP6160045B2 (ja)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6420798A (en) * 1987-07-16 1989-01-24 Matsushita Electric Ind Co Ltd Sound collector
JP3071063B2 (ja) * 1993-05-07 2000-07-31 三洋電機株式会社 収音装置を備えたビデオカメラ
DE69616139T2 (de) 1995-04-25 2002-03-14 Matsushita Electric Ind Co Ltd System zum Einstellen der Tonqualität
JP4519169B2 (ja) 2005-02-02 2010-08-04 富士通株式会社 信号処理方法および信号処理装置
US8015002B2 (en) 2007-10-24 2011-09-06 Qnx Software Systems Co. Dynamic noise reduction using linear model fitting
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
JP5453740B2 (ja) 2008-07-02 2014-03-26 富士通株式会社 音声強調装置
US8238450B2 (en) * 2009-01-30 2012-08-07 Futurewei Technologies Inc. Dynamic transmitter noise level adjustment for digital subscriber line systems
JP2010092057A (ja) 2009-10-29 2010-04-22 Fujitsu Ltd 受話音声処理装置及び受話音声再生装置
JP5460503B2 (ja) * 2010-07-16 2014-04-02 ラピスセミコンダクタ株式会社 信号処理装置、半導体チップ、信号処理システム、及び信号処理方法

Also Published As

Publication number Publication date
EP2709104B1 (en) 2016-04-20
US9245536B2 (en) 2016-01-26
EP2709104A1 (en) 2014-03-19
JP2014052418A (ja) 2014-03-20
US20140067383A1 (en) 2014-03-06

Similar Documents

Publication Publication Date Title
JP6147744B2 (ja) 適応音声了解度処理システムおよび方法
JP4836720B2 (ja) ノイズサプレス装置
US7555075B2 (en) Adjustable noise suppression system
TW594676B (en) Noise reduction device
JP4423300B2 (ja) 雑音抑圧装置
CN113823319B (zh) 改进的语音可懂度
US8521530B1 (en) System and method for enhancing a monaural audio signal
JP5923994B2 (ja) 音声処理装置及び音声処理方法
US20120263317A1 (en) Systems, methods, apparatus, and computer readable media for equalization
WO2010146711A1 (ja) 音声信号処理装置及び音声信号処理方法
JP4018571B2 (ja) 音声強調装置
JPWO2004040555A1 (ja) 音声強調装置
JP2004507141A (ja) 音声強調システム
JP6073456B2 (ja) 音声強調装置
JP2004061617A (ja) 受話音声処理装置
KR20080090002A (ko) 이동 단말에서 음성의 명료도 향상 장치 및 방법
JP2008309955A (ja) ノイズサプレス装置
JP6160045B2 (ja) 調整装置および調整方法
JP2022547860A (ja) コンテキスト適応の音声了解度を向上させる方法
JP2010092057A (ja) 受話音声処理装置及び受話音声再生装置
JP6098038B2 (ja) 音声補正装置、音声補正方法及び音声補正用コンピュータプログラム
JP2011071806A (ja) 電子機器、及び電子機器の音量制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150512

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160510

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160708

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170310

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20170317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170529

R150 Certificate of patent or registration of utility model

Ref document number: 6160045

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150