JPWO2004109661A1

JPWO2004109661A1 - 音質調整装置および音質調整方法

Info

Publication number: JPWO2004109661A1
Application number: JP2005506842A
Authority: JP
Inventors: 小田　幹夫; 幹夫小田
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2003-06-05
Filing date: 2004-06-04
Publication date: 2006-07-20
Also published as: KR20060016103A; CN1802696A; US20060239472A1; WO2004109661A1; KR100709848B1

Abstract

ＬＰＦは入力された音声信号の中低域成分を抽出する。ＨＰＦは入力された音声信号の高低域成分を抽出する。一方のレベル検出器は、ＬＰＦの出力信号のレベルを検出することにより中低域成分の有無を判定する。他方のレベル検出器は、ＨＰＦの出力信号のレベルを検出することにより高域成分の有無を判定する。反転器は一方のレベル検出器の出力信号のレベルを反転させる。ＡＮＤゲートは反転器の出力信号と他方のレベル検出器の出力信号との論理積を演算する。積分器はＡＮＤゲートの出力信号を積分する。ＶＣＡは、中低域成分がなくかつ高域成分がある場合に音声信号が歯擦音であると判定し、ＨＰＦの出力信号のレベルを減衰させ、中低域成分がある場合に音声信号が通常発声音であると判定し、ＨＰＦの出力信号をそのまま出力する。加算器はＬＰＦの出力信号とＶＣＡの出力信号とを加算により合成する。

Description

本発明は、再生される音声の音質を調整する音質調整装置および音質調整方法に関する。

ＢＳ（衛星）放送の開始とともに、昨今のテレビジョンシステムの音声信号は、デジタル信号の形式で送信されるようになっており、低域から高域まで広い周波数帯域、平坦な周波数特性およびノイズの少ない高品質を有する。一方、このような音声信号を再生するテレビジョンセットに搭載されているスピーカは、テレビジョンセットへ内蔵されることによるスペース上の制約、および価格上の制約から、大きさおよび形状に限界がある。それにより、テレビジョンセットのスピーカは、低域から高域まで平坦な周波数特性を有することが困難である。
そこで、再生時の音質を改善するために種々の方法が提案されている（特表２００２−５１３４７９号公報）。
また、高域の周波数特性の乱れから、アナウンサの発声した言葉の「サ」、「シ」、「ス」、「セ」および「ソ」の発音が著しく強調され、耳障りな音に聞こえるという課題がある。このような音は一般的に歯擦音と言われており、「サ」、「シ」、「ス」、「セ」および「ソ」の発音をするときに、前歯に空気が当り、歯擦音になることが知られている。この歯擦音は発音の仕方等により個人差があり、気にならない程度の音声、非常に聞き取りにくい音声などさまざまである。
放送局では、聞き取りにくい音声における歯擦音を抑えるため、プロオーディオ機器としてエフェクタの一種であるディエッサと呼ばれる音質調整装置を使用している。
図９はディエッサの一例を示すブロック図である。以下、図９を参照しながらディエッサについて説明する。
図９のディエッサは、低域通過フィルタ（ＬｏｗＰａｓｓＦｉｌｔｅｒ：以下ＬＰＦと略記する）２１、バンドパスフィルタ（ＢａｎｄＰａｓｓＦｉｌｔｅｒ：以下ＢＰＦと略記する）２２、高域通過フィルタ（ＨｉｇｈＰａｓｓＦｉｌｔｅｒ：以下ＨＰＦと略記する）２３、コンプレッサ２４および加算器２５を備える。
ＬＰＦ２１は、入力された音声信号の中低域成分を通過させる。ＢＰＦ２２は、入力された音声信号の中高域成分のみを通過させる。ＨＰＦ２２は、入力された音声信号の高域成分のみを通過させる。コンプレッサ２４は、ＢＰＦ２４から出力される音声信号のレベルを圧縮する。加算器２５は、ＬＰＦ２１から出力される音声信号、コンプレッサ２４から出力される音声信号およびＨＰＦ２３から出力される音声信号を加算により合成する。
このように構成されたディエッサの動作を図１０および図１１を用いて説明する。図１０は図９のディエッサにおけるＬＰＦ２１、ＢＰＦ２２およびＨＰＦ２３の周波数特性例を示す図である。図１１は図９のディエッサにおけるコンプレッサ２４の特性例を示す図である。
放送局において、アナウンサ等により発生された音声は、マイクで電気信号である音声信号に変換され、マイクアンプ装置で所定のレベルに増幅され、増幅された音声信号が放送用の音声処理機材に入力される。
アナウンサの発声における歯擦音が著しく強く、音声が聞き取りにくい場合には、マイクアンプ装置の後段に図９のディエッサが挿入されることにより、次のようにして歯擦音が低減される。
通常、歯擦音の周波数帯域は５ｋＨｚから１０ｋＨｚと言われており、図９のディエッサにおけるＢＰＦ２２によりこの周波数帯域の成分が抽出される。これ以外の周波数帯域の成分はＬＰＦ２１およびＨＰＦ２３を通過する。ＢＰＦ２２により抽出された周波数帯域の成分は、コンプレッサ２４により圧縮される。図１１に示すように、コンプレッサ２４は、入力レベルがスレッシュレベルＬｓを超えると、出力レベルを圧縮する。
ＬＰＦ２１から出力される音声信号、コンプレッサ２４から出力される音声信号およびＨＰＦ２３から出力される音声信号が加算器２５により加算される。
このようにして、ディエッサによれば、歯擦音の周波数帯域の信号レベルが減衰され、歯擦音が目立たなくされる。
また、ディエッサによっては、ＢＰＦにおける通過帯域、圧縮レベルおよびスレッシュレベルを変化させることができる。その場合、アナウンサの声質に応じた調整が可能となる。
このディエッサの技術を家庭用のテレビジョンセットに応用することにより、テレビジョンセットにおいて気になる歯擦音が低減されるものと考えられる。
しかしながら、放送局でディエッサを使用して音声を収録する場合には歯擦音の低減の効果はあるが、テレビジョン放送を受信することにより得られる音声に残る耳障りな歯擦音を低減するためにディエッサーを使用すると、ＢＰＦの通過帯域にある歯擦音だけでなく、音声と混合されるＢＧＭ（背景音楽）または効果音までもが低減され、高域成分の抜けた音質となってしまう。

本発明の目的は、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を低減することができる音質調整装置および音質調整方法を提供することである。
本発明の一局面に従う音質調整装置は、入力された音声信号における所定の第１の周波数帯域の成分の有無を判定する判定部と、判定部により第１の周波数帯域の成分がないと判定された場合に入力された音声信号における第１の周波数帯域以上の第２の周波数帯域の成分を減衰させ、第２の周波数帯域が減衰された音声信号を出力し、判定部により第１の周波数帯域の成分があると判定された場合に入力された音声信号における第２の周波数帯域の成分を減衰させずに入力された音声信号を出力する制御部とを備えたものである。
その音質調整装置においては、入力された音声信号における所定の第１の周波数帯域の成分の有無が判定部により判定される。すなわち、中低域成分である第１の周波数帯域の成分が存在するか否かに基づいて音声信号が歯擦音であるか否かが判定される。
第１の周波数帯域の成分がないと判定された場合には、入力された音声信号における第１の周波数帯域以上の第２の周波数帯域の成分が制御部により減衰され、第２の周波数帯域が減衰された音声信号が出力される。すなわち、中低域成分である第１の周波数帯域の成分が存在しない場合には、音声信号が歯擦音であるとみなされ、第２の周波数帯域の成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
一方、第１の周波数帯域の成分があると判定された場合には、入力された音声信号における第２の周波数帯域の成分が制御部により減衰されずに入力された音声信号が出力される。すなわち、中低域成分である第１の周波数帯域の成分が存在する場合には、音声信号が通常発声音であるとみなされ、第２の周波数帯域の成分が減衰されない。それより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
判定部は、入力された音声信号における第１の周波数帯域の成分のレベルが所定値以上の場合に第１の周波数帯域の成分があると判定し、入力された音声信号における第１の周波数帯域の成分のレベルが所定値よりも低い場合に第１の周波数帯域の成分がないと判定してもよい。
この場合、入力された音声信号における第１の周波数帯域の成分のレベルが所定値以上の場合に第１の周波数帯域の成分があると判定され、入力された音声信号における第１の周波数帯域の成分のレベルが所定値よりも低い場合に第１の周波数帯域の成分がないと判定される。それにより、音声信号が歯擦音であるか通常発声音であるかを確実に判定することができる。
判定部は、入力された音声信号における第１の周波数帯域の成分を抽出する第１の抽出器と、第１の周波数帯域の成分の有無を判定するために第１の抽出器の出力信号のレベルが所定値以上であるか否かを検出する検出器とを含み、制御部は、入力された音声信号の第２の周波数帯域の成分を抽出する第２の抽出器と、第１の抽出器の出力信号のレベルが所定値以上でないことが検出器により検出された場合に第２の抽出器の出力信号のレベルを減衰させ、第１の抽出器の出力信号のレベルが所定値以上であることが検出器により検出された場合に第２の抽出器の出力信号を減衰させずに出力する減衰器と、第１の抽出器の出力信号と減衰器の出力信号とを合成する合成器とを含んでもよい。
この場合、入力された音声信号における第１の周波数帯域の成分が第１の抽出器により抽出される。また、第１の周波数帯域の成分の有無を判定するために第１の抽出器の出力信号のレベルが所定値以上であるか否かが検出器により検出される。さらに、入力された音声信号の第２の周波数帯域の成分が第２の抽出器により抽出される。
第１の抽出器の出力信号のレベルが所定値以上でないことが検出器により検出された場合には、減衰器により第２の抽出器の出力信号のレベルが減衰される。第１の抽出器の出力信号のレベルが所定値以上であることが検出器により検出された場合には、第２の抽出器の出力信号が減衰器により減衰されずに出力される。第１の抽出器の出力信号と減衰器の出力信号とは合成器により合成される。それにより、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を確実に低減することができる。
判定部は、検出器の出力信号を積分する積分器をさらに含んでもよい。この場合、検出器の出力信号に生じるチャタリングの影響が除去される。
第１の抽出器は低域通過フィルタを含み、第２の抽出器は高域通過フィルタを含んでもよい。
この場合、入力された音声信号における中低域成分が低域通過フィルタを通過することにより、第１の周波数帯域の成分が抽出される。また、入力された音声信号における高域成分が高域通過フィルタを通過することにより、第２の周波数帯域の成分が抽出される。
判定部は、第１の周波数帯域の成分の有無とともに入力された音声信号における第２の周波数帯域の成分の有無を判定し、制御部は、判定部により第１の周波数帯域の成分がなくかつ第２の周波数帯域の成分があると判定された場合に入力された音声信号における第２の周波数帯域の成分を減衰させてもよい。
この場合、判定部により第１の周波数帯域の成分の有無とともに入力された音声信号における第２の周波数帯域の成分の有無が判定される。第１の周波数帯域の成分がなくかつ第２の周波数帯域の成分があると判定された場合に、入力された音声信号における第２の周波数帯域の成分が制御部により減衰される。それにより、歯擦音を正確かつ確実に減衰させることができる。
判定部は、入力された音声信号における第１の周波数帯域の成分のレベルが所定値以上の場合に第１の周波数帯域の成分があると判定し、入力された音声信号における第１の周波数帯域の成分のレベルが所定値よりも低い場合に第１の周波数帯域の成分がないと判定し、入力された音声信号における第２の周波数帯域の成分のレベルが所定値以上の場合に第２の周波数帯域の成分があると判定し、入力された音声信号における第２の周波数帯域の成分のレベルが所定値よりも低い場合に第２の周波数帯域の成分がないと判定してもよい。
この場合、入力された音声信号における第１の周波数帯域の成分のレベルが所定値以上の場合に第１の周波数帯域の成分があると判定され、入力された音声信号における第１の周波数帯域の成分のレベルが所定値よりも低い場合に第１の周波数帯域の成分がないと判定される。また、入力された音声信号における第２の周波数帯域の成分のレベルが所定値以上の場合に第２の周波数帯域の成分があると判定され、入力された音声信号における第２の周波数帯域の成分のレベルが所定値よりも低い場合に第２の周波数帯域の成分がないと判定される。それにより、音声信号が歯擦音であるか通常発声音であるかを確実に判定することができる。
判定部は、入力された音声信号における第１の周波数帯域の成分を抽出する第１の抽出器と、入力された音声信号における第２の周波数帯域の成分を抽出する第２の抽出器と、第１の周波数帯域の成分の有無を判定するために第１の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第１の検出器と、第２の周波数帯域の成分の有無を判定するために第２の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第２の検出器とを含み、制御部は、第１の抽出器の出力信号のレベルが所定値以上でないことが第１の検出器により検出されかつ第２の抽出器の出力信号のレベルが所定値以上であることが第２の検出器により検出された場合に第２の抽出器の出力信号のレベルを減衰させ、第１の抽出器の出力信号のレベルが所定値以上であることが第１の検出器により検出されまたは第２の抽出器の出力信号のレベルが所定値以上でないことが第２の検出器により検出された場合に第２の抽出器の出力信号を減衰させずに出力する減衰器と、第１の抽出器の出力信号と減衰器の出力信号とを合成する合成器とを含んでもよい。
この場合、入力された音声信号における第１の周波数帯域の成分が第１の抽出器により抽出される。また、入力された音声信号の第２の周波数帯域の成分が第２の抽出器により抽出される。さらに、第１の周波数帯域の成分の有無を判定するために第１の抽出器の出力信号のレベルが所定値以上であるか否かが第１の検出器により検出される。また、第２の周波数帯域の成分の有無を判定するために第２の抽出器の出力信号のレベルが所定値以上であるか否かが第２の検出器により検出される。
第１の抽出器の出力信号のレベルが所定値以上でないことが第１の検出器により検出されかつ第２の抽出器の出力信号のレベルが所定値以上であることが第２の検出器により検出された場合には、第２の抽出器の出力信号のレベルが減衰器により減衰される。第１の抽出器の出力信号のレベルが所定値以上であることが第１の検出器により検出されまたは第２の抽出器の出力信号のレベルが所定値以上でないことが第２の検出器により検出された場合には、第２の抽出器の出力信号が減衰器により減衰されずに出力される。第１の抽出器の出力信号と減衰器の出力信号とは合成器により合成される。それにより、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を確実に低減することができる。
判定部は、第１の検出器の出力信号を反転する反転器と、反転器の出力信号および第２の検出器の出力信号の論理積を算出する論理演算器とをさらに含んでもよく、減衰器は、論理演算器の出力信号に基づいて第２の抽出器の出力信号のレベルを減衰させるかまたは減衰させない。
この場合、第１の検出器の出力信号が反転器により反転され、反転器の出力信号および第２の検出器の出力信号の論理積が論理演算器により算出される。さらに、論理演算器の出力信号に基づいて第２の抽出器の出力信号のレベルが減衰器により減衰されるかまたは減衰されない。それにより、音声信号が歯擦音であると判定された場合に高域成分を確実に減衰させることができるとともに、音声信号が通常発声音であると判定された場合に高域成分の減衰を確実に停止することができる。
判定部は、論理演算器の出力信号を積分する積分器をさらに含んでもよい。この場合、論理演算器の出力信号に生じるチャタリングの影響が除去される。
第１の抽出器は低域通過フィルタを含み、第２の抽出器は高域通過フィルタを含んでもよい。
この場合、入力された音声信号における中低域成分が低域通過フィルタを通過することにより、第１の周波数帯域の成分が抽出される。また、入力された音声信号における高域成分が高域通過フィルタを通過することにより、第２の周波数帯域の成分が抽出される。
第１の周波数帯域は、５ｋＨｚ以下の周波数帯域であり、第１の周波数帯域は、５ｋＨｚ以上の周波数帯域であってもよい。
歯擦音は、５ｋＨｚから１０ｋＨｚの周波数帯域にスペクトル成分をを有する。したがって、高域成分の音質劣化を防止しつつ歯擦音を確実に減衰させることができる。その結果、バランスのとれた聞きやすい音声を再生することができる。
本発明の他の局面に従う音質調整方法は、入力された音声信号における所定の第１の周波数帯域の成分の有無を判定するステップと、第１の周波数帯域の成分がないと判定された場合に入力された音声信号における第１の周波数帯域以上の第２の周波数帯域の成分を減衰させ、第２の周波数帯域が減衰された音声信号を出力し、第１の周波数帯域の成分があると判定された場合に入力された音声信号における第２の周波数帯域の成分を減衰させずに入力された音声信号を出力するステップとを備えたものである。
その音声調整方法においては、入力された音声信号における所定の第１の周波数帯域の成分の有無が判定される。すなわち、中低域成分である第１の周波数帯域の成分が存在するか否かに基づいて音声信号が歯擦音であるか否かが判定される。
第１の周波数帯域の成分がないと判定された場合には、入力された音声信号における第１の周波数帯域以上の第２の周波数帯域の成分が減衰され、第２の周波数帯域が減衰された音声信号が出力される。すなわち、中低域成分である第１の周波数帯域の成分が存在しない場合には、音声信号が歯擦音であるとみなされ、第２の周波数帯域の成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
一方、第１の周波数帯域の成分があると判定された場合には、入力された音声信号における第２の周波数帯域の成分が減衰されずに入力された音声信号が出力される。すなわち、中低域成分である第１の周波数帯域の成分が存在する場合には、音声信号が通常発声音であるとみなされ、第２の周波数帯域の成分が減衰されない。それより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
判定するステップは、第１の周波数帯域の成分の有無とともに入力された音声信号における第２の周波数帯域の成分の有無を判定するステップを含み、出力するステップは、第１の周波数帯域の成分がなくかつ第２の周波数帯域の成分があると判定された場合に入力された音声信号における第２の周波数帯域の成分を減衰させるステップを含んでもよい。
この場合、第１の周波数帯域の成分の有無とともに入力された音声信号における第２の周波数帯域の成分の有無が判定される。第１の周波数帯域の成分がなくかつ第２の周波数帯域の成分があると判定された場合に、入力された音声信号における第２の周波数帯域の成分が減衰される。それにより、歯擦音を正確かつ確実に減衰させることができる。
第１の周波数帯域は、５ｋＨｚ以下の周波数帯域であり、第１の周波数帯域は、５ｋＨｚ以上の周波数帯域であってもよい。
歯擦音は、５ｋＨｚから１０ｋＨｚの周波数帯域にスペクトル成分を有する。したがって、高域成分の音質劣化を防止しつつ歯擦音を確実に減衰させることができる。その結果、バランスのとれた聞きやすい音声を再生することができる。

図１は、本発明の第１の実施の形態に係る音質調整装置の構成を示すブロックである。
図２は、図１の音質調整装置における各部の信号波形図である。
図３は、歯擦音の波形の一例を示す図および歯擦音の周波数スペクトルの一例を示す図である。
図４は、通常発声音の波形の一例を示す図であり、通常発声音の周波数スペクトルの一例を示す図である。
図５は、本発明の第２の実施の形態に係る音質調整装置の構成を示すブロック図である。
図６は、図５の音質調整装置における各部の信号波形図である。
図７は、発声単語のスペクトルの測定結果を示す図である。
図８は、音質調整された音声のスペクトルの測定結果を示す図である。
図９は、ディエッサの一例を示すブロック図である。
図１０は、図９のディエッサにおけるＬＰＦ、ＢＰＦおよびＨＰＦの周波数特性例を示す図である。
図１１は、図９のディエッサにおけるコンプレッサ２４の特性例を示す図である。

以下、本発明の実施の形態について図面を参照しながら説明する。
（第１の実施の形態）
図１は本発明の第１の実施の形態に係る音質調整装置の構成を示すブロックである。
図１の音質調整装置は、低域通過フィルタ（ＬｏｗＰａｓｓＦｉｌｔｅｒ：以下、ＬＰＦと略記する）、高域通過フィルタ（ＨｉｇｈＰａｓｓＦｉｌｔｅｒ：以下ＨＰＦと略記する）２、レベル検出器３，４、反転器５、ＡＮＤゲート６、積分器７、ボリュームコントロールアンプ（ＶｏｌｕｍｅＣｏｎｔｒｏｌＡｍｐｌｉｆｉｅｒ：以下ＶＣＡと略記する）８および加算器９を備える。
ＬＰＦ１は、入力された音声信号の５ｋＨｚ以下の中低域成分を通過させることにより中低域成分を抽出する。ＨＰＦ２は、入力された音声信号の５ｋＨｚ以上の高域成分を通過させることにより高低域成分を抽出する。
レベル検出器３は、ＬＰＦ１の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにＨレベル（ハイレベル）の信号を出力し、検出されたレベルが所定値よりも低いときにＬレベル（ローレベル）の信号を出力する。
レベル検出器４は、ＨＰＦ２の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにＨレベルの信号を出力し、検出されたレベルが所定値よりも低いときにＬレベルの信号を出力する。
反転器５は、レベル検出器３の出力信号のレベルを反転させる。すなわち、反転器５は、レベル検出器３の出力信号がＨレベルのときにＬレベルの信号を出力し、レベル検出器３の出力信号がＬレベルのときにＨレベルの信号を出力する。
ＡＮＤゲート６は、反転器５の出力信号とレベル検出器４の出力信号との論理積を演算する。積分器７は、ＡＮＤゲート６の出力信号を積分する。
ＶＣＡ８は、積分器７の出力信号がＨレベルのときにＨＰＦ２の出力信号のレベルを減衰させ、積分器７の出力信号がＬレベルのときにＨＰＦ２の出力信号をそのまま出力する。加算器９は、ＬＰＦ１の出力信号とＶＣＡ８の出力信号とを加算により合成する。
このように構成された音質調整装置の動作を図２、図３および図４を用いて説明する。図２は図１の音質調整装置における各部の信号波形図である。
図２には、図１のＬＰＦ１およびＨＰＦ２に入力される音声信号ａ、ＨＰＦ２の出力信号ｂ、レベル検出器４の出力信号ｃ、反転器５の出力信号ｄ、積分器７の出力信号ｅ、ＶＣＡ８の出力信号ｆおよび加算器９の出力信号ｇが示される。
図３（ａ）は歯擦音の波形の一例を示す図であり、図３（ｂ）は歯擦音の周波数スペクトルの一例を示す図である。図４（ａ）は通常発声音の波形の一例を示す図であり、図４（ｂ）は通常発声音の周波数スペクトルの一例を示す図である。
図３（ａ）および図４（ａ）の横軸は時間を表し、縦軸は振幅を表す。図３（ｂ）および図４（ｂ）の横軸は周波数を表し、縦軸はレベルを表す。
通常、歯擦音は５ｋＨｚから１０ｋＨｚの周波数帯域にスペクトル成分を有する。図３の歯擦音は、ランダム雑音の高域成分のみを有する波形および周波数スペクトルを示す。一方、通常発声音は、中低域成分（ホルマント成分）を有する。ここで、ホルマント成分とは、人間の声が持つ基本波およびその高調波である。図４の通常発声音は、中域基本波に高調波が重畳された波形および周波数スペクトルを示す。
本実施の形態に係る音質調整装置では、このような歯擦音および通常発声音の特徴を利用して、入力された音声信号ａが歯擦音のみを含む場合には高域成分を減衰させて音声再生を行う。
テレビジョン受信機（テレビジョンセット）の音声再生において、テレビジョン放送の音声信号を検波することにより得られる音声ベースバンド信号が音声信号ａとして図１のＬＰＦ１およびＨＰＦ２に入力される。
図２に示される音声信号ａは、「しゃしん」の発声時系列信号である。区間ｔ１，ｔ３で歯擦音「し」が発声されている。この区間ｔ１，ｔ３では、中低域成分が存在せずかつ高域成分が存在する。区間ｔ２，ｔ４では、歯擦音ではない「ゃ」および「ん」が発声されている。区間ｔ２，ｔ４では、中低域成分および高域成分が存在する。音声信号ａの中低域成分はＬＰＦ１を通過し、音声信号ａの高域成分はＨＰＦ２を通過する。
図２の例では、ＨＰＦ２の出力信号ｂにおいて、区間ｔ１，ｔ３で歯擦音による高域成分が存在し、区間ｔ２，ｔ４の中低域成分が除去される。
音声信号ａの高域成分の有無を判定するために、レベル検出器４によりＨＰＦ２の出力信号ｂのレベルが検出される。ＨＰＦ２の出力信号のレベルが所定値以上のときにレベル検出器４の出力信号ｃがＨレベルとなり、ＨＰＦ２の出力信号のレベルが所定値より低いときにはレベル検出器４の出力信号ｃがＬレベルとなる。
図２の例では、レベル検出器４の出力信号ｃは、歯擦音による高域成分が存在する区間ｔ１，ｔ３でＨレベルとなり、高域成分が存在しない区間ｔ２，ｔ４でＬレベルとなる。本実施の形態では、歯擦音以外の高域成分も検出される。
音声信号ａの中低域成分の有無を判定するために、レベル検出器３によりＬＰＦ１の出力信号のレベルが検出される。ＬＰＦ１の出力信号のレベルが所定値以上のときにレベル検出器３の出力信号がＨレベルとなり、ＬＰＦ１の出力信号のレベルが所定値より低いときにはレベル検出器３の出力信号がＬレベルとなる。レベル検出器３の出力信号は反転器５により反転される。
図２の例では、反転器５の出力信号ｄは、中低域成分が存在しない区間ｔ１，ｔ３でＨレベルとなり、中低域成分が存在する区間ｔ２，ｔ４でＬレベルとなる。
反転器５の出力信号ｄはＡＮＤゲート６の一方の入力端子に与えられ、レベル検出器４の出力信号ｃはＡＮＤゲート６の他方の入力端子に与えられる。ＡＮＤゲート６により反転器５の出力信号ｄとレベル検出器４の出力信号ｃとの論理積演算が行われる。
この場合、中低域成分が存在せずかつ高域成分が存在するときにのみＡＮＤゲート６の出力信号がＨレベルとなる。ＡＮＤゲート６の出力信号は多少のチャタリングを有する。そのため、ＡＮＤゲート６の出力信号が積分器７により積分される。
図２の例では、積分器７の出力信号ｅは、中低域成分が存在せずかつ高域成分が存在する区間ｔ１，ｔ３でＨレベルとなり、中低域成分が存在する区間ｔ２，ｔ４でＬレベルとなる。
積分器７の出力信号ｅによりＶＣＡ８の利得が制御される。それにより、ＨＰＦ２を通過した高域成分のレベルがＶＣＡ８により制御される。積分器７の出力信号ｅがＨレベルのときにＶＣＡ８によりＨＰＦ２の出力信号ｂのレベルが減衰され、積分器７の出力信号ｅがＬレベルのときにはＶＣＡ８によりＨＰＦ２の出力信号ｂがそのまま出力される。
図２の例では、ＶＣＡ８の出力信号ｆにおいて、区間ｔ１，ｔ３の歯擦音による高域成分のレベルが減衰されている。
ＬＰＦ１を通過した中低域成分とＶＣＡ８により減衰された高域成分とが加算器９により加算されることにより合成され、出力信号ｇが得られる。
図２の例では、加算器９の出力信号ｇにおいて、区間ｔ１，ｔ３の歯擦音が減衰され、区間ｔ２，ｔ４の通常発声音は減衰されない。
上記のように、本実施の形態に係る音質調整装置においては、高域成分が存在しかつ中低域成分が存在しない区間ｔ１，ｔ３の音声信号は歯擦音と判定され、ＶＣＡ８により高域成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
また、中低域成分が存在する区間ｔ２，ｔ４の音声信号は通常発声音と判定され、ＶＣＡ８による高域成分の減衰が行われない。それにより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
さらに、レベル検出器３，４を用いて中低域成分および高域成分の有無を検出しているので、歯擦音を有する区間を正確に判定することができる。
なお、ＶＣＡ８による高域成分の減衰の程度は、高域成分が低下しすぎないように調整することが必要である。例えば、高域成分を３デシベル〜１０デシベル程度減衰させるのが音質的に好ましい調整である。
本実施の形態において、ＬＰＦ１、ＨＰＦ２、レベル検出器３およびレベル検出器４が判定部を構成し、ＶＣＡ８および加算器９が制御部を構成する。また、ＬＰＦ１が第１の抽出器または低域通過フィルタに相当し、ＨＰＦ２が第２の抽出器または高域通過フィルタに相当し、レベル検出器３が第１の検出器３に相当し、レベル検出器４が第２の検出器に相当し、ＡＮＤゲート６が論理演算器に相当し、ＶＣＡ８が減衰器に相当し、加算器９が合成器に相当する。
なお、図１の各部は、電子回路等のハードウエアにより構成されてもよく、ＣＰＵ（中央演算処理装置）、半導体メモリ等を含むコンピュータとプログラム等のソフトウエアとにより構成されてもよい。
（第２の実施の形態）
図５は本発明の第２の実施の形態に係る音質調整装置の構成を示すブロック図である。
図５の音質調整装置は、ＬＰＦ１、ＨＰＦ２、レベル検出器３、反転器５、積分器７、ＶＣＡ８および加算器９を備える。
ＬＰＦ１は、入力された音声信号の５ｋＨｚ以下の中低域成分を通過させることにより中低域成分を抽出する。ＨＰＦ２は、入力された音声信号の５ｋＨｚ以上の高域成分を通過させることにより高域成分を抽出する。レベル検出器３は、ＬＰＦ１の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにＨレベルの信号を出力し、検出されたレベルが所定値よりも低いときにＬレベルの信号を出力する。
反転器５は、レベル検出器３の出力信号のレベルを反転させる。すなわち、反転器５は、レベル検出器３の出力信号がＨレベルのときにＬレベルの信号を出力し、レベル検出器３の出力信号がＬレベルのときにＨレベルの信号を出力する。積分器７は、反転器５の出力信号を積分する。
ＶＣＡ８は、積分器７の出力信号がＨレベルのときにＨＰＦ２の出力信号のレベルを減衰させ、積分器７の出力信号がＬレベルのときにＨＰＦ２の出力信号をそのまま出力する。加算器９は、ＬＰＦ１の出力信号とＶＣＡ８の出力信号とを加算により合成する。
このように構成された音質調整装置の動作を図６を用いて説明する。図６は図５の音質調整装置における各部の信号波形図である。
図６には、図５のＬＰＦ１およびＨＰＦ２に入力される音声信号Ａ、ＨＰＦ２の出力信号Ｂ、反転器５の出力信号Ｃ、積分器７の出力信号Ｄ、ＶＣＡ８の出力信号Ｅおよび加算器９の出力信号Ｆが示される。
上記のように、通常、歯擦音は５ｋＨｚから１０ｋＨｚの周波数帯域にスペクトル成分を有する。図３に示したように、歯擦音は、ランダム雑音の高域成分のみを有する波形および周波数スペクトルを示す。一方、図４に示したように、通常発声音は、中低域成分（ホルマント成分）を有する。
本実施の形態に係る音質調整装置においても、このような歯擦音および通常発声音の特徴を利用して、入力された音声信号Ａが歯擦音のみを含む場合には高域成分を減衰させて音声再生を行う。
テレビジョン受信機（テレビジョンセット）の音声再生において、テレビジョン放送の音声信号を検波することにより得られる音声ベースバンド信号が音声信号Ａとして図５のＬＰＦ１およびＨＰＦ２に入力される。
図６に示される音声信号Ａは、「しゃしん」の発声時系列信号である。区間ｔ１，ｔ３で歯擦音「し」が発声されている。この区間ｔ１，ｔ３では、中低域成分が存在せずかつ高域成分が存在する。区間ｔ２，ｔ４では、歯擦音ではない「ゃ」および「ん」が発声されている。区間ｔ２，ｔ４では、中低域成分および高域成分が存在する。音声信号Ａの中低域成分はＬＰＦ１を通過し、音声信号Ａの高域成分はＨＰＦ２を通過する。
図６の例では、ＨＰＦ２の出力信号Ｂにおいて、区間ｔ１，ｔ３で歯擦音による高域成分が存在し、区間ｔ２，ｔ４の中低域成分が除去される。
音声信号Ａの中低域成分の有無を判定するために、レベル検出器３によりＬＰＦ１の出力信号のレベルが検出される。ＬＰＦ１の出力信号のレベルが所定値以上のときにレベル検出器３の出力信号がＨレベルとなり、ＬＰＦ１の出力信号のレベルが所定値より低いときにレベル検出器３の出力信号がＬレベルとなる。レベル検出器３の出力信号は反転器５により反転される。
図６の例では、反転器５の出力信号Ｃは、中低域成分が存在しない区間ｔ１，ｔ３でＨレベルとなり、中低域成分が存在する区間ｔ２，ｔ４でＬレベルとなる。
反転器５の出力信号Ｃは多少のチャタリングを有する。そのため、反転器５の出力信号Ｃが積分器７により積分される。
図６の例では、積分器７の出力信号Ｄは、中低域成分が存在しない区間ｔ１，ｔ３でＨレベルとなり、中低域成分が存在する区間ｔ２，ｔ４でＬレベルとなる。
積分器７の出力信号ＤによりＶＣＡ８の利得が制御される。それにより、ＨＰＦ２を通過した高域成分のレベルがＶＣＡ８により制御される。積分器７の出力信号ＤがＨレベルのときにＶＣＡ８によりＨＰＦ２の出力信号Ｂのレベルが減衰され、積分器７の出力信号ＤがＬレベルのときにＶＣＡ８によりＨＰＦ２の出力信号Ｄがそのまま出力される。
図６の例では、ＶＣＡ８の出力信号Ｅにおいて、区間ｔ１，ｔ３の歯擦音による高域成分のレベルが減衰されている。
ＬＰＦ１を通過した中低域成分とＶＣＡ８により減衰された高域成分とが加算器９により加算されることにより合成され、出力信号Ｆが得られる。
図６の例では、加算器９の出力信号Ｆにおいて、区間ｔ１，ｔ３の歯擦音が減衰され，区間ｔ２，ｔ４の通常発声音は減衰されない。
上記のように、本実施の形態に係る音質調整装置においては、中低域成分が存在しない区間ｔ１，ｔ３の音声信号は歯擦音と判定され、ＶＣＡ８により高域成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
また、中低域成分が存在する区間ｔ２，ｔ４の音声信号は通常発声音と判定され、ＶＣＡ８による高域成分の減衰が行われない。それにより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスがとれた聞きやすい音声が再生される。
さらに、レベル検出器３を用いて中低域成分の有無を検出することにより歯察音の有無を判定しているので、回路構成が簡略化される。
なお、ＶＣＡ８による高域成分の減衰の程度は、高域成分が低下しすぎないように調整することが必要である。例えば、高域成分を３デシベル〜１０デシベル程度減衰させるのが音質的に好ましい調整である。
本実施の形態において、ＬＰＦ１およびレベル検出器３が判定部を構成し、ＨＰ２、ＶＣＡ８および加算器９が制御部を構成する。また、ＬＰＦ１が第１の抽出器または低域通過フィルタに相当し、ＨＰＦ２が第２の抽出器または高域通過フィルタに相当し、レベル検出器３が検出器に相当し、ＶＣＡ８が減衰器に相当し、加算器９が合成器に相当する。
なお、図６の各部は、電子回路等のハードウエアにより構成されてもよく、ＣＰＵ、半導体メモリ等を含むコンピュータとプログラム等のソフトウエアとにより構成されてもよい。

本実施例では、図１の音質調整装置を用いて発声単語の音質を調整した。図７は発声単語のスペクトルの測定結果を示す図である。図８は音質調整された音声のスペクトルの測定結果を示す図である。ここでは、図１の音質調整装置により５ｋＨｚ以上の高域成分を１０ｄＢ減衰させた。発声単語は「写真（しゃしん）」である。
図７および図８の横軸は周波数であり、縦軸は振幅である。図８のスペクトルを図７のスペクトルと比較すると、図８のスペクトルでは、図７のスペクトルにおける５ｋＨｚ以上の高域成分が減衰されていことがわかる。それにより、耳障りな歯擦音が減衰され、聞きやすい音声が再生される。
（他の変形例）
上記第１の実施の形態では、正論理のＡＮＤゲート６を用いた場合を説明したが、負論理のＮＡＮＤゲートを用いて音質調整装置を容易に実現することもできる。
また、上記実施の形態では、減衰器として利得を連続的に変化させることが可能なＶＣＡを用いているが、減衰器として利得を少なくとも２段階で切り替えることが可能な減衰器を用いてもよい。

ＢＳ（衛星）放送の開始とともに、昨今のテレビジョンシステムの音声信号は、デジタル信号の形式で送信されるようになっており、低域から高域まで広い周波数帯域、平坦な周波数特性およびノイズの少ない高品質を有する。一方、このような音声信号を再生するテレビジョンセットに搭載されているスピーカは、テレビジョンセットへ内蔵されることによるスペース上の制約、および価格上の制約から、大きさおよび形状に限界がある。それにより、テレビジョンセットのスピーカは、低域から高域まで平坦な周波数特性を有することが困難である。

そこで、再生時の音質を改善するために種々の方法が提案されている（特表２００２−５１３４７９号公報）。

また、高域の周波数特性の乱れから、アナウンサの発声した言葉の「サ」、「シ」、「ス」、「セ」および「ソ」の発音が著しく強調され、耳障りな音に聞こえるという課題がある。このような音は一般的に歯擦音と言われており、「サ」、「シ」、「ス」、「セ」および「ソ」の発音をするときに、前歯に空気が当り、歯擦音になることが知られている。この歯擦音は発音の仕方等により個人差があり、気にならない程度の音声、非常に聞き取りにくい音声などさまざまである。

放送局では、聞き取りにくい音声における歯擦音を抑えるため、プロオーディオ機器としてエフェクタの一種であるディエッサと呼ばれる音質調整装置を使用している。

図９はディエッサの一例を示すブロック図である。以下、図９を参照しながらディエッサについて説明する。

図９のディエッサは、低域通過フィルタ（Low Pass Filter：以下ＬＰＦと略記する）２１、バンドパスフィルタ（Band Pass Filter：以下ＢＰＦと略記する）２２、高域通過フィルタ（High Pass Filter：以下ＨＰＦと略記する）２３、コンプレッサ２４および加算器２５を備える。

ＬＰＦ２１は、入力された音声信号の中低域成分を通過させる。ＢＰＦ２２は、入力された音声信号の中高域成分のみを通過させる。ＨＰＦ２２は、入力された音声信号の高域成分のみを通過させる。コンプレッサ２４は、ＢＰＦ２２から出力される音声信号のレベルを圧縮する。加算器２５は、ＬＰＦ２１から出力される音声信号、コンプレッサ２４から出力される音声信号およびＨＰＦ２３から出力される音声信号を加算により合成する。

このように構成されたディエッサの動作を図１０および図１１を用いて説明する。図１０は図９のディエッサにおけるＬＰＦ２１、ＢＰＦ２２およびＨＰＦ２３の周波数特性例を示す図である。図１１は図９のディエッサにおけるコンプレッサ２４の特性例を示す図である。

放送局において、アナウンサ等により発生された音声は、マイクで電気信号である音声信号に変換され、マイクアンプ装置で所定のレベルに増幅され、増幅された音声信号が放送用の音声処理機材に入力される。

アナウンサの発声における歯擦音が著しく強く、音声が聞き取りにくい場合には、マイクアンプ装置の後段に図９のディエッサが挿入されることにより、次のようにして歯擦音が低減される。

通常、歯擦音の周波数帯域は５ｋＨｚから１０ｋＨｚと言われており、図９のディエッサにおけるＢＰＦ２２によりこの周波数帯域の成分が抽出される。これ以外の周波数帯域の成分はＬＰＦ２１およびＨＰＦ２３を通過する。ＢＰＦ２２により抽出された周波数帯域の成分は、コンプレッサ２４により圧縮される。図１１に示すように、コンプレッサ２４は、入力レベルがスレッシュレベルＬｓを超えると、出力レベルを圧縮する。

ＬＰＦ２１から出力される音声信号、コンプレッサ２４から出力される音声信号およびＨＰＦ２３から出力される音声信号が加算器２５により加算される。

このようにして、ディエッサによれば、歯擦音の周波数帯域の信号レベルが減衰され、歯擦音が目立たなくされる。

また、ディエッサによっては、ＢＰＦにおける通過帯域、圧縮レベルおよびスレッシュレベルを変化させることができる。その場合、アナウンサの声質に応じた調整が可能となる。

このディエッサの技術を家庭用のテレビジョンセットに応用することにより、テレビジョンセットにおいて気になる歯擦音が低減されるものと考えられる。

しかしながら、放送局でディエッサを使用して音声を収録する場合には歯擦音の低減の効果はあるが、テレビジョン放送を受信することにより得られる音声に残る耳障りな歯擦音を低減するためにディエッサーを使用すると、ＢＰＦの通過帯域にある歯擦音だけでなく、音声と混合されるＢＧＭ（背景音楽）または効果音までもが低減され、高域成分の抜けた音質となってしまう。

本発明の目的は、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を低減することができる音質調整装置および音質調整方法を提供することである。

本発明の一局面に従う音質調整装置は、入力された音声信号における所定の第１の周波数帯域の成分の有無を判定する判定部と、判定部により第１の周波数帯域の成分がないと判定された場合に入力された音声信号における第１の周波数帯域以上の第２の周波数帯域の成分を減衰させ、第２の周波数帯域が減衰された音声信号を出力し、判定部により第１の周波数帯域の成分があると判定された場合に入力された音声信号における第２の周波数帯域の成分を減衰させずに入力された音声信号を出力する制御部とを備えたものである。

その音質調整装置においては、入力された音声信号における所定の第１の周波数帯域の成分の有無が判定部により判定される。すなわち、中低域成分である第１の周波数帯域の成分が存在するか否かに基づいて音声信号が歯擦音であるか否かが判定される。

第１の周波数帯域の成分がないと判定された場合には、入力された音声信号における第１の周波数帯域以上の第２の周波数帯域の成分が制御部により減衰され、第２の周波数帯域が減衰された音声信号が出力される。すなわち、中低域成分である第１の周波数帯域の成分が存在しない場合には、音声信号が歯擦音であるとみなされ、第２の周波数帯域の成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。

一方、第１の周波数帯域の成分があると判定された場合には、入力された音声信号における第２の周波数帯域の成分が制御部により減衰されずに入力された音声信号が出力される。すなわち、中低域成分である第１の周波数帯域の成分が存在する場合には、音声信号が通常発声音であるとみなされ、第２の周波数帯域の成分が減衰されない。それより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。

判定部は、入力された音声信号における第１の周波数帯域の成分のレベルが所定値以上の場合に第１の周波数帯域の成分があると判定し、入力された音声信号における第１の周波数帯域の成分のレベルが所定値よりも低い場合に第１の周波数帯域の成分がないと判定してもよい。

この場合、入力された音声信号における第１の周波数帯域の成分のレベルが所定値以上の場合に第１の周波数帯域の成分があると判定され、入力された音声信号における第１の周波数帯域の成分のレベルが所定値よりも低い場合に第１の周波数帯域の成分がないと判定される。それにより、音声信号が歯擦音であるか通常発声音であるかを確実に判定することができる。

判定部は、入力された音声信号における第１の周波数帯域の成分を抽出する第１の抽出器と、第１の周波数帯域の成分の有無を判定するために第１の抽出器の出力信号のレベルが所定値以上であるか否かを検出する検出器とを含み、制御部は、入力された音声信号の第２の周波数帯域の成分を抽出する第２の抽出器と、第１の抽出器の出力信号のレベルが所定値以上でないことが検出器により検出された場合に第２の抽出器の出力信号のレベルを減衰させ、第１の抽出器の出力信号のレベルが所定値以上であることが検出器により検出された場合に第２の抽出器の出力信号を減衰させずに出力する減衰器と、第１の抽出器の出力信号と減衰器の出力信号とを合成する合成器とを含んでもよい。

この場合、入力された音声信号における第１の周波数帯域の成分が第１の抽出器により抽出される。また、第１の周波数帯域の成分の有無を判定するために第１の抽出器の出力信号のレベルが所定値以上であるか否かが検出器により検出される。さらに、入力された音声信号の第２の周波数帯域の成分が第２の抽出器により抽出される。

第１の抽出器の出力信号のレベルが所定値以上でないことが検出器により検出された場合には、減衰器により第２の抽出器の出力信号のレベルが減衰される。第１の抽出器の出力信号のレベルが所定値以上であることが検出器により検出された場合には、第２の抽出器の出力信号が減衰器により減衰されずに出力される。第１の抽出器の出力信号と減衰器の出力信号とは合成器により合成される。それにより、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を確実に低減することができる。

判定部は、検出器の出力信号を積分する積分器をさらに含んでもよい。この場合、検出器の出力信号に生じるチャタリングの影響が除去される。

第１の抽出器は低域通過フィルタを含み、第２の抽出器は高域通過フィルタを含んでもよい。

この場合、入力された音声信号における中低域成分が低域通過フィルタを通過することにより、第１の周波数帯域の成分が抽出される。また、入力された音声信号における高域成分が高域通過フィルタを通過することにより、第２の周波数帯域の成分が抽出される。

判定部は、第１の周波数帯域の成分の有無とともに入力された音声信号における第２の周波数帯域の成分の有無を判定し、制御部は、判定部により第１の周波数帯域の成分がなくかつ第２の周波数帯域の成分があると判定された場合に入力された音声信号における第２の周波数帯域の成分を減衰させてもよい。

この場合、判定部により第１の周波数帯域の成分の有無とともに入力された音声信号における第２の周波数帯域の成分の有無が判定される。第１の周波数帯域の成分がなくかつ第２の周波数帯域の成分があると判定された場合に、入力された音声信号における第２の周波数帯域の成分が制御部により減衰される。それにより、歯擦音を正確かつ確実に減衰させることができる。

判定部は、入力された音声信号における第１の周波数帯域の成分のレベルが所定値以上の場合に第１の周波数帯域の成分があると判定し、入力された音声信号における第１の周波数帯域の成分のレベルが所定値よりも低い場合に第１の周波数帯域の成分がないと判定し、入力された音声信号における第２の周波数帯域の成分のレベルが所定値以上の場合に第２の周波数帯域の成分があると判定し、入力された音声信号における第２の周波数帯域の成分のレベルが所定値よりも低い場合に第２の周波数帯域の成分がないと判定してもよい。

この場合、入力された音声信号における第１の周波数帯域の成分のレベルが所定値以上の場合に第１の周波数帯域の成分があると判定され、入力された音声信号における第１の周波数帯域の成分のレベルが所定値よりも低い場合に第１の周波数帯域の成分がないと判定される。また、入力された音声信号における第２の周波数帯域の成分のレベルが所定値以上の場合に第２の周波数帯域の成分があると判定され、入力された音声信号における第２の周波数帯域の成分のレベルが所定値よりも低い場合に第２の周波数帯域の成分がないと判定される。それにより、音声信号が歯擦音であるか通常発声音であるかを確実に判定することができる。

判定部は、入力された音声信号における第１の周波数帯域の成分を抽出する第１の抽出器と、入力された音声信号における第２の周波数帯域の成分を抽出する第２の抽出器と、第１の周波数帯域の成分の有無を判定するために第１の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第１の検出器と、第２の周波数帯域の成分の有無を判定するために第２の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第２の検出器とを含み、制御部は、第１の抽出器の出力信号のレベルが所定値以上でないことが第１の検出器により検出されかつ第２の抽出器の出力信号のレベルが所定値以上であることが第２の検出器により検出された場合に第２の抽出器の出力信号のレベルを減衰させ、第１の抽出器の出力信号のレベルが所定値以上であることが第１の検出器により検出されまたは第２の抽出器の出力信号のレベルが所定値以上でないことが第２の検出器により検出された場合に第２の抽出器の出力信号を減衰させずに出力する減衰器と、第１の抽出器の出力信号と減衰器の出力信号とを合成する合成器とを含んでもよい。

この場合、入力された音声信号における第１の周波数帯域の成分が第１の抽出器により抽出される。また、入力された音声信号の第２の周波数帯域の成分が第２の抽出器により抽出される。さらに、第１の周波数帯域の成分の有無を判定するために第１の抽出器の出力信号のレベルが所定値以上であるか否かが第１の検出器により検出される。また、第２の周波数帯域の成分の有無を判定するために第２の抽出器の出力信号のレベルが所定値以上であるか否かが第２の検出器により検出される。

第１の抽出器の出力信号のレベルが所定値以上でないことが第１の検出器により検出されかつ第２の抽出器の出力信号のレベルが所定値以上であることが第２の検出器により検出された場合には、第２の抽出器の出力信号のレベルが減衰器により減衰される。第１の抽出器の出力信号のレベルが所定値以上であることが第１の検出器により検出されまたは第２の抽出器の出力信号のレベルが所定値以上でないことが第２の検出器により検出された場合には、第２の抽出器の出力信号が減衰器により減衰されずに出力される。第１の抽出器の出力信号と減衰器の出力信号とは合成器により合成される。それにより、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を確実に低減することができる。

判定部は、第１の検出器の出力信号を反転する反転器と、反転器の出力信号および第２の検出器の出力信号の論理積を算出する論理演算器とをさらに含んでもよく、減衰器は、論理演算器の出力信号に基づいて第２の抽出器の出力信号のレベルを減衰させるかまたは減衰させない。

この場合、第１の検出器の出力信号が反転器により反転され、反転器の出力信号および第２の検出器の出力信号の論理積が論理演算器により算出される。さらに、論理演算器の出力信号に基づいて第２の抽出器の出力信号のレベルが減衰器により減衰されるかまたは減衰されない。それにより、音声信号が歯擦音であると判定された場合に高域成分を確実に減衰させることができるとともに、音声信号が通常発声音であると判定された場合に高域成分の減衰を確実に停止することができる。

判定部は、論理演算器の出力信号を積分する積分器をさらに含んでもよい。この場合、論理演算器の出力信号に生じるチャタリングの影響が除去される。

第１の周波数帯域は、５ｋＨｚ以下の周波数帯域であり、第２の周波数帯域は、５ｋＨｚ以上の周波数帯域であってもよい。

歯擦音は、５ｋＨｚから１０ｋＨｚの周波数帯域にスペクトル成分をを有する。したがって、高域成分の音質劣化を防止しつつ歯擦音を確実に減衰させることができる。その結果、バランスのとれた聞きやすい音声を再生することができる。

本発明の他の局面に従う音質調整方法は、入力された音声信号における所定の周波数以下の第１の周波数帯域の成分の有無を判定するステップと、第１の周波数帯域の成分がないと判定された場合に入力された音声信号における第１の周波数帯域以上の第２の周波数帯域の成分を減衰させ、第２の周波数帯域が減衰された音声信号を出力し、第１の周波数帯域の成分があると判定された場合に入力された音声信号における第２の周波数帯域の成分を減衰させずに入力された音声信号を出力するステップとを備えたものである。

その音声調整方法においては、入力された音声信号における所定の第１の周波数帯域の成分の有無が判定される。すなわち、中低域成分である第１の周波数帯域の成分が存在するか否かに基づいて音声信号が歯擦音であるか否かが判定される。

第１の周波数帯域の成分がないと判定された場合には、入力された音声信号における第１の周波数帯域以上の第２の周波数帯域の成分が減衰され、第２の周波数帯域が減衰された音声信号が出力される。すなわち、中低域成分である第１の周波数帯域の成分が存在しない場合には、音声信号が歯擦音であるとみなされ、第２の周波数帯域の成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。

一方、第１の周波数帯域の成分があると判定された場合には、入力された音声信号における第２の周波数帯域の成分が減衰されずに入力された音声信号が出力される。すなわち、中低域成分である第１の周波数帯域の成分が存在する場合には、音声信号が通常発声音であるとみなされ、第２の周波数帯域の成分が減衰されない。それより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。

判定するステップは、第１の周波数帯域の成分の有無とともに入力された音声信号における第２の周波数帯域の成分の有無を判定するステップを含み、出力するステップは、第１の周波数帯域の成分がなくかつ第２の周波数帯域の成分があると判定された場合に入力された音声信号における第２の周波数帯域の成分を減衰させるステップを含んでもよい。

この場合、第１の周波数帯域の成分の有無とともに入力された音声信号における第２の周波数帯域の成分の有無が判定される。第１の周波数帯域の成分がなくかつ第２の周波数帯域の成分があると判定された場合に、入力された音声信号における第２の周波数帯域の成分が減衰される。それにより、歯擦音を正確かつ確実に減衰させることができる。

歯擦音は、５ｋＨｚから１０ｋＨｚの周波数帯域にスペクトル成分を有する。したがって、高域成分の音質劣化を防止しつつ歯擦音を確実に減衰させることができる。その結果、バランスのとれた聞きやすい音声を再生することができる。

以下、本発明の実施の形態について図面を参照しながら説明する。

（第１の実施の形態）
図１は本発明の第１の実施の形態に係る音質調整装置の構成を示すブロックである。

図１の音質調整装置は、低域通過フィルタ（Low Pass Filter：以下、ＬＰＦと略記する）１、高域通過フィルタ（High Pass Filter：以下ＨＰＦと略記する）２、レベル検出器３，４、反転器５、ＡＮＤゲート６、積分器７、ボリュームコントロールアンプ（Volume Control Amplifier：以下ＶＣＡと略記する）８および加算器９を備える。

ＬＰＦ１は、入力された音声信号の５ｋＨｚ以下の中低域成分を通過させることにより中低域成分を抽出する。ＨＰＦ２は、入力された音声信号の５ｋＨｚ以上の高域成分を通過させることにより高域成分を抽出する。

レベル検出器３は、ＬＰＦ１の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにＨレベル（ハイレベル）の信号を出力し、検出されたレベルが所定値よりも低いときにＬレベル（ローレベル）の信号を出力する。

レベル検出器４は、ＨＰＦ２の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにＨレベルの信号を出力し、検出されたレベルが所定値よりも低いときにＬレベルの信号を出力する。

反転器５は、レベル検出器３の出力信号のレベルを反転させる。すなわち、反転器５は、レベル検出器３の出力信号がＨレベルのときにＬレベルの信号を出力し、レベル検出器３の出力信号がＬレベルのときにＨレベルの信号を出力する。

ＡＮＤゲート６は、反転器５の出力信号とレベル検出器４の出力信号との論理積を演算する。積分器７は、ＡＮＤゲート６の出力信号を積分する。

ＶＣＡ８は、積分器７の出力信号がＨレベルのときにＨＰＦ２の出力信号のレベルを減衰させ、積分器７の出力信号がＬレベルのときにＨＰＦ２の出力信号をそのまま出力する。加算器９は、ＬＰＦ１の出力信号とＶＣＡ８の出力信号とを加算により合成する。

このように構成された音質調整装置の動作を図２、図３および図４を用いて説明する。図２は図１の音質調整装置における各部の信号波形図である。

図２には、図１のＬＰＦ１およびＨＰＦ２に入力される音声信号ａ、ＨＰＦ２の出力信号ｂ、レベル検出器４の出力信号ｃ、反転器５の出力信号ｄ、積分器７の出力信号ｅ、ＶＣＡ８の出力信号ｆおよび加算器９の出力信号ｇが示される。

図３（ａ）は歯擦音の波形の一例を示す図であり、図３（ｂ）は歯擦音の周波数スペクトルの一例を示す図である。図４（ａ）は通常発声音の波形の一例を示す図であり、図４（ｂ）は通常発声音の周波数スペクトルの一例を示す図である。

図３（ａ）および図４（ａ）の横軸は時間を表し、縦軸は振幅を表す。図３（ｂ）および図４（ｂ）の横軸は周波数を表し、縦軸はレベルを表す。

通常、歯擦音は５ｋＨｚから１０ｋＨｚの周波数帯域にスペクトル成分を有する。図３の歯擦音は、ランダム雑音の高域成分のみを有する波形および周波数スペクトルを示す。一方、通常発声音は、中低域成分（ホルマント成分）を有する。ここで、ホルマント成分とは、人間の声が持つ基本波およびその高調波である。図４の通常発声音は、中域基本波に高調波が重畳された波形および周波数スペクトルを示す。

本実施の形態に係る音質調整装置では、このような歯擦音および通常発声音の特徴を利用して、入力された音声信号ａが歯擦音のみを含む場合には高域成分を減衰させて音声再生を行う。

テレビジョン受信機（テレビジョンセット）の音声再生において、テレビジョン放送の音声信号を検波することにより得られる音声ベースバンド信号が音声信号ａとして図１のＬＰＦ１およびＨＰＦ２に入力される。

図２に示される音声信号ａは、「しゃしん」の発声時系列信号である。区間ｔ１，ｔ３で歯擦音「し」が発声されている。この区間ｔ１，ｔ３では、中低域成分が存在せずかつ高域成分が存在する。区間ｔ２，ｔ４では、歯擦音ではない「ゃ」および「ん」が発声されている。区間ｔ２，ｔ４では、中低域成分および高域成分が存在する。音声信号ａの中低域成分はＬＰＦ１を通過し、音声信号ａの高域成分はＨＰＦ２を通過する。

図２の例では、ＨＰＦ２の出力信号ｂにおいて、区間ｔ１，ｔ３で歯擦音による高域成分が存在し、区間ｔ２，ｔ４の中低域成分が除去される。

音声信号ａの高域成分の有無を判定するために、レベル検出器４によりＨＰＦ２の出力信号ｂのレベルが検出される。ＨＰＦ２の出力信号のレベルが所定値以上のときにレベル検出器４の出力信号ｃがＨレベルとなり、ＨＰＦ２の出力信号のレベルが所定値より低いときにはレベル検出器４の出力信号ｃがＬレベルとなる。

図２の例では、レベル検出器４の出力信号ｃは、歯擦音による高域成分が存在する区間ｔ１，ｔ３でＨレベルとなり、高域成分が存在しない区間ｔ２，ｔ４でＬレベルとなる。本実施の形態では、歯擦音以外の高域成分も検出される。

音声信号ａの中低域成分の有無を判定するために、レベル検出器３によりＬＰＦ１の出力信号のレベルが検出される。ＬＰＦ１の出力信号のレベルが所定値以上のときにレベル検出器３の出力信号がＨレベルとなり、ＬＰＦ１の出力信号のレベルが所定値より低いときにはレベル検出器３の出力信号がＬレベルとなる。レベル検出器３の出力信号は反転器５により反転される。

図２の例では、反転器５の出力信号ｄは、中低域成分が存在しない区間ｔ１，ｔ３でＨレベルとなり、中低域成分が存在する区間ｔ２，ｔ４でＬレベルとなる。

反転器５の出力信号ｄはＡＮＤゲート６の一方の入力端子に与えられ、レベル検出器４の出力信号ｃはＡＮＤゲート６の他方の入力端子に与えられる。ＡＮＤゲート６により反転器５の出力信号ｄとレベル検出器４の出力信号ｃとの論理積演算が行われる。

この場合、中低域成分が存在せずかつ高域成分が存在するときにのみＡＮＤゲート６の出力信号がＨレベルとなる。ＡＮＤゲート６の出力信号は多少のチャタリングを有する。そのため、ＡＮＤゲート６の出力信号が積分器７により積分される。

図２の例では、積分器７の出力信号ｅは、中低域成分が存在せずかつ高域成分が存在する区間ｔ１，ｔ３でＨレベルとなり、中低域成分が存在する区間ｔ２，ｔ４でＬレベルとなる。

積分器７の出力信号ｅによりＶＣＡ８の利得が制御される。それにより、ＨＰＦ２を通過した高域成分のレベルがＶＣＡ８により制御される。積分器７の出力信号ｅがＨレベルのときにＶＣＡ８によりＨＰＦ２の出力信号ｂのレベルが減衰され、積分器７の出力信号ｅがＬレベルのときにはＶＣＡ８によりＨＰＦ２の出力信号ｂがそのまま出力される。

図２の例では、ＶＣＡ８の出力信号ｆにおいて、区間ｔ１，ｔ３の歯擦音による高域成分のレベルが減衰されている。

ＬＰＦ１を通過した中低域成分とＶＣＡ８により減衰された高域成分とが加算器９により加算されることにより合成され、出力信号ｇが得られる。

図２の例では、加算器９の出力信号ｇにおいて、区間ｔ１，ｔ３の歯擦音が減衰され、区間ｔ２，ｔ４の通常発声音は減衰されない。

上記のように、本実施の形態に係る音質調整装置においては、高域成分が存在しかつ中低域成分が存在しない区間ｔ１，ｔ３の音声信号は歯擦音と判定され、ＶＣＡ８により高域成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。

また、中低域成分が存在する区間ｔ２，ｔ４の音声信号は通常発声音と判定され、ＶＣＡ８による高域成分の減衰が行われない。それにより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。

さらに、レベル検出器３，４を用いて中低域成分および高域成分の有無を検出しているので、歯擦音を有する区間を正確に判定することができる。

なお、ＶＣＡ８による高域成分の減衰の程度は、高域成分が低下しすぎないように調整することが必要である。例えば、高域成分を３デシベル〜１０デシベル程度減衰させるのが音質的に好ましい調整である。

本実施の形態において、ＬＰＦ１、ＨＰＦ２、レベル検出器３およびレベル検出器４が判定部を構成し、ＶＣＡ８および加算器９が制御部を構成する。また、ＬＰＦ１が第１の抽出器または低域通過フィルタに相当し、ＨＰＦ２が第２の抽出器または高域通過フィルタに相当し、レベル検出器３が第１の検出器３に相当し、レベル検出器４が第２の検出器に相当し、ＡＮＤゲート６が論理演算器に相当し、ＶＣＡ８が減衰器に相当し、加算器９が合成器に相当する。

なお、図１の各部は、電子回路等のハードウエアにより構成されてもよく、ＣＰＵ（中央演算処理装置）、半導体メモリ等を含むコンピュータとプログラム等のソフトウエアとにより構成されてもよい。

（第２の実施の形態）
図５は本発明の第２の実施の形態に係る音質調整装置の構成を示すブロック図である。

図５の音質調整装置は、ＬＰＦ１、ＨＰＦ２、レベル検出器３、反転器５、積分器７、ＶＣＡ８および加算器９を備える。

ＬＰＦ１は、入力された音声信号の５ｋＨｚ以下の中低域成分を通過させることにより中低域成分を抽出する。ＨＰＦ２は、入力された音声信号の５ｋＨｚ以上の高域成分を通過させることにより高域成分を抽出する。レベル検出器３は、ＬＰＦ１の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにＨレベルの信号を出力し、検出されたレベルが所定値よりも低いときにＬレベルの信号を出力する。

反転器５は、レベル検出器３の出力信号のレベルを反転させる。すなわち、反転器５は、レベル検出器３の出力信号がＨレベルのときにＬレベルの信号を出力し、レベル検出器３の出力信号がＬレベルのときにＨレベルの信号を出力する。積分器７は、反転器５の出力信号を積分する。

このように構成された音質調整装置の動作を図６を用いて説明する。図６は図５の音質調整装置における各部の信号波形図である。

図６には、図５のＬＰＦ１およびＨＰＦ２に入力される音声信号Ａ、ＨＰＦ２の出力信号Ｂ、反転器５の出力信号Ｃ、積分器７の出力信号Ｄ、ＶＣＡ８の出力信号Ｅおよび加算器９の出力信号Ｆが示される。

上記のように、通常、歯擦音は５ｋＨｚから１０ｋＨｚの周波数帯域にスペクトル成分を有する。図３に示したように、歯擦音は、ランダム雑音の高域成分のみを有する波形および周波数スペクトルを示す。一方、図４に示したように、通常発声音は、中低域成分（ホルマント成分）を有する。

本実施の形態に係る音質調整装置においても、このような歯擦音および通常発声音の特徴を利用して、入力された音声信号Ａが歯擦音のみを含む場合には高域成分を減衰させて音声再生を行う。

テレビジョン受信機（テレビジョンセット）の音声再生において、テレビジョン放送の音声信号を検波することにより得られる音声ベースバンド信号が音声信号Ａとして図５のＬＰＦ１およびＨＰＦ２に入力される。

図６に示される音声信号Ａは、「しゃしん」の発声時系列信号である。区間ｔ１，ｔ３で歯擦音「し」が発声されている。この区間ｔ１，ｔ３では、中低域成分が存在せずかつ高域成分が存在する。区間ｔ２，ｔ４では、歯擦音ではない「ゃ」および「ん」が発声されている。区間ｔ２，ｔ４では、中低域成分および高域成分が存在する。音声信号Ａの中低域成分はＬＰＦ１を通過し、音声信号Ａの高域成分はＨＰＦ２を通過する。

図６の例では、ＨＰＦ２の出力信号Ｂにおいて、区間ｔ１，ｔ３で歯擦音による高域成分が存在し、区間ｔ２，ｔ４の中低域成分が除去される。

音声信号Ａの中低域成分の有無を判定するために、レベル検出器３によりＬＰＦ１の出力信号のレベルが検出される。ＬＰＦ１の出力信号のレベルが所定値以上のときにレベル検出器３の出力信号がＨレベルとなり、ＬＰＦ１の出力信号のレベルが所定値より低いときにレベル検出器３の出力信号がＬレベルとなる。レベル検出器３の出力信号は反転器５により反転される。

図６の例では、反転器５の出力信号Ｃは、中低域成分が存在しない区間ｔ１，ｔ３でＨレベルとなり、中低域成分が存在する区間ｔ２，ｔ４でＬレベルとなる。

反転器５の出力信号Ｃは多少のチャタリングを有する。そのため、反転器５の出力信号Ｃが積分器７により積分される。

図６の例では、積分器７の出力信号Ｄは、中低域成分が存在しない区間ｔ１，ｔ３でＨレベルとなり、中低域成分が存在する区間ｔ２，ｔ４でＬレベルとなる。

積分器７の出力信号ＤによりＶＣＡ８の利得が制御される。それにより、ＨＰＦ２を通過した高域成分のレベルがＶＣＡ８により制御される。積分器７の出力信号ＤがＨレベルのときにＶＣＡ８によりＨＰＦ２の出力信号Ｂのレベルが減衰され、積分器７の出力信号ＤがＬレベルのときにＶＣＡ８によりＨＰＦ２の出力信号Ｂがそのまま出力される。

図６の例では、ＶＣＡ８の出力信号Ｅにおいて、区間ｔ１，ｔ３の歯擦音による高域成分のレベルが減衰されている。

ＬＰＦ１を通過した中低域成分とＶＣＡ８により減衰された高域成分とが加算器９により加算されることにより合成され、出力信号Ｆが得られる。

図６の例では、加算器９の出力信号Ｆにおいて、区間ｔ１，ｔ３の歯擦音が減衰され，区間ｔ２，ｔ４の通常発声音は減衰されない。

上記のように、本実施の形態に係る音質調整装置においては、中低域成分が存在しない区間ｔ１，ｔ３の音声信号は歯擦音と判定され、ＶＣＡ８により高域成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。

また、中低域成分が存在する区間ｔ２，ｔ４の音声信号は通常発声音と判定され、ＶＣＡ８による高域成分の減衰が行われない。それにより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスがとれた聞きやすい音声が再生される。

さらに、レベル検出器３を用いて中低域成分の有無を検出することにより歯察音の有無を判定しているので、回路構成が簡略化される。

本実施の形態において、ＬＰＦ１およびレベル検出器３が判定部を構成し、ＨＰ２、ＶＣＡ８および加算器９が制御部を構成する。また、ＬＰＦ１が第１の抽出器または低域通過フィルタに相当し、ＨＰＦ２が第２の抽出器または高域通過フィルタに相当し、レベル検出器３が検出器に相当し、ＶＣＡ８が減衰器に相当し、加算器９が合成器に相当する。

なお、図６の各部は、電子回路等のハードウエアにより構成されてもよく、ＣＰＵ、半導体メモリ等を含むコンピュータとプログラム等のソフトウエアとにより構成されてもよい。

（実施例）
本実施例では、図１の音質調整装置を用いて発声単語の音質を調整した。図７は発声単語のスペクトルの測定結果を示す図である。図８は音質調整された音声のスペクトルの測定結果を示す図である。ここでは、図１の音質調整装置により５ｋＨｚ以上の高域成分を１０ｄＢ減衰させた。発声単語は「写真（しゃしん）」である。

図７および図８の横軸は周波数であり、縦軸は振幅である。図８のスペクトルを図７のスペクトルと比較すると、図８のスペクトルでは、図７のスペクトルにおける５ｋＨｚ以上の高域成分が減衰されていことがわかる。それにより、耳障りな歯擦音が減衰され、聞きやすい音声が再生される。

（他の変形例）
上記第１の実施の形態では、正論理のＡＮＤゲート６を用いた場合を説明したが、負論理のＮＡＮＤゲートを用いて音質調整装置を容易に実現することもできる。

また、上記実施の形態では、減衰器として利得を連続的に変化させることが可能なＶＣＡを用いているが、減衰器として利得を少なくとも２段階で切り替えることが可能な減衰器を用いてもよい。

図１は、本発明の第１の実施の形態に係る音質調整装置の構成を示すブロック図である。図２は、図１の音質調整装置における各部の信号波形図である。図３は、歯擦音の波形の一例を示す図および歯擦音の周波数スペクトルの一例を示す図である。図４は、通常発声音の波形の一例を示す図であり、通常発声音の周波数スペクトルの一例を示す図である。図５は、本発明の第２の実施の形態に係る音質調整装置の構成を示すブロック図である。図６は、図５の音質調整装置における各部の信号波形図である。図７は、発声単語のスペクトルの測定結果を示す図である。図８は、音質調整された音声のスペクトルの測定結果を示す図である。図９は、ディエッサの一例を示すブロック図である。図１０は、図９のディエッサにおけるＬＰＦ、ＢＰＦおよびＨＰＦの周波数特性例を示す図である。図１１は、図９のディエッサにおけるコンプレッサ２４の特性例を示す図である。

Claims

入力された音声信号における所定の第１の周波数帯域の成分の有無を判定する判定部と、
前記判定部により前記第１の周波数帯域の成分がないと判定された場合に前記入力された音声信号における前記第１の周波数帯域以上の第２の周波数帯域の成分を減衰させ、第２の周波数帯域が減衰された音声信号を出力し、前記判定部により前記第１の周波数帯域の成分があると判定された場合に前記入力された音声信号における前記第２の周波数帯域の成分を減衰させずに前記入力された音声信号を出力する制御部とを備えた、音質調整装置。
前記判定部は、
前記入力された音声信号における前記第１の周波数帯域の成分のレベルが所定値以上の場合に前記第１の周波数帯域の成分があると判定し、前記入力された音声信号における前記第１の周波数帯域の成分のレベルが前記所定値よりも低い場合に前記第１の周波数帯域の成分がないと判定する、請求項１記載の音質調整装置。
前記判定部は、
前記入力された音声信号における前記第１の周波数帯域の成分を抽出する第１の抽出器と、
前記第１の周波数帯域の成分の有無を判定するために前記第１の抽出器の出力信号のレベルが所定値以上であるか否かを検出する検出器とを含み、
前記制御部は、
前記入力された音声信号の前記第２の周波数帯域の成分を抽出する第２の抽出器と、
前記第１の抽出器の出力信号のレベルが所定値以上でないことが前記検出器により検出された場合に前記第２の抽出器の出力信号のレベルを減衰させ、前記第１の抽出器の出力信号のレベルが所定値以上であることが前記検出器により検出された場合に前記第２の抽出器の出力信号を減衰させずに出力する減衰器と、
前記第１の抽出器の出力信号と前記減衰器の出力信号とを合成する合成器とを含む、請求項１記載の音質調整装置。
前記判定部は、
前記検出器の出力信号を積分する積分器をさらに含む、請求項３記載の音質調整装置。
前記第１の抽出器は低域通過フィルタを含み、
前記第２の抽出器は高域通過フィルタを含む、請求項３記載の音質調整装置。
前記判定部は、前記第１の周波数帯域の成分の有無とともに前記入力された音声信号における前記第２の周波数帯域の成分の有無を判定し、
前記制御部は、前記判定部により前記第１の周波数帯域の成分がなくかつ前記第２の周波数帯域の成分があると判定された場合に前記入力された音声信号における前記第２の周波数帯域の成分を減衰させる、請求項１記載の音質調整装置。
前記判定部は、
前記入力された音声信号における前記第１の周波数帯域の成分のレベルが所定値以上の場合に前記第１の周波数帯域の成分があると判定し、前記入力された音声信号における前記第１の周波数帯域の成分のレベルが前記所定値よりも低い場合に前記第１の周波数帯域の成分がないと判定し、
前記入力された音声信号における前記第２の周波数帯域の成分のレベルが所定値以上の場合に前記第２の周波数帯域の成分があると判定し、前記入力された音声信号における前記第２の周波数帯域の成分のレベルが前記所定値よりも低い場合に前記第２の周波数帯域の成分がないと判定する、請求項６記載の音質調整装置。
前記判定部は、
前記入力された音声信号における前記第１の周波数帯域の成分を抽出する第１の抽出器と、
前記入力された音声信号における前記第２の周波数帯域の成分を抽出する第２の抽出器と、
前記第１の周波数帯域の成分の有無を判定するために前記第１の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第１の検出器と、
前記第２の周波数帯域の成分の有無を判定するために前記第２の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第２の検出器とを含み、
前記制御部は、
前記第１の抽出器の出力信号のレベルが所定値以上でないことが前記第１の検出器により検出されかつ前記第２の抽出器の出力信号のレベルが所定値以上であることが前記第２の検出器により検出された場合に前記第２の抽出器の出力信号のレベルを減衰させ、前記第１の抽出器の出力信号のレベルが所定値以上であることが前記第１の検出器により検出されまたは前記第２の抽出器の出力信号のレベルが所定値以上でないことが前記第２の検出器により検出された場合に前記第２の抽出器の出力信号を減衰させずに出力する減衰器と、
前記第１の抽出器の出力信号と前記減衰器の出力信号とを合成する合成器とを含む、請求項６記載の音質調整装置。
前記判定部は、
前記第１の検出器の出力信号を反転する反転器と、
前記反転器の出力信号および前記第２の検出器の出力信号の論理積を算出する論理演算器とをさらに含み、
前記減衰器は、前記論理演算器の出力信号に基づいて前記第２の抽出器の出力信号のレベルを減衰させるかまたは減衰させない、請求項８記載の音質調整装置。
前記判定部は、
前記論理演算器の出力信号を積分する積分器をさらに含む、請求項９記載の音質調整装置。
前記第１の抽出器は低域通過フィルタを含み、
前記第２の抽出器は高域通過フィルタを含む、請求項８記載の音質調整装置。
前記第１の周波数帯域は、５ｋＨｚ以下の周波数帯域であり、
前記第１の周波数帯域は、５ｋＨｚ以上の周波数帯域である、請求項１記載の音質調整装置。
入力された音声信号における所定の周波数以下の第１の周波数帯域の成分の有無を判定するステップと、
前記第１の周波数帯域の成分がないと判定された場合に前記入力された音声信号における所定の周波数よりも高い第２の周波数帯域の成分を減衰させ、第２の周波数帯域が減衰された音声信号を出力し、前記第１の周波数帯域の成分があると判定された場合に前記入力された音声信号における前記第２の周波数帯域の成分を減衰させずに前記入力された音声信号を出力するステップとを備えた、音質調整方法。
前記判定するステップは、前記第１の周波数帯域の成分の有無とともに前記入力された音声信号における前記第２の周波数帯域の成分の有無を判定するステップを含み、
前記出力するステップは、前記第１の周波数帯域の成分がなくかつ前記第２の周波数帯域の成分があると判定された場合に前記入力された音声信号における前記第２の周波数帯域の成分を減衰させるステップを含む、請求項１３記載の音質調整方法。
前記第１の周波数帯域は、５ｋＨｚ以下の周波数帯域であり、
前記第１の周波数帯域は、５ｋＨｚ以上の周波数帯域である、請求項１３記載の音質調整方法。