JPWO2004109661A1 - 音質調整装置および音質調整方法 - Google Patents
音質調整装置および音質調整方法 Download PDFInfo
- Publication number
- JPWO2004109661A1 JPWO2004109661A1 JP2005506842A JP2005506842A JPWO2004109661A1 JP WO2004109661 A1 JPWO2004109661 A1 JP WO2004109661A1 JP 2005506842 A JP2005506842 A JP 2005506842A JP 2005506842 A JP2005506842 A JP 2005506842A JP WO2004109661 A1 JPWO2004109661 A1 JP WO2004109661A1
- Authority
- JP
- Japan
- Prior art keywords
- component
- frequency band
- level
- output signal
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 16
- 230000005236 sound signal Effects 0.000 claims abstract description 230
- 230000002238 attenuated effect Effects 0.000 claims description 108
- 239000000284 extract Substances 0.000 abstract description 16
- 238000010586 diagram Methods 0.000 description 48
- 238000001228 spectrum Methods 0.000 description 30
- 230000006866 deterioration Effects 0.000 description 18
- 101000964795 Homo sapiens Zinc finger protein 84 Proteins 0.000 description 17
- 102100040636 Zinc finger protein 84 Human genes 0.000 description 17
- 244000145845 chattering Species 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 230000001755 vocal effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G5/00—Tone control or bandwidth control in amplifiers
- H03G5/16—Automatic control
- H03G5/165—Equalizers; Volume or gain control in limited frequency bands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Telephone Function (AREA)
Abstract
LPFは入力された音声信号の中低域成分を抽出する。HPFは入力された音声信号の高低域成分を抽出する。一方のレベル検出器は、LPFの出力信号のレベルを検出することにより中低域成分の有無を判定する。他方のレベル検出器は、HPFの出力信号のレベルを検出することにより高域成分の有無を判定する。反転器は一方のレベル検出器の出力信号のレベルを反転させる。ANDゲートは反転器の出力信号と他方のレベル検出器の出力信号との論理積を演算する。積分器はANDゲートの出力信号を積分する。VCAは、中低域成分がなくかつ高域成分がある場合に音声信号が歯擦音であると判定し、HPFの出力信号のレベルを減衰させ、中低域成分がある場合に音声信号が通常発声音であると判定し、HPFの出力信号をそのまま出力する。加算器はLPFの出力信号とVCAの出力信号とを加算により合成する。
Description
本発明は、再生される音声の音質を調整する音質調整装置および音質調整方法に関する。
BS(衛星)放送の開始とともに、昨今のテレビジョンシステムの音声信号は、デジタル信号の形式で送信されるようになっており、低域から高域まで広い周波数帯域、平坦な周波数特性およびノイズの少ない高品質を有する。一方、このような音声信号を再生するテレビジョンセットに搭載されているスピーカは、テレビジョンセットへ内蔵されることによるスペース上の制約、および価格上の制約から、大きさおよび形状に限界がある。それにより、テレビジョンセットのスピーカは、低域から高域まで平坦な周波数特性を有することが困難である。
そこで、再生時の音質を改善するために種々の方法が提案されている(特表2002−513479号公報)。
また、高域の周波数特性の乱れから、アナウンサの発声した言葉の「サ」、「シ」、「ス」、「セ」および「ソ」の発音が著しく強調され、耳障りな音に聞こえるという課題がある。このような音は一般的に歯擦音と言われており、「サ」、「シ」、「ス」、「セ」および「ソ」の発音をするときに、前歯に空気が当り、歯擦音になることが知られている。この歯擦音は発音の仕方等により個人差があり、気にならない程度の音声、非常に聞き取りにくい音声などさまざまである。
放送局では、聞き取りにくい音声における歯擦音を抑えるため、プロオーディオ機器としてエフェクタの一種であるディエッサと呼ばれる音質調整装置を使用している。
図9はディエッサの一例を示すブロック図である。以下、図9を参照しながらディエッサについて説明する。
図9のディエッサは、低域通過フィルタ(Low Pass Filter:以下LPFと略記する)21、バンドパスフィルタ(Band Pass Filter:以下BPFと略記する)22、高域通過フィルタ(High Pass Filter:以下HPFと略記する)23、コンプレッサ24および加算器25を備える。
LPF21は、入力された音声信号の中低域成分を通過させる。BPF22は、入力された音声信号の中高域成分のみを通過させる。HPF22は、入力された音声信号の高域成分のみを通過させる。コンプレッサ24は、BPF24から出力される音声信号のレベルを圧縮する。加算器25は、LPF21から出力される音声信号、コンプレッサ24から出力される音声信号およびHPF23から出力される音声信号を加算により合成する。
このように構成されたディエッサの動作を図10および図11を用いて説明する。図10は図9のディエッサにおけるLPF21、BPF22およびHPF23の周波数特性例を示す図である。図11は図9のディエッサにおけるコンプレッサ24の特性例を示す図である。
放送局において、アナウンサ等により発生された音声は、マイクで電気信号である音声信号に変換され、マイクアンプ装置で所定のレベルに増幅され、増幅された音声信号が放送用の音声処理機材に入力される。
アナウンサの発声における歯擦音が著しく強く、音声が聞き取りにくい場合には、マイクアンプ装置の後段に図9のディエッサが挿入されることにより、次のようにして歯擦音が低減される。
通常、歯擦音の周波数帯域は5kHzから10kHzと言われており、図9のディエッサにおけるBPF22によりこの周波数帯域の成分が抽出される。これ以外の周波数帯域の成分はLPF21およびHPF23を通過する。BPF22により抽出された周波数帯域の成分は、コンプレッサ24により圧縮される。図11に示すように、コンプレッサ24は、入力レベルがスレッシュレベルLsを超えると、出力レベルを圧縮する。
LPF21から出力される音声信号、コンプレッサ24から出力される音声信号およびHPF23から出力される音声信号が加算器25により加算される。
このようにして、ディエッサによれば、歯擦音の周波数帯域の信号レベルが減衰され、歯擦音が目立たなくされる。
また、ディエッサによっては、BPFにおける通過帯域、圧縮レベルおよびスレッシュレベルを変化させることができる。その場合、アナウンサの声質に応じた調整が可能となる。
このディエッサの技術を家庭用のテレビジョンセットに応用することにより、テレビジョンセットにおいて気になる歯擦音が低減されるものと考えられる。
しかしながら、放送局でディエッサを使用して音声を収録する場合には歯擦音の低減の効果はあるが、テレビジョン放送を受信することにより得られる音声に残る耳障りな歯擦音を低減するためにディエッサーを使用すると、BPFの通過帯域にある歯擦音だけでなく、音声と混合されるBGM(背景音楽)または効果音までもが低減され、高域成分の抜けた音質となってしまう。
そこで、再生時の音質を改善するために種々の方法が提案されている(特表2002−513479号公報)。
また、高域の周波数特性の乱れから、アナウンサの発声した言葉の「サ」、「シ」、「ス」、「セ」および「ソ」の発音が著しく強調され、耳障りな音に聞こえるという課題がある。このような音は一般的に歯擦音と言われており、「サ」、「シ」、「ス」、「セ」および「ソ」の発音をするときに、前歯に空気が当り、歯擦音になることが知られている。この歯擦音は発音の仕方等により個人差があり、気にならない程度の音声、非常に聞き取りにくい音声などさまざまである。
放送局では、聞き取りにくい音声における歯擦音を抑えるため、プロオーディオ機器としてエフェクタの一種であるディエッサと呼ばれる音質調整装置を使用している。
図9はディエッサの一例を示すブロック図である。以下、図9を参照しながらディエッサについて説明する。
図9のディエッサは、低域通過フィルタ(Low Pass Filter:以下LPFと略記する)21、バンドパスフィルタ(Band Pass Filter:以下BPFと略記する)22、高域通過フィルタ(High Pass Filter:以下HPFと略記する)23、コンプレッサ24および加算器25を備える。
LPF21は、入力された音声信号の中低域成分を通過させる。BPF22は、入力された音声信号の中高域成分のみを通過させる。HPF22は、入力された音声信号の高域成分のみを通過させる。コンプレッサ24は、BPF24から出力される音声信号のレベルを圧縮する。加算器25は、LPF21から出力される音声信号、コンプレッサ24から出力される音声信号およびHPF23から出力される音声信号を加算により合成する。
このように構成されたディエッサの動作を図10および図11を用いて説明する。図10は図9のディエッサにおけるLPF21、BPF22およびHPF23の周波数特性例を示す図である。図11は図9のディエッサにおけるコンプレッサ24の特性例を示す図である。
放送局において、アナウンサ等により発生された音声は、マイクで電気信号である音声信号に変換され、マイクアンプ装置で所定のレベルに増幅され、増幅された音声信号が放送用の音声処理機材に入力される。
アナウンサの発声における歯擦音が著しく強く、音声が聞き取りにくい場合には、マイクアンプ装置の後段に図9のディエッサが挿入されることにより、次のようにして歯擦音が低減される。
通常、歯擦音の周波数帯域は5kHzから10kHzと言われており、図9のディエッサにおけるBPF22によりこの周波数帯域の成分が抽出される。これ以外の周波数帯域の成分はLPF21およびHPF23を通過する。BPF22により抽出された周波数帯域の成分は、コンプレッサ24により圧縮される。図11に示すように、コンプレッサ24は、入力レベルがスレッシュレベルLsを超えると、出力レベルを圧縮する。
LPF21から出力される音声信号、コンプレッサ24から出力される音声信号およびHPF23から出力される音声信号が加算器25により加算される。
このようにして、ディエッサによれば、歯擦音の周波数帯域の信号レベルが減衰され、歯擦音が目立たなくされる。
また、ディエッサによっては、BPFにおける通過帯域、圧縮レベルおよびスレッシュレベルを変化させることができる。その場合、アナウンサの声質に応じた調整が可能となる。
このディエッサの技術を家庭用のテレビジョンセットに応用することにより、テレビジョンセットにおいて気になる歯擦音が低減されるものと考えられる。
しかしながら、放送局でディエッサを使用して音声を収録する場合には歯擦音の低減の効果はあるが、テレビジョン放送を受信することにより得られる音声に残る耳障りな歯擦音を低減するためにディエッサーを使用すると、BPFの通過帯域にある歯擦音だけでなく、音声と混合されるBGM(背景音楽)または効果音までもが低減され、高域成分の抜けた音質となってしまう。
本発明の目的は、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を低減することができる音質調整装置および音質調整方法を提供することである。
本発明の一局面に従う音質調整装置は、入力された音声信号における所定の第1の周波数帯域の成分の有無を判定する判定部と、判定部により第1の周波数帯域の成分がないと判定された場合に入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分を減衰させ、第2の周波数帯域が減衰された音声信号を出力し、判定部により第1の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させずに入力された音声信号を出力する制御部とを備えたものである。
その音質調整装置においては、入力された音声信号における所定の第1の周波数帯域の成分の有無が判定部により判定される。すなわち、中低域成分である第1の周波数帯域の成分が存在するか否かに基づいて音声信号が歯擦音であるか否かが判定される。
第1の周波数帯域の成分がないと判定された場合には、入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分が制御部により減衰され、第2の周波数帯域が減衰された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在しない場合には、音声信号が歯擦音であるとみなされ、第2の周波数帯域の成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
一方、第1の周波数帯域の成分があると判定された場合には、入力された音声信号における第2の周波数帯域の成分が制御部により減衰されずに入力された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在する場合には、音声信号が通常発声音であるとみなされ、第2の周波数帯域の成分が減衰されない。それより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
判定部は、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定し、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定してもよい。
この場合、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定され、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定される。それにより、音声信号が歯擦音であるか通常発声音であるかを確実に判定することができる。
判定部は、入力された音声信号における第1の周波数帯域の成分を抽出する第1の抽出器と、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かを検出する検出器とを含み、制御部は、入力された音声信号の第2の周波数帯域の成分を抽出する第2の抽出器と、第1の抽出器の出力信号のレベルが所定値以上でないことが検出器により検出された場合に第2の抽出器の出力信号のレベルを減衰させ、第1の抽出器の出力信号のレベルが所定値以上であることが検出器により検出された場合に第2の抽出器の出力信号を減衰させずに出力する減衰器と、第1の抽出器の出力信号と減衰器の出力信号とを合成する合成器とを含んでもよい。
この場合、入力された音声信号における第1の周波数帯域の成分が第1の抽出器により抽出される。また、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かが検出器により検出される。さらに、入力された音声信号の第2の周波数帯域の成分が第2の抽出器により抽出される。
第1の抽出器の出力信号のレベルが所定値以上でないことが検出器により検出された場合には、減衰器により第2の抽出器の出力信号のレベルが減衰される。第1の抽出器の出力信号のレベルが所定値以上であることが検出器により検出された場合には、第2の抽出器の出力信号が減衰器により減衰されずに出力される。第1の抽出器の出力信号と減衰器の出力信号とは合成器により合成される。それにより、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を確実に低減することができる。
判定部は、検出器の出力信号を積分する積分器をさらに含んでもよい。この場合、検出器の出力信号に生じるチャタリングの影響が除去される。
第1の抽出器は低域通過フィルタを含み、第2の抽出器は高域通過フィルタを含んでもよい。
この場合、入力された音声信号における中低域成分が低域通過フィルタを通過することにより、第1の周波数帯域の成分が抽出される。また、入力された音声信号における高域成分が高域通過フィルタを通過することにより、第2の周波数帯域の成分が抽出される。
判定部は、第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無を判定し、制御部は、判定部により第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させてもよい。
この場合、判定部により第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無が判定される。第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に、入力された音声信号における第2の周波数帯域の成分が制御部により減衰される。それにより、歯擦音を正確かつ確実に減衰させることができる。
判定部は、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定し、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定し、入力された音声信号における第2の周波数帯域の成分のレベルが所定値以上の場合に第2の周波数帯域の成分があると判定し、入力された音声信号における第2の周波数帯域の成分のレベルが所定値よりも低い場合に第2の周波数帯域の成分がないと判定してもよい。
この場合、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定され、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定される。また、入力された音声信号における第2の周波数帯域の成分のレベルが所定値以上の場合に第2の周波数帯域の成分があると判定され、入力された音声信号における第2の周波数帯域の成分のレベルが所定値よりも低い場合に第2の周波数帯域の成分がないと判定される。それにより、音声信号が歯擦音であるか通常発声音であるかを確実に判定することができる。
判定部は、入力された音声信号における第1の周波数帯域の成分を抽出する第1の抽出器と、入力された音声信号における第2の周波数帯域の成分を抽出する第2の抽出器と、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第1の検出器と、第2の周波数帯域の成分の有無を判定するために第2の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第2の検出器とを含み、制御部は、第1の抽出器の出力信号のレベルが所定値以上でないことが第1の検出器により検出されかつ第2の抽出器の出力信号のレベルが所定値以上であることが第2の検出器により検出された場合に第2の抽出器の出力信号のレベルを減衰させ、第1の抽出器の出力信号のレベルが所定値以上であることが第1の検出器により検出されまたは第2の抽出器の出力信号のレベルが所定値以上でないことが第2の検出器により検出された場合に第2の抽出器の出力信号を減衰させずに出力する減衰器と、第1の抽出器の出力信号と減衰器の出力信号とを合成する合成器とを含んでもよい。
この場合、入力された音声信号における第1の周波数帯域の成分が第1の抽出器により抽出される。また、入力された音声信号の第2の周波数帯域の成分が第2の抽出器により抽出される。さらに、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かが第1の検出器により検出される。また、第2の周波数帯域の成分の有無を判定するために第2の抽出器の出力信号のレベルが所定値以上であるか否かが第2の検出器により検出される。
第1の抽出器の出力信号のレベルが所定値以上でないことが第1の検出器により検出されかつ第2の抽出器の出力信号のレベルが所定値以上であることが第2の検出器により検出された場合には、第2の抽出器の出力信号のレベルが減衰器により減衰される。第1の抽出器の出力信号のレベルが所定値以上であることが第1の検出器により検出されまたは第2の抽出器の出力信号のレベルが所定値以上でないことが第2の検出器により検出された場合には、第2の抽出器の出力信号が減衰器により減衰されずに出力される。第1の抽出器の出力信号と減衰器の出力信号とは合成器により合成される。それにより、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を確実に低減することができる。
判定部は、第1の検出器の出力信号を反転する反転器と、反転器の出力信号および第2の検出器の出力信号の論理積を算出する論理演算器とをさらに含んでもよく、減衰器は、論理演算器の出力信号に基づいて第2の抽出器の出力信号のレベルを減衰させるかまたは減衰させない。
この場合、第1の検出器の出力信号が反転器により反転され、反転器の出力信号および第2の検出器の出力信号の論理積が論理演算器により算出される。さらに、論理演算器の出力信号に基づいて第2の抽出器の出力信号のレベルが減衰器により減衰されるかまたは減衰されない。それにより、音声信号が歯擦音であると判定された場合に高域成分を確実に減衰させることができるとともに、音声信号が通常発声音であると判定された場合に高域成分の減衰を確実に停止することができる。
判定部は、論理演算器の出力信号を積分する積分器をさらに含んでもよい。この場合、論理演算器の出力信号に生じるチャタリングの影響が除去される。
第1の抽出器は低域通過フィルタを含み、第2の抽出器は高域通過フィルタを含んでもよい。
この場合、入力された音声信号における中低域成分が低域通過フィルタを通過することにより、第1の周波数帯域の成分が抽出される。また、入力された音声信号における高域成分が高域通過フィルタを通過することにより、第2の周波数帯域の成分が抽出される。
第1の周波数帯域は、5kHz以下の周波数帯域であり、第1の周波数帯域は、5kHz以上の周波数帯域であってもよい。
歯擦音は、5kHzから10kHzの周波数帯域にスペクトル成分をを有する。したがって、高域成分の音質劣化を防止しつつ歯擦音を確実に減衰させることができる。その結果、バランスのとれた聞きやすい音声を再生することができる。
本発明の他の局面に従う音質調整方法は、入力された音声信号における所定の第1の周波数帯域の成分の有無を判定するステップと、第1の周波数帯域の成分がないと判定された場合に入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分を減衰させ、第2の周波数帯域が減衰された音声信号を出力し、第1の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させずに入力された音声信号を出力するステップとを備えたものである。
その音声調整方法においては、入力された音声信号における所定の第1の周波数帯域の成分の有無が判定される。すなわち、中低域成分である第1の周波数帯域の成分が存在するか否かに基づいて音声信号が歯擦音であるか否かが判定される。
第1の周波数帯域の成分がないと判定された場合には、入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分が減衰され、第2の周波数帯域が減衰された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在しない場合には、音声信号が歯擦音であるとみなされ、第2の周波数帯域の成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
一方、第1の周波数帯域の成分があると判定された場合には、入力された音声信号における第2の周波数帯域の成分が減衰されずに入力された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在する場合には、音声信号が通常発声音であるとみなされ、第2の周波数帯域の成分が減衰されない。それより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
判定するステップは、第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無を判定するステップを含み、出力するステップは、第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させるステップを含んでもよい。
この場合、第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無が判定される。第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に、入力された音声信号における第2の周波数帯域の成分が減衰される。それにより、歯擦音を正確かつ確実に減衰させることができる。
第1の周波数帯域は、5kHz以下の周波数帯域であり、第1の周波数帯域は、5kHz以上の周波数帯域であってもよい。
歯擦音は、5kHzから10kHzの周波数帯域にスペクトル成分を有する。したがって、高域成分の音質劣化を防止しつつ歯擦音を確実に減衰させることができる。その結果、バランスのとれた聞きやすい音声を再生することができる。
本発明の一局面に従う音質調整装置は、入力された音声信号における所定の第1の周波数帯域の成分の有無を判定する判定部と、判定部により第1の周波数帯域の成分がないと判定された場合に入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分を減衰させ、第2の周波数帯域が減衰された音声信号を出力し、判定部により第1の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させずに入力された音声信号を出力する制御部とを備えたものである。
その音質調整装置においては、入力された音声信号における所定の第1の周波数帯域の成分の有無が判定部により判定される。すなわち、中低域成分である第1の周波数帯域の成分が存在するか否かに基づいて音声信号が歯擦音であるか否かが判定される。
第1の周波数帯域の成分がないと判定された場合には、入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分が制御部により減衰され、第2の周波数帯域が減衰された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在しない場合には、音声信号が歯擦音であるとみなされ、第2の周波数帯域の成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
一方、第1の周波数帯域の成分があると判定された場合には、入力された音声信号における第2の周波数帯域の成分が制御部により減衰されずに入力された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在する場合には、音声信号が通常発声音であるとみなされ、第2の周波数帯域の成分が減衰されない。それより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
判定部は、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定し、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定してもよい。
この場合、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定され、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定される。それにより、音声信号が歯擦音であるか通常発声音であるかを確実に判定することができる。
判定部は、入力された音声信号における第1の周波数帯域の成分を抽出する第1の抽出器と、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かを検出する検出器とを含み、制御部は、入力された音声信号の第2の周波数帯域の成分を抽出する第2の抽出器と、第1の抽出器の出力信号のレベルが所定値以上でないことが検出器により検出された場合に第2の抽出器の出力信号のレベルを減衰させ、第1の抽出器の出力信号のレベルが所定値以上であることが検出器により検出された場合に第2の抽出器の出力信号を減衰させずに出力する減衰器と、第1の抽出器の出力信号と減衰器の出力信号とを合成する合成器とを含んでもよい。
この場合、入力された音声信号における第1の周波数帯域の成分が第1の抽出器により抽出される。また、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かが検出器により検出される。さらに、入力された音声信号の第2の周波数帯域の成分が第2の抽出器により抽出される。
第1の抽出器の出力信号のレベルが所定値以上でないことが検出器により検出された場合には、減衰器により第2の抽出器の出力信号のレベルが減衰される。第1の抽出器の出力信号のレベルが所定値以上であることが検出器により検出された場合には、第2の抽出器の出力信号が減衰器により減衰されずに出力される。第1の抽出器の出力信号と減衰器の出力信号とは合成器により合成される。それにより、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を確実に低減することができる。
判定部は、検出器の出力信号を積分する積分器をさらに含んでもよい。この場合、検出器の出力信号に生じるチャタリングの影響が除去される。
第1の抽出器は低域通過フィルタを含み、第2の抽出器は高域通過フィルタを含んでもよい。
この場合、入力された音声信号における中低域成分が低域通過フィルタを通過することにより、第1の周波数帯域の成分が抽出される。また、入力された音声信号における高域成分が高域通過フィルタを通過することにより、第2の周波数帯域の成分が抽出される。
判定部は、第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無を判定し、制御部は、判定部により第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させてもよい。
この場合、判定部により第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無が判定される。第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に、入力された音声信号における第2の周波数帯域の成分が制御部により減衰される。それにより、歯擦音を正確かつ確実に減衰させることができる。
判定部は、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定し、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定し、入力された音声信号における第2の周波数帯域の成分のレベルが所定値以上の場合に第2の周波数帯域の成分があると判定し、入力された音声信号における第2の周波数帯域の成分のレベルが所定値よりも低い場合に第2の周波数帯域の成分がないと判定してもよい。
この場合、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定され、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定される。また、入力された音声信号における第2の周波数帯域の成分のレベルが所定値以上の場合に第2の周波数帯域の成分があると判定され、入力された音声信号における第2の周波数帯域の成分のレベルが所定値よりも低い場合に第2の周波数帯域の成分がないと判定される。それにより、音声信号が歯擦音であるか通常発声音であるかを確実に判定することができる。
判定部は、入力された音声信号における第1の周波数帯域の成分を抽出する第1の抽出器と、入力された音声信号における第2の周波数帯域の成分を抽出する第2の抽出器と、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第1の検出器と、第2の周波数帯域の成分の有無を判定するために第2の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第2の検出器とを含み、制御部は、第1の抽出器の出力信号のレベルが所定値以上でないことが第1の検出器により検出されかつ第2の抽出器の出力信号のレベルが所定値以上であることが第2の検出器により検出された場合に第2の抽出器の出力信号のレベルを減衰させ、第1の抽出器の出力信号のレベルが所定値以上であることが第1の検出器により検出されまたは第2の抽出器の出力信号のレベルが所定値以上でないことが第2の検出器により検出された場合に第2の抽出器の出力信号を減衰させずに出力する減衰器と、第1の抽出器の出力信号と減衰器の出力信号とを合成する合成器とを含んでもよい。
この場合、入力された音声信号における第1の周波数帯域の成分が第1の抽出器により抽出される。また、入力された音声信号の第2の周波数帯域の成分が第2の抽出器により抽出される。さらに、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かが第1の検出器により検出される。また、第2の周波数帯域の成分の有無を判定するために第2の抽出器の出力信号のレベルが所定値以上であるか否かが第2の検出器により検出される。
第1の抽出器の出力信号のレベルが所定値以上でないことが第1の検出器により検出されかつ第2の抽出器の出力信号のレベルが所定値以上であることが第2の検出器により検出された場合には、第2の抽出器の出力信号のレベルが減衰器により減衰される。第1の抽出器の出力信号のレベルが所定値以上であることが第1の検出器により検出されまたは第2の抽出器の出力信号のレベルが所定値以上でないことが第2の検出器により検出された場合には、第2の抽出器の出力信号が減衰器により減衰されずに出力される。第1の抽出器の出力信号と減衰器の出力信号とは合成器により合成される。それにより、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を確実に低減することができる。
判定部は、第1の検出器の出力信号を反転する反転器と、反転器の出力信号および第2の検出器の出力信号の論理積を算出する論理演算器とをさらに含んでもよく、減衰器は、論理演算器の出力信号に基づいて第2の抽出器の出力信号のレベルを減衰させるかまたは減衰させない。
この場合、第1の検出器の出力信号が反転器により反転され、反転器の出力信号および第2の検出器の出力信号の論理積が論理演算器により算出される。さらに、論理演算器の出力信号に基づいて第2の抽出器の出力信号のレベルが減衰器により減衰されるかまたは減衰されない。それにより、音声信号が歯擦音であると判定された場合に高域成分を確実に減衰させることができるとともに、音声信号が通常発声音であると判定された場合に高域成分の減衰を確実に停止することができる。
判定部は、論理演算器の出力信号を積分する積分器をさらに含んでもよい。この場合、論理演算器の出力信号に生じるチャタリングの影響が除去される。
第1の抽出器は低域通過フィルタを含み、第2の抽出器は高域通過フィルタを含んでもよい。
この場合、入力された音声信号における中低域成分が低域通過フィルタを通過することにより、第1の周波数帯域の成分が抽出される。また、入力された音声信号における高域成分が高域通過フィルタを通過することにより、第2の周波数帯域の成分が抽出される。
第1の周波数帯域は、5kHz以下の周波数帯域であり、第1の周波数帯域は、5kHz以上の周波数帯域であってもよい。
歯擦音は、5kHzから10kHzの周波数帯域にスペクトル成分をを有する。したがって、高域成分の音質劣化を防止しつつ歯擦音を確実に減衰させることができる。その結果、バランスのとれた聞きやすい音声を再生することができる。
本発明の他の局面に従う音質調整方法は、入力された音声信号における所定の第1の周波数帯域の成分の有無を判定するステップと、第1の周波数帯域の成分がないと判定された場合に入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分を減衰させ、第2の周波数帯域が減衰された音声信号を出力し、第1の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させずに入力された音声信号を出力するステップとを備えたものである。
その音声調整方法においては、入力された音声信号における所定の第1の周波数帯域の成分の有無が判定される。すなわち、中低域成分である第1の周波数帯域の成分が存在するか否かに基づいて音声信号が歯擦音であるか否かが判定される。
第1の周波数帯域の成分がないと判定された場合には、入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分が減衰され、第2の周波数帯域が減衰された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在しない場合には、音声信号が歯擦音であるとみなされ、第2の周波数帯域の成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
一方、第1の周波数帯域の成分があると判定された場合には、入力された音声信号における第2の周波数帯域の成分が減衰されずに入力された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在する場合には、音声信号が通常発声音であるとみなされ、第2の周波数帯域の成分が減衰されない。それより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
判定するステップは、第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無を判定するステップを含み、出力するステップは、第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させるステップを含んでもよい。
この場合、第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無が判定される。第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に、入力された音声信号における第2の周波数帯域の成分が減衰される。それにより、歯擦音を正確かつ確実に減衰させることができる。
第1の周波数帯域は、5kHz以下の周波数帯域であり、第1の周波数帯域は、5kHz以上の周波数帯域であってもよい。
歯擦音は、5kHzから10kHzの周波数帯域にスペクトル成分を有する。したがって、高域成分の音質劣化を防止しつつ歯擦音を確実に減衰させることができる。その結果、バランスのとれた聞きやすい音声を再生することができる。
図1は、本発明の第1の実施の形態に係る音質調整装置の構成を示すブロックである。
図2は、図1の音質調整装置における各部の信号波形図である。
図3は、歯擦音の波形の一例を示す図および歯擦音の周波数スペクトルの一例を示す図である。
図4は、通常発声音の波形の一例を示す図であり、通常発声音の周波数スペクトルの一例を示す図である。
図5は、本発明の第2の実施の形態に係る音質調整装置の構成を示すブロック図である。
図6は、図5の音質調整装置における各部の信号波形図である。
図7は、発声単語のスペクトルの測定結果を示す図である。
図8は、音質調整された音声のスペクトルの測定結果を示す図である。
図9は、ディエッサの一例を示すブロック図である。
図10は、図9のディエッサにおけるLPF、BPFおよびHPFの周波数特性例を示す図である。
図11は、図9のディエッサにおけるコンプレッサ24の特性例を示す図である。
図2は、図1の音質調整装置における各部の信号波形図である。
図3は、歯擦音の波形の一例を示す図および歯擦音の周波数スペクトルの一例を示す図である。
図4は、通常発声音の波形の一例を示す図であり、通常発声音の周波数スペクトルの一例を示す図である。
図5は、本発明の第2の実施の形態に係る音質調整装置の構成を示すブロック図である。
図6は、図5の音質調整装置における各部の信号波形図である。
図7は、発声単語のスペクトルの測定結果を示す図である。
図8は、音質調整された音声のスペクトルの測定結果を示す図である。
図9は、ディエッサの一例を示すブロック図である。
図10は、図9のディエッサにおけるLPF、BPFおよびHPFの周波数特性例を示す図である。
図11は、図9のディエッサにおけるコンプレッサ24の特性例を示す図である。
以下、本発明の実施の形態について図面を参照しながら説明する。
(第1の実施の形態)
図1は本発明の第1の実施の形態に係る音質調整装置の構成を示すブロックである。
図1の音質調整装置は、低域通過フィルタ(Low Pass Filter:以下、LPFと略記する)、高域通過フィルタ(High Pass Filter:以下HPFと略記する)2、レベル検出器3,4、反転器5、ANDゲート6、積分器7、ボリュームコントロールアンプ(Volume Control Amplifier:以下VCAと略記する)8および加算器9を備える。
LPF1は、入力された音声信号の5kHz以下の中低域成分を通過させることにより中低域成分を抽出する。HPF2は、入力された音声信号の5kHz以上の高域成分を通過させることにより高低域成分を抽出する。
レベル検出器3は、LPF1の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにHレベル(ハイレベル)の信号を出力し、検出されたレベルが所定値よりも低いときにLレベル(ローレベル)の信号を出力する。
レベル検出器4は、HPF2の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにHレベルの信号を出力し、検出されたレベルが所定値よりも低いときにLレベルの信号を出力する。
反転器5は、レベル検出器3の出力信号のレベルを反転させる。すなわち、反転器5は、レベル検出器3の出力信号がHレベルのときにLレベルの信号を出力し、レベル検出器3の出力信号がLレベルのときにHレベルの信号を出力する。
ANDゲート6は、反転器5の出力信号とレベル検出器4の出力信号との論理積を演算する。積分器7は、ANDゲート6の出力信号を積分する。
VCA8は、積分器7の出力信号がHレベルのときにHPF2の出力信号のレベルを減衰させ、積分器7の出力信号がLレベルのときにHPF2の出力信号をそのまま出力する。加算器9は、LPF1の出力信号とVCA8の出力信号とを加算により合成する。
このように構成された音質調整装置の動作を図2、図3および図4を用いて説明する。図2は図1の音質調整装置における各部の信号波形図である。
図2には、図1のLPF1およびHPF2に入力される音声信号a、HPF2の出力信号b、レベル検出器4の出力信号c、反転器5の出力信号d、積分器7の出力信号e、VCA8の出力信号fおよび加算器9の出力信号gが示される。
図3(a)は歯擦音の波形の一例を示す図であり、図3(b)は歯擦音の周波数スペクトルの一例を示す図である。図4(a)は通常発声音の波形の一例を示す図であり、図4(b)は通常発声音の周波数スペクトルの一例を示す図である。
図3(a)および図4(a)の横軸は時間を表し、縦軸は振幅を表す。図3(b)および図4(b)の横軸は周波数を表し、縦軸はレベルを表す。
通常、歯擦音は5kHzから10kHzの周波数帯域にスペクトル成分を有する。図3の歯擦音は、ランダム雑音の高域成分のみを有する波形および周波数スペクトルを示す。一方、通常発声音は、中低域成分(ホルマント成分)を有する。ここで、ホルマント成分とは、人間の声が持つ基本波およびその高調波である。図4の通常発声音は、中域基本波に高調波が重畳された波形および周波数スペクトルを示す。
本実施の形態に係る音質調整装置では、このような歯擦音および通常発声音の特徴を利用して、入力された音声信号aが歯擦音のみを含む場合には高域成分を減衰させて音声再生を行う。
テレビジョン受信機(テレビジョンセット)の音声再生において、テレビジョン放送の音声信号を検波することにより得られる音声ベースバンド信号が音声信号aとして図1のLPF1およびHPF2に入力される。
図2に示される音声信号aは、「しゃしん」の発声時系列信号である。区間t1,t3で歯擦音「し」が発声されている。この区間t1,t3では、中低域成分が存在せずかつ高域成分が存在する。区間t2,t4では、歯擦音ではない「ゃ」および「ん」が発声されている。区間t2,t4では、中低域成分および高域成分が存在する。音声信号aの中低域成分はLPF1を通過し、音声信号aの高域成分はHPF2を通過する。
図2の例では、HPF2の出力信号bにおいて、区間t1,t3で歯擦音による高域成分が存在し、区間t2,t4の中低域成分が除去される。
音声信号aの高域成分の有無を判定するために、レベル検出器4によりHPF2の出力信号bのレベルが検出される。HPF2の出力信号のレベルが所定値以上のときにレベル検出器4の出力信号cがHレベルとなり、HPF2の出力信号のレベルが所定値より低いときにはレベル検出器4の出力信号cがLレベルとなる。
図2の例では、レベル検出器4の出力信号cは、歯擦音による高域成分が存在する区間t1,t3でHレベルとなり、高域成分が存在しない区間t2,t4でLレベルとなる。本実施の形態では、歯擦音以外の高域成分も検出される。
音声信号aの中低域成分の有無を判定するために、レベル検出器3によりLPF1の出力信号のレベルが検出される。LPF1の出力信号のレベルが所定値以上のときにレベル検出器3の出力信号がHレベルとなり、LPF1の出力信号のレベルが所定値より低いときにはレベル検出器3の出力信号がLレベルとなる。レベル検出器3の出力信号は反転器5により反転される。
図2の例では、反転器5の出力信号dは、中低域成分が存在しない区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
反転器5の出力信号dはANDゲート6の一方の入力端子に与えられ、レベル検出器4の出力信号cはANDゲート6の他方の入力端子に与えられる。ANDゲート6により反転器5の出力信号dとレベル検出器4の出力信号cとの論理積演算が行われる。
この場合、中低域成分が存在せずかつ高域成分が存在するときにのみANDゲート6の出力信号がHレベルとなる。ANDゲート6の出力信号は多少のチャタリングを有する。そのため、ANDゲート6の出力信号が積分器7により積分される。
図2の例では、積分器7の出力信号eは、中低域成分が存在せずかつ高域成分が存在する区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
積分器7の出力信号eによりVCA8の利得が制御される。それにより、HPF2を通過した高域成分のレベルがVCA8により制御される。積分器7の出力信号eがHレベルのときにVCA8によりHPF2の出力信号bのレベルが減衰され、積分器7の出力信号eがLレベルのときにはVCA8によりHPF2の出力信号bがそのまま出力される。
図2の例では、VCA8の出力信号fにおいて、区間t1,t3の歯擦音による高域成分のレベルが減衰されている。
LPF1を通過した中低域成分とVCA8により減衰された高域成分とが加算器9により加算されることにより合成され、出力信号gが得られる。
図2の例では、加算器9の出力信号gにおいて、区間t1,t3の歯擦音が減衰され、区間t2,t4の通常発声音は減衰されない。
上記のように、本実施の形態に係る音質調整装置においては、高域成分が存在しかつ中低域成分が存在しない区間t1,t3の音声信号は歯擦音と判定され、VCA8により高域成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
また、中低域成分が存在する区間t2,t4の音声信号は通常発声音と判定され、VCA8による高域成分の減衰が行われない。それにより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
さらに、レベル検出器3,4を用いて中低域成分および高域成分の有無を検出しているので、歯擦音を有する区間を正確に判定することができる。
なお、VCA8による高域成分の減衰の程度は、高域成分が低下しすぎないように調整することが必要である。例えば、高域成分を3デシベル〜10デシベル程度減衰させるのが音質的に好ましい調整である。
本実施の形態において、LPF1、HPF2、レベル検出器3およびレベル検出器4が判定部を構成し、VCA8および加算器9が制御部を構成する。また、LPF1が第1の抽出器または低域通過フィルタに相当し、HPF2が第2の抽出器または高域通過フィルタに相当し、レベル検出器3が第1の検出器3に相当し、レベル検出器4が第2の検出器に相当し、ANDゲート6が論理演算器に相当し、VCA8が減衰器に相当し、加算器9が合成器に相当する。
なお、図1の各部は、電子回路等のハードウエアにより構成されてもよく、CPU(中央演算処理装置)、半導体メモリ等を含むコンピュータとプログラム等のソフトウエアとにより構成されてもよい。
(第2の実施の形態)
図5は本発明の第2の実施の形態に係る音質調整装置の構成を示すブロック図である。
図5の音質調整装置は、LPF1、HPF2、レベル検出器3、反転器5、積分器7、VCA8および加算器9を備える。
LPF1は、入力された音声信号の5kHz以下の中低域成分を通過させることにより中低域成分を抽出する。HPF2は、入力された音声信号の5kHz以上の高域成分を通過させることにより高域成分を抽出する。レベル検出器3は、LPF1の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにHレベルの信号を出力し、検出されたレベルが所定値よりも低いときにLレベルの信号を出力する。
反転器5は、レベル検出器3の出力信号のレベルを反転させる。すなわち、反転器5は、レベル検出器3の出力信号がHレベルのときにLレベルの信号を出力し、レベル検出器3の出力信号がLレベルのときにHレベルの信号を出力する。積分器7は、反転器5の出力信号を積分する。
VCA8は、積分器7の出力信号がHレベルのときにHPF2の出力信号のレベルを減衰させ、積分器7の出力信号がLレベルのときにHPF2の出力信号をそのまま出力する。加算器9は、LPF1の出力信号とVCA8の出力信号とを加算により合成する。
このように構成された音質調整装置の動作を図6を用いて説明する。図6は図5の音質調整装置における各部の信号波形図である。
図6には、図5のLPF1およびHPF2に入力される音声信号A、HPF2の出力信号B、反転器5の出力信号C、積分器7の出力信号D、VCA8の出力信号Eおよび加算器9の出力信号Fが示される。
上記のように、通常、歯擦音は5kHzから10kHzの周波数帯域にスペクトル成分を有する。図3に示したように、歯擦音は、ランダム雑音の高域成分のみを有する波形および周波数スペクトルを示す。一方、図4に示したように、通常発声音は、中低域成分(ホルマント成分)を有する。
本実施の形態に係る音質調整装置においても、このような歯擦音および通常発声音の特徴を利用して、入力された音声信号Aが歯擦音のみを含む場合には高域成分を減衰させて音声再生を行う。
テレビジョン受信機(テレビジョンセット)の音声再生において、テレビジョン放送の音声信号を検波することにより得られる音声ベースバンド信号が音声信号Aとして図5のLPF1およびHPF2に入力される。
図6に示される音声信号Aは、「しゃしん」の発声時系列信号である。区間t1,t3で歯擦音「し」が発声されている。この区間t1,t3では、中低域成分が存在せずかつ高域成分が存在する。区間t2,t4では、歯擦音ではない「ゃ」および「ん」が発声されている。区間t2,t4では、中低域成分および高域成分が存在する。音声信号Aの中低域成分はLPF1を通過し、音声信号Aの高域成分はHPF2を通過する。
図6の例では、HPF2の出力信号Bにおいて、区間t1,t3で歯擦音による高域成分が存在し、区間t2,t4の中低域成分が除去される。
音声信号Aの中低域成分の有無を判定するために、レベル検出器3によりLPF1の出力信号のレベルが検出される。LPF1の出力信号のレベルが所定値以上のときにレベル検出器3の出力信号がHレベルとなり、LPF1の出力信号のレベルが所定値より低いときにレベル検出器3の出力信号がLレベルとなる。レベル検出器3の出力信号は反転器5により反転される。
図6の例では、反転器5の出力信号Cは、中低域成分が存在しない区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
反転器5の出力信号Cは多少のチャタリングを有する。そのため、反転器5の出力信号Cが積分器7により積分される。
図6の例では、積分器7の出力信号Dは、中低域成分が存在しない区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
積分器7の出力信号DによりVCA8の利得が制御される。それにより、HPF2を通過した高域成分のレベルがVCA8により制御される。積分器7の出力信号DがHレベルのときにVCA8によりHPF2の出力信号Bのレベルが減衰され、積分器7の出力信号DがLレベルのときにVCA8によりHPF2の出力信号Dがそのまま出力される。
図6の例では、VCA8の出力信号Eにおいて、区間t1,t3の歯擦音による高域成分のレベルが減衰されている。
LPF1を通過した中低域成分とVCA8により減衰された高域成分とが加算器9により加算されることにより合成され、出力信号Fが得られる。
図6の例では、加算器9の出力信号Fにおいて、区間t1,t3の歯擦音が減衰され,区間t2,t4の通常発声音は減衰されない。
上記のように、本実施の形態に係る音質調整装置においては、中低域成分が存在しない区間t1,t3の音声信号は歯擦音と判定され、VCA8により高域成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
また、中低域成分が存在する区間t2,t4の音声信号は通常発声音と判定され、VCA8による高域成分の減衰が行われない。それにより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスがとれた聞きやすい音声が再生される。
さらに、レベル検出器3を用いて中低域成分の有無を検出することにより歯察音の有無を判定しているので、回路構成が簡略化される。
なお、VCA8による高域成分の減衰の程度は、高域成分が低下しすぎないように調整することが必要である。例えば、高域成分を3デシベル〜10デシベル程度減衰させるのが音質的に好ましい調整である。
本実施の形態において、LPF1およびレベル検出器3が判定部を構成し、HP2、VCA8および加算器9が制御部を構成する。また、LPF1が第1の抽出器または低域通過フィルタに相当し、HPF2が第2の抽出器または高域通過フィルタに相当し、レベル検出器3が検出器に相当し、VCA8が減衰器に相当し、加算器9が合成器に相当する。
なお、図6の各部は、電子回路等のハードウエアにより構成されてもよく、CPU、半導体メモリ等を含むコンピュータとプログラム等のソフトウエアとにより構成されてもよい。
(第1の実施の形態)
図1は本発明の第1の実施の形態に係る音質調整装置の構成を示すブロックである。
図1の音質調整装置は、低域通過フィルタ(Low Pass Filter:以下、LPFと略記する)、高域通過フィルタ(High Pass Filter:以下HPFと略記する)2、レベル検出器3,4、反転器5、ANDゲート6、積分器7、ボリュームコントロールアンプ(Volume Control Amplifier:以下VCAと略記する)8および加算器9を備える。
LPF1は、入力された音声信号の5kHz以下の中低域成分を通過させることにより中低域成分を抽出する。HPF2は、入力された音声信号の5kHz以上の高域成分を通過させることにより高低域成分を抽出する。
レベル検出器3は、LPF1の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにHレベル(ハイレベル)の信号を出力し、検出されたレベルが所定値よりも低いときにLレベル(ローレベル)の信号を出力する。
レベル検出器4は、HPF2の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにHレベルの信号を出力し、検出されたレベルが所定値よりも低いときにLレベルの信号を出力する。
反転器5は、レベル検出器3の出力信号のレベルを反転させる。すなわち、反転器5は、レベル検出器3の出力信号がHレベルのときにLレベルの信号を出力し、レベル検出器3の出力信号がLレベルのときにHレベルの信号を出力する。
ANDゲート6は、反転器5の出力信号とレベル検出器4の出力信号との論理積を演算する。積分器7は、ANDゲート6の出力信号を積分する。
VCA8は、積分器7の出力信号がHレベルのときにHPF2の出力信号のレベルを減衰させ、積分器7の出力信号がLレベルのときにHPF2の出力信号をそのまま出力する。加算器9は、LPF1の出力信号とVCA8の出力信号とを加算により合成する。
このように構成された音質調整装置の動作を図2、図3および図4を用いて説明する。図2は図1の音質調整装置における各部の信号波形図である。
図2には、図1のLPF1およびHPF2に入力される音声信号a、HPF2の出力信号b、レベル検出器4の出力信号c、反転器5の出力信号d、積分器7の出力信号e、VCA8の出力信号fおよび加算器9の出力信号gが示される。
図3(a)は歯擦音の波形の一例を示す図であり、図3(b)は歯擦音の周波数スペクトルの一例を示す図である。図4(a)は通常発声音の波形の一例を示す図であり、図4(b)は通常発声音の周波数スペクトルの一例を示す図である。
図3(a)および図4(a)の横軸は時間を表し、縦軸は振幅を表す。図3(b)および図4(b)の横軸は周波数を表し、縦軸はレベルを表す。
通常、歯擦音は5kHzから10kHzの周波数帯域にスペクトル成分を有する。図3の歯擦音は、ランダム雑音の高域成分のみを有する波形および周波数スペクトルを示す。一方、通常発声音は、中低域成分(ホルマント成分)を有する。ここで、ホルマント成分とは、人間の声が持つ基本波およびその高調波である。図4の通常発声音は、中域基本波に高調波が重畳された波形および周波数スペクトルを示す。
本実施の形態に係る音質調整装置では、このような歯擦音および通常発声音の特徴を利用して、入力された音声信号aが歯擦音のみを含む場合には高域成分を減衰させて音声再生を行う。
テレビジョン受信機(テレビジョンセット)の音声再生において、テレビジョン放送の音声信号を検波することにより得られる音声ベースバンド信号が音声信号aとして図1のLPF1およびHPF2に入力される。
図2に示される音声信号aは、「しゃしん」の発声時系列信号である。区間t1,t3で歯擦音「し」が発声されている。この区間t1,t3では、中低域成分が存在せずかつ高域成分が存在する。区間t2,t4では、歯擦音ではない「ゃ」および「ん」が発声されている。区間t2,t4では、中低域成分および高域成分が存在する。音声信号aの中低域成分はLPF1を通過し、音声信号aの高域成分はHPF2を通過する。
図2の例では、HPF2の出力信号bにおいて、区間t1,t3で歯擦音による高域成分が存在し、区間t2,t4の中低域成分が除去される。
音声信号aの高域成分の有無を判定するために、レベル検出器4によりHPF2の出力信号bのレベルが検出される。HPF2の出力信号のレベルが所定値以上のときにレベル検出器4の出力信号cがHレベルとなり、HPF2の出力信号のレベルが所定値より低いときにはレベル検出器4の出力信号cがLレベルとなる。
図2の例では、レベル検出器4の出力信号cは、歯擦音による高域成分が存在する区間t1,t3でHレベルとなり、高域成分が存在しない区間t2,t4でLレベルとなる。本実施の形態では、歯擦音以外の高域成分も検出される。
音声信号aの中低域成分の有無を判定するために、レベル検出器3によりLPF1の出力信号のレベルが検出される。LPF1の出力信号のレベルが所定値以上のときにレベル検出器3の出力信号がHレベルとなり、LPF1の出力信号のレベルが所定値より低いときにはレベル検出器3の出力信号がLレベルとなる。レベル検出器3の出力信号は反転器5により反転される。
図2の例では、反転器5の出力信号dは、中低域成分が存在しない区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
反転器5の出力信号dはANDゲート6の一方の入力端子に与えられ、レベル検出器4の出力信号cはANDゲート6の他方の入力端子に与えられる。ANDゲート6により反転器5の出力信号dとレベル検出器4の出力信号cとの論理積演算が行われる。
この場合、中低域成分が存在せずかつ高域成分が存在するときにのみANDゲート6の出力信号がHレベルとなる。ANDゲート6の出力信号は多少のチャタリングを有する。そのため、ANDゲート6の出力信号が積分器7により積分される。
図2の例では、積分器7の出力信号eは、中低域成分が存在せずかつ高域成分が存在する区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
積分器7の出力信号eによりVCA8の利得が制御される。それにより、HPF2を通過した高域成分のレベルがVCA8により制御される。積分器7の出力信号eがHレベルのときにVCA8によりHPF2の出力信号bのレベルが減衰され、積分器7の出力信号eがLレベルのときにはVCA8によりHPF2の出力信号bがそのまま出力される。
図2の例では、VCA8の出力信号fにおいて、区間t1,t3の歯擦音による高域成分のレベルが減衰されている。
LPF1を通過した中低域成分とVCA8により減衰された高域成分とが加算器9により加算されることにより合成され、出力信号gが得られる。
図2の例では、加算器9の出力信号gにおいて、区間t1,t3の歯擦音が減衰され、区間t2,t4の通常発声音は減衰されない。
上記のように、本実施の形態に係る音質調整装置においては、高域成分が存在しかつ中低域成分が存在しない区間t1,t3の音声信号は歯擦音と判定され、VCA8により高域成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
また、中低域成分が存在する区間t2,t4の音声信号は通常発声音と判定され、VCA8による高域成分の減衰が行われない。それにより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
さらに、レベル検出器3,4を用いて中低域成分および高域成分の有無を検出しているので、歯擦音を有する区間を正確に判定することができる。
なお、VCA8による高域成分の減衰の程度は、高域成分が低下しすぎないように調整することが必要である。例えば、高域成分を3デシベル〜10デシベル程度減衰させるのが音質的に好ましい調整である。
本実施の形態において、LPF1、HPF2、レベル検出器3およびレベル検出器4が判定部を構成し、VCA8および加算器9が制御部を構成する。また、LPF1が第1の抽出器または低域通過フィルタに相当し、HPF2が第2の抽出器または高域通過フィルタに相当し、レベル検出器3が第1の検出器3に相当し、レベル検出器4が第2の検出器に相当し、ANDゲート6が論理演算器に相当し、VCA8が減衰器に相当し、加算器9が合成器に相当する。
なお、図1の各部は、電子回路等のハードウエアにより構成されてもよく、CPU(中央演算処理装置)、半導体メモリ等を含むコンピュータとプログラム等のソフトウエアとにより構成されてもよい。
(第2の実施の形態)
図5は本発明の第2の実施の形態に係る音質調整装置の構成を示すブロック図である。
図5の音質調整装置は、LPF1、HPF2、レベル検出器3、反転器5、積分器7、VCA8および加算器9を備える。
LPF1は、入力された音声信号の5kHz以下の中低域成分を通過させることにより中低域成分を抽出する。HPF2は、入力された音声信号の5kHz以上の高域成分を通過させることにより高域成分を抽出する。レベル検出器3は、LPF1の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにHレベルの信号を出力し、検出されたレベルが所定値よりも低いときにLレベルの信号を出力する。
反転器5は、レベル検出器3の出力信号のレベルを反転させる。すなわち、反転器5は、レベル検出器3の出力信号がHレベルのときにLレベルの信号を出力し、レベル検出器3の出力信号がLレベルのときにHレベルの信号を出力する。積分器7は、反転器5の出力信号を積分する。
VCA8は、積分器7の出力信号がHレベルのときにHPF2の出力信号のレベルを減衰させ、積分器7の出力信号がLレベルのときにHPF2の出力信号をそのまま出力する。加算器9は、LPF1の出力信号とVCA8の出力信号とを加算により合成する。
このように構成された音質調整装置の動作を図6を用いて説明する。図6は図5の音質調整装置における各部の信号波形図である。
図6には、図5のLPF1およびHPF2に入力される音声信号A、HPF2の出力信号B、反転器5の出力信号C、積分器7の出力信号D、VCA8の出力信号Eおよび加算器9の出力信号Fが示される。
上記のように、通常、歯擦音は5kHzから10kHzの周波数帯域にスペクトル成分を有する。図3に示したように、歯擦音は、ランダム雑音の高域成分のみを有する波形および周波数スペクトルを示す。一方、図4に示したように、通常発声音は、中低域成分(ホルマント成分)を有する。
本実施の形態に係る音質調整装置においても、このような歯擦音および通常発声音の特徴を利用して、入力された音声信号Aが歯擦音のみを含む場合には高域成分を減衰させて音声再生を行う。
テレビジョン受信機(テレビジョンセット)の音声再生において、テレビジョン放送の音声信号を検波することにより得られる音声ベースバンド信号が音声信号Aとして図5のLPF1およびHPF2に入力される。
図6に示される音声信号Aは、「しゃしん」の発声時系列信号である。区間t1,t3で歯擦音「し」が発声されている。この区間t1,t3では、中低域成分が存在せずかつ高域成分が存在する。区間t2,t4では、歯擦音ではない「ゃ」および「ん」が発声されている。区間t2,t4では、中低域成分および高域成分が存在する。音声信号Aの中低域成分はLPF1を通過し、音声信号Aの高域成分はHPF2を通過する。
図6の例では、HPF2の出力信号Bにおいて、区間t1,t3で歯擦音による高域成分が存在し、区間t2,t4の中低域成分が除去される。
音声信号Aの中低域成分の有無を判定するために、レベル検出器3によりLPF1の出力信号のレベルが検出される。LPF1の出力信号のレベルが所定値以上のときにレベル検出器3の出力信号がHレベルとなり、LPF1の出力信号のレベルが所定値より低いときにレベル検出器3の出力信号がLレベルとなる。レベル検出器3の出力信号は反転器5により反転される。
図6の例では、反転器5の出力信号Cは、中低域成分が存在しない区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
反転器5の出力信号Cは多少のチャタリングを有する。そのため、反転器5の出力信号Cが積分器7により積分される。
図6の例では、積分器7の出力信号Dは、中低域成分が存在しない区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
積分器7の出力信号DによりVCA8の利得が制御される。それにより、HPF2を通過した高域成分のレベルがVCA8により制御される。積分器7の出力信号DがHレベルのときにVCA8によりHPF2の出力信号Bのレベルが減衰され、積分器7の出力信号DがLレベルのときにVCA8によりHPF2の出力信号Dがそのまま出力される。
図6の例では、VCA8の出力信号Eにおいて、区間t1,t3の歯擦音による高域成分のレベルが減衰されている。
LPF1を通過した中低域成分とVCA8により減衰された高域成分とが加算器9により加算されることにより合成され、出力信号Fが得られる。
図6の例では、加算器9の出力信号Fにおいて、区間t1,t3の歯擦音が減衰され,区間t2,t4の通常発声音は減衰されない。
上記のように、本実施の形態に係る音質調整装置においては、中低域成分が存在しない区間t1,t3の音声信号は歯擦音と判定され、VCA8により高域成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
また、中低域成分が存在する区間t2,t4の音声信号は通常発声音と判定され、VCA8による高域成分の減衰が行われない。それにより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスがとれた聞きやすい音声が再生される。
さらに、レベル検出器3を用いて中低域成分の有無を検出することにより歯察音の有無を判定しているので、回路構成が簡略化される。
なお、VCA8による高域成分の減衰の程度は、高域成分が低下しすぎないように調整することが必要である。例えば、高域成分を3デシベル〜10デシベル程度減衰させるのが音質的に好ましい調整である。
本実施の形態において、LPF1およびレベル検出器3が判定部を構成し、HP2、VCA8および加算器9が制御部を構成する。また、LPF1が第1の抽出器または低域通過フィルタに相当し、HPF2が第2の抽出器または高域通過フィルタに相当し、レベル検出器3が検出器に相当し、VCA8が減衰器に相当し、加算器9が合成器に相当する。
なお、図6の各部は、電子回路等のハードウエアにより構成されてもよく、CPU、半導体メモリ等を含むコンピュータとプログラム等のソフトウエアとにより構成されてもよい。
本実施例では、図1の音質調整装置を用いて発声単語の音質を調整した。図7は発声単語のスペクトルの測定結果を示す図である。図8は音質調整された音声のスペクトルの測定結果を示す図である。ここでは、図1の音質調整装置により5kHz以上の高域成分を10dB減衰させた。発声単語は「写真(しゃしん)」である。
図7および図8の横軸は周波数であり、縦軸は振幅である。図8のスペクトルを図7のスペクトルと比較すると、図8のスペクトルでは、図7のスペクトルにおける5kHz以上の高域成分が減衰されていことがわかる。それにより、耳障りな歯擦音が減衰され、聞きやすい音声が再生される。
(他の変形例)
上記第1の実施の形態では、正論理のANDゲート6を用いた場合を説明したが、負論理のNANDゲートを用いて音質調整装置を容易に実現することもできる。
また、上記実施の形態では、減衰器として利得を連続的に変化させることが可能なVCAを用いているが、減衰器として利得を少なくとも2段階で切り替えることが可能な減衰器を用いてもよい。
図7および図8の横軸は周波数であり、縦軸は振幅である。図8のスペクトルを図7のスペクトルと比較すると、図8のスペクトルでは、図7のスペクトルにおける5kHz以上の高域成分が減衰されていことがわかる。それにより、耳障りな歯擦音が減衰され、聞きやすい音声が再生される。
(他の変形例)
上記第1の実施の形態では、正論理のANDゲート6を用いた場合を説明したが、負論理のNANDゲートを用いて音質調整装置を容易に実現することもできる。
また、上記実施の形態では、減衰器として利得を連続的に変化させることが可能なVCAを用いているが、減衰器として利得を少なくとも2段階で切り替えることが可能な減衰器を用いてもよい。
本発明は、再生される音声の音質を調整する音質調整装置および音質調整方法に関する。
BS(衛星)放送の開始とともに、昨今のテレビジョンシステムの音声信号は、デジタル信号の形式で送信されるようになっており、低域から高域まで広い周波数帯域、平坦な周波数特性およびノイズの少ない高品質を有する。一方、このような音声信号を再生するテレビジョンセットに搭載されているスピーカは、テレビジョンセットへ内蔵されることによるスペース上の制約、および価格上の制約から、大きさおよび形状に限界がある。それにより、テレビジョンセットのスピーカは、低域から高域まで平坦な周波数特性を有することが困難である。
そこで、再生時の音質を改善するために種々の方法が提案されている(特表2002−513479号公報)。
また、高域の周波数特性の乱れから、アナウンサの発声した言葉の「サ」、「シ」、「ス」、「セ」および「ソ」の発音が著しく強調され、耳障りな音に聞こえるという課題がある。このような音は一般的に歯擦音と言われており、「サ」、「シ」、「ス」、「セ」および「ソ」の発音をするときに、前歯に空気が当り、歯擦音になることが知られている。この歯擦音は発音の仕方等により個人差があり、気にならない程度の音声、非常に聞き取りにくい音声などさまざまである。
放送局では、聞き取りにくい音声における歯擦音を抑えるため、プロオーディオ機器としてエフェクタの一種であるディエッサと呼ばれる音質調整装置を使用している。
図9はディエッサの一例を示すブロック図である。以下、図9を参照しながらディエッサについて説明する。
図9のディエッサは、低域通過フィルタ(Low Pass Filter:以下LPFと略記する)21、バンドパスフィルタ(Band Pass Filter:以下BPFと略記する)22、高域通過フィルタ(High Pass Filter:以下HPFと略記する)23、コンプレッサ24および加算器25を備える。
LPF21は、入力された音声信号の中低域成分を通過させる。BPF22は、入力された音声信号の中高域成分のみを通過させる。HPF22は、入力された音声信号の高域成分のみを通過させる。コンプレッサ24は、BPF22から出力される音声信号のレベルを圧縮する。加算器25は、LPF21から出力される音声信号、コンプレッサ24から出力される音声信号およびHPF23から出力される音声信号を加算により合成する。
このように構成されたディエッサの動作を図10および図11を用いて説明する。図10は図9のディエッサにおけるLPF21、BPF22およびHPF23の周波数特性例を示す図である。図11は図9のディエッサにおけるコンプレッサ24の特性例を示す図である。
放送局において、アナウンサ等により発生された音声は、マイクで電気信号である音声信号に変換され、マイクアンプ装置で所定のレベルに増幅され、増幅された音声信号が放送用の音声処理機材に入力される。
アナウンサの発声における歯擦音が著しく強く、音声が聞き取りにくい場合には、マイクアンプ装置の後段に図9のディエッサが挿入されることにより、次のようにして歯擦音が低減される。
通常、歯擦音の周波数帯域は5kHzから10kHzと言われており、図9のディエッサにおけるBPF22によりこの周波数帯域の成分が抽出される。これ以外の周波数帯域の成分はLPF21およびHPF23を通過する。BPF22により抽出された周波数帯域の成分は、コンプレッサ24により圧縮される。図11に示すように、コンプレッサ24は、入力レベルがスレッシュレベルLsを超えると、出力レベルを圧縮する。
LPF21から出力される音声信号、コンプレッサ24から出力される音声信号およびHPF23から出力される音声信号が加算器25により加算される。
このようにして、ディエッサによれば、歯擦音の周波数帯域の信号レベルが減衰され、歯擦音が目立たなくされる。
また、ディエッサによっては、BPFにおける通過帯域、圧縮レベルおよびスレッシュレベルを変化させることができる。その場合、アナウンサの声質に応じた調整が可能となる。
このディエッサの技術を家庭用のテレビジョンセットに応用することにより、テレビジョンセットにおいて気になる歯擦音が低減されるものと考えられる。
しかしながら、放送局でディエッサを使用して音声を収録する場合には歯擦音の低減の効果はあるが、テレビジョン放送を受信することにより得られる音声に残る耳障りな歯擦音を低減するためにディエッサーを使用すると、BPFの通過帯域にある歯擦音だけでなく、音声と混合されるBGM(背景音楽)または効果音までもが低減され、高域成分の抜けた音質となってしまう。
本発明の目的は、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を低減することができる音質調整装置および音質調整方法を提供することである。
本発明の一局面に従う音質調整装置は、入力された音声信号における所定の第1の周波数帯域の成分の有無を判定する判定部と、判定部により第1の周波数帯域の成分がないと判定された場合に入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分を減衰させ、第2の周波数帯域が減衰された音声信号を出力し、判定部により第1の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させずに入力された音声信号を出力する制御部とを備えたものである。
その音質調整装置においては、入力された音声信号における所定の第1の周波数帯域の成分の有無が判定部により判定される。すなわち、中低域成分である第1の周波数帯域の成分が存在するか否かに基づいて音声信号が歯擦音であるか否かが判定される。
第1の周波数帯域の成分がないと判定された場合には、入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分が制御部により減衰され、第2の周波数帯域が減衰された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在しない場合には、音声信号が歯擦音であるとみなされ、第2の周波数帯域の成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
一方、第1の周波数帯域の成分があると判定された場合には、入力された音声信号における第2の周波数帯域の成分が制御部により減衰されずに入力された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在する場合には、音声信号が通常発声音であるとみなされ、第2の周波数帯域の成分が減衰されない。それより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
判定部は、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定し、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定してもよい。
この場合、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定され、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定される。それにより、音声信号が歯擦音であるか通常発声音であるかを確実に判定することができる。
判定部は、入力された音声信号における第1の周波数帯域の成分を抽出する第1の抽出器と、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かを検出する検出器とを含み、制御部は、入力された音声信号の第2の周波数帯域の成分を抽出する第2の抽出器と、第1の抽出器の出力信号のレベルが所定値以上でないことが検出器により検出された場合に第2の抽出器の出力信号のレベルを減衰させ、第1の抽出器の出力信号のレベルが所定値以上であることが検出器により検出された場合に第2の抽出器の出力信号を減衰させずに出力する減衰器と、第1の抽出器の出力信号と減衰器の出力信号とを合成する合成器とを含んでもよい。
この場合、入力された音声信号における第1の周波数帯域の成分が第1の抽出器により抽出される。また、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かが検出器により検出される。さらに、入力された音声信号の第2の周波数帯域の成分が第2の抽出器により抽出される。
第1の抽出器の出力信号のレベルが所定値以上でないことが検出器により検出された場合には、減衰器により第2の抽出器の出力信号のレベルが減衰される。第1の抽出器の出力信号のレベルが所定値以上であることが検出器により検出された場合には、第2の抽出器の出力信号が減衰器により減衰されずに出力される。第1の抽出器の出力信号と減衰器の出力信号とは合成器により合成される。それにより、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を確実に低減することができる。
判定部は、検出器の出力信号を積分する積分器をさらに含んでもよい。この場合、検出器の出力信号に生じるチャタリングの影響が除去される。
第1の抽出器は低域通過フィルタを含み、第2の抽出器は高域通過フィルタを含んでもよい。
この場合、入力された音声信号における中低域成分が低域通過フィルタを通過することにより、第1の周波数帯域の成分が抽出される。また、入力された音声信号における高域成分が高域通過フィルタを通過することにより、第2の周波数帯域の成分が抽出される。
判定部は、第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無を判定し、制御部は、判定部により第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させてもよい。
この場合、判定部により第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無が判定される。第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に、入力された音声信号における第2の周波数帯域の成分が制御部により減衰される。それにより、歯擦音を正確かつ確実に減衰させることができる。
判定部は、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定し、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定し、入力された音声信号における第2の周波数帯域の成分のレベルが所定値以上の場合に第2の周波数帯域の成分があると判定し、入力された音声信号における第2の周波数帯域の成分のレベルが所定値よりも低い場合に第2の周波数帯域の成分がないと判定してもよい。
この場合、入力された音声信号における第1の周波数帯域の成分のレベルが所定値以上の場合に第1の周波数帯域の成分があると判定され、入力された音声信号における第1の周波数帯域の成分のレベルが所定値よりも低い場合に第1の周波数帯域の成分がないと判定される。また、入力された音声信号における第2の周波数帯域の成分のレベルが所定値以上の場合に第2の周波数帯域の成分があると判定され、入力された音声信号における第2の周波数帯域の成分のレベルが所定値よりも低い場合に第2の周波数帯域の成分がないと判定される。それにより、音声信号が歯擦音であるか通常発声音であるかを確実に判定することができる。
判定部は、入力された音声信号における第1の周波数帯域の成分を抽出する第1の抽出器と、入力された音声信号における第2の周波数帯域の成分を抽出する第2の抽出器と、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第1の検出器と、第2の周波数帯域の成分の有無を判定するために第2の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第2の検出器とを含み、制御部は、第1の抽出器の出力信号のレベルが所定値以上でないことが第1の検出器により検出されかつ第2の抽出器の出力信号のレベルが所定値以上であることが第2の検出器により検出された場合に第2の抽出器の出力信号のレベルを減衰させ、第1の抽出器の出力信号のレベルが所定値以上であることが第1の検出器により検出されまたは第2の抽出器の出力信号のレベルが所定値以上でないことが第2の検出器により検出された場合に第2の抽出器の出力信号を減衰させずに出力する減衰器と、第1の抽出器の出力信号と減衰器の出力信号とを合成する合成器とを含んでもよい。
この場合、入力された音声信号における第1の周波数帯域の成分が第1の抽出器により抽出される。また、入力された音声信号の第2の周波数帯域の成分が第2の抽出器により抽出される。さらに、第1の周波数帯域の成分の有無を判定するために第1の抽出器の出力信号のレベルが所定値以上であるか否かが第1の検出器により検出される。また、第2の周波数帯域の成分の有無を判定するために第2の抽出器の出力信号のレベルが所定値以上であるか否かが第2の検出器により検出される。
第1の抽出器の出力信号のレベルが所定値以上でないことが第1の検出器により検出されかつ第2の抽出器の出力信号のレベルが所定値以上であることが第2の検出器により検出された場合には、第2の抽出器の出力信号のレベルが減衰器により減衰される。第1の抽出器の出力信号のレベルが所定値以上であることが第1の検出器により検出されまたは第2の抽出器の出力信号のレベルが所定値以上でないことが第2の検出器により検出された場合には、第2の抽出器の出力信号が減衰器により減衰されずに出力される。第1の抽出器の出力信号と減衰器の出力信号とは合成器により合成される。それにより、再生される音声信号の高域成分の音質劣化が生じることなく歯擦音を確実に低減することができる。
判定部は、第1の検出器の出力信号を反転する反転器と、反転器の出力信号および第2の検出器の出力信号の論理積を算出する論理演算器とをさらに含んでもよく、減衰器は、論理演算器の出力信号に基づいて第2の抽出器の出力信号のレベルを減衰させるかまたは減衰させない。
この場合、第1の検出器の出力信号が反転器により反転され、反転器の出力信号および第2の検出器の出力信号の論理積が論理演算器により算出される。さらに、論理演算器の出力信号に基づいて第2の抽出器の出力信号のレベルが減衰器により減衰されるかまたは減衰されない。それにより、音声信号が歯擦音であると判定された場合に高域成分を確実に減衰させることができるとともに、音声信号が通常発声音であると判定された場合に高域成分の減衰を確実に停止することができる。
判定部は、論理演算器の出力信号を積分する積分器をさらに含んでもよい。この場合、論理演算器の出力信号に生じるチャタリングの影響が除去される。
第1の抽出器は低域通過フィルタを含み、第2の抽出器は高域通過フィルタを含んでもよい。
この場合、入力された音声信号における中低域成分が低域通過フィルタを通過することにより、第1の周波数帯域の成分が抽出される。また、入力された音声信号における高域成分が高域通過フィルタを通過することにより、第2の周波数帯域の成分が抽出される。
第1の周波数帯域は、5kHz以下の周波数帯域であり、第2の周波数帯域は、5kHz以上の周波数帯域であってもよい。
歯擦音は、5kHzから10kHzの周波数帯域にスペクトル成分をを有する。したがって、高域成分の音質劣化を防止しつつ歯擦音を確実に減衰させることができる。その結果、バランスのとれた聞きやすい音声を再生することができる。
本発明の他の局面に従う音質調整方法は、入力された音声信号における所定の周波数以下の第1の周波数帯域の成分の有無を判定するステップと、第1の周波数帯域の成分がないと判定された場合に入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分を減衰させ、第2の周波数帯域が減衰された音声信号を出力し、第1の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させずに入力された音声信号を出力するステップとを備えたものである。
その音声調整方法においては、入力された音声信号における所定の第1の周波数帯域の成分の有無が判定される。すなわち、中低域成分である第1の周波数帯域の成分が存在するか否かに基づいて音声信号が歯擦音であるか否かが判定される。
第1の周波数帯域の成分がないと判定された場合には、入力された音声信号における第1の周波数帯域以上の第2の周波数帯域の成分が減衰され、第2の周波数帯域が減衰された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在しない場合には、音声信号が歯擦音であるとみなされ、第2の周波数帯域の成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
一方、第1の周波数帯域の成分があると判定された場合には、入力された音声信号における第2の周波数帯域の成分が減衰されずに入力された音声信号が出力される。すなわち、中低域成分である第1の周波数帯域の成分が存在する場合には、音声信号が通常発声音であるとみなされ、第2の周波数帯域の成分が減衰されない。それより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
判定するステップは、第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無を判定するステップを含み、出力するステップは、第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に入力された音声信号における第2の周波数帯域の成分を減衰させるステップを含んでもよい。
この場合、第1の周波数帯域の成分の有無とともに入力された音声信号における第2の周波数帯域の成分の有無が判定される。第1の周波数帯域の成分がなくかつ第2の周波数帯域の成分があると判定された場合に、入力された音声信号における第2の周波数帯域の成分が減衰される。それにより、歯擦音を正確かつ確実に減衰させることができる。
第1の周波数帯域は、5kHz以下の周波数帯域であり、第2の周波数帯域は、5kHz以上の周波数帯域であってもよい。
歯擦音は、5kHzから10kHzの周波数帯域にスペクトル成分を有する。したがって、高域成分の音質劣化を防止しつつ歯擦音を確実に減衰させることができる。その結果、バランスのとれた聞きやすい音声を再生することができる。
以下、本発明の実施の形態について図面を参照しながら説明する。
(第1の実施の形態)
図1は本発明の第1の実施の形態に係る音質調整装置の構成を示すブロックである。
図1は本発明の第1の実施の形態に係る音質調整装置の構成を示すブロックである。
図1の音質調整装置は、低域通過フィルタ(Low Pass Filter:以下、LPFと略記する)1、高域通過フィルタ(High Pass Filter:以下HPFと略記する)2、レベル検出器3,4、反転器5、ANDゲート6、積分器7、ボリュームコントロールアンプ(Volume Control Amplifier:以下VCAと略記する)8および加算器9を備える。
LPF1は、入力された音声信号の5kHz以下の中低域成分を通過させることにより中低域成分を抽出する。HPF2は、入力された音声信号の5kHz以上の高域成分を通過させることにより高域成分を抽出する。
レベル検出器3は、LPF1の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにHレベル(ハイレベル)の信号を出力し、検出されたレベルが所定値よりも低いときにLレベル(ローレベル)の信号を出力する。
レベル検出器4は、HPF2の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにHレベルの信号を出力し、検出されたレベルが所定値よりも低いときにLレベルの信号を出力する。
反転器5は、レベル検出器3の出力信号のレベルを反転させる。すなわち、反転器5は、レベル検出器3の出力信号がHレベルのときにLレベルの信号を出力し、レベル検出器3の出力信号がLレベルのときにHレベルの信号を出力する。
ANDゲート6は、反転器5の出力信号とレベル検出器4の出力信号との論理積を演算する。積分器7は、ANDゲート6の出力信号を積分する。
VCA8は、積分器7の出力信号がHレベルのときにHPF2の出力信号のレベルを減衰させ、積分器7の出力信号がLレベルのときにHPF2の出力信号をそのまま出力する。加算器9は、LPF1の出力信号とVCA8の出力信号とを加算により合成する。
このように構成された音質調整装置の動作を図2、図3および図4を用いて説明する。図2は図1の音質調整装置における各部の信号波形図である。
図2には、図1のLPF1およびHPF2に入力される音声信号a、HPF2の出力信号b、レベル検出器4の出力信号c、反転器5の出力信号d、積分器7の出力信号e、VCA8の出力信号fおよび加算器9の出力信号gが示される。
図3(a)は歯擦音の波形の一例を示す図であり、図3(b)は歯擦音の周波数スペクトルの一例を示す図である。図4(a)は通常発声音の波形の一例を示す図であり、図4(b)は通常発声音の周波数スペクトルの一例を示す図である。
図3(a)および図4(a)の横軸は時間を表し、縦軸は振幅を表す。図3(b)および図4(b)の横軸は周波数を表し、縦軸はレベルを表す。
通常、歯擦音は5kHzから10kHzの周波数帯域にスペクトル成分を有する。図3の歯擦音は、ランダム雑音の高域成分のみを有する波形および周波数スペクトルを示す。一方、通常発声音は、中低域成分(ホルマント成分)を有する。ここで、ホルマント成分とは、人間の声が持つ基本波およびその高調波である。図4の通常発声音は、中域基本波に高調波が重畳された波形および周波数スペクトルを示す。
本実施の形態に係る音質調整装置では、このような歯擦音および通常発声音の特徴を利用して、入力された音声信号aが歯擦音のみを含む場合には高域成分を減衰させて音声再生を行う。
テレビジョン受信機(テレビジョンセット)の音声再生において、テレビジョン放送の音声信号を検波することにより得られる音声ベースバンド信号が音声信号aとして図1のLPF1およびHPF2に入力される。
図2に示される音声信号aは、「しゃしん」の発声時系列信号である。区間t1,t3で歯擦音「し」が発声されている。この区間t1,t3では、中低域成分が存在せずかつ高域成分が存在する。区間t2,t4では、歯擦音ではない「ゃ」および「ん」が発声されている。区間t2,t4では、中低域成分および高域成分が存在する。音声信号aの中低域成分はLPF1を通過し、音声信号aの高域成分はHPF2を通過する。
図2の例では、HPF2の出力信号bにおいて、区間t1,t3で歯擦音による高域成分が存在し、区間t2,t4の中低域成分が除去される。
音声信号aの高域成分の有無を判定するために、レベル検出器4によりHPF2の出力信号bのレベルが検出される。HPF2の出力信号のレベルが所定値以上のときにレベル検出器4の出力信号cがHレベルとなり、HPF2の出力信号のレベルが所定値より低いときにはレベル検出器4の出力信号cがLレベルとなる。
図2の例では、レベル検出器4の出力信号cは、歯擦音による高域成分が存在する区間t1,t3でHレベルとなり、高域成分が存在しない区間t2,t4でLレベルとなる。本実施の形態では、歯擦音以外の高域成分も検出される。
音声信号aの中低域成分の有無を判定するために、レベル検出器3によりLPF1の出力信号のレベルが検出される。LPF1の出力信号のレベルが所定値以上のときにレベル検出器3の出力信号がHレベルとなり、LPF1の出力信号のレベルが所定値より低いときにはレベル検出器3の出力信号がLレベルとなる。レベル検出器3の出力信号は反転器5により反転される。
図2の例では、反転器5の出力信号dは、中低域成分が存在しない区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
反転器5の出力信号dはANDゲート6の一方の入力端子に与えられ、レベル検出器4の出力信号cはANDゲート6の他方の入力端子に与えられる。ANDゲート6により反転器5の出力信号dとレベル検出器4の出力信号cとの論理積演算が行われる。
この場合、中低域成分が存在せずかつ高域成分が存在するときにのみANDゲート6の出力信号がHレベルとなる。ANDゲート6の出力信号は多少のチャタリングを有する。そのため、ANDゲート6の出力信号が積分器7により積分される。
図2の例では、積分器7の出力信号eは、中低域成分が存在せずかつ高域成分が存在する区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
積分器7の出力信号eによりVCA8の利得が制御される。それにより、HPF2を通過した高域成分のレベルがVCA8により制御される。積分器7の出力信号eがHレベルのときにVCA8によりHPF2の出力信号bのレベルが減衰され、積分器7の出力信号eがLレベルのときにはVCA8によりHPF2の出力信号bがそのまま出力される。
図2の例では、VCA8の出力信号fにおいて、区間t1,t3の歯擦音による高域成分のレベルが減衰されている。
LPF1を通過した中低域成分とVCA8により減衰された高域成分とが加算器9により加算されることにより合成され、出力信号gが得られる。
図2の例では、加算器9の出力信号gにおいて、区間t1,t3の歯擦音が減衰され、区間t2,t4の通常発声音は減衰されない。
上記のように、本実施の形態に係る音質調整装置においては、高域成分が存在しかつ中低域成分が存在しない区間t1,t3の音声信号は歯擦音と判定され、VCA8により高域成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
また、中低域成分が存在する区間t2,t4の音声信号は通常発声音と判定され、VCA8による高域成分の減衰が行われない。それにより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスのとれた聞きやすい音声が再生される。
さらに、レベル検出器3,4を用いて中低域成分および高域成分の有無を検出しているので、歯擦音を有する区間を正確に判定することができる。
なお、VCA8による高域成分の減衰の程度は、高域成分が低下しすぎないように調整することが必要である。例えば、高域成分を3デシベル〜10デシベル程度減衰させるのが音質的に好ましい調整である。
本実施の形態において、LPF1、HPF2、レベル検出器3およびレベル検出器4が判定部を構成し、VCA8および加算器9が制御部を構成する。また、LPF1が第1の抽出器または低域通過フィルタに相当し、HPF2が第2の抽出器または高域通過フィルタに相当し、レベル検出器3が第1の検出器3に相当し、レベル検出器4が第2の検出器に相当し、ANDゲート6が論理演算器に相当し、VCA8が減衰器に相当し、加算器9が合成器に相当する。
なお、図1の各部は、電子回路等のハードウエアにより構成されてもよく、CPU(中央演算処理装置)、半導体メモリ等を含むコンピュータとプログラム等のソフトウエアとにより構成されてもよい。
(第2の実施の形態)
図5は本発明の第2の実施の形態に係る音質調整装置の構成を示すブロック図である。
図5は本発明の第2の実施の形態に係る音質調整装置の構成を示すブロック図である。
図5の音質調整装置は、LPF1、HPF2、レベル検出器3、反転器5、積分器7、VCA8および加算器9を備える。
LPF1は、入力された音声信号の5kHz以下の中低域成分を通過させることにより中低域成分を抽出する。HPF2は、入力された音声信号の5kHz以上の高域成分を通過させることにより高域成分を抽出する。レベル検出器3は、LPF1の出力信号のレベルを検出し、検出されたレベルが所定値以上のときにHレベルの信号を出力し、検出されたレベルが所定値よりも低いときにLレベルの信号を出力する。
反転器5は、レベル検出器3の出力信号のレベルを反転させる。すなわち、反転器5は、レベル検出器3の出力信号がHレベルのときにLレベルの信号を出力し、レベル検出器3の出力信号がLレベルのときにHレベルの信号を出力する。積分器7は、反転器5の出力信号を積分する。
VCA8は、積分器7の出力信号がHレベルのときにHPF2の出力信号のレベルを減衰させ、積分器7の出力信号がLレベルのときにHPF2の出力信号をそのまま出力する。加算器9は、LPF1の出力信号とVCA8の出力信号とを加算により合成する。
このように構成された音質調整装置の動作を図6を用いて説明する。図6は図5の音質調整装置における各部の信号波形図である。
図6には、図5のLPF1およびHPF2に入力される音声信号A、HPF2の出力信号B、反転器5の出力信号C、積分器7の出力信号D、VCA8の出力信号Eおよび加算器9の出力信号Fが示される。
上記のように、通常、歯擦音は5kHzから10kHzの周波数帯域にスペクトル成分を有する。図3に示したように、歯擦音は、ランダム雑音の高域成分のみを有する波形および周波数スペクトルを示す。一方、図4に示したように、通常発声音は、中低域成分(ホルマント成分)を有する。
本実施の形態に係る音質調整装置においても、このような歯擦音および通常発声音の特徴を利用して、入力された音声信号Aが歯擦音のみを含む場合には高域成分を減衰させて音声再生を行う。
テレビジョン受信機(テレビジョンセット)の音声再生において、テレビジョン放送の音声信号を検波することにより得られる音声ベースバンド信号が音声信号Aとして図5のLPF1およびHPF2に入力される。
図6に示される音声信号Aは、「しゃしん」の発声時系列信号である。区間t1,t3で歯擦音「し」が発声されている。この区間t1,t3では、中低域成分が存在せずかつ高域成分が存在する。区間t2,t4では、歯擦音ではない「ゃ」および「ん」が発声されている。区間t2,t4では、中低域成分および高域成分が存在する。音声信号Aの中低域成分はLPF1を通過し、音声信号Aの高域成分はHPF2を通過する。
図6の例では、HPF2の出力信号Bにおいて、区間t1,t3で歯擦音による高域成分が存在し、区間t2,t4の中低域成分が除去される。
音声信号Aの中低域成分の有無を判定するために、レベル検出器3によりLPF1の出力信号のレベルが検出される。LPF1の出力信号のレベルが所定値以上のときにレベル検出器3の出力信号がHレベルとなり、LPF1の出力信号のレベルが所定値より低いときにレベル検出器3の出力信号がLレベルとなる。レベル検出器3の出力信号は反転器5により反転される。
図6の例では、反転器5の出力信号Cは、中低域成分が存在しない区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
反転器5の出力信号Cは多少のチャタリングを有する。そのため、反転器5の出力信号Cが積分器7により積分される。
図6の例では、積分器7の出力信号Dは、中低域成分が存在しない区間t1,t3でHレベルとなり、中低域成分が存在する区間t2,t4でLレベルとなる。
積分器7の出力信号DによりVCA8の利得が制御される。それにより、HPF2を通過した高域成分のレベルがVCA8により制御される。積分器7の出力信号DがHレベルのときにVCA8によりHPF2の出力信号Bのレベルが減衰され、積分器7の出力信号DがLレベルのときにVCA8によりHPF2の出力信号Bがそのまま出力される。
図6の例では、VCA8の出力信号Eにおいて、区間t1,t3の歯擦音による高域成分のレベルが減衰されている。
LPF1を通過した中低域成分とVCA8により減衰された高域成分とが加算器9により加算されることにより合成され、出力信号Fが得られる。
図6の例では、加算器9の出力信号Fにおいて、区間t1,t3の歯擦音が減衰され,区間t2,t4の通常発声音は減衰されない。
上記のように、本実施の形態に係る音質調整装置においては、中低域成分が存在しない区間t1,t3の音声信号は歯擦音と判定され、VCA8により高域成分が減衰される。それにより、耳障りな歯擦音が低減され、聞きやすい音声が再生される。
また、中低域成分が存在する区間t2,t4の音声信号は通常発声音と判定され、VCA8による高域成分の減衰が行われない。それにより、高域成分の音質劣化が防止される。この場合、中低域成分および高域成分が出力されることにより、バランスがとれた聞きやすい音声が再生される。
さらに、レベル検出器3を用いて中低域成分の有無を検出することにより歯察音の有無を判定しているので、回路構成が簡略化される。
なお、VCA8による高域成分の減衰の程度は、高域成分が低下しすぎないように調整することが必要である。例えば、高域成分を3デシベル〜10デシベル程度減衰させるのが音質的に好ましい調整である。
本実施の形態において、LPF1およびレベル検出器3が判定部を構成し、HP2、VCA8および加算器9が制御部を構成する。また、LPF1が第1の抽出器または低域通過フィルタに相当し、HPF2が第2の抽出器または高域通過フィルタに相当し、レベル検出器3が検出器に相当し、VCA8が減衰器に相当し、加算器9が合成器に相当する。
なお、図6の各部は、電子回路等のハードウエアにより構成されてもよく、CPU、半導体メモリ等を含むコンピュータとプログラム等のソフトウエアとにより構成されてもよい。
(実施例)
本実施例では、図1の音質調整装置を用いて発声単語の音質を調整した。図7は発声単語のスペクトルの測定結果を示す図である。図8は音質調整された音声のスペクトルの測定結果を示す図である。ここでは、図1の音質調整装置により5kHz以上の高域成分を10dB減衰させた。発声単語は「写真(しゃしん)」である。
本実施例では、図1の音質調整装置を用いて発声単語の音質を調整した。図7は発声単語のスペクトルの測定結果を示す図である。図8は音質調整された音声のスペクトルの測定結果を示す図である。ここでは、図1の音質調整装置により5kHz以上の高域成分を10dB減衰させた。発声単語は「写真(しゃしん)」である。
図7および図8の横軸は周波数であり、縦軸は振幅である。図8のスペクトルを図7のスペクトルと比較すると、図8のスペクトルでは、図7のスペクトルにおける5kHz以上の高域成分が減衰されていことがわかる。それにより、耳障りな歯擦音が減衰され、聞きやすい音声が再生される。
(他の変形例)
上記第1の実施の形態では、正論理のANDゲート6を用いた場合を説明したが、負論理のNANDゲートを用いて音質調整装置を容易に実現することもできる。
上記第1の実施の形態では、正論理のANDゲート6を用いた場合を説明したが、負論理のNANDゲートを用いて音質調整装置を容易に実現することもできる。
また、上記実施の形態では、減衰器として利得を連続的に変化させることが可能なVCAを用いているが、減衰器として利得を少なくとも2段階で切り替えることが可能な減衰器を用いてもよい。
Claims (15)
- 入力された音声信号における所定の第1の周波数帯域の成分の有無を判定する判定部と、
前記判定部により前記第1の周波数帯域の成分がないと判定された場合に前記入力された音声信号における前記第1の周波数帯域以上の第2の周波数帯域の成分を減衰させ、第2の周波数帯域が減衰された音声信号を出力し、前記判定部により前記第1の周波数帯域の成分があると判定された場合に前記入力された音声信号における前記第2の周波数帯域の成分を減衰させずに前記入力された音声信号を出力する制御部とを備えた、音質調整装置。 - 前記判定部は、
前記入力された音声信号における前記第1の周波数帯域の成分のレベルが所定値以上の場合に前記第1の周波数帯域の成分があると判定し、前記入力された音声信号における前記第1の周波数帯域の成分のレベルが前記所定値よりも低い場合に前記第1の周波数帯域の成分がないと判定する、請求項1記載の音質調整装置。 - 前記判定部は、
前記入力された音声信号における前記第1の周波数帯域の成分を抽出する第1の抽出器と、
前記第1の周波数帯域の成分の有無を判定するために前記第1の抽出器の出力信号のレベルが所定値以上であるか否かを検出する検出器とを含み、
前記制御部は、
前記入力された音声信号の前記第2の周波数帯域の成分を抽出する第2の抽出器と、
前記第1の抽出器の出力信号のレベルが所定値以上でないことが前記検出器により検出された場合に前記第2の抽出器の出力信号のレベルを減衰させ、前記第1の抽出器の出力信号のレベルが所定値以上であることが前記検出器により検出された場合に前記第2の抽出器の出力信号を減衰させずに出力する減衰器と、
前記第1の抽出器の出力信号と前記減衰器の出力信号とを合成する合成器とを含む、請求項1記載の音質調整装置。 - 前記判定部は、
前記検出器の出力信号を積分する積分器をさらに含む、請求項3記載の音質調整装置。 - 前記第1の抽出器は低域通過フィルタを含み、
前記第2の抽出器は高域通過フィルタを含む、請求項3記載の音質調整装置。 - 前記判定部は、前記第1の周波数帯域の成分の有無とともに前記入力された音声信号における前記第2の周波数帯域の成分の有無を判定し、
前記制御部は、前記判定部により前記第1の周波数帯域の成分がなくかつ前記第2の周波数帯域の成分があると判定された場合に前記入力された音声信号における前記第2の周波数帯域の成分を減衰させる、請求項1記載の音質調整装置。 - 前記判定部は、
前記入力された音声信号における前記第1の周波数帯域の成分のレベルが所定値以上の場合に前記第1の周波数帯域の成分があると判定し、前記入力された音声信号における前記第1の周波数帯域の成分のレベルが前記所定値よりも低い場合に前記第1の周波数帯域の成分がないと判定し、
前記入力された音声信号における前記第2の周波数帯域の成分のレベルが所定値以上の場合に前記第2の周波数帯域の成分があると判定し、前記入力された音声信号における前記第2の周波数帯域の成分のレベルが前記所定値よりも低い場合に前記第2の周波数帯域の成分がないと判定する、請求項6記載の音質調整装置。 - 前記判定部は、
前記入力された音声信号における前記第1の周波数帯域の成分を抽出する第1の抽出器と、
前記入力された音声信号における前記第2の周波数帯域の成分を抽出する第2の抽出器と、
前記第1の周波数帯域の成分の有無を判定するために前記第1の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第1の検出器と、
前記第2の周波数帯域の成分の有無を判定するために前記第2の抽出器の出力信号のレベルが所定値以上であるか否かを検出する第2の検出器とを含み、
前記制御部は、
前記第1の抽出器の出力信号のレベルが所定値以上でないことが前記第1の検出器により検出されかつ前記第2の抽出器の出力信号のレベルが所定値以上であることが前記第2の検出器により検出された場合に前記第2の抽出器の出力信号のレベルを減衰させ、前記第1の抽出器の出力信号のレベルが所定値以上であることが前記第1の検出器により検出されまたは前記第2の抽出器の出力信号のレベルが所定値以上でないことが前記第2の検出器により検出された場合に前記第2の抽出器の出力信号を減衰させずに出力する減衰器と、
前記第1の抽出器の出力信号と前記減衰器の出力信号とを合成する合成器とを含む、請求項6記載の音質調整装置。 - 前記判定部は、
前記第1の検出器の出力信号を反転する反転器と、
前記反転器の出力信号および前記第2の検出器の出力信号の論理積を算出する論理演算器とをさらに含み、
前記減衰器は、前記論理演算器の出力信号に基づいて前記第2の抽出器の出力信号のレベルを減衰させるかまたは減衰させない、請求項8記載の音質調整装置。 - 前記判定部は、
前記論理演算器の出力信号を積分する積分器をさらに含む、請求項9記載の音質調整装置。 - 前記第1の抽出器は低域通過フィルタを含み、
前記第2の抽出器は高域通過フィルタを含む、請求項8記載の音質調整装置。 - 前記第1の周波数帯域は、5kHz以下の周波数帯域であり、
前記第1の周波数帯域は、5kHz以上の周波数帯域である、請求項1記載の音質調整装置。 - 入力された音声信号における所定の周波数以下の第1の周波数帯域の成分の有無を判定するステップと、
前記第1の周波数帯域の成分がないと判定された場合に前記入力された音声信号における所定の周波数よりも高い第2の周波数帯域の成分を減衰させ、第2の周波数帯域が減衰された音声信号を出力し、前記第1の周波数帯域の成分があると判定された場合に前記入力された音声信号における前記第2の周波数帯域の成分を減衰させずに前記入力された音声信号を出力するステップとを備えた、音質調整方法。 - 前記判定するステップは、前記第1の周波数帯域の成分の有無とともに前記入力された音声信号における前記第2の周波数帯域の成分の有無を判定するステップを含み、
前記出力するステップは、前記第1の周波数帯域の成分がなくかつ前記第2の周波数帯域の成分があると判定された場合に前記入力された音声信号における前記第2の周波数帯域の成分を減衰させるステップを含む、請求項13記載の音質調整方法。 - 前記第1の周波数帯域は、5kHz以下の周波数帯域であり、
前記第1の周波数帯域は、5kHz以上の周波数帯域である、請求項13記載の音質調整方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003160264 | 2003-06-05 | ||
JP2003160264 | 2003-06-05 | ||
PCT/JP2004/008161 WO2004109661A1 (ja) | 2003-06-05 | 2004-06-04 | 音質調整装置および音質調整方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2004109661A1 true JPWO2004109661A1 (ja) | 2006-07-20 |
Family
ID=33508570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005506842A Withdrawn JPWO2004109661A1 (ja) | 2003-06-05 | 2004-06-04 | 音質調整装置および音質調整方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20060239472A1 (ja) |
JP (1) | JPWO2004109661A1 (ja) |
KR (1) | KR100709848B1 (ja) |
CN (1) | CN1802696A (ja) |
WO (1) | WO2004109661A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1889172A (zh) * | 2005-06-28 | 2007-01-03 | 松下电器产业株式会社 | 可增加和修正声音类别的声音分类系统及方法 |
JP4937055B2 (ja) * | 2007-09-18 | 2012-05-23 | オンセミコンダクター・トレーディング・リミテッド | 音質調整回路 |
KR100919621B1 (ko) * | 2009-01-23 | 2009-10-01 | 예흥정보통신 주식회사 | 스피치 이펙터 방송장치 |
KR100907578B1 (ko) * | 2009-01-23 | 2009-07-14 | 이승철 | 스피치 출력제어 스피커 |
JP5547414B2 (ja) * | 2009-03-09 | 2014-07-16 | 八幡電気産業株式会社 | 音声信号調整装置及びその調整方法 |
EP2689419B1 (en) * | 2011-03-21 | 2015-03-04 | Telefonaktiebolaget L M Ericsson (PUBL) | Method and arrangement for damping dominant frequencies in an audio signal |
JP2013038713A (ja) * | 2011-08-10 | 2013-02-21 | Semiconductor Components Industries Llc | 音声信号処理回路 |
CN104036788B (zh) * | 2014-05-29 | 2016-10-05 | 北京音之邦文化科技有限公司 | 音频文件的音质识别方法及装置 |
WO2016089745A1 (en) * | 2014-12-05 | 2016-06-09 | Knowles Electronics, Llc | Apparatus and method for digital signal processing with microphones |
US9401158B1 (en) | 2015-09-14 | 2016-07-26 | Knowles Electronics, Llc | Microphone signal fusion |
US9830930B2 (en) | 2015-12-30 | 2017-11-28 | Knowles Electronics, Llc | Voice-enhanced awareness mode |
US9779716B2 (en) | 2015-12-30 | 2017-10-03 | Knowles Electronics, Llc | Occlusion reduction and active noise reduction based on seal quality |
US9812149B2 (en) | 2016-01-28 | 2017-11-07 | Knowles Electronics, Llc | Methods and systems for providing consistency in noise reduction during speech and non-speech periods |
US10867620B2 (en) | 2016-06-22 | 2020-12-15 | Dolby Laboratories Licensing Corporation | Sibilance detection and mitigation |
US10795638B2 (en) * | 2018-10-19 | 2020-10-06 | Bose Corporation | Conversation assistance audio device personalization |
US20220383889A1 (en) * | 2019-07-17 | 2022-12-01 | Dolby Laboratories Licensing Corporation | Adapting sibilance detection based on detecting specific sounds in an audio signal |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4811608A (en) * | 1985-12-18 | 1989-03-14 | Spatial Systems Pty Limited | Force and torque converter |
US4771472A (en) * | 1987-04-14 | 1988-09-13 | Hughes Aircraft Company | Method and apparatus for improving voice intelligibility in high noise environments |
JPS6420798A (en) * | 1987-07-16 | 1989-01-24 | Matsushita Electric Ind Co Ltd | Sound collector |
JPH0363697A (ja) * | 1989-08-02 | 1991-03-19 | Sumitomo Electric Ind Ltd | 音声合成装置 |
US5050217A (en) * | 1990-02-16 | 1991-09-17 | Akg Acoustics, Inc. | Dynamic noise reduction and spectral restoration system |
US5369711A (en) * | 1990-08-31 | 1994-11-29 | Bellsouth Corporation | Automatic gain control for a headset |
US5371803A (en) * | 1990-08-31 | 1994-12-06 | Bellsouth Corporation | Tone reduction circuit for headsets |
US5550925A (en) * | 1991-01-07 | 1996-08-27 | Canon Kabushiki Kaisha | Sound processing device |
JP2942034B2 (ja) * | 1991-01-07 | 1999-08-30 | キヤノン株式会社 | 音声処理装置 |
JPH05191896A (ja) * | 1992-01-13 | 1993-07-30 | Pioneer Electron Corp | 擬似ステレオ装置 |
JP3086539B2 (ja) * | 1992-07-13 | 2000-09-11 | 三洋電機株式会社 | 収音装置における風雑音抑圧回路 |
US5574791A (en) * | 1994-06-15 | 1996-11-12 | Akg Acoustics, Incorporated | Combined de-esser and high-frequency enhancer using single pair of level detectors |
US5422602A (en) * | 1994-06-20 | 1995-06-06 | Aphex Systems, Ltd. | Frequency discriminate leveler |
US6885752B1 (en) * | 1994-07-08 | 2005-04-26 | Brigham Young University | Hearing aid device incorporating signal processing techniques |
US5500902A (en) * | 1994-07-08 | 1996-03-19 | Stockham, Jr.; Thomas G. | Hearing aid device incorporating signal processing techniques |
JPH10124089A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法 |
FR2765715B1 (fr) * | 1997-07-04 | 1999-09-17 | Sextant Avionique | Procede de recherche d'un modele de bruit dans des signaux sonores bruites |
JP3810257B2 (ja) * | 2000-06-30 | 2006-08-16 | 松下電器産業株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
-
2004
- 2004-06-04 KR KR1020057023101A patent/KR100709848B1/ko not_active IP Right Cessation
- 2004-06-04 WO PCT/JP2004/008161 patent/WO2004109661A1/ja active Application Filing
- 2004-06-04 US US10/558,704 patent/US20060239472A1/en not_active Abandoned
- 2004-06-04 JP JP2005506842A patent/JPWO2004109661A1/ja not_active Withdrawn
- 2004-06-04 CN CNA2004800155952A patent/CN1802696A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20060016103A (ko) | 2006-02-21 |
CN1802696A (zh) | 2006-07-12 |
US20060239472A1 (en) | 2006-10-26 |
WO2004109661A1 (ja) | 2004-12-16 |
KR100709848B1 (ko) | 2007-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2407142C2 (ru) | Система и способ обработки аудиосигнала для представления в среде с высоким уровнем шума | |
JP5236006B2 (ja) | 音声信号調整装置及び音声信号調整方法 | |
KR100709848B1 (ko) | 음질 조정 장치 및 음질 조정 방법 | |
US8005246B2 (en) | Hearing aid apparatus | |
JP4827675B2 (ja) | 低周波帯域音声復元装置、音声信号処理装置および録音機器 | |
JP4986182B2 (ja) | 電子機器用音響処理システム、方法及び携帯電話端末 | |
KR20070050930A (ko) | 고 잡음 환경에서의 음향 표현을 위한 오디오 신호 처리시스템 및 방법 | |
US20120128178A1 (en) | Sound reproducing apparatus, sound reproducing method, and program | |
JP2012151767A (ja) | オーディオ信号処理装置およびオーディオアンプ | |
JP4886881B2 (ja) | 音響補正装置、音響出力装置、及び音響補正方法 | |
JP5460503B2 (ja) | 信号処理装置、半導体チップ、信号処理システム、及び信号処理方法 | |
JP2021536597A (ja) | メディア補償パススルーデバイスにおける動的環境オーバレイ不安定性の検出と抑制 | |
JP2009296298A (ja) | 音声信号処理装置および方法 | |
CN111052601B (zh) | 用于减小扬声器中的音频失真的方法和装置 | |
US9712127B2 (en) | Intelligent method and apparatus for spectral expansion of an input signal | |
JP2009296297A (ja) | 音声信号処理装置および方法 | |
JPH08214391A (ja) | 骨導気導複合型イヤーマイクロホン装置 | |
JP5058844B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
JPH06289898A (ja) | 音声信号処理装置 | |
JPH08223677A (ja) | 送話器 | |
JPH11145857A (ja) | 雑音低減装置 | |
JPH05175772A (ja) | 音響再生装置 | |
JP2009193031A (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
JP4803193B2 (ja) | オーディオ信号の利得制御装置および利得制御方法 | |
JPH03237899A (ja) | ハウリング抑制装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20080526 |