JP3596580B2 - Audio signal processing circuit - Google Patents

Audio signal processing circuit Download PDF

Info

Publication number
JP3596580B2
JP3596580B2 JP18614197A JP18614197A JP3596580B2 JP 3596580 B2 JP3596580 B2 JP 3596580B2 JP 18614197 A JP18614197 A JP 18614197A JP 18614197 A JP18614197 A JP 18614197A JP 3596580 B2 JP3596580 B2 JP 3596580B2
Authority
JP
Japan
Prior art keywords
circuit
level
frequency component
signal
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18614197A
Other languages
Japanese (ja)
Other versions
JPH1132395A (en
Inventor
雅美 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP18614197A priority Critical patent/JP3596580B2/en
Publication of JPH1132395A publication Critical patent/JPH1132395A/en
Application granted granted Critical
Publication of JP3596580B2 publication Critical patent/JP3596580B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、補聴器、電話、拡声器、音声通信などの分野で用いられる、音声信号の処理装置に関する。
【0002】
【従来の技術】
音声を伝送あるいは再生する場合、その伝送系あるいは再生系に残響やエコーが多いと、音声の明瞭度が低下してしまう。そこで、そのようなときには、発話速度を遅くする、連続して発声される語音を細かく分解し、時間をあけて再生するなどの処理が行われている。
【0003】
また、子音のような高域周波数の語音が聞き取りにくいときには、周波数イコライザ処理により高域周波数の強調を行うこともある。さらに、いわゆる継時マスキング(子音がエネルギーの大きい母音に続くとき、その母音により子音がマスクされる現象)を考慮した重み関数をかける処理も試みられている。
【0004】
さらに、以上の処理は難聴者や老人を対象に行われることもある。
【0005】
【発明が解決しようとする課題】
ところが、前述したように、発話速度を遅くしたり、連続して発声される語音を分解したりすると、次のような問題点を生じてしまう。
【0006】
1.原音声との間に時間のずれを生じ、即時性がなくなってしまう。したがって、会話などを行うときには使えない。また、放送などを聞く場合であっても、聞き終わるまでの時間が長くなってしまう。
2.語音の知覚判断には音声成分の変化速度も重要な手がかりになっているので、発話速度を遅くすると、この手がかりが変化して別な語音に知覚されてしまうことがある。
3.語音を分解してゆっくり再生すると、語音のまとまりとしての情報や過渡的な変化部分の情報が失われ、明瞭度の悪くなることがある。
4.周波数イコライザ処理により常に高域周波数を増幅した音声は、音色のバランスがくずれて不快であったり、聞き取りにくいことがある。
5.継時マスキングを考慮した重み関数をかける処理は、少なくとも重み関数の時間長の遅延が生じてしまい、即時性が失われてしまう。この結果、口の動きと処理音との間に時間ずれを生じて明瞭度に悪い影響を与えることがある。また、イヤホンからマイクロフォンへの音響的フィードバックがあるときには、その時間遅れによって残響音のような現象が引き起こされてしまう。
【0007】
そこで、上述のような問題点に対処するため、本出願人は、「特願平9−99144号」において、音声の低域成分による高域成分へのマスキングを補償する方式として、低域成分が存在する時間帯のみ高域の増幅率を大きくするようにした「音声信号の処理回路」を提案している。
【0008】
しかしながら、この「音声信号の処理回路」においては、高域の増幅率を大きくするので、アンプの利得および最大出力に余裕が必要になるとともに、ハウリングを起こさないようにハウリングマージンの余裕が必要になり、難聴が重い場合に適さない。
【0009】
この発明は、以上のような問題点を一掃しようとするものである。
【0010】
【課題を解決するための手段】
このため、この発明においては、
入力された音声信号の低域成分に対してレベルの低減を行うレベル低減回路と、
上記音声信号について高域成分の開始点を検出する第1の検出回路と、
上記音声信号について高域成分の終了点を検出する第2の検出回路と、
上記第1の検出回路および第2の検出回路の検出出力にしたがって上記レベル低減回路のレベル低減度を制御するレベル制御回路と
を有し、
このレベル制御回路は、上記第1の検出回路が上記高域成分の開始点を検出したとき、上記低域レベル低減回路に対して上記レベル低減度を大きくするように制御信号を供給するとともに、
上記第2の検出回路が上記高域成分の終了点を検出したとき、上記低域レベル低減回路に対して上記レベル低減度を戻すように制御信号を供給する
ようにした音声信号の処理回路
とするものである。
したがって、音声の低域成分による高域成分へのマスキングや継時マスキングに見合う大きさだけ、低域成分のレベルが低減されて、処理後の音声の明瞭度が改善される。
【0011】
【発明の実施の形態】
ところで、通常の会話の音声は、無声音と有声音との組み合わせ、すなわち、低い周波数の成分と高い周波数の成分との組み合わせで構成されている。また、一般の生活環境に存在する音も、低い周波数の成分と高い周波数の成分との組み合わせになっていることが多い。
【0012】
そして、聴覚では、低域成分が高域成分をマスクすることが知られており、音声を知覚するときにも、このマスキングが働いている。健聴者では、このマスキングによる妨害は小さく、マスキングがあっても正しく音声を知覚できるが、難聴者では、マスキングによる妨害が大きく、時間的にも長く続くことがあり、言葉の聞き取りを悪くする原因の一つになっている。
【0013】
また、健聴者でも低域成分の大きい雑音があると、言葉の聞き取りが低下することがある。さらに、いわゆる継時マスキングによっても、言葉の明瞭度が低下する。
【0014】
そこで、この発明は、このようなマスキングあるいは継時マスキングに起因する明瞭度の低下を抑えようとするものである。
【0015】
そして、このため、この発明の一形態においては、音声の高域成分の開始点から数ミリ秒〜十数ミリ秒の期間を開始期間とし、音声の高域成分の終了点から十数ミリ秒〜数十ミリ秒の期間を終了期間とするとき、この開始期間から終了期間までの処理期間には、音声信号の低域成分に対してレベルの低減を行うものである。
【0016】
図1は、この発明の一形態の構成を示すもので、処理前の音声信号S11が、入力端子11を通じて2つのバンドパスフィルタ12、13に共通に供給され、これらのバンドパスフィルタ12、13の出力信号S12、S13が、固定利得および可変利得のアンプ14、15を通じて加算回路16に供給される。
【0017】
この場合、ここでは、音声の第1フォルマント成分を音声の低域成分とし、第2フォルマント成分および子音成分を音声の高域成分として扱うものである。このため、バンドパスフィルタ12の通過帯域は、音声の第2フォルマント成分および子音成分の帯域、例えば1.2 kHz〜8kHzとされ、バンドパスフィルタ13の通過帯域は、音声のピッチ成分および第1フォルマント成分の帯域、例えば200Hz 〜1.2 kHzとされる。
【0018】
したがって、固定利得アンプ14の利得と、可変利得アンプ15の基準利得とが等しい場合、加算回路16からは、入力された音声信号S11に含まれる高域信号成分S12および低域信号成分S13を、等しい割り合いで有する音声信号S16が得られることになる。そして、この信号S16が出力端子17に取り出される。
【0019】
さらに、入力端子11からの音声信号S11が、前処理のため、バンドパスフィルタ21およびレベル算出回路22に順に供給される。この場合、バンドパスフィルタ21は、高域信号成分の開始点および終了点を検出しやすくし、かつ、雑音による影響が小さくなるように、入力された音声信号S11の第2フォルマント成分と子音成分とを、信号S21として抽出するものである。したがって、バンドパスフィルタ21の通過帯域は、バンドパスフィルタ12の通過帯域と例えば等しく設定される。
【0020】
また、レベル算出回路22は、例えば、信号S21を両波整流するとともに、その低域成分(例えば60Hz以下の成分)を取り出すことにより、バンドパスフィルタ12から出力される高域信号成分S12のレベルを示す信号S22を形成するものである。
【0021】
そして、このレベル算出回路22の算出信号S22が検出回路23に供給されて、高域信号成分S12の開始点および終了点が検出され、その検出信号S23がレベル制御回路24に供給されてレベル制御信号S24が形成され、この信号S24が可変利得アンプ15に利得G15の制御信号として供給される。
【0022】
この場合、高域信号成分S12の開始点および終了点の検出と、可変利得アンプ15の利得G15の大きさとは、例えば、図2に示すような関係とされる。すなわち、算出信号S22の示す高域信号成分S12のレベルが開始点判定のしきい値より小さいときには、アンプ15の利得G15は、アンプ14の利得と等しい基準値とされているが、時点t1 に高域信号成分S12のレベルがその開始点判定のしきい値よりも大きくなると、利得G15は、時点t1 から数ミリ秒ないし十数ミリ秒後の時点t2 までの期間Ts をもって所定値まで次第に小さくされる。
【0023】
また、算出信号S22の示す高域信号成分S12のレベルが終了点判定のしきい値よりも大きいときには、利得G15は小さいままに保持されるが、時点t3 に高域信号成分S12のレベルがその終了点判定のしきい値よりも小さくなると、利得G15は、時点t3 から数十ミリ秒ないし200 ミリ秒後の時点t4 までの期間Te をもって基準値まで次第に大きくされる。
【0024】
このような構成によれば、処理前の音声信号S11に高域信号成分S12が含まれているとき、その開始点から終了点までの期間t1 〜t4 には、レベル制御信号S24によりアンプ15の利得G15が小さくなるので、このアンプ15を通じる低域信号成分S13のレベルが低減される。
【0025】
したがって、高域信号成分S12の開始点から終了点までの期間、端子17に出力される音声信号S16の高域信号成分S12のレベルが相対的に高くなるので、信号S16の再生音にマスキングを生じても、そのマスキングに見合うだけ、再生音の高域成分が相対的に大きくなり、したがって、言葉の聞き取りが改善される。また、継時マスキングの場合、高域成分の開始点の近傍でマスキングの程度が大きいが、図2に示すように、高域信号成分S12の開始点の近傍で、低域信号成分のレベルが比較的速やかに低減されて高域信号成分S12のレベルが相対的に高くなるので、継時マスキングに対しても明瞭度を有効に高めることができる。
【0026】
図3は、検出回路23およびレベル制御回路24が、算出信号S22からレベル制御信号S24を形成する方法の一形態を示す。すなわち、この場合には、図1に示した回路の全部がデジタル化されるとともに、例えばDSPにより構成される。また、音声信号S11はもとの処理前のアナログ音声信号をA/D変換したデジタル音声信号とされる。
【0027】
そして、検出回路23およびレベル制御回路24においては、デジタル音声信号S11の1サンプルごとに、図3のレベル制御ルーチン100が実行され、可変利得アンプ15の利得G15が、例えば図2に示すように制御される。なお、ルーチン100および以下の説明において、各変数の意味は以下のとおりである。
【0028】
e(i) :音声信号S11の第i番目のサンプルの示すレベル。
threshold1:高域成分の終了点判定のしきい値。
信号S11がこの値よりも小さくなったとき、高域成分の終了点と判定する。
threshold2:高域成分の開始点判定のしきい値。
信号S11がこの値よりも大きくなったとき、高域成分の開始点と判定する。
threshold1≦threshold2に設定される。
w :利得G15を制御するための重み係数。0≦w ≦1
w =0のとき、G15=基準利得
w =1のとき、G15=最小利得
d1 :係数w を減少させるときのステップ幅。
d2 :係数w を増加させるときのステップ幅。
【0029】
すなわち、レベル制御ルーチン100においては、まず、ステップ101において、第i番目のサンプルの信号レベルe(i)が開始点判定のしきい値threshold2よりも小さいかどうかが判別され、小さいときには、処理はステップ101からステップ102に進む。
【0030】
そして、このステップ102において、第i番目のサンプルの信号レベルe(i)が終了点判定のしきい値threshold1よりも小さいかどうかが判別され、小さいときには、処理はステップ102からステップ103に進み、このステップ103において、係数w がステップ幅d1だけ小さくされ、ルーチン100を終了する。したがって、図2に示すように、高域成分の終了点が検出されたときには、以後、利得G15は次第に大きくなっていき、低域成分のレベルが次第に高くなっていく。
【0031】
また、ステップ102において、第i番目のサンプルの信号レベルe(i)が終了点判定のしきい値threshold1以上のときには、処理はステップ102からこのルーチン100を終了する。したがって、図2に示すように、高域成分の終了点が検出されるまでの期間(利得G15の小さい期間)は、その利得G15が保持されて、低域成分のレベルが低く保持される。
【0032】
さらに、ステップ101において、第i番目のサンプルの信号レベルe(i)が開始点判定のしきい値threshold2以上のときには、処理はステップ101からステップ104に進み、このステップ104において、係数w がステップ幅d2だけ大きくされ、ルーチン100を終了する。したがって、図2に示すように、高域成分の開始点が検出されたときには、以後、利得G15は次第に小さくなっていき、低域成分のレベルが次第に低くなっていく。
【0033】
こうして、レベル制御ルーチン100によれば、低域成分用のアンプ15の利得G15を低減方向に制御することにより、高域成分のレベルを相対的に上昇させているので、マスキングや継時マスキングによる高域成分の聴感上の減衰を補うことができ、会話の子音部分など音声の明瞭度を向上させることができる。
【0034】
図4は、音声波形の観測結果を示すもので、図4Aは上述のルーチン100による処理を行っていない入力音声信号S11の波形、図4Bはルーチン100による処理を行った出力音声信号S16の波形の観測例である。なお、このときの発声内容は、「1行目に書いてください」である。
【0035】
そして、高域成分の開始点から終了点までの期間(矢印A、B、C、D、Eの部分)は、低域成分のレベルが低くなって、高域成分のレベルが相対的に上昇している。特に、矢印A、B、Cの部分では、音節が区切れて強調されたようになり、あたかも、はっきり発音したかのように聞こえる。
【0036】
したがって、上述の処理回路によれば、音声を残響やエコーなどのある系で伝送あるいは再生するとき、あるいは難聴者や老人が音声を聞くとき、以下のような効果を得ることができる。
1.発声された音声のうち、高域成分へのマスキングが軽減されるように低域成分のレベルが低減され、聴感的に子音が強調されるとともに、音節が強調されるので、音声がはっきりし、明瞭度を改善できる。
2.マスキングを軽減するために高域成分を増強する必要がないので、高域成分用のアンプの利得や最大出力、あるいはハウリングマージンに余裕がなくてもよい。したがって、高域成分用のアンプは、常時最大利得状態で動作させることができる。
3.マスキングが起きているときだけ、聴感的に高域成分が強調されるので、高域成分が常に強調されるときのように、音色のバランスが崩れたような不快感がない。
4.原理的に即時処理ができるので、発声者の口の動きと処理音との間に時間差の生じることがない。また、イヤホンからマイクロフォンへの音響的フィードバックがあっても、残響音のような音にはならないので、聞きやすい。
5.語音の知覚判断にとって重要な音声成分の変化速度や、語音のまとまりとしての情報および過渡的な変化部分の情報が失われない。
【0037】
6.ルーチン100は、その処理のステップ数が少ないので、処理が多少遅いDSPであっても、十分に対応することができる。
【0038】
図5に示すレベル制御ルーチン200は、
threshold=threshold1=threshold2
とすることにより、レベル制御ルーチン100を簡略化した場合である。すなわち、ルーチン200においては、
threshold :高域成分の開始点判定および終了点判定のしきい値。
信号S11がこの値よりも小さいと終了点と判定し、この値よりも大きいと開始点と判定する。
とされ、他はルーチン100と同様とされる。
【0039】
そして、ステップ201において、第i番目のサンプルの信号レベルe(i)がしきい値threshold と比較され、レベルe(i)がしきい値threshold よりも小さければ、ステップ202において、係数w がステップ幅d1だけ小さくされ、そうでなければ、ステップ203において、係数w がステップ幅d2だけ大きくされる。
【0040】
したがって、このレベル制御処理ルーチン200によれば、処理がさらに簡単であり、DSPの負担がより軽くなる。
【0041】
なお、上述においては、入力音声信号S11の低域成分のレベルを低減するために、可変利得アンプ15を用いたが、これに代えて、固定利得アンプと可変アッテネータ回路(いわゆる電子ボリューム)との組み合わせとすることもできる。また、上述においては、いわゆる本線用と前処理用とに、同じ特性の2つのバンドパスフィルタ12、21を用いているが、前処理用のバンドパスフィルタ21を省くとともに、バンドパスフィルタ12からの高域成分S12をレベル算出回路22に分配することにより、より簡単な構成とすることができる。
【0042】
さらに、レベル算出回路22の算出信号S22を、レベル制御回路24に供給することにより、可変利得アンプ15における低域成分のレベル低減度を、入力音声信号S11の高域成分S12のレベルに応じて制御することもできる。
【0043】
【発明の効果】
この発明によれば、音声がはっきりし、明瞭度を改善することができる。また、高域成分用のアンプに対する要求を軽減できる。さらに、常に音声の高域を強調するときのような不快感がない。また、発声者の口の動きと処理音との間に時間差の生じることがない。
【0044】
さらに、イヤホンからマイクロフォンへの音響的フィードバックがあっても、残響音のようにならず、聞きやすい。また、語音の知覚判断などに有効な情報が損なわれない。しかも、デジタル処理する場合の負担を少なくすることができる。
【図面の簡単な説明】
【図1】この発明の一形態を示す系統図である。
【図2】この発明を説明するための図である。
【図3】この発明の一形態を示すフローチャートである。
【図4】この発明を説明するための波形図である。
【図5】この発明の一形態を示すフローチャートである。
【符号の説明】
11=入力端子、12=バンドパスフィルタ、13=バンドパスフィルタ、14=固定利得アンプ、15=可変利得アンプ、16=加算回路、17=出力端子、21=バンドパスフィルタ、22=レベル算出回路、23=検出回路、24=レベル制御回路、100および200=レベル制御ルーチン
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an audio signal processing device used in fields such as hearing aids, telephones, loudspeakers, and voice communications.
[0002]
[Prior art]
When transmitting or reproducing sound, if there is much reverberation or echo in the transmission system or reproduction system, the intelligibility of the sound is reduced. Therefore, in such a case, processing such as lowering the utterance speed, finely decomposing a continuously uttered word sound, and reproducing it at a later time is performed.
[0003]
When it is difficult to hear a high frequency sound such as a consonant, the high frequency may be emphasized by a frequency equalizer process. Further, a process of applying a weighting function in consideration of so-called successive masking (a phenomenon in which a consonant is masked by a vowel when the consonant follows a vowel having a large energy) has been attempted.
[0004]
Further, the above processing may be performed for a hearing-impaired person or an elderly person.
[0005]
[Problems to be solved by the invention]
However, as described above, if the utterance speed is reduced or a speech sound that is continuously uttered is decomposed, the following problems occur.
[0006]
1. A time lag occurs between the original sound and the original sound. Therefore, it cannot be used for conversations. In addition, even when listening to a broadcast or the like, the time required to finish listening is long.
2. Since the rate of change of the voice component is also an important clue for the perceptual judgment of the speech sound, if the speech speed is reduced, this clue may change and be perceived as another speech sound.
3. When a speech sound is decomposed and played back slowly, information as a unit of the speech sound or information of a transient change portion may be lost, and the intelligibility may deteriorate.
4. A sound whose high frequency is always amplified by the frequency equalizer processing may be uncomfortable due to an imbalance in timbre or may be difficult to hear.
5. In the process of applying the weighting function in consideration of the successive masking, at least the time length of the weighting function is delayed, and the immediacy is lost. As a result, a time lag may occur between the movement of the mouth and the processed sound, which may adversely affect the clarity. Also, when there is acoustic feedback from the earphone to the microphone, a time delay causes a phenomenon such as reverberation.
[0007]
In order to address the above-described problems, the present applicant has disclosed in Japanese Patent Application No. 9-99144 a low-frequency component as a method of compensating for the masking of a low-frequency component of a sound into a high-frequency component. A "sound signal processing circuit" has been proposed in which the amplification factor in the high frequency band is increased only in the time zone in which.
[0008]
However, in this "audio signal processing circuit", since the amplification factor in the high frequency band is increased, a margin is required for the gain and the maximum output of the amplifier, and a margin for the howling margin is required to prevent howling. It is not suitable for severe hearing loss.
[0009]
The present invention seeks to eliminate the above problems.
[0010]
[Means for Solving the Problems]
Therefore, in the present invention,
A level reduction circuit that reduces the level of a low-frequency component of the input audio signal,
A first detection circuit for detecting a start point of a high-frequency component of the audio signal;
A second detection circuit that detects an end point of a high-frequency component of the audio signal;
A level control circuit that controls a level reduction degree of the level reduction circuit according to detection outputs of the first detection circuit and the second detection circuit;
When the first detection circuit detects the start point of the high frequency component, the level control circuit supplies a control signal to the low frequency level reduction circuit so as to increase the degree of level reduction,
An audio signal processing circuit configured to supply a control signal to the low frequency level reduction circuit so as to return the level reduction degree when the second detection circuit detects the end point of the high frequency component; Is what you do.
Therefore, the level of the low-frequency component is reduced by an amount corresponding to the masking of the high-frequency component by the low-frequency component and the successive masking, and the clarity of the processed voice is improved.
[0011]
BEST MODE FOR CARRYING OUT THE INVENTION
By the way, the speech of a normal conversation is composed of a combination of unvoiced sound and voiced sound, that is, a combination of a low frequency component and a high frequency component. In addition, sounds that exist in general living environments are often combinations of low-frequency components and high-frequency components.
[0012]
In the sense of hearing, it is known that a low-frequency component masks a high-frequency component, and this masking also works when a voice is perceived. In a normal hearing person, the masking disturbance is small and the voice can be perceived correctly even with the masking. It has become one of.
[0013]
In addition, even for a normal hearing person, if there is noise having a large low-frequency component, the hearing of words may be reduced. Further, the so-called successive masking also reduces the clarity of words.
[0014]
Therefore, the present invention is intended to suppress a decrease in clarity due to such masking or successive masking.
[0015]
Therefore, in one embodiment of the present invention, a period of several milliseconds to several tens of milliseconds from the start point of the high frequency component of the audio is set as the start period, and ten and several milliseconds from the end point of the high frequency component of the audio. When a period of up to several tens of milliseconds is set as the end period, during the processing period from the start period to the end period, the level of the low frequency component of the audio signal is reduced.
[0016]
FIG. 1 shows a configuration of an embodiment of the present invention. An unprocessed audio signal S11 is supplied to two band-pass filters 12, 13 in common through an input terminal 11, and these band-pass filters 12, 13 are provided. Output signals S12 and S13 are supplied to an addition circuit 16 through fixed gain and variable gain amplifiers 14 and 15.
[0017]
In this case, the first formant component of the voice is treated as the low-frequency component of the voice, and the second formant component and the consonant component are treated as the high-frequency component of the voice. Therefore, the pass band of the band-pass filter 12 is set to a band of the second formant component and the consonant component of the voice, for example, 1.2 kHz to 8 kHz, and the pass band of the band-pass filter 13 is set to the pitch component of the voice and the first band. The band of the formant component, for example, 200 Hz to 1.2 kHz.
[0018]
Therefore, when the gain of the fixed gain amplifier 14 is equal to the reference gain of the variable gain amplifier 15, the high frequency signal component S 12 and the low frequency signal component S 13 included in the input audio signal S 11 are output from the adder circuit 16. An audio signal S16 having the same ratio is obtained. Then, the signal S16 is taken out to the output terminal 17.
[0019]
Further, the audio signal S11 from the input terminal 11 is sequentially supplied to the bandpass filter 21 and the level calculation circuit 22 for preprocessing. In this case, the band-pass filter 21 makes it easy to detect the start point and the end point of the high-frequency signal component, and reduces the influence of noise on the second formant component and the consonant component of the input audio signal S11. Are extracted as a signal S21. Therefore, the pass band of the band pass filter 21 is set, for example, equal to the pass band of the band pass filter 12.
[0020]
The level calculation circuit 22 rectifies the signal S21 in two-waves and extracts the low-frequency component (for example, a component of 60 Hz or less) of the signal S21, thereby obtaining the level of the high-frequency signal component S12 output from the band-pass filter 12. Is formed.
[0021]
Then, the calculation signal S22 of the level calculation circuit 22 is supplied to the detection circuit 23, and the start point and the end point of the high frequency signal component S12 are detected. The detection signal S23 is supplied to the level control circuit 24 to perform level control. A signal S24 is formed, and the signal S24 is supplied to the variable gain amplifier 15 as a control signal for the gain G15.
[0022]
In this case, the detection of the start point and the end point of the high-frequency signal component S12 and the magnitude of the gain G15 of the variable gain amplifier 15 have, for example, a relationship as shown in FIG. That is, when the level of the high-frequency signal component S12 indicated by the calculation signal S22 is smaller than the threshold value for the start point determination, the gain G15 of the amplifier 15 is set to the reference value equal to the gain of the amplifier 14, but at time t1. When the level of the high-frequency signal component S12 becomes larger than the threshold value for determining the start point, the gain G15 gradually decreases to a predetermined value in a period Ts from the time point t1 to a time point t2 several milliseconds to several tens of milliseconds later. Is done.
[0023]
Further, when the level of the high-frequency signal component S12 indicated by the calculation signal S22 is larger than the threshold value for the end point determination, the gain G15 is kept small, but at the time t3, the level of the high-frequency signal component S12 becomes When the gain G15 becomes smaller than the threshold value for the end point determination, the gain G15 is gradually increased to the reference value in a period Te from a time t3 to a time t4 several tens of milliseconds to 200 milliseconds later.
[0024]
According to such a configuration, when the high-frequency signal component S12 is included in the audio signal S11 before processing, the level control signal S24 controls the amplifier 15 during the period t1 to t4 from the start point to the end point. Since the gain G15 is reduced, the level of the low-frequency signal component S13 passing through the amplifier 15 is reduced.
[0025]
Therefore, during the period from the start point to the end point of the high-frequency signal component S12, the level of the high-frequency signal component S12 of the audio signal S16 output to the terminal 17 becomes relatively high, so that the reproduced sound of the signal S16 is masked. Even if it occurs, the high-frequency component of the reproduced sound becomes relatively large corresponding to the masking, so that the listening of words is improved. In the case of successive masking, the degree of masking is large near the start point of the high frequency component, but as shown in FIG. 2, the level of the low frequency signal component is close to the start point of the high frequency signal component S12. Since the level of the high-frequency signal component S12 is relatively increased relatively quickly, the clarity can be effectively increased even for successive masking.
[0026]
FIG. 3 shows an embodiment of a method in which the detection circuit 23 and the level control circuit 24 form the level control signal S24 from the calculation signal S22. That is, in this case, all of the circuits shown in FIG. 1 are digitized and configured by, for example, a DSP. The audio signal S11 is a digital audio signal obtained by A / D-converting the original analog audio signal before processing.
[0027]
Then, in the detection circuit 23 and the level control circuit 24, the level control routine 100 of FIG. 3 is executed for each sample of the digital audio signal S11, and the gain G15 of the variable gain amplifier 15 is changed as shown in FIG. Controlled. In the routine 100 and the following description, the meaning of each variable is as follows.
[0028]
e (i): the level indicated by the i-th sample of the audio signal S11.
threshold1: threshold value for determining the end point of the high frequency component.
When the signal S11 becomes smaller than this value, it is determined that the high-frequency component ends.
threshold2: threshold value for determining the start point of the high frequency component.
When the signal S11 becomes larger than this value, it is determined to be the start point of the high frequency component.
threshold1 ≦ threshold2 is set.
w: weight coefficient for controlling the gain G15. 0 ≦ w ≦ 1
When w = 0, G15 = reference gain w = 1, G15 = minimum gain d1: step width when decreasing coefficient w 1.
d2: Step width when increasing the coefficient w 2.
[0029]
That is, in the level control routine 100, first, at step 101, it is determined whether or not the signal level e (i) of the i-th sample is smaller than a threshold value threshold2 for starting point determination. The process proceeds from step 101 to step 102.
[0030]
Then, in this step 102, it is determined whether or not the signal level e (i) of the i-th sample is smaller than a threshold value threshold1 for determining the end point. When it is smaller, the process proceeds from step 102 to step 103, In this step 103, the coefficient w 1 is reduced by the step width d1, and the routine 100 ends. Therefore, as shown in FIG. 2, when the end point of the high frequency component is detected, thereafter, the gain G15 gradually increases, and the level of the low frequency component gradually increases.
[0031]
If the signal level e (i) of the i-th sample is equal to or higher than the threshold value threshold1 for determining the end point in step 102, the process ends the routine 100 from step 102. Therefore, as shown in FIG. 2, during a period until the end point of the high frequency component is detected (a period in which the gain G15 is small), the gain G15 is maintained and the level of the low frequency component is maintained low.
[0032]
Further, in step 101, when the signal level e (i) of the i-th sample is equal to or higher than the threshold value threshold2 for starting point determination, the process proceeds from step 101 to step 104, where the coefficient w 2 The width is increased by d2, and the routine 100 ends. Therefore, as shown in FIG. 2, when the start point of the high frequency component is detected, thereafter, the gain G15 gradually decreases, and the level of the low frequency component gradually decreases.
[0033]
Thus, according to the level control routine 100, the level of the high frequency component is relatively increased by controlling the gain G15 of the low frequency component amplifier 15 in the decreasing direction. The auditory decay of the high-frequency component can be compensated for, and the clarity of voice such as a consonant part of a conversation can be improved.
[0034]
4A and 4B show the results of observation of the audio waveform. FIG. 4A shows the waveform of the input audio signal S11 that has not been processed by the routine 100, and FIG. 4B shows the waveform of the output audio signal S16 that has been processed by the routine 100. This is an example of observation. The utterance content at this time is "Please write on the first line".
[0035]
During the period from the start point to the end point of the high-frequency component (arrows A, B, C, D, and E), the level of the low-frequency component is low and the level of the high-frequency component is relatively high. are doing. In particular, in the portions of arrows A, B and C, the syllables are separated and emphasized, and it sounds as if they were pronounced clearly.
[0036]
Therefore, according to the above-described processing circuit, the following effects can be obtained when transmitting or reproducing sound in a system such as reverberation or echo, or when a hearing-impaired person or elderly person hears sound.
1. Among the uttered voices, the level of the low-frequency component is reduced so that the masking to the high-frequency component is reduced, and consonants are audibly emphasized, and the syllables are emphasized, so that the voice is clear, Clarity can be improved.
2. Since it is not necessary to increase the high-frequency component in order to reduce the masking, there is no need to have a margin in the gain, the maximum output, or the howling margin of the high-frequency component amplifier. Therefore, the amplifier for the high frequency component can always be operated in the maximum gain state.
3. Only when the masking is occurring, the high-frequency component is audibly enhanced, so that there is no discomfort as if the balance of the timbre was broken as in the case where the high-frequency component is always emphasized.
4. Since the processing can be performed immediately in principle, there is no time difference between the movement of the mouth of the speaker and the processed sound. Also, even if there is acoustic feedback from the earphone to the microphone, it does not sound like reverberation, so it is easy to hear.
5. The rate of change of the speech component, which is important for the perceptual judgment of the speech sound, the information as a unit of the speech sound, and the information of the transient change portion are not lost.
[0037]
6. The routine 100 has a small number of processing steps, and therefore can sufficiently cope with a DSP whose processing is somewhat slow.
[0038]
The level control routine 200 shown in FIG.
threshold = threshold1 = threshold2
This is a case where the level control routine 100 is simplified. That is, in the routine 200,
threshold: threshold value for determining the start point and the end point of the high frequency component.
If the signal S11 is smaller than this value, it is determined to be the end point, and if it is larger than this value, it is determined to be the start point.
The rest is the same as the routine 100.
[0039]
Then, in step 201, the signal level e (i) of the i-th sample is compared with the threshold value threshold, and if the level e (i) is smaller than the threshold value threshold, in step 202, the coefficient w 2 Otherwise, in step 203, the coefficient w 2 is increased by the step width d2.
[0040]
Therefore, according to the level control processing routine 200, the processing is further simplified, and the load on the DSP is further reduced.
[0041]
In the above description, the variable gain amplifier 15 is used to reduce the level of the low frequency component of the input audio signal S11. However, instead of this, a fixed gain amplifier and a variable attenuator circuit (so-called electronic volume) are used. It can also be a combination. In the above description, two band-pass filters 12 and 21 having the same characteristics are used for the so-called main line and the pre-processing, but the band-pass filter 21 for the pre-processing is omitted and the band-pass filter 12 is used. By distributing the high frequency component S12 to the level calculation circuit 22, a simpler configuration can be achieved.
[0042]
Further, by supplying the calculation signal S22 of the level calculation circuit 22 to the level control circuit 24, the level reduction degree of the low frequency component in the variable gain amplifier 15 is adjusted according to the level of the high frequency component S12 of the input audio signal S11. It can also be controlled.
[0043]
【The invention's effect】
ADVANTAGE OF THE INVENTION According to this invention, a sound is clear and intelligibility can be improved. Further, the requirement for the amplifier for the high frequency component can be reduced. Furthermore, there is no unpleasant sensation as when always emphasizing the high frequency range of sound. Further, there is no time difference between the movement of the mouth of the speaker and the processed sound.
[0044]
Furthermore, even if there is acoustic feedback from the earphone to the microphone, the sound does not look like reverberation and is easy to hear. In addition, effective information for perceptual judgment of speech sounds and the like is not lost. In addition, the burden of digital processing can be reduced.
[Brief description of the drawings]
FIG. 1 is a system diagram illustrating one embodiment of the present invention.
FIG. 2 is a diagram for explaining the present invention.
FIG. 3 is a flowchart illustrating one embodiment of the present invention.
FIG. 4 is a waveform chart for explaining the present invention.
FIG. 5 is a flowchart illustrating one embodiment of the present invention.
[Explanation of symbols]
11 = input terminal, 12 = bandpass filter, 13 = bandpass filter, 14 = fixed gain amplifier, 15 = variable gain amplifier, 16 = addition circuit, 17 = output terminal, 21 = bandpass filter, 22 = level calculation circuit , 23 = detection circuit, 24 = level control circuit, 100 and 200 = level control routine

Claims (5)

入力された音声信号を低域成分と高域成分とに分割する帯域分割回路と、
この帯域分割回路によって分割された上記低域成分のレベルを可変するレベル可変回路と、
上記帯域分割回路によって抽出した高域成分の開始点を検出する第1の検出回路と、
上記帯域分割回路によって抽出した高域成分の終了点を検出する第2の検出回路と、
上記第1の検出回路および上記第2の検出回路の検出出力にしたがって上記レベル可変回路を制御するレベル制御回路と
を有し、
上記第1の検出回路が上記高域成分の開始点を検出したとき、上記レベル可変回路に対してレベルを低減させるように上記レベル制御回路から制御信号を供給するとともに、
上記第2の検出回路が上記高域成分の終了点を検出したとき、上記レベル可変回路に対してレベルの低減を解除するように上記レベル制御回路から制御信号を供給する
ことを特徴とする音声信号の処理回路。
A band division circuit that divides the input audio signal into a low-frequency component and a high-frequency component,
A level variable circuit that varies the level of the low-frequency component divided by the band dividing circuit;
A first detection circuit for detecting a start point of the high frequency component extracted by the band division circuit;
A second detection circuit that detects an end point of the high-frequency component extracted by the band division circuit;
A level control circuit that controls the level variable circuit according to the detection outputs of the first detection circuit and the second detection circuit;
When the first detection circuit detects the start point of the high frequency component, it supplies a control signal from the level control circuit so as to reduce the level to the level variable circuit,
When the second detection circuit detects an end point of the high frequency component, a control signal is supplied from the level control circuit to the level variable circuit so as to cancel the level reduction. Signal processing circuit.
請求項1に記載の音声信号の処理回路において、
上記第1の検出回路は、上記高域成分の信号レベルが所定のしきい値を越えたとき、これを検出して上記開始点の検出信号を出力する
ようにした音声信号の処理回路。
The audio signal processing circuit according to claim 1,
The first detection circuit is a sound signal processing circuit configured to detect, when the signal level of the high frequency component exceeds a predetermined threshold value, to output the detection signal of the start point.
請求項1に記載の音声信号の処理回路において、
上記第2の検出回路は、上記高域成分の信号レベルが所定のしきい値を下回ったとき、これを検出して上記終了点の検出信号を出力する
ようにした音声信号の処理回路。
The audio signal processing circuit according to claim 1,
The second detection circuit is a sound signal processing circuit configured to detect, when the signal level of the high frequency component falls below a predetermined threshold value, to output the end point detection signal.
請求項1に記載の音声信号の処理回路において、
上記第1の検出回路が上記高域成分の開始点を検出した時点からの経過時間に応じてレベルを大きくするように上記レベル制御回路から制御信号を上記レベル可変回路に供給する
ようにした音声信号の処理回路。
The audio signal processing circuit according to claim 1,
A sound in which a control signal is supplied from the level control circuit to the level variable circuit so as to increase a level according to an elapsed time from a point in time when the first detection circuit detects the start point of the high frequency component. Signal processing circuit.
請求項1に記載の音声信号の処理回路において、
上記第2の検出回路が上記高域成分の終了点を検出した時点からの経過時間に応じてレベルを小さくするように上記レベル制御回路から制御信号を上記レベル可変回路に供給する
ようにした音声信号の処理回路。
The audio signal processing circuit according to claim 1,
A sound in which a control signal is supplied from the level control circuit to the variable level circuit so as to reduce a level according to an elapsed time from a point in time when the second detection circuit detects the end point of the high frequency component. Signal processing circuit.
JP18614197A 1997-07-11 1997-07-11 Audio signal processing circuit Expired - Fee Related JP3596580B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18614197A JP3596580B2 (en) 1997-07-11 1997-07-11 Audio signal processing circuit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18614197A JP3596580B2 (en) 1997-07-11 1997-07-11 Audio signal processing circuit

Publications (2)

Publication Number Publication Date
JPH1132395A JPH1132395A (en) 1999-02-02
JP3596580B2 true JP3596580B2 (en) 2004-12-02

Family

ID=16183105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18614197A Expired - Fee Related JP3596580B2 (en) 1997-07-11 1997-07-11 Audio signal processing circuit

Country Status (1)

Country Link
JP (1) JP3596580B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374877B2 (en) 2009-01-29 2013-02-12 Panasonic Corporation Hearing aid and hearing-aid processing method

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ366799A0 (en) * 1999-10-26 1999-11-18 University Of Melbourne, The Emphasis of short-duration transient speech features
JP4939259B2 (en) * 2007-03-05 2012-05-23 パイオニア株式会社 Acoustic device and sound correction method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374877B2 (en) 2009-01-29 2013-02-12 Panasonic Corporation Hearing aid and hearing-aid processing method

Also Published As

Publication number Publication date
JPH1132395A (en) 1999-02-02

Similar Documents

Publication Publication Date Title
KR100283421B1 (en) Speech rate conversion method and apparatus
KR100860805B1 (en) Voice enhancement system
US9591410B2 (en) Hearing assistance apparatus
US8170221B2 (en) Audio enhancement system and method
KR930002041B1 (en) Method and apparatus for improving voice intelligibility in high noise environments
US20050207583A1 (en) Audio enhancement system and method
JP2003520469A (en) Noise reduction apparatus and method
US20080082327A1 (en) Sound Processing Apparatus
US8538052B2 (en) Generation of probe noise in a feedback cancellation system
WO2002093876A2 (en) Final signal from a near-end signal and a far-end signal
JP2002051392A (en) In-vehicle conversation assisting device
JPH0968997A (en) Method and device for processing voice
JP4774255B2 (en) Audio signal processing method, apparatus and program
JP3789503B2 (en) Audio processing device
JP2000152394A (en) Hearing aid for moderately hard of hearing, transmission system having provision for the moderately hard of hearing, recording and reproducing device for the moderately hard of hearing and reproducing device having provision for the moderately hard of hearing
JP2008102551A (en) Apparatus for processing voice signal and processing method thereof
JP3596580B2 (en) Audio signal processing circuit
JP2000278786A (en) Microphone system
JP4079478B2 (en) Audio signal processing circuit and processing method
JP2006333396A (en) Audio signal loudspeaker
JP5188558B2 (en) Audio processing device
JPH06319192A (en) Audio signal processing method/device
JP3303446B2 (en) Audio signal processing device
JPH06289897A (en) Speech signal processor
RU2589298C1 (en) Method of increasing legible and informative audio signals in the noise situation

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040831

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees