JP4079478B2 - 音声信号の処理回路および処理方法 - Google Patents

音声信号の処理回路および処理方法 Download PDF

Info

Publication number
JP4079478B2
JP4079478B2 JP09914497A JP9914497A JP4079478B2 JP 4079478 B2 JP4079478 B2 JP 4079478B2 JP 09914497 A JP09914497 A JP 09914497A JP 9914497 A JP9914497 A JP 9914497A JP 4079478 B2 JP4079478 B2 JP 4079478B2
Authority
JP
Japan
Prior art keywords
voiced sound
circuit
end point
amplitude
start point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09914497A
Other languages
English (en)
Other versions
JPH10290497A (ja
Inventor
雅美 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP09914497A priority Critical patent/JP4079478B2/ja
Publication of JPH10290497A publication Critical patent/JPH10290497A/ja
Application granted granted Critical
Publication of JP4079478B2 publication Critical patent/JP4079478B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、補聴器、電話、拡声器、音声通信などの分野で用いられる音声信号の処理回路に関する。
【0002】
【従来の技術】
音声を伝送あるいは再生する場合、その伝送系あるいは再生系に残響やエコーが多いと、音声の明瞭度が低下してしまう。そこで、そのようなときには、発話速度を遅くする、連続して発声される語音を細かく分解し、時間をあけて再生するなどの処理が行なわれている。
【0003】
また、子音のような高域周波数が聞き取りにくいときには、周波数イコライザ処理により高域周波数の強調を行うこともある。さらに、いわゆる継時マスキング(エネルギーの大きい母音と子音とが続くとき、その母音により子音がマスクされる現象)を考慮した重み関数をかける処理も試みられている。
【0004】
さらに、以上の処理は難聴者や老人を対象に行われることもある。
【0005】
【発明が解決しようとする課題】
ところが、上述したように、発話速度を遅くしたり、連続して発声される語音を分解したりすると、次のような問題点を生じてしまう。
【0006】
1.原音声との間に時間のずれを生じ、即時性がなくなってしまう。したがって、会話などを行なうときには使えない。また、放送などを聞く楊合であっても、聞き終わるまでの時間が長くなってしまう。
2.語音の知覚判断には音声成分の変化速度も重要な手がかりになっているので、発話速度を遅くすると、この手がかりが変化して別な語音に知覚されてしまうことがある。
3.語音を分解してゆっくり再生すると、語音のまとまりとしての情報や過渡的な変化部分の情報が失われ、明瞭度の悪くなることがある。
4.周波数イコライザ処理により常に高域周波数を増幅した音声は、音色のバランスがくずれて不快であったり、聞き取りにくいことがある。
5.継時マスキングを考慮した重み関数をかける処理は、少なくとも重み関数の時間長の遅延が生じてしまい、即時性が失われてしまう。この結果、口の動きと処理音との間に時間ずれを生じて明瞭度に悪い影響を与えることがある。また、イヤホンからマイクロフォンへの音響的フィードバックがあるときには、その時間遅れによって残響音のような現象が引き起こされてしまう。
【0007】
この発明は、このような問題点に対処しようとするものである。
【0008】
【課題を解決するための手段】
このため、この発明においては、
入力された音声信号の子音成分に対して振幅の変更を行なう振幅変更回路と、
上記音声信号について有声音の開始点を検出する開始点検出回路と、
上記音声信号について上記有声音の終了点を検出する終了点検出回路と、
上記開始点検出回路および上記終了点検出回路の出力にしたがって上記振幅変更回路の利得を制御する制御回路と
を有し、
上記制御回路は、上記開始点検出回路が上記開始点を検出したとき、上記振幅変更回路に対して上記利得を大きくするように制御信号を供給するとともに、
上記終了点検出回路が上記終了点を検出したとき、上記振幅変更回路に対して上記利得を戻すように制御信号を供給する
ようにした音声信号の処理回路
とするものである。
したがって、有声音によるマスキングや継時マスキングに見合う大きさだけ、子音成分が増幅され、言葉の聞き取りが改善される。
【0009】
【発明の実施の形態】
ところで、通常の会話の音声は、低い周波数の成分と高い周波数の成分との組み合わせで構成されている。また、一般の生活環境に存在する音も、低い周波数の成分と高い周波数の成分との組み合わせになっていることが多い。
【0010】
そして、聴覚では、低域成分が高域成分をマスクすることが知られており、音声を知覚するときにも、このマスキングが働いている。健聴者では、このマスキングによる妨害は小さく、マスキングがあっても正しく音声を知覚できるが、難聴者では、マスキングによる妨害が大きく、時間的にも長く続くことがあり、言葉の聞き取りを悪くする原因の一つになっている。
【0011】
また、健聴者でも低域成分の大きい雑音があると、言葉の聞き取りが低下することがある。さらに、いわゆる継時マスキングによっても、言葉の明瞭度が低下する。
【0012】
そこで、この発明は、このようなマスキングあるいは継時マスキングに起因する明瞭度の低下を抑えようとするものである。
【0013】
そして、このため、この発明の一形態においては、有声音の開始点から数ミリ秒〜十数ミリ秒の期間を立ち上がり期間とし、有声音の終了点から十数ミリ秒〜数十ミリ秒の期間を立ち下がり期間とするとき、これら立ち上がり期間から立ち下がり期間にかけて、高域成分を増強するものである。
【0014】
図1は、この発明の一形態を示すもので、処理前の音声信号S11が、入力端子11を通じて有声音の帯域を通過帯域とするフィルタ12に供給されてその有声音の信号成分S12が取り出され、この信号成分S12が加算回路13に供給される。また、端子11からの信号S11が、子音の帯域を通過帯域とするフィルタ14に供給されて子音の信号成分S14が取り出され、この信号成分S14が可変利得アンプ15を通じて加算回路13に供給される。
【0015】
したがって、加算回路13においては、信号成分S12と信号成分S14とが加算されるので、可変利得アンプ15の利得G15が基準利得(例えば1倍)であるとすれば、加算回路13からは、音声信号S11に含まれる有声音の信号成分S12および子音の信号成分S14を、等しい割り合いで有する音声信号S13が得られることになる。そして、この信号S13が出力端子16に取り出される。
【0016】
さらに、端子11の信号S11が、前処理のため、バンドパスフィルタ21およびレベル算出回路22に順に供給される。この場合、バンドパスフィルタ21は、有声音の開始点および終了点を検出しやすくし、かつ、雑音による影響が小さくなるように、信号S11からピッチ成分とフォルマント成分とを、信号S21として抽出するものである。したがって、バンドパスフィルタ21の通過帯域は、例えば150Hz 〜1000Hzとされている。
【0017】
また、レベル算出回路22は、例えば、信号S21を両波整流するとともに、その低域成分(例えば60Hz以下の成分)を取り出すことにより、信号 21のレベルを示す信号S22を形成するものである。
【0018】
そして、このレベル算出回路22の算出信号S22が検出回路23に供給されて有声音の開始点および終了点が検出され、その検出信号S23が制御回路24に供給されて制御信号S24が形成され、この信号S24が可変利得アンプ15に利得G15の制御信号として供給される。
【0019】
この場合、有声音の開始点および終了点の検出と、アンプ15の利得G15の大きさとは、例えば図2に示すような関係とされる。すなわち、算出信号S22の示す有声音のレベルが開始判定のしきい値より小さいときには、アンプ15の利得G15は基準値とされているが、有声音のレベルがその開始判定のしきい値よりも大きくなると、利得G15は、数ミリ秒から十数ミリ秒の立ち上がり期間をもって最大値まで次第に大きくされる。
【0020】
また、算出信号S22の示す有声音のレベルが終了判定のしきい値よりも大きいときには、利得G15は大きいままとされるが、有声音のレベルがその終了判定のしきい値よりも小さくなると、利得G15は、数十ミリ秒から200 ミリ秒程度の立ち下がり期間をもって基準値まで次第に小さくされる。
【0021】
このような構成によれば、処理前の音声信号S11に有声音の信号成分が含まれているとき、その開始点から終了点までの期間、信号S24によりアンプ15の利得G15が大きくなるので、その開始点から終了点までの期間、アンプ15を通じる子音の信号成分S14が大きくなる。
【0022】
したがって、有声音の開始点から終了点までの期間、端子16に出力される音声信号S13の子音の信号成分S14のレベルが大きくなるので、信号S13の再生音にマスキングを生じても、そのマスキングに見合う大きさだけ子音が大きくなり、したがって、言葉の聞き取りが改善される。
【0023】
また、有声音の終了点からの時間間隔が短い期間には、継時マスキングが大きいが、子音の信号成分S14は大きく増幅されるので、継時マスキングに対しても明瞭度を有効に高めることができる。さらに、次の子音の開始点までの時間間隔の長い期間には、継時マスキングが小さいが、この期間には、子音の信号成分S14はあまり増幅されないので、音色のバランスのくずれことがない。
【0024】
図3は、検出回路23および制御回路24が、検出信号S22から制御信号S24を形成する方法の一形態を示す。すなわち、この場合には、図1に示した回路の全部がデジタル化されるとともに、例えばDSPにより構成される。また、音声信号S11はもとの処理前のアナログ音声信号をA/D変換したデジタル音声信号とされる。
【0025】
そして、検出回路23および制御回路24においては、デジタル音声信号S11の1サンプルごとに、図3の処理ルーチン100が実行され、アンプ15の利得G15が例えば図2に示すように制御させる。なお、ルーチン100および以下の説明において、各変数の意味は以下のとおりである。
【0026】
Figure 0004079478
【0027】
すなわち、ルーチン100においては、まず、ステップ101において、第i番目のサンプルの信号レベルe(i)が開始判定のしきい値threshold2よりも小さいかどうかが判別され、小さいときには、処理はステップ101からステップ102に進む。
【0028】
そして、このステップ102において、第i番目のサンプルの信号レベルe(i)が終了判定のしきい値threshold1よりも小さいかどうかが判別され、小さいときには、処理はステップ102からステップ103に進み、このステップ103において、係数w がステップ幅d1だけ小さくされ、ルーチン100を終了する。したがって、図2に示すように、有声音の終了点が検出されたときには、以後、利得G15は次第に小さくなっていく。
【0029】
また、ステップ102において、第i番目のサンプルの信号レベルe(i)が終了判定のしきい値threshold1以上のときには、処理はステップ102からこのルーチン100を終了する。したがって、図2に示すように、有声音の終了が検出されるまでの期間(利得G15の大きい期間)は、その利得G15が保持される。
【0030】
さらに、ステップ101において、第i番目のサンプルの信号レベルe(i)が開始判定のしきい値threshold2以上のときには、処理はステップ101からステップ104に進み、このステップ104において、係数w がステップ幅d2だけ大きくされ、ルーチン100を終了する。したがって、図2に示すように、有声音の開始点が検出されたときには、以後、利得G15は次第に大きくなっていく。
【0031】
こうして、ルーチン100によれば、有声音のレベルにしたがってアンプ15の利得G15を制御することにより、子音のレベルを補正しているので、マスキングや継時マスキングによる子音成分の聴感上の減衰を補うことができ、会話の子音部分など音声の明瞭度を向上させることができる。
【0032】
図4は、音声波形の観測結果を示すもので、図4Aはルーチン100による処理を行っていない音声信号S11の波形、図4Bはルーチン100による処理を行った音声信号S13の波形の観測例である。なお、このときの発声内容は、「1行目に書いてください」である。
【0033】
そして、有声音の開始点から終了点までの区間Bは、子音の部分が大きく増幅され、有声音の終了点からの短い期間(矢印A、Fの部分)は、継時マスキングが大きいので、子音は大きく増幅され、次の子音の始まりまでの長い期間(矢印C、D、Eの部分)は、継時マスキングが小さいので、子音はあまり増幅されていない。
【0034】
したがって、上述の処理回路によれば、音声を残響やエコーなどのある系で伝送あるいは再生するとき、あるいは難聴者や老人が音声を聞くとき、以下のような効果を得ることができる。
1.次に発声される音への継時マスキングだけが軽減されるように、子音が強調されるので、音声がはっきりし、明瞭度を改善できる。
2.マスキングが起きているときだけ子音が強調されるので、常に高域が強調されるときのように、音色のバランスが崩れたような不快感がない。
3.原理的に即時処理ができるので、発声者の口の動きと処理音との間に時間差の生じることがない。また、イヤホンからマイクロフォンへの音響的フィードバックがあっても、残響音のような音にはならないので、聞きやすい。
4.語音の知覚判断にとって重要な音声成分の変化速度や、語音のまとまりとしての情報および過渡的な変化部分の情報が失われない。
5.図4の処理ルーチン100によれば、その処理のステップ数が少ないので、処理が多少遅いDSPであっても、十分に対応することができる。
【0035】
図5に示すルーチン200は、
threshold=threshold1=threshold2
とすることにより、ルーチン100を簡略化した場合である。すなわち、ルーチン200においては、
threshold :有声音の開始判定および終了判定のしきい値。信号S11がこの値よりも小さいと終了と判定し、この値よりも大きいと開始と判定する。
とされ、他はルーチン100と同様とされる。
【0036】
そして、ステップ201において、第i番目のサンプルの信号レベルe(i)がしきい値threshold と比較され、レベルe(i)がしきい値threshold よりも小さければ、ステップ202において、係数w がステップ幅d1だけ小さくされ、そうでなければ、ステップ203において、係数w がステップ幅d2だけ大きくされる。
【0037】
したがって、このルーチン200によれば、処理がさらに簡単であり、DSPの負担がより軽くなる。
【0038】
【発明の効果】
この発明によれば、音声がはっきりし、明瞭度を改善できる。また、常に音声の高域を強調するときのような不快感がない。さらに、発声者の口の動きと処理音との間に時間差の生じることがない。
【0039】
また、イヤホンからマイクロフォンへの音響的フィードバックがあっても、残響音のようにならず、聞きやすい。さらに、語音の知覚判断などに有効な情報が損なわれない。しかも、デジタル処理する場合の負担を少なくすることができる。
【図面の簡単な説明】
【図1】この発明の一形態を示す系統図である。
【図2】この発明を説明するための図である。
【図3】この発明の一形態の一部を示すフローチャートである。
【図4】この発明を説明するための波形図である。
【図5】この発明の一形態の一部を示すフローチャートである。
【符号の説明】
12…有声音帯域フィルタ、13…加算回路、14…子音帯域フィルタ、15…可変利得アンプ、21…バンドパスフィルタ、22…レベル算出回路、23…検出回路、24…制御回路、100…処理ルーチン

Claims (6)

  1. 入力音声信号から、有声音の帯域を通過帯域とし有声音の帯域成分を取り出す第1の取り出し回路と、
    上記入力音声信号から、子音の帯域を通過帯域とし子音の帯域成分を取り出す第2の取り出し回路と、
    上記第2の取り出し回路によって取り出された上記子音の帯域成分の振幅の変更を行なう振幅変更回路と、
    上記第1の取り出し回路によって取り出された有声音の帯域成分と、上記振幅変更回路によって振幅が変更された子音の帯域成分とを加算する加算回路と、
    上記入力音声信号のピッチ成分およびフォルマント成分を抽出する抽出回路と、
    この抽出回路の抽出出力から上記入力音声信号における上記有声音の開始点を検出する有声音開始点検出回路と、
    上記抽出回路の抽出出力から上記入力音声信号における上記有声音の終了点を検出する有声音終了点検出回路と、
    上記有声音開始点検出回路および上記有声音終了点検出回路により検出された上記有声音の開始点から終了判定点からの立下りまでの区間のみ、上記振幅変更回路の利得を基準値に対し大きくし、上記有声音終了点検出回路により検出された上記有声音の終了点からの立下り区間において上記振幅変更回路の利得を上記基準値まで下げるように上記振幅変更回路に対して制御を行う制御回路と
    を有する音声信号の処理回路。
  2. 請求項1に記載の音声信号の処理回路において、
    上記有声音開始点検出回路は、上記有声音の信号レベルが所定のしきい値を越えたとき、これを検出して上記開始点の検出信号とする
    ようにした音声信号の処理回路。
  3. 請求項1に記載の音声信号の処理回路において、
    上記有声音終了点検出回路は、上記有声音の信号レベルが所定のしきい値を下回ったとき、これを検出して上記終了点の検出信号とする
    ようにした音声信号の処理回路。
  4. 請求項1に記載の音声信号の処理回路において、
    上記振幅変更回路が可変利得アンプである
    ようにした音声信号の処理回路。
  5. 請求項1〜請求項4に記載の音声信号の処理回路において、
    上記有声音の開始点から数ミリ秒〜十数ミリ秒の期間を立ち上がり期間とし、上記有声音の終了点から十数ミリ秒〜数十ミリ秒の期間を立ち下がり期間とするとき、上記立ち上がり期間から上記立ち下がり期間にかけて、上記振幅変更回路の利得を変更する
    ようにした音声信号の処理回路。
  6. 入力音声信号から、有声音の帯域を通過帯域とし有声音の帯域成分を取り出す第1の取り出しステップと、
    上記入力音声信号から、子音の帯域を通過帯域とし子音の帯域成分を取り出す第2の取り出しステップと、
    この第2の取り出しステップによって取り出された上記子音の帯域成分の振幅の変更を行なう振幅変更ステップと、
    上記第1の取り出しステップによって取り出された有声音の帯域成分と、上記振幅変更ステップによって振幅が変更された子音の帯域成分とを加算する加算ステップと、
    上記入力音声信号のピッチ成分およびフォルマント成分を抽出する抽出ステップと、
    この抽出ステップの抽出出力から上記入力音声信号における上記有声音の開始点を検出する有声音開始点検出ステップと、
    上記抽出ステップの抽出出力から上記入力音声信号における上記有声音の終了点を検出する有声音終了点検出ステップと、
    上記有声音開始点検出ステップおよび上記有声音終了点検出ステップの出力に基づいて上記振幅変更ステップの利得を制御する制御ステップと
    を有し、
    この制御ステップは、上記有声音開始点検出ステップが上記開始点を検出したとき、上記振幅変更ステップに対して上記利得を基準値よりも大きくするように制御信号を供給するとともに、
    上記有声音終了点検出ステップが上記終了点を検出したとき、上記振幅変更ステップに対して上記利得を上記基準値に戻すように上記制御信号を供給する
    ことを特徴とした音声信号の処理方法。
JP09914497A 1997-04-16 1997-04-16 音声信号の処理回路および処理方法 Expired - Fee Related JP4079478B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09914497A JP4079478B2 (ja) 1997-04-16 1997-04-16 音声信号の処理回路および処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09914497A JP4079478B2 (ja) 1997-04-16 1997-04-16 音声信号の処理回路および処理方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007335479A Division JP2008102551A (ja) 2007-12-27 2007-12-27 音声信号の処理装置およびその処理方法

Publications (2)

Publication Number Publication Date
JPH10290497A JPH10290497A (ja) 1998-10-27
JP4079478B2 true JP4079478B2 (ja) 2008-04-23

Family

ID=14239515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09914497A Expired - Fee Related JP4079478B2 (ja) 1997-04-16 1997-04-16 音声信号の処理回路および処理方法

Country Status (1)

Country Link
JP (1) JP4079478B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006087018A (ja) * 2004-09-17 2006-03-30 Matsushita Electric Ind Co Ltd 音響処理装置
JP6296219B2 (ja) * 2012-07-13 2018-03-20 パナソニックIpマネジメント株式会社 補聴装置
JP7176260B2 (ja) * 2018-07-06 2022-11-22 カシオ計算機株式会社 音声信号処理装置、音声信号処理方法、および補聴器

Also Published As

Publication number Publication date
JPH10290497A (ja) 1998-10-27

Similar Documents

Publication Publication Date Title
US5737719A (en) Method and apparatus for enhancement of telephonic speech signals
US20110004468A1 (en) Hearing aid and hearing-aid processing method
JP2003520469A (ja) 雑音低減装置及び方法
WO2012042768A1 (ja) 音声処理装置および音声処理方法
EP2081405A1 (en) A hearing aid adapted to a specific type of voice in an acoustical environment, a method and use
US7340231B2 (en) Method of programming a communication device and a programmable communication device
JP2011075728A (ja) 音声帯域拡張装置および音声帯域拡張プログラム
US20090257609A1 (en) Method for Noise Reduction and Associated Hearing Device
JPH0968997A (ja) 音声処理方法及び装置
JP3789503B2 (ja) 音声処理装置
JP4774255B2 (ja) 音声信号処理方法、装置及びプログラム
JP2008102551A (ja) 音声信号の処理装置およびその処理方法
KR100956167B1 (ko) 한국어 주파수 특성에 맞는 다채널 디지털 보청기의 채널설정방법 및 이를 이용한 다채널 디지털 보청기
JP2000152394A (ja) 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置
JP4079478B2 (ja) 音声信号の処理回路および処理方法
JP2006333396A (ja) 音声信号拡声装置
KR100883896B1 (ko) 음성명료도 향상장치 및 방법
JP3596580B2 (ja) 音声信号の処理回路
JP3303446B2 (ja) 音声信号処理装置
JP4005166B2 (ja) 音声信号の処理回路
JP5188558B2 (ja) 音声処理装置
JPH0916193A (ja) 話速変換装置
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
JP3219892B2 (ja) リアルタイム話速変換装置
JPH06289898A (ja) 音声信号処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041013

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050706

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050711

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20051111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071024

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110215

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110215

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees