JPH06289896A - 音声の特徴強調方式および装置 - Google Patents

音声の特徴強調方式および装置

Info

Publication number
JPH06289896A
JPH06289896A JP7334693A JP7334693A JPH06289896A JP H06289896 A JPH06289896 A JP H06289896A JP 7334693 A JP7334693 A JP 7334693A JP 7334693 A JP7334693 A JP 7334693A JP H06289896 A JPH06289896 A JP H06289896A
Authority
JP
Japan
Prior art keywords
frequency
voice
fourier transform
pitch
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7334693A
Other languages
English (en)
Inventor
Yoshito Nene
義人 禰寝
Hiroshi Ikeda
宏 池田
Tatsu Ifukube
達 伊福部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7334693A priority Critical patent/JPH06289896A/ja
Publication of JPH06289896A publication Critical patent/JPH06289896A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)

Abstract

(57)【要約】 【目的】 音声の特徴から新たな特徴を合成し、合成さ
れた特徴を強調することで、難聴者にとって聞き取り易
い音声に加工する方式および装置を提供する。 【構成】 ホルマント検出手段11にて入力音声の複数
のホルマント周波数を検出し、検出された各々のホルマ
ント周波数の整数倍の周波数同士の差に相当する特徴周
波数成分を特徴周波数合成手段12にて求める。入力音
声に対して求めた特徴周波数成分を特徴周波数成分加工
手段13にて付加または強調する。あるいは、入力音声
のピッチ周波数を検出し、検出されたピッチ周波数成分
を強調する。 【効果】 聴覚系内部で生成される特徴があらかじめ強
調されるため、特徴生成能力の衰えた難聴者に対して、
音声の明瞭度が向上する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、衰えた聴覚特性を補助
するための音声信号処理方式に係り、とくに音声の特徴
を加工する音声の特徴強調方式および装置、更にはそれ
を用いた各種機器に関する。
【0002】
【従来の技術】難聴者の聴覚を補助する手段として、従
来アナログ回路を用いて音声の振幅及びその周波数特性
を加工するアナログ型補聴器が主に使用されてきた。こ
れに対し近年、ディジタル信号処理を聴覚障害の補償に
応用するための研究開発が盛んに行われている。この研
究開発動向については、例えば日本音響学会誌(199
1年47巻10号、P760〜P765)「聴覚障害補
償へのディジタル技術の応用」やJ.Acoust.S
oc.Am.(90(2),Pt.1,Aug.199
1)”Speech−perception aids
for hearing−impaied peop
le:Current status and nee
ded research”等に詳述されている。 一
般に聴力の損失を補うためには、音圧レベルの増幅とダ
イナミックレンジの圧縮を、使用者の聴力特性に合わせ
て周波数ごとに行う。従来のアナログ補聴器では、この
ような処理をアナログ回路で実現している。また、近年
開発されているディジタル補聴器では、この処理をディ
ジタルフィルタ等のソフトウエアで実現することで、使
用者の聴力特性への適合がより詳細に行えるようにして
いる。 一方、このような音圧レベルの増幅とダイナミ
ックレンジの圧縮だけでは、ある程度の効果しか得られ
ないことから、音声の特徴的な周波数成分や波形上の特
徴的な部分を加工することで、聴覚の劣化を補償しよう
とする試みもなされている。このような処理は、難聴者
の周波数分解能、時間分解能、スペクトル弁別能、音像
合成能力等の劣化を補うことを目的としており、例えば
日本音響学会誌(1987年43巻5号、P356〜P
361)「音声特徴抽出機能を備えたディジタル補聴
器」等に詳しくまとめられている。 このような特徴加
工型の音声加工方式は主にスペクトルを加工する方法と
波形を加工する方法との2つに分類される。前者は主に
スペクトル転移方式、スペクトル圧縮方式、ホルマント
強調方式等があり、後者には子音の音圧強調方式、持続
時間伸長方式、無音区間挿入方式等がある。これらの方
式は初めから聴覚障害の補償にために開発された方式も
あれば、ヘリウム音声の修復や、放送での会話調節等、
他の目的に開発された方式もある。
【0003】
【発明が解決しようとする課題】一般に人間には、入力
音声に元々含まれていない情報を、脳内で作り出して言
語理解の補助に利用する能力がある。文脈から欠落した
言葉を予測できる能力などは、高次の言語処理機能にお
けるその一例である。また、より末梢に近いレベルの処
理においても、入力には元々含まれていない成分が聴覚
系の内部で作り出されている。
【0004】上記従来の技術においては、元々入力音声
に含まれている特徴を、強調あるいは加工することが行
われている。よって、入力音声以外の雑音情報を増幅し
てしまったり、逆に入力音声の特徴を崩してしまう恐れ
もあった。
【0005】聴覚系処理機構が入力音声に存在していな
かった特徴を作り出し、音声の知覚に役立てていること
についての考慮がされておらず、本発明の目的は、例え
ば健常者であれば、聴覚系内部で作り出されると予想さ
れ、音声の近くに役立てている音声の特徴、つまり入力
音声に元々含まれていなかった音声の特徴や、また電話
通信などにおいて元々含まれてはいたが伝達途中で欠落
してしまった音声の特徴を、入力音声に対して付加ある
いは強調することによって、劣化した聴力を補償する方
式および装置を提供することにある。
【0006】
【課題を解決するための手段】上記課題を解決するため
の第一の手段は、入力音声中に含まれる複数のホルマン
ト周波数を検出し、検出された各ホルマント周波数の整
数倍の周波数同志の差に相当する周波数の成分を、付加
あるいは強調するものである。上記課題を解決するため
の第二の手段は、入力音声のピッチ周波数(基本周波
数)を検出し、検出されたピッチ周波数成分を付加ある
いは強調するものである。
【0007】
【作用】一般に人間(健常者)は、入力には元々含まれ
ていない成分を聴覚系内部で作り出して音声を聞いてい
る。例えば、f1、f2という異なる周波数を持つ2つ
のシングルトーンを同時に聞いた場合に、(f2−f
1)という周波数成分や(f1−n×(f2−f1))
という周波数成分を他の周波数よりも強く感じ取ってい
ことが知られている。このことはたとえばJ.Acou
st.Soc.Am.(51,1972)”Audit
ory Distortion Product f2
ーf1 and 2f1ーf2”等に詳述されている。
すなわち人間の聴覚系では、抹消機能そのものに非線形
性があり、それによって作り出された成分が、その後の
聴覚系の処理に大きな役割を果たしている場合がある。
【0008】ところで、難聴者の聴覚においては、この
ような入力音声には無かった特徴成分を、聴覚系内部で
作り出す能力が健常者と異なっていることが最近わかっ
てきた。これについては、例えば、日本音響学会平成3
年度秋季研究発表会講演論文集 (1−7−3)「難聴
者における結合音知覚特性」等に述べられている。すな
わち、難聴者の聴力の衰えの原因には、聴力レベルの低
下とともに、このような聴覚神経系内で音声知覚に必要
な情報を作り出す能力の低下も考えられる。
【0009】上記本発明の第1の手段においては、まず
ホルマント周波数を検出する手段により入力音声のホル
マントが存在する複数の周波数が検出される。そして検
出されたホルマント周波数の整数倍の周波数同志の差に
相当する周波数が求められる。これにより求められた周
波数成分は、健常者の聴覚系内部において強調される周
波数に相当する。難聴者において、これらの成分を聴覚
系処理機構で作り出す機能が衰えたことによって聴力機
能が衰えている場合には、これらの成分をもとの音声信
号に付加あるいは、もしもとの音声信号にこの成分が存
在しているならばその周波数成分を強調することによっ
て、衰えた聴覚を補助することが可能となる。
【0010】一方、一般の電話通信においては伝達され
る音声の帯域が制限されており、実際に発せられた音声
の持つ周波数成分の内、およそ300Hzから3.3k
Hzの間にある情報のみが効率良く伝達され、それ以外
の周波数成分の情報は欠落あるいは減衰することが多
い。従って電話通信においては、300Hz以下の帯域
にある音声のピッチ周波数(基本周波数)成分は、著し
く減衰して伝えられる。
【0011】健常者においては、このような帯域制限に
よりピッチ周波数成分の減衰した電話音声でも正しく内
容を聞き取ることができる。ところが難聴者、とくに高
齢者に多い感音性難聴の場合、比較的高い周波数に対す
る聴力が衰えることが多いため、帯域制限によりピッチ
周波数を含む低い周波数の情報が欠落すると、通常会話
で重要な手がかりとなっている情報が受け取れなくな
り、音声の聞き取りが極端に悪くなることが多い。上記
従来の技術においては、このように元々存在していた情
報が伝送中に欠落した場合に、受け手側でその情報を補
って音声の聞き取りを向上させる方法についても考慮さ
れていなかった。
【0012】上記本発明の第2の手段においては、まず
入力音声が持つピッチ周波数成分が検出される。このピ
ッチ周波数成分は、直接音声を聴取する場合には何等問
題無く与えられるが、電話などの通信装置を通じて得ら
れる音声では、通信系における周波数帯域に制限がある
ため、減衰あるいは消滅していることが多い。健常者に
おいては、このピッチ周波数成分が無い場合でも、より
高い周波数帯域に存在する音声情報のみを基に音声を聞
き取っている。しかし、難聴者とくに高齢者に多い感音
性難聴者の場合には、高い周波数帯域の聴力レベルが低
い周波数帯域に比べより劣化する傾向にあるので、直接
音声を聞く場合に低い周波数帯域の音声情報に依存する
度合いが高くなっており、このためピッチ周波数が含ま
れる低い周波数帯域の情報が少ない場合には、極端に聞
き取り能力が悪くなる。このようなピッチ周波数成分の
減衰あるいは消滅によって音声の聞き取りにくくなって
いる場合には、そのピッチ周波数成分を元の音声信号に
付加あるいは、もし元の音声信号にこの成分が存在する
場合にはその周波数成分を強調することによって、衰え
た聴覚を補助することが可能となる。
【0013】
【実施例】以下、本発明を実施例を用いて詳細に説明す
る。
【0014】図1は本発明の第1の音声の特徴強調手段
を表す実施例の構成図、図2は本手段の音声加工の概念
を表す図である。入力された音声信号はホルマント周波
数検出手段11により、その時点の入力音声に含まれる
ホルマント周波数が抽出される。ここで言うホルマント
周波数とは、ある時間幅の音声信号を分析して得られる
周波数成分の分布の包絡線上のピークが示す周波数であ
る。一般にこのピークは図2に示すように複数個同時に
存在し、ホルマント周波数は周波数の低い方から第1、
第2、…と番号づけて呼ばれる。このうち第2および第
3ホルマントは、発声した人にはよらず発声した母音に
よって、その周波数が一定の範囲に分布することから、
母音の特徴を示す重要なパラメ−タとなる。以下この第
2および第3ホルマント周波数をf2、f3と表す。本
実施例では抽出されたホルマント周波数のうちこのf
2、f3の値が、図1に示した特徴周波数合成手段12
に送られる。特徴周波数合成手段12では、
【0015】
【数1】 fa=f3−f2 …(数1) あるいは
【0016】
【数2】 fb=2×f2−f3 …(数2) という計算により、付加または強調を行う新しい特徴周
波数成分faまたはfbが求められる。そして特徴周波
数成分加工手段13においては、これらの周波数成分が
入力音声に対して付加あるいは強調される。
【0017】図3は、図1に示した第1の音声の特徴強
調手段をケプストラムを利用して実現した場合の詳細な
構成図である。マイク101等の入力手段からの入力音
声はAD変換器102によってディジタル化され,フレ
ーム切り出し手段103によって時間窓がかけられフレ
ームに切り出されたのち、ホルマント周波数検出手段1
1に渡される。このホルマント周波数検出手段11では
フーリエ変換手段111によるフーリエ変換(以下F
T)によってまず周波数分析される。この結果から周波
数ごとの振幅の分布を示すパワースペクトラムが得られ
る。このパワースペクトラムを対数変換手段112によ
り対数変換し、逆フーリエ変換手段113により逆フー
リエ変換(以下IFT)をしてケプストラム分布を得
る。このケプストラム分布中の高いケフレンシー領域に
存在しているピッチに相当するケプストラム成分をピッ
チ成分除去手段114のリフター(ケプストラム領域で
のフィルター)により除去した後、もう一度フーリエ変
換手段115によりFTを行いスペクトル包絡線を得
る。この包絡線に対してピーク検出手段116によりピ
ーク検出処理を行いホルマント周波数の検出をおこな
う。検出されたホルマント周波数のうちのf2およびf
3の値を用いて、特徴周波数合成手段12にて上記の
(数1)(数2)の数式によりfaとfbが算出され
る。特徴周波数成分加工手段13の特徴周波数強調手段
131は、初めのFTの結果であるホルマント周波数検
出手段11中のフーリエ変換手段111からのパワース
ペクトラムと上記faまたはfbを入力として受け取
り、faとfbに相当する周波数成分のパワーを増加さ
せる。そして最後に、逆フーリエ変換手段132にてI
FTを行い,フレーム間合成手段104にてフレーム間
合成を行って,DA変換器105にてアナログ信号に変
換して出力音声を得る。その出力音声はスピーカ106
等の出力手段を介して出力される。なお、本実施例にお
いてはfaおよびfbの算出を(数1)および(数2)
によるものとしているが、f2およびf3以外のホルマ
ント周波数を用いたり、(数1)(数2)以外の算出方
法によって付加あるいは強調される周波数が得られる場
合でも、まったく同様の構成によって実現できることは
言うまでもない。
【0018】図4は、図1に示した第1の音声の特徴強
調手段をLPCケプストラムを利用して実現した場合の
詳細な構成図である。マイク101等の入力手段からの
入力音声はAD変換器102によってディジタル化さ
れ,フレーム切り出し手段103によって時間窓がかけ
られフレームに切り出されたのち、ホルマント検出手段
11中のLPC分析手段117によりLPC分析されス
ペクトル包絡線に相当するLPCケプストラムを得る。
このLPCケプストラムに対してピーク検出手段118
によりピーク検出処理を行いホルマント周波数の検出を
おこなう。検出されたホルマント周波数のうちのf2お
よびf3の値を用いて、上記の(数1)(数2)の数式
によりfaとfbが算出される。そして,特徴周波数成
分加工手段13の特徴周波数強調手段131は、フーリ
エ変換手段107からの入力フレームのFTの結果であ
るパワースペクトラムと上記faまたはfbを入力とし
て受け取り、上記パワースペクトラム中のfaとfbに
相当する周波数成分のパワーを増加させる。そして最後
に、逆フーリエ変換手段132にてIFTを行い,フレ
ーム間合成手段104にてフレーム間合成を行って,D
A変換器105にてアナログ信号に変換して出力音声を
得る。その出力音声はスピーカ106等の出力手段を介
して出力される。
【0019】図5は本発明の第2の音声の特徴強調手段
を表す実施例の構成図、図6は本手段の音声加工の概念
を表す図である。一般に電話等の通信系を通じて得られ
た音声は、その周波数帯域が制限され、おおよそ300
Hz〜3.2KHzの範囲の周波数成分のみが伝達され
る。このため電話音声を周波数分析した場合には、図6
に示した一例のように、通過帯域以外の成分が著しく減
少している。本発明の第2の音声の特徴強調手段では、
まずこのような帯域制限された入力音声を入力とし、ピ
ッチ周波数検出手段21によりその信号に含まれるピッ
チ周波数fpが検出される。そして、この検出されたピ
ッチ周波数の情報はピッチ周波数成分加工手段22に送
られる。ピッチ周波数成分加工手段22は、ピッチ周波
数の情報と元の入力音声情報とを受け取り、入力音声に
対してピッチ周波数の成分を付加あるいは強調して出力
する。この結果、図6に示したように、本来帯域制限に
より減衰していたピッチ成分が強調されて出力される。
【0020】図7は,図5に示した第2の音声の特徴強
調手段をケプストラムを利用して実現した場合の詳細な
構成図である。マイク201等の入力手段または電話回
線等からの入力音声は,AD変換器202によってディ
ジタル化され,フレーム切り出し手段203によって時
間窓がかけられフレームに切り出されたのち、ピッチ周
波数検出手段21に渡される。このピッチ周波数検出手
段21では、まずフーリエ変換手段211のFTにより
周波数分析が行われ、周波数ごとの振幅の分布を示すパ
ワースペクトラムを得る。これを対数変換手段212に
より対数変換したのち,逆フーリエ変換手段213によ
りIFTを行いケプストラムを得る。ケプストラム中の
高いケフレンシーをもつ領域に対して高ケフレンシー領
域ピーク検出手段214によってピーク検出を行い,検
出されたピ−クの示すケフレンシー値の逆数を逆数変換
手段215により取ることによってピッチ周波数を検出
する。ピッチ周波数成分加工手段22中のピッチ周波数
強調手段221は、この検出されたピッチ周波数fpの
値を受け取り、初めのFTの出力であるピッチ周波数検
出手段21のフーリエ変換手段221からのパワースペ
クトラムに対してピッチ周波数成分を付加あるいは強調
する。そして最後に、逆フーリ変換手段222にて上記
加工されたパワースペクトラムに対してIFTを行い出
力音声デ−タを得る。アナログ信号への変換はフレーム
間合成手段204にてフレーム間合成を行った後、D/
A変換器205により行う。その出力音声はスピーカ2
06等の出力手段を介して出力される。
【0021】図8は、上記第1および第2の音声の特徴
強調手段の両方を同時に実現するための構成の一例を示
す図である。FT処理やIFT処理を行うフーリエ変換
手段311,対数変換手段312,逆フーリエ変換手段
313,320等は両方の処理で共有し、他の処理を独
立して行う。その他の構成要素は,先に説明した図3ま
たは図7などと同様である。もちろん,第1の音声の特
徴強調手段として,図4に示したLPCケプストラムを
利用しても構わない。
【0022】以上,図1から図8に示した本発明の実施
例を補聴器に適用すれば,加齢等によって聴力機能が衰
え,音声の特徴を捕えることが困難になった難聴者で
も,健聴者と同様に音声を聞き取ることが可能となる。
【0023】図9は、本発明の上記第1および第2の音
声の特徴強調手段を電話機に応用する場合の構成を示し
た図である。同図において電話機4の受話回路41は電
話回線を通じて送られてきた信号から音声信号を抽出す
る回路で、送話回路42は逆にハンドセット43中のマ
イクロホン432により得られた音声信号を、電話回線
用の信号に変換して電話回線に送出する回路である。電
話回線がアナログ回線方式の場合には、音声信号がディ
ジタル符号化されていないため、受話回路を通して抽出
されたアナログ音声信号を、上記第1および第2の少な
くとも1つを用いた音声の特徴強調手段(図3,図4,
または図7等参照)である音声の特徴強調手段40内の
AD変換器を利用して一旦ディジタル信号に変換した
後、先に説明した特徴周波数成分の合成/強調処理また
はピッチ周波数成分の強調処理を行い、DA変換器によ
ってアナログ信号に戻してハンドセット43内のスピー
カ431から出力する。なお、ディジタル回線方式の場
合には、送られて来る信号が既にディジタル符号化され
ており、通常のディジタル電話機で行われている複号化
処理を受話回路41内で行い、ディジタル音声信号に変
換した後、上記の特徴周波数成分の合成/強調処理をま
たはピッチ周波数成分の強調処理行い、DA変換器によ
ってアナログ信号に変換して出力することで、同様の効
果が得られることは言うまでもない。
【0024】一方、本実施例による電話機は、使用者に
よって特徴周波数成分あるいはピッチ周波数成分の強調
量を変更する手段44を有している。使用者は通話中に
音声を聞きながら強調量を、例えばボリュームを回すな
どの手段により変化させ、最も聞きやすい強調量におい
て通話を行なう。また本実施例ではこの強調量を表す信
号処理パラメータを記憶するためのパラメータ記憶手段
45を有しており、例えば、通話終了時にその通話で使
われていたパラメータを記憶する。使用者が新たな通話
を行なう際に、過去に使用した条件と同じ条件で通話を
行ないたいと希望する場合には、使用者はパラメータ選
択手段46によってパラメータ記憶手段45中に記憶さ
れているパラメータセットの1つを選択し、このパラメ
ータを音声の特徴強調手段40に転送する。
【0025】さらに、本実施例の電話機のパラメータ選
択手段46には頻度検出手段47が具備されている。こ
の頻度検出手段47は、パラメータ記憶手段45に記憶
されている複数のパラメータセットの中で、最も高い頻
度で使用されたパラメータセットを検出する機能を有し
ており、この最も頻度の高いパラメータセットは、本電
話機により通話を開始する際に、初めに設定される初期
パラメータセットとして使用される。使用者が他のパラ
メータセットで通話を行ないたい場合には、上記パラメ
ータ選択手段46によって選択し直すことができる。
【0026】なお,強調量変更手段44,パラメータ記
憶手段45,パラメータ選択手段46などを具備せず,
あらかじめ音声の特徴強調手段40にデフォルト値を設
定しておき,外部からのスイッチ操作等によって,単に
強調の選択/非選択を指定できるようなシンプルな構成
とすることも可能である。
【0027】図10は、本発明の上記第1および第2の
音声の特徴強調手段をテレビジョン受信機に利用した実
施例を示す図である。放送電波に含まれるテレビジョン
信号はテレビ電波受信回路51により抽出され,抽出さ
れたテレビジョン信号は映像/音声信号分離手段52に
よって映像信号と音声信号に分離される。このうち映像
信号は画像信号処理回路54により処理された後,ディ
スプレイ57に表示される。
【0028】一方,分離された音声信号は,音声信号処
理回路53によって音声帯域のアナログ信号に変換され
た後,音声の特徴強調手段40に渡される。この音声の
特徴強調手段40は,図9の電話機の実施例同様,上記
第1および第2の少なくとも1つを用いた音声の特徴強
調手段(図3,図4,または図7等参照)で,上記で説
明した音声の特徴強調を行なう。そして特徴強調を受け
た音声信号はスピーカ56によって出力される。
【0029】また,本実施例のテレビジョン受信機に
は,パラメータ記憶手段45,パラメータ選択手段4
6,および強調量変更手段44が具備されているが,こ
れらの手段の機能は図9の電話機の実施例と同様であ
る。なお,本実施例においても,これらの手段を具備せ
ずに,あらかじめ音声の特徴強調手段40にデフォルト
値を設定しておき,外部からのスイッチ操作等によっ
て,単に強調の選択/非選択を指定できるようなシンプ
ルな構成とすることも可能である。
【0030】図11は、本発明の上記第1および第2の
音声の特徴強調手段をラジオ受信機に利用した実施例を
示す図である。放送電波に含まれるラジオ信号はラジオ
電波受信回路61により抽出され,音声信号処理回路6
2によって音声帯域のアナログ信号に変換された後,音
声の特徴強調手段40に渡される。この音声の特徴強調
手段40は,図9の電話機の実施例同様,上記第1およ
び第2の少なくとも1つを用いた音声の特徴強調手段
(図3,図4,または図7等参照)で,上記で説明した
音声の特徴強調を行なう。そして特徴強調を受けた音声
信号はスピーカ64によって出力される。
【0031】また,本実施例のラジオ受信機には,パラ
メータ記憶手段45,パラメータ選択手段46,および
強調量変更手段44が具備されているが,これらの手段
の機能は図9の電話機の実施例と同様である。なお,本
実施例においても,これらの手段を具備せずに,あらか
じめ音声の特徴強調手段40にデフォルト値を設定して
おき,外部からのスイッチ操作等によって,単に強調の
選択/非選択を指定できるようなシンプルな構成とする
ことも可能である。
【0032】本発明の応用は,図1から図11に示した
補聴器,電話機,テレビジョン受信機,ラジオ受信機に
限らず広範な音声利用機器に適用可能である。例えば,
テープレコーダ,VTR,CD,DDC,MDなどを用
いた音声録音機器,WS(ワークステーション)やPC
(パーソナルコンピュータ)等に接続された音声出力機
器,音声読み上げ機能を搭載したWP(ワードプロセッ
サ)や電子メールの他,一般個人向けの機器だけでな
く,産業応用分野の機器やシステムにも適用可能であ
る。
【0033】また,本発明の第1および第2の音声の特
徴強調手段は,汎用のDSP(ディジタルシグナルプロ
セッサ)を用いて容易に実現できるが,専用のハードウ
エアや汎用のマイクロコンピュータを用いてソフトウエ
アにて実現しても構わない。
【0034】
【発明の効果】本発明によれば、音声信号中に含まれて
いる特徴から人間の聴覚系処理機構内で作り出される新
たな特徴を、あらかじめ音声信号に対して付加あるいは
強調できるので、このような特徴抽出および合成機能が
衰えたことによって聴力機能が衰えている難聴者でも、
健常者と同様に音声を聞き取ることが可能となる。 と
くに、回線の特性からピッチ情報が極端に劣化する電話
音声に本発明を適用し、ピッチ周波数成分を強調した場
合、老人性難聴などの高い周波数成分の聴力が衰えた人
々においては、比較的低い周波数帯域あるピッチ情報が
聞き取りの重要な手がかりとなっているので、これらの
人々にとって電話音声が聞き取り易くなるという効果が
ある。
【図面の簡単な説明】
【図1】本発明の第1の音声の特徴強調手段の実施例の
構成図である。
【図2】本発明の第1の音声の特徴強調手段の実施例の
音声加工の概念図である。
【図3】ケプストラムを用いて実現した本発明の第1の
音声の特徴強調手段の実施例の構成図である。
【図4】LPC分析を用いて実現した本発明の第1の音
声の特徴強調手段の実施例の構成図である。
【図5】本発明の第2の音声の特徴強調手段の実施例の
構成図である。
【図6】本発明の第2の音声の特徴強調手段の実施例の
音声加工の概念図である。
【図7】ケプストラムを用いて実現した本発明の第2の
音声の特徴強調手段の実施例の構成図である。
【図8】本発明の第1の音声の特徴強調手段と第2の音
声の特徴強調手段を同時に実現する実施例の構成図であ
る。
【図9】本発明の第1または第2の音声の特徴強調手段
を応用した電話機の構成図である。
【図10】本発明の第1または第2の音声の特徴強調手
段を応用したテレビジョン受信機の構成図である。
【図11】本発明の第1または第2の音声の特徴強調手
段を応用したラジオ受信機の構成図である。
【符号の説明】
1:音声の特徴強調手段、11:ホルマント周波数検出
手段、12:特徴周波数合成手段、13:特徴周波数成
分加工手段、2:音声の特徴強調手段、21:ピッチ周
波数検出手段、22:ピッチ周波数成分加工手段、3:
音声の特徴強調手段、4:音声の特徴強調手段を有する
電話機、41:受話回路、42:送話回路、43:ハン
ドセット、44:強調量変更手段、45:パラメータ記
憶手段、46:パラメータ選択手段、47:頻度検出手
段、5:音声の特徴強調手段を有するテレビジョン受信
機、51:テレビ電波受信回路、52:映像/音声信号
分離回路、53:音声信号処理回路、54:画像信号処
理回路、6:音声の特徴強調手段を有するラジオ受信
機、61:ラジオ電波受信回路、62:音声信号処理回
路。

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】入力音声の複数のホルマント周波数を検出
    し、この検出された複数のホルマント周波数より、各々
    の整数倍の周波数同士の加算あるいは減算により特徴周
    波数を合成し、上記入力音声中に含まれる上記合成され
    た特徴周波数成分のパワーを強調することを特徴とする
    音声の特徴強調方式。
  2. 【請求項2】入力音声の複数のホルマント周波数を検出
    するホルマント周波数検出手段と、この検出された複数
    のホルマント周波数より、各々の整数倍の周波数同士の
    加算あるいは減算により特徴周波数を合成する特徴周波
    数合成手段と、上記入力音声中に含まれる上記合成され
    た特徴周波数成分のパワーを強調する特徴周波数成分加
    工手段を有することを特徴とする音声の特徴強調装置。
  3. 【請求項3】請求項2記載において、上記ホルマント周
    波数検出手段におけるホルマント周波数の検出は、上記
    入力音声に対してケプストラム解析を行うことによって
    得られるスペクトル包絡線上のピーク検出によって実現
    することを特徴とする音声の特徴強調装置。
  4. 【請求項4】請求項2記載において、上記特徴周波数合
    成手段は、検出された複数のホルマント周波数のうち、
    2つの異なるホルマント周波数を、 fn(n=1,2,…)およびfm(m=1,2,…) (但し、n≠m) と表した場合に、上記入力音声中に含まれる、 fx=i×fn−j×fm(i=1,2,…;j=1,
    2,…) なる式で表される特徴周波数fxとして合成することを
    特徴とする音声の特徴強調装置。
  5. 【請求項5】請求項4記載において、上記特徴周波数f
    xは、 n=3,m=2,i=1,j=1 として得られる特徴周波数faと、 n=2,m=3,i=2,j=1 として得られる特徴周波数fbの、少なくともどちらか
    一方とすることを特徴とする音声の特徴強調装置。
  6. 【請求項6】請求項2記載において、上記入力音声を音
    響−電気変換する入力手段と、変換されたアナログ信号
    をディジタル信号に変換するA/D変換器と、ディジタ
    ル信号に変換された入力音声データに、時間窓をかけて
    有限長の音声フレームに分割して切り出すフレーム切り
    出し手段を備え、 上記ホルマント周波数検出手段は、上記音声フレームに
    対して第1のフーリエ変換を行ない、周波数ごとの振幅
    を示すパワースペクトラムを得る第1のフーリエ変換手
    段と、このパワースペクトラムを対数変換する対数変換
    手段と、この対数変換された結果を入力として逆フーリ
    エ変換を行ない、ケプストラム分布を得る第1の逆フー
    リエ変換手段と、このケプストラム分布上のピッチに相
    当する成分を除去するピッチ成分除去手段と、このピッ
    チ成分が除去された結果に対してフーリエ変換を行な
    い、スペクトル包絡線を得る第2のフーリエ変換手段
    と、得られたスペクトル包絡線上のピーク検出によって
    複数のホルマント周波数を検出するピーク検出手段を備
    え、 上記特徴周波数成分加工手段は、上記第1のフーリエ変
    換手段にて得られたパワースペクトラムと、上記特徴周
    波数合成手段にて合成された特徴周波数を入力し、特徴
    周波数成分のパワーを強調する特徴周波数強調手段と、
    その結果に対して逆フーリエ変換を行ない、出力音声デ
    ータを得る第2の逆フーリエ変換手段を備え、 この出力音声データをつなぎ合わせてフレーム間合成を
    行なうフレーム間合成手段と、合成された出力音声デー
    タをディジタル信号からアナログ信号に変換するD/A
    変換器と、変換されたアナログ信号を電気−音響変換し
    て出力音声を出力する出力手段を備えたことを特徴とす
    る音声の特徴強調装置。
  7. 【請求項7】請求項2記載において、上記ホルマント周
    波数検出手段におけるホルマント周波数の検出は、上記
    入力音声に対してLPC解析を行うことによって得られ
    るスペクトル包絡線上のピーク検出によって実現するこ
    とを特徴とする音声の特徴強調装置。
  8. 【請求項8】請求項2記載において、上記入力音声を音
    響−電気変換する入力手段と、変換されたアナログ信号
    をディジタル信号に変換するA/D変換器と、ディジタ
    ル信号に変換された入力音声データに、時間窓をかけて
    有限長の音声フレームに分割して切り出すフレーム切り
    出し手段を備え、 上記ホルマント周波数検出手段は、上記音声フレームに
    対してLPC分析し、スペクトル包絡線に相当するLP
    Cケプストラムを得るLPC分析手段と、このLPCケ
    プストラムに対してピーク検出を行ない、ホルマント周
    波数の検出を行なうピーク検出手段を備え、 上記音声フレームに対してフーリエ変換を行ない、周波
    数ごとの振幅を示すパワースペクトラムを得るフーリエ
    変換手段を備え、 上記特徴周波数成分加工手段は、上記フーリエ変換手段
    にて得られたパワースペクトラムと、上記特徴周波数合
    成手段にて合成された特徴周波数を入力し、特徴周波数
    成分のパワーを強調する特徴周波数強調手段と、その結
    果に対して逆フーリエ変換を行ない、出力音声データを
    得る逆フーリエ変換手段を備え、 この出力音声データをつなぎ合わせてフレーム間合成を
    行なうフレーム間合成手段と、合成された出力音声デー
    タをディジタル信号からアナログ信号に変換するD/A
    変換器と、変換されたアナログ信号を電気−音響変換し
    て出力音声を出力する出力手段を備えたことを特徴とす
    る音声の特徴強調装置。
  9. 【請求項9】入力音声のピッチ周波数を検出し、この検
    出されたピッチ周波数成分のパワーを強調することを特
    徴とする音声の特徴強調方式。
  10. 【請求項10】入力音声のピッチ周波数を検出するピッ
    チ周波数検出手段と、この検出されたピッチ周波数成分
    のパワーを強調するピッチ周波数成分加工手段を有する
    ことを特徴とする音声の特徴強調装置。
  11. 【請求項11】請求項10記載において、上記入力音声
    を音響−電気変換する入力手段と、変換されたアナログ
    信号をディジタル信号に変換するA/D変換器と、ディ
    ジタル信号に変換された入力音声データに、時間窓をか
    けて有限長の音声フレームに分割して切り出すフレーム
    切り出し手段を備え、 上記ピッチ周波数検出手段は、上記音声フレームに対し
    てフーリエ変換を行ない、周波数ごとの振幅を示すパワ
    ースペクトラムを得るフーリエ変換手段と、このパワー
    スペクトラムを対数変換する対数変換手段と、この対数
    変換された結果を入力として逆フーリエ変換を行ない、
    ケプストラム分布を得る第1の逆フーリエ変換手段と、
    このケプストラム分布中の高いケフレンシーを有する領
    域に対してピーク検出を行なう高ケフレンシー領域ピー
    ク検出手段と、検出されたピークの示すケフレンシー値
    の逆数を取りピッチ周波数を検出する逆数変換手段を備
    え、 上記ピッチ周波数成分加工手段は、上記フーリエ変換手
    段にて得られたパワースペクトラムと、上記逆数変換手
    段にて検出されたピッチ周波数を入力し、ピッチ周波数
    成分のパワーを強調するピッチ周波数強調手段と、その
    結果に対して逆フーリエ変換を行ない、出力音声データ
    を得る第2の逆フーリエ変換手段を備え、 この出力音声データをつなぎ合わせてフレーム間合成を
    行なうフレーム間合成手段と、合成された出力音声デー
    タをディジタル信号からアナログ信号に変換するD/A
    変換器と、変換されたアナログ信号を電気−音響変換し
    て出力音声を出力する出力手段を備えたことを特徴とす
    る音声の特徴強調装置。
  12. 【請求項12】入力音声の複数のホルマント周波数とピ
    ッチ周波数を検出し、上記検出された複数のホルマント
    周波数より、各々の整数倍の周波数同士の加算あるいは
    減算により特徴周波数を合成し、上記入力音声中に含ま
    れる上記合成された特徴周波数成分と上記検出されたピ
    ッチ周波数成分の両方のパワーを強調することを特徴と
    する音声の特徴強調方式。
  13. 【請求項13】入力音声を音響−電気変換する入力手段
    と、変換されたアナログ信号をディジタル信号に変換す
    るA/D変換器と、ディジタル信号に変換された入力音
    声データに、時間窓をかけて有限長の音声フレームに分
    割して切り出すフレーム切り出し手段を備え、 上記音声フレームに対して第1のフーリエ変換を行な
    い、周波数ごとの振幅を示すパワースペクトラムを得る
    第1のフーリエ変換手段と、このパワースペクトラムを
    対数変換する対数変換手段と、この対数変換された結果
    を入力として逆フーリエ変換を行ない、ケプストラム分
    布を得る第1の逆フーリエ変換手段と、このケプストラ
    ム分布上のピッチに相当する成分を除去するピッチ成分
    除去手段と、このピッチ成分が除去された結果に対して
    フーリエ変換を行ない、スペクトル包絡線を得る第2の
    フーリエ変換手段と、得られたスペクトル包絡線上のピ
    ーク検出によって複数のホルマント周波数を検出するピ
    ーク検出手段と、上記ケプストラム分布中の高いケフレ
    ンシーを有する領域に対してピーク検出を行なう高ケフ
    レンシー領域ピーク検出手段と、検出されたピークの示
    すケフレンシー値の逆数を取りピッチ周波数を検出する
    逆数変換手段を備え、 上記検出された複数のホルマント周波数より、各々の整
    数倍の周波数同士の加算あるいは減算により特徴周波数
    を合成する特徴周波数合成手段を備え、 上記第1のフーリエ変換手段にて得られたパワースペク
    トラムと、上記特徴周波数合成手段にて合成された特徴
    周波数と、上記逆数変換手段にて検出されたピッチ周波
    数を入力し、特徴周波数成分およびピッチ周波数成分の
    パワーを強調する特徴周波数強調手段と、その結果に対
    して逆フーリエ変換を行ない、出力音声データを得る第
    2の逆フーリエ変換手段を備え、 この出力音声データをつなぎ合わせてフレーム間合成を
    行なうフレーム間合成手段と、合成された出力音声デー
    タをディジタル信号からアナログ信号に変換するD/A
    変換器と、変換されたアナログ信号を電気−音響変換し
    て出力音声を出力する出力手段を備えたことを特徴とす
    る音声の特徴強調装置。
  14. 【請求項14】請求項2〜8、10〜11,及び13記
    載のいずれかの音声の特徴強調装置を有することを特徴
    とする補聴器。
  15. 【請求項15】請求項2〜8、10〜11,及び13記
    載のいずれかの音声の特徴強調装置を有することを特徴
    とする電話機。
  16. 【請求項16】請求項15記載において、上記特徴周波
    数成分または上記ピッチ周波数成分の強調量または周波
    数を使用者が変更する強調量変更手段を有することを特
    徴とする電話機。
  17. 【請求項17】請求項16記載において、上記使用者に
    よって変更した強調量または周波数を表すパラメータセ
    ットを記憶するパラメータ記憶手段と、使用者が過去に
    選択したパラメータセットを上記パラメータ記憶手段か
    ら選択し、過去に使用したパラメータセットと同じパラ
    メータセットを使用して処理を行なうためのパラメータ
    選択手段を有することを特徴とする電話機。
  18. 【請求項18】請求項17記載において、上記パラメー
    タ選択手段は、上記パラメータ記憶手段へのパラメータ
    セットの記憶を複数回行なった後、複数のパラメータセ
    ットの中で最も使用頻度の高いパラメータセットを検出
    する頻度検出手段と、使用開始に設定する初期パラメー
    タセットとして、最も頻度の高かったパラメータセット
    を設定するための手段を有することを特徴とする電話
    機。
  19. 【請求項19】請求項2〜8、10〜11,及び13記
    載のいずれかの音声の特徴強調装置を有することを特徴
    とするテレビジョン受信機。
  20. 【請求項20】請求項19記載において、上記特徴周波
    数成分または上記ピッチ周波数成分の強調量または周波
    数を使用者が変更する強調量変更手段を有することを特
    徴とするテレビジョン受信機。
  21. 【請求項21】請求項20記載において、上記使用者に
    よって変更した強調量または周波数を表すパラメータセ
    ットを記憶するパラメータ記憶手段と、使用者が過去に
    選択したパラメータセットを上記パラメータ記憶手段か
    ら選択し、過去に使用したパラメータセットと同じパラ
    メータセットを使用して処理を行なうためのパラメータ
    選択手段を有することを特徴とするテレビジョン受信
    機。
  22. 【請求項22】請求項21記載において、上記パラメー
    タ選択手段は、上記パラメータ記憶手段へのパラメータ
    セットの記憶を複数回行なった後、複数のパラメータセ
    ットの中で最も使用頻度の高いパラメータセットを検出
    する頻度検出手段と、使用開始に設定する初期パラメー
    タセットとして、最も頻度の高かったパラメータセット
    を設定するための手段を有することを特徴とするテレビ
    ジョン受信機。
  23. 【請求項23】請求項2〜8、10〜11,及び13記
    載のいずれかの音声の特徴強調装置を有することを特徴
    とするラジオ受信機。
  24. 【請求項24】請求項23記載において、上記特徴周波
    数成分または上記ピッチ周波数成分の強調量または周波
    数を使用者が変更する強調量変更手段を有することを特
    徴とするラジオ受信機。
  25. 【請求項25】請求項24記載において、上記使用者に
    よって変更した強調量または周波数を表すパラメータセ
    ットを記憶するパラメータ記憶手段と、使用者が過去に
    選択したパラメータセットを上記パラメータ記憶手段か
    ら選択し、過去に使用したパラメータセットと同じパラ
    メータセットを使用して処理を行なうためのパラメータ
    選択手段を有することを特徴とするラジオ受信機。
  26. 【請求項26】請求項25記載において、上記パラメー
    タ選択手段は、上記パラメータ記憶手段へのパラメータ
    セットの記憶を複数回行なった後、複数のパラメータセ
    ットの中で最も使用頻度の高いパラメータセットを検出
    する頻度検出手段と、使用開始に設定する初期パラメー
    タセットとして、最も頻度の高かったパラメータセット
    を設定するための手段を有することを特徴とするラジオ
    受信機。
JP7334693A 1993-03-31 1993-03-31 音声の特徴強調方式および装置 Pending JPH06289896A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7334693A JPH06289896A (ja) 1993-03-31 1993-03-31 音声の特徴強調方式および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7334693A JPH06289896A (ja) 1993-03-31 1993-03-31 音声の特徴強調方式および装置

Publications (1)

Publication Number Publication Date
JPH06289896A true JPH06289896A (ja) 1994-10-18

Family

ID=13515512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7334693A Pending JPH06289896A (ja) 1993-03-31 1993-03-31 音声の特徴強調方式および装置

Country Status (1)

Country Link
JP (1) JPH06289896A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008026777A (ja) * 2006-07-25 2008-02-07 Casio Comput Co Ltd 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム
JP2009058708A (ja) * 2007-08-31 2009-03-19 Internatl Business Mach Corp <Ibm> 音声処理システム、方法及びプログラム
WO2010087171A1 (ja) * 2009-01-29 2010-08-05 パナソニック株式会社 補聴器および補聴処理方法
JP2010266150A (ja) * 2009-05-15 2010-11-25 Zojirushi Corp 調理器
JP2014219567A (ja) * 2013-05-08 2014-11-20 日本放送協会 音声強調装置、及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008026777A (ja) * 2006-07-25 2008-02-07 Casio Comput Co Ltd 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム
JP2009058708A (ja) * 2007-08-31 2009-03-19 Internatl Business Mach Corp <Ibm> 音声処理システム、方法及びプログラム
US8812312B2 (en) 2007-08-31 2014-08-19 International Business Machines Corporation System, method and program for speech processing
WO2010087171A1 (ja) * 2009-01-29 2010-08-05 パナソニック株式会社 補聴器および補聴処理方法
US8374877B2 (en) 2009-01-29 2013-02-12 Panasonic Corporation Hearing aid and hearing-aid processing method
JP2010266150A (ja) * 2009-05-15 2010-11-25 Zojirushi Corp 調理器
JP2014219567A (ja) * 2013-05-08 2014-11-20 日本放送協会 音声強調装置、及びプログラム

Similar Documents

Publication Publication Date Title
JP5778778B2 (ja) 補聴器および改善された音声再生方法
Kates et al. Speech intelligibility enhancement
US7243060B2 (en) Single channel sound separation
EP0796489B1 (en) Method for transforming a speech signal using a pitch manipulator
JP4759052B2 (ja) 高周波数再生が強化された補聴器および音声信号処理方法
US5737719A (en) Method and apparatus for enhancement of telephonic speech signals
JP5493655B2 (ja) 音声帯域拡張装置および音声帯域拡張プログラム
Yoo et al. Speech signal modification to increase intelligibility in noisy environments
JPH1028057A (ja) オーディオ復号化装置及びオーディオ符号化復号化システム
KR20050010927A (ko) 오디오 신호 처리 장치
JP2000152394A (ja) 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置
JPH06289896A (ja) 音声の特徴強調方式および装置
CN114866939A (zh) 一种新型超强降噪的助听器语音处理系统
JP5046233B2 (ja) 音声強調処理装置
JP4185984B2 (ja) 音信号の加工装置および加工方法
JPH07146700A (ja) ピッチ強調方法および装置ならびに聴力補償装置
JPH06289898A (ja) 音声信号処理装置
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
JP2000148161A (ja) 自動音質音量制御方法と装置
JP3185363B2 (ja) 補聴器
JPH07111527A (ja) 音声の加工方法およびそれを用いた装置
US11758337B2 (en) Audio processing apparatus
WO2022137806A1 (ja) 耳装着型デバイス、及び、再生方法
JP3351745B2 (ja) 音程調整機能付き補聴器
JPS5879400A (ja) 補聴器