JPH06289896A

JPH06289896A - 音声の特徴強調方式および装置

Info

Publication number: JPH06289896A
Application number: JP7334693A
Authority: JP
Inventors: Yoshito Nene; 義人禰寝; Hiroshi Ikeda; 宏池田; Tatsu Ifukube; 達伊福部
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1993-03-31
Filing date: 1993-03-31
Publication date: 1994-10-18

Abstract

(57)【要約】【目的】音声の特徴から新たな特徴を合成し、合成さ
れた特徴を強調することで、難聴者にとって聞き取り易
い音声に加工する方式および装置を提供する。【構成】ホルマント検出手段１１にて入力音声の複数
のホルマント周波数を検出し、検出された各々のホルマ
ント周波数の整数倍の周波数同士の差に相当する特徴周
波数成分を特徴周波数合成手段１２にて求める。入力音
声に対して求めた特徴周波数成分を特徴周波数成分加工
手段１３にて付加または強調する。あるいは、入力音声
のピッチ周波数を検出し、検出されたピッチ周波数成分
を強調する。【効果】聴覚系内部で生成される特徴があらかじめ強
調されるため、特徴生成能力の衰えた難聴者に対して、
音声の明瞭度が向上する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、衰えた聴覚特性を補助
するための音声信号処理方式に係り、とくに音声の特徴
を加工する音声の特徴強調方式および装置、更にはそれ
を用いた各種機器に関する。

【０００２】

【従来の技術】難聴者の聴覚を補助する手段として、従
来アナログ回路を用いて音声の振幅及びその周波数特性
を加工するアナログ型補聴器が主に使用されてきた。こ
れに対し近年、ディジタル信号処理を聴覚障害の補償に
応用するための研究開発が盛んに行われている。この研
究開発動向については、例えば日本音響学会誌（１９９
１年４７巻１０号、Ｐ７６０〜Ｐ７６５）「聴覚障害補
償へのディジタル技術の応用」やＪ．Ａｃｏｕｓｔ．Ｓ
ｏｃ．Ａｍ．（９０（２），Ｐｔ．１，Ａｕｇ．１９９
１）”Ｓｐｅｅｃｈ−ｐｅｒｃｅｐｔｉｏｎａｉｄｓ
ｆｏｒｈｅａｒｉｎｇ−ｉｍｐａｉｅｄｐｅｏｐ
ｌｅ：Ｃｕｒｒｅｎｔｓｔａｔｕｓａｎｄｎｅｅ
ｄｅｄｒｅｓｅａｒｃｈ”等に詳述されている。一
般に聴力の損失を補うためには、音圧レベルの増幅とダ
イナミックレンジの圧縮を、使用者の聴力特性に合わせ
て周波数ごとに行う。従来のアナログ補聴器では、この
ような処理をアナログ回路で実現している。また、近年
開発されているディジタル補聴器では、この処理をディ
ジタルフィルタ等のソフトウエアで実現することで、使
用者の聴力特性への適合がより詳細に行えるようにして
いる。一方、このような音圧レベルの増幅とダイナミ
ックレンジの圧縮だけでは、ある程度の効果しか得られ
ないことから、音声の特徴的な周波数成分や波形上の特
徴的な部分を加工することで、聴覚の劣化を補償しよう
とする試みもなされている。このような処理は、難聴者
の周波数分解能、時間分解能、スペクトル弁別能、音像
合成能力等の劣化を補うことを目的としており、例えば
日本音響学会誌（１９８７年４３巻５号、Ｐ３５６〜Ｐ
３６１）「音声特徴抽出機能を備えたディジタル補聴
器」等に詳しくまとめられている。このような特徴加
工型の音声加工方式は主にスペクトルを加工する方法と
波形を加工する方法との２つに分類される。前者は主に
スペクトル転移方式、スペクトル圧縮方式、ホルマント
強調方式等があり、後者には子音の音圧強調方式、持続
時間伸長方式、無音区間挿入方式等がある。これらの方
式は初めから聴覚障害の補償にために開発された方式も
あれば、ヘリウム音声の修復や、放送での会話調節等、
他の目的に開発された方式もある。

【０００３】

【発明が解決しようとする課題】一般に人間には、入力
音声に元々含まれていない情報を、脳内で作り出して言
語理解の補助に利用する能力がある。文脈から欠落した
言葉を予測できる能力などは、高次の言語処理機能にお
けるその一例である。また、より末梢に近いレベルの処
理においても、入力には元々含まれていない成分が聴覚
系の内部で作り出されている。

【０００４】上記従来の技術においては、元々入力音声
に含まれている特徴を、強調あるいは加工することが行
われている。よって、入力音声以外の雑音情報を増幅し
てしまったり、逆に入力音声の特徴を崩してしまう恐れ
もあった。

【０００５】聴覚系処理機構が入力音声に存在していな
かった特徴を作り出し、音声の知覚に役立てていること
についての考慮がされておらず、本発明の目的は、例え
ば健常者であれば、聴覚系内部で作り出されると予想さ
れ、音声の近くに役立てている音声の特徴、つまり入力
音声に元々含まれていなかった音声の特徴や、また電話
通信などにおいて元々含まれてはいたが伝達途中で欠落
してしまった音声の特徴を、入力音声に対して付加ある
いは強調することによって、劣化した聴力を補償する方
式および装置を提供することにある。

【０００６】

【課題を解決するための手段】上記課題を解決するため
の第一の手段は、入力音声中に含まれる複数のホルマン
ト周波数を検出し、検出された各ホルマント周波数の整
数倍の周波数同志の差に相当する周波数の成分を、付加
あるいは強調するものである。上記課題を解決するため
の第二の手段は、入力音声のピッチ周波数（基本周波
数）を検出し、検出されたピッチ周波数成分を付加ある
いは強調するものである。

【０００７】

【作用】一般に人間（健常者）は、入力には元々含まれ
ていない成分を聴覚系内部で作り出して音声を聞いてい
る。例えば、ｆ１、ｆ２という異なる周波数を持つ２つ
のシングルトーンを同時に聞いた場合に、（ｆ２−ｆ
１）という周波数成分や（ｆ１−ｎ×（ｆ２−ｆ１））
という周波数成分を他の周波数よりも強く感じ取ってい
ことが知られている。このことはたとえばＪ．Ａｃｏｕ
ｓｔ．Ｓｏｃ．Ａｍ．（５１，１９７２）”Ａｕｄｉｔ
ｏｒｙＤｉｓｔｏｒｔｉｏｎＰｒｏｄｕｃｔｆ２
ーｆ１ａｎｄ２ｆ１ーｆ２”等に詳述されている。
すなわち人間の聴覚系では、抹消機能そのものに非線形
性があり、それによって作り出された成分が、その後の
聴覚系の処理に大きな役割を果たしている場合がある。

【０００８】ところで、難聴者の聴覚においては、この
ような入力音声には無かった特徴成分を、聴覚系内部で
作り出す能力が健常者と異なっていることが最近わかっ
てきた。これについては、例えば、日本音響学会平成３
年度秋季研究発表会講演論文集（１−７−３）「難聴
者における結合音知覚特性」等に述べられている。すな
わち、難聴者の聴力の衰えの原因には、聴力レベルの低
下とともに、このような聴覚神経系内で音声知覚に必要
な情報を作り出す能力の低下も考えられる。

【０００９】上記本発明の第１の手段においては、まず
ホルマント周波数を検出する手段により入力音声のホル
マントが存在する複数の周波数が検出される。そして検
出されたホルマント周波数の整数倍の周波数同志の差に
相当する周波数が求められる。これにより求められた周
波数成分は、健常者の聴覚系内部において強調される周
波数に相当する。難聴者において、これらの成分を聴覚
系処理機構で作り出す機能が衰えたことによって聴力機
能が衰えている場合には、これらの成分をもとの音声信
号に付加あるいは、もしもとの音声信号にこの成分が存
在しているならばその周波数成分を強調することによっ
て、衰えた聴覚を補助することが可能となる。

【００１０】一方、一般の電話通信においては伝達され
る音声の帯域が制限されており、実際に発せられた音声
の持つ周波数成分の内、およそ３００Ｈｚから３.３ｋ
Ｈｚの間にある情報のみが効率良く伝達され、それ以外
の周波数成分の情報は欠落あるいは減衰することが多
い。従って電話通信においては、３００Ｈｚ以下の帯域
にある音声のピッチ周波数（基本周波数）成分は、著し
く減衰して伝えられる。

【００１１】健常者においては、このような帯域制限に
よりピッチ周波数成分の減衰した電話音声でも正しく内
容を聞き取ることができる。ところが難聴者、とくに高
齢者に多い感音性難聴の場合、比較的高い周波数に対す
る聴力が衰えることが多いため、帯域制限によりピッチ
周波数を含む低い周波数の情報が欠落すると、通常会話
で重要な手がかりとなっている情報が受け取れなくな
り、音声の聞き取りが極端に悪くなることが多い。上記
従来の技術においては、このように元々存在していた情
報が伝送中に欠落した場合に、受け手側でその情報を補
って音声の聞き取りを向上させる方法についても考慮さ
れていなかった。

【００１２】上記本発明の第２の手段においては、まず
入力音声が持つピッチ周波数成分が検出される。このピ
ッチ周波数成分は、直接音声を聴取する場合には何等問
題無く与えられるが、電話などの通信装置を通じて得ら
れる音声では、通信系における周波数帯域に制限がある
ため、減衰あるいは消滅していることが多い。健常者に
おいては、このピッチ周波数成分が無い場合でも、より
高い周波数帯域に存在する音声情報のみを基に音声を聞
き取っている。しかし、難聴者とくに高齢者に多い感音
性難聴者の場合には、高い周波数帯域の聴力レベルが低
い周波数帯域に比べより劣化する傾向にあるので、直接
音声を聞く場合に低い周波数帯域の音声情報に依存する
度合いが高くなっており、このためピッチ周波数が含ま
れる低い周波数帯域の情報が少ない場合には、極端に聞
き取り能力が悪くなる。このようなピッチ周波数成分の
減衰あるいは消滅によって音声の聞き取りにくくなって
いる場合には、そのピッチ周波数成分を元の音声信号に
付加あるいは、もし元の音声信号にこの成分が存在する
場合にはその周波数成分を強調することによって、衰え
た聴覚を補助することが可能となる。

【００１３】

【実施例】以下、本発明を実施例を用いて詳細に説明す
る。

【００１４】図１は本発明の第１の音声の特徴強調手段
を表す実施例の構成図、図２は本手段の音声加工の概念
を表す図である。入力された音声信号はホルマント周波
数検出手段１１により、その時点の入力音声に含まれる
ホルマント周波数が抽出される。ここで言うホルマント
周波数とは、ある時間幅の音声信号を分析して得られる
周波数成分の分布の包絡線上のピークが示す周波数であ
る。一般にこのピークは図２に示すように複数個同時に
存在し、ホルマント周波数は周波数の低い方から第１、
第２、…と番号づけて呼ばれる。このうち第２および第
３ホルマントは、発声した人にはよらず発声した母音に
よって、その周波数が一定の範囲に分布することから、
母音の特徴を示す重要なパラメ−タとなる。以下この第
２および第３ホルマント周波数をｆ２、ｆ３と表す。本
実施例では抽出されたホルマント周波数のうちこのｆ
２、ｆ３の値が、図１に示した特徴周波数合成手段１２
に送られる。特徴周波数合成手段１２では、

【００１５】

【数１】ｆａ＝ｆ３−ｆ２ …（数１）あるいは

【００１６】

【数２】ｆｂ＝２×ｆ２−ｆ３ …（数２）という計算により、付加または強調を行う新しい特徴周
波数成分ｆａまたはｆｂが求められる。そして特徴周波
数成分加工手段１３においては、これらの周波数成分が
入力音声に対して付加あるいは強調される。

【００１７】図３は、図１に示した第１の音声の特徴強
調手段をケプストラムを利用して実現した場合の詳細な
構成図である。マイク１０１等の入力手段からの入力音
声はＡＤ変換器１０２によってディジタル化され，フレ
ーム切り出し手段１０３によって時間窓がかけられフレ
ームに切り出されたのち、ホルマント周波数検出手段１
１に渡される。このホルマント周波数検出手段１１では
フーリエ変換手段１１１によるフーリエ変換（以下Ｆ
Ｔ）によってまず周波数分析される。この結果から周波
数ごとの振幅の分布を示すパワースペクトラムが得られ
る。このパワースペクトラムを対数変換手段１１２によ
り対数変換し、逆フーリエ変換手段１１３により逆フー
リエ変換（以下ＩＦＴ）をしてケプストラム分布を得
る。このケプストラム分布中の高いケフレンシー領域に
存在しているピッチに相当するケプストラム成分をピッ
チ成分除去手段１１４のリフター（ケプストラム領域で
のフィルター）により除去した後、もう一度フーリエ変
換手段１１５によりＦＴを行いスペクトル包絡線を得
る。この包絡線に対してピーク検出手段１１６によりピ
ーク検出処理を行いホルマント周波数の検出をおこな
う。検出されたホルマント周波数のうちのｆ２およびｆ
３の値を用いて、特徴周波数合成手段１２にて上記の
（数１）（数２）の数式によりｆａとｆｂが算出され
る。特徴周波数成分加工手段１３の特徴周波数強調手段
１３１は、初めのＦＴの結果であるホルマント周波数検
出手段１１中のフーリエ変換手段１１１からのパワース
ペクトラムと上記ｆａまたはｆｂを入力として受け取
り、ｆａとｆｂに相当する周波数成分のパワーを増加さ
せる。そして最後に、逆フーリエ変換手段１３２にてＩ
ＦＴを行い，フレーム間合成手段１０４にてフレーム間
合成を行って，ＤＡ変換器１０５にてアナログ信号に変
換して出力音声を得る。その出力音声はスピーカ１０６
等の出力手段を介して出力される。なお、本実施例にお
いてはｆａおよびｆｂの算出を（数１）および（数２）
によるものとしているが、ｆ２およびｆ３以外のホルマ
ント周波数を用いたり、（数１）（数２）以外の算出方
法によって付加あるいは強調される周波数が得られる場
合でも、まったく同様の構成によって実現できることは
言うまでもない。

【００１８】図４は、図１に示した第１の音声の特徴強
調手段をＬＰＣケプストラムを利用して実現した場合の
詳細な構成図である。マイク１０１等の入力手段からの
入力音声はＡＤ変換器１０２によってディジタル化さ
れ，フレーム切り出し手段１０３によって時間窓がかけ
られフレームに切り出されたのち、ホルマント検出手段
１１中のＬＰＣ分析手段１１７によりＬＰＣ分析されス
ペクトル包絡線に相当するＬＰＣケプストラムを得る。
このＬＰＣケプストラムに対してピーク検出手段１１８
によりピーク検出処理を行いホルマント周波数の検出を
おこなう。検出されたホルマント周波数のうちのｆ２お
よびｆ３の値を用いて、上記の（数１）（数２）の数式
によりｆａとｆｂが算出される。そして，特徴周波数成
分加工手段１３の特徴周波数強調手段１３１は、フーリ
エ変換手段１０７からの入力フレームのＦＴの結果であ
るパワースペクトラムと上記ｆａまたはｆｂを入力とし
て受け取り、上記パワースペクトラム中のｆａとｆｂに
相当する周波数成分のパワーを増加させる。そして最後
に、逆フーリエ変換手段１３２にてＩＦＴを行い，フレ
ーム間合成手段１０４にてフレーム間合成を行って，Ｄ
Ａ変換器１０５にてアナログ信号に変換して出力音声を
得る。その出力音声はスピーカ１０６等の出力手段を介
して出力される。

【００１９】図５は本発明の第２の音声の特徴強調手段
を表す実施例の構成図、図６は本手段の音声加工の概念
を表す図である。一般に電話等の通信系を通じて得られ
た音声は、その周波数帯域が制限され、おおよそ３００
Ｈｚ〜３.２ＫＨｚの範囲の周波数成分のみが伝達され
る。このため電話音声を周波数分析した場合には、図６
に示した一例のように、通過帯域以外の成分が著しく減
少している。本発明の第２の音声の特徴強調手段では、
まずこのような帯域制限された入力音声を入力とし、ピ
ッチ周波数検出手段２１によりその信号に含まれるピッ
チ周波数ｆｐが検出される。そして、この検出されたピ
ッチ周波数の情報はピッチ周波数成分加工手段２２に送
られる。ピッチ周波数成分加工手段２２は、ピッチ周波
数の情報と元の入力音声情報とを受け取り、入力音声に
対してピッチ周波数の成分を付加あるいは強調して出力
する。この結果、図６に示したように、本来帯域制限に
より減衰していたピッチ成分が強調されて出力される。

【００２０】図７は，図５に示した第２の音声の特徴強
調手段をケプストラムを利用して実現した場合の詳細な
構成図である。マイク２０１等の入力手段または電話回
線等からの入力音声は，ＡＤ変換器２０２によってディ
ジタル化され，フレーム切り出し手段２０３によって時
間窓がかけられフレームに切り出されたのち、ピッチ周
波数検出手段２１に渡される。このピッチ周波数検出手
段２１では、まずフーリエ変換手段２１１のＦＴにより
周波数分析が行われ、周波数ごとの振幅の分布を示すパ
ワースペクトラムを得る。これを対数変換手段２１２に
より対数変換したのち，逆フーリエ変換手段２１３によ
りＩＦＴを行いケプストラムを得る。ケプストラム中の
高いケフレンシーをもつ領域に対して高ケフレンシー領
域ピーク検出手段２１４によってピーク検出を行い，検
出されたピ−クの示すケフレンシー値の逆数を逆数変換
手段２１５により取ることによってピッチ周波数を検出
する。ピッチ周波数成分加工手段２２中のピッチ周波数
強調手段２２１は、この検出されたピッチ周波数ｆｐの
値を受け取り、初めのＦＴの出力であるピッチ周波数検
出手段２１のフーリエ変換手段２２１からのパワースペ
クトラムに対してピッチ周波数成分を付加あるいは強調
する。そして最後に、逆フーリ変換手段２２２にて上記
加工されたパワースペクトラムに対してＩＦＴを行い出
力音声デ−タを得る。アナログ信号への変換はフレーム
間合成手段２０４にてフレーム間合成を行った後、Ｄ／
Ａ変換器２０５により行う。その出力音声はスピーカ２
０６等の出力手段を介して出力される。

【００２１】図８は、上記第１および第２の音声の特徴
強調手段の両方を同時に実現するための構成の一例を示
す図である。ＦＴ処理やＩＦＴ処理を行うフーリエ変換
手段３１１，対数変換手段３１２，逆フーリエ変換手段
３１３，３２０等は両方の処理で共有し、他の処理を独
立して行う。その他の構成要素は，先に説明した図３ま
たは図７などと同様である。もちろん，第１の音声の特
徴強調手段として，図４に示したＬＰＣケプストラムを
利用しても構わない。

【００２２】以上，図１から図８に示した本発明の実施
例を補聴器に適用すれば，加齢等によって聴力機能が衰
え，音声の特徴を捕えることが困難になった難聴者で
も，健聴者と同様に音声を聞き取ることが可能となる。

【００２３】図９は、本発明の上記第１および第２の音
声の特徴強調手段を電話機に応用する場合の構成を示し
た図である。同図において電話機４の受話回路４１は電
話回線を通じて送られてきた信号から音声信号を抽出す
る回路で、送話回路４２は逆にハンドセット４３中のマ
イクロホン４３２により得られた音声信号を、電話回線
用の信号に変換して電話回線に送出する回路である。電
話回線がアナログ回線方式の場合には、音声信号がディ
ジタル符号化されていないため、受話回路を通して抽出
されたアナログ音声信号を、上記第１および第２の少な
くとも１つを用いた音声の特徴強調手段（図３，図４，
または図７等参照）である音声の特徴強調手段４０内の
ＡＤ変換器を利用して一旦ディジタル信号に変換した
後、先に説明した特徴周波数成分の合成／強調処理また
はピッチ周波数成分の強調処理を行い、ＤＡ変換器によ
ってアナログ信号に戻してハンドセット４３内のスピー
カ４３１から出力する。なお、ディジタル回線方式の場
合には、送られて来る信号が既にディジタル符号化され
ており、通常のディジタル電話機で行われている複号化
処理を受話回路４１内で行い、ディジタル音声信号に変
換した後、上記の特徴周波数成分の合成／強調処理をま
たはピッチ周波数成分の強調処理行い、ＤＡ変換器によ
ってアナログ信号に変換して出力することで、同様の効
果が得られることは言うまでもない。

【００２４】一方、本実施例による電話機は、使用者に
よって特徴周波数成分あるいはピッチ周波数成分の強調
量を変更する手段４４を有している。使用者は通話中に
音声を聞きながら強調量を、例えばボリュームを回すな
どの手段により変化させ、最も聞きやすい強調量におい
て通話を行なう。また本実施例ではこの強調量を表す信
号処理パラメータを記憶するためのパラメータ記憶手段
４５を有しており、例えば、通話終了時にその通話で使
われていたパラメータを記憶する。使用者が新たな通話
を行なう際に、過去に使用した条件と同じ条件で通話を
行ないたいと希望する場合には、使用者はパラメータ選
択手段４６によってパラメータ記憶手段４５中に記憶さ
れているパラメータセットの１つを選択し、このパラメ
ータを音声の特徴強調手段４０に転送する。

【００２５】さらに、本実施例の電話機のパラメータ選
択手段４６には頻度検出手段４７が具備されている。こ
の頻度検出手段４７は、パラメータ記憶手段４５に記憶
されている複数のパラメータセットの中で、最も高い頻
度で使用されたパラメータセットを検出する機能を有し
ており、この最も頻度の高いパラメータセットは、本電
話機により通話を開始する際に、初めに設定される初期
パラメータセットとして使用される。使用者が他のパラ
メータセットで通話を行ないたい場合には、上記パラメ
ータ選択手段４６によって選択し直すことができる。

【００２６】なお，強調量変更手段４４，パラメータ記
憶手段４５，パラメータ選択手段４６などを具備せず，
あらかじめ音声の特徴強調手段４０にデフォルト値を設
定しておき，外部からのスイッチ操作等によって，単に
強調の選択／非選択を指定できるようなシンプルな構成
とすることも可能である。

【００２７】図１０は、本発明の上記第１および第２の
音声の特徴強調手段をテレビジョン受信機に利用した実
施例を示す図である。放送電波に含まれるテレビジョン
信号はテレビ電波受信回路５１により抽出され，抽出さ
れたテレビジョン信号は映像／音声信号分離手段５２に
よって映像信号と音声信号に分離される。このうち映像
信号は画像信号処理回路５４により処理された後，ディ
スプレイ５７に表示される。

【００２８】一方，分離された音声信号は，音声信号処
理回路５３によって音声帯域のアナログ信号に変換され
た後，音声の特徴強調手段４０に渡される。この音声の
特徴強調手段４０は，図９の電話機の実施例同様，上記
第１および第２の少なくとも１つを用いた音声の特徴強
調手段（図３，図４，または図７等参照）で，上記で説
明した音声の特徴強調を行なう。そして特徴強調を受け
た音声信号はスピーカ５６によって出力される。

【００２９】また，本実施例のテレビジョン受信機に
は，パラメータ記憶手段４５，パラメータ選択手段４
６，および強調量変更手段４４が具備されているが，こ
れらの手段の機能は図９の電話機の実施例と同様であ
る。なお，本実施例においても，これらの手段を具備せ
ずに，あらかじめ音声の特徴強調手段４０にデフォルト
値を設定しておき，外部からのスイッチ操作等によっ
て，単に強調の選択／非選択を指定できるようなシンプ
ルな構成とすることも可能である。

【００３０】図１１は、本発明の上記第１および第２の
音声の特徴強調手段をラジオ受信機に利用した実施例を
示す図である。放送電波に含まれるラジオ信号はラジオ
電波受信回路６１により抽出され，音声信号処理回路６
２によって音声帯域のアナログ信号に変換された後，音
声の特徴強調手段４０に渡される。この音声の特徴強調
手段４０は，図９の電話機の実施例同様，上記第１およ
び第２の少なくとも１つを用いた音声の特徴強調手段
（図３，図４，または図７等参照）で，上記で説明した
音声の特徴強調を行なう。そして特徴強調を受けた音声
信号はスピーカ６４によって出力される。

【００３１】また，本実施例のラジオ受信機には，パラ
メータ記憶手段４５，パラメータ選択手段４６，および
強調量変更手段４４が具備されているが，これらの手段
の機能は図９の電話機の実施例と同様である。なお，本
実施例においても，これらの手段を具備せずに，あらか
じめ音声の特徴強調手段４０にデフォルト値を設定して
おき，外部からのスイッチ操作等によって，単に強調の
選択／非選択を指定できるようなシンプルな構成とする
ことも可能である。

【００３２】本発明の応用は，図１から図１１に示した
補聴器，電話機，テレビジョン受信機，ラジオ受信機に
限らず広範な音声利用機器に適用可能である。例えば，
テープレコーダ，ＶＴＲ，ＣＤ，ＤＤＣ，ＭＤなどを用
いた音声録音機器，ＷＳ（ワークステーション）やＰＣ
（パーソナルコンピュータ）等に接続された音声出力機
器，音声読み上げ機能を搭載したＷＰ（ワードプロセッ
サ）や電子メールの他，一般個人向けの機器だけでな
く，産業応用分野の機器やシステムにも適用可能であ
る。

【００３３】また，本発明の第１および第２の音声の特
徴強調手段は，汎用のＤＳＰ（ディジタルシグナルプロ
セッサ）を用いて容易に実現できるが，専用のハードウ
エアや汎用のマイクロコンピュータを用いてソフトウエ
アにて実現しても構わない。

【００３４】

【発明の効果】本発明によれば、音声信号中に含まれて
いる特徴から人間の聴覚系処理機構内で作り出される新
たな特徴を、あらかじめ音声信号に対して付加あるいは
強調できるので、このような特徴抽出および合成機能が
衰えたことによって聴力機能が衰えている難聴者でも、
健常者と同様に音声を聞き取ることが可能となる。と
くに、回線の特性からピッチ情報が極端に劣化する電話
音声に本発明を適用し、ピッチ周波数成分を強調した場
合、老人性難聴などの高い周波数成分の聴力が衰えた人
々においては、比較的低い周波数帯域あるピッチ情報が
聞き取りの重要な手がかりとなっているので、これらの
人々にとって電話音声が聞き取り易くなるという効果が
ある。

【図面の簡単な説明】

【図１】本発明の第１の音声の特徴強調手段の実施例の
構成図である。

【図２】本発明の第１の音声の特徴強調手段の実施例の
音声加工の概念図である。

【図３】ケプストラムを用いて実現した本発明の第１の
音声の特徴強調手段の実施例の構成図である。

【図４】ＬＰＣ分析を用いて実現した本発明の第１の音
声の特徴強調手段の実施例の構成図である。

【図５】本発明の第２の音声の特徴強調手段の実施例の
構成図である。

【図６】本発明の第２の音声の特徴強調手段の実施例の
音声加工の概念図である。

【図７】ケプストラムを用いて実現した本発明の第２の
音声の特徴強調手段の実施例の構成図である。

【図８】本発明の第１の音声の特徴強調手段と第２の音
声の特徴強調手段を同時に実現する実施例の構成図であ
る。

【図９】本発明の第１または第２の音声の特徴強調手段
を応用した電話機の構成図である。

【図１０】本発明の第１または第２の音声の特徴強調手
段を応用したテレビジョン受信機の構成図である。

【図１１】本発明の第１または第２の音声の特徴強調手
段を応用したラジオ受信機の構成図である。

【符号の説明】

１：音声の特徴強調手段、１１：ホルマント周波数検出
手段、１２：特徴周波数合成手段、１３：特徴周波数成
分加工手段、２：音声の特徴強調手段、２１：ピッチ周
波数検出手段、２２：ピッチ周波数成分加工手段、３：
音声の特徴強調手段、４：音声の特徴強調手段を有する
電話機、４１：受話回路、４２：送話回路、４３：ハン
ドセット、４４：強調量変更手段、４５：パラメータ記
憶手段、４６：パラメータ選択手段、４７：頻度検出手
段、５：音声の特徴強調手段を有するテレビジョン受信
機、５１：テレビ電波受信回路、５２：映像／音声信号
分離回路、５３：音声信号処理回路、５４：画像信号処
理回路、６：音声の特徴強調手段を有するラジオ受信
機、６１：ラジオ電波受信回路、６２：音声信号処理回
路。

Claims

【特許請求の範囲】

【請求項１】入力音声の複数のホルマント周波数を検出
し、この検出された複数のホルマント周波数より、各々
の整数倍の周波数同士の加算あるいは減算により特徴周
波数を合成し、上記入力音声中に含まれる上記合成され
た特徴周波数成分のパワーを強調することを特徴とする
音声の特徴強調方式。
【請求項２】入力音声の複数のホルマント周波数を検出
するホルマント周波数検出手段と、この検出された複数
のホルマント周波数より、各々の整数倍の周波数同士の
加算あるいは減算により特徴周波数を合成する特徴周波
数合成手段と、上記入力音声中に含まれる上記合成され
た特徴周波数成分のパワーを強調する特徴周波数成分加
工手段を有することを特徴とする音声の特徴強調装置。
【請求項３】請求項２記載において、上記ホルマント周
波数検出手段におけるホルマント周波数の検出は、上記
入力音声に対してケプストラム解析を行うことによって
得られるスペクトル包絡線上のピーク検出によって実現
することを特徴とする音声の特徴強調装置。
【請求項４】請求項２記載において、上記特徴周波数合
成手段は、検出された複数のホルマント周波数のうち、
２つの異なるホルマント周波数を、ｆｎ（ｎ＝１，２，…）およびｆｍ（ｍ＝１，２，…）（但し、ｎ≠ｍ）と表した場合に、上記入力音声中に含まれる、ｆｘ＝ｉ×ｆｎ−ｊ×ｆｍ（ｉ＝１，２，…；ｊ＝１，
２，…）なる式で表される特徴周波数ｆｘとして合成することを
特徴とする音声の特徴強調装置。
【請求項５】請求項４記載において、上記特徴周波数ｆ
ｘは、ｎ＝３，ｍ＝２，ｉ＝１，ｊ＝１として得られる特徴周波数ｆａと、ｎ＝２，ｍ＝３，ｉ＝２，ｊ＝１として得られる特徴周波数ｆｂの、少なくともどちらか
一方とすることを特徴とする音声の特徴強調装置。
【請求項６】請求項２記載において、上記入力音声を音
響−電気変換する入力手段と、変換されたアナログ信号
をディジタル信号に変換するＡ／Ｄ変換器と、ディジタ
ル信号に変換された入力音声データに、時間窓をかけて
有限長の音声フレームに分割して切り出すフレーム切り
出し手段を備え、上記ホルマント周波数検出手段は、上記音声フレームに
対して第１のフーリエ変換を行ない、周波数ごとの振幅
を示すパワースペクトラムを得る第１のフーリエ変換手
段と、このパワースペクトラムを対数変換する対数変換
手段と、この対数変換された結果を入力として逆フーリ
エ変換を行ない、ケプストラム分布を得る第１の逆フー
リエ変換手段と、このケプストラム分布上のピッチに相
当する成分を除去するピッチ成分除去手段と、このピッ
チ成分が除去された結果に対してフーリエ変換を行な
い、スペクトル包絡線を得る第２のフーリエ変換手段
と、得られたスペクトル包絡線上のピーク検出によって
複数のホルマント周波数を検出するピーク検出手段を備
え、上記特徴周波数成分加工手段は、上記第１のフーリエ変
換手段にて得られたパワースペクトラムと、上記特徴周
波数合成手段にて合成された特徴周波数を入力し、特徴
周波数成分のパワーを強調する特徴周波数強調手段と、
その結果に対して逆フーリエ変換を行ない、出力音声デ
ータを得る第２の逆フーリエ変換手段を備え、この出力音声データをつなぎ合わせてフレーム間合成を
行なうフレーム間合成手段と、合成された出力音声デー
タをディジタル信号からアナログ信号に変換するＤ／Ａ
変換器と、変換されたアナログ信号を電気−音響変換し
て出力音声を出力する出力手段を備えたことを特徴とす
る音声の特徴強調装置。
【請求項７】請求項２記載において、上記ホルマント周
波数検出手段におけるホルマント周波数の検出は、上記
入力音声に対してＬＰＣ解析を行うことによって得られ
るスペクトル包絡線上のピーク検出によって実現するこ
とを特徴とする音声の特徴強調装置。
【請求項８】請求項２記載において、上記入力音声を音
響−電気変換する入力手段と、変換されたアナログ信号
をディジタル信号に変換するＡ／Ｄ変換器と、ディジタ
ル信号に変換された入力音声データに、時間窓をかけて
有限長の音声フレームに分割して切り出すフレーム切り
出し手段を備え、上記ホルマント周波数検出手段は、上記音声フレームに
対してＬＰＣ分析し、スペクトル包絡線に相当するＬＰ
Ｃケプストラムを得るＬＰＣ分析手段と、このＬＰＣケ
プストラムに対してピーク検出を行ない、ホルマント周
波数の検出を行なうピーク検出手段を備え、上記音声フレームに対してフーリエ変換を行ない、周波
数ごとの振幅を示すパワースペクトラムを得るフーリエ
変換手段を備え、上記特徴周波数成分加工手段は、上記フーリエ変換手段
にて得られたパワースペクトラムと、上記特徴周波数合
成手段にて合成された特徴周波数を入力し、特徴周波数
成分のパワーを強調する特徴周波数強調手段と、その結
果に対して逆フーリエ変換を行ない、出力音声データを
得る逆フーリエ変換手段を備え、この出力音声データをつなぎ合わせてフレーム間合成を
行なうフレーム間合成手段と、合成された出力音声デー
タをディジタル信号からアナログ信号に変換するＤ／Ａ
変換器と、変換されたアナログ信号を電気−音響変換し
て出力音声を出力する出力手段を備えたことを特徴とす
る音声の特徴強調装置。
【請求項９】入力音声のピッチ周波数を検出し、この検
出されたピッチ周波数成分のパワーを強調することを特
徴とする音声の特徴強調方式。
【請求項１０】入力音声のピッチ周波数を検出するピッ
チ周波数検出手段と、この検出されたピッチ周波数成分
のパワーを強調するピッチ周波数成分加工手段を有する
ことを特徴とする音声の特徴強調装置。
【請求項１１】請求項１０記載において、上記入力音声
を音響−電気変換する入力手段と、変換されたアナログ
信号をディジタル信号に変換するＡ／Ｄ変換器と、ディ
ジタル信号に変換された入力音声データに、時間窓をか
けて有限長の音声フレームに分割して切り出すフレーム
切り出し手段を備え、上記ピッチ周波数検出手段は、上記音声フレームに対し
てフーリエ変換を行ない、周波数ごとの振幅を示すパワ
ースペクトラムを得るフーリエ変換手段と、このパワー
スペクトラムを対数変換する対数変換手段と、この対数
変換された結果を入力として逆フーリエ変換を行ない、
ケプストラム分布を得る第１の逆フーリエ変換手段と、
このケプストラム分布中の高いケフレンシーを有する領
域に対してピーク検出を行なう高ケフレンシー領域ピー
ク検出手段と、検出されたピークの示すケフレンシー値
の逆数を取りピッチ周波数を検出する逆数変換手段を備
え、上記ピッチ周波数成分加工手段は、上記フーリエ変換手
段にて得られたパワースペクトラムと、上記逆数変換手
段にて検出されたピッチ周波数を入力し、ピッチ周波数
成分のパワーを強調するピッチ周波数強調手段と、その
結果に対して逆フーリエ変換を行ない、出力音声データ
を得る第２の逆フーリエ変換手段を備え、この出力音声データをつなぎ合わせてフレーム間合成を
行なうフレーム間合成手段と、合成された出力音声デー
タをディジタル信号からアナログ信号に変換するＤ／Ａ
変換器と、変換されたアナログ信号を電気−音響変換し
て出力音声を出力する出力手段を備えたことを特徴とす
る音声の特徴強調装置。
【請求項１２】入力音声の複数のホルマント周波数とピ
ッチ周波数を検出し、上記検出された複数のホルマント
周波数より、各々の整数倍の周波数同士の加算あるいは
減算により特徴周波数を合成し、上記入力音声中に含ま
れる上記合成された特徴周波数成分と上記検出されたピ
ッチ周波数成分の両方のパワーを強調することを特徴と
する音声の特徴強調方式。
【請求項１３】入力音声を音響−電気変換する入力手段
と、変換されたアナログ信号をディジタル信号に変換す
るＡ／Ｄ変換器と、ディジタル信号に変換された入力音
声データに、時間窓をかけて有限長の音声フレームに分
割して切り出すフレーム切り出し手段を備え、上記音声フレームに対して第１のフーリエ変換を行な
い、周波数ごとの振幅を示すパワースペクトラムを得る
第１のフーリエ変換手段と、このパワースペクトラムを
対数変換する対数変換手段と、この対数変換された結果
を入力として逆フーリエ変換を行ない、ケプストラム分
布を得る第１の逆フーリエ変換手段と、このケプストラ
ム分布上のピッチに相当する成分を除去するピッチ成分
除去手段と、このピッチ成分が除去された結果に対して
フーリエ変換を行ない、スペクトル包絡線を得る第２の
フーリエ変換手段と、得られたスペクトル包絡線上のピ
ーク検出によって複数のホルマント周波数を検出するピ
ーク検出手段と、上記ケプストラム分布中の高いケフレ
ンシーを有する領域に対してピーク検出を行なう高ケフ
レンシー領域ピーク検出手段と、検出されたピークの示
すケフレンシー値の逆数を取りピッチ周波数を検出する
逆数変換手段を備え、上記検出された複数のホルマント周波数より、各々の整
数倍の周波数同士の加算あるいは減算により特徴周波数
を合成する特徴周波数合成手段を備え、上記第１のフーリエ変換手段にて得られたパワースペク
トラムと、上記特徴周波数合成手段にて合成された特徴
周波数と、上記逆数変換手段にて検出されたピッチ周波
数を入力し、特徴周波数成分およびピッチ周波数成分の
パワーを強調する特徴周波数強調手段と、その結果に対
して逆フーリエ変換を行ない、出力音声データを得る第
２の逆フーリエ変換手段を備え、この出力音声データをつなぎ合わせてフレーム間合成を
行なうフレーム間合成手段と、合成された出力音声デー
タをディジタル信号からアナログ信号に変換するＤ／Ａ
変換器と、変換されたアナログ信号を電気−音響変換し
て出力音声を出力する出力手段を備えたことを特徴とす
る音声の特徴強調装置。
【請求項１４】請求項２〜８、１０〜１１，及び１３記
載のいずれかの音声の特徴強調装置を有することを特徴
とする補聴器。
【請求項１５】請求項２〜８、１０〜１１，及び１３記
載のいずれかの音声の特徴強調装置を有することを特徴
とする電話機。
【請求項１６】請求項１５記載において、上記特徴周波
数成分または上記ピッチ周波数成分の強調量または周波
数を使用者が変更する強調量変更手段を有することを特
徴とする電話機。
【請求項１７】請求項１６記載において、上記使用者に
よって変更した強調量または周波数を表すパラメータセ
ットを記憶するパラメータ記憶手段と、使用者が過去に
選択したパラメータセットを上記パラメータ記憶手段か
ら選択し、過去に使用したパラメータセットと同じパラ
メータセットを使用して処理を行なうためのパラメータ
選択手段を有することを特徴とする電話機。
【請求項１８】請求項１７記載において、上記パラメー
タ選択手段は、上記パラメータ記憶手段へのパラメータ
セットの記憶を複数回行なった後、複数のパラメータセ
ットの中で最も使用頻度の高いパラメータセットを検出
する頻度検出手段と、使用開始に設定する初期パラメー
タセットとして、最も頻度の高かったパラメータセット
を設定するための手段を有することを特徴とする電話
機。
【請求項１９】請求項２〜８、１０〜１１，及び１３記
載のいずれかの音声の特徴強調装置を有することを特徴
とするテレビジョン受信機。
【請求項２０】請求項１９記載において、上記特徴周波
数成分または上記ピッチ周波数成分の強調量または周波
数を使用者が変更する強調量変更手段を有することを特
徴とするテレビジョン受信機。
【請求項２１】請求項２０記載において、上記使用者に
よって変更した強調量または周波数を表すパラメータセ
ットを記憶するパラメータ記憶手段と、使用者が過去に
選択したパラメータセットを上記パラメータ記憶手段か
ら選択し、過去に使用したパラメータセットと同じパラ
メータセットを使用して処理を行なうためのパラメータ
選択手段を有することを特徴とするテレビジョン受信
機。
【請求項２２】請求項２１記載において、上記パラメー
タ選択手段は、上記パラメータ記憶手段へのパラメータ
セットの記憶を複数回行なった後、複数のパラメータセ
ットの中で最も使用頻度の高いパラメータセットを検出
する頻度検出手段と、使用開始に設定する初期パラメー
タセットとして、最も頻度の高かったパラメータセット
を設定するための手段を有することを特徴とするテレビ
ジョン受信機。
【請求項２３】請求項２〜８、１０〜１１，及び１３記
載のいずれかの音声の特徴強調装置を有することを特徴
とするラジオ受信機。
【請求項２４】請求項２３記載において、上記特徴周波
数成分または上記ピッチ周波数成分の強調量または周波
数を使用者が変更する強調量変更手段を有することを特
徴とするラジオ受信機。
【請求項２５】請求項２４記載において、上記使用者に
よって変更した強調量または周波数を表すパラメータセ
ットを記憶するパラメータ記憶手段と、使用者が過去に
選択したパラメータセットを上記パラメータ記憶手段か
ら選択し、過去に使用したパラメータセットと同じパラ
メータセットを使用して処理を行なうためのパラメータ
選択手段を有することを特徴とするラジオ受信機。
【請求項２６】請求項２５記載において、上記パラメー
タ選択手段は、上記パラメータ記憶手段へのパラメータ
セットの記憶を複数回行なった後、複数のパラメータセ
ットの中で最も使用頻度の高いパラメータセットを検出
する頻度検出手段と、使用開始に設定する初期パラメー
タセットとして、最も頻度の高かったパラメータセット
を設定するための手段を有することを特徴とするラジオ
受信機。