JP3961616B2 - 話速変換方法および話速変換機能付補聴器 - Google Patents
話速変換方法および話速変換機能付補聴器 Download PDFInfo
- Publication number
- JP3961616B2 JP3961616B2 JP12662597A JP12662597A JP3961616B2 JP 3961616 B2 JP3961616 B2 JP 3961616B2 JP 12662597 A JP12662597 A JP 12662597A JP 12662597 A JP12662597 A JP 12662597A JP 3961616 B2 JP3961616 B2 JP 3961616B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- vowel
- input
- speed
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
この発明は、入力された音声信号の発話速度(話速)を伸長して出力することにより、装用者の聴覚機能の低下を補償した話速変換機能付補聴器に関する。
【0002】
【従来の技術】
従来より、高齢者など聴覚機能が低下した者が装用する機能補助装置として補聴器が使用されている。ところで、老齢化による聴覚機能の低下は、最小可聴信号レベルの上昇,高音域の聴取機能の低下などの伝音系機能低下のほか音声識別臨界速度(語音を識別することができる最大の話速)の低下などの聴覚中枢系の機能低下も含まれている。
【0003】
このため、高齢者用の補聴器として、音声信号を時間的に伸長して周波数帯域の一部または全部を増幅することに加えて、音声信号の出力速度を入力速度よりも低速にする話速変換処理を行う補聴器も提案されている。
【0004】
【発明が解決しようとする課題】
しかし、単に入力された音声信号を低速に変換して出力するのみの補聴器では、対話者がゆっくり話してくれた場合でもこれを更に低速に変換して出力するため、話速が低速になり過ぎてしまい、装用者が高齢者であってもかえって聞き取りにくくなる場合があった。
【0005】
これに対応するためには、対話者の発言の話速に応じて話速変換の変換率を変えればよいが、高齢者がマニュアル操作でこれを行うことは殆ど不可能であり、また、話者の発話速度を事前に予測して変換率を決定することも不可能である。
【0006】
この発明は、音声信号の先頭部分で話速を測定する話速検出方法、および、検出された話速を用いて以後の音声信号の話速を目標値に変換することにより、リアルタイムの話速変換を可能にした話速変換方法、そして、どのような発話速度(話速)の音声信号が入力された場合でも、適切な話速に変換して出力することができる話速変換機能付補聴器を提供することを目的とする。
【0007】
【課題を解決するための手段】
この出願の請求項1の発明は、入力される音声信号のうち最初の母音の長さを検出し、該検出された最初の母音の長さに基づいて前記入力された音声信号の母音部の発話速度を検出し、該検出された発話速度に基づき、前記最初の母音以後に入力される所定数の母音部の音声信号の発話速度を予め設定されている目標話速に変換し、その後入力される音声信号の母音部は話速変換しないことを特徴とする。
【0008】
この出願の請求項2の発明は、入力される音声信号のうち最初の母音の長さを検出し、該検出された最初の母音の長さに基づいて前記入力された音声信号の母音部の発話速度を検出し、該検出された発話速度に基づき、前記最初の母音以後に入力される所定数の母音部の音声信号の発話速度を予め設定されている目標話速に変換し、その後入力される音声信号の母音部は圧縮することを特徴とする。
【0010】
この出願の請求項3の発明は、音声信号を含む音響信号を入力する入力手段と、該入力手段から入力された音声信号の発話速度を検出する話速検出手段と、前記入力手段から入力された音声信号の母音部を検出する母音部検出手段と、該検出された母音部の数をカウントするカウント手段と、発話速度変換の目標値である目標話速を記憶する目標話速記憶手段と、該目標話速記憶手段に目標話速を設定する話速設定手段と、前記話速検出手段が検出した音声信号の発話速度から前記目標話速へ変換するための変換比率を算出する変換比率算出手段と、該変換比率算出手段が算出した変換比率で、前記カウント手段のカウント値が所定値になるまで入力される音声信号の発話速度を変換する話速変換手段と、前記カウント手段のカウント値が前記所定値に達したのち、入力される母音部を圧縮する及び/又は無声区間を削除する圧縮手段と、を備えたことを特徴とする。
【0011】
この出願の請求項4の発明は、音声信号を含む音響信号を入力する入力手段と、該入力手段から入力された音響信号を監視し、音声信号の開始を検出する音声信号検出手段と、該開始を検出された音声信号の母音部を検出する母音部検出手段と、該検出された母音部の数をカウントするカウント手段と、前記母音部検出手段により検出された母音部の長さを検出する母音長検出手段と、前記開始を検出された音声信号において、前記母音部検出手段により最初に検出された母音部の長さに基づいて該音声信号の発話速度を検出する話速検出手段と、発話速度変換の目標値である目標話速を記憶する目標話速記憶手段と、前記話速検出手段が検出した音声信号の発話速度から前記目標話速へ変換するための変換比率を算出する変換比率算出手段と、該変換比率算出手段が算出した変換比率で、前記カウント手段のカウント値が所定値になるまで前記最初の母音以後に入力される音声信号の発話速度を変換し、その後入力される音声信号の母音部は話速変換しない話速変換手段と、を備えたことを特徴とする。
【0012】
通常の速度の発声では1モーラ(1音節)はほぼ140〜150ms程度である。また、子音部と母音部はオーバーラップしているため厳密に子音部を特定することは困難であるが、このうちほぼ20〜40msを子音部が占め、母音部が100〜130msを占めることが知られている。また、通常の会話やアナウンスでは1単語程度の発声で発話速度が大きく変化することはないことも知られている。
【0013】
請求項1,請求項3および請求項5の発明では、これらの前提にたち、音声信号の最初の母音の長さを検出し、上記時間的占有率を逆算することによって発話速度(話速)を検出する。これにより、音声信号が入力されたときリアルタイム(約200ms以内)に該音声信号の発話速度を検出することができる。
【0014】
また、高齢者に聞き取りやすくするためには1モーラを200ms(5モーラ/秒)程度に伸長することが好ましい。請求項2,請求項4および請求項5の発明では、この発話速度を目標話速とし、上記検出方法で検出された発話速度とこの目標話速と差を補償するように入力される音声信号を変換することにより、話し手がどのような速度で話した場合でも高齢者が聞き取りやすい話速の音声信号を出力できるようにした。
【0015】
【発明の実施の形態】
図1は、この発明の実施の形態である話速変換機能付補聴器(以下、単に補聴器という。)の構成を示すブロック図である。マイク10はオーディオ信号を受信してアンプ11に入力する。なお、オーディオ信号は、会話やアナウンスの人声である音声信号やノイズなどからなる可聴周波数信号である。また、マイク10は補聴器本体,装耳部等どこに設けるものであってもよい。前記アンプ11は前記オーディオ信号を増幅してフィルタ12に入力する。上記フィルタ12はアンチエリアシングフィルタであり、サンプリング周波数の1/2以上の周波数をカットするローパスフィルタで構成されている。このフィルタ12を通過したオーディオ信号はA/Dコンバータ13でディジタル信号(波形データ)に変換される。このディジタルの波形データはDSP14に入力される。DSP14には信号処理用RAM15およびパラメータRAM16が接続されている。信号処理用RAM15はDRAMで構成された大容量のものであり、この信号処理用RAM15には話速変換され伸長された音声信号や遅延して出力される音声信号が記憶される。また、パラメータRAM16はDSP14の動作を制御するためのパラメータを記憶するRAMであり、バッテリバックアップされたSRAMで構成されている。このパラメータRAM16には目標話速データ記憶エリア16aが設定されているほか、後述の伸長音節数(Nvmax),レベル閾値(Pth),長さ閾値(Lpth),限度波数(Nd)などのパラメータが記憶される。またこのパラメータRAM16には設定器21が接続されている。この設定器21は、上記目標話速データや伸長音節数を設定するためのものである。
【0016】
DSP14は入力された波形データを分析して、現在音声信号が入力されているか否かを判断する。音声信号が入力されている場合には、その信号を伸長するなど適切な処理をして信号処理用RAM15に書き込むとともに、読出クロック(サンプリングクロック)に同期して書き込まれた信号をD/Aコンバータ17に出力する。また、音声信号が入力されていない場合には、入力された信号をそのままD/Aコンバータ17に出力する。また、DSP14はD/Aコンバータ17に信号を出力するとき、該信号のうち高い周波数成分のゲインを大きくするイコライジングを同時に行う。
【0017】
D/Aコンバータ17は入力されたディジタル波形データをアナログのオーディオ信号に再変換してローパスフィルタ18に入力する。オーディオ信号はローパスフィルタ18を通過することによって、アナログ変換時の不連続ノイズが除去される。そしてアンプ19は、このオーディオ信号を利用者が可聴できるレベルまで増幅してレシーバ20に出力する。レシーバ20は、アンプ19から入力されたアナログ信号を空気振動に変換して装用者の外耳道に放出する。
【0018】
なお、A/Dコンバータ13,DSP14およびD/Aコンバータ17には図示していないクロック回路からクロックが供与されている。
【0019】
ここで、この補聴器の機能を図2,図3を参照して説明する。
レシーバ20から出力される音声信号の話速の目標値を示す目標話速データをパラメータRAM16の目標話速データ記憶エリア16aに記憶する。この目標話速データは設定器21から設定入力されるが、この設定は工場出荷時に行っておいてもよく、利用者(装用者)が自ら設定するようにしてもよい。入力された音声信号がどのような話速のものであっても、この話速で出力されるように話速を変換する。この入力音声に応じた話速変換処理をリアルタイムに行うため、入力された音声信号の最初の音節は話速を変換せず、母音の長さを計測する。この母音の長さから後続する会話の話速を推定する。推定した入力音声の話速と上記目標値から話速変換比率(母音の波形データ伸長率)を算出し、後続する音節の母音に対して伸長処理を施す。これにより、どのような速度で話者が話しても装用者には一定の最も聞き取りやすい話速でこの音声信号が入力される。
【0020】
しかし、入力される全ての音声信号を話速変換して伸長すると、長い文章が一度に入力される場合には、入力音声信号に対する出力音声信号の遅延が大きくなりすぎて信号処理用RAM15の記憶容量が足りなくなったり、会話における応答のずれが大きくなりすぎて会話が円滑に行われなくなる問題点が生じ、さらに、テレビや映画などでは画面と音声のずれが大きくなる問題点などが生じる。その一方で、単語や一連の文はその全体を完全に聞き取ることができなくても、その一部特に先頭部分を正確に聞き取ることができれば、その内容を十分に把握することができる場合が多い。そこで、一つの単語を構成する音節の数は3つあるいは4つなど比較的少数の特定の数が多いことに着目し、この実施形態では先頭から4つ(第2音節から3つ)の音節は伸長し、それ以後の音節はそのまままたは圧縮して出力することにより、入力音声と出力音声の遅延の最小限にしている。なお、この実施形態では、日本語の場合、各音節には必ず母音が含まれていることに着目し、母音の数をカウントすることで音節数のカウントに代えている。また、無声区間も必要に応じてその一部を削除するようにしている。
【0021】
図2は4音節の単語「おはよう」が入力されたときの話速変換処理を示す図である。最初の「お」が入力されたとき、これを伸長しないでそのまま出力し、母音部の長さを測定する。この長さに基づいて伸長比率を決定する。次の「は」が入力されたとき、「は」を構成する音素「子音:H」と「母音:A」のうち子音のHはそのまま出力(メモリ(信号処理用RAM15)に記憶)し、母音のAは上記伸長比率に応じて伸長してメモリに記憶する。なお、メモリに記憶された波形データは読出プログラムによって順次よみだされ音声信号として出力される。この伸長処理プログラムと読出プログラムは並行して動作している。つぎの「よ」が入力されたときも同様に子音のYはそのままメモリに記憶し、母音のOを伸長してメモリに記憶する。「う」は母音のみであるため全体を伸長してメモリに記憶する。
【0022】
なお、この補聴器は入力レベルが入力レベル閾値Pthを超える信号が持続時間閾値Lpth以上の長さ入力されたとき、これを音声信号であると判断して上記処理を行う。このため、同図に示すパルス的なノイズが入力されても持続時間が短いためこれを音声信号として処理しない。また、話速変換された音声信号がメモリから読出出力されている期間以外は入力されたオーディオ信号(レベルノイズ・パルスノイズなどの背景音)をそのまま出力している。
【0023】
また、この図は、時間軸上の伸長方式のみ図示しているが、実際には出力レベルは入力レベルに比して数十dB増幅されているものとする。また、この増幅レベルは全ての周波数帯域に一様ではなく、可聴周波数に限定され、且つ、可聴周波数上方が特に大きなゲインで増幅されるようになっている。このイコライズ処理もDSP14が行う。
【0024】
また、図3は9音節の文「おはようございます」が入力されたときの話速変換処理を示す図である。9音節であっても最初の4音節「おはよう」に関しては上記と同様の処理が行われ伸長された音声信号がレシーバ20から出力される。そして、5音節目以後は圧縮されて出力される。DSP14は伸長処理をしながら音節数をカウントしており、連続して5音節目が入力されるとこれ以後連続して入力される音節(母音)が一定以上の長さであれば、これを圧縮するようにしている。5音節目以後は母音の波数(周期数)Nwをカウントし、このカウント値Nwが限度数Ndを超えたとき、それ以後を圧縮する。圧縮の方式は2波(2周期分の波形データ)を読み込んで、これらの平均波を算出し、この1波のみをメモリ(信号処理用RAM15)記憶することで時間を1/2に圧縮する方式である。
【0025】
なお、この実施形態では5音節以後を圧縮するようにしているが、圧縮しないでそのまま出力するようにしてもよい。また、圧縮の方式として、音節(母音)が一定波数を超えるときその超えた部分を1/2に圧縮する方式を採用しているが、圧縮方式はこれに限定されるものではなく、音節(母音)全体を圧縮するようにしてもよく、波数単位でなく時間単位で非圧縮限度を定めるようにしてもよい。
【0026】
図4〜図8は上記DSPの動作を示すフローチャートである。図4はデータ取込処理、図5〜図7は話速変換処理、図8は読出処理を示している。これらデータ取込処理、話速変換処理、読出処理は並行して実行される。なお、全ての動作スタート時に先立って初期設定動作が実行され、信号処理用RAM15のクリアやフラグのプリセットなどが行われているものとする。
【0027】
図4のフローチャートを参照してデータ取込処理について説明する。このデータ取込処理は、数サンプルの波形データからなるフレーム毎に実行される。まず、A/Dコンバータ13から波形データDをリアルタイムバッファに取り込む(s1)。そして、このレベルを判定する(s3)。このデータDのレベルが入力レベル閾値Pthよりも高い場合にはs6以下の動作に進む。また、DのレベルがPth以下の場合にはs4以下に進む。なお、リアルタイムバッファや各種フラグはDSP14の内部に設定されている。
【0028】
装用直後で音声信号がない場合、D≦Pthであり、初期設定によりFnsセット、Fsリセットであるためs3→s4→s5で何もしないでリターンする。ここで、話速変換フラグFsは、現在話速変換処理(主として伸長処理)を行っていることを示すフラグであり、これがセットされていると入力された波形データがそのまま出力されないことを示している。また、信号無しフラグFnsは入力された波形データがPthを超えているか否かを示すフラグである。このフラグのリセット状態が一定時間(Lpth)以上継続した場合、すなわち、Pthを超える信号がLpth以上継続して入力された場合、入力された信号が音声信号であると判断される。
【0029】
Pthを超える何らかの信号が入力された場合、s6に進み、話速変換フラグFsがセットされているか否かを判断する。最初はこのフラグはセットされていないためs7に進み信号無しフラグFnsがセットされているか否かを判断する。最初にこの動作に進んだときはFnsがセットされているためs7からs8に進む。s8ではFnsをリセットし、リセット継続時間(閾値レベルを超えた時間)をカウントするためタイマカウンタTを0にリセットする(s9)。また、連続して2回以上s6→s7に動作が進んだ場合にはすでにFnsがリセットされているためs7からs10に進む。s10ではタイマカウンタTに1を加算する。加算の結果Tが閾値Lpthに等しくなった場合には(s11)、現在入力されている信号は音声信号であるとして話速変換処理を開始するため話速変換フラグFsをセットし(s12)、変換比率計算処理(図5)を起動する(s13)。一方、s11でT<Lpthであった場合にはそのままリターンする。このように、s2で入力さされた波形データDが一定時間Lpth以上レベル閾値Pthを超えていた場合には音声信号が入力されたことしてFsがセットされる。Fsがセットされている間、後述の話速変換処理(変換比率計算処理および変換処理)が実行される。
【0030】
一方、入力された波形データのレベルDがPth以下になった場合には、s3からs4に進む。s4ではFnsがセットしているか否かを判断するが、一旦レベルDがPthを超えたのち、レベルが低下してs4に進んだ場合には、前記s8でFnsがリセットされているためs4からs14に進む。s14では信号無しフラグFnsをセットし、無音時間をカウントするためタイマカウンタTをリセットする(s15)。また、すでにFnsがリセットされている場合にはs4からs5に進み話速変換フラグFsがリセットされているか否かを判断する。Fsがリセットされている場合には上述したようにそのままリターンするが、一旦、話速変換動作をスタートしたのち入力信号レベルが低下してこの処理動作に進んだ場合にはFsはセットしたままであるためs5からs16に進む。s16ではタイマカウンタTに1を加算する。加算の結果Tが無音時間閾値Tnsに達した場合には(s17)、既に音声信号の入力は終了していると判断して話速変換フラグFsをリセットするとともに、音声信号の波形データが終了した以後、信号処理用RAM15に書き込まれた無音部のデータを廃棄するように、並行動作している話速変換処理動作に指示する(s19)。一方、Tに1を加算してもs17でT<Tnsであった場合にはそのままリターンする。
【0031】
このように、入力された波形データがPthを下回ったままTnsを経過したとき、音声信号の入力が終了したとして話速変換フラグFsをリセットする。なお、波形データのレベルDがPthを下回ったとき即座にFsをリセットしないのは、音声信号中にも短時間の無音部(無声区間)が存在するからであり、この無声区間も音声信号として取り込む必要があるからである。音声信号中に含まれる無音部としては促音「っ」や語間のインターバルなどがある
以下、話速変換処理動作を説明する。
図5のフローチャートはFsがセットされ、話速変換処理動作がスタートしたとき最初に実行される変換比率計算処理動作を示している。この動作がスタートするときにはリアルタイムバッファにLpth分の波形データが蓄積されているため、このなかの適当な区間を切り出し(s21)、ゼロクロス点の間隔に基づいて各部の基本周波数fzを割り出す(s22)。このfzに基づき、母音部を抽出する(s23)。母音部は子音部に比して基本周波数が低いことからこれらを分離抽出することができる。そして、母音部数カウンタNvに1をセットする(s24)。この母音部数カウンタNvは音節数をカウントする代わりに母音部の数をカウントするものであり、以下の処理ではこのカウント値を音節数として扱っている。以下、リアルタイムバッファに入力される波形データを監視しながら母音部を終了するまで母音の時間的長さLvをカウントする(s25,s26)。この音節の母音部が終了すると(s26)、この母音部の長さに基づいて音節の長さを推定し、これに基づいてこの音声信号の発話速度(話速)を算出する(s27)。この算出された話速とパラメータRAM16に記憶されている目標話速データとを比較することにより話速変換比率を計算する(s28)。こののち、話速変換処理を実行するための変換処理動作(図6)を起動する(s29)。
【0032】
なお、リアルタイムバッファは、ある程度の時間分の波形データを蓄積記憶することができるものとし、処理済のデータは各処理動作において適宜クリアまたは上書きされるものとする。
【0033】
図6は実際に話速変換処理を実行する変換処理動作を示すフローチャートである。この動作は、音声信号が入力されたのち、第2音節のデータから実行される。この処理が開始されると、入力された波形データをリアルタイムバッファから直接読み出し出力することができなくなり、信号処理用RAM15から読み出す必要があるためメモリ読出フラグFmをセットする(s30)。そしてリアルタイムバッファ記憶されているデータを読み取る(s31)。このデータが母音部のデータであるか(s32)、子音部のデータであるか(s33)、無音部のデータであるか(s34)、または、無音部データの廃棄指示のデータであるか(s35)を判断する。なお、この動作においてリアルタイムバッファのデータの読み取りはs31のみで行われるのではなく、必要に応じて各処理動作で行われる。また、リアルタイムバッファからデータを読み取るとき、必要に応じてA/Dコンバータ13からデータが入力されるまで待機する。
【0034】
あ行以外の音節は子音から開始するため、子音部と判断された場合にはs33からs36に進みこの子音部のデータをそのまま信号処理用RAM15に書き込む(s36)。子音は非周期音であり加工すると不自然になるため、話速変換するときでも伸長しないためである。
【0035】
一方、読み取られたデータが母音部のデータである場合には、母音部数カウンタNvに1を加算する(s40)。これによりNvがNvmaxを超えたか否かを判断する(s41)。図3を参照して説明したようにこの実施形態ではNvmax=4にしている。したがって、Nvが5になったときs41は肯定的な判断となりs45に進む。NvがNvmax以下のときには、この母音部を伸長する(s42,s43)。
【0036】
図7(A)のフローチャートを参照して伸長処理を説明する。ここでは、母音部の複数波を1つのブロックとして扱う。たとえば、母音の3波で1ブロックとする。そして、このブロックにおける母音波形の基本周波数を算出する(s60)。この基本周波数の算出はゼロクロスを用いたもので、s22の動作とほぼ同様である。そしてブロック内の隣接する2波形を選択して切り出し(s61)、これらの平均波形を算出する(s62)。そしてこの平均波形を上記切り出した2波形間に挿入する(s63)。これでこのブロックは4波になったことになる。この4波のブロックを信号処理用RAM15に書き込む(s64)。この例では、3波を4波に伸長しているため、伸長率は133%となる。また、各ブロックは全て同数である必要はなく、伸長率130%にするためには、ブロックの波数を4,3,3の繰り返しにすればよい。
【0037】
図6に戻って、検出された母音部(音節)が5番目以後のものであった場合にはs41からs45に進む。s45ではこの母音部の長さを波数で計るための波数カウンタNwをクリアする。そしてリアルタイムバッファに入力される波形データを読み取り、1波形が入力される毎にNwをカウントアップしてゆく(s46)。そしてこの波数Nwが限度波数Ndを超えるまではそのままRAMに書き込んでゆくが(s47→s48)、Nwが限度波数Ndを超えると以後は圧縮処理をして(s49)、信号処理用RAM15に書き込む。
【0038】
図7(B)は圧縮処理動作を示すフローチャートである。この動作は、リアルタイムバッファに2波形が入力されるのを待って実行される。まず、この2波形を切り出し(s65)、この平均波形を算出する(s66)。そして、この算出された平均波形を上記2波形に代えて信号処理用RAM15に書き込む(s67)。この動作により、Nd以後の母音部波形は1/2に圧縮されることになる。
【0039】
また、s31で読み取られた波形データが無音部のものであれば母音数(音節数)カウンタNvの値を判断し(s55)、Nvmaxを超えていなければ母音部の伸長率に合わせてこの無音部も伸長して信号処理用RAM15に書き込む(s56)。もし、音節数Nvが伸長限度数Nvmaxを超えている場合には、伸長せずにそのまま信号処理用RAM15に書き込む(s36)。一方、読み取られたデータが無音部の廃棄指示であれば信号処理用RAM15の末尾に記憶されている無音データ群を廃棄・消去する(s57)。これは、これらの無音部データを音声信号の無声区間(促音など)として記憶していたが、実際には音声信号が終了したあとの無音部分であり不要であることが判明したからである。
廃棄指示が入力されると、音声信号の処理が終了したことを意味するためこれでこの動作を終了してリターンする。
【0040】
図8は読出処理動作を示すフローチャートである。この動作はデータ取込処理と同様、補聴器の動作スタートと同時に起動し常時実行されている。この動作も上記データ取込処理動作と同様サンプリングタイミング毎に実行される。
【0041】
まず、Fmがセットしているか否かを判断する(s70)。Fmがセットしていない場合にはs74に進んで、リアルタイムバッファに記憶されている最新のデータを読み出してD/Aコンバータ17に出力する。Fmがセットされている場合には信号処理用RAM15に読み出すべきデータがあるか否かを判断し(s71)、ある場合には時刻ポインタに指示される位置のデータを読み出してD/Aコンバータ17に出力する(s72)。時刻ポインタはこの読み出しによって歩進されるが、上記変換処理(伸長処理・圧縮処理を含む)によるデータ書き込みによっても変更される場合があるものとする。一方、信号処理用RAM15に読み出すべきデータがない場合にはFmをリセットしたのち(s73)、リアルタイムバッファから最新のデータを読み出してD/Aコンバータ17に出力する(s74)。以後、変換処理動作がスタートしてFmがセットされるまでリアルタイムバッファからD/Aコンバータ17にデータが出力されることになる。なお、信号処理用RAM15においては、読出済データの消去動作が適宜行われるものとする。
【0042】
なお、上記実施形態では、最初の母音(音節)は話速変換せずに出力するようにしているが、何らかの変換比率で話速変換出力するようにしてもよい。たとえば、直前の音声信号に対して決定された変換比率で変換するなどである。
【0043】
なお、上記実施形態では、最初の母音の長さに基づいてその音声信号の発話速度を検出するようにしているが、発話速度を検出する方法はこれに限定されない。たとえば、無音部の後に音声信号が入力されたとき、該無音部直前に入力された音声信号の母音長から今回の音声信号の発話速度を推定する方法や、無音部の後に音声信号が入力されたとき、該無音部直前に入力された音声信号の母音間距離から今回の音声信号の発話速度を推定する方法などを採用することができる。これらの方法によれば、直前の1音節を用いることもでき、直前の1文すべての母音長や母音間距離を求めてその平均値やその変化曲線を用いて今回の発話速度を推定することができる。
【0044】
また、この実施形態には請求の範囲に記載していない以下のような発明が含まれている。
【0045】
所定音節以後は話速変換しないようにしたことにより、理解度の低下を防ぎ、且つ、出力遅れを最小限にくい止めることができる。
【0046】
音声信号として検出された信号のゲインを上げることにより、了解度を高くすることができる。
【0047】
【発明の効果】
以上のようにこの発明によれば、音声信号の最初の母音に基づいてその音声信号の発話速度を検出するようにしたことにより、ほぼリアルタイムで高精度に発話速度を検出することができる。
【0048】
また、この発明によれば、入力された音声信号の発話速度を検出し、この音声信号の発話速度を目標話速に変換することにより、どのような発話速度の音声信号が入力された場合でもリアルタイムに利用者が所望の速度(目標話速)に発話速度を変換することができる。
【図面の簡単な説明】
【図1】この発明の実施形態である話速変換機能付の補聴器のブロック図
【図2】同補聴器の話速変換機能を説明する図
【図3】同補聴器の話速変換機能を説明する図
【図4】同補聴器のDSPの動作を示すフローチャート
【図5】同補聴器のDSPの動作を示すフローチャート
【図6】同補聴器のDSPの動作を示すフローチャート
【図7】同補聴器のDSPの動作を示すフローチャート
【図8】同補聴器のDSPの動作を示すフローチャート
【符号の説明】
10…マイクロフォン、11…マイクアンプ、12…フィルタ、
13…A/Dコンバータ、14…DSP、15…音声信号RAM、
16…パラメータRAM、16a…目標話速データ記憶エリア、
17…D/Aコンバータ、18…ローパスフィルタ、19…パワーアンプ、
20…レシーバ、21…設定器
Claims (4)
- 入力される音声信号のうち最初の母音の長さを検出し、
該検出された最初の母音の長さに基づいて前記入力された音声信号の母音部の発話速度を検出し、
該検出された発話速度に基づき、前記最初の母音以後に入力される所定数の母音部の音声信号の発話速度を予め設定されている目標話速に変換し、その後入力される音声信号の母音部は話速変換しないことを特徴とする話速変換方法。 - 入力される音声信号のうち最初の母音の長さを検出し、
該検出された最初の母音の長さに基づいて前記入力された音声信号の母音部の発話速度を検出し、
該検出された発話速度に基づき、前記最初の母音以後に入力される所定数の母音部の音声信号の発話速度を予め設定されている目標話速に変換し、その後入力される音声信号の母音部は圧縮することを特徴とする話速変換方法。 - 音声信号を含む音響信号を入力する入力手段と、
該入力手段から入力された音声信号の発話速度を検出する話速検出手段と、
前記入力手段から入力された音声信号の母音部を検出する母音部検出手段と、
該検出された母音部の数をカウントするカウント手段と、
発話速度変換の目標値である目標話速を記憶する目標話速記憶手段と、
該目標話速記憶手段に目標話速を設定する話速設定手段と、
前記話速検出手段が検出した音声信号の発話速度から前記目標話速へ変換するための変換比率を算出する変換比率算出手段と、
該変換比率算出手段が算出した変換比率で、前記カウント手段のカウント値が所定値になるまで入力される音声信号の発話速度を変換する話速変換手段と、
前記カウント手段のカウント値が前記所定値に達したのち、入力される母音部を圧縮する及び/又は無声区間を削除する圧縮手段と、
を備えたことを特徴とする話速変換機能付補聴器。 - 音声信号を含む音響信号を入力する入力手段と、
該入力手段から入力された音響信号を監視し、音声信号の開始を検出する音声信号検出手段と、
該開始を検出された音声信号の母音部を検出する母音部検出手段と、
該検出された母音部の数をカウントするカウント手段と、
前記母音部検出手段により検出された母音部の長さを検出する母音長検出手段と、
前記開始を検出された音声信号において、前記母音部検出手段により最初に検出された母音部の長さに基づいて該音声信号の発話速度を検出する話速検出手段と、
発話速度変換の目標値である目標話速を記憶する目標話速記憶手段と、
前記話速検出手段が検出した音声信号の発話速度から前記目標話速へ変換するための変換比率を算出する変換比率算出手段と、
該変換比率算出手段が算出した変換比率で、前記カウント手段のカウント値が所定値になるまで前記最初の母音以後に入力される音声信号の発話速度を変換し、その後入力される音声信号の母音部は話速変換しない話速変換手段と、
を備えたことを特徴とする話速変換機能付補聴器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP12662597A JP3961616B2 (ja) | 1996-05-22 | 1997-05-16 | 話速変換方法および話速変換機能付補聴器 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8-127363 | 1996-05-22 | ||
JP12736396 | 1996-05-22 | ||
JP12662597A JP3961616B2 (ja) | 1996-05-22 | 1997-05-16 | 話速変換方法および話速変換機能付補聴器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1070790A JPH1070790A (ja) | 1998-03-10 |
JP3961616B2 true JP3961616B2 (ja) | 2007-08-22 |
Family
ID=26462788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP12662597A Expired - Fee Related JP3961616B2 (ja) | 1996-05-22 | 1997-05-16 | 話速変換方法および話速変換機能付補聴器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3961616B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3374767B2 (ja) * | 1998-10-27 | 2003-02-10 | 日本電信電話株式会社 | 録音音声データベース話速均一化方法及び装置及び話速均一化プログラムを格納した記憶媒体 |
JP3432443B2 (ja) * | 1999-02-22 | 2003-08-04 | 日本電信電話株式会社 | 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体 |
JP4882152B2 (ja) * | 2001-01-24 | 2012-02-22 | ヤマハ株式会社 | 話速検出方法および音声信号処理装置 |
JP2007047312A (ja) * | 2005-08-08 | 2007-02-22 | Sony Corp | 話速変換装置 |
JP4807261B2 (ja) * | 2007-01-09 | 2011-11-02 | ヤマハ株式会社 | 音声処理装置およびプログラム |
WO2011001694A1 (ja) | 2009-07-03 | 2011-01-06 | パナソニック株式会社 | 補聴器の調整装置、方法およびプログラム |
JP5289591B1 (ja) * | 2012-01-18 | 2013-09-11 | 三菱電機株式会社 | 音声ガイダンス機能搭載家電製品 |
JP2015132777A (ja) * | 2014-01-15 | 2015-07-23 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
-
1997
- 1997-05-16 JP JP12662597A patent/JP3961616B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1070790A (ja) | 1998-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2955247B2 (ja) | 話速変換方法およびその装置 | |
KR100302370B1 (ko) | 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템 | |
JP3961616B2 (ja) | 話速変換方法および話速変換機能付補聴器 | |
JP3220043B2 (ja) | 話速変換方法およびその装置 | |
JP2000152394A (ja) | 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置 | |
JP2959468B2 (ja) | 話速変換方法および話速変換機能付補聴器 | |
JP4127155B2 (ja) | 聴覚補助装置 | |
JPH0916193A (ja) | 話速変換装置 | |
JPS6257040B2 (ja) | ||
JP3284968B2 (ja) | 話速変換機能を有する補聴器 | |
JP2905112B2 (ja) | 環境音分析装置 | |
JP4134844B2 (ja) | 聴覚補助装置 | |
JP3102553B2 (ja) | 音声信号処理装置 | |
JPH08317496A (ja) | ディジタル音声信号処理装置 | |
JPH08294199A (ja) | 話速変換装置 | |
JP3257379B2 (ja) | 話速変換機能付補聴器 | |
JP3632384B2 (ja) | 聴覚補助装置 | |
JP4079478B2 (ja) | 音声信号の処理回路および処理方法 | |
JPH10145897A (ja) | 話速変換装置 | |
JPH07281691A (ja) | 話速変換方法 | |
JPH0698398A (ja) | 音声の無音区間検出伸長装置及び音声の無音区間検出伸長方法 | |
JP2870421B2 (ja) | 話速変換機能を有する補聴器 | |
JP4005166B2 (ja) | 音声信号の処理回路 | |
JP4882152B2 (ja) | 話速検出方法および音声信号処理装置 | |
JPH0772896A (ja) | 音声の圧縮伸長装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040402 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040831 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041101 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20041124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050121 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050126 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20050225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070517 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110525 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130525 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140525 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |