JPH10145897A - 話速変換装置 - Google Patents

話速変換装置

Info

Publication number
JPH10145897A
JPH10145897A JP30455096A JP30455096A JPH10145897A JP H10145897 A JPH10145897 A JP H10145897A JP 30455096 A JP30455096 A JP 30455096A JP 30455096 A JP30455096 A JP 30455096A JP H10145897 A JPH10145897 A JP H10145897A
Authority
JP
Japan
Prior art keywords
vowel
consonant
signal
speech speed
speed conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP30455096A
Other languages
English (en)
Inventor
Katsufumi Kondo
克文 近藤
Koji Tanitaka
幸司 谷高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP30455096A priority Critical patent/JPH10145897A/ja
Publication of JPH10145897A publication Critical patent/JPH10145897A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】話速変換処理された音声信号における母音部と
子音部とのエネルギーバランスを自然の発話における母
音部と子音部とのエネルギーバランスに近づけることに
より話速変換処理された音声信号の明瞭度を向上させた
話速変換装置を提供する。 【解決手段】話速変換装置では、入力された音声信号か
ら母音部を抽出し、該母音部を設定されている伸長率で
伸長するとともに、伸長された母音部の先行または/お
よび後続する子音部を設定されている増幅率で増幅す
る。また、母音部を伸長する伸長率と子音部を増幅する
増幅率とを相関させたことによって、子音部と母音部と
のエネルギーバランスを自然の発話における子音部と母
音部とのエネルギーバランスに近づている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、入力される音声
信号を時間的に伸長し、これを出力する話速変換装置に
関する。
【0002】
【従来の技術】従来より、高齢者等の聴覚機能が低下し
た者に対する機能補助装置として補聴器がある。ここ
で、高齢化による聴覚機能の低下には、最小可聴信号レ
ベルの上昇、高音域の聴取機能の低下などの伝音系機能
の低下だけではなく、音声を識別することのできる話速
(音声識別臨界速度)の低下という聴覚中枢系の機能低
下も含まれている。このため、高齢者向けの補聴器には
音声信号を増幅する機能に加えて、装用者にゆっくり聞
かせるために音声信号を時間的に伸長して出力する話速
変換処理装置を備えた補聴器の提案がされている。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
話速変換処理装置は、音声信号に含まれる母音部を時間
的に伸長するというものであり、子音部に対しては何ら
加工を行っていなかった。その結果、話速変換処理され
た音声信号においては、もともとエネルギーの小さい子
音部がそのままの小さいエネルギーで放置されているの
に対し、もともとエネルギーの大きかった母音部が伸長
されたことによってさらに大きなエネルギーを持ち、子
音部と母音部とのエネルギーバランスが自然の発話にお
けるエネルギーバランスからかけ離れたものとなる。こ
のように、母音部のエネルギーだけが増加するため、こ
の話速変換処理された音声信号では母音部による先行お
よび後続する子音部のマスキング効果が大きくなり、明
瞭度が悪いという問題があった。
【0004】この発明の目的は、話速変換処理された音
声信号における母音部と子音部とのエネルギーバランス
を自然の発話における母音部と子音部とのエネルギーバ
ランスに近づけることにより話速変換処理された音声信
号の明瞭度を向上させた話速変換装置を提供することに
ある。
【0005】
【課題を解決するための手段】請求項1に記載した発明
は、入力される音声信号から母音部を検出する母音検出
手段と、母音部を時間的に伸長する伸長手段と、を備え
た話速変換装置であって、前記伸長手段で伸長した母音
部に先行または/および後続する子音部を増幅する子音
増幅手段を備えたことを特徴とする。
【0006】この構成では、入力される音声信号から母
音部を検出し、該母音部を時間的に伸長するとともに、
伸長した母音部に先行または/および後続する子音部を
増幅する。これによって、入力された音声信号の母音部
と子音部が図7(A)に示すようなエネルギーであれ
ば、話速変換処理された音声信号においてはエネルギー
が増加するのが伸長された母音部だけでなく、増幅され
た子音部のエネルギーも増加し、話速変換処理された音
声信号の母音部と子音部が図7(B)に示すようなエネ
ルギーバランスとなる。すなわち、話速変換処理された
音声信号における母音部のエネルギが子音部のエネルギ
ーに比べて極端に大きなものとならない。このため、母
音部に先行または/および後続する子音部がマスキング
されることを防止でき、話速変換処理された音声信号の
明瞭度を向上させることができる。なお、伸長した母音
部に先行する子音部を増幅すれば該子音部がマスキング
されることを防止でき、伸長した母音部に後続する子音
部を増幅すれば該子音部がマスキングされることを防止
できる。
【0007】請求項2に記載した発明は、前記母音部を
伸長する伸長率を用いて前記子音部を増幅する増幅率を
決定する増幅率決定手段を備えたことを特徴とする。
【0008】この構成では、子音部を増幅する増幅率が
伸長率を用いて決定されるようにしたので、話速変換処
理された音声信号における子音部と母音部とのエネルギ
ーバランスを処理前の(自然の発話による)音声信号に
おけるエネルギーバランスに近似させることができ、話
速変換処理された音声信号の明瞭度をさらに向上させる
ことができる。
【0009】さらに、請求項3に記載した発明は、入力
された一連の音声信号の先頭から所定数の音節以降の母
音部に対して前記伸長手段を禁止する伸長禁止手段と、
前記伸長手段で伸長された母音部に後続する子音部の直
前に所定の時間以上の無音部があり且つ、該子音部に後
続する母音部が伸長されないときには、該子音部に対す
る増幅を禁止する増幅禁止手段を備えたことを特徴とす
る。
【0010】この構成では、伸長された母音部に後続す
る子音部であっても、直前に所定の時間以上の無音部が
あり且つ後続する母音部が伸長されないときには該子音
部に対する増幅を禁止する。ここで、直前に所定の時間
以上の無音部がある子音部は先行する母音部にマスキン
グされない。一方、該子音部を増幅すると、この増幅さ
れてエネルギーの大きくなった子音部と後続する伸長さ
れない母音部とのエネルギーバランスが崩れ、話速変換
処理された音声信号の明瞭度を低下させる。したがっ
て、このような子音部の増幅を禁止することで、話速変
換処理された音声信号の明瞭度の低下を防止できる。
【0011】
【発明の実施の形態】図1は、この発明の実施の形態で
ある話速変換装置を適用した補聴器1の構成を示すブロ
ック図である。マイク2は、オーディオ信号を受信して
アンプ3に入力する。ここで、オーディオ信号とは会話
やアナウンスの人声である音声信号やノイズ等からなる
可聴周波数信号である。また、マイク2は補聴器本体、
装耳部等どこに設けるものであってもよい。前記アンプ
3はマイク2から入力されたオディオ信号を増幅してフ
ィルタ4に入力する。上記フィルタ4はアンチエリアシ
ングフィルタであり、サンプリング周波数の1/2以上
の周波数をカットするローパスフィルタで構成されてい
る。このフィルタ4を通過したオーディオ信号がA/D
コンバータ5でディジタル信号に変換される。DSP6
にこのディジタル信号が入力される。DSP6には、信
号処理用RAM7、パラメータRAM8、ROM9が接
続されている。信号処理用RAM7はDRAMで構成さ
れた大容量のものであり、この信号処理用RAM7には
後述する話速変換処理によって伸長や増幅等した出力す
る音声信号を記憶する。また、パラメータRAM8に
は、DSP6の動作を制御するためのパラメータを記憶
しており、バッテリバックアップされたSRAMで構成
されている。装用者によって設定される後述する母音の
伸長率K、子音の増幅係数gおよび伸長率Kと増幅係数
gから決定される子音の増幅率GもこのパラメータRA
M8に記憶される。ROM9には、DSP6の動作プロ
グラムが記憶されている。なお、DSP6、信号処理用
RAM7、パラメータRAM8、および、ROM9が話
速変換装置を構成する。
【0012】DSP6はROM9に記憶されている動作
プログラムに基づいて入力された音声信号に対して後述
する処理を行う。D/Aコンバータ11は入力されたデ
ィジタル信号をアナログ信号に再変換してフィルタ12
に入力する。フィルタ12は、ローパスフィルタであ
り、アナログ変換時の不連続ノイズを除去する。そし
て、アンプ13がフィルタ12から出力されたアナログ
信号を装用者の可聴信号レベルまで増幅してレシーバ1
4に入力し、レシーバ14でこの入力されたアナログ信
号を空気振動に変換し、装用者の外耳道に放出する。な
お、図示していないがA/Dコンバータ5、DSP回路
6、D/Aコンバータ11等にクロック回路からクロッ
クを供与している。
【0013】上記したように、この補聴器1は、入力さ
れた音声信号に対して話速変換装置が母音部の伸長およ
び子音部の増幅を行う。また、アンプ13は話速変換装
置で伸長および増幅された音声信号を増幅し、レシーバ
14がこの増幅された信号を空気振動として放出する。
母音部を伸長する伸長率Kおよび子音部を増幅する増幅
率Gは、後述する処理でパラメータRAM8に設定す
る。また、この実施形態の話速変換装置では、入力され
る全ての音声信号に対して母音部を伸長するのではな
く、入力される一連の音声信号において先頭から3つの
音節における母音部に対して伸長処理を行い、その後に
つづく音声信号に対しては母音部の伸長処理を行わな
い。その理由は、入力される全ての音声信号に対して母
音部を伸長すると、長い文章が一度に入力された場合、
入力信号に対する出力信号の遅延が大きくなりすぎて信
号処理用RAM7の記憶容量が足りなくなったり、会話
における応答のずれが大きくなりすぎて会話が円滑に行
われなくなるという問題が生じたり、さらに、テレビや
映画などでは画面と音声のずれが大きくなる問題が生じ
るからである。一方で、一連の音声信号による文は、そ
の全体を正確に聞き取ることができなくても、その一
部、特に先頭部分を正確に聞き取ることができれば、そ
の文の内容を十分に把握することができる。そこで、本
実施形態の話速変換装置では、上記したように入力され
る一連の音声信号に対してその先頭から3つの音節にお
ける母音部のみを伸長し、それ以後の音声信号に対して
は伸長処理を行わないようにした。なお、この実施形態
では、一連の音声信号に対してその先頭から3つの音節
における母音部のみを伸長するとして説明を行うが、先
頭から4つまたは5つの音節における母音部を伸長する
ように変更することも簡単にできる。また、日本語で
は、各音節に通常母音が含まれているので音節数と母音
の数はほぼ一致する。
【0014】さらに、この実施形態の話速変換装置は、
話速変換処理された信号の子音部と母音部とのエネルギ
ーバランスが崩れて、不明瞭な音声信号となることを防
止するために、伸長する母音部に先行および後続する子
音部を増幅する。その他の子音部は増幅しない。具体的
には、上記したように先頭から3つの音節における母音
部だけを伸長する構成としているので、先頭から4つ目
の音節の子音部まで増幅を行い、以降の子音部に対して
は増幅を禁止する。これに加えて、子音部の直前に10
0ms以上の無音部がある場合、該子音部に先行する母
音部が伸長される場合であっても後続する母音部が伸長
されない場合には該子音部の増幅を禁止するようにして
いる。この場合に該当する子音部は、先頭から4つ目の
音節の子音部であり、直前に100ms以上の無音部が
ある場合には該子音部の増幅を禁止するようにしてい
る。例えば、『花が咲いた(HANAGASAIT
A)』と言う入力された音声に対して話速変換処理を行
う場合には、先頭から3音節までの『はなが』に対して
は子音部が増幅され、母音部が伸長される。ここで、
『花が』と『咲いた』の間が数十ms程度の短い無音部
であった場合には、『咲』の子音部『S』は増幅しない
と、先行する伸長された『が』の母音部『A』にマスキ
ングされて不明瞭な音声信号となる。よって、この場合
には『咲』の子音部『S』を増幅する。また、『花が』
と『咲いた』の間が100ms以上の長い無音部であっ
た場合には、『咲』の子音部『S』は先行する伸長され
た『が』の母音部『A』にマスキングされない。一方、
『咲』の子音部『S』を増幅すると、伸長されない
『咲』の母音部『A』との間で自然性が失われる。この
ため、『咲』の子音部『S』の増幅しない方が話速変換
処理された音声信号の明瞭度がよい。そこで、このよう
な子音部に対しては増幅を禁止するようにしている。な
お、後続する『いた』に対しては、子音部の増幅および
母音部の伸長は行わない。また、本実施形態の話速変換
装置では、後述するように母音部を伸長する伸長率と子
音部を増幅する増幅率とを相関させており、話速変換処
理された音声信号における母音部と子音部とのエネルギ
ーバランスを自然の発話におけるそれに近づけ、処理さ
れた音声信号の明瞭度をより一層向上させている。
【0015】次に、この実施形態の補聴器1の動作につ
いて説明する。この実施形態の補聴器1は、以下に示す
パラメータ設定モードと入力された音声信号を処理して
出力させる実行モードの2つのモードがある。このモー
ドの切り替えは、スイッチ操作によって簡単に行える。
なお、このスイッチは補聴器1の本体に設けられてい
る。使用に先立って、パラメータ設定モードで母音部の
伸長率Kおよび子音部の増幅率Gの設定を行う。図2は
パラメータ設定モードにおける処理を示すフローチャー
トである。パラメータ設定モードでは、最初に母音部の
伸長率Kの入力を受け付ける。なお、母音部の伸長率K
は予め範囲が設定されており、装用者はその範囲内の値
を入力する。話速変換装置は母音部の伸長率Kの入力を
受け付けると(n1)、入力された伸長率Kが予め設定
されている範囲内の値であるかどうかを判定する(n
2)。もし、入力された伸長率Kが予め設定されている
範囲内の値であればこの値を母音部の伸長率Kとしてパ
ラメータRAM8に記憶し(n3)、次いで子音部に対
する増幅係数gの入力を受け付ける(n4)。入力され
た伸長率Kが予め設定されている範囲内の値でなければ
n1に戻り伸長率Kの再入力を受け付ける。
【0016】n4で子音部の増幅係数gの入力を受け付
けると、入力された子音部の増幅係数gが設定されてい
る範囲内の値であるかどうかを判定する(n5)。入力
された増幅係数gが設定されている範囲内の値でなけれ
ばn4に戻る。しかし、増幅係数gが設定されている範
囲内の値であれば、n3で記憶した母音部の伸長率Kと
この子音部の増幅係数gとの積を増幅率Gとして算出し
(n6)、この算出した増幅率Gが1以下であるかどう
かを判定し(n7)、1以下であればn1に戻り、上記
した処理を繰り返す。n7で1以下でない場合には、n
6で算出した増幅率GをパラメータRAM8に記憶し処
理を完了する(n8)。すなわち、子音部の増幅率G=
母音部の伸長率K×子音部の増幅係数gである。
【0017】このように、伸長率Kと増幅係数gの設定
可能な範囲を制限し、増幅率Gを母音部の伸長率Kに基
づいて決定されるようにしているのは、話速変換処理さ
れた音声信号における母音部と子音部とのエネルギーバ
ランスが自然の発話におけるそれからかけ離れたものと
なることを防止し、話速変換処理された音声信号の明瞭
度を向上させるためである。また、増幅率Gと伸長率K
との間には、K≧G>1 の関係が成立するよう、伸長
率Kと増幅係数gに対して設定可能な範囲を制限してい
る。なお、入力された母音部の伸長率Kに基づいて子音
部の増幅率Gが自動的に設定されるようにしてもよい
(予め、子音増幅係数gを固定値として設定しておくこ
とによって実現できる。)。このようにすれば、装用者
は自分の音声識別臨界速度に応じて伸長率を設定するだ
けでよくなり、設定操作をより簡単に行えるようにでき
る。
【0018】次に、実行モードの動作について説明す
る。マイク2で取り込まれた音声信号は、アンプ3、フ
ィルター4を介してA/D変換器5に入力され、A/D
変換器5でディジタル信号に変換される。話速変換装置
では、A/D変換器5でディジタル信号に変換された音
声信号を取り込んで以下に示す処理を行う。図3〜図6
を参照しながら話速変換装置の実行モードの動作につい
て説明する。図3はデータの取り込み処理を示す図であ
る。なお、全ての動作スタート時に先立って初期設定動
作が実行され、信号処理用RAM15のクリアや後述す
る各種フラグのプリセットなどが行われているものとす
る。
【0019】図3のフローチャートを参照してデータ取
込処理について説明する。このデータ取込処理は、数サ
ンプルの波形データからなるフレーム毎に実行される。
まず、A/Dコンバータ5から波形データDをリアルタ
イムバッファに取り込む(n11)。そして、このレベ
ルを判定する(n12)。このデータDのレベルが入力
レベル閾値Pthよりも高い場合にはn16以下の動作
に進む。また、DのレベルがPth以下の場合にはn1
3以下に進む。なお、リアルタイムバッファや各種フラ
グはDSP14の内部に設定されている。
【0020】装用直後で音声信号がない場合、D≦Pt
hであり、初期設定により信号無しフラグFnsセッ
ト、話速変換フラグFsリセットであるためn12→n
13→n14で何もしないでリターンする。ここで、話
速変換フラグFsは、現在話速変換処理を行っているこ
とを示すフラグであり、これがセットされていると入力
された波形データがそのまま出力されないことを示して
いる。また、信号無しフラグFnsは入力された波形デ
ータがPthを超えているか否かを示すフラグである。
このフラグのリセット状態が一定時間(Lpth)以上
継続した場合、すなわち、Pthを超える信号がLpt
h以上継続して入力された場合、入力された信号が音声
信号であると判断される。
【0021】Pthを超える何らかの信号が入力された
場合、n16に進み、話速変換フラグFsがセットされ
ているか否かを判断する。最初はこのフラグはセットさ
れていないためn17に進み信号無しフラグFnsがセ
ットされているか否かを判断する。最初にこの動作に進
んだときはFnsがセットされているためn17からn
18に進む。n18ではFnsをリセットし、リセット
継続時間(閾値レベルを超えた時間)をカウントするた
めタイマカウンタTを0にリセットする(n19)。ま
た、連続して2回以上n16→n17に動作が進んだ場
合にはすでにFnsがリセットされているためn17か
らn20に進む。n20ではタイマカウンタTに1を加
算する。加算の結果Tが閾値Lpthに等しくなった場
合には(n21)、現在入力されている信号は音声信号
であるとして話速変換処理を開始し信号処理用RAM7
から波形データを読み出すようにするため話速変換フラ
グFsおよびメモリ読出フラグFmをセットして(n2
2)、リターンする。一方、n21でT<Lpthであ
った場合にはそのままリターンする。このように、n1
2で入力された波形データDが一定時間Lpth以上レ
ベル閾値Pthを超えていた場合には音声信号が入力さ
れたとしてFsがセットされる。Fsがセットされてい
る間、後述(図4)の話速変換処理が実行される。
【0022】一方、入力された波形データのレベルDが
Pth以下になった場合には、n12からn13に進
む。n13ではFnsがセットしているか否かを判断す
るが、一旦レベルDがPthを超えたのち、レベルDが
低下してn13に進んだ場合には、前記n18でFns
がリセットされているためn13からn24に進む。n
24では信号無しフラグFnsをセットし、無音時間を
カウントするためタイマカウンタTをリセットする(n
25)。また、すでにFnsがリセットされている場合
にはn13からn14に進み話速変換フラグFsがリセ
ットされているか否かを判断する。Fsがリセットされ
ている場合には上述したようにそのままリターンする
が、一旦、話速変換動作をスタートしたのち入力信号レ
ベルが低下してこの処理動作に進んだ場合にはFsはセ
ットしたままであるためn14からn26に進む。n2
6ではタイマカウンタTに1を加算する。加算の結果T
が無音時間閾値Tnsに達した場合には(n27)、既
に音声信号の入力は終了していると判断して話速変換フ
ラグFsをリセットするとともに、音声信号の波形デー
タが終了した以後、信号処理用RAM15に書き込まれ
た無音部のデータを廃棄するように、並行動作している
話速変換処理動作に指示する(n29)。一方、Tに1
を加算してもn27でT<Tnsであった場合にはその
ままリターンする。
【0023】このように、入力された波形データがPt
hを下回ったままTnsを経過したとき、音声信号の入
力が終了したとして話速変換フラグFsをリセットす
る。なお、波形データのレベルDがPthを下回ったと
き即座にFsをリセットしないのは、音声信号中にも短
時間の無音部(無声区間)が存在するからであり、この
無声区間も音声信号として取り込む必要があるからであ
る。音声信号中に含まれる無音区間としては促音「っ」
や語間のインターバルなどがある。
【0024】図4は話速変換処理動作を示すフローチャ
ートである。まず、話速変換フラグFsがセットされて
いるか否かを判断する(n30)。セットされていない
場合にはまだ話速変換すべき音声信号が入力されていな
いとしてリターンする。Fsがセットされている場合に
は、リアルタイムバッファに記憶されているデータを読
み取る(n31)。このデータが母音部のデータである
か(n32)、子音部のデータであるか(n33)、無
音部のデータであるか(n34)、または、無音部デー
タの廃棄指示のデータであるか(n35)を判断する。
なお、この話速変換処理動作においてリアルタイムバッ
ファのデータの読み取りはn31のみで行われるのでは
なく、必要に応じて各処理動作で行われる。また、リア
ルタイムバッファからデータを読み取るとき、必要に応
じてA/Dコンバータ5からデータが入力されるまで待
機する。
【0025】あ行以外の音節は子音から開始するため、
子音部と判断された場合にはn33からn36に進み、
母音部数カウンタNvがNv>Nvmax、Nv=Nv
max、Nv<Nvmaxのいずれであるかを判断す
る。このNvは一連の音声信号に対して伸長処理を行っ
た母音数をカウントするカウンタであり、この母音数カ
ウンタNvは動作スタート時にリセットされている。上
記したように、本実施形態の話速変換装置では、入力さ
れる一連の音声信号に対してその先頭から3つの音節に
おける母音部のみを伸長し、それ以後の音声信号に対し
ては伸長処理を行わないようにしているので、Nvma
x=3に設定している。n36で母音部数カウンタNv
がNvmaxをこえていると判断した場合には、後述す
るように該子音部に先行および後続する母音部も伸長さ
れないので、この子音部に対しても何ら加工することな
く信号処理用RAM7に書き込む(n37)。n36
で、母音部数カウンタNv=Nvmaxであると判断し
た場合には、該子音部の直前に100ms以上の無音部
が存在しているかどうかを判断する(n38)。n38
で該子音部の直前に100ms以上の無音部が存在して
いたと判断した場合には、n37に進む。これは、上記
したように、先行する伸長された母音部からの影響を殆
ど受けない子音部を増幅し、該子音部と後続する伸長さ
れない母音部とのエネルギーバランスを崩して出力され
る音声信号の明瞭度を低下させないためである。n38
で100ms以上の無音部が存在していないと判断した
場合にはn39に進み該子音部を設定されている増幅率
Gで増幅して、信号処理用RAM7に書き込む。n36
でNv<Nvmaxであれば、該子音部に後続する母音
部が必ず伸長されるので、n39に進み該子音部を設定
されている増幅率Gで増幅して、信号処理用RAM7に
書き込む。なお、この話速変換処理において、信号処理
用RAM7への波形データの書き込みは書込ポインタが
示すアドレスに対して行われ、この書き込みののち書込
ポインタのアドレスは更新される。
【0026】一方、読み取られたデータが母音部のデー
タである場合には、n32からn40に進み、母音部数
カウンタNvに1を加算する。そして、この加算により
NvがNvmaxを超えたか否かを判断する(s4
1)。NvがNvmax以下のときには、この母音部を
設定されている伸長率Kで伸長する(n42、n4
3)。
【0027】図5のフローチャートを参照して伸長処理
を説明する。ここでは、伸長率Kが1.33に設定され
ている場合の例で説明する。母音部の複数波を1つのブ
ロックとして扱う。たとえば、母音部の3波を1ブロッ
クとして扱う。そして、このブロックにおける母音波形
の基本周波数を算出する(n60)。この基本周波数の
算出は自己相関を用いたものである。そしてブロック内
の隣接する2波形を選択して切り出し(n61)、これ
らの平均波形を算出する(n62)。そしてこの平均波
形を上記切り出した2波形間に挿入する(n63)。こ
れでこのブロックは4波になったことになる。この4波
のブロックを信号処理用RAM15に書き込む(n6
4)。このように、3波を4波に伸長しているため、伸
長率は133%となる。また、伸長率Kが1.25に設
定されている場合であれば、1ブロックを母音部の4波
とし、これを上記した処理で5波に加工すればよく、ま
た、伸長率Kが1.2に設定されている場合であれば、
1ブロックを母音部の5波とし、これを上記した処理で
6波に加工すればよい。
【0028】図4に戻って、検出された母音部(音節)
が4番目以後のものであった場合にはn41からn44
に進み、該母音部を何ら加工することなく信号処理用R
AM7に書き込む。また、n31で読み取られた波形デ
ータが無音部のものであれば、母音数(音節数)カウン
タNvの値を判断する(n34→n51)。NvがNv
maxを超えていなければ、母音部の伸長率に合わせて
該無音部も伸長して信号処理用RAM7に書き込む(n
52)。一方、音節数Nvが伸長限度数Nvmaxを超
えている場合には、該無音部に対して何ら加工すること
なく信号処理用RAM7に書き込む(n37)。
【0029】読み取られたデータが無音部の廃棄指示で
あれば信号処理用RAM15の末尾に記憶されている無
音データ群を廃棄・消去する(s55)。これは、これ
らの無音部データを音声信号の無声区間として記憶して
いたが、実際には音声信号が終了したあとの無音部分で
あり不要であることが判明したからである。
【0030】図6は読出処理動作を示すフローチャート
である。この動作はデータ取込処理と同様、補聴器の動
作スタートと同時に起動し常時実行されている。まず、
メモリ読出フラグFmがセットしているか否かを判断す
る(n70)。Fmがセットされていない場合にはn7
6に進んで、リアルタイムバッファに記憶されている最
新のデータを読み出してD/Aコンバータ11に出力す
る。Fmがセットされている場合には信号処理用RAM
7に読み出すべきデータがあるか否かを判断し(n7
1)、ある場合には読出ポインタが指示するアドレスの
波形データを読み出してD/Aコンバータ11に出力す
る(n72)。読出ポインタはこの読み出し動作に伴っ
て歩進される。そして、現在、話速変換フラグFsがリ
セットされていれば、母音数カウンタNvをリセットし
て、次の音声信号群(会話やアナウンス)の入力に備え
る(n73)。
【0031】一方、信号処理用RAM15に読み出すべ
きデータがない場合にはFmをリセットしたのち(n7
4)、リアルタイムバッファから最新のデータを読み出
してD/Aコンバータ11に出力する(n76)。以
後、変換処理動作がスタートしてFmがセットされるま
でリアルタイムバッファからD/Aコンバータ11にデ
ータが出力されることになる。
【0032】補聴器1では、話速変換装置から出力され
た信号をD/Aコンバータ11でアナログ信号に変換
し、フィルタ12およびアンプ13を介してレシーバ1
4から装用者の外耳道に放出する。このとき、アンプ1
3では入力されたアナログ信号を所定の増幅率で増幅し
て出力する。すなわち、母音部、子音部、および無音部
は同じ増幅率で増幅されて、出力される。
【0033】このように、母音部を伸長することによ
り、自然の発話からかけ離れたエネルギーバランスとな
った信号を、子音部を増幅することにより自然の発話に
近いエネルギーバランスの信号として出力することがで
きる。したがって、話速変換処理された音声信号の明瞭
度を向上させることができる。
【0034】
【発明の効果】以上のように、 請求項1に記載した発
明では、入力される音声信号から母音部を検出し、該母
音部を時間的に伸長するとともに、伸長した母音部に先
行または/および後続する子音部を増幅することで、話
速変換処理された音声信号における母音部のエネルギが
子音部のエネルギーに比べて極端に大きなものとならな
い。このため、母音部によって先行または/および後続
する子音部がマスキングされることを防止でき、話速変
換処理された音声信号の明瞭度の低下を改善することが
できる。
【0035】請求項2に記載した発明では、子音部を増
幅する増幅率が伸長率を用いて決定されるようにしたの
で、話速変換処理された音声信号における子音部と母音
部とのエネルギーバランスが処理前の(自然の発話によ
る)音声信号におけるエネルギーバランスに近似させる
ことができ、話速変換処理された音声信号の明瞭度をさ
らに向上させることができる。
【0036】さらに、請求項3に記載した発明では、伸
長された母音部に後続する子音部の直前に所定の時間以
上の無音部があって、先行する母音部からマスキングの
影響を受けない子音部に対する増幅を禁止するようにし
ているので、該子音部とこれに後続する母音部とのエネ
ルギーバランスを自然の発話におけるエネルギーバラン
スで維持することによって、処理された音声信号の明瞭
度が低下することを防止できる。
【図面の簡単な説明】
【図1】この発明の実施形態である話速変換装置を適用
した補聴器の構成を示す図である。
【図2】同実施形態の補聴器におけるパラメータ設定モ
ードのフローチャートである。
【図3】同実施形態の補聴器の実行モードの動作を示す
フローチャートである。
【図4】同実施形態の補聴器の実行モードの動作を示す
フローチャートである。
【図5】同実施形態の補聴器の実行モードの動作を示す
フローチャートである。
【図6】同実施形態の補聴器の実行モードの動作を示す
フローチャートである。
【図7】話速変換処理前の音声信号における母音部と子
音部のエネルギーバランスと話速変換処理後の音声信号
における母音部と子音部のエネルギーバランスとを示す
図である。
【符号の説明】
1−補聴器 2−マイクロホン 3−増幅器 4−フィルタ 5−A/D変換器 6−DSP 7−信号処理用RAM 8−パラメータRAM 9−ROM 10−設定器 11−D/A変換器 12−フィルタ 13−増幅器 14−装耳部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力される音声信号から母音部を検出す
    る母音検出手段と、 母音部を時間的に伸長する伸長手段と、を備えた話速変
    換装置であって、 前記伸長手段で伸長した母音部に先行または/および後
    続する子音部を増幅する子音増幅手段を備えたことを特
    徴とする話速変換装置。
  2. 【請求項2】 前記母音部を伸長する伸長率を用いて前
    記子音部を増幅する増幅率を決定する増幅率決定手段を
    備えたことを特徴とする請求項1記載の話速変換装置。
  3. 【請求項3】 入力された一連の音声信号の先頭から所
    定数の音節以降の母音部に対して前記伸長手段を禁止す
    る伸長禁止手段と、 前記伸長手段で伸長された母音部に後続する子音部の直
    前に所定の時間以上の無音部があり且つ、該子音部に後
    続する母音部が伸長されないときには、該子音部に対す
    る増幅を禁止する増幅禁止手段を備えたことを特徴とす
    る請求項1または2のいずれかに記載の話速変換装置。
JP30455096A 1996-11-15 1996-11-15 話速変換装置 Pending JPH10145897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30455096A JPH10145897A (ja) 1996-11-15 1996-11-15 話速変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30455096A JPH10145897A (ja) 1996-11-15 1996-11-15 話速変換装置

Publications (1)

Publication Number Publication Date
JPH10145897A true JPH10145897A (ja) 1998-05-29

Family

ID=17934350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30455096A Pending JPH10145897A (ja) 1996-11-15 1996-11-15 話速変換装置

Country Status (1)

Country Link
JP (1) JPH10145897A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9245537B2 (en) 2013-03-27 2016-01-26 Panasonic Intellectual Property Management Co., Ltd. Speech enhancement apparatus and method for emphasizing consonant portion to improve articulation of audio signal
JP2017119961A (ja) * 2015-12-28 2017-07-06 株式会社富士機材 継手部品及び継手構造の形成方法
CN116095054A (zh) * 2022-11-03 2023-05-09 国网北京市电力公司 语音播放方法、装置、计算机可读存储介质及计算机设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9245537B2 (en) 2013-03-27 2016-01-26 Panasonic Intellectual Property Management Co., Ltd. Speech enhancement apparatus and method for emphasizing consonant portion to improve articulation of audio signal
JP2017119961A (ja) * 2015-12-28 2017-07-06 株式会社富士機材 継手部品及び継手構造の形成方法
CN116095054A (zh) * 2022-11-03 2023-05-09 国网北京市电力公司 语音播放方法、装置、计算机可读存储介质及计算机设备

Similar Documents

Publication Publication Date Title
JP2955247B2 (ja) 話速変換方法およびその装置
US5608803A (en) Programmable digital hearing aid
Nejime et al. A portable digital speech-rate converter for hearing impairment
TWI504282B (zh) 增加聽障者聽到聲音正確性之方法及助聽器
JP4876245B2 (ja) 子音加工装置、音声情報伝達装置及び子音加工方法
JP3961616B2 (ja) 話速変換方法および話速変換機能付補聴器
KR100956167B1 (ko) 한국어 주파수 특성에 맞는 다채널 디지털 보청기의 채널설정방법 및 이를 이용한 다채널 디지털 보청기
JPH10145897A (ja) 話速変換装置
JP2001184100A (ja) 話速変換装置
JP2959468B2 (ja) 話速変換方法および話速変換機能付補聴器
JP4127155B2 (ja) 聴覚補助装置
JP3219892B2 (ja) リアルタイム話速変換装置
JP3187242B2 (ja) 話速変換装置
JPH0916193A (ja) 話速変換装置
JPH10290498A (ja) 話速変換機能を有する補聴器
JP2870421B2 (ja) 話速変換機能を有する補聴器
JP3632384B2 (ja) 聴覚補助装置
JP4979336B2 (ja) 音声出力装置
JP3102553B2 (ja) 音声信号処理装置
JP3257379B2 (ja) 話速変換機能付補聴器
JPH0698398A (ja) 音声の無音区間検出伸長装置及び音声の無音区間検出伸長方法
JP3937688B2 (ja) 話速変換方法および話速変換装置
JPS59123400A (ja) 時計付補聴器
JP4005166B2 (ja) 音声信号の処理回路
JP3187241B2 (ja) 話速変換装置