JPH08294199A - 話速変換装置 - Google Patents
話速変換装置Info
- Publication number
- JPH08294199A JPH08294199A JP9476495A JP9476495A JPH08294199A JP H08294199 A JPH08294199 A JP H08294199A JP 9476495 A JP9476495 A JP 9476495A JP 9476495 A JP9476495 A JP 9476495A JP H08294199 A JPH08294199 A JP H08294199A
- Authority
- JP
- Japan
- Prior art keywords
- value
- power
- threshold
- speed conversion
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Analogue/Digital Conversion (AREA)
Abstract
(57)【要約】 (修正有)
【構成】 入力音声をリングバッファに蓄積しながら、
フレーム毎のパワー判定処理を行ない、パワー判定処理
の結果に応じて波形伸長処理を行ない、処理結果を2つ
のフレームバッファに保持し、該2つのフレームバッフ
ァをパイプライン動作をさせて、リアルタイム話速変換
機能を実現している話速変換装置において、(a)該パワ
ー判定処理に必要なしきい値を自動的に変更するしきい
値処理手段と、(b)該しきい値処理に必要なパラメータ
を外部から調整可能とする手段と、(c)話速変換により
生じる遅れ時間量を監視詞、遅れ時間料によってしきい
値を変更する手段、を設け、(a)(b)(c)のいずれか1つ
もしくは複数個を組み合わせて使用する。 【効果】 入力音声レベルに応じた安定した話速変換動
作、および遅れ時間を解消が実現できる。また、装置の
使用環境に応じて、使用者が話速変換動作を制御できる
ようになる。
フレーム毎のパワー判定処理を行ない、パワー判定処理
の結果に応じて波形伸長処理を行ない、処理結果を2つ
のフレームバッファに保持し、該2つのフレームバッフ
ァをパイプライン動作をさせて、リアルタイム話速変換
機能を実現している話速変換装置において、(a)該パワ
ー判定処理に必要なしきい値を自動的に変更するしきい
値処理手段と、(b)該しきい値処理に必要なパラメータ
を外部から調整可能とする手段と、(c)話速変換により
生じる遅れ時間量を監視詞、遅れ時間料によってしきい
値を変更する手段、を設け、(a)(b)(c)のいずれか1つ
もしくは複数個を組み合わせて使用する。 【効果】 入力音声レベルに応じた安定した話速変換動
作、および遅れ時間を解消が実現できる。また、装置の
使用環境に応じて、使用者が話速変換動作を制御できる
ようになる。
Description
【0001】
【産業上の利用分野】本発明は、音声の速度を変換する
話速変換装置に関し、とくに音声信号処理方式のパラメ
ータ設定方法に係わる。
話速変換装置に関し、とくに音声信号処理方式のパラメ
ータ設定方法に係わる。
【0002】
【従来の技術】難聴者の聴覚を補助する手段として、従
来アナログ回路を用いて音声の振幅及びその周波数特性
を加工するアナログ型補聴器が主に使用されてきた。こ
れに対し近年、ディジタル信号処理を聴覚障害の補償に
応用するための研究開発が盛んに行われている。この研
究開発動向については、例えば日本音響学会誌(1991年
47巻10号、P760〜P765)「聴覚障害補償へのディジタル
技術の応用」や"Speech-perception aids for hearing-
impaired people : Current status and neededreserac
h", J.of Acoust. Soc. America, Vol.90, No.2, P
t.1, Aug. 1991.等に詳述されている。
来アナログ回路を用いて音声の振幅及びその周波数特性
を加工するアナログ型補聴器が主に使用されてきた。こ
れに対し近年、ディジタル信号処理を聴覚障害の補償に
応用するための研究開発が盛んに行われている。この研
究開発動向については、例えば日本音響学会誌(1991年
47巻10号、P760〜P765)「聴覚障害補償へのディジタル
技術の応用」や"Speech-perception aids for hearing-
impaired people : Current status and neededreserac
h", J.of Acoust. Soc. America, Vol.90, No.2, P
t.1, Aug. 1991.等に詳述されている。
【0003】一般に聴力の損失を補うためには、音圧レ
ベルの増幅とダイナミックレンジの圧縮を、使用者の聴
力特性に合わせて周波数ごとに行う。従来のアナログ補
聴器では、このような処理をアナログ回路で実現してい
る。また、近年開発されているディジタル補聴器では、
この処理をディジタルフィルタ等のソフトウエアで実現
することで、使用者の聴力特性への適合がより詳細に行
えるようにしている。このような動向の中、近年、ディ
ジタル信号処理により音声のピッチを変えずに速度だけ
を変えて、より高次な言語処理速度の衰えも含めた聴覚
系全般に渡った補聴を行なおうとする試みがなされてい
る。このような話速変換技術については、例えば日本音
響学会講演論文集(平成6年3月、2-4-7)「難聴者に
よる話速変換音声の評価」や日本音響学会誌(1994年50
巻7号、P509〜P520)「リアルタイム話速変換型受聴シ
ステム」などに詳述されている。
ベルの増幅とダイナミックレンジの圧縮を、使用者の聴
力特性に合わせて周波数ごとに行う。従来のアナログ補
聴器では、このような処理をアナログ回路で実現してい
る。また、近年開発されているディジタル補聴器では、
この処理をディジタルフィルタ等のソフトウエアで実現
することで、使用者の聴力特性への適合がより詳細に行
えるようにしている。このような動向の中、近年、ディ
ジタル信号処理により音声のピッチを変えずに速度だけ
を変えて、より高次な言語処理速度の衰えも含めた聴覚
系全般に渡った補聴を行なおうとする試みがなされてい
る。このような話速変換技術については、例えば日本音
響学会講演論文集(平成6年3月、2-4-7)「難聴者に
よる話速変換音声の評価」や日本音響学会誌(1994年50
巻7号、P509〜P520)「リアルタイム話速変換型受聴シ
ステム」などに詳述されている。
【0004】特に最近、この話速変換機能を携帯型の大
きさの装置に収めた、ポータブル話速変換装置が開発さ
れた。この装置については、"A portable digital spee
ch-rate converter and its evaluation by hearing-im
paired listeners", in Proc. of Int. Conf. on Spok
en Language Processing (ICSLP94), pp.2055-2058,
Yokohama, Sep. 1994.に詳述されている。
きさの装置に収めた、ポータブル話速変換装置が開発さ
れた。この装置については、"A portable digital spee
ch-rate converter and its evaluation by hearing-im
paired listeners", in Proc. of Int. Conf. on Spok
en Language Processing (ICSLP94), pp.2055-2058,
Yokohama, Sep. 1994.に詳述されている。
【0005】図6に、この従来の話速変換装置の信号処
理の流れを示す。図中の太い実線は音声信号の流れを、
点線は制御信号の流れを意味する。
理の流れを示す。図中の太い実線は音声信号の流れを、
点線は制御信号の流れを意味する。
【0006】上記従来の話速変換装置では、マイクロホ
ン11を通じて入力された音声を、アナログ増幅器1
2、ローパスフィルタ13に通した後、A/D変換器14
によりディジタル値に変換する。ディジタル化された音
声は、一定の時間長(以下フレームと呼ぶ)を有する2
つの入力フレームバッファ21および22に交互に入力
される。一方の入力フレームバッファに入力している間
に、もう一方の入力フレームバッファの音声データに対
して、音声の時間軸をそのピッチを変化させることなく
伸長する話速変換処理30を施す。そして、その処理結
果を比較的容量の大きい出力リングバッファ50に記録
する。出力リングバッファ50は、最後のアドレスの次
が先頭アドレスになるように、アドレスが環状に用いら
れるメモリである。出力リングバッファ50への話速変
換処理結果の書き込みとは独立して、出力リングバッフ
ァ50から1つずつ処理済みのデータを取りだし、D/A
変換器64、ローパスフィルタ63、アナログ増幅器6
2、およびスピーカーまたはイヤホン61を通じて音声
に変換して出力することを同時に行なうことで、話速変
換処理と変換結果の出力が同時に進行し、リアルタイム
の話速変換が実現される。したがって出力音声は、入力
音声に対して遅れ時間を伴って出力され、その遅れ時間
も時間と共に広がってゆく。即ち聞き手は、現実からは
どんどん遅れながら、しかしゆっくりと音声を聞くこと
ができる。
ン11を通じて入力された音声を、アナログ増幅器1
2、ローパスフィルタ13に通した後、A/D変換器14
によりディジタル値に変換する。ディジタル化された音
声は、一定の時間長(以下フレームと呼ぶ)を有する2
つの入力フレームバッファ21および22に交互に入力
される。一方の入力フレームバッファに入力している間
に、もう一方の入力フレームバッファの音声データに対
して、音声の時間軸をそのピッチを変化させることなく
伸長する話速変換処理30を施す。そして、その処理結
果を比較的容量の大きい出力リングバッファ50に記録
する。出力リングバッファ50は、最後のアドレスの次
が先頭アドレスになるように、アドレスが環状に用いら
れるメモリである。出力リングバッファ50への話速変
換処理結果の書き込みとは独立して、出力リングバッフ
ァ50から1つずつ処理済みのデータを取りだし、D/A
変換器64、ローパスフィルタ63、アナログ増幅器6
2、およびスピーカーまたはイヤホン61を通じて音声
に変換して出力することを同時に行なうことで、話速変
換処理と変換結果の出力が同時に進行し、リアルタイム
の話速変換が実現される。したがって出力音声は、入力
音声に対して遅れ時間を伴って出力され、その遅れ時間
も時間と共に広がってゆく。即ち聞き手は、現実からは
どんどん遅れながら、しかしゆっくりと音声を聞くこと
ができる。
【0007】この話速変換動作は、装置上に設けられた
スロースイッチ41を通じて使用者により制御され、ス
ロースイッチが押下されている間は話速変換が行なわ
れ、押下されていない間は、話速変換は施されず、入力
音声がそのまま出力されるようになっている。図6にお
いてスローボタン41で制御される、スイッチ手段40
によって、この動作が表現されている。
スロースイッチ41を通じて使用者により制御され、ス
ロースイッチが押下されている間は話速変換が行なわ
れ、押下されていない間は、話速変換は施されず、入力
音声がそのまま出力されるようになっている。図6にお
いてスローボタン41で制御される、スイッチ手段40
によって、この動作が表現されている。
【0008】一方、話速変換処理30は、パワー判定処
理31と波形伸長処理32とからなり、パワー判定処理
31によって選択されたパワーの大きいフレームの波形
のみに波形伸長処理32が施され、選択されなかった部
分は、そのまま出力バッファに転送されるように動作す
る。
理31と波形伸長処理32とからなり、パワー判定処理
31によって選択されたパワーの大きいフレームの波形
のみに波形伸長処理32が施され、選択されなかった部
分は、そのまま出力バッファに転送されるように動作す
る。
【0009】図5には、この話速変換処理の手順を示
す。パワー判定処理31では、しきい値Thと各フレー
ムの音声信号のパワーを比較する。これにより、比較的
パワーの小さい子音部分や背景雑音部分は波形伸長処理
32が施されず、パワーの大きい母音部分が主に波形伸
長される。パワー判定処理31によって、ピッチ周期が
明確に現われないパワーの小さい部分を波形伸長処理3
2の対象から外すことにより、歪の発生を防止してい
る。
す。パワー判定処理31では、しきい値Thと各フレー
ムの音声信号のパワーを比較する。これにより、比較的
パワーの小さい子音部分や背景雑音部分は波形伸長処理
32が施されず、パワーの大きい母音部分が主に波形伸
長される。パワー判定処理31によって、ピッチ周期が
明確に現われないパワーの小さい部分を波形伸長処理3
2の対象から外すことにより、歪の発生を防止してい
る。
【0010】波形伸長処理32では、まず音声信号のピ
ッチ周期(基本周期)を抽出する処理が行なわれ、抽出
したピッチ周期の2倍の長さを有する2種類の窓関数を
入力波形の異なる2箇所にかける。該窓関数の一方は0
から1に変化し、もう一方は1から0に変化する。窓関
数をかけた結果同士を加算することで2ピッチ長の合成
波形を得る。この合成波形を入力波形の中に挿入するこ
とにより、ピッチ周期を変えずに波形の時間軸方向の伸
長が実現できる。
ッチ周期(基本周期)を抽出する処理が行なわれ、抽出
したピッチ周期の2倍の長さを有する2種類の窓関数を
入力波形の異なる2箇所にかける。該窓関数の一方は0
から1に変化し、もう一方は1から0に変化する。窓関
数をかけた結果同士を加算することで2ピッチ長の合成
波形を得る。この合成波形を入力波形の中に挿入するこ
とにより、ピッチ周期を変えずに波形の時間軸方向の伸
長が実現できる。
【0011】さらにパワー判定処理32では、第2のし
きい値Toとフレーム毎のパワーの比較を行ない、To以下
のパワーを有する区間が時間しきい値を越えて連続する
場合には、この区間は無音区間であるとみなし、この時
間しきい値を越えた部分に対応する出力バッファ上のデ
ータを削除する処理を行なう。これにより出力バッファ
中の無音区間が削除され、話速変換によって生じた遅れ
時間が短縮される。実際には、パワー判定処理31にお
いて、しきい値Toを下回るパワーを持つフレームが一定
個数続いた後は、次にパワーがToより大きいフレームが
来るまで、出力バッファへの転送を中止することで、こ
の無音区間削除を実現している。
きい値Toとフレーム毎のパワーの比較を行ない、To以下
のパワーを有する区間が時間しきい値を越えて連続する
場合には、この区間は無音区間であるとみなし、この時
間しきい値を越えた部分に対応する出力バッファ上のデ
ータを削除する処理を行なう。これにより出力バッファ
中の無音区間が削除され、話速変換によって生じた遅れ
時間が短縮される。実際には、パワー判定処理31にお
いて、しきい値Toを下回るパワーを持つフレームが一定
個数続いた後は、次にパワーがToより大きいフレームが
来るまで、出力バッファへの転送を中止することで、こ
の無音区間削除を実現している。
【0012】
【発明が解決しようとする課題】上記従来の技術におい
ては、パワー判定処理におけるしきい値ThおよびToの設
定が適切でないと、話速変換処理が正しく行なわれな
い。ところが、本装置の入力音声は、マイクロホンを通
じて入力されるので、装置が使用される環境によって、
入力音声のレベルや無音区間におけるその背景雑音の大
きさが大幅に変化する。このため一定のしきい値で常に
安定した動作を得ることは困難である。従って、上記し
きい値ThおよびToは、入力音声に応じて適宜調整される
ことが望ましい。
ては、パワー判定処理におけるしきい値ThおよびToの設
定が適切でないと、話速変換処理が正しく行なわれな
い。ところが、本装置の入力音声は、マイクロホンを通
じて入力されるので、装置が使用される環境によって、
入力音声のレベルや無音区間におけるその背景雑音の大
きさが大幅に変化する。このため一定のしきい値で常に
安定した動作を得ることは困難である。従って、上記し
きい値ThおよびToは、入力音声に応じて適宜調整される
ことが望ましい。
【0013】ところが、上記従来技術について述べてい
る文献においては、「過去の入力情報を参考にして、上
記しきい値を決定する」という考え方のみが示されてい
ただけで、その具体的な実現方法については考慮されて
いなかった。
る文献においては、「過去の入力情報を参考にして、上
記しきい値を決定する」という考え方のみが示されてい
ただけで、その具体的な実現方法については考慮されて
いなかった。
【0014】本発明の第1の目的は、上記話速変換装置
において、入力音声中の波形伸長を施す部分を決定する
のに必要なしきい値Th、および無音区間削除を施す部分
を決定するのに必要なしきい値Toを、入力音声に応じて
適宜設定するための、具体的な方法を提供することにあ
る。
において、入力音声中の波形伸長を施す部分を決定する
のに必要なしきい値Th、および無音区間削除を施す部分
を決定するのに必要なしきい値Toを、入力音声に応じて
適宜設定するための、具体的な方法を提供することにあ
る。
【0015】一方、上記話速変換処理装置においては、
しきい値Toとの比較により無音区間を検出し、その削除
を行なうことで、話速変換に伴う遅れ時間の解消を図っ
ている。しかし、遅れ時間の蓄積がリングバッファの容
量を越える場合には、それ以上の話速変換動作が連続し
て行なえないという問題があった。
しきい値Toとの比較により無音区間を検出し、その削除
を行なうことで、話速変換に伴う遅れ時間の解消を図っ
ている。しかし、遅れ時間の蓄積がリングバッファの容
量を越える場合には、それ以上の話速変換動作が連続し
て行なえないという問題があった。
【0016】ところが、上記従来の技術においては、こ
のようなリングバッファに遅れ時間が蓄積した場合に、
それを効率よく解消するための方法に関する配慮がなさ
れていなかった。
のようなリングバッファに遅れ時間が蓄積した場合に、
それを効率よく解消するための方法に関する配慮がなさ
れていなかった。
【0017】本発明の第2の目的は、上記話速変換装置
において、蓄積した遅れ時間量に応じて、適宜その遅れ
時間を解消するための、具体的な方法を提供することに
ある。
において、蓄積した遅れ時間量に応じて、適宜その遅れ
時間を解消するための、具体的な方法を提供することに
ある。
【0018】
【課題を解決するための手段】上記本発明の第1の目的
を達成するための手段は、従来の装置構成に対して、算
出されるフレーム毎のパワー値に応じてしきい値の調整
を行なう、しきい値処理と、該しきい値処理に必要なパ
ラメータを、外部から使用者が調整することを可能にす
るパラメータ調整系を設けることである。
を達成するための手段は、従来の装置構成に対して、算
出されるフレーム毎のパワー値に応じてしきい値の調整
を行なう、しきい値処理と、該しきい値処理に必要なパ
ラメータを、外部から使用者が調整することを可能にす
るパラメータ調整系を設けることである。
【0019】なお、上記しきい値処理には、パワー値の
比較を行なうパワー値比較手段と、パワーの最大および
最小値を記憶する記憶手段と、該記憶された最大および
最小パワー値より新たなしきい値を算出するしきい値変
更手段と、一定の時間間隔を計測するタイマー手段と、
該記憶された最大および最小パワー値をリセットするリ
セット手段とが具備されている。
比較を行なうパワー値比較手段と、パワーの最大および
最小値を記憶する記憶手段と、該記憶された最大および
最小パワー値より新たなしきい値を算出するしきい値変
更手段と、一定の時間間隔を計測するタイマー手段と、
該記憶された最大および最小パワー値をリセットするリ
セット手段とが具備されている。
【0020】上記本発明の第2の目的を達成するための
手段は、上記第1の目的を達成するための手段に加え
て、リングバッファ上の遅れ時間を監視する遅れ時間監
視手段を設け、該遅れ時間監視手段の出力に応じて、上
記しきい値処理の出力が変化するように、上記パラメー
タ調整系を動作させる方法である。
手段は、上記第1の目的を達成するための手段に加え
て、リングバッファ上の遅れ時間を監視する遅れ時間監
視手段を設け、該遅れ時間監視手段の出力に応じて、上
記しきい値処理の出力が変化するように、上記パラメー
タ調整系を動作させる方法である。
【0021】
【作用】上記第1の目的を達成するための手段におい
て、しきい値処理は、従来の装置構成内で算出されるフ
レーム毎のパワー値に応じて、しきい値が変更されるよ
うに作用する。これにより、入力音声のレベルの変動に
応じた、しきい値の設定が実現される。また、パラメー
タ調整系は、使用者からの制御を受取り、それに応じて
しきい値処理の出力が変化するように作用する。これに
より、しきい値の設定において、使用者がしきい値を変
更することが可能となり、装置の使用状態に応じた、し
きい値設定が可能となる。
て、しきい値処理は、従来の装置構成内で算出されるフ
レーム毎のパワー値に応じて、しきい値が変更されるよ
うに作用する。これにより、入力音声のレベルの変動に
応じた、しきい値の設定が実現される。また、パラメー
タ調整系は、使用者からの制御を受取り、それに応じて
しきい値処理の出力が変化するように作用する。これに
より、しきい値の設定において、使用者がしきい値を変
更することが可能となり、装置の使用状態に応じた、し
きい値設定が可能となる。
【0022】より具体的には、入力音声信号のフレーム
毎のパワーが計算されると、上記しきい値処理内の上記
パワー値比較手段によって、該パワーと上記記憶手段に
記憶されている最大および最小パワー値との比較が行な
われ、該パワーが記憶されている最大パワー値より大き
い場合、あるいは記憶されている最小パワー値より小さ
い場合には、記憶されている最大および最小パワー値の
更新が行なわれる。この記憶されている最大および最小
パワー値は、一定の時間間隔で上記しきい値変更手段に
送られる。なおこの該一定時間間隔毎の変更のタイミン
グは上記タイマー手段により与えられる。上記しきい値
変更手段では、与えられた最大および最小パワー値よ
り、新たなしきい値を算出し、従来の装置構成内のパワ
ー判定処理にその結果を与える。上記しきい値変更手段
に最大および最小パワー値が送られた直後には、上記リ
セット手段により、該記憶されている最大および最小値
はリセットされる。これにより、一定時間間隔毎のフレ
ームパワーの最大および最小値に基づいて、話速変換処
理に必要なしきい値の設定が行なえるようになるため、
入力音声のレベルの変動に応じた、しきい値の設定が実
現される。
毎のパワーが計算されると、上記しきい値処理内の上記
パワー値比較手段によって、該パワーと上記記憶手段に
記憶されている最大および最小パワー値との比較が行な
われ、該パワーが記憶されている最大パワー値より大き
い場合、あるいは記憶されている最小パワー値より小さ
い場合には、記憶されている最大および最小パワー値の
更新が行なわれる。この記憶されている最大および最小
パワー値は、一定の時間間隔で上記しきい値変更手段に
送られる。なおこの該一定時間間隔毎の変更のタイミン
グは上記タイマー手段により与えられる。上記しきい値
変更手段では、与えられた最大および最小パワー値よ
り、新たなしきい値を算出し、従来の装置構成内のパワ
ー判定処理にその結果を与える。上記しきい値変更手段
に最大および最小パワー値が送られた直後には、上記リ
セット手段により、該記憶されている最大および最小値
はリセットされる。これにより、一定時間間隔毎のフレ
ームパワーの最大および最小値に基づいて、話速変換処
理に必要なしきい値の設定が行なえるようになるため、
入力音声のレベルの変動に応じた、しきい値の設定が実
現される。
【0023】一方、上記第2の目的を達成するための手
段においては、上記遅れ時間監視手段によって、話速変
換による実時間からの遅れ量が監視され、該遅れ量が大
きくなった場合には、上記パラメータ調整系によって、
上記しきい値処理に与えられるパラメータが変化する。
この際のパラメータの変更は、遅れ時間が大きくなるに
つれて、設定されるしきい値が大きくなるように作用に
する。この結果、より多くの部分が無音区間として判断
されるようになり、より長い範囲が無音区間として削除
されるようになる。この作用により、実時間からの遅れ
量が大きくなった場合には、より長い部分が無音区間と
して削除されるようになるので、遅れ時間の量に対応し
て、適宜その遅れ時間が解消できるようになる。
段においては、上記遅れ時間監視手段によって、話速変
換による実時間からの遅れ量が監視され、該遅れ量が大
きくなった場合には、上記パラメータ調整系によって、
上記しきい値処理に与えられるパラメータが変化する。
この際のパラメータの変更は、遅れ時間が大きくなるに
つれて、設定されるしきい値が大きくなるように作用に
する。この結果、より多くの部分が無音区間として判断
されるようになり、より長い範囲が無音区間として削除
されるようになる。この作用により、実時間からの遅れ
量が大きくなった場合には、より長い部分が無音区間と
して削除されるようになるので、遅れ時間の量に対応し
て、適宜その遅れ時間が解消できるようになる。
【0024】
【実施例】以下、本発明を実施例を用いて詳細に説明す
る。
る。
【0025】図1に本発明の話速変換装置の第1の実施
例を示す。図中の話速変換処理30では、図5に示した
従来の方式と同様、フレーム単位で処理が実行される。
1フレーム毎にパワーが計算されると、パワー判定処理
31により該パワー値としきい値Thおよび無音しきい値
Toとの比較が行なわれる。
例を示す。図中の話速変換処理30では、図5に示した
従来の方式と同様、フレーム単位で処理が実行される。
1フレーム毎にパワーが計算されると、パワー判定処理
31により該パワー値としきい値Thおよび無音しきい値
Toとの比較が行なわれる。
【0026】パワー判定処理31では、Thよりパワーの
大きいフレームのデータは次の波形伸長処理32に転送
される。Thよりパワー値が低く、かつToよりパワー値が
大きいフレームのデータは、そのまま出力バッファ50
に転送される。Toよりパワー値が低いフレームのデータ
は、ほとんどの場合出力バッファ50にそのまま転送さ
れるが、Toよりパワー値の低いフレームが一定数以上連
続した場合には、それ以後に連続するToよりパワーの低
いフレームのデータは、どこにも転送されず出力されな
い。この動作により一定時間を越えて持続する無音区間
が削除されることになる。そして、この無音区間削除処
理は、フレームのパワー値が次にToより大きくなったと
き、あるいは話速変換によって蓄積した実時間からの遅
れ量を、削除される無音区間の量が越えた時に中止され
る。
大きいフレームのデータは次の波形伸長処理32に転送
される。Thよりパワー値が低く、かつToよりパワー値が
大きいフレームのデータは、そのまま出力バッファ50
に転送される。Toよりパワー値が低いフレームのデータ
は、ほとんどの場合出力バッファ50にそのまま転送さ
れるが、Toよりパワー値の低いフレームが一定数以上連
続した場合には、それ以後に連続するToよりパワーの低
いフレームのデータは、どこにも転送されず出力されな
い。この動作により一定時間を越えて持続する無音区間
が削除されることになる。そして、この無音区間削除処
理は、フレームのパワー値が次にToより大きくなったと
き、あるいは話速変換によって蓄積した実時間からの遅
れ量を、削除される無音区間の量が越えた時に中止され
る。
【0027】なお、上記の無音区間削除処理の終了時に
おいては、データの連続性を確保するため、無音区間削
除を開始したフレームの1つ前のフレームFeと、無音区
間削除を中止した時点のフレームFsを滑らかに接続す
る。このためには、たとえば、1フレーム分の長さを持
ち1から0、および0から1に変化する2つの窓関数デ
ータWeとWsを用意し、これらを各々FeとFsにかけて加算
を行なった合成フレームを作り、この合成フレームをFe
の変わりに出力バッファ上に保存する、といった操作を
行なう。
おいては、データの連続性を確保するため、無音区間削
除を開始したフレームの1つ前のフレームFeと、無音区
間削除を中止した時点のフレームFsを滑らかに接続す
る。このためには、たとえば、1フレーム分の長さを持
ち1から0、および0から1に変化する2つの窓関数デ
ータWeとWsを用意し、これらを各々FeとFsにかけて加算
を行なった合成フレームを作り、この合成フレームをFe
の変わりに出力バッファ上に保存する、といった操作を
行なう。
【0028】本実施例では、図6に示した従来の装置の
構成に加え、しきい値処理70を有している。話速変換
処理内のパワー判定処理によりフレーム毎のパワー値P
が計算されると、上記のフレームデータの転送とは独立
に、そのパワー値Pはパワー値比較手段71に渡され、
記憶手段72に記憶されている最大パワー値Pmaxおよび
最小パワー値Pminとの比較が行なわれる。今回のパワー
値がPmaxより大きい場合には、今回のパワー値がPmaxと
して記憶される。逆にPminより低い場合には、今回のパ
ワー値がPminとして記憶される。この最大および最小パ
ワー値の比較更新は、フレーム毎に行なわれる。
構成に加え、しきい値処理70を有している。話速変換
処理内のパワー判定処理によりフレーム毎のパワー値P
が計算されると、上記のフレームデータの転送とは独立
に、そのパワー値Pはパワー値比較手段71に渡され、
記憶手段72に記憶されている最大パワー値Pmaxおよび
最小パワー値Pminとの比較が行なわれる。今回のパワー
値がPmaxより大きい場合には、今回のパワー値がPmaxと
して記憶される。逆にPminより低い場合には、今回のパ
ワー値がPminとして記憶される。この最大および最小パ
ワー値の比較更新は、フレーム毎に行なわれる。
【0029】上記記憶手段72に記憶されている最大お
よび最小パワー値は、リセット手段73により一定時間
間隔でリセットされる。この場合リセットとは、最大パ
ワー値を装置内部で表現可能な最小の値に、また最小パ
ワー値を装置内部で表現可能な最大の値に変更すること
である。
よび最小パワー値は、リセット手段73により一定時間
間隔でリセットされる。この場合リセットとは、最大パ
ワー値を装置内部で表現可能な最小の値に、また最小パ
ワー値を装置内部で表現可能な最大の値に変更すること
である。
【0030】上記リセット動作の行なわれる一定時間間
隔は、タイマー手段74により管理される。タイマー手
段74は、たとえば処理されたフレームの数をカウント
するなどの手段により一定時間間隔毎に出力を出す。こ
の出力に応じて上記リセット手段73は上記リセット動
作を行なう。この結果、記憶手段72に記憶される最大
および最小パワー値は、この一定時間間隔内での最大お
よび最小パワー値になる。
隔は、タイマー手段74により管理される。タイマー手
段74は、たとえば処理されたフレームの数をカウント
するなどの手段により一定時間間隔毎に出力を出す。こ
の出力に応じて上記リセット手段73は上記リセット動
作を行なう。この結果、記憶手段72に記憶される最大
および最小パワー値は、この一定時間間隔内での最大お
よび最小パワー値になる。
【0031】一方、話速変換処理30内のパワー判定処
理31に使用されるしきい値ThとToは、しきい値変更手
段75によって変更される。この変更も上記タイマー手
段74で管理される一定時間毎に行なわれる。しきい値
変更手段75内では、上記記憶手段72内に保持されて
いる一定時間間隔毎の最大および最小パワー値に基づい
て、しきい値ThおよびToが算出される。たとえば、上記
一定時間間隔毎の最大パワー値をPmax、最小パワー値を
Pminとすると、 Th = Pmin + a | Pmax - Pmin | ( a = 0 〜 1.0 ) (式1 ) To = Pmin + b | Pmax - Pmin | ( b = 0 〜 1.0 ) (式2 ) で表される式により、ThとToが決定される。
理31に使用されるしきい値ThとToは、しきい値変更手
段75によって変更される。この変更も上記タイマー手
段74で管理される一定時間毎に行なわれる。しきい値
変更手段75内では、上記記憶手段72内に保持されて
いる一定時間間隔毎の最大および最小パワー値に基づい
て、しきい値ThおよびToが算出される。たとえば、上記
一定時間間隔毎の最大パワー値をPmax、最小パワー値を
Pminとすると、 Th = Pmin + a | Pmax - Pmin | ( a = 0 〜 1.0 ) (式1 ) To = Pmin + b | Pmax - Pmin | ( b = 0 〜 1.0 ) (式2 ) で表される式により、ThとToが決定される。
【0032】ここで計算に必要なパラメータa、およびb
は、あらかじめ決められた値、たとえば、a = 0.2、 b
= 0.1、を用いる。
は、あらかじめ決められた値、たとえば、a = 0.2、 b
= 0.1、を用いる。
【0033】なお、パラメータbの値をパラメータaの値
より大きくすると、無音しきい値が波形伸長しきい値を
上回り、波形伸長を行なうほど大きなパワーのフレーム
にも係わらず、無音区間と判断されて削除されるという
矛盾が生じるため、aは必ずb以上の値を持つように選
ぶ。
より大きくすると、無音しきい値が波形伸長しきい値を
上回り、波形伸長を行なうほど大きなパワーのフレーム
にも係わらず、無音区間と判断されて削除されるという
矛盾が生じるため、aは必ずb以上の値を持つように選
ぶ。
【0034】図2に本発明の第2の実施例を示す。上記
第1の実施例と異なる点は、しきい値変更手段が必要と
するパラメータaおよびbが、パラメータ調整系80内の
パラメータ変更手段81によって、装置外部より変更で
きる点である。上記第1の実施例では、このパラメータ
をしきい値変更手段75内に保持されている一定の値と
していたが、本実施例では、使用者が装置の使用環境を
考慮して、パラメータを変更することができる。たとえ
ば、背景雑音が大きいため、目的とする音声が含まれて
いないフレームにおいても、背景雑音のためにそのパワ
ー値が大きくなり、ほとんどのフレームが無音区間と判
断されず、無音区間削除が適切に行なわれないような場
合には、パラメータaおよびbを大きくして、しきい値Th
およびToを大きくすれば、波形伸長が行なわれるフレー
ムが減り、かつ、雑音が多少含まれていても、背景雑音
しか含まれていないフレームを無音区間として取り扱う
ようになるため、無音区間削除が適切に動作するように
なる。
第1の実施例と異なる点は、しきい値変更手段が必要と
するパラメータaおよびbが、パラメータ調整系80内の
パラメータ変更手段81によって、装置外部より変更で
きる点である。上記第1の実施例では、このパラメータ
をしきい値変更手段75内に保持されている一定の値と
していたが、本実施例では、使用者が装置の使用環境を
考慮して、パラメータを変更することができる。たとえ
ば、背景雑音が大きいため、目的とする音声が含まれて
いないフレームにおいても、背景雑音のためにそのパワ
ー値が大きくなり、ほとんどのフレームが無音区間と判
断されず、無音区間削除が適切に行なわれないような場
合には、パラメータaおよびbを大きくして、しきい値Th
およびToを大きくすれば、波形伸長が行なわれるフレー
ムが減り、かつ、雑音が多少含まれていても、背景雑音
しか含まれていないフレームを無音区間として取り扱う
ようになるため、無音区間削除が適切に動作するように
なる。
【0035】本実施例のパラメータ変更手段81は、装
置外部から調整可能なボリューム82で与えられる電圧
値をA/D変換器83でディジタル化した値をパラメータ
変更手段81に取り込み、この値を元に数値演算によっ
てパラメータaおよびbを算出することにより実現してい
る。
置外部から調整可能なボリューム82で与えられる電圧
値をA/D変換器83でディジタル化した値をパラメータ
変更手段81に取り込み、この値を元に数値演算によっ
てパラメータaおよびbを算出することにより実現してい
る。
【0036】なお、パラメータbの値をパラメータaの値
より大きくすると、無音しきい値が波形伸長しきい値を
上回り、波形伸長を行なうほど大きなパワーのフレーム
にも係わらず、無音区間と判断されて削除されるという
矛盾が生じるため、上記ボリューム設定によりaがbより
小さくなる場合には、必ずbをaに等しくするような訂正
を、上記しきい値変更手段81が行なう。
より大きくすると、無音しきい値が波形伸長しきい値を
上回り、波形伸長を行なうほど大きなパワーのフレーム
にも係わらず、無音区間と判断されて削除されるという
矛盾が生じるため、上記ボリューム設定によりaがbより
小さくなる場合には、必ずbをaに等しくするような訂正
を、上記しきい値変更手段81が行なう。
【0037】また、ボリュームで設定できるこれらのパ
ラメータの設定範囲は、式1および式2で示されたとお
り、原理的には0〜1.0であるが、実際には、aを0.4
より大きくするとThが高くなり、部分的に波形伸長は行
なわれていても、聴感上ほとんどゆっくりになったとは
感じなくなってしまう。そこでこのパラメータ設定範囲
を0〜0.4とし、これとボリュームの全可動範囲を対
応付けるようにすると、実際には使われることがないよ
うな0.4以上の高い値に、パラメータが誤って設定され
ることがなくなるという利点がある。
ラメータの設定範囲は、式1および式2で示されたとお
り、原理的には0〜1.0であるが、実際には、aを0.4
より大きくするとThが高くなり、部分的に波形伸長は行
なわれていても、聴感上ほとんどゆっくりになったとは
感じなくなってしまう。そこでこのパラメータ設定範囲
を0〜0.4とし、これとボリュームの全可動範囲を対
応付けるようにすると、実際には使われることがないよ
うな0.4以上の高い値に、パラメータが誤って設定され
ることがなくなるという利点がある。
【0038】図3に本発明の第3の実施例を示す。本実
施例と上記第2の実施例との異なる点は、信号処理全体
の流れにおける、リングバッファとフレームバッファの
位置を交換した点である。即ち、入力音声信号はディジ
タル化された後に、すぐに入力リングバッファ20に入
力される。入力リングバッファ20は比較的大容量のメ
モリで構成され、そのアドレスが環状に用いられる。こ
のため入力の音声信号は、現時点からリングバッファ1
周分に対応する時間長の過去の音声が、常にこのリング
バッファ内に残る。
施例と上記第2の実施例との異なる点は、信号処理全体
の流れにおける、リングバッファとフレームバッファの
位置を交換した点である。即ち、入力音声信号はディジ
タル化された後に、すぐに入力リングバッファ20に入
力される。入力リングバッファ20は比較的大容量のメ
モリで構成され、そのアドレスが環状に用いられる。こ
のため入力の音声信号は、現時点からリングバッファ1
周分に対応する時間長の過去の音声が、常にこのリング
バッファ内に残る。
【0039】話速変換処理30では、従来の方式および
上記実施例と同様、フレーム単位で処理が実行される。
1フレーム分のデータをリングバッファから読みだし話
速変換した結果は、2つの出力バッファ51、52のい
ずれか一方に入力される。従って、出力バッファのサイ
ズは、話速変換の伸長率を考慮して、1フレームよりも
長いサイズになっている。もう一方の出力バッファに
は、前回の話速変換結果が保持されている。前回の話速
変換結果データがサンプリング間隔でD/A変換器64に
送られ、ローパスフィルタ63、アナログ増幅器62、
およびスピーカー又はイヤホン61を通じて出力される
間に、今回のフレームの話速変換処理が終了するよう、
1フレームの長さや話速変換処理に必要な時間が調整さ
れている。これにより従来の話速変換装置および上記実
施例と同様の、リアルタイム話速変換が実現できる。
上記実施例と同様、フレーム単位で処理が実行される。
1フレーム分のデータをリングバッファから読みだし話
速変換した結果は、2つの出力バッファ51、52のい
ずれか一方に入力される。従って、出力バッファのサイ
ズは、話速変換の伸長率を考慮して、1フレームよりも
長いサイズになっている。もう一方の出力バッファに
は、前回の話速変換結果が保持されている。前回の話速
変換結果データがサンプリング間隔でD/A変換器64に
送られ、ローパスフィルタ63、アナログ増幅器62、
およびスピーカー又はイヤホン61を通じて出力される
間に、今回のフレームの話速変換処理が終了するよう、
1フレームの長さや話速変換処理に必要な時間が調整さ
れている。これにより従来の話速変換装置および上記実
施例と同様の、リアルタイム話速変換が実現できる。
【0040】なお、本実施例においてパワー判定処理3
1が行なう無音区間削除は、リングバッファからの読み
出し位置を飛ばすことで実現している。即ち、リングバ
ッファからフレーム単位でデータを読みだす時に、フレ
ームのパワーを調べ、連続してそのパワーがToを下回っ
た場合にはそこは無音区間であると判断する。そして、
一定数以上のフレームにおいて、連続してパワーがToを
下回った場合には、その後再びパワーがToを上回るま
で、あるいは話速変換によって蓄積した実時間からの遅
れ量を、削除される無音区間の量が越えるときまで、リ
ングバッファから出力バッファへの転送を行なわず、読
み出しアドレスをフレーム単位で飛ばす。但し、無音区
間削除処理の中止時には、上記第1の実施例で記載した
ような、フレームのデータが滑らかにつながるような、
窓関数を用いた処理を行なう。
1が行なう無音区間削除は、リングバッファからの読み
出し位置を飛ばすことで実現している。即ち、リングバ
ッファからフレーム単位でデータを読みだす時に、フレ
ームのパワーを調べ、連続してそのパワーがToを下回っ
た場合にはそこは無音区間であると判断する。そして、
一定数以上のフレームにおいて、連続してパワーがToを
下回った場合には、その後再びパワーがToを上回るま
で、あるいは話速変換によって蓄積した実時間からの遅
れ量を、削除される無音区間の量が越えるときまで、リ
ングバッファから出力バッファへの転送を行なわず、読
み出しアドレスをフレーム単位で飛ばす。但し、無音区
間削除処理の中止時には、上記第1の実施例で記載した
ような、フレームのデータが滑らかにつながるような、
窓関数を用いた処理を行なう。
【0041】本実施例においても、上記実施例と同様、
フレーム毎のパワーの最大および最小値の一定時間間隔
毎の更新が行なわれている。そしてこの最大および最小
パワー値を元に、しきい値ThとToが算出され、話速変換
処理30内のパワー判定処理31に与えられている。し
きい値ThおよびToの算出に必要なパラメータaおよびb
が、外部からの設定により変更できる点は、上記第2の
実施例と同様である。
フレーム毎のパワーの最大および最小値の一定時間間隔
毎の更新が行なわれている。そしてこの最大および最小
パワー値を元に、しきい値ThとToが算出され、話速変換
処理30内のパワー判定処理31に与えられている。し
きい値ThおよびToの算出に必要なパラメータaおよびb
が、外部からの設定により変更できる点は、上記第2の
実施例と同様である。
【0042】図4に本発明の第4の実施例を示す。本実
施例では、上記第3の実施例の構成に加え、さらに遅れ
時間監視手段90が用意されている。該遅れ時間監視手
段90は、入力リングバッファ20における入力ポイン
タPiと出力ポインタPoの位置関係を常に監視している。
ここで入力ポインタPiとは、A/D変換器14より音声デ
ータがサンプリング間隔で入力される際、そのデータを
保持するリングバッファ上の位置を示すアドレスを指す
ポインタ変数である。また出力ポインタPoとは、その時
点で話速変換処理に転送されたフレームの位置を指すポ
インタ変数である。即ち、リングバッファ上で考えれ
ば、PiをPoがいつも追いかけているように動作する。
施例では、上記第3の実施例の構成に加え、さらに遅れ
時間監視手段90が用意されている。該遅れ時間監視手
段90は、入力リングバッファ20における入力ポイン
タPiと出力ポインタPoの位置関係を常に監視している。
ここで入力ポインタPiとは、A/D変換器14より音声デ
ータがサンプリング間隔で入力される際、そのデータを
保持するリングバッファ上の位置を示すアドレスを指す
ポインタ変数である。また出力ポインタPoとは、その時
点で話速変換処理に転送されたフレームの位置を指すポ
インタ変数である。即ち、リングバッファ上で考えれ
ば、PiをPoがいつも追いかけているように動作する。
【0043】話速変換処理30を動作させた際には、フ
レーム単位でリングバッファから音声データが話速変換
処理に転送され、パワー判定処理31および波形伸長処
理32が行なわれ、その結果が出力バッファ51または
52に書き込まれる。したがってPoはフレーム単位でリ
ングバッファ上を進んで行くのに対し、Piはサンプリン
グ毎に、1つずつリングバッファ上を進んで行く。話速
変換処理30に転送されたフレームのパワーが大きく、
波形伸長処理32が行なわれた場合には、出力バッファ
51または52に書き込まれる話速変換後のデータは1
フレームよりも長くなる。このため、次のパイプライン
サイクルで、この出力バッファのデータをサンプリング
間隔で1つずつD/A変換器を通じて出力する間に、Piは
1フレームよりも長い距離を移動することになる。この
作業を連続して行なうと、徐々にPoとPiの差が広がって
ゆき、遅れ時間量が増えてゆく。つまり、PoとPiの差が
その時点での遅れ時間量を表す。上記遅れ時間監視手段
は、このPoとPiの差ΔPを監視し、このΔPの大きさに応
じた値を出力する。例えば、ΔPの値とあらかじめ決め
られた遅れ時間しきい値Tpを比較し、ΔPがTpよりも大
きい場合には1を、それ以外の時は0を出力する。
レーム単位でリングバッファから音声データが話速変換
処理に転送され、パワー判定処理31および波形伸長処
理32が行なわれ、その結果が出力バッファ51または
52に書き込まれる。したがってPoはフレーム単位でリ
ングバッファ上を進んで行くのに対し、Piはサンプリン
グ毎に、1つずつリングバッファ上を進んで行く。話速
変換処理30に転送されたフレームのパワーが大きく、
波形伸長処理32が行なわれた場合には、出力バッファ
51または52に書き込まれる話速変換後のデータは1
フレームよりも長くなる。このため、次のパイプライン
サイクルで、この出力バッファのデータをサンプリング
間隔で1つずつD/A変換器を通じて出力する間に、Piは
1フレームよりも長い距離を移動することになる。この
作業を連続して行なうと、徐々にPoとPiの差が広がって
ゆき、遅れ時間量が増えてゆく。つまり、PoとPiの差が
その時点での遅れ時間量を表す。上記遅れ時間監視手段
は、このPoとPiの差ΔPを監視し、このΔPの大きさに応
じた値を出力する。例えば、ΔPの値とあらかじめ決め
られた遅れ時間しきい値Tpを比較し、ΔPがTpよりも大
きい場合には1を、それ以外の時は0を出力する。
【0044】一方、この遅れ時間監視手段90の出力
は、パラメータ変更手段81に与えられる。本実施例に
おけるパラメータ変更手段81は、しきい値変更手段に
与えられるパラメータa、bの値を、上記第2及び第3の
実施例と同様、外部から制御可能なボリュームの値に応
じて変更させるだけでなく、上記遅れ時間監視手段90
の出力に応じても変更させる機能を有する。例えば、遅
れ時間監視手段90の出力が1の場合には、ΔPが大き
い時なので、パラメータa、bの値を大きくする。この結
果、上記第1の実施例で述べた(式1)より、パワー判
定処理31のためのしきい値ThとToが強制的に大きくな
り、波形伸長するフレームと判定されるフレームが少な
くなり、無音区間と判定され削除される区間が長くな
る。この結果、遅れ時間の蓄積の早さがそれまでより遅
くなると共に、無音区間削除処理により縮められる量も
増えるので、それまでよりは早く遅れ時間が解消できる
ようになる。
は、パラメータ変更手段81に与えられる。本実施例に
おけるパラメータ変更手段81は、しきい値変更手段に
与えられるパラメータa、bの値を、上記第2及び第3の
実施例と同様、外部から制御可能なボリュームの値に応
じて変更させるだけでなく、上記遅れ時間監視手段90
の出力に応じても変更させる機能を有する。例えば、遅
れ時間監視手段90の出力が1の場合には、ΔPが大き
い時なので、パラメータa、bの値を大きくする。この結
果、上記第1の実施例で述べた(式1)より、パワー判
定処理31のためのしきい値ThとToが強制的に大きくな
り、波形伸長するフレームと判定されるフレームが少な
くなり、無音区間と判定され削除される区間が長くな
る。この結果、遅れ時間の蓄積の早さがそれまでより遅
くなると共に、無音区間削除処理により縮められる量も
増えるので、それまでよりは早く遅れ時間が解消できる
ようになる。
【0045】上記第4の実施例では、遅れ時間監視手段
90の出力を2値とし、パラメータa、bの変更も、大き
くするかしないかのいずれかであった。しかし、遅れ時
間監視手段90の出力をΔPに比例した連続量とし、そ
の値に比例させてa、bを増加させれば、より細かく遅れ
時間量に対応した、しきい値の変更を行なうことが可能
である。
90の出力を2値とし、パラメータa、bの変更も、大き
くするかしないかのいずれかであった。しかし、遅れ時
間監視手段90の出力をΔPに比例した連続量とし、そ
の値に比例させてa、bを増加させれば、より細かく遅れ
時間量に対応した、しきい値の変更を行なうことが可能
である。
【0046】さらに、上記第4の実施例では、パラメー
タa、bの両方を変更するように述べたが、ΔPの大きさ
に応じてパラメータbのみを変更し、削除される無音区
間の量を増やすだけでも、同様の効果を得ることが可能
である。この場合、伸長区間は遅れ時間量により変化し
ないので、話速変換後の「ゆっくり感」は、遅れ時間が
少ないときと変わらず一定にできるという利点がある。
タa、bの両方を変更するように述べたが、ΔPの大きさ
に応じてパラメータbのみを変更し、削除される無音区
間の量を増やすだけでも、同様の効果を得ることが可能
である。この場合、伸長区間は遅れ時間量により変化し
ないので、話速変換後の「ゆっくり感」は、遅れ時間が
少ないときと変わらず一定にできるという利点がある。
【0047】
【発明の効果】本発明によれば、入力される音声レベル
に応じて、適切に話速変換処理のためのしきい値が設定
されるため、安定した波形伸長動作および無音区間削除
動作を得ることができるようになる、という効果があ
る。
に応じて、適切に話速変換処理のためのしきい値が設定
されるため、安定した波形伸長動作および無音区間削除
動作を得ることができるようになる、という効果があ
る。
【0048】また、本発明によれば、使用者が周囲の雑
音状況を判断して、ボリュームを調整することでしきい
値設定レベルを変更できるようになるため、より使用環
境に適応した動作を得ることが可能となる。
音状況を判断して、ボリュームを調整することでしきい
値設定レベルを変更できるようになるため、より使用環
境に適応した動作を得ることが可能となる。
【0049】さらに、本発明によれば、話速変換に伴っ
て蓄積した遅れ時間量に応じて、それを少なくするよう
にしきい値の変更が行なわれるため、遅れ時間を従来よ
りも素早く解消できるようになり、その結果、連続して
話速変換を行なえる時間が長くできるという効果があ
る。
て蓄積した遅れ時間量に応じて、それを少なくするよう
にしきい値の変更が行なわれるため、遅れ時間を従来よ
りも素早く解消できるようになり、その結果、連続して
話速変換を行なえる時間が長くできるという効果があ
る。
【0050】
【図1】本発明の第1の実施例の信号処理の流れを示す
図。
図。
【図2】本発明の第2の実施例の信号処理の流れを示す
図。
図。
【図3】本発明の第3の実施例の信号処理の流れを示す
図。
図。
【図4】本発明の第4の実施例の信号処理の流れを示す
図。
図。
【図5】本発明に使用する話速変換処理の説明図。
【図6】従来の話速変換装置における信号処理の流れを
示す図。
示す図。
10:入力アナログ系 11:マイクロホン、12:アナログ増幅器、13:ロ
ーパスフィルタ、14:A/D変換器 20:入力リングバッファ 21、22:入力フレームバッファ 30:話速変換処理 31:パワー判定処理、32:波形伸長処理 40:スイッチ手段 41:スローボタン 50:出力リングバッファ 51、52:出力フレームバッファ 60:出力アナログ系 61:スピーカーまたはイヤホン、62:アナログ増幅
器、63:ローパスフィルタ、64:D/A変換器 70:しきい値処理 71:パワー値比較手段、72:記憶手段、73:リセ
ット手段 74:タイマー手段、75:しきい値変更手段 80:パラメータ調整系 81:パラメータ変更手段、82:ボリューム、83:
A/D変換器 90:遅れ時間監視手段。
ーパスフィルタ、14:A/D変換器 20:入力リングバッファ 21、22:入力フレームバッファ 30:話速変換処理 31:パワー判定処理、32:波形伸長処理 40:スイッチ手段 41:スローボタン 50:出力リングバッファ 51、52:出力フレームバッファ 60:出力アナログ系 61:スピーカーまたはイヤホン、62:アナログ増幅
器、63:ローパスフィルタ、64:D/A変換器 70:しきい値処理 71:パワー値比較手段、72:記憶手段、73:リセ
ット手段 74:タイマー手段、75:しきい値変更手段 80:パラメータ調整系 81:パラメータ変更手段、82:ボリューム、83:
A/D変換器 90:遅れ時間監視手段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 高宮 正志 茨城県ひたちなか市稲田1410番地 株式会 社日立製作所パーソナルメディア機器事業 部内
Claims (14)
- 【請求項1】音声信号をディジタル音声データに変換す
る手段と、該ディジタル音声データを保持する入力バッ
ファと、該音声データのフレーム単位のパワーを算出
し、しきい値と比較するパワー判定処理と、該パワー判
定処理の結果に基づいて、該音声データの形成するフレ
ーム単位の音声波形をピッチを変えずに時間軸方向に伸
長する波形伸長処理と、該波形伸長処理結果を保持する
出力バッファと、該出力バッファ内のディジタル音声デ
ータを音響信号に変換する手段と、を有する話速変換装
置において、任意の時点よりも過去に入力された音声デ
ータのフレーム単位のパワー値に基づいて、上記任意の
時点における該パワー判定処理に必要なしきい値を変更
する、しきい値処理手段を設けたことを特徴とする、話
速変換装置。 - 【請求項2】上記しきい値処理手段は、入力音声データ
のフレーム単位のパワー値を入力とし、最大及び最小パ
ワー値を記憶する記憶手段と、該記憶された最大及び最
小パワー値から上記パワー判定処理に必要なしきい値を
算出する、しきい値変更手段と、現在の入力フレームの
パワー値と該記憶手段に記憶されている最大及び最小パ
ワー値との比較を行ない、比較結果に応じて記憶されて
いる最大及び最小パワー値の更新を行なうパワー値比較
手段と、一定の時間間隔で出力を出すタイマー手段と、
該タイマー手段の出力時に該記憶手段の最大及び最小パ
ワー値をリセットするリセット手段とを有することを特
徴とする、請求項1記載の話速変換装置。 - 【請求項3】上記しきい値処理手段が、しきい値の決定
に必要とするパラメータを変更するパラメータ調整系を
有し、かつ、このパラメータ調整系は、装置外部より制
御可能な調整手段を有することを特徴とする、請求項1
または2に記載の話速変換装置。 - 【請求項4】上記調整手段は、装置外部より操作可能な
可変抵抗と、該可変抵抗により設定される電圧値をディ
ジタル値に変換するA/D変換器と、該A/D変換器出力を元
に上記パラメータを算出する手段とからなることを特徴
とした、請求項3に記載の話速変換装置。 - 【請求項5】音声信号をディジタル音声データに変換す
る手段と、該ディジタル音声データを保持する入力バッ
ファと、該音声データのフレーム単位のパワーを算出
し、しきい値と比較するパワー判定処理と、該パワー判
定処理の結果に基づいて、該音声データの形成するフレ
ーム単位の音声波形をピッチを変えずに時間軸方向に伸
長する波形伸長処理と、該波形伸長処理結果を保持する
出力バッファと、該出力バッファ内のディジタル音声デ
ータを音響信号に変換する手段とを有する話速変換装置
において、話速変換動作によって任意の時点までに蓄積
した遅れ時間量に対応して、上記任意の時点における該
パワー判定処理に必要なしきい値を変更する手段を設け
ることを特徴とする話速変換装置。 - 【請求項6】上記蓄積した遅れ時間量が増加し、あらか
じめ決められた限界量を越えた場合に、上記しきい値は
それまでより大きな値に変更され、該限界量よりも該遅
れ時間量が少なくなった場合に、該しきい値を元の値に
戻すように動作することを特徴とする請求項5に記載の
話速変換装置。 - 【請求項7】上記しきい値は、上記遅れ時間量に比例し
て変化することを特徴とする請求項5に記載の話速変換
装置。 - 【請求項8】上記遅れ時間に対応してしきい値を変更す
る手段は、話速変換動作によってその時点までに蓄積し
た遅れ時間量を監視する遅れ時間監視手段と、上記パワ
ー判定処理に必要なしきい値を、その時点よりも以前に
入力された音声データのパワー値に基づいて変更するし
きい値処理手段と、該しきい値処理手段が、しきい値の
決定に必要とするパラメータを変更するパラメータ調整
系とからなり、該遅れ時間監視手段の出力に対応して、
該パラメータ調整系の出力が変化し、これによってしき
い値処理手段の出力が変更されることを特徴とする請求
項5から7のいずれかに記載の話速変換装置。 - 【請求項9】上記遅れ時間監視手段は、上記入力バッフ
ァあるいは出力バッファにおける、データ入力位置を示
すアドレスと、データ出力位置を示すアドレスの差を監
視し、該アドレスの差の絶対値に対応した出力を行なう
ことを特徴とする請求項8に記載の話速変換装置。 - 【請求項10】上記パワー判定処理で使用するしきい値
には、波形伸長をするフレームを決定するのに使用され
る伸長しきい値と、無音区間を判定するために使用され
る無音しきい値とがあり、上記しきい値処理によって変
更されるのは、その両方のしきい値であるか、あるいは
該無音しきい値のみであることを特徴とする請求項1か
ら9のいずれかに記載の話速変換装置。 - 【請求項11】上記パワー判定処理で使用するしきい値
には、波形伸長をするフレームを決定するのに使用され
る伸長しきい値と、無音区間を判定するために使用され
る無音しきい値とがあり、上記しきい値処理によってこ
れらのしきい値が変更される際には、常に該伸長しきい
値は該無音しきい値以上の値に設定されることを特徴と
する請求項1から10のいずれかに記載の話速変換装
置。 - 【請求項12】上記伸長しきい値をTh、および上記無音
しきい値をToとし、その時点より一定時間過去におけ
る、フレーム単位のパワー値の最大値をPmax、最小値を
Pminとしたとき、 Th = Pmin + a | Pmax - Pmin | ( a = 0 〜 1.0 )
および To = Pmin + b | Pmax - Pmin | ( b = 0 〜 1.0 ) なる式で、伸長しきい値および無音しきい値が決定され
ることを特徴とする請求項1から11のいずれかに記載
の話速変換装置。 - 【請求項13】上記パラメータaは上記パラメータb以上
の値であることを特徴とする請求項12に記載の話速変
換装置。 - 【請求項14】上記パラメータaは0.4以下の値であるこ
とを特徴とする請求項12に記載の話速変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9476495A JPH08294199A (ja) | 1995-04-20 | 1995-04-20 | 話速変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9476495A JPH08294199A (ja) | 1995-04-20 | 1995-04-20 | 話速変換装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08294199A true JPH08294199A (ja) | 1996-11-05 |
Family
ID=14119173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9476495A Pending JPH08294199A (ja) | 1995-04-20 | 1995-04-20 | 話速変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08294199A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6236970B1 (en) | 1997-04-30 | 2001-05-22 | Nippon Hoso Kyokai | Adaptive speech rate conversion without extension of input data duration, using speech interval detection |
US7298129B2 (en) * | 2005-11-04 | 2007-11-20 | Tektronix, Inc. | Time arbitrary signal power statistics measurement device and method |
CN112601153A (zh) * | 2021-03-01 | 2021-04-02 | 成都大熊猫繁育研究基地 | 一种声音自动采集与传输装置及其使用方法 |
-
1995
- 1995-04-20 JP JP9476495A patent/JPH08294199A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6236970B1 (en) | 1997-04-30 | 2001-05-22 | Nippon Hoso Kyokai | Adaptive speech rate conversion without extension of input data duration, using speech interval detection |
US6374213B2 (en) | 1997-04-30 | 2002-04-16 | Nippon Hoso Kyokai | Adaptive speech rate conversion without extension of input data duration, using speech interval detection |
EP1517299A2 (en) | 1997-04-30 | 2005-03-23 | Nippon Hoso Kyokai | Speech interval detecting method and system, and speech speed converting method and system using the speech interval detecting method and system |
EP1517299A3 (en) * | 1997-04-30 | 2012-08-29 | Nippon Hoso Kyokai | Speech interval detecting method and system, and speech speed converting method and system using the speech interval detecting method and system |
US7298129B2 (en) * | 2005-11-04 | 2007-11-20 | Tektronix, Inc. | Time arbitrary signal power statistics measurement device and method |
TWI411788B (zh) * | 2005-11-04 | 2013-10-11 | Tektronix Inc | 時間任意信號功率統計測量裝置及方法 |
CN112601153A (zh) * | 2021-03-01 | 2021-04-02 | 成都大熊猫繁育研究基地 | 一种声音自动采集与传输装置及其使用方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2955247B2 (ja) | 話速変換方法およびその装置 | |
JP4640461B2 (ja) | 音量調整装置およびプログラム | |
KR100302370B1 (ko) | 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템 | |
JP5342945B2 (ja) | 音声信号の振幅調整装置及び音声信号の振幅調整方法 | |
JP3961616B2 (ja) | 話速変換方法および話速変換機能付補聴器 | |
JP3308567B2 (ja) | ディジタル音声処理装置及びディジタル音声処理方法 | |
JPH0968997A (ja) | 音声処理方法及び装置 | |
JPH08294199A (ja) | 話速変換装置 | |
JPH09198089A (ja) | 再生速度変換装置 | |
JPH0916193A (ja) | 話速変換装置 | |
JP2008102551A (ja) | 音声信号の処理装置およびその処理方法 | |
JP4127155B2 (ja) | 聴覚補助装置 | |
JPH06319192A (ja) | オーディオ信号処理方法および装置 | |
JPH08317496A (ja) | ディジタル音声信号処理装置 | |
JP2959468B2 (ja) | 話速変換方法および話速変換機能付補聴器 | |
JP3102553B2 (ja) | 音声信号処理装置 | |
JP3596580B2 (ja) | 音声信号の処理回路 | |
JPH0855428A (ja) | 録音信号処理装置 | |
JP4079478B2 (ja) | 音声信号の処理回路および処理方法 | |
JP4134844B2 (ja) | 聴覚補助装置 | |
JPH0944185A (ja) | Pwm信号変調復調回路 | |
JP3257379B2 (ja) | 話速変換機能付補聴器 | |
CN115240700B (zh) | 一种声学设备及其声音处理方法 | |
JPH07192392A (ja) | 話速変換装置 | |
JPH0698398A (ja) | 音声の無音区間検出伸長装置及び音声の無音区間検出伸長方法 |