JPH04367898A - 音声再生装置 - Google Patents

音声再生装置

Info

Publication number
JPH04367898A
JPH04367898A JP3144454A JP14445491A JPH04367898A JP H04367898 A JPH04367898 A JP H04367898A JP 3144454 A JP3144454 A JP 3144454A JP 14445491 A JP14445491 A JP 14445491A JP H04367898 A JPH04367898 A JP H04367898A
Authority
JP
Japan
Prior art keywords
voice
ratio
speed
duration
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3144454A
Other languages
English (en)
Other versions
JP2867744B2 (ja
Inventor
Masayuki Misaki
正之 三崎
Ryoji Suzuki
良二 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3144454A priority Critical patent/JP2867744B2/ja
Publication of JPH04367898A publication Critical patent/JPH04367898A/ja
Application granted granted Critical
Publication of JP2867744B2 publication Critical patent/JP2867744B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は記録された会話音声信号
などの再生速度を通常速度以外に変更する音声再生方法
および音声再生装置に関するものである。
【0002】
【従来の技術】従来より、記録した音声信号の再生速度
を可変する機能をもつ様々な装置が提案されている。最
も簡単な例はアナログテープレコーダのキュー(早送り
再生)、レビュー(巻戻し再生)であるが、これらの高
速再生音声は通常速度の音声と比べると音程・速度の両
方が変化しているため、内容を聴取するのはほとんど不
可能である。また、高速/低速再生時にも音程が変化し
ないように補償する速度変換処理を行なう音声再生装置
も提案されている。  以下、速度変換処理を行なう音
声再生装置について、図面を参照しながら説明を行なう
【0003】(図4)は従来の音声再生装置の構成を示
すものである。(図4)において、101は速度変換器
、102は切り換え器、103は速度制御器である。
【0004】以上のように構成された音声再生装置につ
いて、以下その動作について説明する。まず、入力され
た音声信号は速度変換器101と切り替え器102に入
力される。速度変換器101は音程を通常再生時に保っ
たまま速度のみを変更する処理を行なうものである。速
度変換処理については例えば『ディジタル音声処理』古
井貞煕著、東海大学出版会のTDHSアルゴリズムの項
目を参照されたい。切り換え器102は入力されたその
ままの音声信号と、速度変換器101の出力信号とを速
度制御器103の制御により切り換える。速度制御器1
03は設定された再生速度に応じて速度変換器101の
パラメータを制御し、切り換え器102の入力を選択す
る。この構成で、通常再生時には入力された音声信号は
そのまま切り換え器102を通じて出力される。一方、
再生速度を変更して聴取する場合には、速度制御器10
3で制御された速度変換器101によって速度変換され
た音声が切り換え器102を通じて出力される。
【0005】
【発明が解決しようとする課題】しかし上記の構成では
入力信号の内容如何によらずに、一様に時間軸伸縮を行
なう速度変換処理を行なって再生速度を変化させている
。これにより、再生音の音程は保存されてはいる。しか
しながら、再生速度を通常速度から大きく変更する場合
には、人間の発声法とは異なった不自然な再生音になる
という課題を有している。
【0006】本発明は上記の課題を解決するもので、再
生速度を変更してもできるだけ人間の発声法に近い状態
で自然に聞き取れ、しかも了解性も改善できる再生音を
得るための音声再生方法および、音声再生装置を提供す
ることを目的とする。
【0007】
【課題を解決するための手段】この目的を達成するため
に本発明の音声再生方法では、入力信号における音声区
間の時間長の比によってファジー推論した結果に基づい
て、入力音声に対して無音区間の削除(付加)と速度変
換処理とを併用して行なう方法を採用している。また、
本発明の音声再生装置では音声時間率検出器の出力と設
定した再生速度比とを入力としてファジー推論する推論
器と推論結果に基づいて入力音声に処理を行なう無音区
間処理器と速度変換処理器とを有した構成になっている
【0008】
【作用】この構成によって、音声時間率検出器の出力と
再生速度比とをファジー推論して無音区間増減比と速度
変換比とを決定している。これにより入力音声信号の特
徴を考慮して、早口な会話や遅口な会話をもう少し遅く
/早くといった再生速度の変更をより自然に行なうこと
が可能となる。そして、この無音区間の伸長と音声区間
の伸長をうまく組み合わせることで、人間が会話速度を
変更するときと同様の結果が得られるのである。
【0009】
【実施例】以下本発明の第1の実施例について、図面を
参照しながら説明する。
【0010】(図1)は本発明の第1の実施例における
フローチャートを示すものである。本実施例では入力さ
れる音声信号は、記録媒体にすでに録音がなされている
ものとする。基本的な考え方は、入力信号の無音区間に
対しては所定の時間長だけ無音を削除することで、また
、音声区間に対しては所定の速度変換比で継続時間長を
圧縮して音声信号の高速再生を可能とするものである。 また、音声はフレーム単位で音声/無音の判定と、無音
削除、速度変換の処理がなされるものとする。ここで、
音声時間率とは次の(数1)で示すように、入力される
信号において音声区間が占める時間長の比を表している
【0011】
【数1】
【0012】また、速度変換比とは(数2)で示すよう
に、高速再生時には常時1より小さい値をとり、圧縮比
が大きいほど小さい値となる。
【0013】
【数2】
【0014】以下に、(図1)の説明を行なう。まず、
現在のフレームF0 の音声/無音判定を行なう。この
判定結果は以後Nフレーム分の処理が済むまで保持され
ているものとする。そして、現在のフレーム以前のNフ
レームについての音声/無音判定の結果を調べて、音声
区間と判定された時間長の全体に占める割合を示す音声
時間率VRを求める。これにより、F0 近傍における
VRが推定される。また、高速再生の度合とは、通常再
生と比較した再生速度の度合であり、ここでは「少し早
い」、と「かなり早い」の2つが設定可能であるとする
。この値VRと設定されている高速再生の度合によりF
0 に対する無音削除処理あるいは速度変換処理のパラ
メータを変更することを考える。一般にVRが大きいと
きは早口の会話であり、VRが小さいときは遅口の会話
であることが知られている(参考文献:「音声情報処理
の基礎」斉藤収三、中田和男共著、オーム社、第3章)
【0015】しかし、これらは発声者や会話状況によっ
て様々に状況が変わる。入力音声を分類したときの「早
口」,「普通」,「遅口」は、ファジー集合である。 「早口」な音声を「少し早く」したいときと、「遅口」
な音声を「少し早く」したいときとでは、早くする度合
が異なるため、実際の再生速度も違った値にするほうが
良い。つまり、無音削除処理あるいは速度変換処理のパ
ラメータを決定する際には、曖昧な情報処理が必要とい
える。したがって、VRと高速再生の度合とを入力とし
たファジー推論を行なうことで無音区間削除比SEと速
度変換比STを導出する。無音区間削除処理では、VR
が大きいときはF0 に対して短い削除をし、VRが小
さいときはF0 に対して長い削除をする。一方、速度
変換処理では、VRが大きいときは速度変換比を大きく
し(1に近い値)、VRが小さいときには速度変換比を
小さく(0に近い値)する。以上のようなルールを基に
SEとSTを設定する。
【0016】次に、F0 が無音区間であるならば無音
削除をし、そうでなければ速度変換で時間圧縮を行なう
。 このような処理を繰り返すことで高速再生を行なう。
【0017】次にファジー推論を行なう推論の規則等に
ついて示す。(図5)にファジー推論を行なう際に必要
なメンバーシップ関数を示す。
【0018】(図5)において(a)はVRに対するメ
ンバーシップ関数、(b)はSEに対するメンバーシッ
プ関数、(c)はSTに対するメンバーシップ関数であ
る。これらの図に於て使用している記号の示す意味を以
下に列挙する。
【0019】音声時間率:VR PS:音声時間率が小さい(遅口) PM:音声時間率は中ぐらい(普通の会話速度)PB:
音声時間率は大きい(早口) 無音区間削除比:SE PS:少しだけ削除する PM:やや削除する PB:かなり削除する 速度変換比:ST PS:少しだけ圧縮する PM:やや圧縮する PB:かなり圧縮する そして、(表1)に示す制御規則でSEおよびSRを推
論する。
【0020】
【表1】
【0021】以上のように本実施例によれば、無音区間
削除比と速度変換比とを音声時間率によってファジー推
論して再生速度の制御を行なっているため、より人間の
感覚に合った自然な高速再生ができる。
【0022】以下本発明の第2の実施例について、図面
を参照しながら説明する。(図2)は本発明の第2の実
施例におけるフローチャートを示すものである。本実施
例でも入力される音声信号は、記録媒体にすでに録音が
なされているものとする。基本的な考え方は、入力信号
の無音区間に対しては所定の時間長だけ無音を付加する
ことで、また、音声区間に対しては所定の速度変換比で
継続時間長を伸長して音声信号の高速再生を可能とする
ものである。また、音声はフレーム単位で音声/無音の
判定と、無音付加、速度変換の処理がなされるものとす
る。また(数2)で表わされる速度変換比は、低速再生
時には常時1より大きい値をとり、伸長比が大きいほど
大きい値となる。
【0023】以下に、(図2)の説明を行なう。まず、
現在のフレームF0 の音声/無音判定を行なう。この
判定結果は以後Nフレーム分の処理が済むまで保持され
ているものとする。そして、現在のフレーム以前のNフ
レームについての音声/無音判定の結果を調べて、音声
区間と判定された時間長の全体に占める割合を示す音声
時間率VRを求める。これにより、F0 近傍における
VRが推定される。また、低速再生の度合とは、通常再
生と比較した再生速度の度合であり、ここでは「少し遅
い」、と「かなり遅い」の2つが設定可能であるとする
【0024】VRと設定されている低速再生の度合によ
りF0 に対する無音付加処理あるいは速度変換処理の
パラメータを変更することを考える。「早口」な音声を
「少し遅く」したいときと、「遅口」な音声を「少し遅
く」したいときとでは、遅くする度合が異なるため、実
際の再生速度も違った値にするほうが良い。つまり、無
音付加処理あるいは速度変換処理のパラメータを決定す
る際には、曖昧な情報処理が必要といえる。したがって
、VRと低速再生の度合とを入力としたファジー推論を
行なうことで無音区間付加比SAと速度変換比STを導
出する。無音区間付加処理では、VRが大きいときはF
0 に対して多く付加をし、VRが小さいときはF0 
に対して短い付加をする。一方、速度変換処理では、V
Rが大きいときは速度変換比を大きくし(1より大きい
値)、VRが小さいときには速度変換比を小さく(1に
近い値)する。以上のようにSAとSTを設定する。
【0025】次に、F0 が無音区間であるならば無音
付加をし、そうでなければ速度変換で時間伸長を行なう
。 このような処理を繰り返すことで低速再生を行なう。
【0026】次にファジー推論を行なう推論の規則等に
ついて示す。(図6)において(a)はVRに対するメ
ンバーシップ関数、(b)はSAに対するメンバーシッ
プ関数、(c)はSTに対するメンバーシップ関数であ
る。これらの図に於て使用している記号の示す意味を以
下に列挙する。
【0027】音声時間率:VR PS:音声時間率が小さい(遅口) PM:音声時間率は中ぐらい(普通の会話速度)PB:
音声時間率は大きい(早口) 無音区間付加比:SA PS:少しだけ付加する PM:やや付加する PB:かなり付加する 速度変換比:ST NS:少しだけ伸長する NM:やや伸長する NB:かなり伸長する そして、(表2)に示す制御規則でSEおよびSRを推
論する。
【0028】
【表2】
【0029】以上のように本実施例によれば、無音区間
付加比と速度変換比とを音声時間率によってファジー推
論して再生速度の制御を行なっているため、より人間の
感覚に合った自然な低速再生ができる。
【0030】以下本発明の音声再生装置の一実施例につ
いて、図面を参照しながら説明する。
【0031】(図3)は本発明の音声再生装置の一実施
例における構成を示すものである。(図3)において、
1は有無判定器、2は音声時間率検出器、3は推論器、
4は無音区間処理器、5は速度変換処理器、6は第1の
スイッチ、7は第2のスイッチである。本実施例でも入
力される音声信号は、記録媒体にすでに録音がなされて
いるものとする。基本的な考え方は、入力信号の無音区
間に対しては所定の時間長だけ無音を削除/付加するこ
とで、また、音声区間に対しては所定の速度変換比で継
続時間長を圧縮/伸長して音声信号の低速/高速再生を
可能とするものである。また、音声はフレーム単位で音
声/無音の判定と、無音削除/付加、速度変換の処理が
なされるものとする。また、音声時間率および速度変換
比は上述したようにそれぞれ(数1)および(数2)で
表わされる。
【0032】以上のように構成された実施例について以
下にその動作を説明する。まず、有無判定器1は現在の
フレームF0 の音声/無音判定を行い、その結果を有
声時間率検出器2と第1のスイッチ6と第2のスイッチ
7とに出力する。音声時間率検出器2は有無判定器1の
過去から現在までの判定結果を複数フレーム分保持して
おり、音声区間のフレームと無音区間のフレームとの比
率に基づいて音声時間率VRを求めて推論器3へ出力す
る。ここで、推論器3に入力される再生速度変更量DS
と音声時間率VRについて補足説明を行なう。
【0033】VRは本発明の音声再生方法の第1の実施
例で説明したように、人間の会話の早さを示すファジー
集合と考えられる。また、DSは現在の再生速度をどれ
くらい早く/遅くするかを使用者が設定したあいまいな
値であり、これもファジー集合と考えられる。例えば、
現在遅口の音声を少し早く再生中であるが、これを今よ
りさらに少し早くしたい時や、現在早口の英語音声を大
変ゆっくり再生しているが、これを今より少しだけ早く
したい時、以上のような再生速度の制御をうまく行なう
ためにファジー推論を用いてパラメータを決定する。
【0034】推論器3は現在設定されている再生速度変
更量DSと音声時間率VRとを入力として、無音区間増
減比および速度変換比をファジー推論によって決定する
。音声信号は、有無判定器1の判定結果に基づいた第1
のスイッチ6の切り替え操作により、無音区間について
は無音区間処理器4へ入力され、音声区間については速
度変換処理器5へ入力される。無音区間処理器4は無音
区間のフレームに対して推論器3によって与えられた無
音区間増減比で決められた所定の時間長の無音区間を削
除/付加する。速度変換処理器5は音声区間のフレーム
に対して推論器3によって与えられた速度変換比で時間
軸伸縮を行なう。第2のスイッチ7は有無判定器1の判
定結果に基づき、無音区間処理器4の出力と速度変換処
理器5の出力とを切り換えて出力音声とする。
【0035】以上のように本実施例では、無音区間増減
比と速度変換比とを音声時間率と現在の再生速度からの
変更量によってファジー推論して再生速度の制御を行な
っているため、より所望の再生速度に設定しやすくなる
【0036】なお、本実施例においては、無音区間に対
しては無音区間処理器で必ず処理を行なう構成であるが
、無音区間に対しても速度変換処理を用いる構成も考え
られる。
【0037】
【発明の効果】以上の説明からも明らかなように、本発
明は音声時間率によって無音区間削除比と速度変換比と
をファジー推論で決定して、無音区間の所定の時間長を
削除し、音声区間に速度変換処理を施して時間長を圧縮
することで、音声を人間に自然に聞こえるように高速に
再生する音声再生方法を実現できるものである。
【0038】また、音声時間率によって無音区間付加比
と速度変換比とをファジー推論で決定して、無音区間の
所定の時間長を付加し、音声区間に速度変換処理を施し
て時間長を伸長することで、音声を人間に自然に聞こえ
るように低速に再生する音声再生方法を実現できる。
【0039】さらに、音声時間率検出器によって得た音
声時間率と現在の再生速度からの変更量によって無音区
間増減比と速度変換比とをファジー推論する推論器と、
無音区間処理器、速度変換処理器を設けることにより、
現在の再生速度を使用者がどのように変更したいかをよ
り的確に実現できる音声再生装置を提供することができ
る。
【図面の簡単な説明】
【図1】本発明の音声再生方法の第1の実施例のフロー
チャート
【図2】本発明の音声再生方法の第2の実施例のフロー
チャート
【図3】本発明の音声再生装置の一実施例の構成図
【図
4】従来の音声再生装置の構成図
【図5】本発明の音声再生方法の第1の実施例に適用さ
れる各メンバーシップ関数
【図6】本発明の音声再生方法の第2の実施例に適用さ
れる各メンバーシップ関数
【符号の説明】
1  有無判定器 2  音声時間率検出器 3  推論器 4  無音区間処理器 5  速度変換処理器 6  第1のスイッチ 7  第2のスイッチ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】  入力信号に含まれる音声区間の時間長
    の比を求め、前記比を入力としてファジー推論を行なっ
    て無音区間削除比と音声区間の速度変換比を求め、入力
    信号が無音区間であれば前記無音区間削除比に基づいて
    無音区間の所定の時間長を削除し、入力信号が音声区間
    であれば前記速度変換比に基づいて音声区間に速度変換
    処理を施して時間長を圧縮する処理を繰り返して行い、
    音声を高速再生する音声再生方法。
  2. 【請求項2】  入力信号に含まれる音声区間の時間長
    の比を求め、前記比を入力としてファジー推論を行なっ
    て無音区間付加比と音声区間の速度変換比を求め、入力
    信号が無音区間であれば前記無音区間付加比に基づいて
    無音区間に所定の時間長を付加し、入力信号が音声区間
    であれば前記速度変換比に基づいて音声区間に速度変換
    処理を施して時間長を伸長する処理を繰り返して行い、
    音声を低速再生する音声再生方法。
  3. 【請求項3】  入力信号が音声区間であるか無音区間
    であるかを検出する有無判定器と、入力信号に含まれる
    音声区間の時間長の比を検出する音声時間率検出器と、
    前記音声時間率検出器の出力と現在の再生速度からの変
    更量とを入力としてファジー推論を行なって無音区間増
    減比と音声区間の速度変換比を決定する推論器と、前記
    有無判定器の出力と前記推論器出力である無音区間増減
    比に応じて入力信号の無音区間に対して所定の時間長を
    付加もしくは削除する無音区間処理器と、前記有無判定
    器の出力と前記推論器出力である速度変換比に応じて入
    力信号の音声区間に対して音程一定で継続時間長を圧縮
    または伸長する速度変換処理器とを有する音声再生装置
JP3144454A 1991-06-17 1991-06-17 音声再生装置 Expired - Fee Related JP2867744B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3144454A JP2867744B2 (ja) 1991-06-17 1991-06-17 音声再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3144454A JP2867744B2 (ja) 1991-06-17 1991-06-17 音声再生装置

Publications (2)

Publication Number Publication Date
JPH04367898A true JPH04367898A (ja) 1992-12-21
JP2867744B2 JP2867744B2 (ja) 1999-03-10

Family

ID=15362628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3144454A Expired - Fee Related JP2867744B2 (ja) 1991-06-17 1991-06-17 音声再生装置

Country Status (1)

Country Link
JP (1) JP2867744B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084692A (ja) * 2003-09-10 2005-03-31 Microsoft Corp デジタルオーディオ信号の高品質の伸張および圧縮を提供するシステムおよび方法
JP2007025039A (ja) * 2005-07-13 2007-02-01 Matsushita Electric Ind Co Ltd 音声再生装置、音声録音再生装置、およびそれらの方法、記録媒体、集積回路
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置
JP2008107381A (ja) * 2006-10-23 2008-05-08 Mitsubishi Electric Corp 話速変換装置及び話速変換制御方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084692A (ja) * 2003-09-10 2005-03-31 Microsoft Corp デジタルオーディオ信号の高品質の伸張および圧縮を提供するシステムおよび方法
JP2007025039A (ja) * 2005-07-13 2007-02-01 Matsushita Electric Ind Co Ltd 音声再生装置、音声録音再生装置、およびそれらの方法、記録媒体、集積回路
JP4580297B2 (ja) * 2005-07-13 2010-11-10 パナソニック株式会社 音声再生装置、音声録音再生装置、およびそれらの方法、記録媒体、集積回路
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置
JP2008107381A (ja) * 2006-10-23 2008-05-08 Mitsubishi Electric Corp 話速変換装置及び話速変換制御方法

Also Published As

Publication number Publication date
JP2867744B2 (ja) 1999-03-10

Similar Documents

Publication Publication Date Title
CA2253749C (en) Method and device for instantly changing the speed of speech
JP4523257B2 (ja) 音声データ処理方法、プログラム及び音声信号処理システム
JP3619946B2 (ja) 話速変換装置、話速変換方法及び記録媒体
JP3630609B2 (ja) 音声情報再生方法ならびに装置
JPH04367898A (ja) 音声再生装置
JPS5982608A (ja) 音声の再生速度制御方式
JP3378672B2 (ja) 話速変換装置
JP2009075280A (ja) コンテンツ再生装置
JP2006317768A (ja) 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム
JP3081469B2 (ja) 話速変換装置
JP3422716B2 (ja) 話速変換方法および装置および話速変換プログラムを格納した記録媒体
JP2000099097A (ja) 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法
JP3189587B2 (ja) 音声時間軸変換装置
JPH08328586A (ja) 音声時間軸変換装置
JPH09152889A (ja) 話速変換装置
JPH0573089A (ja) 音声再生方法
JPH09138698A (ja) 音声記録再生装置
JP2001222300A (ja) 音声再生装置および記録媒体
JPH09146587A (ja) 話速変換装置
JP4580297B2 (ja) 音声再生装置、音声録音再生装置、およびそれらの方法、記録媒体、集積回路
JPH07191695A (ja) 話速変換装置
JPH0854895A (ja) 再生装置
JP3189597B2 (ja) 音声時間軸変換装置
JP2001318700A (ja) 話速変換装置
KR100372576B1 (ko) 오디오신호 가공방법

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071225

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091225

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees