JPH10222806A - 話速変換装置 - Google Patents

話速変換装置

Info

Publication number
JPH10222806A
JPH10222806A JP9019359A JP1935997A JPH10222806A JP H10222806 A JPH10222806 A JP H10222806A JP 9019359 A JP9019359 A JP 9019359A JP 1935997 A JP1935997 A JP 1935997A JP H10222806 A JPH10222806 A JP H10222806A
Authority
JP
Japan
Prior art keywords
compression
voice
data
compression rate
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9019359A
Other languages
English (en)
Inventor
Koji Tanaka
浩司 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP9019359A priority Critical patent/JPH10222806A/ja
Publication of JPH10222806A publication Critical patent/JPH10222806A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 この発明は、音声メモリ内の未読み出しの音
声データの蓄積量が所定量を越えたときに、再生速度倍
率分の1の圧縮率で圧縮処理を行なうことができない場
合においても、音声メモリ内の未読み出しの音声データ
の蓄積量が音声メモリの容量を越えないようにすること
ができる話速変換装置を提供することを目的とする。 【解決手段】 音声メモリ内の未読み出しの音声データ
の蓄積量を算出する蓄積量算出手段、ならびに音声メモ
リ内の未読み出しの音声データの蓄積量が所定値を越え
た時に、話速変換手段31で用いられる圧縮率を、原則
的には、再生速度倍率分の1の値に設定し、圧縮率を再
生速度倍率分の1とした場合に、圧縮処理が不可能であ
る場合には、話速変換手段31で用いられる圧縮率を、
再生速度倍率分の1より小さな圧縮率で圧縮処理可能な
値に設定する手段7を備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する分野】この発明は、VTR等に応用され
ている話速変換装置に関する。
【0002】
【従来の技術】VTRの高速再生時において、ビデオテ
ープから読み取られた音声信号のうち、無音区間の音声
信号を削除し、音声区間の音声信号を時間軸上において
伸長し、音声区間の音声を再生速度より遅い速度で出力
する話速変換装置が知られている。
【0003】このような話速変換装置では、入力音声の
話速を遅くして出力する際に入力音声と出力音声との間
に生じる時間的な遅延量を吸収するための音声メモリが
設けられている。音声メモリ内の未読み出しの音声デー
タの蓄積量が、音声メモリの容量を越えると、出力され
る音声区間の音声に途切れが生じる。音声メモリ内の未
読み出しの音声データの蓄積量が音声メモリの容量を越
えないようにするためには、音声メモリ内の未読み出し
の音声データの蓄積量が所定量を越えたときに、理論的
には、圧縮率αを再生速度倍率M分の1、つまり、α=
1/Mに設定すればよい。
【0004】たとえば、再生速度Mが2の場合(2倍速
再生の場合)には、音声メモリ内の未読み出しの音声デ
ータの蓄積量が所定量を越えたときに、圧縮率αを1/
2に設定すればよい。圧縮率αが1/2ということは、
たとえば、2ピッチ周期が1ピッチ周期に間引かれるこ
とを意味する。しかしながら、1/Mの圧縮処理が不可
能な場合がある。
【0005】
【発明が解決しようとする課題】この発明は、音声メモ
リ内の未読み出しの音声データの蓄積量が所定量を越え
たときに、再生速度倍率分の1の圧縮率で圧縮処理を行
なうことができない場合においても、音声メモリ内の未
読み出しの音声データの蓄積量が音声メモリの容量を越
えないようにすることができる話速変換装置を提供する
ことを目的とする。
【0006】
【課題を解決するための手段】この発明による話速変換
装置は、1より大きな再生速度倍率で再生が行なわれる
際に、入力音声信号のうち、少なくとも音声区間の信号
を圧縮処理することにより、入力音声の話速を遅くさせ
る話速変換手段と、話速変換手段の前段、後段または内
部に設けられ、入力音声の話速を遅くして出力する際に
生じる遅延量を吸収するために音声データを蓄積される
音声メモリとを備えた話速変換装置において、音声メモ
リ内の未読み出しの音声データの蓄積量を算出する蓄積
量算出手段、ならびに音声メモリ内の未読み出しの音声
データの蓄積量が所定値を越えた時に、話速変換手段で
用いられる圧縮率を、原則的には、再生速度倍率分の1
の値に設定し、圧縮率を再生速度倍率分の1とした場合
に、圧縮処理が不可能である場合には、話速変換手段で
用いられる圧縮率を、再生速度倍率分の1より小さな圧
縮率で圧縮処理可能な値に設定する手段を備えているこ
とを特徴とする。
【0007】圧縮処理が不可能である場合は、話速変換
手段で用いられるソフトウエア等によって異なる。圧縮
処理が不可能である場合には、たとえば、次のような1
つの場合がある。
【0008】(1)αを圧縮率、データ入力個数をP、
データ出力個数をQとて、圧縮率αをα=Q/Pで定義
した場合に、データ入力個数Pが規定ビット数の2進数
で表現できない場合。この場合には、データ入力個数P
が規定ビット数の2進数で表現できるような圧縮率であ
って、かつ1/Mより小さな圧縮率に、圧縮率が設定さ
れる。
【0009】(2)αを圧縮率、データ入力個数をP、
データ出力個数をQとて、圧縮率αをα=Q/Pで定義
した場合に、データ入力個数Qが規定ビット数の2進数
で表現できない場合。この場合には、データ入力個数Q
が規定ビット数の2進数で表現できるような圧縮率であ
って、かつ1/Mより小さな圧縮率に、圧縮率が設定さ
れる。
【0010】(3)αを圧縮率、データ入力個数をP、
データ出力個数をQとて、圧縮率αをα=Q/Pで定義
した場合に、データ入力個数PおよびQが規定ビット数
の2進数で表現できない場合。この場合には、データ入
力個数PおよびQが規定ビット数の2進数で表現できる
ような圧縮率であって、かつ1/Mより小さな圧縮率
に、圧縮率が設定される。
【0011】(4)圧縮処理が不可能である場合とは、
αを圧縮率、データ入力個数をP、データ出力個数をQ
とて、圧縮率αをα=Q/Pで定義した場合に、圧縮率
αが規定ビット数の2進数で表現できない場合。この場
合には、圧縮率αが規定ビット数の2進数で表現できる
ような圧縮率であってかつ1/Mより小さな圧縮率に、
圧縮率が設定される。
【0012】上記規定ビット数の2進数の表現形式に
は、固定小数点表現、浮動小数点表現等がある。
【0013】
【発明の実施の形態】以下、図面を参照して、この発明
をVTRに適用した場合の実施の形態について説明す
る。
【0014】図1は、VTRに設けられた話速変換装置
の構成例を示している。
【0015】入力音声信号は、A/D変換部1に送ら
れ、たとえば12ビットのディジタル信号に変換され
る。
【0016】A/D変換部1の出力は、区間判別部2に
送られる。区間判別部2は、所要数の音声データのパワ
ーの平均値、パワーの累積値、振幅平均値、振幅累積値
等に基づいて、入力音声が音声区間であるか、無音区間
であるかを判定する。
【0017】所要数の音声データのパワーの平均値に基
づいて、入力音声が音声区間であるか、無音区間である
かを判定する場合について説明する。この場合には、所
定数の音声データの平均パワー値Pが算出される。この
平均パワー値Pは、サンプリングされた所定数の各音声
データの振幅を、i0 ,i1 ,…iN-1 とすると、次の
数式1によって求められる。
【0018】
【数1】
【0019】そして、算出された平均パワー値Pと所定
のしきい値Thとが比較され、平均パワー値Pがしきい
値Th以上である場合には(P≧Th)、当該入力音声
信号が音声区間であると判定され、パワー値Pがしきい
値Th未満である場合には(P<Th)、当該入力音声
信号が無音区間であると判定される。
【0020】このしきい値は、音声データのレベルに応
じて変化させてもよい。また、定常雑音、環境雑音も無
音区間として取り扱われる。
【0021】なお、入力音声信号のパワースペクトル、
入力信号の周期性の有無等に基づいて、入力音声が音声
区間であるか、無音区間であるかを判定するようにして
もよい。また、音声区間に関しては、その特徴を分析
し、母音または子音(有声子音、無音子音)の判別をも
行なってよい。
【0022】話速制御部3は、音声圧縮部31と無音削
除部32とを備えている。音声区間であると判定された
音声データは、音声圧縮部31によって、圧縮処理(時
間軸伸長処理)が行なわれる。無音区間であると判定さ
れた音声データは、無音削除部32によって削除され
る。
【0023】音声圧縮部31によって圧縮処理が行なわ
れた音声データは、音声メモリ4に一旦蓄積される。音
声メモリ4に蓄積された音声データは、逐次読み出され
てD/A変換部5に送られ、アナログ信号に変換され
る。
【0024】音声メモリ4内の未読み出しの音声データ
の蓄積量は、蓄積量算出部6によって算出される。蓄積
量算出部6によって算出された蓄積量Sは圧縮率制御部
7に送られる。圧縮率制御部7は、蓄積量算出部6によ
って算出された蓄積量Sと操作部8によって設定されて
いる再生速度倍率Mとに基づいて、音声圧縮部31で用
いられる圧縮率αを制御する。なお、Mは、M>1とな
る任意の値である。
【0025】再生速度倍率Mの場合には、M倍速再生時
の音声の音程を1倍速再生時(標準再生速度での再生
時)の音声の音程に戻すために、A/D変換部1のサン
プリング周波数fADは、次の数式2で示されるように、
D/A変換部5のサンプリング周波数fDAのM倍に設定
される。
【0026】
【数2】
【0027】したがって、M=2の場合(2倍速再生
時)には、fAD=2fDAとなる。一方、時間軸圧縮伸長
部31で用いられる圧縮率αは、蓄積量算出部6によっ
て算出された蓄積量が第1の所定値SHに達するまで
は、出力音声の話速を入力音声の話速より遅くさせるた
めに、1/Mより大きな第1設定値(α>1/M)に設
定される。したがって、M=2の場合(2倍速再生時)
には、圧縮率αは1/2より大きな値、たとえば、2/
3に設定される。
【0028】蓄積量算出部6によって算出された蓄積量
が第1の所定値SHに達した場合には、未読み出しデー
タの蓄積量が音声メモリ4の容量を越えないように(音
切れが発生しないように)、音声圧縮部31で用いられ
る圧縮率αは、1/M以下の第2の設定値(α≦1/
M)に設定される。ただし、原則的には、圧縮率αは、
1/Mに設定され、1/Mでの圧縮処理が不可能な場合
には、1/Mより小さな圧縮率α(α<1/M)に設定
される。M=2の場合(2倍速再生時)には、圧縮率α
は1/2に設定される。
【0029】そして、蓄積量算出部6によって算出され
た蓄積量が第2の所定値SL(SL<SH)まで低下す
ると、音声圧縮部31で用いられる圧縮率αは、第2の
設定値から第1の設定値に戻される。
【0030】音声圧縮部31で用いられる圧縮法として
は、たとえば、ポインタ移動制御による重複加算法(PIC
OLA : Pointer Interval Control Overlap and Add)、
TDHS(Time Domain Harmonic Scaling)法等がある。PI
COLAを用いて、入力音声データを圧縮率α=2/3
で圧縮する方法について、図2を用いて簡単に説明す
る。
【0031】まず、入力音声データからピッチ周期が抽
出される。抽出されたピッチ周期をTpとする。波形A
に対しては、1から0へ直線的に向かう重み(重み関数
K1)がつけられて波形A’が作成される。波形Bに対
しては、0から1へ直線的に向かう重み(重み関数K
2)がつけられて波形B’が作成される。
【0032】そして、これらの波形A’およびB’が加
え合わされて、長さTpの波形A’*B’が作成され
る。上記重みは、波形A’*B’の前後の接続点での連
続性を保つためにつけられている。次に、ポインタが、
圧縮率αに基づいて決定された長さである3Tp分だけ
移動せしめられ、同様な操作が行なわれる。これによ
り、3つの波形A、B、Cから2つの波形A’*B’と
Cとが得られる。このようにして、3ピッチ周期分の信
号が、2ピッチ周期分の信号に圧縮される。
【0033】上記の例では、ピッチ周期単位で圧縮処理
を行なっているが、予め定められた固定フレーム長単位
で圧縮処理を行なってもよい。
【0034】1/Mより大きな圧縮率α{α>(1/
M)}で、入力信号を圧縮した場合に、出力音声の話速
が入力音声の話速に対して遅くなる理由について、M=
2で、α=2/3の場合を例にとって説明する。
【0035】M=2の場合(fAD=2fDAの場合)に
は、単位時間当たりにA/D変換部1によって変換され
るデータ量は、単位時間当たりにD/A変換部5によっ
て変換されるデータ量の2倍になる。n=1/2の場合
(fAD/fDA=2の場合)において、A/D変換された
音声データをそのままD/A変換して出力するとする。
この場合、A/D変換されたディジタルデータおよびD
/A変換されたディジタルデータを時間軸上で表示する
と、図3に示すようになる。
【0036】図3において、t1はA/D変換部1のサ
ンプリング周期(1/fAD)であり、D/A変換部5の
サンプリング周期(1/fDA)は2t1となる。図3か
ら明らかなように、D/A変換データ列(A1〜A6)
は、A/D変換データ列(A1〜A6)が2倍に時間軸
上で伸長されたものとなる。つまり、入力音声信号の所
定時間Tの長さが、時間軸上で2倍に伸長されて、出力
音声信号として出力されることになるので、入力音声の
話速に対して、出力音声の話速が2倍遅くなったことに
なる。
【0037】そこで、所定時間長さの入力音声信号を、
時間長さを変更することなく、出力音声信号として出力
するためには、言い換えれば、入力音声の話速と出力音
声の話速を同じにするには、A/D変換部1によって変
換された音声データを、1/2倍に圧縮する必要があ
る。つまり、図4に示すように、A/D変換された音声
データを1個ずつ間引くことにより、A/D変換された
音声データを1/2倍に圧縮すれば、入力音声信号の所
定長さMの時間長が変更されることなく、出力音声信号
として出力される。図4の例では、A/D変換データ列
A1、A2、…A7が、1/2倍に圧縮されることによ
り、D/A変換データ列A1、A3、A5、A7に変換
されている。
【0038】入力音声の話速に対して、出力音声の話速
を遅くするには、入力音声信号の所定時間長さを時間軸
上で伸長して、出力音声信号として出力すればよいこと
になる。n=1/2の場合(fAD/fDA=2の場合)に
は、A/D変換されたデータと、D/A変換されたデー
タとの時間長さが同じになる1/2倍の圧縮より、圧縮
の割合(度合い)を小さくすればよい。
【0039】つまり、入力音声の話速に対して、出力音
声の話速を遅くするためには、A/D変換部1によって
変換された音声データを1/2より大きな圧縮率αで圧
縮する必要がある。たとえば、A/D変換部1によって
変換された音声区間の音声データを、圧縮率α=1/2
より大きな圧縮率α=2/3で圧縮した場合には、出力
音声信号の音声区間は、入力音声信号の音声区間を2/
3に圧縮したことになる。したがって、この場合には、
圧縮率α=1/2で圧縮した場合に比べて、1/2−2
/3=1/6だけ、入力される音声区間が時間軸上で伸
長されて出力されることになる。
【0040】蓄積量算出部6によって算出された蓄積量
が第1の所定値に達した場合の、圧縮率α(第2の設定
値)の決定方法について説明する。ここでは、音声圧縮
部31が、αを圧縮率、データ入力個数をP、データ出
力個数をQとて、圧縮率αをα=Q/Pで定義した場合
に、データ入力個数Pが規定ビット数の2進数で表現で
きない場合に、圧縮処理を行なえないシステムである場
合について説明する。
【0041】A/D変換部1のサンプリング周波数fAD
と、D/A変換部5のサンプリング周波数fDAとは、単
一のクロック発振器から発生したクロック信号を分周す
ることにより生成される。
【0042】例えば、再生速度倍率をMとして、1<M
≦2の範囲で、通常速度に対して再生速度が速くなるよ
うに、再生速度倍率を変化させることができるシステム
を想定する。D/A変換部5のサンプリング周波数fDA
は、何れの再生速度倍率においても一定であり、クロッ
ク発振器から発生したクロック信号を、10分周するこ
とにより生成されるものとする。つまり、D/A変換部
5のサンプリング周波数fDAは、クロック発振器から発
生したクロック信号の周波数をKとすると、次の数式3
によって表される。
【0043】
【数3】
【0044】一方、A/D変換部1のサンプリング周波
数fADは、クロック発振器から発生したクロック信号の
周波数をKとし、N(N:整数)を再生速度倍率に応じ
た変数とすると、次の数式4によって表される。
【0045】
【数4】
【0046】したがって、fAD/fDAは、次の数式5に
よって表される。
【0047】
【数5】
【0048】出力音声の音程を、1倍速再生時の音程と
するためには、次の数式6の関係を満たす必要がある。
【0049】
【数6】
【0050】したがって、NとMには、次の表1のよう
な関係がある。
【0051】
【表1】
【0052】音声区間の途切れをなくすためには、理論
的には、圧縮率αは、数式7のように設定すればよい。
【0053】
【数7】
【0054】通常の圧縮処理では、音声圧縮部31に入
力される所定単位の波形(音声のピッチ周期単位の波形
または固定長単位の波形)の入力個数と、音声圧縮部3
1から出力される所定単位の波形の出力個数との比が次
の数式8または数式9となるように、間引き処理が行な
われる。
【0055】
【数8】
【0056】
【数9】
【0057】数式8および9において、ここでmは正の
整数であり、Lは任意の数とする。圧縮率は、出力個数
/入力個数で表される。音声のピッチ周期または固定長
の周期をTとすると、数式8では、(L+m)T個のデ
ータからmT個のデータを間引いて、LT個のデータを
生成することになる。数式9では、LT個のデータから
mT個のデータを間引いて、(L−m)T個のデータを
生成することになる。
【0058】ここでは、音声圧縮部31において数式9
による間引き処理が行なわれるものとする。m=1の場
合には、LT個のデータからT個のデータを間引いて、
(L−1)T個のデータを生成することになる。この場
合の圧縮率αは、数式10で表される。
【0059】
【数10】
【0060】したがって、データ入力個数と、データ出
力個数とは、数式11で表される。
【0061】
【数11】
【0062】したがって、データ入力個数T/(1−
α)を規定ビット数内の2進数として実現できれば、圧
縮率αでの圧縮処理が行なえることになる。周期Tをピ
ッチ周期とすると、音声のピッチ周期T(Tは正の整
数)は入力される音声により変化するので、1/(1−
α)を規定ビット数内の2進数として実現できれば、圧
縮率αでの圧縮処理が行なえることになる。
【0063】たとえば、表1の各再生速度倍率Mにおけ
る1/(1−α)は、次の表2のようになる。
【0064】
【表2】
【0065】規定ビット数を16ビットとすると、1/
(1−α)を、16ビットの2進数で表すことができれ
ば、圧縮率αでの圧縮処理が行なえることになる。ここ
で、再生速度倍率Mを表1の再生速度倍率Mの範囲内と
すると、1/(1−α)は、次の数式10の範囲内で、
16ビットの2進数で表すことを試みる。
【0066】
【数12】
【0067】ところで、16ビット長の固定小数点演算
においては、次のような表現形式が用いられる。
【0068】(1)第1の表現形式:最上位桁は、正負
を表すために用い、その次の7ビットは整数値を表すた
めに用い、下位8ビットは小数部を表すために用いる形
式。この表現形式では、−28 から{28 −(1/
7 )}まで表現できる。
【0069】(2)第2の表現形式:最上位桁は、正負
を表すために用い、下位15ビットは小数部を表すため
に用いる形式。この表現形式では、−1から{1−(1
/215)}まで表現できる。
【0070】(3)第3の表現形式:最上位桁は、正負
を表すために用い、その次の4ビットは整数値を表すた
めに用い、下位11ビットは小数部を表すために用いる
形式。この表現形式では、−24 から{24 −(1/2
11)}まで表現できる。
【0071】(4)第4の表現形式:最上位桁は、正負
を表すために用い、下位15ビットは整数部を表すため
に用いる形式。この表現形式では、−215 から(215
−1)まで表現できる。
【0072】ここでは、第3の表現形式が用いられてい
るものとする。1/(1−α)をこのような表現形式の
2進数で表すと、次の数式13のようになる。
【0073】
【数13】
【0074】{1/(1−α)}×211は、次の数式1
4で表されるようになる。
【0075】
【数14】
【0076】したがって、{1/(1−α)}×211
整数であれば、{1/(1−α)}も16ビットの2進
数で表されることになる。表2の各再生速度倍率Mにつ
いて、検討する。
【0077】M=2、α=1/2であれば、{1/(1
−α)}×211=2048となる。
【0078】M=5/3、α=3/5であれば、{1/
(1−α)}×211=5120となる。
【0079】M=4/5、α=5/4であれば、{1/
(1−α)}×211=10240となる。
【0080】M=10/9、α=9/10であれば、
{1/(1−α)}×211=20480となる。
【0081】したがって、M=2、M=5/3、M=4
/5およびM=10/9の再生速度倍率においては、α
=1/Mとしても、{1/(1−α)}×211の値が整
数となる。したがって、これらの再生速度倍率において
は、音声メモリ4内の未読み出しデータの蓄積量が所定
値に達した場合に、圧縮率α=1/Mとすることによ
り、音声区間の音切れを防止することができる。
【0082】しかしながら、M=10/7、α=7/1
0であれば、{1/(1−α)}×211=(10/3)
×2048=6826.666…となり、整数で表され
なくなる。
【0083】そこで、再生速度倍率10/7に変えて、
{1/(1−α)}×211=6826、または(1−
α)×211=6827となるような再生速度倍率を決定
することが考えられる。
【0084】すなわち、M=1/αであるので、{1/
(1−α)}×2048=6826に相当する再生速度
倍率MAは次式15となり、{1/(1−α)}×20
48=6827に相当する再生速度倍率MBは次式16
となる。
【0085】
【数15】
【0086】
【数16】
【0087】M=fAD/fDAであるので、再生速度倍率
MAの場合には、fAD/fDA=3413/2389とな
り、再生速度倍率MBの場合には、fAD/fDA=682
7/4779となり、いずれの場合も、クロック発振器
から発生したクロック信号に基づいて、このような比率
の周波数信号を生成することは容易でないことは明らか
である。
【0088】そこで、再生速度倍率Mとして10/7が
設定されている場合において、音声メモリ4内の未読み
出しデータの蓄積量が所定値に達した場合には、圧縮率
αは次のような値に設定される。
【0089】すなわち、音声メモリ4内の未読み出しデ
ータの蓄積量が所定値に達した場合には、圧縮率αを1
/M=7/10より小さな値に設定する。6/10<7
/10<6/10であるので、α=6/10、α=7/
10、α=8/10のそれぞれについて、{1/(1−
α)}×211を算出すると、次の数式17に示すように
なる。
【0090】
【数17】
【0091】このようにαが小さくなれば、{1/(1
−α)}×211の値は大きくなる。したがって、圧縮率
αを7/10より小さくするためには、次の数式18を
満たすような整数を選定すればよい。
【0092】
【数18】
【0093】つまり、{1/(1−α)}×211が68
26以下の整数となる圧縮率αが選定される。
【0094】上記は、音声圧縮部31が、入力個数T/
(1−α)を規定ビット数内の2進数として実現できれ
ば、圧縮率αでの圧縮処理が行なえるシステムである場
合について説明したが、音声圧縮部31が、出力個数α
・T/(1−α)を規定ビット数内の2進数として実現
できれば、圧縮率αでの圧縮処理が行なえるシステムで
ある場合には、上述した入力個数を規定ビット数内の2
進数として表現する考え方を、出力個数α・T/(1−
α)に対して適用すればよい。
【0095】また、音声圧縮部31が、入力個数T/
(1−α)および出力個数α・T/(1−α)の両方を
規定ビット数内の2進数として実現できれば、圧縮率α
での圧縮処理が行なえるシステムである場合には、上述
した入力個数を規定ビット数内の2進数として表現する
考え方を、入力個数T/(1−α)および出力個数α・
T/(1−α)の両方に対して適用すればよい。
【0096】なお、この発明は、音声圧縮部31が、圧
縮率αを規定ビット数内の2進数として実現できれば、
圧縮率αでの圧縮処理が行なえるシステムにも適用する
ことができる。圧縮率を規定ビット数内の2進数で表現
できれば、圧縮率×入力個数=出力個数であるので、圧
縮率αでの圧縮処理が容易に行なえることが推測でき
る。表2における圧縮率αの範囲は、数式19で示すよ
うになる。
【0097】
【数19】
【0098】これを、上記第2表現形式の2進数では、
αは次の数式20のように表される。
【0099】
【数20】
【0100】ここで、α×215とすれば、これは次の数
式21で表されるようになる。
【0101】
【数21】
【0102】したがって、α×215が整数であれば、α
も16ビットの2進数で表されることになる。表2の各
再生速度倍率Mについて、検討する。
【0103】M=2、α=1/2であれば、α×215
16384となる。
【0104】M=4/5、α=5/4であれば、α×2
15=40960となる。
【0105】しかしながら、M=10/6(α=3/
5)の場合、M=10/7(α=7/10)の場合、M
=10/9(α=9/10)の場合は、α×215は、整
数とならない。
【0106】M=10/6(α=3/5)の場合には、
α<3/5で、α×215が2進数で表現できる値に、α
は設定される。
【0107】M=10/7(α=7/10)の場合に
は、α<7/10で、α×215が2進数で表現できる値
に、αは設定される。
【0108】M=10/9(α=9/10)の場合に
は、α<9/10で、α×215が2進数で表現できる値
に、αは設定される。
【0109】なお、この発明は、図5、図6および図7
にそれぞれ示すような話速変換装置にも適用することが
できる。
【0110】図5の話速変換装置について説明する。
【0111】入力音声信号は、A/D変換部101に送
られ、ディジタル信号に変換される。A/D変換部10
1の出力は、音声メモリ102を介して区間判別部10
3に送られる。区間判別部103は、所要数の音声デー
タのパワーの平均値、パワーの累積値、振幅平均値、振
幅累積値等に基づいて、入力音声が音声区間であるか、
無音区間であるかを判定する。
【0112】話速制御部104は、音声圧縮部111と
無音削除部112とを備えている。音声区間であると判
定された音声データは、音声圧縮部111によって、圧
縮処理が行なわれる。無音区間であると判定された音声
データは、無音削除部112によって削除される。
【0113】音声圧縮部111によって圧縮処理が行な
われた音声データは、D/A変換部105に送られ、ア
ナログ信号に変換される。
【0114】音声メモリ102内の未読み出しの音声デ
ータの蓄積量は、蓄積量算出部106によって算出され
る。蓄積量算出部106によって算出された蓄積量Sは
圧縮率制御部107に送られる。圧縮率制御部107
は、蓄積量算出部106によって算出された蓄積量Sと
操作部108によって設定されている再生速度倍率Mと
に基づいて、音声圧縮部111で用いられる圧縮率αを
制御する。
【0115】再生速度倍率Mの場合には、A/D変換部
101のサンプリング周波数fADは、D/A変換部10
5のサンプリング周波数fDAのM倍に設定される。一
方、音声圧縮部111で用いられる圧縮率αは、蓄積量
算出部106によって算出された蓄積量が第1の所定値
SHに達するまでは、1/Mより大きな第1設定値(α
>1/M)に設定される。蓄積量算出部106によって
算出された蓄積量が第1の所定値SHに達した場合に
は、音声圧縮部31で用いられる圧縮率αは、1/M以
下の第2の設定値(α≦1/M)に設定される。
【0116】そして、蓄積量算出部106によって算出
された蓄積量が第2の所定値SL(SL<SH)まで低
下すると、音声圧縮部111で用いられる圧縮率αは、
第2の設定値から第1の設定値に戻される。
【0117】図6の話速変換装置について説明する。
【0118】入力音声信号は、A/D変換部201に送
られ、ディジタル信号に変換される。A/D変換部20
1の出力は、区間判別部202に送られる。区間判別部
202は、所要数の音声データのパワーの平均値、パワ
ーの累積値、振幅平均値、振幅累積値等に基づいて、入
力音声が音声区間であるか、無音区間であるかを判定す
る。
【0119】入力音声信号のうち、無音区間であると判
定された音声データは、無音削除部203によって削除
され、音声区間であると判定された音声データは、音声
メモリ204に蓄積される。音声メモリ204に蓄積さ
れたデータは順次読み出され、音声圧縮部205に送ら
れる。音声圧縮部205では圧縮処理が行なわれる。
【0120】音声圧縮部205によって圧縮処理が行な
われた音声データは、D/A変換部206に送られ、ア
ナログ信号に変換される。
【0121】音声メモリ204内の未読み出しの音声デ
ータの蓄積量は、蓄積量算出部207によって算出され
る。蓄積量算出部207によって算出された蓄積量Sは
圧縮率制御部208に送られる。圧縮率制御部208
は、蓄積量算出部207によって算出された蓄積量Sと
操作部209によって設定されている再生速度倍率Mと
に基づいて、音声圧縮部205で用いられる圧縮率αを
制御する。
【0122】再生速度倍率Mの場合には、A/D変換部
201のサンプリング周波数fADは、D/A変換部20
6のサンプリング周波数fDAのM倍に設定される。一
方、音声圧縮部205で用いられる圧縮率αは、蓄積量
算出部207によって算出された蓄積量が第1の所定値
SHに達するまでは、1/Mより大きな第1設定値(α
>1/M)に設定される。蓄積量算出部207によって
算出された蓄積量が第1の所定値SHに達した場合に
は、音声圧縮部205で用いられる圧縮率αは、1/M
以下の第2の設定値(α≦1/M)に設定される。
【0123】そして、蓄積量算出部207によって算出
された蓄積量が第2の所定値SL(SL<SH)まで低
下すると、音声圧縮部205で用いられる圧縮率αは、
第2の設定値から第1の設定値に戻される。
【0124】図7の話速変換装置について説明する。
【0125】入力音声信号は、A/D変換部301に送
られ、ディジタル信号に変換される。A/D変換部30
1の出力は、音声圧縮部302に送られて圧縮処理され
る。音声圧縮部302によって圧縮処理が行なわれた音
声データは、音声メモリ303に蓄積される。
【0126】音声メモリ303から読み出された音声デ
ータは、区間判別部304に送られる。区間判別部30
4は、所要数の音声データのパワーの平均値、パワーの
累積値、振幅平均値、振幅累積値等に基づいて、入力音
声が音声区間であるか、無音区間であるかを判定する。
【0127】音声メモリ303から読み出された音声デ
ータのうち、無音区間であると判定された音声データ
は、無音削除部305によって削除され、音声区間であ
ると判定された音声データは、D/A変換部306に送
られ、アナログ信号に変換される。
【0128】音声メモリ303内の未読み出しの音声デ
ータの蓄積量は、蓄積量算出部307によって算出され
る。蓄積量算出部307によって算出された蓄積量Sは
圧縮率制御部308に送られる。圧縮率制御部308
は、蓄積量算出部307によって算出された蓄積量Sと
操作部309によって設定されている再生速度倍率Mと
に基づいて、音声圧縮部302で用いられる圧縮率αを
制御する。
【0129】再生速度倍率Mの場合には、A/D変換部
301のサンプリング周波数fADは、D/A変換部30
6のサンプリング周波数fDAのM倍に設定される。一
方、音声圧縮部302で用いられる圧縮率αは、蓄積量
算出部307によって算出された蓄積量が第1の所定値
SHに達するまでは、1/Mより大きな第1設定値(α
>1/M)に設定される。蓄積量算出部307によって
算出された蓄積量が第1の所定値SHに達した場合に
は、音声圧縮部302で用いられる圧縮率αは、1/M
以下の第2の設定値(α≦1/M)に設定される。
【0130】そして、蓄積量算出部307によって算出
された蓄積量が第2の所定値SL(SL<SH)まで低
下すると、音声圧縮部302で用いられる圧縮率αは、
第2の設定値から第1の設定値に戻される。上述した規
定ビット数の2進数表現については、16ビット固定小
数点表現について説明したが、16ビット以外の規定ビ
ット数の固定小数点表現を用いてもよい。また、規定ビ
ット数の浮動小数点表現を用いてもよい。
【0131】
【発明の効果】この発明によれば、音声メモリ内の未読
み出しの音声データの蓄積量が所定量を越えたときに、
再生速度倍率分の1の圧縮率で圧縮処理を行なうことが
できない場合においても、音声メモリ内の未読み出しの
音声データの蓄積量が音声メモリの容量を越えないよう
にすることができるようになる。
【図面の簡単な説明】
【図1】話速変換装置の構成を示すブロック図である。
【図2】PICOLAを用いた時間軸圧縮伸長法を説明
するための模式図である。
【図3】n=1/2の場合(fAD/fDA=2の場合)に
おいて、A/D変換された音声データをそのままD/A
変換して出力した場合の、A/D変換されたディジタル
データおよびD/A変換されたディジタルデータを示す
タイムチャートである。
【図4】n=1/2の場合(fAD/fDA=2の場合)に
おいて、入力音声の話速と出力音声の話速を同じにする
ために、A/D変換された音声データを1個ずつ間引い
た場合の、A/D変換されたディジタルデータおよびD
/A変換されたディジタルデータを示すタイムチャート
である。
【図5】話速変換装置の他の例を示すブロック図であ
る。
【図6】話速変換装置のさらに他の例を示すブロック図
である。
【図7】話速変換装置のさらに他の例を示すブロック図
である。
【符号の説明】
1、101、201、301 A/D変換部 31、111、205、302 音声圧縮部 4、102、204、303 音声メモリ 5、105、206、306 D/A変換部 6、106、207、307 蓄積量算出部 7、107、208、308 圧縮率制御部 8、108、209、309 操作部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 1より大きな再生速度倍率で再生が行な
    われる際に、入力音声信号のうち、少なくとも音声区間
    の信号を圧縮処理することにより、入力音声の話速を遅
    くさせる話速変換手段と、話速変換手段の前段、後段ま
    たは内部に設けられ、入力音声の話速を遅くして出力す
    る際に生じる遅延量を吸収するために音声データを蓄積
    される音声メモリとを備えた話速変換装置において、 音声メモリ内の未読み出しの音声データの蓄積量を算出
    する蓄積量算出手段、ならびに、 音声メモリ内の未読み出しの音声データの蓄積量が所定
    値を越えた時に、話速変換手段で用いられる圧縮率を、
    原則的には、再生速度倍率分の1の値に設定し、圧縮率
    を再生速度倍率分の1とした場合に、圧縮処理が不可能
    である場合には、話速変換手段で用いられる圧縮率を、
    再生速度倍率分の1より小さな圧縮率で圧縮処理可能な
    値に設定する手段、 を備えていることを特徴とする話速変換装置。
  2. 【請求項2】 圧縮処理が不可能である場合とは、αを
    圧縮率、データ入力個数をP、データ出力個数をQと
    て、圧縮率αをα=Q/Pで定義した場合に、データ入
    力個数Pが規定ビット数の2進数で表現できない場合を
    いい、この場合には、データ入力個数Pが規定ビット数
    の2進数で表現できるような圧縮率であって、かつ1/
    Mより小さな圧縮率に、圧縮率が設定される請求項1に
    記載の話速変換装置。
  3. 【請求項3】 圧縮処理が不可能である場合とは、αを
    圧縮率、データ入力個数をP、データ出力個数をQと
    て、圧縮率αをα=Q/Pで定義した場合に、データ入
    力個数Qが規定ビット数の2進数で表現できない場合を
    いい、この場合には、データ入力個数Qが規定ビット数
    の2進数で表現できるような圧縮率であって、かつ1/
    Mより小さな圧縮率に、圧縮率が設定される請求項1に
    記載の話速変換装置。
  4. 【請求項4】 圧縮処理が不可能である場合とは、αを
    圧縮率、データ入力個数をP、データ出力個数をQと
    て、圧縮率αをα=Q/Pで定義した場合に、データ入
    力個数PおよびQが規定ビット数の2進数で表現できな
    い場合をいい、この場合には、データ入力個数Pおよび
    Qが規定ビット数の2進数で表現できるような圧縮率で
    あって、かつ1/Mより小さな圧縮率に、圧縮率が設定
    される請求項1に記載の話速変換装置。
  5. 【請求項5】 圧縮処理が不可能である場合とは、αを
    圧縮率、データ入力個数をP、データ出力個数をQと
    て、圧縮率αをα=Q/Pで定義した場合に、圧縮率α
    が規定ビット数の2進数で表現できない場合をいい、こ
    の場合には、圧縮率αが規定ビット数の2進数で表現で
    きるような圧縮率であってかつ1/Mより小さな圧縮率
    に、圧縮率が設定される請求項1に記載の話速変換装
    置。
  6. 【請求項6】 規定ビット数の2進数の表現形式は、固
    定小数点表現および浮動小数点表現のうちから選択され
    た任意の表現形式である請求項2、3、4および5のい
    ずれかに記載の話速変換装置。
JP9019359A 1997-01-31 1997-01-31 話速変換装置 Pending JPH10222806A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9019359A JPH10222806A (ja) 1997-01-31 1997-01-31 話速変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9019359A JPH10222806A (ja) 1997-01-31 1997-01-31 話速変換装置

Publications (1)

Publication Number Publication Date
JPH10222806A true JPH10222806A (ja) 1998-08-21

Family

ID=11997184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9019359A Pending JPH10222806A (ja) 1997-01-31 1997-01-31 話速変換装置

Country Status (1)

Country Link
JP (1) JPH10222806A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001053835A (ja) * 1999-05-28 2001-02-23 Sanyo Electric Co Ltd 話速変換装置を備えた通話装置
WO2002013196A3 (en) * 2000-08-10 2002-04-11 Thomson Licensing Sa Memory addressing method suitable for systems having a variable speed data reproduction capability
WO2003001510A1 (fr) * 2001-06-21 2003-01-03 Sony Corporation Appareil et procede de traitement de signaux numeriques et systeme de reproduction/reception de signaux numeriques
WO2006129917A3 (en) * 2005-04-22 2007-03-01 Lg Electronics Inc Method and apparatus for reproducing data and method for transmitting data

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001053835A (ja) * 1999-05-28 2001-02-23 Sanyo Electric Co Ltd 話速変換装置を備えた通話装置
WO2002013196A3 (en) * 2000-08-10 2002-04-11 Thomson Licensing Sa Memory addressing method suitable for systems having a variable speed data reproduction capability
JP2004506244A (ja) * 2000-08-10 2004-02-26 トムソン ライセンシング ソシエテ アノニム 可変速度データ再生機能を備えたシステム用のメモリアドレス指定方法
US7978959B2 (en) 2000-08-10 2011-07-12 Thomsong Licensing Memory addressing method suitable for systems having a variable speed data reproduction capability
WO2003001510A1 (fr) * 2001-06-21 2003-01-03 Sony Corporation Appareil et procede de traitement de signaux numeriques et systeme de reproduction/reception de signaux numeriques
WO2006129917A3 (en) * 2005-04-22 2007-03-01 Lg Electronics Inc Method and apparatus for reproducing data and method for transmitting data

Similar Documents

Publication Publication Date Title
JP4675692B2 (ja) 話速変換装置
WO1993002446A1 (en) Method for time-scale modification of signals
JPH04506575A (ja) 長時間予測子を有する適応変換コード化装置
EP1309965B1 (en) Method and system for enabling audio speed conversion
US4716591A (en) Speech synthesis method and device
JPH10222806A (ja) 話速変換装置
JP2000075862A (ja) 波形信号の時間軸圧縮伸長装置
JPS5982608A (ja) 音声の再生速度制御方式
JPH07199996A (ja) 波形データ符号化装置、波形データ符号化方法、波形データ復号装置、及び波形データ符号化/復号装置
JP3373933B2 (ja) 話速変換装置
JPH09152889A (ja) 話速変換装置
JP3357742B2 (ja) 話速変換装置
JPH0845177A (ja) 話速変換装置
JP3147562B2 (ja) 音声速度変換方法
JPH10214098A (ja) 音声変換玩具
JP2860991B2 (ja) 音声蓄積再生装置
JPS5968793A (ja) 音声合成装置
JPH0235320B2 (ja)
JP3249012B2 (ja) 音声符号化装置
JPH05252121A (ja) 音声符号化処理回路
JPS5914760B2 (ja) Adpcm再生器
JP3787986B2 (ja) 音波形データ圧縮・復元方式とその動作を実行するためのプログラムを記録した記録媒体
JPH10224898A (ja) 補聴器
JPH0713585A (ja) 音声区間切出し装置
JPH0679239B2 (ja) 音声合成器

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20031222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040315

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040413