JPH07181998A - 音声時間軸圧縮方法及び伸長方法 - Google Patents

音声時間軸圧縮方法及び伸長方法

Info

Publication number
JPH07181998A
JPH07181998A JP5327898A JP32789893A JPH07181998A JP H07181998 A JPH07181998 A JP H07181998A JP 5327898 A JP5327898 A JP 5327898A JP 32789893 A JP32789893 A JP 32789893A JP H07181998 A JPH07181998 A JP H07181998A
Authority
JP
Japan
Prior art keywords
waveform
voice signal
pointer
voice
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5327898A
Other languages
English (en)
Other versions
JP2951181B2 (ja
Inventor
Tatsuo Inoue
健生 井上
Shozo Sugishita
正蔵 杉下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP5327898A priority Critical patent/JP2951181B2/ja
Priority to KR1019940022599A priority patent/KR100372208B1/ko
Publication of JPH07181998A publication Critical patent/JPH07181998A/ja
Priority to US08/888,527 priority patent/US5781885A/en
Application granted granted Critical
Publication of JP2951181B2 publication Critical patent/JP2951181B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

(57)【要約】 【目的】 圧縮伸長率が1に近い時でもずれや歪みの小
さい音声波形が得られる音声圧縮伸長方式を開発する。 【構成】 音声信号の圧縮時において、入力された音声
信号波形の現在のポインタの位置P1と該ポインタに対
して1ピッチ周期だけ進んだ位置P2との両方から夫々
前記ピッチ周期の2倍以上且つ整数倍の長さの音声信号
波形F、Gを切り出し、切り出された一対の音声信号波
形を適当な重みW1、W2をつけて加算し、前記2つの
音声信号波形を圧縮した1つの信号波形Eを生成し、次
に前記現在ポインタP1を圧縮率に応じて前記入力され
た音声信号波形上で移動せしめてポインタP4として同
様の操作を行い圧縮された音声信号を得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、放送、映画、音楽にお
いて、音声を処理する場合の発声速度を制御する音声の
発声速度変換方法、及び音声ICレコーダ等に用いられ
るデジタルの音声信号を主として符号化する音声の時間
軸圧縮あるいは伸長方法に関する。
【0002】
【従来の技術】従来デジタルの音声信号を時間軸圧縮あ
るいは伸長する方法として、IEEE Trans.Acoust.Speec
h,Signal Processing,vol.ASSP-27,pp.121-133,Apr.'79
"Time-domain algorithms for harmonic bandwidth re
duction and time scaling of speech signals" D.Mala
h著に開示されたTDHS(Tme-Domain Harmonic Scali
ng)や「自己相関法による音声の時間軸での伸縮方式と
その評価」電子通信学会春季講演予稿集pp.9-16,1986.
5.21 森田直孝、 板倉文忠著に開示されたPICOLA
(Pointer Interval Control OverLap and Add)等が提
唱されている。
【0003】前記TDHSでは、音声波形に対して予め
ピッチ抽出器を用いて抽出されたピッチ周期をT、圧縮
率(あるいは伸長率)をrとするとき、図7(a)の波
形図に示すように現在のポインタ位置P1と、これに対
してピッチ周期Tだけ進んだ時点P2から夫々長さN
c
【0004】
【数1】
【0005】の音声波形A及びBを切り出し、波形Aに
は1から0へ直線的に向かう重み(図中破線F1で示す
窓関数)を、一方の波形Bには逆に0から1へ直線的に
向かう重み(図中破線F2で示す窓関数)を付与して、
両者を加え合わせることにより長さNc の波形Cを得
る。次にポインタを前記入力波形(図7(a))上で、
【0006】
【数2】
【0007】だけ移動して、前記と同様にピッチ周期T
の2つの波形を切り出し、これらに重みをつけて加え合
わせることにより、次の長さNc の波形を得る。以後こ
の操作を繰り返すことにより長さNc +Tの入力波形か
ら長さNc の出力波形が連続して作り出される。しかも
この長さNc の波形は長さNc +Tの入力波形に対して
圧縮率rを満足したものとなっている。
【0008】一方、伸長の場合には図8(a)(b)の
波形図に示すように現在のポインタ位置P1とこれに対
してピッチ周期Tだけ遅れた時点P4から夫々長さN
s
【0009】
【数3】
【0010】の音声波形A及びBを切り出し、波形Aに
は0から1へ直線的に向かう重み(図中破線F3で示す
窓関数)を、一方の波形Bには逆に1から0へ直線的に
向かう重み(図中破線F4で示す窓関数)を付与して、
両者を加え合わせることにより長さNs の波形Cを得
る。次にポインタを前記入力波形(図8(a))上で、
【0011】
【数4】
【0012】だけ移動して、前記と同様にピッチ周期T
の2つの波形を切り出し、これらに重みを付けて加え合
わせることにより、次の長さNs の波形を得る。以後こ
の操作を繰り返すことにより長さNs −Tの入力波形に
対し伸長率rの出力波形が連続して得られる。しかもこ
の長さNs の波形は長さNs −Tの入力波形に対して伸
長率rを満足したものとなっている。
【0013】ところでかかるTDHSを時間軸の圧縮あ
るいは伸長に適用すると、上述のように圧縮率あるいは
伸長率rが1に近い場合、波形長Nc やNs がピッチ周
期Tよりも大きくなり過ぎてしまい、加え合わせる音声
波形内でピッチ周期の揺らぎによる波形のずれが生じ、
歪みの原因になるという問題点があった。
【0014】
【発明が解決しようとする課題】本発明は、上記のよう
にTDHSを時間軸の圧縮あるいは伸長に適用すると圧
縮率(あるいは伸長率)rが1に近い場合、Nc やNs
がTより大きく加え合わせる音声波形内でピッチ周期の
揺らぎによる波形のずれが生じ、歪みの原因となるとい
う従来の問題点に鑑み、圧縮率(あるいは伸長率)が1
に近い時でもずれや歪みの小さい音声波形が得られる音
声圧縮及び伸長方式を開発することを目的とする。
【0015】
【課題を解決するための手段】本発明は、音声信号の圧
縮時において、入力された音声信号波形の現在のポイン
タの位置と該ポインタに対して1ピッチ周期だけ進んだ
位置との両方から夫々前記ピッチ周期の2倍以上且つ整
数倍の長さの音声信号波形を切り出し、切り出された一
対の音声信号波形を適当な重みをつけて加算し、前記2
つの音声信号波形を圧縮した1つの信号波形を生成し、
次に前記現在ポインタを圧縮率に応じて前記入力された
音声信号波形上あるいは生成された音声信号上で移動せ
しめて同様の操作を行い圧縮された音声信号を得るもの
である。
【0016】また本発明は、音声信号の伸長時におい
て、入力された音声信号波形の現在のポインタの位置と
該ポインタに対して1ピッチ周期だけ遅れた位置との両
方から夫々前記ピッチ周期の2倍以上で且つ整数倍の長
さの音声信号波形を切り出し、切り出された一対の音声
信号波形を適当な重みをつけて加算し、前記2つの音声
信号波形を合成した1つの信号波形を生成し、次に前記
現在ポインタを伸長率に応じて前記入力された音声信号
波形上あるいは生成された音声信号上で移動せしめて同
様の操作を行い伸長された音声信号を得るものである。
【0017】
【作用】上記構成によると、加え合わせる音声波形の長
さは、圧縮率あるいは伸長率に関わり無くピッチ周期の
2倍以上で且つ整数倍の長さであり、ポインタの移動量
によって圧縮率あるいは伸長率の調整が行われるため、
常に最も似通った波形同士が加え合わされ、圧縮率ある
いは伸長率が1に近づくに従って得られた音声信号の歪
みは小さくなる。
【0018】
【実施例】以下本発明の音声時間軸圧縮方法及び伸長方
法をその一実施例について図面に基づいて詳細に説明す
る。 [圧縮方法]対応図は図1〜図3 図1は当該圧縮方法を実現する回路ブロック図を示す。
【0019】図1においてアナログ音声信号s(t)は
A/D変換器1によりデジタル音声データs(n)に変
換される。次にピッチ抽出器2によりデジタル音声デー
タs(n)のピッチ周期Tが抽出され、抽出されたピッ
チ情報を用いて時間軸圧縮器3により音声データs
(n)の時間軸圧縮が行われ、結果として圧縮されたデ
ジタル音声信号sc(n)を得る。
【0020】そして前記ピッチ周期情報Tと圧縮された
音声信号sc(n)をD/A変換器4に送り、ここでアナ
ログ音声信号s’(t)に変換して出力する。
【0021】以下に前記図1における時間軸圧縮器3の
詳細な働きを図2(a)(b)及び図3(a)(b)を
用いて説明する。
【0022】前記時間軸圧縮器3では図2(a)に示す
ように、夫々現在のポインタP1と、これに対してピッ
チ周期Tだけ進んだ時点P2から、夫々長さ2Tの音声
波形F(音声波形A+音声波形B、即ちポインタP1〜
P3の区間)及び音声波形G(音声波形B+音声波形
C、即ちポインタP2〜P4の区間)を切り出し、波形
Fには1から0へ向かう重み(窓関数W1)をつけ、波
形Gには逆に0から1へ向かう重み(窓関数W2)をつ
けてこれら両波形を加え合わせ、長さ2Tの音声波形E
を得る(図2(b)参照)。なお、ここでの重みW1、
W2は音声波形Eの前後の接続点での波形の連続性を保
つために設けたものである。
【0023】次に図2のLc を、
【0024】
【数5】
【0025】とするとき、Lc ≧2Tのときには前記図
2(a)の入力音声上でT+Lc だけポインタを移動さ
せてポインタP5として上記と同様の操作を行う。この
時の出力は前記波形Eとこれに続くP4からP5までの
長さLc −2Tの入力波形をそのまま出力することにな
る。
【0026】一方Lc <2Tのときは図3(a)に示す
入力音声上でポインタP1からT+Lc だけ右にポイン
タを移動させてポインタP6として図2(a)と同様の
操作を行う。この時の出力は波形Eの前半の長さLc
部分のみとなり、残りの2T−Lc の部分は次の処理に
再び用いられるため入力側へ戻される。
【0027】以上の操作によって長さT+Lc の入力波
形から長さLc の出力波形が作られ、これは音声信号の
圧縮率rを満足するものとなっている。なお、図2
(a)(b)は圧縮率r=3/4、図3(a)(b)は
圧縮率r=3/5の場合を夫々示しており、双方とも圧
縮波形を切り出す波形長はピッチ周期の2倍の場合を示
している。
【0028】もちろん切り出す波形は2倍以上の整数倍
であれば良くこの実施例に限られるものではないことは
言うまでもない。 [伸長方法]対応図は図4〜図6 図4は当該伸長方法を実現する回路ブロック図を示す。
【0029】図4においてアナログ音声信号s(t)は
A/D変換器1によりデジタル音声データs(n)に変
換される。次にピッチ抽出器2によりデジタル音声デー
タs(n)のピッチ周期Tが抽出され、抽出されたピッ
チ情報を用いて時間軸伸長器5により音声データs
(n)の時間軸伸長が行われ、結果として伸長されたデ
ジタル音声信号se(n)を得る。
【0030】そして前記ピッチ周期情報Tと伸長された
音声信号se(n)をD/A変換器4に送り、ここでアナ
ログ音声信号s’(t)に変換して出力する。
【0031】以下に前記図4における時間軸伸長器5の
詳細な働きを図5(a)(b)及び図6(a)(b)を
用いて説明する。
【0032】前記時間軸伸長器5では図5(a)に示す
ように、現在のポインタP1と、このポインタP1に対
してピッチ周期Tだけ遅れた時点P4から夫々長さ2T
の音声波形F(波形A+波形B、即ちポインタP4〜P
2の区間)及び音声波形G(波形B+波形C、即ちポイ
ンタP1〜P3の区間)を切り出し、波形Fには0から
1へ向かう重みW3を、波形Gには1から0へ向かう重
みW4をつけて加え合わせ、図5(b)に示す長さ2T
の音声波形Hを作成する。この時の重みW3、W4は前
記時間軸圧縮器3の場合と同様に音声波形Hの前後の接
続点での連続性を保つために設けるものである。
【0033】そしてLs
【0034】
【数6】
【0035】とするとき、Ls ≧Tの時は前記図5
(a)の入力音声上でLs だけ移動させてポインタP3
として同様の操作を行う。この時の出力は波形Hとこれ
に続くポインタP2〜P3までの長さLs −Tの入力波
形(波形C)をそのまま出力する。一方、Ls <Tのと
きは図6(a)の入力音声上でポインタP1からLs
けポインタを移動させて、ポインタP5として上記と同
様の操作を行う。この時の出力は、波形Hの前半の長さ
T+Ls の部分のみとなり、残りのT−Ls の部分は次
の処理に再び用いられるため、入力側に戻される。
【0036】以上の操作によって長さLs の入力波形か
ら長さT+Ls の出力波形が作られており、伸長率rが
満足されていることが解る。なお、図5(a)(b)は
伸長率r=3/2の場合を示しており、図6(a)
(b)は伸長率r=3の場合で共に伸長波形を作る時に
切り出す波形長はピッチ周期の2倍の場合を示してい
る。もちろん切り出す波形は2倍以上の整数倍であれば
良くこの実施例に限られるものではないことは言うまで
もない。
【0037】
【発明の効果】本発明の時間軸圧縮方法及び伸長方法に
よると、圧縮時または伸長時に加え合わせる音声波形の
長さは圧縮率あるいは伸長率に関わり無くピッチ周期の
2倍以上の整数倍の長さであり、ポインタの移動量によ
って圧縮あるいは伸長の調整が行われるため、ピッチ周
期の揺らぎによる波形のずれが抑えられ、結果的に圧縮
あるいは伸長時の音声波形の歪みが小さくなる効果が期
待できる。
【0038】また従来の方法と比較して圧縮率あるいは
伸長率が1に近づくに従って歪みが小さくなる効果も期
待できる。
【図面の簡単な説明】
【図1】本発明の時間軸圧縮方法を実現するブロック回
路図である。
【図2】本発明方法による圧縮時(LC ≧2T)の入力
波形(a)及び出力波形(b)を示す図である。
【図3】本発明方法による圧縮時(Lc <2T)の入力
波形(a)及び出力波形(b)を示す図である。
【図4】本発明の時間軸伸長方法を実現するブロック回
路図である。
【図5】本発明方法による伸長時(Ls ≧T)の入力波
形(a)及び出力波形(b)を示す図である。
【図6】本発明方法による伸長時(Ls <T)の入力波
形(a)及び出力波形(b)を示す図である。
【図7】図2、図3に対応する従来方法の図である。
【図8】図5、図6に対応する従来方法の図である。
【符号の説明】
1 A/D変換器 2 ピッチ抽出器 3 時間軸圧縮器 4 D/A変換器 5 時間軸伸長器

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 音声信号の圧縮時において、入力された
    音声信号波形の現在のポインタの位置と該ポインタに対
    して1ピッチ周期だけ進んだ位置との両方から夫々前記
    ピッチ周期の2倍以上で且つ整数倍の長さの音声信号波
    形を切り出し、切り出された一対の音声信号波形を適当
    な重みをつけて加算し、前記2つの音声信号波形を圧縮
    した1つの信号波形を生成し、次に前記現在ポインタを
    圧縮率に応じて前記入力された音声信号波形上で移動せ
    しめて同様の操作を行い圧縮された音声信号を得ること
    を特徴とする音声時間軸圧縮方法。
  2. 【請求項2】 音声信号の伸長時において、入力された
    音声信号波形の現在のポインタの位置と該ポインタに対
    して1ピッチ周期だけ遅れた位置との両方から夫々前記
    ピッチ周期の2倍以上で且つ整数倍の長さの音声信号波
    形を切り出し、切り出された一対の音声信号波形を適当
    な重みをつけて加算し、前記2つの音声信号波形を合成
    した1つの信号波形を生成し、次に前記現在ポインタを
    伸長率に応じて前記入力された音声信号波形上で移動せ
    しめて同様の操作を行い伸長された音声信号を得ること
    を特徴とする音声時間軸伸長方法。
JP5327898A 1993-09-09 1993-12-24 音声時間軸圧縮装置及び音声時間軸伸長装置、並びに音声時間軸圧縮伸長装置 Expired - Lifetime JP2951181B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP5327898A JP2951181B2 (ja) 1993-12-24 1993-12-24 音声時間軸圧縮装置及び音声時間軸伸長装置、並びに音声時間軸圧縮伸長装置
KR1019940022599A KR100372208B1 (ko) 1993-09-09 1994-09-08 음성신호의시간축압축/신장방법
US08/888,527 US5781885A (en) 1993-09-09 1997-07-07 Compression/expansion method of time-scale of sound signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5327898A JP2951181B2 (ja) 1993-12-24 1993-12-24 音声時間軸圧縮装置及び音声時間軸伸長装置、並びに音声時間軸圧縮伸長装置

Publications (2)

Publication Number Publication Date
JPH07181998A true JPH07181998A (ja) 1995-07-21
JP2951181B2 JP2951181B2 (ja) 1999-09-20

Family

ID=18204231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5327898A Expired - Lifetime JP2951181B2 (ja) 1993-09-09 1993-12-24 音声時間軸圧縮装置及び音声時間軸伸長装置、並びに音声時間軸圧縮伸長装置

Country Status (1)

Country Link
JP (1) JP2951181B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7613609B2 (en) 2003-04-09 2009-11-03 Sony Corporation Apparatus and method for encoding a multi-channel signal and a program pertaining thereto
US8364475B2 (en) 2008-12-09 2013-01-29 Fujitsu Limited Voice processing apparatus and voice processing method for changing accoustic feature quantity of received voice signal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7613609B2 (en) 2003-04-09 2009-11-03 Sony Corporation Apparatus and method for encoding a multi-channel signal and a program pertaining thereto
US8364475B2 (en) 2008-12-09 2013-01-29 Fujitsu Limited Voice processing apparatus and voice processing method for changing accoustic feature quantity of received voice signal

Also Published As

Publication number Publication date
JP2951181B2 (ja) 1999-09-20

Similar Documents

Publication Publication Date Title
US5630013A (en) Method of and apparatus for performing time-scale modification of speech signals
US6173255B1 (en) Synchronized overlap add voice processing using windows and one bit correlators
US20020133334A1 (en) Time scale modification of digitally sampled waveforms in the time domain
EP0726560B1 (en) Variable speed playback system
JP2976860B2 (ja) 再生装置
JPS623439B2 (ja)
KR100372208B1 (ko) 음성신호의시간축압축/신장방법
CN100555876C (zh) 声信号处理装置和方法
JP3465628B2 (ja) オーディオ信号の時間軸圧伸方法及び装置
Makhoul et al. Time-scale modification in medium to low rate speech coding
JPH07181998A (ja) 音声時間軸圧縮方法及び伸長方法
JPH0777999A (ja) 音声時間軸圧縮伸長方法
JP2001255882A (ja) 音声信号処理装置及びその信号処理方法
JP4643914B2 (ja) 音声合成方法および装置
JP3147562B2 (ja) 音声速度変換方法
JPH1078791A (ja) ピッチ変換器
JP3213388B2 (ja) 時間軸圧縮伸長方法
JPH07302097A (ja) 音声の時間軸圧縮方法、及び伸長方法、並びに音声の時間軸圧縮伸長方法
JPH0266598A (ja) 音声信号圧縮伸張装置
JP2709198B2 (ja) 音声合成方法
JP4437703B2 (ja) 話速変換方法および装置
JPS60262200A (ja) スペクトルパラメ−タ補間方法
KR100445342B1 (ko) 듀얼 에스오엘에이 알고리듬을 이용한 음성속도변환방법및 시스템
JPH10187180A (ja) 楽音発生装置
JPS594719B2 (ja) 音声合成用基本周期波形生成法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090709

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090709

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100709

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100709

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110709

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120709

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 14

EXPY Cancellation because of completion of term