JPH07181998A - 音声時間軸圧縮方法及び伸長方法 - Google Patents
音声時間軸圧縮方法及び伸長方法Info
- Publication number
- JPH07181998A JPH07181998A JP5327898A JP32789893A JPH07181998A JP H07181998 A JPH07181998 A JP H07181998A JP 5327898 A JP5327898 A JP 5327898A JP 32789893 A JP32789893 A JP 32789893A JP H07181998 A JPH07181998 A JP H07181998A
- Authority
- JP
- Japan
- Prior art keywords
- waveform
- voice signal
- pointer
- voice
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Abstract
さい音声波形が得られる音声圧縮伸長方式を開発する。 【構成】 音声信号の圧縮時において、入力された音声
信号波形の現在のポインタの位置P1と該ポインタに対
して1ピッチ周期だけ進んだ位置P2との両方から夫々
前記ピッチ周期の2倍以上且つ整数倍の長さの音声信号
波形F、Gを切り出し、切り出された一対の音声信号波
形を適当な重みW1、W2をつけて加算し、前記2つの
音声信号波形を圧縮した1つの信号波形Eを生成し、次
に前記現在ポインタP1を圧縮率に応じて前記入力され
た音声信号波形上で移動せしめてポインタP4として同
様の操作を行い圧縮された音声信号を得る。
Description
いて、音声を処理する場合の発声速度を制御する音声の
発声速度変換方法、及び音声ICレコーダ等に用いられ
るデジタルの音声信号を主として符号化する音声の時間
軸圧縮あるいは伸長方法に関する。
るいは伸長する方法として、IEEE Trans.Acoust.Speec
h,Signal Processing,vol.ASSP-27,pp.121-133,Apr.'79
"Time-domain algorithms for harmonic bandwidth re
duction and time scaling of speech signals" D.Mala
h著に開示されたTDHS(Tme-Domain Harmonic Scali
ng)や「自己相関法による音声の時間軸での伸縮方式と
その評価」電子通信学会春季講演予稿集pp.9-16,1986.
5.21 森田直孝、 板倉文忠著に開示されたPICOLA
(Pointer Interval Control OverLap and Add)等が提
唱されている。
ピッチ抽出器を用いて抽出されたピッチ周期をT、圧縮
率(あるいは伸長率)をrとするとき、図7(a)の波
形図に示すように現在のポインタ位置P1と、これに対
してピッチ周期Tだけ進んだ時点P2から夫々長さN
c 、
は1から0へ直線的に向かう重み(図中破線F1で示す
窓関数)を、一方の波形Bには逆に0から1へ直線的に
向かう重み(図中破線F2で示す窓関数)を付与して、
両者を加え合わせることにより長さNc の波形Cを得
る。次にポインタを前記入力波形(図7(a))上で、
の2つの波形を切り出し、これらに重みをつけて加え合
わせることにより、次の長さNc の波形を得る。以後こ
の操作を繰り返すことにより長さNc +Tの入力波形か
ら長さNc の出力波形が連続して作り出される。しかも
この長さNc の波形は長さNc +Tの入力波形に対して
圧縮率rを満足したものとなっている。
波形図に示すように現在のポインタ位置P1とこれに対
してピッチ周期Tだけ遅れた時点P4から夫々長さN
s 、
は0から1へ直線的に向かう重み(図中破線F3で示す
窓関数)を、一方の波形Bには逆に1から0へ直線的に
向かう重み(図中破線F4で示す窓関数)を付与して、
両者を加え合わせることにより長さNs の波形Cを得
る。次にポインタを前記入力波形(図8(a))上で、
の2つの波形を切り出し、これらに重みを付けて加え合
わせることにより、次の長さNs の波形を得る。以後こ
の操作を繰り返すことにより長さNs −Tの入力波形に
対し伸長率rの出力波形が連続して得られる。しかもこ
の長さNs の波形は長さNs −Tの入力波形に対して伸
長率rを満足したものとなっている。
るいは伸長に適用すると、上述のように圧縮率あるいは
伸長率rが1に近い場合、波形長Nc やNs がピッチ周
期Tよりも大きくなり過ぎてしまい、加え合わせる音声
波形内でピッチ周期の揺らぎによる波形のずれが生じ、
歪みの原因になるという問題点があった。
にTDHSを時間軸の圧縮あるいは伸長に適用すると圧
縮率(あるいは伸長率)rが1に近い場合、Nc やNs
がTより大きく加え合わせる音声波形内でピッチ周期の
揺らぎによる波形のずれが生じ、歪みの原因となるとい
う従来の問題点に鑑み、圧縮率(あるいは伸長率)が1
に近い時でもずれや歪みの小さい音声波形が得られる音
声圧縮及び伸長方式を開発することを目的とする。
縮時において、入力された音声信号波形の現在のポイン
タの位置と該ポインタに対して1ピッチ周期だけ進んだ
位置との両方から夫々前記ピッチ周期の2倍以上且つ整
数倍の長さの音声信号波形を切り出し、切り出された一
対の音声信号波形を適当な重みをつけて加算し、前記2
つの音声信号波形を圧縮した1つの信号波形を生成し、
次に前記現在ポインタを圧縮率に応じて前記入力された
音声信号波形上あるいは生成された音声信号上で移動せ
しめて同様の操作を行い圧縮された音声信号を得るもの
である。
て、入力された音声信号波形の現在のポインタの位置と
該ポインタに対して1ピッチ周期だけ遅れた位置との両
方から夫々前記ピッチ周期の2倍以上で且つ整数倍の長
さの音声信号波形を切り出し、切り出された一対の音声
信号波形を適当な重みをつけて加算し、前記2つの音声
信号波形を合成した1つの信号波形を生成し、次に前記
現在ポインタを伸長率に応じて前記入力された音声信号
波形上あるいは生成された音声信号上で移動せしめて同
様の操作を行い伸長された音声信号を得るものである。
さは、圧縮率あるいは伸長率に関わり無くピッチ周期の
2倍以上で且つ整数倍の長さであり、ポインタの移動量
によって圧縮率あるいは伸長率の調整が行われるため、
常に最も似通った波形同士が加え合わされ、圧縮率ある
いは伸長率が1に近づくに従って得られた音声信号の歪
みは小さくなる。
法をその一実施例について図面に基づいて詳細に説明す
る。 [圧縮方法]対応図は図1〜図3 図1は当該圧縮方法を実現する回路ブロック図を示す。
A/D変換器1によりデジタル音声データs(n)に変
換される。次にピッチ抽出器2によりデジタル音声デー
タs(n)のピッチ周期Tが抽出され、抽出されたピッ
チ情報を用いて時間軸圧縮器3により音声データs
(n)の時間軸圧縮が行われ、結果として圧縮されたデ
ジタル音声信号sc(n)を得る。
音声信号sc(n)をD/A変換器4に送り、ここでアナ
ログ音声信号s’(t)に変換して出力する。
詳細な働きを図2(a)(b)及び図3(a)(b)を
用いて説明する。
ように、夫々現在のポインタP1と、これに対してピッ
チ周期Tだけ進んだ時点P2から、夫々長さ2Tの音声
波形F(音声波形A+音声波形B、即ちポインタP1〜
P3の区間)及び音声波形G(音声波形B+音声波形
C、即ちポインタP2〜P4の区間)を切り出し、波形
Fには1から0へ向かう重み(窓関数W1)をつけ、波
形Gには逆に0から1へ向かう重み(窓関数W2)をつ
けてこれら両波形を加え合わせ、長さ2Tの音声波形E
を得る(図2(b)参照)。なお、ここでの重みW1、
W2は音声波形Eの前後の接続点での波形の連続性を保
つために設けたものである。
2(a)の入力音声上でT+Lc だけポインタを移動さ
せてポインタP5として上記と同様の操作を行う。この
時の出力は前記波形Eとこれに続くP4からP5までの
長さLc −2Tの入力波形をそのまま出力することにな
る。
入力音声上でポインタP1からT+Lc だけ右にポイン
タを移動させてポインタP6として図2(a)と同様の
操作を行う。この時の出力は波形Eの前半の長さLc の
部分のみとなり、残りの2T−Lc の部分は次の処理に
再び用いられるため入力側へ戻される。
形から長さLc の出力波形が作られ、これは音声信号の
圧縮率rを満足するものとなっている。なお、図2
(a)(b)は圧縮率r=3/4、図3(a)(b)は
圧縮率r=3/5の場合を夫々示しており、双方とも圧
縮波形を切り出す波形長はピッチ周期の2倍の場合を示
している。
であれば良くこの実施例に限られるものではないことは
言うまでもない。 [伸長方法]対応図は図4〜図6 図4は当該伸長方法を実現する回路ブロック図を示す。
A/D変換器1によりデジタル音声データs(n)に変
換される。次にピッチ抽出器2によりデジタル音声デー
タs(n)のピッチ周期Tが抽出され、抽出されたピッ
チ情報を用いて時間軸伸長器5により音声データs
(n)の時間軸伸長が行われ、結果として伸長されたデ
ジタル音声信号se(n)を得る。
音声信号se(n)をD/A変換器4に送り、ここでアナ
ログ音声信号s’(t)に変換して出力する。
詳細な働きを図5(a)(b)及び図6(a)(b)を
用いて説明する。
ように、現在のポインタP1と、このポインタP1に対
してピッチ周期Tだけ遅れた時点P4から夫々長さ2T
の音声波形F(波形A+波形B、即ちポインタP4〜P
2の区間)及び音声波形G(波形B+波形C、即ちポイ
ンタP1〜P3の区間)を切り出し、波形Fには0から
1へ向かう重みW3を、波形Gには1から0へ向かう重
みW4をつけて加え合わせ、図5(b)に示す長さ2T
の音声波形Hを作成する。この時の重みW3、W4は前
記時間軸圧縮器3の場合と同様に音声波形Hの前後の接
続点での連続性を保つために設けるものである。
(a)の入力音声上でLs だけ移動させてポインタP3
として同様の操作を行う。この時の出力は波形Hとこれ
に続くポインタP2〜P3までの長さLs −Tの入力波
形(波形C)をそのまま出力する。一方、Ls <Tのと
きは図6(a)の入力音声上でポインタP1からLs だ
けポインタを移動させて、ポインタP5として上記と同
様の操作を行う。この時の出力は、波形Hの前半の長さ
T+Ls の部分のみとなり、残りのT−Ls の部分は次
の処理に再び用いられるため、入力側に戻される。
ら長さT+Ls の出力波形が作られており、伸長率rが
満足されていることが解る。なお、図5(a)(b)は
伸長率r=3/2の場合を示しており、図6(a)
(b)は伸長率r=3の場合で共に伸長波形を作る時に
切り出す波形長はピッチ周期の2倍の場合を示してい
る。もちろん切り出す波形は2倍以上の整数倍であれば
良くこの実施例に限られるものではないことは言うまで
もない。
よると、圧縮時または伸長時に加え合わせる音声波形の
長さは圧縮率あるいは伸長率に関わり無くピッチ周期の
2倍以上の整数倍の長さであり、ポインタの移動量によ
って圧縮あるいは伸長の調整が行われるため、ピッチ周
期の揺らぎによる波形のずれが抑えられ、結果的に圧縮
あるいは伸長時の音声波形の歪みが小さくなる効果が期
待できる。
伸長率が1に近づくに従って歪みが小さくなる効果も期
待できる。
路図である。
波形(a)及び出力波形(b)を示す図である。
波形(a)及び出力波形(b)を示す図である。
路図である。
形(a)及び出力波形(b)を示す図である。
形(a)及び出力波形(b)を示す図である。
Claims (2)
- 【請求項1】 音声信号の圧縮時において、入力された
音声信号波形の現在のポインタの位置と該ポインタに対
して1ピッチ周期だけ進んだ位置との両方から夫々前記
ピッチ周期の2倍以上で且つ整数倍の長さの音声信号波
形を切り出し、切り出された一対の音声信号波形を適当
な重みをつけて加算し、前記2つの音声信号波形を圧縮
した1つの信号波形を生成し、次に前記現在ポインタを
圧縮率に応じて前記入力された音声信号波形上で移動せ
しめて同様の操作を行い圧縮された音声信号を得ること
を特徴とする音声時間軸圧縮方法。 - 【請求項2】 音声信号の伸長時において、入力された
音声信号波形の現在のポインタの位置と該ポインタに対
して1ピッチ周期だけ遅れた位置との両方から夫々前記
ピッチ周期の2倍以上で且つ整数倍の長さの音声信号波
形を切り出し、切り出された一対の音声信号波形を適当
な重みをつけて加算し、前記2つの音声信号波形を合成
した1つの信号波形を生成し、次に前記現在ポインタを
伸長率に応じて前記入力された音声信号波形上で移動せ
しめて同様の操作を行い伸長された音声信号を得ること
を特徴とする音声時間軸伸長方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5327898A JP2951181B2 (ja) | 1993-12-24 | 1993-12-24 | 音声時間軸圧縮装置及び音声時間軸伸長装置、並びに音声時間軸圧縮伸長装置 |
KR1019940022599A KR100372208B1 (ko) | 1993-09-09 | 1994-09-08 | 음성신호의시간축압축/신장방법 |
US08/888,527 US5781885A (en) | 1993-09-09 | 1997-07-07 | Compression/expansion method of time-scale of sound signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5327898A JP2951181B2 (ja) | 1993-12-24 | 1993-12-24 | 音声時間軸圧縮装置及び音声時間軸伸長装置、並びに音声時間軸圧縮伸長装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07181998A true JPH07181998A (ja) | 1995-07-21 |
JP2951181B2 JP2951181B2 (ja) | 1999-09-20 |
Family
ID=18204231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5327898A Expired - Lifetime JP2951181B2 (ja) | 1993-09-09 | 1993-12-24 | 音声時間軸圧縮装置及び音声時間軸伸長装置、並びに音声時間軸圧縮伸長装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2951181B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7613609B2 (en) | 2003-04-09 | 2009-11-03 | Sony Corporation | Apparatus and method for encoding a multi-channel signal and a program pertaining thereto |
US8364475B2 (en) | 2008-12-09 | 2013-01-29 | Fujitsu Limited | Voice processing apparatus and voice processing method for changing accoustic feature quantity of received voice signal |
-
1993
- 1993-12-24 JP JP5327898A patent/JP2951181B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7613609B2 (en) | 2003-04-09 | 2009-11-03 | Sony Corporation | Apparatus and method for encoding a multi-channel signal and a program pertaining thereto |
US8364475B2 (en) | 2008-12-09 | 2013-01-29 | Fujitsu Limited | Voice processing apparatus and voice processing method for changing accoustic feature quantity of received voice signal |
Also Published As
Publication number | Publication date |
---|---|
JP2951181B2 (ja) | 1999-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5630013A (en) | Method of and apparatus for performing time-scale modification of speech signals | |
US6173255B1 (en) | Synchronized overlap add voice processing using windows and one bit correlators | |
US20020133334A1 (en) | Time scale modification of digitally sampled waveforms in the time domain | |
EP0726560B1 (en) | Variable speed playback system | |
JP2976860B2 (ja) | 再生装置 | |
JPS623439B2 (ja) | ||
KR100372208B1 (ko) | 음성신호의시간축압축/신장방법 | |
CN100555876C (zh) | 声信号处理装置和方法 | |
JP3465628B2 (ja) | オーディオ信号の時間軸圧伸方法及び装置 | |
Makhoul et al. | Time-scale modification in medium to low rate speech coding | |
JPH07181998A (ja) | 音声時間軸圧縮方法及び伸長方法 | |
JPH0777999A (ja) | 音声時間軸圧縮伸長方法 | |
JP2001255882A (ja) | 音声信号処理装置及びその信号処理方法 | |
JP4643914B2 (ja) | 音声合成方法および装置 | |
JP3147562B2 (ja) | 音声速度変換方法 | |
JPH1078791A (ja) | ピッチ変換器 | |
JP3213388B2 (ja) | 時間軸圧縮伸長方法 | |
JPH07302097A (ja) | 音声の時間軸圧縮方法、及び伸長方法、並びに音声の時間軸圧縮伸長方法 | |
JPH0266598A (ja) | 音声信号圧縮伸張装置 | |
JP2709198B2 (ja) | 音声合成方法 | |
JP4437703B2 (ja) | 話速変換方法および装置 | |
JPS60262200A (ja) | スペクトルパラメ−タ補間方法 | |
KR100445342B1 (ko) | 듀얼 에스오엘에이 알고리듬을 이용한 음성속도변환방법및 시스템 | |
JPH10187180A (ja) | 楽音発生装置 | |
JPS594719B2 (ja) | 音声合成用基本周期波形生成法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080709 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080709 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090709 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090709 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100709 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100709 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110709 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120709 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 14 |
|
EXPY | Cancellation because of completion of term |