JPH0193799A - 音声ピッチ変換方法 - Google Patents

音声ピッチ変換方法

Info

Publication number
JPH0193799A
JPH0193799A JP62250706A JP25070687A JPH0193799A JP H0193799 A JPH0193799 A JP H0193799A JP 62250706 A JP62250706 A JP 62250706A JP 25070687 A JP25070687 A JP 25070687A JP H0193799 A JPH0193799 A JP H0193799A
Authority
JP
Japan
Prior art keywords
pitch
waveform
linear prediction
voice
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62250706A
Other languages
English (en)
Other versions
JP2612867B2 (ja
Inventor
Toru Tsugi
徹 都木
Hisao Kuwabara
尚夫 桑原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP62250706A priority Critical patent/JP2612867B2/ja
Publication of JPH0193799A publication Critical patent/JPH0193799A/ja
Application granted granted Critical
Publication of JP2612867B2 publication Critical patent/JP2612867B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、放送、映画、音楽等における音声処理におい
て、音声の高低やアクセント、イントネーション等を変
化させたり、ビブラートを付加したりするなど、音声の
ピッチ周波数を制御する音声ピッチ変換方法に関する。
[発明の概要] 本発明は人の音声を一時記録し、そのピッチの周期を変
化させて、再び音声として出力する技術に関するもので
、 入力音声をA/D変換した後、有声音部分についてその
ピッチ周波数を抽出し、波形を各ピッチ間隔で分割し、
各ピッチの周期を伸縮し、これらを発話時間長に変化が
ないように接続し、さらにその波形をフーリエ変換し、
周波数領域においてピッチの変更によって生じた歪成分
を軽減せしめ、逆フーリエ変換によって時間領域に戻し
た後、これをD/^変換することにより、原音声の音韻
性や自然性を良好に保ったまま、声の高さやイントネー
ションを自由に変換できるようにする方法である。
[従来の技術] この種の技術としては、古典的な例として音声をアナロ
グテープレコーダに録音し、再生スピードを変化させる
方法がある。この方法の場合、ピッチ周波数のみならず
、ホルマントの周波数も含めた全周波数帯域が一様に変
化すると共に、発話時間長も同時に変化する。
すなわち、再生スピードを録音時のR倍にすると、ピッ
チおよびホルマントの周波数は全てR倍となり、発話時
間長は1/R倍となる。
ここで、ピッチは音声の高低を与えたり、その時間的変
化によってアクセントやイントネーションを特徴づける
ものであり、また、ホルマントは音声の音韻性を特徴づ
けるものであり、大幅な個人差を有する。
上記従来例に対して、デジタル技術を用い、発話時間長
を変化させない方法も開発されている。
すなわち、サンプリング周波数Fで書込んだ音声波形を
、FXRなるサンプリング周波数で読出せば、ピッチお
よびホルマント周波数はR倍となる。この際、適当な時
間窓と周期を用いて波形を間引いたり、繰り返したりす
れば、発話時間長を原音声と同じに保つことができる。
このような装置は「ハーモナイザー」などと呼ばれ、音
響効果装置として一般に使用されている。
[発明が解決しようとする問題点] しかしながら、上述したいずれの従来例においても、ピ
ッチ周波数を変化させた場合、同時にホルマント周波数
も変化してしまうことが避けられない。
ホルマント周波数が変化すると、音声における個人差が
不明瞭となり、さらに変化量が多い場合には音韻性が劣
化し、非人間的な声となる。従って、上述したような効
果を積極的に利用するのでない限り、ピッチ周波数の変
化に伴うホルマント周波数の変化が有害であるという問
題点があった。
また、従来の音声処理装置では、音声の高低を制御する
ことが主であるから、ピッチ周波数の長時間にわたる平
均の変化を制御することは容易であるが、イントネーシ
ョンのような短時間内のピッチ周波数の変化を制御でき
ないという問題点があった。
そこで本発明の目的は上述した従来の問題点を解消し、
原音声のピッチ周波数を大きく変化させてもホルマント
周波数を不変とすることおよび変化に伴う周波数歪を軽
減することによって、個人性や音韻性を保ち、人間の音
声としての自然性を損なわずに音声の高低やアクセント
等を制御することが可能な音声ピッチ変換方法を提供す
ることにある。
本発明の他の目的は、短時間内においてもピッチ周波数
の制御を可能とすることによってイントネーションやビ
ブラート等の強調、付替が自由に行なうことのできる音
声ピッチ変換方法を提供することにある。
[問題点を解決するための手段] そのために本発明では入力音声から有声音区間を抽出し
、有声音区間からピッチ周期を抽出し、抽出したピッチ
周期に対応した各々のピッチ区間において線形予測係数
を求め、線形予測係数を用いてスペクトル包絡を算出し
、各々のピッチ区間の波形を線形予測係数を援用するこ
とによって伸縮し、伸縮された波形を入力音声の発声時
間長と等しくなるよう各々のピッチ区間の波形を間引く
かまたは繰り返すことによって接続し、接続された波形
において線形予測係数を求め、線形予測係数を用いてス
ペクトル包絡を算出し、波形の伸縮前に算出したスペク
トル包絡と伸縮後に算出したスペクトル包絡との差を歪
成分とし、接続波形をフーリエ変換によって周波数領域
に変換し、周波数領域の各々の周波数成分から歪成分を
修正した後、逆フーリエ変換によって波形を時間領域に
戻し、戻された波形の平均ピッチ周期に対応した櫛形ろ
波を波形に施した後、前後の無声音区間または無音区間
と接続し、新たな音声波形とすることを特徴とする。
[作 用1 以上の構成によれば、周波数スペクトル包絡を原音声の
ものに保ったまま、換言すれば、原音声のホルマント周
波数を変化させずにピッチ周波数を変更することができ
る。
また、各ピッチ区間毎にピッチ周期を変えることができ
る。
[実施例] 以下、図面に示す実施例に基づき本発明の詳細な説明す
る。
第1図は、本発明の一実施例に係るピッチ周波数変換シ
ステムのブロック図を示す。図において、2は分析部、
4はピッチ周波数制御部、6は波形接続部、8は歪修正
部をそれぞれ示し、各部は電子計算機内に構成され、R
OM 、 RAMあるいはディスクメモリ等のメモリを
併用しながらピッチ周波数変換の処理が実行される。 
A/D変換されて標本化された音声波形は分析部2へ入
力し、有音と無音および有声音と無声音の判別、さらに
有声音についてはピッチ区間が定められる。
次にピッチ周波数制御部4においては、分析部2で得ら
れた各ピッチ区間について所望の変更を加え、新たなピ
ッチ周期列を計算し、各ピッチ毎に新たなピッチ周期に
応じて波形を伸縮する。これにより、音声の高低、イン
トネーション等が制御される。
波形接続部6ではピッチ周波数制御部4で変更された各
ピッチの波形を発話時間長に変化が無いように適宜間引
くかまたは繰り返すことによって接続する。
歪修正部8では波形接続部6で得られた有声音区間での
合成波形に対して、その短時間スペクトル包絡を順次求
め、これを原音声のスペクトル包絡と同じになるよう修
正する。
上述した一連の有声音に対するピッチ周波数変換の処理
を終了すると、無声音区間および無音区間を接続し、次
の有声音区間の処理に移る。最終的に合成された音声波
形をD/A変換して出力音声とする。
上記各部における処理の詳細を第2図に示すフローチャ
ートを参照しながら説明する。
誉換ビット数12bit、標本化周波数15kHzでA
/D変換された音声は、まず、分析部2におけるステッ
プS1で音声パワーの有無に基づいて有音区間と無音区
間の判別が行われる。次にステップS2では有音区間の
標本値に対してPARCOR分析と7交さ分析とを行い
、無声子音区間と有声音区間との判別を行う、これは、
1次のPARCOR係数を参照して入力周波数の高域成
分の割合を調べたり、平文さ数を調べることによって行
なう。すなわち、無、声子音のエネルギーは高周波領域
まで分布しており、高域成分の割合および高周波になる
と多くなる平文さ数を調べることによって無声子音と有
声音とを判別する。なお、PARCOR分析と平文さ分
析の両方を用いて判別を行なうのは、判別を確実なもの
とするためである。
上記ステップS1およびS2で判別された無音区間の時
間および無声子音区間の波形は、それぞれステップS2
1およびS22においてそのままRAMあるいはメモリ
ディスク等に記憶される。
次に、ステップS3では有声音区間における音声波形の
標本値を音声の生成モデルに基づくいわゆる声道逆フィ
ルタに通すことによって線形予測分析を行なう。この線
形予測分析によって線形予測係数と残差波形を得る。得
られた残差波形はステップS23においてRAMあるい
はディスクメモリ等に記憶される。
ステップS4ではステップS3で得られた残差波形の相
間における周期と原音声波形のピークの間隔とから仮の
ピッチ周期を求める。
次に、ステップS5においては、第3図に示すように波
形のレベルが急に大きくなる点の直前をピッチの開始点
とし、上記で求めたピッチ周期に基づき次のピッチの開
始点の1標本手前を終了点として1つのピッチ区間を定
める。
ステップS6では上記で求めた1ピッチ区間の中間点を
分析窓の中心として、20m5ec程度の窓掛けを行な
う。この窓掛けにより有限個の標本値による短時間スペ
クトル分析が可能となり、この窓掛はデータを基に再び
線形予測分析を行なう。すなわち、標本値の窓掛けを行
なったデータを基に相関関数を求めることによって、線
形予測係数α、〜α2を算出する。ここで、pは線形予
測分析の次数であり、一般に男性の声に対してはp=1
4、女性の声に対してはp=10程度を用いる。
ステップS7.S8では上記1ピッチ区間の標本値の自
乗和をピッチ区間長で割った値を正規化パワーと定義し
、ピッチ区間の長さ、線形予測係数と共にRAMあるい
はメモリディスク等に記憶する。
上記ステップ56〜S8の1ピッチ区間についての処理
を終了すると、処理区間を1ピッチ分だけ後へずらし、
次のピッチ区間の処理を行ない、これらの操作を有声区
間が終るまで繰返す。
ピッチ周波数制御部4では、まずステップS9において
、分析部2で得られた一連のピッチ周期の各々に所望の
変更を加え、新たにピッチ周期列を算出する。すなわち
、ある有声音区間内において、初めのピッチからn番目
のピッチの周期pn、ピッチ周波数をFr1−1/Pr
1とし、また全ピッチ数をLとする。さらに、平均ピッ
チ周波数F AVEを、人間の音声における高低の知覚
機構を考慮して全ピッチ周波数の相乗平均で定義する。
すなわち、 F AVE −CF I X F 2 X ”” F 
L)”’=(Pt XP2 x・・・・・’PL)−’
八   (1)このとき、例えば、音声の高低を制御す
るために平均のピッチ周波数をR倍にしたければ、(1
)式より全てのピッチ周期を1/R倍にすればよい。
また、アクセントのように抑揚を変化させる場合には、
各ピッチ周期毎に異なる比率で周期を伸縮しなければな
らない。そのために、第4図に示すように、各ピッチ周
期毎にn番目のピッチ周波数FllをRn倍する。
また、第5図に示すように原音声の平均ピッチ周波数を
中心として抑揚を強調あるいは抑圧する場合は、Rnと
して(2)式に示すものを用いればよい。すなわち、 Rn= (Fn/FAVE ) c−電このときC>1
ならば抑揚の強調、0≦c<1ならば抑揚の抑圧となる
次に、ステップSIOにおいて、各ピッチ毎の波形をス
テップS9で得た新しいピッチ周期に対応させて伸縮す
る。すなわち、原音声におけるある1ピッチ区間の標本
数をkとし、変更されたピッチ区間長に相当する標本数
をに′とすると、ピッチ周期を縮めた場合には波形をピ
ッチ区間の開始点からに′番目の標本値までで打ち切り
、ピッチ周期を伸ばした場合には分析部2で得られた線
形予測係数α、〜α、を用いて、(3)式に示す如くm
=に+ 1番目からm=に’番目までの標本値を求め後
続の波形を得る。
x (m)=a 、  x (m−1)+a*  x 
(m−2)÷・・・・・・+αp x (m−p)  
          (3)ただし、人間の音声の特徴
を考慮して後続部は指数的に減衰する窓係数を掛ける。
ステップ311では、ステップS7で得た正規化パワー
の調整を行なう。すなわち、ピッチ周期を変更すると、
一般に前述した正規化パワーも変化するのでステップS
7で得た値と同じになるよう各標本値を定数倍する。
波形接続部6では、まずステップS12で発話時間長の
比較を行なう。すなわち、原音声の発話時間長をT、n
番目のピッチ区間のピッチ周期をPnとし、ピッチ周波
数変更後のそれらをそれぞれT’ 、 Pr1°とする
と、 T−P、+P2+・・・・・・+pt、       
(4)T’  −P、l+P2°+・・・・・・+pL
l      (5)と現わされる。一般にピッチ周波
数変更によって発話時間長は変化するから”r&T’ 
となる。
そこで、γ=T’ /Tとおき、γの値に応じて、ステ
ップS13:Qピッチ区間の間引きあるいは繰り返しを
行なう。すなわち、γ〉1ならば、γ/(γ−1)ピッ
チにつき1ピツチの割合で間引き、γく1ならば、γ/
(1−γ)ピッチにつき1ピツチの割合で同じ波形を繰
り返す。
γ=1.5およびγ= 0.667の場合の処理の様子
をそれぞれ第6図(A)および(B)に示す。同図に示
すように、γ=1.5の場合は3ピツチに1回ピッチ変
更後の音声のピッチ区間3および6を間引き、γ= 0
.667の場合、2ピツチに1回ピッチ変更後の音声の
ピッチ区間2.4および6の波形を繰り返す。
これにより、概ね原音声の発話時間長を保つことができ
、聴感的にも違和感がない。
なお、一般的にピッチ周期を変更した波形においては、
その波形のピッチ区間の最終標本点と次のピッチ区間の
開始標本点との間には標本値の大きな不連続があるので
、ステップ514において、接続点、すなわち最終標本
点と開始標本点の前後数標本のデータを用いて最小自乗
法により3次曲線を用いた近似を行ない連続的に接続す
る。
歪修正部8では、まず、ステップS15において、第7
図に示すようにピッチ周期の変更を行った波形の9点か
らq+M−1までのM個の標本のデータに対してその自
乗和Psを求めると共に、このM個の標本値について線
形予測分析を行ない、線形予測係数α、°〜α、°を得
る。
ステップS24およびS25では、この線形予測係数α
1°〜α、°および前述したところの分析部2において
原音声の時刻的に同じ区間に相当する部分から得られた
線形予測係数α1〜α、を用いて、それぞれ以下に示す
(6)式および(7)式によってスペクトル包絡H(K
)およびH(に)を求める。
H(k)=11+ Σ α1°・exp(−j2yc 
i (k−1)/N) l−’ll1 k−1〜N(6) H(k)=11+ Σ a 1−exp(−j2 π1
(k−1)/N) l−’ム11I k−1〜N(7) ここで、Mは20〜30m5ecの時間長での標本数で
あり、標本化周波数は15kHxであるから、その値は
300〜450程度となり、NはMより大きい2のべき
乗で512とする。
スペクトル包絡H(に)は、原音声の音韻性や個人性を
多く含む、すなわちホルマント周波数を特徴づける物理
量であるが、H(に)はピッチ周期の変更に起因する歪
により、必ずしもH(K)と一致しない。この歪を修正
するために以下の処理を行なう。
まず、ステップ516において、第7図に示すq−(N
−M) /2点からq+ (N4M) /2−1までの
N個の標本を新たにx(1)〜x (N) とおき、(
8)式に示すように、時間窓係数w (m)と掛けて、
y(1)〜y (N)とする。すなわち、 y (m) = w (m)  −x (m)    
l11−1〜N (8)ただし、L−(N−M)/24
1. L’−(N4M)/2として、w (m)−0,
5−(1−cos(yrm/L))    1≦m≦L
w(m)=I             L≦m≦L。
w (m)=0.5・[1+cos(rt (m−L’
)/L)]L°≦m≦N 得られたy (I++)に対して、N点の高速フーリエ
変換を行ない、周波数領域に変換してY (K)とする
。次にステップ517で、以下の(9)式で示すように
、Y (K)の絶対値をスペクトル包絡H(K)および
π(K)の比を用いて変更する。すなわち、V(x)−
o(に)/「(K)・Y(に)K−1〜N(9)ステッ
プ518では得られたY(に)を逆高速フーリエ変換に
より時間領域の波形y(1)〜”;t (N)とし、さ
らにステップ519において、以下(lO)式で示すよ
うに櫛型ろ波を行ないx(1)〜X (N) とする。
これにより、ピッチ周波数の非整数倍の周波数に生じた
歪成分を減衰させる。
7(m)・0.25 ((1−a)?(m−Kp)+2
 (1+a)7(m)+ (1−a)7(m+にp)) ただし、’i(m) −7(1)  m≦O,y(m)
・7(N)  m>Nここで、Kpはピッチ周波数変更
後の処理区間における平均ピッチ周期に相当するピッチ
区間の標本数であり、また、aはOから1の間の定数で
、0.01程度を用いる。
(10)式より得られたN点のデータのうち中心のM個
の標本のデータに対し、その自乗和Ps’が先にステッ
プS15で求めたPsと等しくなるよう各標本値を定数
倍してゲインの調整をする。これによって音声の大きさ
が等しく保たれる。さらに、波形接続の際、端の効果を
軽減するため、両端で0、中心で1となるようなハニン
グ窓または三角窓を掛け、この波形をRAMあるいはメ
モリディスク等に記憶する。
次に第7図に示すg点をM/2点だけ後ヘシフトして処
理区間を穆し、ステップS16以降の一連の処理を行っ
た後、第8図に示すようにM個の標本値の前半のM/2
点と、直前の処理フレームの後半のM/2点とを瓜ね合
わせて順次加える。
以下有声音区間が終るまで同じ操作を繰り返せば原音声
と同様なスペクトル包絡を有する音声波形が得られる。
これにより、ホルマント周波数は不変となり原音声の音
韻性や個人性を保存することが可能となる。
なお、Kpがある程度以上大きい場合には、Mを450
〜600とし、同時にNも1024に拡大した方が良い
音質が得られる。
ひとつの有声音区間の処理が終了したならば、ステップ
S20で前後の無声音区間または、無音区間と接続し、
ステップS2以降で次の有音声区間の処理に穆る。最終
的に合成された音声ををD/A変換して、出力音声とす
る。
[発明の効果コ 以上説明したように、本発明によれば音声の周波数スペ
クトル包絡を原音声のものに保ったまま、言い換えれば
原音声のホルマント周波数を変化させずにピッチ周波数
を変更することができる。従ってホルマントの構造に依
存する音韻性や個人性に影舌を与えず、従来の技術より
自然性の高い状態でピッチ周波数を変化させることが可
能である。
また、従来の装置ではピッチ周波数の変化量が長時間に
わたり一定でありたが、本発明においては、各ピッチ毎
にその変化量を変えることで抑揚を変化させ、会話のイ
ントネーションや歌声のビブラートの制御などが可能で
ある。
【図面の簡単な説明】
第1図は本発明の一実施例に係るシステムのブロック図
、 第2図は本発明の一実施例を示すフローチャート、 第3図は実施例におけるピッチ区間の定め方を説明する
ための波形図、 図、 第6図は実施例におけるピッチ区間の間引きあるいは繰
り返しを説明するための波形図、第7図は実施例の歪修
正を説明するための波形図、 第8図は実施例Cおける波形の重ね合せを説明するため
の波形図である。 2・・・分析部、 4・・・ピッチ周波数制御部、 6・・・波形接続部、 8・・・歪修正部。

Claims (1)

  1. 【特許請求の範囲】 入力音声から有声音区間を抽出し、 該有声音区間からピッチ周期を抽出し、 当該抽出したピッチ周期に対応した各々のピッチ区間に
    おいて線形予測係数を求め、該線形予測係数を用いてス
    ペクトル包絡を算出し、 前記各々のピッチ区間の波形を前記線形予測係数を援用
    することによって伸縮し、 当該伸縮された波形を前記入力音声の発声時間長と等し
    くなるよう前記各々のピッチ区間の波形を間引くかまた
    は繰り返すことによって接続し、当該接続された波形に
    おいて線形予測係数を求め、該線形予測係数を用いてス
    ペクトル包絡を算出し、 前記波形の伸縮前に算出した前記スペクトル包絡と前記
    伸縮後に算出した前記スペクトル包絡との差を歪成分と
    し、 前記接続波形をフーリエ変換によって周波数領域に変換
    し、 該周波数領域の各々の周波数成分から前記歪成分を修正
    した後、逆フーリエ変換によって当該波形を時間領域に
    戻し、 当該戻された波形の平均ピッチ周期に対応した櫛形ろ波
    を当該波形に施した後、前後の無声音区間または無音区
    間と接続し、新たな音声波形とする ことを特徴とする音声ピッチ変換方法。
JP62250706A 1987-10-06 1987-10-06 音声ピッチ変換方法 Expired - Lifetime JP2612867B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62250706A JP2612867B2 (ja) 1987-10-06 1987-10-06 音声ピッチ変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62250706A JP2612867B2 (ja) 1987-10-06 1987-10-06 音声ピッチ変換方法

Publications (2)

Publication Number Publication Date
JPH0193799A true JPH0193799A (ja) 1989-04-12
JP2612867B2 JP2612867B2 (ja) 1997-05-21

Family

ID=17211835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62250706A Expired - Lifetime JP2612867B2 (ja) 1987-10-06 1987-10-06 音声ピッチ変換方法

Country Status (1)

Country Link
JP (1) JP2612867B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002229600A (ja) * 2001-01-31 2002-08-16 Pigeon Corp マザリーズ類似音変換装置とマザリーズ類似音変換方法
WO2002095731A1 (fr) * 2001-05-22 2002-11-28 Fujitsu Limited Processeur de signaux vocaux
JP2012181345A (ja) * 2011-03-01 2012-09-20 Nippon Hoso Kyokai <Nhk> 韻律変換装置およびプログラム
JP2015138187A (ja) * 2014-01-23 2015-07-30 日本放送協会 音声信号処理装置及び音声ピッチ変換プログラム
JP2015138193A (ja) * 2014-01-23 2015-07-30 日本放送協会 音声信号処理装置及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002229600A (ja) * 2001-01-31 2002-08-16 Pigeon Corp マザリーズ類似音変換装置とマザリーズ類似音変換方法
JP4647110B2 (ja) * 2001-01-31 2011-03-09 ピジョン株式会社 マザリーズ類似音変換装置とマザリーズ類似音変換方法
WO2002095731A1 (fr) * 2001-05-22 2002-11-28 Fujitsu Limited Processeur de signaux vocaux
JP2012181345A (ja) * 2011-03-01 2012-09-20 Nippon Hoso Kyokai <Nhk> 韻律変換装置およびプログラム
JP2015138187A (ja) * 2014-01-23 2015-07-30 日本放送協会 音声信号処理装置及び音声ピッチ変換プログラム
JP2015138193A (ja) * 2014-01-23 2015-07-30 日本放送協会 音声信号処理装置及びプログラム

Also Published As

Publication number Publication date
JP2612867B2 (ja) 1997-05-21

Similar Documents

Publication Publication Date Title
US5828994A (en) Non-uniform time scale modification of recorded audio
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
Grofit et al. Time-scale modification of audio signals using enhanced WSOLA with management of transients
JP2612868B2 (ja) 音声の発声速度変換方法
US20050240397A1 (en) Method of determining variable-length frame for speech signal preprocessing and speech signal preprocessing method and device using the same
JPH0193799A (ja) 音声ピッチ変換方法
JP2904279B2 (ja) 音声合成方法および装置
JPH05307395A (ja) 音声合成装置
JP2612869B2 (ja) 声質変換方法
Arakawa et al. High quality voice manipulation method based on the vocal tract area function obtained from sub-band LSP of STRAIGHT spectrum
JP3197975B2 (ja) ピッチ制御方法及び装置
JP6011039B2 (ja) 音声合成装置および音声合成方法
JP5573529B2 (ja) 音声処理装置およびプログラム
Lee et al. A simple strategy for natural Mandarin spoken word stretching via the vocoder
JP4313724B2 (ja) 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体
JPS63199399A (ja) 音声合成装置
Lawlor A novel efficient algorithm for voice gender conversion
JP2001312300A (ja) 音声合成装置
JPH03259200A (ja) 音声の発声時間長制御方法および装置
JPS63210899A (ja) 音声合成装置
Klatt Synthesis of stop consonants in initial position
KR100322704B1 (ko) 음성신호의지속시간변경방법
JPS63210900A (ja) 音声合成装置
JP3083829B2 (ja) 音声ピッチ変換方法および装置
Grofit et al. Time-scale modification of music signals

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080227

Year of fee payment: 11