JPS6040629B2 - 音素片編集型音声合成の補間方式 - Google Patents
音素片編集型音声合成の補間方式Info
- Publication number
- JPS6040629B2 JPS6040629B2 JP56197944A JP19794481A JPS6040629B2 JP S6040629 B2 JPS6040629 B2 JP S6040629B2 JP 56197944 A JP56197944 A JP 56197944A JP 19794481 A JP19794481 A JP 19794481A JP S6040629 B2 JPS6040629 B2 JP S6040629B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- phoneme
- speech synthesis
- editing type
- interpolation method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
- Telephone Function (AREA)
Description
【発明の詳細な説明】
本発明は音素片編集型音声合成の補間方式に関し、その
目的とするところは出力音声の振幅あるいはホルマント
周波数のなめらかな補間を行うことにある。
目的とするところは出力音声の振幅あるいはホルマント
周波数のなめらかな補間を行うことにある。
従来、マイクロコンピュータ、ROMおよびD/A変換
器を構成要素とする音素片編集型音声合成装置では、R
OM中に書き込まれた音声のピッチ単位からなる特定の
音素片データを複数回繰り返して1個の音韻単位を構成
し、これらの音韻単位を順次接続することによってまと
まった単語音声を得ている。
器を構成要素とする音素片編集型音声合成装置では、R
OM中に書き込まれた音声のピッチ単位からなる特定の
音素片データを複数回繰り返して1個の音韻単位を構成
し、これらの音韻単位を順次接続することによってまと
まった単語音声を得ている。
このため、従釆の音声編集型音声合成方式では前詐収O
M中の音素片によって決定される音韻の境界面で合成音
の振幅、ピッチ周期およびホルマント周波数が急激に変
化する。このため今までの音素片編集型音声合成方式で
は、なめらかな音声のつながりが得られない欠点がある
。なお、同出願人には既に特顔昭56一82645号に
よって音素片間のなめらかなつながりを得る方法を提案
しているが、この方法では各素片のサンプル数を同じに
するために素片ごとにピッチ周期に合わせてサンプリン
グ時間を変化させる必要があるため、発声用マイクロコ
ンピュータで処理することが困難である。
M中の音素片によって決定される音韻の境界面で合成音
の振幅、ピッチ周期およびホルマント周波数が急激に変
化する。このため今までの音素片編集型音声合成方式で
は、なめらかな音声のつながりが得られない欠点がある
。なお、同出願人には既に特顔昭56一82645号に
よって音素片間のなめらかなつながりを得る方法を提案
しているが、この方法では各素片のサンプル数を同じに
するために素片ごとにピッチ周期に合わせてサンプリン
グ時間を変化させる必要があるため、発声用マイクロコ
ンピュータで処理することが困難である。
そこで本発明はN個の音素片の各データPhk(kil
、2、……N)に対しPhkとPhk‐・のデータ間を
直線で結んだ疑似アナログ波形を得、これを再度異なっ
たサンプル数MでサンプリングしN個のデータ数の秦片
からM個のデータを作製し音素片間の補間を行うことに
より、発声用マイクロコンピュータでなめらかな音声の
つながりを実現したものであって、以下本発明の一実施
例を図面に基づいて説明する。
、2、……N)に対しPhkとPhk‐・のデータ間を
直線で結んだ疑似アナログ波形を得、これを再度異なっ
たサンプル数MでサンプリングしN個のデータ数の秦片
からM個のデータを作製し音素片間の補間を行うことに
より、発声用マイクロコンピュータでなめらかな音声の
つながりを実現したものであって、以下本発明の一実施
例を図面に基づいて説明する。
先ず、音声データよりその1ピッチについて各周波数成
分の位相を変化させ、これらを全てooおよび18ぴか
な始まる正弦波で置換した音素片を第1式に示す。
分の位相を変化させ、これらを全てooおよび18ぴか
な始まる正弦波で置換した音素片を第1式に示す。
Phn=i≧OAnisin(iのnt)・…・・第1
式但し、oPhnは音素片nを示す。
式但し、oPhnは音素片nを示す。
oiは基本角周波数(ピッチ周波数)の第i次高調波を
示す。
示す。
oAnは第i次高調波の振幅値を示す。
ownは音素片nの基本角周波数を示す。
この音素片を量子化する場合、そのサンプル時間丁秒は
遮断角周波数のcによって第2式のように定まる。
遮断角周波数のcによって第2式のように定まる。
ィ=ZL(サンプリング定理より)・・・・・・第2式
のCサンプリング時記7秒で第1式を童子化すると、音
素片nのj番目のサンプリングデータPhnjは第3式
で表わされる。
のCサンプリング時記7秒で第1式を童子化すると、音
素片nのj番目のサンプリングデータPhnjは第3式
で表わされる。
Nn
Ph〜=i≧OAnisin(iのni7)・・・・・
・第3式ここでNnはのc≧Nnwn
……第4式となる最大の整数であり、同時にNnはサン
プルデータ数に等しい。
・第3式ここでNnはのc≧Nnwn
……第4式となる最大の整数であり、同時にNnはサン
プルデータ数に等しい。
一方、第2式と第4式よりヱL>Nn・7
・・・・・・第5式00n但し、Nnはこの式を流
す最大の整数となる。
・・・・・・第5式00n但し、Nnはこの式を流
す最大の整数となる。
のnは素片ごとに異なる値で、本発明では丁を一定値に
固定し、その結果得られた各素片のデータ数Nnを補間
実行時に変化させることにより、補間すべき両端の音素
片のデータ数を等しくしている。橘間すべき両端の音素
片をそれぞれPhn、Phmとし、そのデータ数をNn
、Nmとする。
固定し、その結果得られた各素片のデータ数Nnを補間
実行時に変化させることにより、補間すべき両端の音素
片のデータ数を等しくしている。橘間すべき両端の音素
片をそれぞれPhn、Phmとし、そのデータ数をNn
、Nmとする。
この素片を式で表わし、Phni{Phnili=1,
・・・・・・,Nn} ・・・・・・第6式Phm=
{P肌lk=1,……,Nm} ……第7式とする。
・・・・・・,Nn} ・・・・・・第6式Phm=
{P肌lk=1,……,Nm} ……第7式とする。
両素片の基本角周波数wnが等しくない場合、7を一定
とするため、どうしてもNnとNmは異なる整数になる
。この場合、一方の素片のデータをもう一方の素片のデ
ータ数と等しくする操作を行う。例えばPhmのデータ
数をPhnと同じもこする場合について次に説明する。
とするため、どうしてもNnとNmは異なる整数になる
。この場合、一方の素片のデータをもう一方の素片のデ
ータ数と等しくする操作を行う。例えばPhmのデータ
数をPhnと同じもこする場合について次に説明する。
Phmのデータ点Phm(k‐,)とPhmkとの間を
時間△tに対し−次的に変化するデータとし、Nm個の
データ点間を時間に対して連続的に変化するアナログ波
形を作る。
時間△tに対し−次的に変化するデータとし、Nm個の
データ点間を時間に対して連続的に変化するアナログ波
形を作る。
一方、PhmからNn個のデータを得る場合の各サンプ
ル点Phmi(i=1、・・・・・・Nn)の時間軸上
の位置をTPhmiとすると、TP肌ニ(i−1)7′
(i=1,…,Nn)……第8式′ Nm−1
.....・第9式7;町了−7その
サンプリング点における上記アナログ波形の値をそのサ
ンプル点のデータとし、Nn個のデー夕を作る。
ル点Phmi(i=1、・・・・・・Nn)の時間軸上
の位置をTPhmiとすると、TP肌ニ(i−1)7′
(i=1,…,Nn)……第8式′ Nm−1
.....・第9式7;町了−7その
サンプリング点における上記アナログ波形の値をそのサ
ンプル点のデータとし、Nn個のデー夕を作る。
このデータPhmより計算で求められ、Phmiのデー
タをDP肌とすると、DPhmi=DPhmk羊岬・)
mhmi−恥側}であって、この第1坊式を実行するプ
ログラムの追加により本方式は発声用マイクロコンピュ
ータで処理することができる。
タをDP肌とすると、DPhmi=DPhmk羊岬・)
mhmi−恥側}であって、この第1坊式を実行するプ
ログラムの追加により本方式は発声用マイクロコンピュ
ータで処理することができる。
第1図は、ある音素片Phmのデータを示す。
機軸は時間t、縦軸はパワーを表わしている。サンプリ
ング時間7(一定)によりデータ数Nmは定まる。この
例の場合、Nm=9である。第2図はNm個の各素片デ
ータ間を直線で結んで得られたアナログ波形を示す。
ング時間7(一定)によりデータ数Nmは定まる。この
例の場合、Nm=9である。第2図はNm個の各素片デ
ータ間を直線で結んで得られたアナログ波形を示す。
この波形の一般式は、Dp肌(t)=DP肌k−亭P肌
上k‐,L{t−Tp肌(k−,)}十Dp肌(k−リ
・・・・・・第11式但し、(k−1)7
隻tきk7で表わされる。
上k‐,L{t−Tp肌(k−,)}十Dp肌(k−リ
・・・・・・第11式但し、(k−1)7
隻tきk7で表わされる。
第3図はPhmからNn個のデータを得る場合に、各サ
ンプル点とその点でのデータを第2図で示したアナログ
波形から得られたデータ値を示している。この場合、N
n=11である。各サンプル点のデータ値は第11式に
サンプル点までの時間TP肌を代入すれば求められる。
第4図は、得られたNn個のデータより発声した波形で
ある。
ンプル点とその点でのデータを第2図で示したアナログ
波形から得られたデータ値を示している。この場合、N
n=11である。各サンプル点のデータ値は第11式に
サンプル点までの時間TP肌を代入すれば求められる。
第4図は、得られたNn個のデータより発声した波形で
ある。
この引例ではNmくNnであるが、Nm>Nnの場合で
も同じことが行える。但し、この場合にはデータ数変換
に伴う誤差が生じるが、実際に補間を行なう素片間では
データ数が大きく異なる場合はほとんどなく、その誤差
は補間のメリットに比べ充分に無視できる。むしろ、前
記の計算を実行するアルゴリズムは簡単であり、しかも
発声時に同時に処理を行える点で有益である。なお、第
5図にこの処理を用いた発声方式のアルゴリズム例を示
す。以上説明のように本発明の補間方式によると、音素
片編集型音声合成装置の出力音声の振幅値あるいはホル
マント周波数になめらかな補間を行うことができると共
に、これを発声用マイクロコンピュータで実行できるも
のであって、素片データの作成を容易にできるものであ
る。
も同じことが行える。但し、この場合にはデータ数変換
に伴う誤差が生じるが、実際に補間を行なう素片間では
データ数が大きく異なる場合はほとんどなく、その誤差
は補間のメリットに比べ充分に無視できる。むしろ、前
記の計算を実行するアルゴリズムは簡単であり、しかも
発声時に同時に処理を行える点で有益である。なお、第
5図にこの処理を用いた発声方式のアルゴリズム例を示
す。以上説明のように本発明の補間方式によると、音素
片編集型音声合成装置の出力音声の振幅値あるいはホル
マント周波数になめらかな補間を行うことができると共
に、これを発声用マイクロコンピュータで実行できるも
のであって、素片データの作成を容易にできるものであ
る。
図面の簡単な説明図面は本発明の一実施例における音素
片編集型音声合成の橘間方式を示すもので、第1図はあ
る音素片のデータ図、第2図はNm個の素片データ間を
直線で結んだアナ。
片編集型音声合成の橘間方式を示すもので、第1図はあ
る音素片のデータ図、第2図はNm個の素片データ間を
直線で結んだアナ。
グ波形図、第3図はある音素片からNnのデータを得る
際のサンプ点と第2図アナログ波形との関係図、第4図
はNm個のデータより発生した波形図、第5図はアルゴ
リズム説明図である。第〆図 第2図 第J図 第4図 繁J図
際のサンプ点と第2図アナログ波形との関係図、第4図
はNm個のデータより発生した波形図、第5図はアルゴ
リズム説明図である。第〆図 第2図 第J図 第4図 繁J図
Claims (1)
- 1 N個の音素片の各データP_h_k(k=1、2、
……N)に対しP_h_kとP_h_k_−_1のデー
タ間を直線で結んだ疑似アナログ波形を得、これを再度
異なつたサンプル数MでサンプリングしN個のデータ数
の素片からM個のデータを作製して音素片間の補間を行
なうようにした音素片編集型音声合成の補間方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56197944A JPS6040629B2 (ja) | 1981-12-08 | 1981-12-08 | 音素片編集型音声合成の補間方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56197944A JPS6040629B2 (ja) | 1981-12-08 | 1981-12-08 | 音素片編集型音声合成の補間方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5898798A JPS5898798A (ja) | 1983-06-11 |
JPS6040629B2 true JPS6040629B2 (ja) | 1985-09-11 |
Family
ID=16382889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56197944A Expired JPS6040629B2 (ja) | 1981-12-08 | 1981-12-08 | 音素片編集型音声合成の補間方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6040629B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0289127U (ja) * | 1988-12-28 | 1990-07-16 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0266598A (ja) * | 1988-09-01 | 1990-03-06 | Matsushita Electric Ind Co Ltd | 音声信号圧縮伸張装置 |
DE60232560D1 (de) | 2001-08-31 | 2009-07-16 | Kenwood Hachioji Kk | Vorrichtung und Verfahren zur Erzeugung eines Signals mit konstanten Grundfrequenz und Vorrichtung sowie Verfahren zum Synthetisieren von Sprachsignalen unter Verwendung dieser Signals mit konstanten Grundfrequenz. |
-
1981
- 1981-12-08 JP JP56197944A patent/JPS6040629B2/ja not_active Expired
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0289127U (ja) * | 1988-12-28 | 1990-07-16 |
Also Published As
Publication number | Publication date |
---|---|
JPS5898798A (ja) | 1983-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS63285598A (ja) | 音素接続形パラメ−タ規則合成方式 | |
JPH1097287A (ja) | 周期信号変換方法、音変換方法および信号分析方法 | |
JP2018136430A (ja) | 音声変換モデル学習装置、音声変換装置、方法、及びプログラム | |
Bonada et al. | Sample-based singing voice synthesizer by spectral concatenation | |
JP3732793B2 (ja) | 音声合成方法、音声合成装置及び記録媒体 | |
JPH08254993A (ja) | 音声合成装置 | |
JPS6040629B2 (ja) | 音素片編集型音声合成の補間方式 | |
Bonada et al. | Generation of growl-type voice qualities by spectral morphing | |
JPS6017120B2 (ja) | 音素片編型音声合成方式 | |
JPH07261798A (ja) | 音声分析合成装置 | |
JP3294192B2 (ja) | 音声変換装置及び音声変換方法 | |
CN107851433B (zh) | 基于谐波模型和声源-声道特征分解的语音分析合成方法 | |
JPS6040628B2 (ja) | 音素片編集型音声合成の補間方式 | |
JP3949828B2 (ja) | 音声変換装置及び音声変換方法 | |
JP2674280B2 (ja) | 音声合成装置 | |
JPH05127697A (ja) | ホルマントの線形転移区間の分割による音声の合成方法 | |
JPS62139599A (ja) | 音声合成装置 | |
JPS5898800A (ja) | 音素片編集型音声合成方式 | |
JPH02248999A (ja) | 音声認識方式 | |
Navakauskas et al. | Multirate implementation scheme for restoration of voiced speech signals | |
JP3206128B2 (ja) | ループ波形生成装置及びループ波形生成方法 | |
Paulikas et al. | Multirate implementation for restoration of voiced speech signals | |
JP2650480B2 (ja) | 音声合成装置 | |
JPH0582959B2 (ja) | ||
JP2000003199A (ja) | 音声変換装置及び音声変換方法 |