JPS6040628B2 - 音素片編集型音声合成の補間方式 - Google Patents
音素片編集型音声合成の補間方式Info
- Publication number
- JPS6040628B2 JPS6040628B2 JP56197943A JP19794381A JPS6040628B2 JP S6040628 B2 JPS6040628 B2 JP S6040628B2 JP 56197943 A JP56197943 A JP 56197943A JP 19794381 A JP19794381 A JP 19794381A JP S6040628 B2 JPS6040628 B2 JP S6040628B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- phoneme
- speech synthesis
- interpolation method
- type speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000000034 method Methods 0.000 title claims description 9
- 230000015572 biosynthetic process Effects 0.000 title description 3
- 238000003786 synthesis reaction Methods 0.000 title description 3
- 238000005070 sampling Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000001308 synthesis method Methods 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Landscapes
- Complex Calculations (AREA)
- Telephone Function (AREA)
- Electrophonic Musical Instruments (AREA)
Description
【発明の詳細な説明】
本発明は音素片編集型音声合成の補間方式に関し、その
目的とするところは出力音声の振幅あるいはホルマント
周波数のなめらかな桶間を行うことにある。
目的とするところは出力音声の振幅あるいはホルマント
周波数のなめらかな桶間を行うことにある。
従来、マイクロコンピュータ、ROMおよび0/A変換
器を構成要素とする音素片編集型音声合成装置では、R
OM中に書き込まれた音声のピッチ単位からなる特定の
音素片データを複数回繰り返して1個の音韻単位を構成
し、これらの音韻単位を順次接続することによってまと
まった単語音声を得ている。
器を構成要素とする音素片編集型音声合成装置では、R
OM中に書き込まれた音声のピッチ単位からなる特定の
音素片データを複数回繰り返して1個の音韻単位を構成
し、これらの音韻単位を順次接続することによってまと
まった単語音声を得ている。
このため、従釆の音素片編集型音声合成方式では前記R
OMの音素片によって決定される音韻の境界面で合成音
の振幅、ピッチ周波およびホルマント周波数が急激に変
化する。このため今までの音素片編集型音声合成方式で
は、なめらかな音声のつながりが得られない欠点がある
。なお、同出願人は特顔昭56−82645号によって
音素片間になめらかなつながりを得る方法を提案されて
いるが、この方法では各秦片のサンプル数を同じ‘こす
るために素片ごとにピッチ周期に合わせてサンプリング
時間を変化させる必要があるため、発声用マイクロコン
ピュータで処理することが困難である。
OMの音素片によって決定される音韻の境界面で合成音
の振幅、ピッチ周波およびホルマント周波数が急激に変
化する。このため今までの音素片編集型音声合成方式で
は、なめらかな音声のつながりが得られない欠点がある
。なお、同出願人は特顔昭56−82645号によって
音素片間になめらかなつながりを得る方法を提案されて
いるが、この方法では各秦片のサンプル数を同じ‘こす
るために素片ごとにピッチ周期に合わせてサンプリング
時間を変化させる必要があるため、発声用マイクロコン
ピュータで処理することが困難である。
そこで本発明は音素片のデータ数をN個とした際、その
N個の各データ点Phk(k=1、2、……N)に対し
てそれぞれ(k=1)TSt<k7または(k−2)?
きt<(k−1)↑などで表わされる時間領域を割り当
て、データ点数をM個に変更するにあたって、M個の各
データの時間軸上の位置が上記時間領域に何れに入るか
により、それと対応するPhkのデータ値をそのサンプ
ル点のデータとすることにより、N個のデータ秦片から
M個のデータ素片を作製して音素片間の補間を行い、発
生用マイクロコンピュータでなめらかな音声のつながり
を実現したものであって、以下本発明の一実施例を図面
に基づいて説明する。
N個の各データ点Phk(k=1、2、……N)に対し
てそれぞれ(k=1)TSt<k7または(k−2)?
きt<(k−1)↑などで表わされる時間領域を割り当
て、データ点数をM個に変更するにあたって、M個の各
データの時間軸上の位置が上記時間領域に何れに入るか
により、それと対応するPhkのデータ値をそのサンプ
ル点のデータとすることにより、N個のデータ秦片から
M個のデータ素片を作製して音素片間の補間を行い、発
生用マイクロコンピュータでなめらかな音声のつながり
を実現したものであって、以下本発明の一実施例を図面
に基づいて説明する。
先ず、音声データよりその1ピッチについて各周波数成
分の位相を変化させ、これらを全て00および1800
から始まる正弦波で置換した音素片を第1式に示す。但
し、 oPhnは音素片nを示す。
分の位相を変化させ、これらを全て00および1800
から始まる正弦波で置換した音素片を第1式に示す。但
し、 oPhnは音素片nを示す。
oiは基本角周波数(ピッチ周波数)の第i次高調波を
示す。
示す。
oAniは第i次高調波の振幅値を示す。
ownは音素片nの基本角周波数を示す。
この音素片を量子化する場合、そのサンプル時間7秒は
遮断角周波数のcによって第2式のように定まる。
遮断角周波数のcによって第2式のように定まる。
7<OL(サンプリング定理より)・…・・第2式00
Cサンプリング時間7秒で第1式を量子化すると、音素
片nのj番目のサンプリングデータPhnjは第3式で
表わされる。
Cサンプリング時間7秒で第1式を量子化すると、音素
片nのj番目のサンプリングデータPhnjは第3式で
表わされる。
ここでNnは
のc≧Nnのn ……第4式となる最大
の整数であり、同時にNnはサンプルデータ数に等しい
。
の整数であり、同時にNnはサンプルデータ数に等しい
。
一方、第2式と第4式よりZL>Nn・す
…・・・第5式○リn但し、Nnはこの式を満す
最大の整数となる。
…・・・第5式○リn但し、Nnはこの式を満す
最大の整数となる。
■nは素片ごとに異なる値で、本発明では丁を一定値に
固定し、その結果得られた各素片のデータ数Nnを補間
実行時に変化させることにより、桶間すべき両端の音素
片のデータ数を等しくしている。桶間すべき両端の音素
片をそれぞれPhn、Phmとし、そのデータ数をNn
、Nmとする。
固定し、その結果得られた各素片のデータ数Nnを補間
実行時に変化させることにより、桶間すべき両端の音素
片のデータ数を等しくしている。桶間すべき両端の音素
片をそれぞれPhn、Phmとし、そのデータ数をNn
、Nmとする。
この素片を式で表わし、Phn={Phnilj=1、
・・・・・・,Nn} ・・・・・・第6式Phm=
{P胸klk=1、……,Nm} ……第7式とする
。
・・・・・・,Nn} ・・・・・・第6式Phm=
{P胸klk=1、……,Nm} ……第7式とする
。
両索片の基本角間波数のnが等しくない場合、ヶを一定
とするため、どうしてもNnとNmは異なる整数になる
。この場合、一方の素片のデータをもう一方の素片のデ
ータ数と等しくする操作を行う。たとえば、Phmのデ
ータ数をPhnと同じにする場合、Phmの各データ点
Phmxに対し時間領域(k−1)7≦t<k7を割り
当てる。そしてPhmからNn個のデータ数を得た場合
の各サンプル点Phmiの時間軸上の位置TP仙川TP
血(t)ニ(i−・)7′工(i−・)(N母三÷7)
‐‐‐‐‐‐第8式が上記の時間領域のどこに入るか
により、入った領域のPhmkをそのサンプル点Phm
iのデータとする。
とするため、どうしてもNnとNmは異なる整数になる
。この場合、一方の素片のデータをもう一方の素片のデ
ータ数と等しくする操作を行う。たとえば、Phmのデ
ータ数をPhnと同じにする場合、Phmの各データ点
Phmxに対し時間領域(k−1)7≦t<k7を割り
当てる。そしてPhmからNn個のデータ数を得た場合
の各サンプル点Phmiの時間軸上の位置TP仙川TP
血(t)ニ(i−・)7′工(i−・)(N母三÷7)
‐‐‐‐‐‐第8式が上記の時間領域のどこに入るか
により、入った領域のPhmkをそのサンプル点Phm
iのデータとする。
これによりPhmからNnN個のデータを簡易的に求め
ることができる。第1図にある音素片データPhmのデ
ータを示す。
ることができる。第1図にある音素片データPhmのデ
ータを示す。
横軸は時間t、縦藤はパワーを表わしている。サンプル
時間丁(一定)によりデータ数Nmは定まる。この例の
場合、Nm=9である。第2図はNm個の素片データP
hmk〔k=1、…・・・、Nm)に時間領域(k−1
)7≦t<kヶを割り当て、その間のデータをPhmk
としたグラフである。第3図ではPhmをNn個でサン
プリングした場合の各点に対応するPhmkの領域を示
している。
時間丁(一定)によりデータ数Nmは定まる。この例の
場合、Nm=9である。第2図はNm個の素片データP
hmk〔k=1、…・・・、Nm)に時間領域(k−1
)7≦t<kヶを割り当て、その間のデータをPhmk
としたグラフである。第3図ではPhmをNn個でサン
プリングした場合の各点に対応するPhmkの領域を示
している。
この例の場合はNn=11である。第4図ではPhmi
(i=1、……、Nn)の値を対応する領域のPhmk
の値とした場合の波形を示している。
(i=1、……、Nn)の値を対応する領域のPhmk
の値とした場合の波形を示している。
この例でNm<NnであるがNm>Nnの場合でも同じ
操作を行なう。
操作を行なう。
但し、この場合、データ数変換に伴う誤差が生じるのは
やむを得ないが、実際には補間を行う素片間ではデータ
数の大きく異なる場合はほとんどなく、その誤差は補間
のメリットに比べ充分に無視できるものである。第5図
は以上説明の処理を用いた発生方式のアルゴリズムを示
す。
やむを得ないが、実際には補間を行う素片間ではデータ
数の大きく異なる場合はほとんどなく、その誤差は補間
のメリットに比べ充分に無視できるものである。第5図
は以上説明の処理を用いた発生方式のアルゴリズムを示
す。
なお、素片データに対し割り当てる時間領域は、(k−
1)7≦t<k↑以外にも、(k−2)すくt≦(Kk
−1)7などのように、その選び方はかくつも考えられ
るが、意図する所は同じである。
1)7≦t<k↑以外にも、(k−2)すくt≦(Kk
−1)7などのように、その選び方はかくつも考えられ
るが、意図する所は同じである。
以上説明のように本発明の桶間方式によると、秦片側の
桶間は桶間を行う秦片のデータ数が等しい場合のみなら
ず、データ数の異なる秦片間での補間も簡単なアルゴリ
ズムを追加することにより実現することができ、発声用
マイクロコンピュータで出力音声の振幅値あるいはホル
マント周波数のなめらかな補間を行うことができるもの
である。
桶間は桶間を行う秦片のデータ数が等しい場合のみなら
ず、データ数の異なる秦片間での補間も簡単なアルゴリ
ズムを追加することにより実現することができ、発声用
マイクロコンピュータで出力音声の振幅値あるいはホル
マント周波数のなめらかな補間を行うことができるもの
である。
図面は本発明の一実施例であって、第1図はある音素片
のデータ図、第2図はNm個の黍片データを時間領域に
割り当てた説明図、第3図は第1図におけるサンプリン
グ点に第2図を対応させた説明図、第4図は発声波形図
、第5図はアルゴリズム説明図である。 簾ノ図 第タ図 第J図 第4図 繋J図
のデータ図、第2図はNm個の黍片データを時間領域に
割り当てた説明図、第3図は第1図におけるサンプリン
グ点に第2図を対応させた説明図、第4図は発声波形図
、第5図はアルゴリズム説明図である。 簾ノ図 第タ図 第J図 第4図 繋J図
Claims (1)
- 1 音素片のデータ数をN個とした際、そのN個の各デ
ータ点P_h_k(k=1、2、……N)に対してそれ
ぞれ(k−1)τ≦t<kτまたは(k−2)τ<t≦
(k−1)τなどで表わされる時間領域を割り当て、デ
ータ点数をM個に変更にするにあたつて、M個の各デー
タの時間軸上の位置が上記時間領域の何れに入るかによ
り、それに対応するP_h_kのデータ値をそのサンプ
ル点のデータとし、N個のデータ素片からM個のデータ
素片を作製して音素片間の補間を行うようにした音素片
編集型音声合成の補間方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56197943A JPS6040628B2 (ja) | 1981-12-08 | 1981-12-08 | 音素片編集型音声合成の補間方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56197943A JPS6040628B2 (ja) | 1981-12-08 | 1981-12-08 | 音素片編集型音声合成の補間方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5898797A JPS5898797A (ja) | 1983-06-11 |
| JPS6040628B2 true JPS6040628B2 (ja) | 1985-09-11 |
Family
ID=16382871
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56197943A Expired JPS6040628B2 (ja) | 1981-12-08 | 1981-12-08 | 音素片編集型音声合成の補間方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6040628B2 (ja) |
-
1981
- 1981-12-08 JP JP56197943A patent/JPS6040628B2/ja not_active Expired
Also Published As
| Publication number | Publication date |
|---|---|
| JPS5898797A (ja) | 1983-06-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2595235B2 (ja) | 音声合成装置 | |
| JP3266819B2 (ja) | 周期信号変換方法、音変換方法および信号分析方法 | |
| CA1065490A (en) | Emphasis controlled speech synthesizer | |
| JPH0863197A (ja) | 符号化音声信号の復号化方法 | |
| JPS63285598A (ja) | 音素接続形パラメ−タ規則合成方式 | |
| CN112037755B (zh) | 一种基于音色克隆的语音合成方法、装置及电子设备 | |
| JP2018136430A (ja) | 音声変換モデル学習装置、音声変換装置、方法、及びプログラム | |
| JPH10319996A (ja) | 雑音の効率的分解と波形補間における周期信号波形 | |
| Nercessian | Differentiable WORLD synthesizer-based neural vocoder with application to end-to-end audio style transfer | |
| Bonada et al. | Sample-based singing voice synthesizer by spectral concatenation | |
| GB2050125A (en) | Data converter for a speech synthesizer | |
| JP2018004870A (ja) | 音声合成装置および音声合成方法 | |
| JPS6040628B2 (ja) | 音素片編集型音声合成の補間方式 | |
| US4601052A (en) | Voice analysis composing method | |
| JPS6040629B2 (ja) | 音素片編集型音声合成の補間方式 | |
| JP4830350B2 (ja) | 声質変換装置、及びプログラム | |
| JPS5816297A (ja) | 音声合成方式 | |
| Vích et al. | Pitch synchronous transform warping in voice conversion | |
| JPS62139599A (ja) | 音声合成装置 | |
| JP3294192B2 (ja) | 音声変換装置及び音声変換方法 | |
| JP2011247921A (ja) | 信号合成方法、信号合成装置及びプログラム | |
| JP3206128B2 (ja) | ループ波形生成装置及びループ波形生成方法 | |
| Tabet et al. | Speech Analysis–Synthesis Using Sinusoidal Representations: A Review | |
| JPH01283600A (ja) | 残差駆動型音声合成装置 | |
| JPS5898800A (ja) | 音素片編集型音声合成方式 |