JPH0370000A - 音声合成方法 - Google Patents
音声合成方法Info
- Publication number
- JPH0370000A JPH0370000A JP1204726A JP20472689A JPH0370000A JP H0370000 A JPH0370000 A JP H0370000A JP 1204726 A JP1204726 A JP 1204726A JP 20472689 A JP20472689 A JP 20472689A JP H0370000 A JPH0370000 A JP H0370000A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- sound
- sound source
- voiced
- frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 title description 7
- 238000003786 synthesis reaction Methods 0.000 title description 7
- 230000005284 excitation Effects 0.000 claims abstract description 23
- 238000001308 synthesis method Methods 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 claims description 2
- 230000001755 vocal effect Effects 0.000 abstract description 13
- 230000002159 abnormal effect Effects 0.000 abstract description 8
- 238000000034 method Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000630 rising effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野コ
この発明は音声生成過程を模擬した音声生成モデルによ
る音声合成方法に係り、特に滑らかな合成音声を得るた
めの音源励振タイミングの設定方法に関する。
る音声合成方法に係り、特に滑らかな合成音声を得るた
めの音源励振タイミングの設定方法に関する。
[従来の技術]
音声合成の代表的な方法として、音声波形を時間的に区
切った短い区間(以後、フレームと呼ぶ)毎に、そのフ
レームの音声の特徴を表すパラメータ(有声/無声判別
情報、ピッチ周期情報、振幅情報、声道情報)を求め、
このフレーム音声特徴パラメータで音声生成モデルを駆
動すること−により、音声を合成する形式がある。例え
ばPARCOR形(偏自己相関形)、LSP形(線スペ
クトル対形)などが、この形式にあたる。
切った短い区間(以後、フレームと呼ぶ)毎に、そのフ
レームの音声の特徴を表すパラメータ(有声/無声判別
情報、ピッチ周期情報、振幅情報、声道情報)を求め、
このフレーム音声特徴パラメータで音声生成モデルを駆
動すること−により、音声を合成する形式がある。例え
ばPARCOR形(偏自己相関形)、LSP形(線スペ
クトル対形)などが、この形式にあたる。
第2図に従来の音声合成器の一構成例を示す。
100は無音もしくは無声音をノイズで近似するための
雑音発生器、101.は有声音をパルス列で近似するた
めのインパルス発生器であって、音声特徴パラメータの
うちのピッチ周期情報を、ピッチ周期毎にインパルスを
発生する。
雑音発生器、101.は有声音をパルス列で近似するた
めのインパルス発生器であって、音声特徴パラメータの
うちのピッチ周期情報を、ピッチ周期毎にインパルスを
発生する。
102は有声/無声判別情報により雑音発生器100又
はインパルス発生器101の出力を選択する切換スイッ
チで、判別情報が有声の場合にはインパルス発生器lo
tからの疑似音源信号を、また無声音の場合には雑音発
生器100からの疑似音源信号を択一的に切り換える。
はインパルス発生器101の出力を選択する切換スイッ
チで、判別情報が有声の場合にはインパルス発生器lo
tからの疑似音源信号を、また無声音の場合には雑音発
生器100からの疑似音源信号を択一的に切り換える。
103は切換スイッチ102により選択された疑似音源
信号に対し振幅情報を乗じる乗算器、104は合成フィ
ルタであって、声道情報(PARCOR係数、LSP係
数など)によって音声を合成するための声道フィルタを
構成する。107は合成音の出力端子、105,106
はそれぞれ乗算器103と声道フィルタ104のための
補間器である。
信号に対し振幅情報を乗じる乗算器、104は合成フィ
ルタであって、声道情報(PARCOR係数、LSP係
数など)によって音声を合成するための声道フィルタを
構成する。107は合成音の出力端子、105,106
はそれぞれ乗算器103と声道フィルタ104のための
補間器である。
補間器105,106はフレーム周期毎に受は取る音声
特徴パラメータのうち、フレーム間の振幅情報と声道情
報とを適当な補間周期(フレーム周期より短いサブフレ
ームあるいはlサンプリング周期)毎に補間し、合成音
における振幅と声道特性とのフレーム間での不連続を軽
減し、より実音声に近い滑らかな変化特性とするために
備えられている。
特徴パラメータのうち、フレーム間の振幅情報と声道情
報とを適当な補間周期(フレーム周期より短いサブフレ
ームあるいはlサンプリング周期)毎に補間し、合成音
における振幅と声道特性とのフレーム間での不連続を軽
減し、より実音声に近い滑らかな変化特性とするために
備えられている。
このような構成において、100〜103は疑似音源発
生回路を構成するものであり、この100〜103の音
源発生回路から発生された疑似音源信号を声道フィルタ
104に通すことにより合成音が出力端子107より出
力される。
生回路を構成するものであり、この100〜103の音
源発生回路から発生された疑似音源信号を声道フィルタ
104に通すことにより合成音が出力端子107より出
力される。
ここでピッチ周期毎にインパルスを発生するために必要
なインパルス発生器101の構戎例について述べる。
なインパルス発生器101の構戎例について述べる。
インパルス発生器101は内部にカウンタとインパルス
発生回路とを持ち、フレーム音声特徴パラメータの一部
として外部から与えられるピッチ周期をカウンタにセッ
トし、サンプリング周期に同期してカウンタをカウント
ダウンしていく。カウントが“0”になった時点(音源
励振位置)で有声音を近似するインパルスを出力する。
発生回路とを持ち、フレーム音声特徴パラメータの一部
として外部から与えられるピッチ周期をカウンタにセッ
トし、サンプリング周期に同期してカウンタをカウント
ダウンしていく。カウントが“0”になった時点(音源
励振位置)で有声音を近似するインパルスを出力する。
この出力と同時に現フレームのピッチ周期をカウンタに
セットして、ピッチ周期毎にパルスを発生するように構
成される。
セットして、ピッチ周期毎にパルスを発生するように構
成される。
[発明が解決しようとする課題]
ところで、従来この種のインパルス発生器においては、
インパルスを発生する時点(音源励振位置)とフレーム
との関係は余り考慮されていなかった。
インパルスを発生する時点(音源励振位置)とフレーム
との関係は余り考慮されていなかった。
すなわち、音声合成器の動作開始時点、あるいは直前の
フレームが無音もしくは無声音の場合におけるフレーム
の開始時点では、共にピッチが存在しないわけであるか
ら、上記したカウンタの値は不定である。したがって通
常、このような時点ではフレームの開始位置で現フレー
ムのピッチ周期情報の生成を待ってカウンタにセットし
、それからカウントダウンを開始させることになる。こ
のため、パルスが発生するのは現フレームの開始点t。
フレームが無音もしくは無声音の場合におけるフレーム
の開始時点では、共にピッチが存在しないわけであるか
ら、上記したカウンタの値は不定である。したがって通
常、このような時点ではフレームの開始位置で現フレー
ムのピッチ周期情報の生成を待ってカウンタにセットし
、それからカウントダウンを開始させることになる。こ
のため、パルスが発生するのは現フレームの開始点t。
から現フレームのピッチ周期を経た時点1゜となる(第
3図(a))。なお、第3図は有声音フレームの直前の
フレームが無音もしくは無声音の場合の音声合成器の各
部の波形を示している。
3図(a))。なお、第3図は有声音フレームの直前の
フレームが無音もしくは無声音の場合の音声合成器の各
部の波形を示している。
一方、第2図においてインパルス発生器101の出力は
切換スイッチ102を経て乗算器103に入力される。
切換スイッチ102を経て乗算器103に入力される。
ここではフレーム音声特徴パラメータの一部として与え
られる音源強度、すなわち音源振幅情報がインパルス発
生器101の出力に乗ぜられ、有声音疑似音源として声
道フィルタ1o4に入力される。先にも述べた通り乗算
器103に人力される振幅情報は、フレームパラメータ
として与えられる振幅を補間器105によって補間した
値であるが、第3図に示すように前フレームが無音であ
った場合、あるいは微小振幅の無声音であった場合、第
3図(b)または(C)に示すように発声の立上がり部
分の振幅増加の度合はかなり大きくなる。これは音声の
特徴として、立下がり振幅変化は比較的ゆるやかである
が、発声の立上がり部分の振幅の増加は急峻だからであ
る。
られる音源強度、すなわち音源振幅情報がインパルス発
生器101の出力に乗ぜられ、有声音疑似音源として声
道フィルタ1o4に入力される。先にも述べた通り乗算
器103に人力される振幅情報は、フレームパラメータ
として与えられる振幅を補間器105によって補間した
値であるが、第3図に示すように前フレームが無音であ
った場合、あるいは微小振幅の無声音であった場合、第
3図(b)または(C)に示すように発声の立上がり部
分の振幅増加の度合はかなり大きくなる。これは音声の
特徴として、立下がり振幅変化は比較的ゆるやかである
が、発声の立上がり部分の振幅の増加は急峻だからであ
る。
第3図(b)、(C)の立上がり部分の振幅増加がもっ
とゆるやかであれば問題はないのであるが、現実には上
記した理由で立上がり部分の振幅増加の度合がかなり大
きくなる。このため第3図(a)のパルス列に対する乗
算器103の疑似音源出力は、たとえ第3図(b)、(
C)のようにフレーム間の不連続性を軽減するために振
幅補間を施したとしても、第3図(d)に示すように、
ピッチ周期隔てた時点t、での音源インパルスはかなり
の振幅を有することになる。
とゆるやかであれば問題はないのであるが、現実には上
記した理由で立上がり部分の振幅増加の度合がかなり大
きくなる。このため第3図(a)のパルス列に対する乗
算器103の疑似音源出力は、たとえ第3図(b)、(
C)のようにフレーム間の不連続性を軽減するために振
幅補間を施したとしても、第3図(d)に示すように、
ピッチ周期隔てた時点t、での音源インパルスはかなり
の振幅を有することになる。
したがって、このような疑似音源を用いて生成された合
成音は第3図(e)に示されるように振幅が急激に立ち
上がるため、合成音中に振幅の不連続による異音が混入
して合成音の品質が劣化する。
成音は第3図(e)に示されるように振幅が急激に立ち
上がるため、合成音中に振幅の不連続による異音が混入
して合成音の品質が劣化する。
因に、この異音は一般的には「ブツッ」という音として
知覚される。例えば、ラジオやテレビの時報音は通常s
in波によって形成しているが、振幅を緩やかに上げて
から一定振幅にした後、緩やかに下げているので、その
立上がりや立下がり時には異音の発生はない。しかし、
急激に一定振幅に持って行ったり、急激に振幅を“0“
にすると、その立上がりや立下がりに「ブツッ」という
異音が発生する。これと同じ現象が音声合成においても
起こるのである。
知覚される。例えば、ラジオやテレビの時報音は通常s
in波によって形成しているが、振幅を緩やかに上げて
から一定振幅にした後、緩やかに下げているので、その
立上がりや立下がり時には異音の発生はない。しかし、
急激に一定振幅に持って行ったり、急激に振幅を“0“
にすると、その立上がりや立下がりに「ブツッ」という
異音が発生する。これと同じ現象が音声合成においても
起こるのである。
この発明の目的は、無音から有音に切り換わった直後の
第1回目の音源励振位置をピッチ周期に拘束されないよ
うにすることによって、音源振幅の急激な変化による合
成音の劣化という従来技術の問題点を除去し、合成音の
品質を向上させる音声合成方法を提供することにある。
第1回目の音源励振位置をピッチ周期に拘束されないよ
うにすることによって、音源振幅の急激な変化による合
成音の劣化という従来技術の問題点を除去し、合成音の
品質を向上させる音声合成方法を提供することにある。
[課題を解決するための手段]
この発明の音声合成方法は、フレーム周期毎にピッチ周
期を初めとする音声特徴パラメータを求め、前記パラメ
ータを用いてフレームを有声音フレームト無音フレーム
もしくは無声音フレームとに分け、無音もしくは無声音
フレームのときは無声音源を近似する音源信号を発生し
、有声音フレームのときは有声音源を近似する音源信号
をピッチ周期毎に同期させた音源励振位置で発生し、こ
れら音源信号に振幅補間を施して音声を合成するように
したものである。
期を初めとする音声特徴パラメータを求め、前記パラメ
ータを用いてフレームを有声音フレームト無音フレーム
もしくは無声音フレームとに分け、無音もしくは無声音
フレームのときは無声音源を近似する音源信号を発生し
、有声音フレームのときは有声音源を近似する音源信号
をピッチ周期毎に同期させた音源励振位置で発生し、こ
れら音源信号に振幅補間を施して音声を合成するように
したものである。
このような方法において、特に前記フレームの状態が無
音フレームもしくは無声音フレームから有声音フレーム
に切り換わった直後の有声音フレームの少なくとも第1
回目の音源励振位置を、音源信号振幅の概形が滑らかに
変化するように前記有声音フレームの開始時点からピッ
チ周期に特定されない成る適当時間隔てた位置に設定す
るようにしたものである。
音フレームもしくは無声音フレームから有声音フレーム
に切り換わった直後の有声音フレームの少なくとも第1
回目の音源励振位置を、音源信号振幅の概形が滑らかに
変化するように前記有声音フレームの開始時点からピッ
チ周期に特定されない成る適当時間隔てた位置に設定す
るようにしたものである。
[作用]
有声音源信号の振幅概形の急激な変化は無音→有声音、
無声音→有声音の切り換わりの有声音フレームの開始か
ら第1回目の音源信号の励振が発せられるまでの時間間
隔が長すぎることに起因している。
無声音→有声音の切り換わりの有声音フレームの開始か
ら第1回目の音源信号の励振が発せられるまでの時間間
隔が長すぎることに起因している。
音声のピッチ周期はおおよそ2 m5ec= l 2r
asec程度に分布し、ピッチ周期が長い程この現象が
顕著に現れる。
asec程度に分布し、ピッチ周期が長い程この現象が
顕著に現れる。
従って無音→有声音、無声音→有声音の切り換わり直後
の有声音フレームに限り少なくとも第1回目の音源励振
位置をピッチ周期に特定せず、振幅概形が滑らかに変化
するような時間位置に予め設定することにより、前記の
問題は解消される。
の有声音フレームに限り少なくとも第1回目の音源励振
位置をピッチ周期に特定せず、振幅概形が滑らかに変化
するような時間位置に予め設定することにより、前記の
問題は解消される。
この予め設定すべき時間間隔はピッチ周期の下限である
2 m5ec前後に設定すれば、第1回目の音源励振位
置が有声音フレームの開始時点に近くなる。
2 m5ec前後に設定すれば、第1回目の音源励振位
置が有声音フレームの開始時点に近くなる。
したがって、有声音フレームの開始時点から振幅情報が
急激に立ち上がっても、その立上がりの初期に第1回目
の音源信号が発生する。その結果、音源信号の振幅がか
なり小さくなるため、合成音中の振幅の不連続による異
音は全く知覚されなくなる。
急激に立ち上がっても、その立上がりの初期に第1回目
の音源信号が発生する。その結果、音源信号の振幅がか
なり小さくなるため、合成音中の振幅の不連続による異
音は全く知覚されなくなる。
[実施例]
以下、この発明の実施例を第1図、第4図〜第5図を用
いて説明する。なお、本実施例では無音→有声音、無声
音→有声音の切り換わり時についての音声合成について
説明するが、これは音声合成器の動作開始時点にも共通
する。
いて説明する。なお、本実施例では無音→有声音、無声
音→有声音の切り換わり時についての音声合成について
説明するが、これは音声合成器の動作開始時点にも共通
する。
第1図はこの発明の音声合成方法を実施するための音源
パルス発生回路の一例を示す。ここで200はピッチ周
期Tpの入力端子、201は無音→有声音、無声音→有
声音の切り換わり直後の第1回目の音源励振位置を決め
る予め設定した時間長Ta(例えば2 m5ec)の入
力端子、202はセレクト信号に応じてTpまたはTa
を選択するセレクタ、203はセレクタ202のセレク
ト信号S1の入力端子、204はロードされた値をサン
プリングクロックTに基づいてダウンカウントしてイン
パルス発生のタイミングを得るためのカウンタである。
パルス発生回路の一例を示す。ここで200はピッチ周
期Tpの入力端子、201は無音→有声音、無声音→有
声音の切り換わり直後の第1回目の音源励振位置を決め
る予め設定した時間長Ta(例えば2 m5ec)の入
力端子、202はセレクト信号に応じてTpまたはTa
を選択するセレクタ、203はセレクタ202のセレク
ト信号S1の入力端子、204はロードされた値をサン
プリングクロックTに基づいてダウンカウントしてイン
パルス発生のタイミングを得るためのカウンタである。
205はカウンタ204の出力端子、206はカウンタ
204から出力されるパルス発生タイミング信号に応じ
て有声音の音源信号(音源パルス)を発生するパルス発
生回路、207は音源パルス(振幅情報を乗じる前の信
号)出力端子である。210はカウンタ204のパルス
発生タイミング信号が出力さてたとき、又はクロックC
K Lが出力されたときセレクタ202の出力をカウン
タ204にロードする論理和回路である。
204から出力されるパルス発生タイミング信号に応じ
て有声音の音源信号(音源パルス)を発生するパルス発
生回路、207は音源パルス(振幅情報を乗じる前の信
号)出力端子である。210はカウンタ204のパルス
発生タイミング信号が出力さてたとき、又はクロックC
K Lが出力されたときセレクタ202の出力をカウン
タ204にロードする論理和回路である。
また、第5図は第1図の音源パルス発生回路における音
源パルス発生処理のタイムチャートである。第5図(a
)はサンプリングクロックT、第5図(b)はカウンタ
204の内容をアナログ的に表示したグラフ、第5図(
C)はCKL、第5図(d)はパルス発生タイミング信
号、第5図(e)はセレクタ202のセレクト信号Sl
である。またTfはフレーム周期である。
源パルス発生処理のタイムチャートである。第5図(a
)はサンプリングクロックT、第5図(b)はカウンタ
204の内容をアナログ的に表示したグラフ、第5図(
C)はCKL、第5図(d)はパルス発生タイミング信
号、第5図(e)はセレクタ202のセレクト信号Sl
である。またTfはフレーム周期である。
以下、第1図、第5図に従ってフレームの状態が無音も
しくは無声音フレームから有声音フレームに変化した場
合の有声音源発生の動作について説明する。 まず始め
に、セレクト信号入力端子203に入力されるセレクト
信号S1および論理和回路210に入力されるCKLに
ついて説明する。
しくは無声音フレームから有声音フレームに変化した場
合の有声音源発生の動作について説明する。 まず始め
に、セレクト信号入力端子203に入力されるセレクト
信号S1および論理和回路210に入力されるCKLに
ついて説明する。
セレクト信号S、はフレームの状態を示す信号となって
おりフレームが無声音あるいは無音のとき“■”で、セ
レクタ202はA人力すなわちTaを選択し、有声音の
とき“0”となってB入力すなわちTpを選択する。た
だしこのフレーム状態信号であるセレクト信号Slは実
際のフレームに対して半周期(T/2)だけ遅らせであ
る。CK Lによるカウンタ204へのロードを確実に
するためである。
おりフレームが無声音あるいは無音のとき“■”で、セ
レクタ202はA人力すなわちTaを選択し、有声音の
とき“0”となってB入力すなわちTpを選択する。た
だしこのフレーム状態信号であるセレクト信号Slは実
際のフレームに対して半周期(T/2)だけ遅らせであ
る。CK Lによるカウンタ204へのロードを確実に
するためである。
一方、CKLは第5図(C)にそのタイミングを示して
いるが、無音→有声音あるいは無声音→有声音のフレー
ム切り換わり時の、有声音のフレーム開始時にのみ発せ
られる信号である。このCKLは論理和回路210を経
てカウンタ204のロード信号となる。
いるが、無音→有声音あるいは無声音→有声音のフレー
ム切り換わり時の、有声音のフレーム開始時にのみ発せ
られる信号である。このCKLは論理和回路210を経
てカウンタ204のロード信号となる。
従って、無音→有声音もしくは無声音→有声音切り換わ
り時における第1図の回路の動作は、有声音フレーム開
始時点t0でCK L、により、カウンタ204にロー
ド信号が入力され、そのときセレクタ202はセレクト
信号S、により固定値Taが選択されているためカウン
タ204ではTaがセットされる。
り時における第1図の回路の動作は、有声音フレーム開
始時点t0でCK L、により、カウンタ204にロー
ド信号が入力され、そのときセレクタ202はセレクト
信号S、により固定値Taが選択されているためカウン
タ204ではTaがセットされる。
カウンタ204はサンプリングクロックTによりダウン
カウント動作を行い、カウンタ出力値が“O”になった
時、パルス発生タイミング信号S。
カウント動作を行い、カウンタ出力値が“O”になった
時、パルス発生タイミング信号S。
をカウンタ出力端子205から発する。すなわち、無声
音→有声音あるいは無音→有声音の変化時には、有声音
フレームの開始点t。からTa時間経過した時点で、ま
ず第1の音源パルスがパルス発生回路206から発生さ
れる。パルス発生タイミング信号S、はパルス発生回路
206に入力されるとともに、論理和回路210を経て
カウンタ204のロード信号となる。
音→有声音あるいは無音→有声音の変化時には、有声音
フレームの開始点t。からTa時間経過した時点で、ま
ず第1の音源パルスがパルス発生回路206から発生さ
れる。パルス発生タイミング信号S、はパルス発生回路
206に入力されるとともに、論理和回路210を経て
カウンタ204のロード信号となる。
この時点(Ta経過時点)ではセレクト信号SIは既に
“O”となっており、以後有声音フレームが続く限りセ
レクタ202はその時点でのフレーム(現フレーム)の
ピッチ周期Tpを選択し、その値をカウンタ204にロ
ードし、ピッチ周期毎に音源パルスが発せられる。
“O”となっており、以後有声音フレームが続く限りセ
レクタ202はその時点でのフレーム(現フレーム)の
ピッチ周期Tpを選択し、その値をカウンタ204にロ
ードし、ピッチ周期毎に音源パルスが発せられる。
このようにして音源発生回路の動作により発せられた音
源パルスに、補間後の振幅情報を乗じた音源信号を第4
図に示す。同図に示されるように振幅情報を乗じた第1
回目の音源信号の振幅Vは小さなり、これに続く2回目
以降の音源信号から形成される振幅概形には急激な変化
がなく、これにより滑らかな合成音が生成可能となる。
源パルスに、補間後の振幅情報を乗じた音源信号を第4
図に示す。同図に示されるように振幅情報を乗じた第1
回目の音源信号の振幅Vは小さなり、これに続く2回目
以降の音源信号から形成される振幅概形には急激な変化
がなく、これにより滑らかな合成音が生成可能となる。
以上述べたように本実施例によれば、無音→有声音、無
声音→有声音の切り換わり直後の有声音フレームにあっ
ては、第1回目の音源励振位置を、ピッチ周期情報の生
成を待つことなく、ピンチ周期よりも手前に設定するよ
うにしたので、音声情報振幅が急激に立ち上がっても、
その立上がりの低い段階でインパルスが発生するため、
音源インパルスの振幅は小さくなり、したがって、合成
音中に異音が混入して合成音の品質が劣化するというこ
とがない。
声音→有声音の切り換わり直後の有声音フレームにあっ
ては、第1回目の音源励振位置を、ピッチ周期情報の生
成を待つことなく、ピンチ周期よりも手前に設定するよ
うにしたので、音声情報振幅が急激に立ち上がっても、
その立上がりの低い段階でインパルスが発生するため、
音源インパルスの振幅は小さくなり、したがって、合成
音中に異音が混入して合成音の品質が劣化するというこ
とがない。
我々がおこなった実験によれば、第1回目の音源励振位
置を2 m5ec前後に設定した場合には、合成音中の
振幅の不連続による異音は全く知覚されなかった。
置を2 m5ec前後に設定した場合には、合成音中の
振幅の不連続による異音は全く知覚されなかった。
なお、この発明は既述したPARCOR形やLSP形の
分析合成形式の外にホルマント形やケプストラム形等に
も適用できる。
分析合成形式の外にホルマント形やケプストラム形等に
も適用できる。
また、上記実施例では音源パルス発生回路をセレクタ、
カウンタ、論理和回路、パルス発生回路、で構成したが
、本発明方法を実施するためにの回路は、このような構
成の回路に限定されるものではない。例えばピッチ周期
をカウンタにロードして、その値がカウントダウンによ
り0”になったとき、即ちピッチ周期と一致させて音源
パルスを発生させる方式ではなく、一致させな(でもピ
ッチ周期と同期させて音源パルスを発生させる方式の回
路であってもよい。また個別回路に代えてマイクロコン
ピュータで構成することもできる。
カウンタ、論理和回路、パルス発生回路、で構成したが
、本発明方法を実施するためにの回路は、このような構
成の回路に限定されるものではない。例えばピッチ周期
をカウンタにロードして、その値がカウントダウンによ
り0”になったとき、即ちピッチ周期と一致させて音源
パルスを発生させる方式ではなく、一致させな(でもピ
ッチ周期と同期させて音源パルスを発生させる方式の回
路であってもよい。また個別回路に代えてマイクロコン
ピュータで構成することもできる。
さらに、上記実施例ではlピッチ周期の中で音源励振位
置をずらしたが、本発明はこれに限定されるこのではな
く、1ピッチ周期を越えて音源励振位置をずらすことも
可能である。
置をずらしたが、本発明はこれに限定されるこのではな
く、1ピッチ周期を越えて音源励振位置をずらすことも
可能である。
また、第1回目の音源励振位置のみをピッチ周期に拘束
されないようにしたが、滑らかな音源振幅が得られるの
であれば第2回目以降の音源励振位置も時間設定するよ
うにしてもよい。
されないようにしたが、滑らかな音源振幅が得られるの
であれば第2回目以降の音源励振位置も時間設定するよ
うにしてもよい。
[発明の効果]
無声音フレームから有声音フレームに切り換わった直後
の有声音フレームの少なくとも第1回目の音源励振位置
を、音源信号振幅が滑らかに変化するように有声音フレ
ームの開始時点からピッチ周期に特定されない所定時間
隔てた位置に設定するようにしたので、音源信号の振幅
には急激な変化がなくなり、滑らかな合成音が生成でき
、合成音の品質を向上できる。
の有声音フレームの少なくとも第1回目の音源励振位置
を、音源信号振幅が滑らかに変化するように有声音フレ
ームの開始時点からピッチ周期に特定されない所定時間
隔てた位置に設定するようにしたので、音源信号の振幅
には急激な変化がなくなり、滑らかな合成音が生成でき
、合成音の品質を向上できる。
第1図は本発明による音源パルス発生回路の一実施例を
示すブロック図、第2図は一般的な音声合成器の構成を
示すブロック図、第3図は従来の合成音特性図、第4図
は本実施例による音源パルス特性図、第5図は音源パル
ス発生処理のタイムチャートである。 100は無声音源を近似する音源信号を発生する雑音発
生器、101は有声音源を近似する音源信号を発生する
インパルス発生器、105は振幅補間を行う補間器、■
は音源信号振幅、toは有声音フレームの開始時点、1
.は第1回目の音源励振位置、Tfはフレーム周期、T
p(Tpi。 Tpi+l)はピッチ周期、Taは所定時間である。 浬− ト−
示すブロック図、第2図は一般的な音声合成器の構成を
示すブロック図、第3図は従来の合成音特性図、第4図
は本実施例による音源パルス特性図、第5図は音源パル
ス発生処理のタイムチャートである。 100は無声音源を近似する音源信号を発生する雑音発
生器、101は有声音源を近似する音源信号を発生する
インパルス発生器、105は振幅補間を行う補間器、■
は音源信号振幅、toは有声音フレームの開始時点、1
.は第1回目の音源励振位置、Tfはフレーム周期、T
p(Tpi。 Tpi+l)はピッチ周期、Taは所定時間である。 浬− ト−
Claims (1)
- 【特許請求の範囲】 フレーム周期毎にピッチ周期を初めとする音声特徴パラ
メータを求め、前記パラメータを用いてフレームを有声
音フレームと無音フレームもしくは無声音フレームとに
分け、無音もしくは無声音フレームのときは無声音源を
近似する音源信号を発生し、有声音フレームのときは有
声音源を近似する音源信号をピッチ周期毎に同期させた
音源励振位置で発生し、これら音源信号に振幅補間を施
して音声を合成するようにした音声合成方法において、 前記フレームの状態が無音フレームもしくは無声音フレ
ームから有声音フレームに切り換わった直後の有声音フ
レームの少なくとも第1回目の音源励振位置を、音源信
号振幅が滑らかに変化するように前記有声音フレームの
開始時点からピッチ周期に特定されない所定時間隔てた
位置に設定することを特徴とする音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1204726A JPH0370000A (ja) | 1989-08-09 | 1989-08-09 | 音声合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1204726A JPH0370000A (ja) | 1989-08-09 | 1989-08-09 | 音声合成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0370000A true JPH0370000A (ja) | 1991-03-26 |
Family
ID=16495295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1204726A Pending JPH0370000A (ja) | 1989-08-09 | 1989-08-09 | 音声合成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0370000A (ja) |
-
1989
- 1989-08-09 JP JP1204726A patent/JPH0370000A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6024191B2 (ja) | 音声合成装置および音声合成方法 | |
JPH086592A (ja) | 音声合成方法及び装置 | |
JP3430985B2 (ja) | 合成音生成装置 | |
EP0391545B1 (en) | Speech synthesizer | |
JPH0232399A (ja) | 音声合成装置 | |
JPS645720B2 (ja) | ||
US7418388B2 (en) | Voice synthesizing method using independent sampling frequencies and apparatus therefor | |
Dutilleux et al. | Time‐segment Processing | |
JPH0370000A (ja) | 音声合成方法 | |
JP2600384B2 (ja) | 音声合成方法 | |
JPH1078791A (ja) | ピッチ変換器 | |
JPS5925239B2 (ja) | パラメ−タ補間方式 | |
Fries | Hybrid time-and frequency-domain speech synthesis with extended glottal source generation | |
JPH04116700A (ja) | 音声分析・合成装置 | |
JP3089940B2 (ja) | 音声合成装置 | |
JPS6053999A (ja) | 音声合成器 | |
JPS5848920B2 (ja) | 音声合成器の音源作成装置 | |
JP2614436B2 (ja) | 音声合成装置 | |
JP3331656B2 (ja) | 音響装置 | |
JPS6332595A (ja) | エコ−ミユ−テイング装置 | |
JPH05108097A (ja) | 音声合成装置 | |
JPS62100027A (ja) | 音声符号化方式 | |
JPH03200299A (ja) | 音声合成装置 | |
JPH01304499A (ja) | 音声合成方法とその装置 | |
JPH01224800A (ja) | 残差駆動型音声合成装置 |