JP2675883B2 - 音声合成方式 - Google Patents
音声合成方式Info
- Publication number
- JP2675883B2 JP2675883B2 JP1343119A JP34311989A JP2675883B2 JP 2675883 B2 JP2675883 B2 JP 2675883B2 JP 1343119 A JP1343119 A JP 1343119A JP 34311989 A JP34311989 A JP 34311989A JP 2675883 B2 JP2675883 B2 JP 2675883B2
- Authority
- JP
- Japan
- Prior art keywords
- vowel
- parameter
- speech
- voice
- unvoiced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は、素片編集による音声規則合成方式に関する
ものである。
ものである。
[従来の技術] 従来文字列データから音声を生成するための、音声規
則合成方式がある。これは、文字列データの情報に従っ
て、音声素片のファイルに登録された音声素片の特徴パ
ラメータ(LPC,PARCOR,LSP,メルケプストラムなど。以
下単にパラメータと呼ぶことにする)を取り出し、一定
の規則に基づいてパラメータと駆動音源信号(有声音声
区間ではインパルス列、無声音声区間ではノイズ)を合
成音声の発声速度に応じて伸縮させて結合し、音声合成
器に与えることにより合成音声を得ている。ここで音声
素片の種類としては、CV(子音−母音)素片、VCV(子
音−母音−子音)等を用いるのが一般的である。
則合成方式がある。これは、文字列データの情報に従っ
て、音声素片のファイルに登録された音声素片の特徴パ
ラメータ(LPC,PARCOR,LSP,メルケプストラムなど。以
下単にパラメータと呼ぶことにする)を取り出し、一定
の規則に基づいてパラメータと駆動音源信号(有声音声
区間ではインパルス列、無声音声区間ではノイズ)を合
成音声の発声速度に応じて伸縮させて結合し、音声合成
器に与えることにより合成音声を得ている。ここで音声
素片の種類としては、CV(子音−母音)素片、VCV(子
音−母音−子音)等を用いるのが一般的である。
人間が単語、あるいは文章などを発声する場合、前後
の音韻環境によって母音が無声化する場合がある。例え
ば“一式(いっしき)”と発声する場合には、“し”の
母音/i/が無声化する。従来これを規則合成において実
現するために、“し”の母音部/i/を合成する際に、パ
ラメータは変更せずに、駆動音源信号を、有声音を合成
るためのインパルス列から無声音を合成するためのノイ
ズに変えることにより無声化の効果を得るようにしてい
た。
の音韻環境によって母音が無声化する場合がある。例え
ば“一式(いっしき)”と発声する場合には、“し”の
母音/i/が無声化する。従来これを規則合成において実
現するために、“し”の母音部/i/を合成する際に、パ
ラメータは変更せずに、駆動音源信号を、有声音を合成
るためのインパルス列から無声音を合成するためのノイ
ズに変えることにより無声化の効果を得るようにしてい
た。
[発明が解決しようとしている問題点] 従来の方法では、本来有声音であり、インパルス音源
で合成すべき特徴パラメータをむりやりノイズ音源で合
成するために、本来の無声化母音の音声とは異なった、
不自然な合成音声となる傾向があった。
で合成すべき特徴パラメータをむりやりノイズ音源で合
成するために、本来の無声化母音の音声とは異なった、
不自然な合成音声となる傾向があった。
また、母音を無声化した音声素片データを別に持つ方
法を考えられるが、保持しておく情報量が大きくなる等
の問題があった。
法を考えられるが、保持しておく情報量が大きくなる等
の問題があった。
[問題点を解決するための手段] 本発明では、母音の無声化を行う際に、無声化する母
音部のパラメータとして該母音の直前の子音のパラメー
タを駆動音源としてノイズ音源を用いることにより、自
然な無声母音を得ることを可能とする音声合成方式を提
供することを目的としている。
音部のパラメータとして該母音の直前の子音のパラメー
タを駆動音源としてノイズ音源を用いることにより、自
然な無声母音を得ることを可能とする音声合成方式を提
供することを目的としている。
[実施例] まず、母音の無声化が起こる場合の音韻環境について
説明する。
説明する。
(1)無声化する母音は/i/(い)と/u/(う) (2)無声化する母音の直前の子音は無声摩擦音/s/,/h
/,/c/,/f/と、破裂音/p/,/t/,/k/ (3)無声化する母音に後続する子音がある場合、その
子音は破裂性の子音/p/,/t/,/k/ 以上の条件を満たす場合に、母音の無声化を行う。尚、
語尾の場合には、(1)、(2)の条件を満たす場合に
母音の無声化を行う。
/,/c/,/f/と、破裂音/p/,/t/,/k/ (3)無声化する母音に後続する子音がある場合、その
子音は破裂性の子音/p/,/t/,/k/ 以上の条件を満たす場合に、母音の無声化を行う。尚、
語尾の場合には、(1)、(2)の条件を満たす場合に
母音の無声化を行う。
[実施例1] 第1図は本発明の第1の実施例を最もよく表す図面で
あり、同図において(a)は無声化すべき音声区間を含
む音声素片データ、(b)は音声素片のパラメータ系
列、(c)は母音の無声化部分のパラメータ系列を直前
の子音のパラメータ系列に置き換えた後のパラメータ系
列、(d)はその結果得られる無声化した音声素片デー
タ、(e)は(d)の無声化音声素片データのパワー制
御関数、(f)はパワー制御された無声化音声波形であ
る。以下図面に従って母音を音声化する場合の方法につ
いて説明する。
あり、同図において(a)は無声化すべき音声区間を含
む音声素片データ、(b)は音声素片のパラメータ系
列、(c)は母音の無声化部分のパラメータ系列を直前
の子音のパラメータ系列に置き換えた後のパラメータ系
列、(d)はその結果得られる無声化した音声素片デー
タ、(e)は(d)の無声化音声素片データのパワー制
御関数、(f)はパワー制御された無声化音声波形であ
る。以下図面に従って母音を音声化する場合の方法につ
いて説明する。
前述したような母音の無声化が起こる条件に従って母
音が無声化すると判断されたら、データベースから無声
化する母音を含む音声素片データ(実質的には音声を分
析して得られる特徴パラメータ系列(b))を取り出
す。このとき音声素片のデータには(a)に示すように
音響的な境界の情報を示すラベルが付けられている。ラ
ベルの情報から、母音の開始位置から終了位置迄の区間
Vのデータを、子音定常区間Cのデータに変更する。そ
の方法としては、子音定常区間Cのパラメータを(c)
に示すように母音終了位置まで線形に引伸し、区間Vに
子音パラメータを入れる。そして区間Vの音源はノイズ
音源を選択するように設定する。
音が無声化すると判断されたら、データベースから無声
化する母音を含む音声素片データ(実質的には音声を分
析して得られる特徴パラメータ系列(b))を取り出
す。このとき音声素片のデータには(a)に示すように
音響的な境界の情報を示すラベルが付けられている。ラ
ベルの情報から、母音の開始位置から終了位置迄の区間
Vのデータを、子音定常区間Cのデータに変更する。そ
の方法としては、子音定常区間Cのパラメータを(c)
に示すように母音終了位置まで線形に引伸し、区間Vに
子音パラメータを入れる。そして区間Vの音源はノイズ
音源を選択するように設定する。
また、音声素片を接続する際にパワーのギャップが生
じ、異音が発声するのを防ぐために、パワーの制御を行
う必要がある場合には、(d)に示すように、無声区間
の終了位置付近で値が0になるようなパワー制御特性補
正関数を設定して、パラメータのパワー項に適用するこ
とによりパワー制御を行う。メルケプストラム係数の場
合には、パラメータが対数値で表されるため、パワー項
からパワー特性補正関数を差し引くことによりパワーの
制御を行うことができる。
じ、異音が発声するのを防ぐために、パワーの制御を行
う必要がある場合には、(d)に示すように、無声区間
の終了位置付近で値が0になるようなパワー制御特性補
正関数を設定して、パラメータのパワー項に適用するこ
とによりパワー制御を行う。メルケプストラム係数の場
合には、パラメータが対数値で表されるため、パワー項
からパワー特性補正関数を差し引くことによりパワーの
制御を行うことができる。
以上の実施例の動作は第3図に示す構成において実行
される。第3図において、1は合成すべき単語あるいは
文章を入力するテキスト入力部、2は入力されたテキス
トを解析して音韻系列に分解したり、テキスト中に含ま
れるコントロールコード(アクセント情報や発声速度な
どを制御するコード)を解析する為のテキスト解析部、
3はテキスト解析部2からの制御情報からピッチを生成
するピッチ生成部、6はパラメータ読み出し部5で読み
出した音声素片のパワーの正規化を行うパワー正規化
部、7はパワー正規化部6で用いるパワーの基準値を記
憶しておく為のパワー正規化データ格納部、8はパワー
の正規化を行った音声素片データを接続するパラメータ
接続部、9は接続されたパラメータ系列とピッチ情報か
ら音声波形を生成する音声合成部、10は音声波形を出力
する為の出力手段である。
される。第3図において、1は合成すべき単語あるいは
文章を入力するテキスト入力部、2は入力されたテキス
トを解析して音韻系列に分解したり、テキスト中に含ま
れるコントロールコード(アクセント情報や発声速度な
どを制御するコード)を解析する為のテキスト解析部、
3はテキスト解析部2からの制御情報からピッチを生成
するピッチ生成部、6はパラメータ読み出し部5で読み
出した音声素片のパワーの正規化を行うパワー正規化
部、7はパワー正規化部6で用いるパワーの基準値を記
憶しておく為のパワー正規化データ格納部、8はパワー
の正規化を行った音声素片データを接続するパラメータ
接続部、9は接続されたパラメータ系列とピッチ情報か
ら音声波形を生成する音声合成部、10は音声波形を出力
する為の出力手段である。
以上の実施例1では音声素片がCV(子音−母音)の場
合について説明したが、音声素片の種類はCVに限定され
るものではない。音声素片がCV素片よりも大きい場合
(例えばCVC素片など、子音と母音あるいは子音と子音
を接続するような場合)についても同様の方法により母
音の無声化を行うことができる。
合について説明したが、音声素片の種類はCVに限定され
るものではない。音声素片がCV素片よりも大きい場合
(例えばCVC素片など、子音と母音あるいは子音と子音
を接続するような場合)についても同様の方法により母
音の無声化を行うことができる。
[実施例2] 次に音声素片がVCV(母音−子音−母音)の場合(音
声素片を接続する際に母音と母音を接続するような場
合)についての実施例について説明する。
声素片を接続する際に母音と母音を接続するような場
合)についての実施例について説明する。
第2図は本発明の第2の実施例を表わす図面であり、
同図において(a)は無声化すべき音声区間を含むVCV
接続音声。(b)は(a)における音声区間Vを無声化
した場合の音声波形を表す。
同図において(a)は無声化すべき音声区間を含むVCV
接続音声。(b)は(a)における音声区間Vを無声化
した場合の音声波形を表す。
以下図面に従って説明する。データベースから音声素
片データを取り出す。VCV素片を用いて接続する場合に
は、(a)に示すように先行のVCV素片と後続のVCV素片
の母音定常部を補間して接続するのが一般的である。こ
の場合母音を無声化しようとすれば先行VCVと後続VCVに
はさまれる母音を無声化することになる。そこでVCV素
片をモーラ位置に合わせて位置し、(b)に示すよう
に、先行のVCVの後ろのV開始点から後続VCVの前のV終
了点までの母音区間Vのデータを、先行VCVの子音の定
常区間Cのデータに変更する。その方法は実施例1でも
述べたように、子音定常区間Cのパラメータを母音終了
位置まで線形に引伸し、音源をノイズにすることにより
母音区間を無声化する。パワーの制御を行う必要がある
場合には、第1図の実施例に記載された方法によりパワ
ー制御を行うことが可能である。
片データを取り出す。VCV素片を用いて接続する場合に
は、(a)に示すように先行のVCV素片と後続のVCV素片
の母音定常部を補間して接続するのが一般的である。こ
の場合母音を無声化しようとすれば先行VCVと後続VCVに
はさまれる母音を無声化することになる。そこでVCV素
片をモーラ位置に合わせて位置し、(b)に示すよう
に、先行のVCVの後ろのV開始点から後続VCVの前のV終
了点までの母音区間Vのデータを、先行VCVの子音の定
常区間Cのデータに変更する。その方法は実施例1でも
述べたように、子音定常区間Cのパラメータを母音終了
位置まで線形に引伸し、音源をノイズにすることにより
母音区間を無声化する。パワーの制御を行う必要がある
場合には、第1図の実施例に記載された方法によりパワ
ー制御を行うことが可能である。
本実施例も実施例1と同じく、第3図に示す構造にお
いて実行される。
いて実行される。
尚本発明は上記記載の実施例に限定されることなく、
種々の変形が可能である。例えば上記実施例において
は、母音区間のパラメータを子音区間のパラメータに変
更する場合、子音の定常区間を母音終了点まで線形に引
伸すようにしているが、母音区間に子音の定常部の一部
のパラメータをコピーして、パラメータを置換えるよう
にしても良い。
種々の変形が可能である。例えば上記実施例において
は、母音区間のパラメータを子音区間のパラメータに変
更する場合、子音の定常区間を母音終了点まで線形に引
伸すようにしているが、母音区間に子音の定常部の一部
のパラメータをコピーして、パラメータを置換えるよう
にしても良い。
[発明の効果] 本発明において、母音の無声化を行う際に、無声化す
る母音部のパラメータとして該母音の直前の子音のパラ
メータを駆動音源としてノイズ音源を用いることによ
り、自然な無声母音を得ることが可能となった。
る母音部のパラメータとして該母音の直前の子音のパラ
メータを駆動音源としてノイズ音源を用いることによ
り、自然な無声母音を得ることが可能となった。
第1図は本発明の第1の実施例 第2図は本発明の第2の実施例 第3図は本発明の第1の実施例の構成を示すブロック図
───────────────────────────────────────────────────── フロントページの続き (72)発明者 川崎 勝彦 東京都大田区下丸子3丁目30番2号 キ ヤノン株式会社内 (56)参考文献 特開 昭61−270800(JP,A) NHK編「日本語発音アクセント辞典 −改訂新版」−解説・付録−日本放送出 版協会
Claims (4)
- 【請求項1】合成すべき音声の音韻系列に応じて、音声
素片ファイルに登録された特徴パラメータと駆動音源と
を合成音声の発生速度に応じて伸縮させ、順次接続して
音声合成器に与え、合成音声を出力する音声規則合成方
式であって、無声化する母音のパラメータとして該母音
の直前の子音のパラメータを用い、ノイズを駆動音源に
して無声化した母音を合成することを特徴とする音声合
成方式。 - 【請求項2】母音の無声化が起こる条件に基づいて母音
が無声化するか否か判断することを特徴とする請求項
(1)に記載の音声合成方式。 - 【請求項3】無声化する母音の音声区間におけるパラメ
ータは該母音の直前の子音のパラメータを母音区間まで
引伸すことにより得ることを特徴とする請求項(1)に
記載の音声合成方式。 - 【請求項4】無声化する母音の音声区間におけるパラメ
ータは該母音の直前の子音のパラメータを母音区間に複
写することにより得ることを特徴とする請求項(1)に
記載の音声合成方式。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1343119A JP2675883B2 (ja) | 1989-12-29 | 1989-12-29 | 音声合成方式 |
EP90312074A EP0427485B1 (en) | 1989-11-06 | 1990-11-05 | Speech synthesis apparatus and method |
US07/608,757 US5220629A (en) | 1989-11-06 | 1990-11-05 | Speech synthesis apparatus and method |
DE69028072T DE69028072T2 (de) | 1989-11-06 | 1990-11-05 | Verfahren und Einrichtung zur Sprachsynthese |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1343119A JP2675883B2 (ja) | 1989-12-29 | 1989-12-29 | 音声合成方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03203793A JPH03203793A (ja) | 1991-09-05 |
JP2675883B2 true JP2675883B2 (ja) | 1997-11-12 |
Family
ID=18359077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1343119A Expired - Fee Related JP2675883B2 (ja) | 1989-11-06 | 1989-12-29 | 音声合成方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2675883B2 (ja) |
-
1989
- 1989-12-29 JP JP1343119A patent/JP2675883B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
NHK編「日本語発音アクセント辞典−改訂新版」−解説・付録−日本放送出版協会 |
Also Published As
Publication number | Publication date |
---|---|
JPH03203793A (ja) | 1991-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Clark et al. | Festival 2–build your own general purpose unit selection speech synthesiser | |
US9218803B2 (en) | Method and system for enhancing a speech database | |
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
US20060259303A1 (en) | Systems and methods for pitch smoothing for text-to-speech synthesis | |
JP2000206982A (ja) | 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体 | |
US6212501B1 (en) | Speech synthesis apparatus and method | |
JPH1039895A (ja) | 音声合成方法および装置 | |
US7912718B1 (en) | Method and system for enhancing a speech database | |
Stöber et al. | Speech synthesis using multilevel selection and concatenation of units from large speech corpora | |
JP2761552B2 (ja) | 音声合成方法 | |
US8510112B1 (en) | Method and system for enhancing a speech database | |
JPH08335096A (ja) | テキスト音声合成装置 | |
van Rijnsoever | A multilingual text-to-speech system | |
JP2675883B2 (ja) | 音声合成方式 | |
JP3109778B2 (ja) | 音声規則合成装置 | |
JP3060276B2 (ja) | 音声合成装置 | |
JP2703253B2 (ja) | 音声合成装置 | |
JP2900454B2 (ja) | 音声合成装置の音節データ作成方式 | |
JPH0667685A (ja) | 音声合成装置 | |
JP2880507B2 (ja) | 音声合成方法 | |
JP3303428B2 (ja) | 音声合成装置のアクセント成分基本テーブルの作成方法 | |
JP2004206144A (ja) | 基本周波数パタン生成方法、及びプログラム記録媒体 | |
JPH08160983A (ja) | 音声合成装置 | |
JPH09325788A (ja) | 音声合成装置及び方法 | |
JPH03203800A (ja) | 音声合成方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080718 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080718 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090718 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |