JP2675883B2 - 音声合成方式 - Google Patents

音声合成方式

Info

Publication number
JP2675883B2
JP2675883B2 JP1343119A JP34311989A JP2675883B2 JP 2675883 B2 JP2675883 B2 JP 2675883B2 JP 1343119 A JP1343119 A JP 1343119A JP 34311989 A JP34311989 A JP 34311989A JP 2675883 B2 JP2675883 B2 JP 2675883B2
Authority
JP
Japan
Prior art keywords
vowel
parameter
speech
voice
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1343119A
Other languages
English (en)
Other versions
JPH03203793A (ja
Inventor
隆 麻生
武 藤田
恭則 大洞
勝彦 川崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1343119A priority Critical patent/JP2675883B2/ja
Priority to EP90312074A priority patent/EP0427485B1/en
Priority to US07/608,757 priority patent/US5220629A/en
Priority to DE69028072T priority patent/DE69028072T2/de
Publication of JPH03203793A publication Critical patent/JPH03203793A/ja
Application granted granted Critical
Publication of JP2675883B2 publication Critical patent/JP2675883B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、素片編集による音声規則合成方式に関する
ものである。
[従来の技術] 従来文字列データから音声を生成するための、音声規
則合成方式がある。これは、文字列データの情報に従っ
て、音声素片のファイルに登録された音声素片の特徴パ
ラメータ(LPC,PARCOR,LSP,メルケプストラムなど。以
下単にパラメータと呼ぶことにする)を取り出し、一定
の規則に基づいてパラメータと駆動音源信号(有声音声
区間ではインパルス列、無声音声区間ではノイズ)を合
成音声の発声速度に応じて伸縮させて結合し、音声合成
器に与えることにより合成音声を得ている。ここで音声
素片の種類としては、CV(子音−母音)素片、VCV(子
音−母音−子音)等を用いるのが一般的である。
人間が単語、あるいは文章などを発声する場合、前後
の音韻環境によって母音が無声化する場合がある。例え
ば“一式(いっしき)”と発声する場合には、“し”の
母音/i/が無声化する。従来これを規則合成において実
現するために、“し”の母音部/i/を合成する際に、パ
ラメータは変更せずに、駆動音源信号を、有声音を合成
るためのインパルス列から無声音を合成するためのノイ
ズに変えることにより無声化の効果を得るようにしてい
た。
[発明が解決しようとしている問題点] 従来の方法では、本来有声音であり、インパルス音源
で合成すべき特徴パラメータをむりやりノイズ音源で合
成するために、本来の無声化母音の音声とは異なった、
不自然な合成音声となる傾向があった。
また、母音を無声化した音声素片データを別に持つ方
法を考えられるが、保持しておく情報量が大きくなる等
の問題があった。
[問題点を解決するための手段] 本発明では、母音の無声化を行う際に、無声化する母
音部のパラメータとして該母音の直前の子音のパラメー
タを駆動音源としてノイズ音源を用いることにより、自
然な無声母音を得ることを可能とする音声合成方式を提
供することを目的としている。
[実施例] まず、母音の無声化が起こる場合の音韻環境について
説明する。
(1)無声化する母音は/i/(い)と/u/(う) (2)無声化する母音の直前の子音は無声摩擦音/s/,/h
/,/c/,/f/と、破裂音/p/,/t/,/k/ (3)無声化する母音に後続する子音がある場合、その
子音は破裂性の子音/p/,/t/,/k/ 以上の条件を満たす場合に、母音の無声化を行う。尚、
語尾の場合には、(1)、(2)の条件を満たす場合に
母音の無声化を行う。
[実施例1] 第1図は本発明の第1の実施例を最もよく表す図面で
あり、同図において(a)は無声化すべき音声区間を含
む音声素片データ、(b)は音声素片のパラメータ系
列、(c)は母音の無声化部分のパラメータ系列を直前
の子音のパラメータ系列に置き換えた後のパラメータ系
列、(d)はその結果得られる無声化した音声素片デー
タ、(e)は(d)の無声化音声素片データのパワー制
御関数、(f)はパワー制御された無声化音声波形であ
る。以下図面に従って母音を音声化する場合の方法につ
いて説明する。
前述したような母音の無声化が起こる条件に従って母
音が無声化すると判断されたら、データベースから無声
化する母音を含む音声素片データ(実質的には音声を分
析して得られる特徴パラメータ系列(b))を取り出
す。このとき音声素片のデータには(a)に示すように
音響的な境界の情報を示すラベルが付けられている。ラ
ベルの情報から、母音の開始位置から終了位置迄の区間
Vのデータを、子音定常区間Cのデータに変更する。そ
の方法としては、子音定常区間Cのパラメータを(c)
に示すように母音終了位置まで線形に引伸し、区間Vに
子音パラメータを入れる。そして区間Vの音源はノイズ
音源を選択するように設定する。
また、音声素片を接続する際にパワーのギャップが生
じ、異音が発声するのを防ぐために、パワーの制御を行
う必要がある場合には、(d)に示すように、無声区間
の終了位置付近で値が0になるようなパワー制御特性補
正関数を設定して、パラメータのパワー項に適用するこ
とによりパワー制御を行う。メルケプストラム係数の場
合には、パラメータが対数値で表されるため、パワー項
からパワー特性補正関数を差し引くことによりパワーの
制御を行うことができる。
以上の実施例の動作は第3図に示す構成において実行
される。第3図において、1は合成すべき単語あるいは
文章を入力するテキスト入力部、2は入力されたテキス
トを解析して音韻系列に分解したり、テキスト中に含ま
れるコントロールコード(アクセント情報や発声速度な
どを制御するコード)を解析する為のテキスト解析部、
3はテキスト解析部2からの制御情報からピッチを生成
するピッチ生成部、6はパラメータ読み出し部5で読み
出した音声素片のパワーの正規化を行うパワー正規化
部、7はパワー正規化部6で用いるパワーの基準値を記
憶しておく為のパワー正規化データ格納部、8はパワー
の正規化を行った音声素片データを接続するパラメータ
接続部、9は接続されたパラメータ系列とピッチ情報か
ら音声波形を生成する音声合成部、10は音声波形を出力
する為の出力手段である。
以上の実施例1では音声素片がCV(子音−母音)の場
合について説明したが、音声素片の種類はCVに限定され
るものではない。音声素片がCV素片よりも大きい場合
(例えばCVC素片など、子音と母音あるいは子音と子音
を接続するような場合)についても同様の方法により母
音の無声化を行うことができる。
[実施例2] 次に音声素片がVCV(母音−子音−母音)の場合(音
声素片を接続する際に母音と母音を接続するような場
合)についての実施例について説明する。
第2図は本発明の第2の実施例を表わす図面であり、
同図において(a)は無声化すべき音声区間を含むVCV
接続音声。(b)は(a)における音声区間Vを無声化
した場合の音声波形を表す。
以下図面に従って説明する。データベースから音声素
片データを取り出す。VCV素片を用いて接続する場合に
は、(a)に示すように先行のVCV素片と後続のVCV素片
の母音定常部を補間して接続するのが一般的である。こ
の場合母音を無声化しようとすれば先行VCVと後続VCVに
はさまれる母音を無声化することになる。そこでVCV素
片をモーラ位置に合わせて位置し、(b)に示すよう
に、先行のVCVの後ろのV開始点から後続VCVの前のV終
了点までの母音区間Vのデータを、先行VCVの子音の定
常区間Cのデータに変更する。その方法は実施例1でも
述べたように、子音定常区間Cのパラメータを母音終了
位置まで線形に引伸し、音源をノイズにすることにより
母音区間を無声化する。パワーの制御を行う必要がある
場合には、第1図の実施例に記載された方法によりパワ
ー制御を行うことが可能である。
本実施例も実施例1と同じく、第3図に示す構造にお
いて実行される。
尚本発明は上記記載の実施例に限定されることなく、
種々の変形が可能である。例えば上記実施例において
は、母音区間のパラメータを子音区間のパラメータに変
更する場合、子音の定常区間を母音終了点まで線形に引
伸すようにしているが、母音区間に子音の定常部の一部
のパラメータをコピーして、パラメータを置換えるよう
にしても良い。
[発明の効果] 本発明において、母音の無声化を行う際に、無声化す
る母音部のパラメータとして該母音の直前の子音のパラ
メータを駆動音源としてノイズ音源を用いることによ
り、自然な無声母音を得ることが可能となった。
【図面の簡単な説明】
第1図は本発明の第1の実施例 第2図は本発明の第2の実施例 第3図は本発明の第1の実施例の構成を示すブロック図
───────────────────────────────────────────────────── フロントページの続き (72)発明者 川崎 勝彦 東京都大田区下丸子3丁目30番2号 キ ヤノン株式会社内 (56)参考文献 特開 昭61−270800(JP,A) NHK編「日本語発音アクセント辞典 −改訂新版」−解説・付録−日本放送出 版協会

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】合成すべき音声の音韻系列に応じて、音声
    素片ファイルに登録された特徴パラメータと駆動音源と
    を合成音声の発生速度に応じて伸縮させ、順次接続して
    音声合成器に与え、合成音声を出力する音声規則合成方
    式であって、無声化する母音のパラメータとして該母音
    の直前の子音のパラメータを用い、ノイズを駆動音源に
    して無声化した母音を合成することを特徴とする音声合
    成方式。
  2. 【請求項2】母音の無声化が起こる条件に基づいて母音
    が無声化するか否か判断することを特徴とする請求項
    (1)に記載の音声合成方式。
  3. 【請求項3】無声化する母音の音声区間におけるパラメ
    ータは該母音の直前の子音のパラメータを母音区間まで
    引伸すことにより得ることを特徴とする請求項(1)に
    記載の音声合成方式。
  4. 【請求項4】無声化する母音の音声区間におけるパラメ
    ータは該母音の直前の子音のパラメータを母音区間に複
    写することにより得ることを特徴とする請求項(1)に
    記載の音声合成方式。
JP1343119A 1989-11-06 1989-12-29 音声合成方式 Expired - Fee Related JP2675883B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP1343119A JP2675883B2 (ja) 1989-12-29 1989-12-29 音声合成方式
EP90312074A EP0427485B1 (en) 1989-11-06 1990-11-05 Speech synthesis apparatus and method
US07/608,757 US5220629A (en) 1989-11-06 1990-11-05 Speech synthesis apparatus and method
DE69028072T DE69028072T2 (de) 1989-11-06 1990-11-05 Verfahren und Einrichtung zur Sprachsynthese

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1343119A JP2675883B2 (ja) 1989-12-29 1989-12-29 音声合成方式

Publications (2)

Publication Number Publication Date
JPH03203793A JPH03203793A (ja) 1991-09-05
JP2675883B2 true JP2675883B2 (ja) 1997-11-12

Family

ID=18359077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1343119A Expired - Fee Related JP2675883B2 (ja) 1989-11-06 1989-12-29 音声合成方式

Country Status (1)

Country Link
JP (1) JP2675883B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NHK編「日本語発音アクセント辞典−改訂新版」−解説・付録−日本放送出版協会

Also Published As

Publication number Publication date
JPH03203793A (ja) 1991-09-05

Similar Documents

Publication Publication Date Title
Clark et al. Festival 2–build your own general purpose unit selection speech synthesiser
US9218803B2 (en) Method and system for enhancing a speech database
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
US20060259303A1 (en) Systems and methods for pitch smoothing for text-to-speech synthesis
JP2000206982A (ja) 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体
US6212501B1 (en) Speech synthesis apparatus and method
JPH1039895A (ja) 音声合成方法および装置
US7912718B1 (en) Method and system for enhancing a speech database
Stöber et al. Speech synthesis using multilevel selection and concatenation of units from large speech corpora
JP2761552B2 (ja) 音声合成方法
US8510112B1 (en) Method and system for enhancing a speech database
JPH08335096A (ja) テキスト音声合成装置
van Rijnsoever A multilingual text-to-speech system
JP2675883B2 (ja) 音声合成方式
JP3109778B2 (ja) 音声規則合成装置
JP3060276B2 (ja) 音声合成装置
JP2703253B2 (ja) 音声合成装置
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JPH0667685A (ja) 音声合成装置
JP2880507B2 (ja) 音声合成方法
JP3303428B2 (ja) 音声合成装置のアクセント成分基本テーブルの作成方法
JP2004206144A (ja) 基本周波数パタン生成方法、及びプログラム記録媒体
JPH08160983A (ja) 音声合成装置
JPH09325788A (ja) 音声合成装置及び方法
JPH03203800A (ja) 音声合成方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080718

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080718

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090718

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees