JP3344487B2 - 音声基本周波数パターン生成装置 - Google Patents
音声基本周波数パターン生成装置Info
- Publication number
- JP3344487B2 JP3344487B2 JP25099791A JP25099791A JP3344487B2 JP 3344487 B2 JP3344487 B2 JP 3344487B2 JP 25099791 A JP25099791 A JP 25099791A JP 25099791 A JP25099791 A JP 25099791A JP 3344487 B2 JP3344487 B2 JP 3344487B2
- Authority
- JP
- Japan
- Prior art keywords
- syllable
- fundamental frequency
- circuit
- basic
- basic frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
装置における音声基本周波数パターン生成装置に関する
ものであり、特に音声基本周波数パターン決定回路を語
或は句の音節単位に具備し、音声基本周波数パターン決
定回路は単語或は句の音節位置毎に各別の回路を有して
おり、これら各別の回路はそれぞれ音節の基本周波数の
平均値を決定する回路と音節内の基本周波数変化パター
ンを決定する回路とより成るものとして合成される音声
の自然性を向上した音声基本周波数パターン生成装置に
関する。
例について説明する。従来の音声基本周波数パターン生
成装置としては、先ず、アクセントの型に着目してこれ
によって基本周波数パターンを決定するものが知られて
いる。確かにアクセントの型は基本周波数パターンを決
定する最も重要な因子ではあるが、基本周波数パターン
を決定するその他の因子である音韻の種類、当該音韻の
前後の音韻環境の変動をも基本周波数パターンの決定に
取り入れるに好適なものとは言い難いものであった。
音節位置を基本周波数パターンを決定する因子として着
目し、これらを入力として基本周波数パターンを決定す
る手法も提案されている。しかし、この手法は音節或は
母音中心の基本周波数パターンを決定するに過ぎず、音
節内の基本周波数変動を考慮するものではない。また、
語或は句の音節位置は単なるパラメータの内の一つに過
ぎず、語或は句の音節位置毎に基本周波数パターンを決
定するというものではないので、基本周波数パターンの
精密な決定は困難なものであった。
通りの従来の音声基本周波数パターン生成装置が内包す
る課題を解消しようとするものである。
節単位に分解し、分解された音節の各々に属性を設定す
る質的説明要因設定回路1を具備し、属性項目として当
該音節のトーン、当該音節の前および後の音節のトー
ン、当該音節の子音クラス、後続音節の子音クラス、ア
クセント句内位置を設定し、属性項目に対応するトーン
・パターンを設定するアクセント辞書2を具備し、各音
節の属性の内の一つであるアクセント句内位置を参照し
て各音節に対応した基本周波数生成回路が第1ないし第
5の内の何れの音節位置であるかを判定選択する音節位
置判定回路3を具備し、この基本周波数生成回路は音節
内の基本周波数を決定する音節の平均値決定回路4、
6、8、10、12と音節内の基本周波数変化パターン
決定回路5、7、9、11、13とより成り、音節の長
さと基本周波数変化率とから音節内における基本周波数
の増減値を求め、基本周波数の増減値と平均値とから音
節開始時点における基本周波数と音節終了時点における
基本周波数とを設定し、更に、この音節開始時点と音節
終了時点との間を補間することにより音節の基本周波数
パターンを生成する音節内基本周波数設定回路14を具
備し、音節毎の基本周波数パターンを連結する基本周波
数連結回路15を具備する音声基本周波数パターン生成
装置を構成した。
る。図1において、1は質的説明要因設定回路であり、
入力されたテキストを音節単位に分解し、分解された音
節の各々に後述する属性値を設定するものである。質的
説明要因とはカテゴリーの如き数量により表現すること
ができない変数のことをいう。設定される属性項目或い
はカテゴリーとしては、当該音節のトーン、当該音節の
前および後の音節のトーン、当該音節の子音クラス、後
続音節の子音クラス、アクセント句内位置、が採用され
る。2はアクセント辞書であり、トーン・パターンを決
定する際に検索されるものである。設定される属性項目
とは別に、属性項目の一つとして、アクセント句内にお
ける基本周波数の最大のものを意味するアクセントの大
きさが採用される。アクセントの大きさはテキストと共
に入力される。属性値の一例を語「ありがとう」につい
て図2に示しておく。ここで、トーン・パターンの項に
おけるH、Lはアクセントの型を表記する際に使用され
る「高、低」を意味している。そして、例えば「あ」に
ついて、第1のLは前音節のト−ンを示し、次のLは当
該音節のト−ンを示し、最後のHは後音節のト−ンを示
す。連続するLLHを総称して「あ」のト−ン・パタ−
ンと呼んでいる。これら全項目についての属性値が音声
基本周波数パターン生成モデルの入力とされる。3は音
節位置判定回路であり、各音節の属性の内の一つである
アクセント句内位置を参照して各音節に対応した基本周
波数生成回路が第1ないし第5の内の何れの音節位置で
あるかを判定選択するためのものである。この基本周波
数生成回路は音節内の基本周波数を決定する音節の平均
値決定回路4、6、8、10、12と音節内の基本周波
数変化パターン決定回路5、7、9、11、13とより
成り、これらの各回路のパラメータは第1ないし第5の
音節毎に予め作成しておくものとする。その作成の仕方
については後述する。音節の変化率とは、分析フレーム
の1フレームの間において基本周波数が何Hz増加し或
いは減少したかを示す値である。選択された第1ないし
第5の基本周波数生成回路は入力された音節の属性値を
使用して音節内の基本周波数の平均値および基本周波数
の変化率を決定する。14は音節内基本周波数設定回路
であり、音節の長さ(フレーム数)と基本周波数変化率
とから音節内における基本周波数の増減値を求め、この
増減値と平均値とから音節開始時点における基本周波数
と音節終了時点における基本周波数とを設定する。更
に、この音節開始時点と音節終了時点との間を直線補間
することにより音節の基本周波数パターンを生成する。
15は基本周波数連結回路であり、音節毎の基本周波数
パターンを連結し、語或いは文章の基本周波数パターン
を生成する。
周波数変化パターン決定回路の双方のパラメータは、学
習データを使用して数量化1類(「数量化理論とデータ
処理」駒沢、朝倉書店、1982、参照)により求め
る。ここで、数量化1類とは質的説明要因を使用して目
的変数(実施例においては、音節内母音における基本周
波数平均値および基本周波数変化率がこれに相当する)
を推定する方法である。モデルの一般式は次の通りであ
る。
ー(例えばトーン・パターン、音節の子音クラス)をδ
fc=1とし、他のカテゴリーはδfc=0として式(1)
により設定する。
声基本周波数パターン生成装置は、語或は句の基本周波
数パターンを決定する因子である音韻のクラス、当該音
韻の前後の音韻環境の変動をも基本周波数パターンの決
定に取り入れるに好適なものであり、基本周波数パター
ンを語或は句の音節毎に決定するというものであるので
基本周波数パターンを精密に決定することができること
となった。
置の実施例を示すブロック図。
の例を示す図。
ターン決定回路 14 音節内基本周波数設定回路 15 基本周波数連結回路
Claims (1)
- 【請求項1】 入力されたテキストを音節単位に分解
し、分解された音節の各々に属性を設定する質的説明要
因設定回路を具備し、属性項目として当該音節のトー
ン、当該音節の前および後の音節のトーン、当該音節の
子音クラス、後続音節の子音クラス、アクセント句内位
置を設定し、 属性項目に対応するトーン・パターンを設定するアクセ
ント辞書を具備し、 各音節の属性の内の一つであるアクセント句内位置を参
照して各音節に対応した基本周波数生成回路が第1ない
し第5の内の何れの音節位置であるかを判定選択する音
節位置判定回路を具備し、 この基本周波数生成回路は音節内の基本周波数を決定す
る音節の平均値決定回路と音節内の基本周波数変化パタ
ーン決定回路とより成り、 音節の長さと基本周波数変化率とから音節内における基
本周波数の増減値を求め、基本周波数の増減値と平均値
とから音節開始時点における基本周波数と音節終了時点
における基本周波数とを設定し、更に、この音節開始時
点と音節終了時点との間を補間することにより音節の基
本周波数パターンを生成する音節内基本周波数設定回路
を具備し、 音節毎の基本周波数パターンを連結する基本周波数連結
回路を具備することを特徴とする音声基本周波数パター
ン生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25099791A JP3344487B2 (ja) | 1991-09-30 | 1991-09-30 | 音声基本周波数パターン生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25099791A JP3344487B2 (ja) | 1991-09-30 | 1991-09-30 | 音声基本周波数パターン生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0588690A JPH0588690A (ja) | 1993-04-09 |
JP3344487B2 true JP3344487B2 (ja) | 2002-11-11 |
Family
ID=17216118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25099791A Expired - Lifetime JP3344487B2 (ja) | 1991-09-30 | 1991-09-30 | 音声基本周波数パターン生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3344487B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8606583B2 (en) | 2008-08-13 | 2013-12-10 | Nec Corporation | Speech synthesis system for generating speech information obtained by converting text into speech |
US8620663B2 (en) | 2008-08-13 | 2013-12-31 | Nec Corporation | Speech synthesis system for generating speech information obtained by converting text into speech |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IN172054B (ja) * | 1988-02-24 | 1993-03-27 | Du Pont | |
JP3576840B2 (ja) | 1997-11-28 | 2004-10-13 | 松下電器産業株式会社 | 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 |
-
1991
- 1991-09-30 JP JP25099791A patent/JP3344487B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8606583B2 (en) | 2008-08-13 | 2013-12-10 | Nec Corporation | Speech synthesis system for generating speech information obtained by converting text into speech |
US8620663B2 (en) | 2008-08-13 | 2013-12-31 | Nec Corporation | Speech synthesis system for generating speech information obtained by converting text into speech |
Also Published As
Publication number | Publication date |
---|---|
JPH0588690A (ja) | 1993-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102017124264B4 (de) | Computerimplementiertes Verfahren und Rechensystem zum Bestimmen phonetischer Beziehungen | |
EP0427485B1 (en) | Speech synthesis apparatus and method | |
JPS63285598A (ja) | 音素接続形パラメ−タ規則合成方式 | |
JPH10116089A (ja) | 音声合成用の基本周波数テンプレートを収容する韻律データベース | |
JP2001034283A (ja) | 音声合成方法、音声合成装置及び音声合成プログラムを記録したコンピュータ読み取り可能な媒体 | |
Bellegarda et al. | Statistical prosodic modeling: from corpus design to parameter estimation | |
JP2001282278A (ja) | 音声情報処理装置及びその方法と記憶媒体 | |
JP2623586B2 (ja) | 音声合成におけるピッチ制御方式 | |
JP3344487B2 (ja) | 音声基本周波数パターン生成装置 | |
JP4684770B2 (ja) | 韻律生成装置及び音声合成装置 | |
JP3560590B2 (ja) | 韻律生成装置および韻律生成方法並びにプログラム | |
Chen et al. | A statistical model based fundamental frequency synthesizer for Mandarin speech | |
Chen et al. | A first study on neural net based generation of prosodic and spectral information for Mandarin text-to-speech | |
JPH0580791A (ja) | 音声規則合成装置および方法 | |
JP3077981B2 (ja) | 基本周波数パタン生成装置 | |
JP2011191528A (ja) | 韻律作成装置及び韻律作成方法 | |
JP3292218B2 (ja) | 音声メッセージ作成装置 | |
Ebihara et al. | Speech synthesis software with a variable speaking rate and its implementation on a 32-bit microprocessor | |
JP2573587B2 (ja) | ピッチパタン生成装置 | |
JP3437472B2 (ja) | 音声合成方法とその装置 | |
JP3303428B2 (ja) | 音声合成装置のアクセント成分基本テーブルの作成方法 | |
JP2001100777A (ja) | 音声合成方法及び装置 | |
JP3078073B2 (ja) | 基本周波数パタン生成方法 | |
JP2001282273A (ja) | 音声情報処理装置とその方法と記憶媒体 | |
JP2936773B2 (ja) | 継続時間長決定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070830 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080830 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080830 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090830 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090830 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100830 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100830 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110830 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120830 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120830 Year of fee payment: 10 |