JPH0389300A - 韻律制御方式 - Google Patents

韻律制御方式

Info

Publication number
JPH0389300A
JPH0389300A JP1226645A JP22664589A JPH0389300A JP H0389300 A JPH0389300 A JP H0389300A JP 1226645 A JP1226645 A JP 1226645A JP 22664589 A JP22664589 A JP 22664589A JP H0389300 A JPH0389300 A JP H0389300A
Authority
JP
Japan
Prior art keywords
speech
prosody
rhythm
phoneme
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1226645A
Other languages
English (en)
Inventor
Tetsuya Sakayori
哲也 酒寄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1226645A priority Critical patent/JPH0389300A/ja
Publication of JPH0389300A publication Critical patent/JPH0389300A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 弦触じ1艷 本発明は、韻律制御方式、より詳細には、規則音声合成
装置の韻律制御方式に関する。
丈来挟先 規則音声合成のための音韻継続時間長制御方式として例
えば以下のようなものが知られている。
■「匂坂、東倉、規則による音声合成のための音韻時間
長制御、電子通信学会論文誌、 Vol、J67−A、
No7Jには、各音韻の継続時間長を1発話単位のモー
ラ数、音韻環境、発話単位内の位置などの、音韻継続時
間長に影響を及ぼす要因の和や積として決定することが
記載されている。
■r特開昭63−46498号公報(韻律制御方式)」
には、各音韻の継続時間長を、発話単位のモーラ数、音
韻環境2発話単位内の位置などの、音韻継続時間長に影
響を及ぼす要因説明変数として数量化■類によって決定
することが記載されている。なお、この方式は一つの定
数テーブルを使用するものである。
また、規則音声合成のための基本周波数パターン制御方
式としては例えば以下のようなものが知られている。
■「広瀬、藤崎、太田2日本語平叙文の基本周波数パタ
ーンの音響的特徴2日本音響学会音声研究会資料、57
9−034には、人間の発声における基本周波数パター
ンを、臨界制動2次系のインパルス応答、の重畳として
、モデル化することが記載されている。
■「特開昭63−46497号公報(音声合成方式)」
には、単語のアクセント型、単語のモーラ数、音韻系列
などの、基本周波数パターンに影響を及ぼす要因を説明
変数として、数量化■類によって基本周波数パターンを
決定することが記載されている。なお、この方式は一つ
の定数デープルを使用するものである。
しかしながら、前述の従来技術の■、■は口調等の変更
を考慮していない。■、■は−っノ定数テーブルを使う
ので、この方法で例えば口調を変更する場合には、口調
の種類を説明変数の一つに加えることによって行なう。
こうすると1口調の種類によって一律のバイアスが発話
単位全体の音韻継続時間長やピッチパターンに加算され
る。しかし人間の発声では、発話単位全体が一律に変化
するものではない、このことは現在の規則音声合成装置
によって合成された音声が5口調等の変化に自然な対応
ができない大きな原因である。
且−一り 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、発声目的、口調、話者特性などの変化による、人
間の発声における韻律の変化を、規則音声合成装置によ
って忠実に再現することを目的としてなされたものであ
る。
盪−一玖 本発明は、上記目的を達成するために、予め用意した音
声素片のパラメータ系列を、音韻・韻律を表現する入力
記号列に従って読みだし、音声パラメータ結合規則によ
って、前記音声素片パラメータ系列を接続し、韻律制御
規則によって、音韻・韻律を表現する入力記号列に応じ
た音韻継続時間長、基本周波数パターン、振幅パターン
などを計算することにより、韻律を付加する規則音声合
成装置において、音韻継続時間長設定の際に使用する定
数テーブル、または振幅パターン設定の際に使用する定
数テーブルを複数記憶し、合成音声の使用目的、合成音
声に要求される口調、合成音声に要求される話者特性な
どによって、異なる定数テーブルを選択的に用いて継続
時間長、または基本周波数パターン、または振幅パター
ンを計算することを特徴としたものである。以下、本発
明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するためのフローチ
ャートで、以下、第1図に添って音韻継続時間長を数量
化■類によって制御する場合について具体的な処理の流
れを説明する。
まず、合成音声の使用目的、合成音声に要求される口調
、合成音声に要求される話者特性などによって韻律テー
ブル番号tを設定する。ここで合成音声の使用目的とは
、例えばr受聴者への何らかの教育あるいは指示」、「
ニュースやデータベースなどの情報の正確な伝達」、「
非常時の警報あるいは誘導」、1人間との対話」などで
ある。
合成音声に要求される口調とは例えば「命令調」。
「質問間」、「朗読調」、「泣きそうな話し方」。
「甘えた話し方」、「怒りを含んだ話し方ノなどである
。合成音声に要求される話者特性とは「性別」、「年齢
」、「出身地」、「特定の職業など(バスガイド、落語
家、アナウンサーなど)に特有の話し方」、「特定の個
人」などである。また、韻律テーブルとは数量化ト類で
用いる回帰係数の表である。上述のようなそれぞれの特
性に対応する人間の発声を、数量化I類によって分析し
、それぞれに対応する韻律テーブルを用意しておく。
第2図は、口調によって複数用意した韻律テーブルの例
を示す図で、(a)図は朗読調、(b)図は質問間、C
o)図は命令調に対するAJkを示している。
この後、入力音韻系列のひとつひとつの音韻に対して継
続時間長を計算する。前からi番目の音韻の継続時間長
をDiとする。計算を行なうために、まず音韻が各要因
についてどのカテゴリに該当するかを判定する。ここで
要因とは例えば「先行音韻の種類」、「後続音韻の種類
」、「入力音韻系列の長さコなどの定性的要因である。
さらにカテゴリとは各音韻が各要因について取る値の部
分集合であり、前述の要因の例で言えば、例えば「先行
音韻の種類」、「後続音韻の種類jに対してはr /a
/、/i/、/u/、/e/、10/、/s/、/に/
、/n/、/m/+・・・」、「入力音韻系列の長さ」
に対しては「1゜2.3〜4,5〜7,8以上」などが
考えられる。
計算は以下の様にして行なう。まず、DiにOを代入す
る。次に全ての要因、カテゴリに対して前述の判定を行
なう。その結果i番目の音韻がj番目の要因のに番目の
カテゴリに該当する場合には、Diに定数A J k、
を加算する。Aの値は合成音声の使用目的、合成音声に
要求される口調、合成音声に要求される話者特性などの
特性ごとに、複数の韻律テーブルとして記憶装置に蓄え
られている。
こうして該当する全てのカテゴリについてAを加算をし
たものがDiの計算結果として得られる。
この計算を全入力音韻系列に関して行なう。
また、ピッチ周期パターンや振幅パターンの設定につい
ても、数量化I類で制御する際の韻律テーブルを、合成
音声の使用目的、合成音声に要求される口調、合成音声
に要求される話者特性などによって、複数の韻律テーブ
ルから選択的に使用して計算することが可能である。ピ
ッチ周期パターンや振幅パターンを数量化I類で制御す
る方法は公知であり、この際、韻律テーブルを選択的に
利用する方法は上記実施例と同様であるので詳しい説明
は省略する。
以上は数量化I類によって韻律を制御する場合を例に説
明したが、本発明はこれに限るものではなく、なんらか
の表引きを伴う韻律の制御法には全て適用が可能である
羞−一来 以上の説明から明らかなように、本発明によると、合成
音声の使用目的、合成音声に要求される口調、合成音声
に要求される話者特性などに応じて、複数の異なる定数
表を選択的に用いて韻律を計算することにより、人間の
発声における発声目的、口調、話者特性などによる韻律
の変化を、規則音声合成装置によって忠実に再現するこ
とが可能となり、これにより、自然性に優れた音声が合
成できる。
【図面の簡単な説明】 第1図は、本発明の一実施例を説明するためのフローチ
ャート、第2図は、韻律テーブルの例を示す図である。

Claims (1)

    【特許請求の範囲】
  1. 1、予め用意した音声素片のパラメータ系列を、音韻・
    韻律を表現する入力記号列に従って読みだし、音声パラ
    メータ結合規則によって、前記音声素片パラメータ系列
    を接続し、韻律制御規則によって、音韻・韻律を表現す
    る入力記号列に応じた音韻継続時間長、基本周波数パタ
    ーン、振幅パターンなどを計算することにより、韻律を
    付加する規則音声合成装置において、音韻継続時間長設
    定の際に使用する定数テーブル、または振幅パターン設
    定の際に使用する定数テーブルを複数記憶し、合成音声
    の使用目的、合成音声に要求される口調、合成音声に要
    求される話者特性などによって、異なる定数テーブルを
    選択的に用いて継続時間長、または基本周波数パターン
    、または振幅パターンを計算することを特徴とする韻律
    制御方式。
JP1226645A 1989-08-31 1989-08-31 韻律制御方式 Pending JPH0389300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1226645A JPH0389300A (ja) 1989-08-31 1989-08-31 韻律制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1226645A JPH0389300A (ja) 1989-08-31 1989-08-31 韻律制御方式

Publications (1)

Publication Number Publication Date
JPH0389300A true JPH0389300A (ja) 1991-04-15

Family

ID=16848426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1226645A Pending JPH0389300A (ja) 1989-08-31 1989-08-31 韻律制御方式

Country Status (1)

Country Link
JP (1) JPH0389300A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222187A (ja) * 1996-12-04 1998-08-21 Just Syst Corp 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10222187A (ja) * 1996-12-04 1998-08-21 Just Syst Corp 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体

Similar Documents

Publication Publication Date Title
Yoshimura et al. Mixed excitation for HMM-based speech synthesis
Gold et al. Speech and audio signal processing: processing and perception of speech and music
JP4125362B2 (ja) 音声合成装置
US5704007A (en) Utilization of multiple voice sources in a speech synthesizer
Rachman et al. DAVID: An open-source platform for real-time transformation of infra-segmental emotional cues in running speech
Murray et al. Synthesizing emotions in speech: Is it time to get excited?
US8775185B2 (en) Speech samples library for text-to-speech and methods and apparatus for generating and using same
US8103505B1 (en) Method and apparatus for speech synthesis using paralinguistic variation
JP2002244689A (ja) 平均声の合成方法及び平均声からの任意話者音声の合成方法
Murray et al. Rule-based emotion synthesis using concatenated speech
Gussenhoven et al. On the speaker-dependence of the perceived prominence of F0peaks
JPH0641557A (ja) 音声合成のための方法および装置
Krstulovic et al. An HMM-based speech synthesis system applied to German and its adaptation to a limited set of expressive football announcements.
Carlson Models of speech synthesis.
Rabiner A model for synthesizing speech by rule
d’Alessandro et al. The speech conductor: gestural control of speech synthesis
JPH0389300A (ja) 韻律制御方式
JP3742206B2 (ja) 音声合成方法及び装置
d’Eon et al. Musical speech: a transformer-based composition tool
JPH09179576A (ja) 音声合成方法
JPH05224689A (ja) 音声合成装置
Georgila 19 Speech Synthesis: State of the Art and Challenges for the Future
JPS5914752B2 (ja) 音声合成方式
d’Alessandro Realtime and Accurate Musical Control of Expression in Voice Synthesis
Ansari Inverse filter approach to pitch modification: Application to concatenative synthesis of female speech