JPH03171099A - 韻律情報生成方式 - Google Patents

韻律情報生成方式

Info

Publication number
JPH03171099A
JPH03171099A JP1310929A JP31092989A JPH03171099A JP H03171099 A JPH03171099 A JP H03171099A JP 1310929 A JP1310929 A JP 1310929A JP 31092989 A JP31092989 A JP 31092989A JP H03171099 A JPH03171099 A JP H03171099A
Authority
JP
Japan
Prior art keywords
utterance
spoken words
pause
syntax
meaning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1310929A
Other languages
English (en)
Other versions
JP3152915B2 (ja
Inventor
Shinsuke Sakai
坂井 信輔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP31092989A priority Critical patent/JP3152915B2/ja
Publication of JPH03171099A publication Critical patent/JPH03171099A/ja
Application granted granted Critical
Publication of JP3152915B2 publication Critical patent/JP3152915B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声出力の機械翻訳システム、自動通訳シス
テム、テキスト音声合或システム等の構或要素である概
念構造からの音声合或に関するものである。
〔従来の技術〕
従来、音声の規則合戊を行なうシステムのための、ポー
ズ長やイントネーションなどの、いわゆる音声の韻律情
報を計算する方法が各種提案されている。これらには、
たとえば「情報処理学会論文誌」第27巻11号105
8ページに記載されているように、特定の単語や句切り
記号の後や、隣接するアクセント旬間の結合力に応じて
ポーズを挿入するなどの、単語の種類、局所的な構文情
報に基づいてポーズの挿入を行なうという方法がある。
また、イントネーションの付与については、たとえば、
アイ・イー・イー・イー・インターナショナル・コンフ
ァレンス・オン自アコースティックス・スピーチ・アン
ド・シグナル・プロセシング 1988  (IEEE
  rnternationa]  Conferen
ce  on  Acoustics,Speech 
 and  Sxgnal  Processing 
 1988)、663ページ〜666ページに記載され
ているように、構文的な境界のタイプによりイントネー
ションの話調成分の立て直し方を決定する方式がある。
〔発明が解決しようとする課題〕
しかしながら、従来の韻律情報の生成方式においては、
発話のあらわす意味や、発話者の意図をあらわす語用論
的な情報を韻律情報の生成に反映するということがなか
ったので、出力される合或音声は、しばしば平板で自然
性に欠けると感じられることがあった。本発明の目的は
、このような欠点を克服した、より自然で、発話の担う
意味が了解されやすい韻律情報の生成方式を提供するこ
とにある。
〔課題を解決するための手段〕
本発明の韻律情報生成方式においては、発話の意味をあ
らわす概念構造における意味関係と、その中間表現から
生成された発話の構文構造とから、発話中のポーズの継
続時間を計算することを特徴としている。
また、本発明別の韻律情報生成方式においては、発話の
意味をあらわす概念構造における意味関係と、その中間
表現から生成された発話の構文構造と、その構文構造か
ら生成された形態素列の語彙情報とから、発話中のポー
ズの継続時間を計算することを特徴としている。
また、本発明の更に別の韻律情報生成方式においては、
発話の意味をあらわす概念構造における意味関係と、そ
の中間表現から生成された発話の構文構造とから、発話
のイントネーションを計算することを特徴としている。
また、本発明の更に別の韻律情報生成方式においては、
発話の意味をあらわす概念構造における意味関係と、そ
の中間表現から生成された発話の構文構造と、その構文
構造から生成された形態素列の語貴情報とから、発話の
イントネーションを計算することを特徴としている。
また、本発明の更に別の韻律情報生成方式においては、
発話の意味をあらわす概念構造における談話上のフォー
カスを指定する情報から、発話の戊分の強調度を計算す
ることを特徴としている。
〔作用〕
その中にアクセント核が1つ存在するような日本語の文
の部分単位をアクセント句という。韻律情報を生成する
単位を、このアクセント句とする。
アクセント句に対して、付与するべき韻律情報には、ア
クセント句に後続するポーズの長さ、アクセント句のイ
ントネーションの話調成分の立て直しの度合および傾き
、リズム的な強調度、談話的な強調度などがある。
第1図(a)の発話文が生成されるもとになる概念構造
は、同図(b)である。第1図(a)における上向きの
矢印はアクセント句の境界を示し、横向きの矢印はかか
り受け関係を示している。
「A席」に対応するアクセント句の後のポーズの長さは
、かかり先である「B席」の位置がすぐ右側であること
、および、かかり先との間に戒り立っている概念構造上
の意味関係が(AND)であることから計算される。ま
た、「および」に対応するアクセント句の後のポーズの
長さは、かかり先である「C席」の位置がすぐ右側であ
ること、およびかかり先に対して、「および」自身が《
AND>という関係をあらわす概念構造上のノードに対
応していることから計算できるが、「および」という形
態素がit的にもつその後のポーズのおかれ方に関する
性質も用いると、より高精度のポーズ長の決定を行なう
ことができる。一方、「B席」というアクセント句のイ
ントネーションの話調成分の立て直しの度合および傾き
は、その前のアクセント句である「A席」が「B席」に
かかっていること、およびこのかかり受けに対応する概
念構造上の意味関係が(AND)であることによって決
定される。また、アクセント句「および」の話調成分に
ついては、直前のアクセント句「B席」が「および」に
かかっていることおよび、「および」自身が(A N 
D)という関係をあらわす概念構造上のノードに対応し
ていることから計算できるが、「および」という形態素
が[的にもつその直前にかかり元の語がある場合の話調
成分の立て直しに関する性質を用いると、より高精度の
ポーズ長の決定を行なうことができる。
また、アクセント句「A席」、「B席」および「C席の
」に対応する概念ノードには、談話上のフォーカスであ
るということをあらわす#FOCUSという情報が存在
する。これにより、アクセント句「A席」、「B席」お
よび「C席の」の談話的強調度を大とするという計算が
行なわれる。
〔実施例〕
次に図面を参照しつつ本発明の実施例を説明することに
よって本発明をさらに詳細に説明する。
第2図は本発明を実現する一実施例をあらわすブロック
図である。構文生成部201は、概念構造を入力されて
、構文構造を生成する。韻律情報生成部202は、概念
構造および構文構造を入力されて、各アクセント句につ
いて後続ポーズ長およびイントネーションの話調戊分の
立て直しの度合および傾き、談話的な強調度を計算して
、出力する。
アクセント句のポーズ長は、 if  CR (p)  and  SR (p)th
en  PL (p)=P  (1)という形式のポー
ズ長決定規則のセットを用いて計算される。CR (p
)は、アクセント句pのヰ既念構造上の性質に関する条
件をあらわす述語、SR (p)は、pの構文構造上の
性質に関する条件をあらわす述語である。pL (p)
は、pに後続するポーズの長さをあらわす。この形式の
規則の集合は、たとえば、第4図に示すようなテーブル
を韻律情報生底部202に保持することによって実現で
きる。
一方、アクセント句の話調成分の立て直しの度合および
傾きは、 if  CR(p)  and  SR(p)then
  RL (p)=R  (2)i f  CR (p
)  and  SR (1))then  GR (
p) 一G  (3)という形式の規則のセットを用い
て計算される。
CR (p)は、アクセント句pの概念構造上の性質に
関する条件をあらわす述語、SR(p)は、pの構文構
造上の性質に関する条件をあらわす述語である。RL 
(p)は、pの話調戊分の立て直しの度合、GR (p
)は、pの話調戊分の傾きをあらわす。この形式の規則
の集合は、たとえば、第5図および第6図に示すような
テーブルを韻律情報生成部202に保持することによっ
て実現できる。
アクセント句の、談話的強調度は、 i  f   FC  (p) then  DS  (p)=HIGHe I s e
  DS  (p)  =LOW     (4)とい
う規則によって計算される。FC (1))は、アクセ
ント句pにフォーカス情報があれば真となる述語である
。この談話的強調度は、生成された韻律情報を人力され
て音声合戊を行なう音声合或装置において、たとえば、
HIGHの場合は合或音のパワーの増加および音韻継続
時間長の引き延ばしをすることにより実現される。
次に本発明の他の実施例について、第3図を参照しなが
ら説明する。
第3図は本発明を実現する一実施例をあらわすブロック
図である。構文生成部301は、概念構造を人力されて
、構文構造を生成する。形態素生成部302は、構文構
造を入力されて、形態素列を生成する。韻律情報生成部
303は、概念構造、構文構造および形態素列を入力さ
れて、各アクセント句について後続ポーズ長およびイン
トネーションの話調成分の立て直しの度合および傾き、
談話的な強調度を計算して、出力する。
アクセント句のポーズ長は、 if  CR (p)  and  SR (p)an
d  MR(p) then  PL (p)=P  (1)という形式の
ポーズ長決定規則のセットを用いて計算される。CR 
(p)は、アクセント句pの概念構造上の性質に関する
条件をあらわす述語、SR (p)は、pの構文構造上
の性質に関する条件をあらわす述語である。MR (p
)は、pの形態上の性質に関する条件をあらわす述語で
ある。PL (p)は、pに後続するポーズの長さをあ
らわす。この形式の規則の集合は、たとえば、第7図に
示すようなテーブルを韻律情報生成部302に保持する
ことによって実現できる。
一方、アクセント句の話調成分の立て直しの度合および
傾きは、 i f  CR (p)  and  SR (p)a
nd  MR (+)) then  RL (p)=R  (2)if  CR
  (p)   and  SR  (p)and  
MR(1)) then  GR  (1))=G  (3)という形
式のポーズ長決定規則のセットを用いて計算される。C
R (p)は、アクセント句pの概念構造上の性質に関
する条件をあらわす述語、SR (p)は、pの構文構
造上の性質に関する条件をあらわす述語である。MR 
(p)は、pの形態上の性質に関する条件をあらわす述
語である。RL (p)は、pの話調制限の立て直しの
度合、GR (p)は、pの話調戊分の傾きをあらわす
。この形式の規則の集合も、ポーズ長決定規則と同様に
、テーブル韻律情報生成部302に保持することによっ
て実現できる。pの談話的強調度については、第2図の
実施例と同様に計算する。
〔発明の効果〕
以上に述べたように、本発明の韻律情報生成方式による
と、発話のあらわす意味、談話のフォーカスのような語
用論的な情報を反映した、自然で発話内容の了解がしや
すい韻律情報を生成することが可能となる。
【図面の簡単な説明】
第1図は、概念構造および構文構造の一例を示す図、第
2図および第3図は、本発明の実施例を示すブロック図
、第4図および第7図はI−ズ長決定規則をあらわすテ
ーブルの図、第5図は話調成分の立て直しの度合の決定
規則をあらわすテーブルの図、第6図は、話調戊分の傾
きの決定規則をあらわすテーブルの図である。 201・・・構文生成部、202・・・韻律情報生底部
、301・・・構文生成部、302・・・形態素生成部
、303・・・韻律情報生成部。

Claims (5)

    【特許請求の範囲】
  1. (1)発話の意味をあらわす概念構造における意味関係
    と、その中間表現から生成された発話の構文構造とから
    、発話中のポーズの継続時間を計算することを特徴とす
    る韻律情報生成方式。
  2. (2)発話の意味をあらわす概念構造における意味関係
    と、その中間表現から生成された発話の構文構造と、そ
    の構文構造から生成された形態素列の語彙情報とから、
    発話中のポーズの継続時間を計算することを特徴とする
    韻律情報生成方式。
  3. (3)発話の意味をあらわす概念構造における意味関係
    と、その中間表現から生成された発話の構文構造とから
    、発話のイントネーションを計算することを特徴とする
    韻律情報生成方式。
  4. (4)発話の意味をあらわす概念構造における意味関係
    と、その中間表現から生成された発話の構文構造と、そ
    の構文構造から生成された形態素列の語彙情報とから、
    発話のイントネーションを計算することを特徴とする韻
    律情報生成方式。
  5. (5)発話の意味をあらわす概念構造における談話上の
    フォーカスを指定する情報から、発話の成分の強調度を
    計算することを特徴とする韻律情報生成方式。
JP31092989A 1989-11-30 1989-11-30 韻律情報生成方式 Expired - Lifetime JP3152915B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31092989A JP3152915B2 (ja) 1989-11-30 1989-11-30 韻律情報生成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31092989A JP3152915B2 (ja) 1989-11-30 1989-11-30 韻律情報生成方式

Publications (2)

Publication Number Publication Date
JPH03171099A true JPH03171099A (ja) 1991-07-24
JP3152915B2 JP3152915B2 (ja) 2001-04-03

Family

ID=18011085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31092989A Expired - Lifetime JP3152915B2 (ja) 1989-11-30 1989-11-30 韻律情報生成方式

Country Status (1)

Country Link
JP (1) JP3152915B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6420598A (en) * 1987-07-15 1989-01-24 Ricoh Kk Inter-section degree of connection determiner
JPS6488599A (en) * 1987-09-30 1989-04-03 Matsushita Electric Ind Co Ltd Voice synthesizer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6420598A (en) * 1987-07-15 1989-01-24 Ricoh Kk Inter-section degree of connection determiner
JPS6488599A (en) * 1987-09-30 1989-04-03 Matsushita Electric Ind Co Ltd Voice synthesizer

Also Published As

Publication number Publication date
JP3152915B2 (ja) 2001-04-03

Similar Documents

Publication Publication Date Title
US7460997B1 (en) Method and system for preselection of suitable units for concatenative speech
Dutoit High-quality text-to-speech synthesis: An overview
US7565291B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
US7010489B1 (en) Method for guiding text-to-speech output timing using speech recognition markers
Kayte et al. Hidden Markov model based speech synthesis: A review
Dutoit A short introduction to text-to-speech synthesis
Stöber et al. Speech synthesis using multilevel selection and concatenation of units from large speech corpora
Mullah A comparative study of different text-to-speech synthesis techniques
Cadic et al. Towards Optimal TTS Corpora.
KR0146549B1 (ko) 한국어 텍스트/음성 변환 방법
JP2004145015A (ja) テキスト音声合成システム及び方法
JP2008015424A (ja) 様式指定型音声合成方法、及び様式指定型音声合成装置とそのプログラムと、その記憶媒体
Chen et al. A Mandarin Text-to-Speech System
JPH03171099A (ja) 韻律情報生成方式
Khaw et al. Preparation of MaDiTS corpus for Malay dialect translation and speech synthesis system.
Georgila 19 Speech Synthesis: State of the Art and Challenges for the Future
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
Heggtveit An overview of text-to-speech synthesis
Khalifa et al. SMaTalk: Standard malay text to speech talk system
KR100269215B1 (ko) 음성 합성을 위한 발화구의 기본 주파수 궤적 생성 방법
Eady et al. Pitch assignment rules for speech synthesis by word concatenation
IMRAN ADMAS UNIVERSITY SCHOOL OF POST GRADUATE STUDIES DEPARTMENT OF COMPUTER SCIENCE
JPH06214585A (ja) 音声合成装置
Khalifa et al. SMaTTS: Standard malay text to speech system
JP2003345372A (ja) 音声合成装置及び音声合成方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080126

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090126

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100126

Year of fee payment: 9

EXPY Cancellation because of completion of term