JP3690502B2 - 韻律情報設定方法及び装置並びにプログラム及び記録媒体 - Google Patents

韻律情報設定方法及び装置並びにプログラム及び記録媒体 Download PDF

Info

Publication number
JP3690502B2
JP3690502B2 JP2001121097A JP2001121097A JP3690502B2 JP 3690502 B2 JP3690502 B2 JP 3690502B2 JP 2001121097 A JP2001121097 A JP 2001121097A JP 2001121097 A JP2001121097 A JP 2001121097A JP 3690502 B2 JP3690502 B2 JP 3690502B2
Authority
JP
Japan
Prior art keywords
accent phrase
probability
pose
strength
dependency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001121097A
Other languages
English (en)
Other versions
JP2002311982A (ja
Inventor
久子 浅野
永 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001121097A priority Critical patent/JP3690502B2/ja
Publication of JP2002311982A publication Critical patent/JP2002311982A/ja
Application granted granted Critical
Publication of JP3690502B2 publication Critical patent/JP3690502B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、日本語テキストに対して、高精度に韻律情報を付与し、自然で聞き易い合成音声を出力させるための韻律情報設定方法及び装置並びに韻律情報設定プログラム及び記録媒体に関するものである。
【0002】
【従来の技術】
日本語テキスト音声合成は、漢字かな交じりの日本語テキストに対して、読み、および、アクセント(韻律上の基本単位であるアクセント句(少なくとも1個以下のアクセント核を持つ単位)の設定とそのアクセント型付与)、ポーズ、強弱(構文・意味や文脈的な情報を反映した音声的な強調・抑圧)等の韻律情報を設定し、これらを元に音声波形を生成して合成音声を出力する。自然で聞き易い合成音声を出力するためには、この読みや韻律情報を正しく設定する必要がある。
【0003】
読みとアクセントの付与は、単語に対する情報(単語情報)を用いることで、高精度に設定することができる。単語情報は、一般に形態素解析を用いて得ることができる。形態素解析は成熟した技術であり、99%以上の精度を実現しているものが数多く存在する。
【0004】
これに対し、ポーズや強弱は、単語情報に加え、一般に構文、意味、文脈等の情報が影響を与えていると言われている(音声文法研究会編:「文法と音声」くろしお出版、1997等)。
日本語の構文情報としては、ある文節がどの文節に係るかを表す文節係り受け情報が一般に用いられる。文節係り受け解析の既存技術としては、統計ベースのものとして、決定木を用いた手法(春野:「機械学習の手法による自然言語処理」、音声言語情報処理 29−23)、語の共起確率に基づく手法(藤尾他:「語の共起確率に基づく係り受け解析とその評価」、情報処理学会論文誌、Vol.40,No.12)、ルールベースのものとして、白井他:「階層的認識構造に着目した日本語従属節間の係り受け解析の方法とその精度」、情報処理学会論文誌、Vol.36,No.10等が存在する。しかし、文節係り受け解析の精度は、現状では最も優れたものでも85%前後であり、形態素解析と比べ精度に問題が残る。
【0005】
また、日本語テキスト音声合成において、構文情報を利用する際には、文法上の基本単位である文節の係り受け情報を利用するのが一般的である。しかし、文節と韻律上の基本単位であるアクセント句が一致しない部分に対し、文節係り受け関係を利用することは、精度低下の一因となる。
意味、文脈解析については、現状では十分な精度が達成されているとはいえない。
【0006】
【発明が解決しようとする課題】
従来の韻律情報の設定では、ポーズや強弱情報を設定する際には、次のような問題があった。
(1)形態素解析より得られる単語情報のみを用いる手法では、構文的な違いを正しく表現できない場合がある。
(2)単語情報に加えて、文節係り受け情報を用いる手法では、文節係り受け解析の誤りがそのまま韻律情報の誤りになる場合がある。また、文節とアクセント句が一致しない部分に対し、文節係り受け情報を利用することで、正しく韻律情報を設定できない場合がある。
(3)汎用的な意味、文脈解析は、現状では十分が精度が達成されているとはいえない。また、あるドメインに特化した意味、文脈解析を他のドメインに適応させるのも難しい。このため、これらを汎用な枠組みで韻律情報の設定に利用するのは難しい。
【0007】
本発明は、上記問題点を解決するためになされたものであり、既存の統計的な文節係り受け解析を流用して、韻律情報の設定に最適な情報に変形し、その情報を用いて、ポーズ、強弱情報を設定することにより、現状の係り受け解析の精度を考慮した韻律情報の設定を行うこと、統計モデルを利用しているため、ドメインに応じて学習データを切り替えることにより、間接的に意味、文脈的な情報を反映して韻律情報の設定を行うことにある。
【0008】
【課題を解決するための手段】
請求項1の発明は、入力した日本語テキストを単語認定及び読み韻律情報を設定するための辞書を用いて形態素解析し、単語情報を得て、
単語情報と、韻律単位の設定単位であるアクセント句を認定し、アクセント句の読みとアクセント型を付与するための規則を用いて読み・アクセントの付与を行い、アクセント句の認定及びアクセント句情報を得て、
当該アクセント句の前後所定個数のアクセント句区間を設定し、
アクセント句区間のアクセント句情報に基づいて係り受け解析モデルを用いて隣接アクセント句係り受け解析を行い各隣接アクセント句の係り受け有無の確率PDを求め、
各隣接アクセント句の係り受け有無の確率PDを元にアクセント句区間の隣接アクセント句係り受け有無の組み合わせパターンにおける連続係り受け有無確率PSDを算出し、
アクセント句区間のアクセント句情報と、アクセント句係り受け有無の組み合わせパターンに基づいてポーズモデルを用いてポーズ確率PPMを算出し、
連続係り受け有無確率PSDとポーズ確率PPMからアクセント句区間の隣接アクセント句係り受け有無の各組み合わせパターンにおけるポーズ確率PSDPを算出し、
隣接アクセント句係り受け有無の各組み合わせパターンにおけるポーズ確率PSDPの総和を計算して統合ポーズ確率PTPを得て、
統合ポーズ確率PTPと予め設定された閾値と比較することにより当該アクセント句のポーズの設定を行うことを特徴とする。
【0009】
請求項2の発明は、請求項1に記載の発明において、
予め決められた規則によるポーズ設定とポーズ未設定区間が予め決められたポーズ未設定区間より長い場合に統合ポーズ確率PTP以上で最も高い確率を持つ位置にポーズの設定を行うことを特徴とする。
【0010】
請求項3の発明は、請求項1に記載の発明において、
当該アクセント句の前後所定個数のアクセント句区間におけるアクセント句情報と、アクセント句係り受け有無の組み合わせパターン、各アクセント句のポーズ有無に基づいて強弱モデルを用いて強度毎の強弱確率APMを算出し、
強度毎の強弱確率APMと前記連続係り受け有無の確率PSDから隣接アクセント句係り受け有無の強弱確率ASDPを算出し、
強度毎の強弱確率ASDPの総和を統合強弱確率ATPとして算出し、
強度毎の統合強弱確率ATPの中で最大となる強度を当該アクセント句に設定することを特徴とする。
【0011】
【発明の実施の形態】
図1は、本発明を説明する概略フローチャートである。
本発明は、(1)日本語テキストを入力して、(2)形態素解析、(3)読み・アクセント付与、(4)隣接アクセント句係り受け解析((8)係り受け解析モデルを利用)、(5)ポーズ付与((9)ポーズ付与モデルを利用)、(6)強弱付与((10)強弱モデルを利用)を行い、(7)読み、韻律情報を出力する。
【0012】
以下、本発明を詳細に説明する。
はじめに、(8)係り受け解析モデル、(9)ポーズ付与モデル、(10)強弱モデルについて説明する。
(8)係り受け解析モデルは、数値化アクセント句情報(品詞、アクセント句位置、アクセント型、モーラ数、自立語等)を用いて隣接アクセント句間の係り受け有(または無)確率PDを演算する演算式である。この演算式は例えば、PD=a1x1+a2x2+・・・(a1,a2,・・・はパラメータ、x1,x2,・・・ はアクセント句情報(属性)による変数 、例えば、アクセント句が名詞の場合、x1=0.3、アクセント句が動詞の場合、x1=0.1等)のように表される。
(9)ポーズ付与モデルは、アクセント句情報(数値化情報)のセットFを用いてアクセント句の隣接係り受け有(または無)ポーズ確率PPMを演算する演算式である。
(10)強弱モデルは、アクセント句情報を用いて通常(音声的に強めも弱めもしない)、強調(音声的に弱める)、抑圧(音声的に弱める)のそれぞれ(強度毎)の強弱確率APMを演算する演算式である。
【0013】
次に、(8)係り受け解析モデル、(9)ポーズ付与モデル、(10)強弱モデルの作成方法について説明する。
これらは統計モデルであり、図2に示すフローにより作成する。
(12)モデルパラメータ設定は、(11)学習データを入力として、(13)パラメータ設定されたモデルを出力する。
(11)学習データは、推定に利用する属性値(アクセント句情報)の集合および正解データからなる。どのような属性を規定するかは、何を推定するかに応じて異なる。
(12)モデルパラメータ設定は、あるモデルに対して、最大エントロピー法(Berger,A.Lら,"A Maximum Entropy Approach to Natural Language Processing",Computational Linguistics,No.22,Vol.1)、決定木法(J.Ross Quinlan,"C4.5 Programs for mashine learning",Morgan Kanfmann Publishers,1993)等のアルゴリズムを用いて、モデルで利用するパラメータを設定する。
(13)パラメータ設定されたモデル(演算式)は図1の(8)〜(10)の各モデルに相当し、図1の(4)〜(6)においては、(11)学習データで規定した属性値(アクセント句情報)のセットをそれぞれ(8)〜(10)の各モデル(演算式)に入力し、出力値(確率値)を得る。
【0014】
図3に本発明の韻律情報設定装置の構成を示す。
韻律情報設定装置は、形態素解析部2、読み・アクセント付与部3、隣接アクセント句係り受け解析部4、ポーズ付与部5、強弱付与部6、係り受け解析モデル格納部8、ポーズ付与モデル格納部9、強弱モデル格納部10から構成される。
(1)日本語テキストは、任意の日本語テキストである。
(2)形態素解析〜(6)強弱付与は、原則的には文単位に処理を行う。
(2)形態素解析
形態素解析部2は、特開平9−134359号公報(特願平7−291143号)「形態素解析方法および装置」や、宮崎、大山:「日本文音声出力のための言語処理方式」、情報処理学会論文誌、Vol.27,NO.11に記述された多段解析法による形態素解析など、既存の技術を用いて行う。
形態素解析は、日本語テキストを辞書を参照することにより認識可能な文字列に対して形態素として属性を付与し、接続規則ファイルを用いて隣接した部分文字列に付与されている属性を調べて隣接可能な部分文字列の並びを検出し、複数の部分文字列の並びが検出された場合、優先度規則ファイルの優先度規則を適用して解を絞り込み単一の解(すなわち、最適な隣接可能な部分文字列の並び)を得る。
この形態素解析により、表記、品詞、読み、アクセント型などからなる単語情報が得られる。
【0015】
(3)読み・アクセント付与
読み・アクセント付与部3は、特開平11−344998号公報(特願平10−154605号)「読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体」で記述された既存の技術を用いる。
読み・アクセント付与は、宮崎方式等を用いて読みを付与し、a.1語で登録された複合語内でアクセント句境界が存在する場合に対応する、複数のアクセント句に関する情報、b.1語で登録され、付属語を含み、その内部にアクセント句境界が存在する場合に対応する、短単位の単語に展開するための構成単語情報、c.1語で登録された複合語で内部には、アクセント句境界は存在しないが、長単位語であることを表すための語数の各情報を格納した辞書と意味的係り受け情報を用いてアクセント句境界及びアクセント型の設定を行う。また、アクセント付与時に、結びつきの強い文節間のアクセント結合を行う。
この読み・アクセント付与により、読みとアクセント(アクセント句の設定とそのアクセント型の付与)が設定される。
【0016】
(4)隣接アクセント句係り受け解析
隣接アクセント句係り受け解析部4は、従来の統計的な文節係り受け解析を流用して隣接アクセント句係り受け解析を行う。
統計的な文節係り受け解析は、一般に、単語情報から得られる文節単位の各種情報(表記、品詞、読み、アクセント型等)と、各文節がどの文節に係るかを学習データとして、規定した統計モデルで学習を行い、統計モデルのパラメータ設定を行う。解析時には、単語情報から得られる文節単位の各種情報をパラメータ設定された統計モデルに入力して、各文節がどの文節に係るかを推定し、その推定確率を出力する。
【0017】
本発明では、この統計的な文節係り受け解析に対しては以下の変更を行う。
まず、ポーズ、強弱情報の設定単位は、文節ではなく、アクセント句であることから、学習データに対して、
・単語情報から得られる文節単位の各種情報
→単語情報から得られるアクセント句単位の各種情報
・各文節がどの文節に係るか
→各アクセント句がどのアクセント句に係るか
という変更を行い、統計モデルのパラメータ設定を行う。このパラメータ設定された統計モデルが(8)係り受け解析モデルとなる。
解析時には、単語情報から得られるアクセント句単位の各種情報(主辞主品詞、主辞主副詞、語形主品詞、アクセント句位置、アクセント型、モーラ数等)を入力として、各アクセント句がどのアクセント句に係るかを、その推定確率とともに出力するように変更する。
【0018】
さらに、一般に、係り先が遠くになるほど係り受け精度が低下すること、韻律情報の設定においては、隣接アクセント句に係るか(左枝分かれ境界)、それ以外に係るか(右枝分かれ境界)が最も重要であることから、各アクセント句がどのアクセント句に係るかというアクセント句係り受け確率を、各アクセント句が直後アクセント句に係る確率に変更する。
具体的には、各アクセント句に対して、
隣接アクセント句係り受け確率PD=直後アクセント句に係る確率とする。
さらに、より簡易に、「各アクセント句がどのアクセント句に係るか」ではなく、はじめから、「各アクセント句が直後アクセント句に係るか」という統計モデルを用いて、直接、隣接アクセント句係り受け確率を算出することも可能である。
この場合には、このパラメータ設定された統計モデルが(8)係り受け解析モデルとなる。
【0019】
(5)ポーズ付与
ポーズ付与部5の具体的な処理フローを図4を用いて説明する。
(i)はじめに、(21)規則によるポーズ設定を行う。
処理対象は、単語情報のみからその構造が自明となり、規則により正しくポーズ有無が設定できるアクセント句であり、例えば、日時表現、数量表現(「先月/三十日」が月要素+日要素となるため、[小ポーズ]先月[ポーズなし]三十日と認定される)や文末(句読点[ポーズ]と認定される)などが考えられる。
これらのアクセント句に対しては、特開平11−344998号公報「読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体」等の従来技術を用いて、ポーズを設定する。
(ii)また、(24)モーラ数、統合ポーズ確率に基づくポーズ設定で利用するため、ここで処理対象としたアクセント句に対しては、
ポーズを設定しないアクセント句:統合ポーズ確率PTP=0
ポーズを設定するアクセント句:統合ポーズ確率PTP=1
を設定する。
【0020】
(iii)次に、(22)と(23)の処理を、処理対象の先頭アクセント句から末尾アクセント句まで順に行う(ただし(21)で処理対象としたアクセント句を除く)。
(22)係り受け有無組み合わせパターン単位のポーズ確率設定では、当該アクセント句−i番目〜当該アクセント句+j番目(i,jは予め設定する)の(i+j+1)個のアクセント句を対象に、そのアクセント句を構成する単語情報から得られる情報(アクセント句情報)および隣接アクセント句係り受け有無を、(9)ポーズモデルに入力して、当該アクセント句直後のポーズ確率を推定(演算)する。
アクセント句情報としては、アクセント句の主辞主品詞、主辞副品詞、語形主品詞、語形副品詞、アクセント句位置、アクセント型、モーラ数、記号の有無、自立語数、付属語数等が考えられる。
【0021】
隣接アクセント句係り受け有無は、(4)隣接アクセント句係り受け解析により、確率付で得られるが(隣接アクセント句係り受け有確率=隣接アクセント句係り受け確率、隣接アクセント句係り受け無確率=1−隣接アクセント句係り受け確率)、ここでは係り受け閾値(0.5≧係り受け閾値≧0,係り受け閾値=0の場合は、全組み合わせ)以上の各組み合わせに対して、ポーズ確率推定を行う。
そして、ある隣接アクセント句係り受け有無の組み合わせパターンにおける連続係り受け有無確率PSD(D−i,・・・,D−1,D0,D+1,・・・,D+j)を、
PSD(D-i,・・・,D-1,D0,D+1,・・・,D+j)= PD-i(D-i)×,・・・,PD-1(D-1)×PD0(D0)×PD+1(D+1),・・・,×PD+j(D+j)
Dk=当該アクセント句+k番目のアクセント句の係り受け有または無
PDk(Dk)=Dkの確率(当該アクセント句+k番目のアクセント句の隣接
アクセント句係り受け有無の確率)
と定義し、
この係り受け有無の組み合わせパターンにおけるポーズ確率PSDP(D-i,・・・,D-1,D0,D+1,・・・,D+j)を
PSDP(D-i,・・・,D-1,D0,D+1,・・・,D+j)= PSD(D-i,・・・,D-1,D0,D+1,・・・,D+j)×PPM(F-i,・・・,F0,F+1,・・・,F+j)
Fk:当該アクセント句+k番目のアクセント句のアクセント句情報(属性値セット)
(このうち、隣接係り受け有無はDk)
PPM(F-i,・・・,F0,F+1,・・・,F+j):アクセント句情報(属性値)セットFを用いてポーズモデルにより推定されたポーズ確率
と定義する。
【0022】
具体例を用いて説明する。
(i) i=j=1、係り受け閾値=0.05として、対象となる3つのアクセント句(PD-1,PD0,PD+1)の(8)係り受け解析モデルを用いて(4)隣接アクセント句係り受け解析(数値化アクセント句情報を係り受け解析モデル(演算式)に代入して隣接係り受け有確率を算出)により隣接係り受け有確率PDが
PD-1(有)=0.90
PD0(有)=0.01
PD+1(有)=0.55
であった場合(PD-1(無)=0.10、PD0(無)=0.99、PD+1(無)=0.45)とする。
【0023】
(ii)隣接アクセント句係り受け有無の各組み合わせパターンに対する連続係り受け有無確率PSD(・,・,・)=PD-1(・)×PD0(・)×PD+1(・)は、
PSD(有,無,有)=0.90×0.99×0.55=0.49005
PSD(有,無,無)=0.90×0.99×0.45=0.40095
PSD(無,無,有)=0.10×0.99×0.55=0.05445
PSD(無,無,無)=0.10×0.99×0.45=0.04455
となる。
(当該アクセント句の係り受け有(PD0(有)=0.01)の連続係り受け有無確率PSD(・,有,・)は係り受け閾値(0.05)以下になることは明らかであるので含めない)
【0024】
(iii)また、上記の隣接アクセント句係り受け有無の各組み合わせパターンにおけるポーズ確率PPM(隣接係り受け有無以外の属性値は省略)が(9)ポーズ付与モデルを用いてポーズ付与部で演算した結果、
PPM(有,無,有)=0.45
PPM(有,無,無)=0.80
PPM(無,無,有)=0.15
PPM(無,無,無)=0.60
であったとする。
【0025】
(iv)隣接アクセント句係り受け有無の組み合わせパターンにおけるポーズ確率PSDP(・,・,・)=PSD(・,・,・)×PPM(・,・,・)は、
PSDP(有,無,有)=0.49005×0.45=0.2205225
PSDP(有,無,無)=0.49005×0.80=0.32076
PSDP(無,無,有)=0.05445×0.15=0.0081675
PSDP(無,無,無)=0.04455×0.60=0.02673
となる。
【0026】
(v)全PSDPを算出後、(23)統合ポーズ確率設定を行う。
(23)統合ポーズ確率設定では、統合ポーズ確率PTPは
PTP=PSDP(D-i,・・・,D-1,D0,D+1,・・・,D+j)の総和
と定義し、PTP≧0.5(閾値)となるアクセント句の直後にポーズを設定する。
上記例では、
Figure 0003690502
となり、アクセント句D0にポーズが設定される。
【0027】
(24)モーラ数、統合ポーズ確率に基づくポーズ設定は、長い区間ポーズがないと聞きにくいという音声上の制約を考慮して設定するポーズである。
予め、ポーズ未設定区間長と統合ポーズ確率PTPからなるポーズ未設定区間閾値セット(複数指定可)を定めておき、図5のフローによりポーズを設定する。
【0028】
以下、図5を用いて、(24)モーラ数、統合ポーズ確率PTPに基づくポーズ設定を説明する。
(31)では、ポーズ未設定区間の初期設定を行う。すなわち、ポーズ未設定区間の開始位置を処理対象の先頭に、終了位置を最初のポーズ位置に設定する。その後(32)へ移る。
(32)では、ポーズ未設定区間の総モーラ数がポーズ未設定区間閾値セットのポーズ未設定区間長以上であるか判定する(ポーズ未設定区間閾値セットが複数ある場合には、その中のいずれか以上であればよい)。条件を満たす場合には(33)へ、満たさない場合は(35)へ移る。
(33)では、(32)の条件を満たすポーズ未設定区間閾値セットで、最も長いポーズ未設定区間長のものに対応する統合ポーズ確率PTP以上で、最も高い確率を持つ位置(これを最大位置とよぶ)を求める。その後、(34)へ移る。
(34)では、最大位置が決定したかどうか判定する。条件を満たす場合には(36)へ、満たさない場合には(35)へ移る。
(35)では、ポーズ未設定区間終了位置が、処理対象末尾であるか判定する。条件を満たす場合には処理を終了する。満たさない場合には(37)へ移る。
(36)では、最大位置にポーズを設定する。そして、最大位置を新たにポーズ未設定区間終了位置にして(32)へ移る。
(37)では、現在のポーズ未設定区間終了位置をポーズ未設定区間開始位置に、次のポーズ位置をポーズ未設定区間終了位置にして、(32)へ移る。
以上のポーズ付与では、ポーズ有無の2値のみの設定の具体的手順を示したが、さらに細分化した(例えば、小ポーズ、中ポーズ等に分けるなど)ポーズ推定も可能である。この場合、(9)ポーズ付与モデルで、細分化したポーズ推定確率値を出力するようにし、(23)統合ポーズ確率設定では最も確率値の高いものを推定結果とすればよい。
【0029】
(6)強弱付与
強弱付与部6は、(5)ポーズ付与の(22)係り受け有無組み合わせパターン単位のポーズ確率設定と(23)統合ポーズ確率設定と同様の手法で、アクセント句単位に処理を行う。
図6に示すように、はじめに、(41)係り受け有無組み合わせパターン単位の強弱確率設定において、当該アクセント句の前後所定個数のアクセント句区間において品詞、アクセント句位置、アクセント型、モーラ数、自立語数等からなるアクセント句情報と隣接アクセント句間の係り受け有無の組み合わせに対応する強度(通常、強調、抑圧)毎の強弱確率APMを(10)強弱モデルを用いて求め、アクセント句間内の各隣接アクセント句の係り受け有無の確率PDを係り受け解析モデルを用いて求め、各隣接アクセント句の係り受け有無の確率PDから隣接アクセント句間の係り受け有無の各組み合わせパターンに対応する連続係り受け有無の確率PSDを求め、強弱確率APMと連続係り受け有無の確率PSDから係り受け有無の各組み合わせパターンに対応する強弱確率ASDPを算出し、(42)統合強弱確率設定において、係り受け有無の各組み合わせパターンにわたる強度毎の強弱確率ASDPの総和を統合強弱確率ATPとして算出し、強度毎の統合強弱確率ATPが最大となる強度(通常、強調、抑圧のいずれか)を当該アクセント句に設定する。
なお、強弱付与は音量の他にピッチ周波数の高低により行うこともできる。
【0030】
(実施例)
図7〜図9を用いて、本発明の実施例を説明する。
図7を参照して(2)形態素解析、(3)読み・アクセント付与、(4)隣接アクセント句係り受け解析を説明する。
(i)図7に示す日本語テキストを入力例として、(2)形態素解析を行う。
形態素解析は、入力された日本語テキストに対して、単語辞書を用いて単語の認定を行い、各単語ごとに、表記、品詞、読み、アクセント型などからなる単語情報が得られる。
(ii)次に、単語情報を用いて(3)読み・アクセント付与を行い、図7に示すようにアクセント句の認定を行い(図の/で囲まれた部分が一つのアクセント句)、読みとアクセント型(図では ’がアクセント位置を表す)を付与する。
(iii)次に、アクセント句の情報を用いて(4)隣接アクセント句係り受け解析を行い、各アクセント句に対して、隣接アクセント句係り受け確率PDを算出する(図の()内の数値が隣接アクセント句係り受け確率PDを表す)。
(iv)図8を参照して(5)ポーズ付与の説明を行う。
はじめに、(21)規則によるポーズ設定により、通常のテキストではポーズが付与されるのが一般的な句読点の位置にポーズを付与する。具体的には、図8において、[ポーズ ]と示した「陥るなか、」、「始めました。」の直後にポーズを付与する。また、これらの位置の統合ポーズ確率を1.0000に設定する。
【0031】
(v)次に、(22)係り受け有無組み合わせパターン単位のポーズ確率設定と(23)統合ポーズ確率設定について、当該アクセント句−2〜当該アクセント句+2の5つのアクセント句のアクセント句情報を用い、予め設定された係り受け閾値0.05の場合について、「景気が」と「いう」の2つのアクセント句の場合を具体的に説明する。
「景気が」:
図7の隣接アクセント句係り受け解析の結果より、
PSD(有,有,有,有,有)=0.99×0.98×0.97×1.00×0.99=0.9317
(他の組み合わせはすべて係り受け閾値0.05以下のため存在しない)
PPM(有;名詞;判定詞;・・・,有;動詞;格助詞;・・・,有;名詞;格助詞;・・・,有;名詞;名詞;・・・,有;名詞;格助詞;・・・)=0.98
(推定に用いるアクセント句情報(属性値)セットである隣接アクセント句係り受け有無、アクセント句情報(ここでは、隣接アクセント句有無;主辞主品詞;語形主品詞のみを表示、他に主辞副品詞、語形副品詞、モーラ数等の数値化した属性を用いる)を(9)ポーモデル(演算式)に入力して与えられる)
PSDP(有,有,有,有,有)=0.9317×0.98=0.9131
PTP=PSDP(有,有,有,有,有)=0.9131
PTP≧0.5(閾値)であるため、ポーズを設定する。
「いう」:
【0032】
図6の隣接アクセント句係り受け解析の結果より、
PSD(無,有,有,有,有)=0.91×0.98×0.80×0.98×0.96=0.6712
PSD(無,有,無,有,有)=0.91×0.98×0.20×0.98×0.96=0.1678
PSD(有,有,有,有,有)=0.09×0.98×0.80×0.98×0.96=0.0664
PSD(有,有,無,有,有)=0.09×0.98×0.20×0.98×0.96=0.0166
上記に対応するPPMは順に以下のようであるとする。
PPM(無;名詞;連用助詞;・・・,有;名詞;格助詞;・・・,有;動詞語幹;動詞活用語尾;・・・,有;名詞;格助詞;・・・,有;名詞;格助詞;・・・)=0.01
PPM(無;名詞;連用助詞;・・・,有;名詞;格助詞;・・・,無;動詞語幹;動詞活用語尾;・・・,有;名詞;格助詞;・・・,有;名詞;格助詞;・・・)=0.60
PPM(有;名詞;連用助詞;・・・,有;名詞;格助詞;・・・,有;動詞語幹;動詞活用語尾;・・・,有;名詞;格助詞;・・・,有;名詞;格助詞;・・・)=0.02
PPM(有;名詞;連用助詞;・・・,有;名詞;格助詞;・・・,無;動詞語幹;動詞活用語尾;・・・,有;名詞;格助詞;・・・,有;名詞;格助詞;・・・)=0.65
これらから、各PSDPは順に、
PSDP(無,有,有,有,有)=0.6712×0.01=0.0067
PSDP(無,有,無,有,有)=0.1678×0.60=0.1007
PSDP(有,有,有,有,有)=0.0664×0.02=0.0013
PSDP(有,有,無,有,有)=0.0166×0.65=0.0108
となるので、
PTP=0.0067+0.1007+0.0013+0.0108=0.1195
PTP<0.5であるため、ポーズを設定しない。
【0033】
(vi)その他の統合ポーズ確率設定については詳細は省略するが、図8の統合ポーズ確率設定の()内の数値が統合ポーズ確率PTPを表す。これが0.5以上である、「景気が」と「内閣府は」のアクセント句の直後にポーズを設定する。
(vii)次に(24)モーラ数、統合ポーズ確率に基づくポーズ設定を行う。ここでは、ポーズ未設定区間閾値値セットとして、
セット1:ポーズ未設定区間長=20、統合ポーズ確率=0.04
セット2:ポーズ未設定区間長=30、統合ポーズ確率=0.0001
を設定している。
具体的な処理の流れを、図5を用いて説明する。
まず、(31)で、ポーズ未設定区間開始位置を先頭(「緩やかに」の前)、ポーズ未設定区間終了位置を最初のポーズ位置である「景気が」の直後に設定する。
次に(32)では、ポーズ未設定区間「緩やかに回復してきたはずの景気が」の総モーラ数22モーラがポーズ未設定区間閾値セット1のポーズ未設定区間長を超えているので、(33)へ移る。
(33)では、未設定区間において、セット1の統合ポーズ確率0.04以上となる位置を探すが、存在しない。
そこで(34)から(35)に移り、現在の終了位置(「景気が」の直後)が処理対象末尾であるか判定し、(37)へ移る。
【0034】
(37)では、開始位置を「景気が」の直後、終了位置を「陥るなか、」の直後に設定し、(32)へ移る。
(32)では、ポーズ未設定区間「失速寸前に陥るなか、」の総モーラ数が15モーラであるので、(35)、(37)と移り、開始位置を「陥るなか、」の直後、終了位置を「内閣府は」の直後に設定し、総モーラ数は6であるので、同様に(32)→(35)→(37)と移り、開始位置を「内閣府は」の直後、終了位置を「始めました。」の直後に設定し、(32)へ移る。
(32)では、ポーズ未設定区間「デフレーションという言葉の定義を見直す作業を始めました。」の総モーラ数31モーラがポーズ未設定区間閾値セットのセット1、セット2両方のポーズ未設定区間長を超えるので(33)へ移る。
(33)では、最も長いポーズ未設定区間長をもつセット2の統合ポーズ確率0.0001以上で、最も高い確率をもつ位置として、統合ポーズ確率0.1598を持つ「定義を」の直後を最大位置として設定する。
【0035】
そして(34)→(36)と移り、最大位置「定義を」の直後にポーズを設定し、終了位置を「定義を」の直後として(32)へ移る。
(32)では、ポーズ未設定区間「デフレーションという言葉の定義を」の総モーラ数が17モーラのため(35)→(37)と移り、開始位置を「定義を」の直後、終了位置を「始めました。」の直後に設定し(32)へ移る。
(32)では、ポーズ未設定区間「見直す作業を始めました。」の総モーラ数が14モーラなので、(35)へ移り、「始めました。」の直後は、処理対象末尾であるため、処理を終了する。
この結果、(24)モーラ数、統合ポーズ確率に基づくポーズ設定では、「定義を」の直後にポーズを付与する。
【0036】
(viii)最終的には、「景気が」、「陥るなか」、「内閣府は」、「定義を」、「始めました」の直後がポーズとなる。
次に、(6)強弱付与の例を図9に示す。
ここでは、通常(音声的に強めも弱めもしない)、強調(音声的に強める)、抑圧(音声的に弱める)の3値のそれぞれを推定する(10)強弱モデル(演算式)を利用するものである。
(41)係り受け組み合わせパターン単位の強弱確率設定については、(22)係り受け有無の組み合わせパターン単位のポーズ確率設定と同様、当該アクセント句−2〜当該アクセント句+2の5つのアクセント句、係り受け閾値0.05とした場合、組み合わせパターンは(22)と同様になるため、ここでの具体例は省略する。
(42)統合強弱確率ATP設定により、図9の統合強弱確率に示すように、統合強弱確率が設定されたとする(()内に通常、強調、抑圧の順に各統合強弱確率値ATPを示している)。
【0037】
この結果、「デフレーションと」というアクセント句では、「強調」の統合強弱確率ATPが0.63と最も高いため、「強調」を付与し、「いう」というアクセント句では、「抑圧」の統合強弱確率ATPが0.76と最も高いため、「抑圧」を付与し、それ以外のアクセント句では「通常」の統合強弱確率ATPが最も高いため、「通常」(つまり、特別な指定はしないデフォルト)とする。
本発明の韻律情報設定装置は、CPUやメモリ等を有するコンピュータと、アクセス主体となるユーザが利用する利用者端末と記録媒体から構成される。
記録媒体は、CD−ROM、磁気ディスク装置、半導体メモリ等の機械読み取り可能な記録媒体であり、ここに記録されたプログラムは、コンピュータに読み取られ、コンピュータの動作を制御し、コンピュータ上に前述した実施の形態における各構成要素、すなわち形態素解析部、アクセント句認定、読み・アクセント付与部、隣接アクセント句係り受け解析部、ポーズ付与部、強弱付与部、各モデル格納部等を実現して各処理を行う。
【0038】
【発明の効果】
以上説明したように、本発明によれば、既存の統計的な文節係り受け解析を流用して、韻律情報の設定に最適な情報に変形し、その情報を用いて、ポーズ、強弱情報を設定することにより、現状の係り受け解析の精度を考慮した韻律情報の設定を行うことができる。
また、統計モデルを利用しているため、ドメインに応じて学習データを切り替えることにより、間接的に意味、文脈的な情報を反映して韻律情報の設定を行うことができる。
【図面の簡単な説明】
【図1】本発明の概略フローチャート。
【図2】本発明の韻律情報設定装置の構成図。
【図3】モデル作成のフローチャート。
【図4】ポーズ付与のフローチャート。
【図5】モーラ数、統合ポーズ確率に基づくポーズ設定のフローチャート。
【図6】強弱付与のフローチャート。
【図7】入力テキスト〜隣接アクセント句係り受け解析の処理例を説明する図。
【図8】ポーズ付与例を説明する図。
【図9】強弱付与例を説明する図。
【符号の説明】
2 形態素解析部
3 アクセント句認定、読み・アクセント付与部
4 隣接アクセント句係り受け解析部
5 ポーズ付与部
6 強弱付与部

Claims (12)

  1. 日本語テキストを入力して、読み・韻律情報を出力する読み・韻律情報設定方法において、
    入力した日本語テキストを単語認定及び読み韻律情報を設定するための辞書を用いて形態素解析し、単語情報を得る過程と、
    単語情報と、韻律単位の設定単位であるアクセント句を認定し、アクセント句の読みとアクセント型を付与するための規則を用いて読み・アクセントの付与を行い、アクセント句の認定及びアクセント句情報を得る過程と、
    当該アクセント句の前後所定個数のアクセント句区間を設定する過程と、
    アクセント句区間のアクセント句情報に基づいて係り受け解析モデルを用いて隣接アクセント句係り受け解析を行い各隣接アクセント句の係り受け有無の確率PDを求める過程と、
    各隣接アクセント句の係り受け有無の確率PDを元にアクセント句区間の隣接アクセント句係り受け有無の組み合わせパターンにおける連続係り受け有無確率PSDを算出する過程と、
    アクセント句区間のアクセント句情報と、アクセント句係り受け有無の組み合わせパターンに基づいてポーズモデルを用いてポーズ確率PPMを算出する過程と、
    連続係り受け有無確率PSDとポーズ確率PPMからアクセント句区間の隣接アクセント句係り受け有無の各組み合わせパターンにおけるポーズ確率PSDPを算出する過程と、
    ポーズ確率PSDPの総和を計算して統合ポーズ確率PTPを得る過程と、
    統合ポーズ確率PTPと予め設定された閾値とを比較することにより当該アクセント句におけるポーズの設定を行う過程とを備えたことを特徴とする韻律情報設定方法。
  2. 請求項1に記載の韻律情報設定方法において、
    予め決められた規則によるポーズの設定を行う過程と、
    ポーズ未設定区間が予め決められたポーズ未設定区間より長い場合に統合ポーズ確率PTP以上で最も高い確率を持つ位置にポーズの設定を行う過程と、
    を備えたことを特徴とする韻律情報設定方法。
  3. 請求項1に記載の韻律情報設定方法において、
    当該アクセント句の前後所定個数のアクセント句区間におけるアクセント句情報と、アクセント句係り受け有無の組み合わせパターン、各アクセント句のポーズ有無に基づいて強弱モデルを用いて強度毎の強弱確率APMを算出する過程と、
    強度毎の強弱確率APMと前記連続係り受け有無の確率PSDから隣接アクセント句係り受け有無の組み合わせパターンの強弱確率ASDPを算出する過程と、
    強度毎の強弱確率ASDPの総和を統合強弱確率ATPとして算出する過程と、
    強度毎の統合強弱確率ATPの中で最大となる強度を当該アクセント句に設定する過程とを備えたことを特徴とする韻律情報設定方法。
  4. 日本語テキストを入力して、読み・韻律情報を出力する読み・韻律情報設定装置において、
    入力した日本語テキストを単語認定及び読み韻律情報を設定するための辞書を用いて形態素解析し、単語情報を得る形態素解析部と、
    単語情報と、韻律単位の設定単位であるアクセント句を認定し、アクセント句の読みとアクセント型を付与するための規則を用いて読み・アクセントの付与を行い、アクセント句の認定及びアクセント句情報を得る読み・アクセント付与部と、
    当該アクセント句の前後所定個数のアクセント句区間を設定し、アクセント句区間のアクセント句情報に基づいて係り受け解析モデルを用いて隣接アクセント句係り受け解析を行い各隣接アクセント句の係り受け有無の確率PDを演算する隣接アクセント句係り受け解析部と、
    各隣接アクセント句の係り受け有無の確率PDを元にアクセント句区間の隣接アクセント句係り受け有無の組み合わせパターンにおける連続係り受け有無確率PSDを算出し、アクセント句区間のアクセント句情報と、アクセント句係り受け有無の組み合わせパターンに基づいてポーズモデルを用いてポーズ確率PPMを算出し、連続係り受け有無確率PSDとポーズ確率PPMからアクセント句区間の隣接アクセント句係り受け有無の各組み合わせパターンにおけるポーズ確率PSDPを算出し、ポーズ確率PSDPの総和を計算して統合ポーズ確率PTPを得て、統合ポーズ確率PTPと予め設定された閾値と比較することにより当該アクセント句のポーズの設定を行うポーズ付与部を備えたことを特徴とする韻律情報設定装置。
  5. 請求項4に記載の韻律情報設定装置において、
    ポーズ付与部は、
    予め決められた規則によるポーズの設定を行う手段と、
    ポーズ未設定区間が予め決められたポーズ未設定区間より長い場合に統合ポーズ確率PTP以上で最も高い確率を持つ位置にポーズの設定を行う手段を備えたことを特徴とする韻律情報設定装置。
  6. 請求項4に記載の韻律情報設定装置において、
    当該アクセント句の前後所定個数のアクセント句区間におけるアクセント句情報と、アクセント句係り受け有無の組み合わせパターン、各アクセント句のポーズ有無に基づいて強弱モデルを用いて強度毎の強弱確率APMを算出し、強度毎の強弱確率APMと前記連続係り受け有無の確率PSDから隣接アクセント句係り受け有無の組み合わせパターンの強度毎の強弱確率ASDPを算出し、強度毎の強弱確率ASDPの総和を統合強弱確率ATPとして算出し、強度毎の統合強弱確率ATPの中で最大となる強度を当該アクセント句に設定する強弱付与部を備えたことを特徴とする韻律情報設定装置。
  7. 入力した日本語テキストを単語認定及び読み韻律情報を設定するための辞書を用いて形態素解析し、単語情報を得る処理と、
    単語情報と、韻律単位の設定単位であるアクセント句を認定し、アクセント句の読みとアクセント型を付与するための規則を用いて読み・アクセントの付与を行い、アクセント句の認定及びアクセント句情報を得る処理と、
    当該アクセント句の前後所定個数のアクセント句区間を設定する処理と、
    アクセント句区間のアクセント句情報に基づいて係り受け解析モデルを用いて隣接アクセント句係り受け解析を行い各隣接アクセント句の係り受け有無の確率PDを求める処理と、
    各隣接アクセント句の係り受け有無の確率PDを元にアクセント句区間の隣接アクセント句係り受け有無の組み合わせパターンにおける連続係り受け有無確率PSDを算出する処理と、
    アクセント句区間のアクセント句情報と、アクセント句係り受け有無の組み合わせパターンに基づいてポーズモデルを用いてポーズ確率PPMを算出する処理と、
    連続係り受け有無確率PSDとポーズ確率PPMからアクセント句区間の隣接アクセント句係り受け有無の組み合わせにおけるポーズ確率PSDPを算出する処理と、
    隣接アクセント句係り受け有無の各組み合わせパターンにおけるポーズ確率PSDPの総和を計算して統合ポーズ確率PTPを得る処理と、
    統合ポーズ確率PTPと予め設定された閾値と比較することにより当該アクセント句のポーズの設定を行う処理をコンピュータに実行させるための韻律情報設定プログラム。
  8. 請求項7に記載の韻律情報設定プログラムにおいて、
    予め決められた規則によるポーズの設定を行う処理と、
    ポーズ未設定区間が予め決められたポーズ未設定区間より長い場合に統合ポーズ確率PTP以上で最も高い確率を持つ位置にポーズの設定を行う処理を備えた韻律情報設定プログラム。
  9. 請求項7に記載の韻律情報設定プログラムにおいて、
    当該アクセント句の前後所定個数のアクセント句区間におけるアクセント句情報と、アクセント句係り受け有無の組み合わせパターン、各アクセント句のポーズ有無に基づいて強弱モデルを用いて強度毎の強弱確率APMを算出する処理と、
    強度毎の強弱確率APMと前記連続係り受け有無の確率PSDから隣接アクセント句係り受け有無の組み合わせパターンの強度毎の強弱確率ASDPを算出する処理と、
    強度毎の強弱確率ASDPの総和を統合強弱確率ATPとして算出する処理と、
    強度毎の統合強弱確率ATPの中で最大となる強度を当該アクセント句に設定する処理をコンピュータに実行させるための韻律情報設定プログラム。
  10. 入力した日本語テキストを単語認定及び読み韻律情報を設定するための辞書を用いて形態素解析し、単語情報を得る処理と、
    単語情報と、韻律単位の設定単位であるアクセント句を認定し、アクセント句の読みとアクセント型を付与するための規則を用いて読み・アクセントの付与を行い、アクセント句の認定及びアクセント句情報を得る処理と、
    当該アクセント句の前後所定個数のアクセント句区間を設定する処理と、
    アクセント句区間のアクセント句情報に基づいて係り受け解析モデルを用いて隣接アクセント句係り受け解析を行い各隣接アクセント句の係り受け有無の確率PDを求める処理と、
    各隣接アクセント句の係り受け有無の確率PDを元にアクセント句間の隣接アクセント句係り受け有無の組み合わせパターンにおける連続係り受け有無確率PSDを算出する処理と、
    アクセント句区間のアクセント情報と、アクセント句係り受け有無の組み合わせパターンに基づいてポーズモデルを用いてポーズ確率PPMを算出する処理と、連続係り受け有無確率PSDとポーズ確率PPMからアクセント句区間の隣接アクセント句係り受け有無の各組み合わせパターンにおけるポーズ確率PSDPを算出する処理と、
    ポーズ確率PSDPの総和を計算して統合ポーズ確率PTPを得る処理と、
    統合ポーズ確率PTPと予め設定された閾値とを比較することにより当該アクセント句のポーズの設定を行う処理をコンピュータに実行させるための韻律情報設定プログラムを記録したコンピュータ読み取り可能な記録媒体。
  11. 請求項10に記載の韻律情報設定プログラムを記録したコンピュータ読み取り記録媒体において、
    予め決められた規則によるポーズの設定を行う処理と、
    ポーズ未設定区間が予め決められたポーズ未設定区間より長い場合に統合ポーズ確率PTP以上で最も高い確率を持つ位置にポーズの設定を行う処理を備えた韻律情報設定プログラムを記録したコンピュータ読み取り可能な記録媒体。
  12. 請求項10に記載の韻律情報設定プログラムを記録したコンピュータ読み取り記録媒体において、
    当該アクセント句の前後所定個数のアクセント句区間におけるアクセント句情報と、アクセント句係り受け有無の組み合わせパターン、各アクセント句のポーズ有無に基づいて強弱モデルを用いて強度毎の強弱確率APMを算出する処理と、
    強度毎の強弱確率APMと前記連続係り受け有無の確率PSDから隣接アクセント句係り受け有無の組み合わせパターンの強弱確率ASDPを算出する処理と、
    強度毎の強弱確率ASDPの総和を統合強弱確率ATPとして算出する処理と、
    強度毎の統合強弱確率ATPの中で最大となる強度を当該アクセント句に設定する処理を備えた韻律情報設定プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2001121097A 2001-04-19 2001-04-19 韻律情報設定方法及び装置並びにプログラム及び記録媒体 Expired - Lifetime JP3690502B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001121097A JP3690502B2 (ja) 2001-04-19 2001-04-19 韻律情報設定方法及び装置並びにプログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001121097A JP3690502B2 (ja) 2001-04-19 2001-04-19 韻律情報設定方法及び装置並びにプログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2002311982A JP2002311982A (ja) 2002-10-25
JP3690502B2 true JP3690502B2 (ja) 2005-08-31

Family

ID=18971031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001121097A Expired - Lifetime JP3690502B2 (ja) 2001-04-19 2001-04-19 韻律情報設定方法及び装置並びにプログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP3690502B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1320482C (zh) * 2003-09-29 2007-06-06 摩托罗拉公司 标识文本串中的自然语音停顿的方法
JP4621936B2 (ja) * 2005-09-16 2011-02-02 株式会社国際電気通信基礎技術研究所 音声合成装置、学習データ生成装置、ポーズ予測装置およびプログラム
CN1945693B (zh) * 2005-10-09 2010-10-13 株式会社东芝 训练韵律统计模型、韵律切分和语音合成的方法及装置
JP6309852B2 (ja) * 2014-07-25 2018-04-11 日本電信電話株式会社 強調位置予測装置、強調位置予測方法及びプログラム

Also Published As

Publication number Publication date
JP2002311982A (ja) 2002-10-25

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
US5878386A (en) Natural language parser with dictionary-based part-of-speech probabilities
KR100563365B1 (ko) 계층적 언어 모델
US6535849B1 (en) Method and system for generating semi-literal transcripts for speech recognition systems
JP2007114507A (ja) 韻律制御規則生成方法、音声合成方法、韻律制御規則生成装置、音声合成装置、韻律制御規則生成プログラム及び音声合成プログラム
JP3690502B2 (ja) 韻律情報設定方法及び装置並びにプログラム及び記録媒体
JP5623380B2 (ja) 誤り文修正装置、誤り文修正方法およびプログラム
GB2378877A (en) Prosodic boundary markup mechanism
JP4004376B2 (ja) 音声合成装置、音声合成プログラム
JP2011154061A (ja) 辞書作成装置、そのコンピュータプログラムおよびデータ処理方法
JP3016779B1 (ja) 音声理解装置及び音声理解システム
JP2004151527A (ja) 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム
JP3518340B2 (ja) 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体
Yeh et al. Speech recognition with word fragment detection using prosody features for spontaneous speech
JP4218075B2 (ja) 音声合成装置およびそのテキスト解析方法
JP3836607B2 (ja) 音声認識のための統計的言語モデル作成装置
JP2004246140A (ja) テキスト選択方法、装置及びプログラム
JP3571925B2 (ja) 音声情報処理装置
JP2004271615A (ja) 情報処理装置
JP6287754B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム
JP2000056788A (ja) 音声合成装置の韻律制御方法
JPH05134691A (ja) 音声合成方法および装置
JP6773074B2 (ja) 応答生成方法、応答生成装置及び応答生成プログラム
JP4308627B2 (ja) テキスト解析方法、テキスト解析装置、テキスト解析プログラム、このプログラムを記録した記録媒体
JP2002258884A (ja) 音声合成方法および装置並びにプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050524

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050607

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3690502

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090624

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090624

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100624

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100624

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110624

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120624

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130624

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term