JP2016029413A

JP2016029413A - 強調位置予測装置、強調位置予測方法及びプログラム

Info

Publication number: JP2016029413A
Application number: JP2014151460A
Authority: JP
Inventors: 秀治中嶋; Hideji Nakajima; 水野　秀之; Hideyuki Mizuno; 秀之水野
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2014-07-25
Filing date: 2014-07-25
Publication date: 2016-03-03
Anticipated expiration: 2034-07-25
Also published as: JP6309852B2

Abstract

【課題】入力テキストの言語情報に基づいて、入力テキストの強調区間を予測する。
【解決手段】解析結果記憶部１１に、強調生起範囲で区切られた入力テキストを解析した解析結果が記憶されている。強調位置予測モデル記憶部１０４に、テキスト解析結果から得られる特徴量と強調の有無を示す識別情報との関係を表す強調位置予測モデルが記憶されている。特徴量構成部１０２が、入力テキストの解析結果から強調生起範囲ごとの特徴量の系列を生成する。強調位置予測部１０３が、強調生起範囲ごとの特徴量の系列を強調位置予測モデルへ入力して強調生起範囲ごとの識別情報の系列を求める。
【選択図】図１

Description

この発明は、音声合成技術に関し、特に、音声の強調位置を予測する技術に関する。

例えば、映画のシーンに応じた台詞を発話する場面、童話の語り聞かせの場面、テレビなどのメディアを通じた商品宣伝の場面、及びコールセンタなどでの電話応対場面などで自然に発せられた「表現豊かな音声」において、強調は頻繁に行われている。音声合成によって生成される合成音においても、適切な強調を行うことにより、合成音の自然性が高まる。

非特許文献１にあるように、特定の区間が強調されて発話された場合、強調区間の基本周波数が読上げ調で発話された部分に比べて高くなる。従来の音声合成装置で、読み上げの音声合成に用いられる、読み、アクセント型、アクセント句境界の位置及びポーズの位置といった特徴量と、読み上げとは異なる日常の様々な表現豊かな音声だけから音声合成用モデルを構築し、そのモデルを用いて音声合成を行っても、このような強調区間での声の高さを十分に再現できない。

非特許文献１では、人手によって強調区間にマーク（以下、強調マークという）を付与し、それらの強調マークを含む学習データを用いて音声合成用モデルを再構築することで、声の高さの再現性能を改善している。

前野、能勢、小林、井島、中嶋、水野、吉岡、"多様な発話様式によるHMM音声合成のための韻律コンテキストの検討"、日本音響学会春季研究発表会、1-Q-28(d)、pp. 385-386、2011年

非特許文献１の手法によって音声合成を行うためには、合成対象の入力テキストの各区間に強調マークを付与するか否かを決定する必要がある。しかし、従来の音声合成では、これを自動で実現する方法は存在しなかった。そのため、テキストからの音声合成の自動化は実現されていない。

この発明は、入力テキストの言語情報に基づいて、入力テキストの強調区間を予測する強調位置予測技術を提供することを目的とする。

上記の課題を解決するために、この発明の強調位置予測装置は、テキスト解析結果から得られる特徴量と強調の有無を示す識別情報との関係を表す強調位置予測モデルを記憶する強調位置予測モデル記憶部と、強調生起範囲で区切られた入力テキストを解析した解析結果から強調生起範囲ごとの特徴量の系列を生成する特徴量構成部と、強調生起範囲ごとの特徴量の系列を強調位置予測モデルへ入力して強調生起範囲ごとの識別情報の系列を求める強調位置予測部と、を含む。

この発明によれば、入力テキストの言語情報に基づいて、入力テキストの強調区間を予測することができる。また、音声合成への応用だけではなく、強調と判断された箇所の文字を太字にする、括弧を加える、色を変える、などの修飾を加えることによって、テキスト上でも強調箇所を一目瞭然にすることが可能となる。

図１は、強調位置予測装置の機能構成を例示する図である。図２は、強調位置予測方法の処理フローを例示する図である。図３は、特徴量構成部が出力する特徴量の具体例を示す図である。

以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

実施形態の強調位置予測装置１０は、制御部１００、解析結果読込部１０１、特徴量構成部１０２、強調位置予測部１０３及び強調位置予測モデル記憶部１０４を有する。強調位置予測装置１０は外部の装置が有する解析結果記憶部１１にアクセス可能なように構成されている。解析結果記憶部１１は、強調位置予測装置１０自身が内部に有していてもよい。強調位置予測装置１０は、さらにカテゴリ名辞書記憶部１０５を有していてもよい。強調位置予測装置１０は、例えば、ＣＰＵ（central processing unit）やＲＡＭ（random-access memory）等を備える公知のコンピュータに所定のプログラムが読み込まれて構成される装置である。強調位置予測装置１０の少なくとも一部が集積回路等のハードウェアで構成されていてもよい。強調位置予測装置１０は、制御部１００の制御のもとで各処理を実行する。

強調位置予測装置１０が備える各記憶部は、例えば、ＲＡＭ（Random Access Memory）などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ（Flash Memory）のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。音声ドキュメント検索装置が備える各記憶部は、それぞれ論理的に分割されていればよく、一つの物理的な記憶装置に記憶されていてもよい。

解析結果記憶部１１には、入力テキストに言語情報として形態素解析結果及び係り受け解析結果が付与された入力テキスト情報が記憶されている。入力テキストは、音声合成対象となる１個以上の単語からなる系列であり、この系列は後述する方法で強調生起範囲ごとに区切られている。

音声合成のテキスト解析内で動作する形態素解析は、テキストを単語ごとに分割し、それぞれの単語に品詞や読みなどの辞書的情報を付与する技術である。形態素解析は、例えば、「松本裕治、“形態素解析システム「茶筅」”、情報処理、vol. 41(11)、pp. 1208-1214、2000年（参考文献１）」に記載された方法によって実施できる。

音声合成のテキスト解析内で動作する係り受け解析は、形態素解析結果を入力として、複数の単語列からなる文節を構成し、品詞や単語の出現形や単語のアイディの関係に基づいて、文節間の係り受け関係を予測する技術である。係り受け解析は、例えば、「工藤拓、松本裕治、“チャンキングの段階適用による日本語係り受け解析”、情報処理学会論文誌、43(6)、pp. 1834-1842、2002年（参考文献２）」に記載された方法によって実施できる。

形態素解析及び係り受け解析の技術は従来技術であり、ここではそれらの詳しい説明は省略する。

例えば、アクセント句の先頭の文節の係り受け情報と最後の文節の係り受け情報をアクセント句間での係り受け情報として用いることができる。アクセント句は、１つ以上の文節から構成される系列である。声の高さのような韻律処理では、アクセント句を単位として処理を行う場合が多い。アクセント句の境界の予測は、例えば、「Nakajima, H., Miyazaki, N., Yoshida, A., Nakamura, T., Mizuno, H., “Creation and Analysis of a Japanese Speaking Style Parallel Database for Expressive Speech Synthesis”, in Proceedings of Oriental COCOSDA 2010, ［online］, [2014年7月3日検索], <インターネットURL:http://desceco.org/O-COCOSDA2010/proceedings/paper_30.pdf>（参考文献３）」に記載された方法により実施できることが知られている。

強調生起範囲は、所定の基準に基づいて定められた単語または単語列からなる区間である。どのような区間を強調生起範囲としてもよい。例えば、ポーズ位置とポーズ位置で挟まれた区間（イントネーション句）にある単語または単語列を１つの強調生起範囲とすることができる。ポーズ位置の予測は、例えば、「木暮監修、山森編著、“未来ねっと技術シリーズ４メディア処理技術”、電気通信協会、pp. 146-149（参考文献４）」に記載された方法によって実行できる。あるいは、アクセント句を強調生起範囲としてもよい。あるいは、前記の係り受け解析の処理単位である文節を強調生起範囲としてもよい。なお、アクセント句とイントネーション句とは、単語列としては重複することがあるため、強調生起範囲は、アクセント句単位で決定するか、もしくはイントネーション句単位で決定することとなり、アクセント句とイントネーション句を混在させた強調生起範囲の決定は行わない方がよい。

強調位置予測モデル記憶部１０４には、強調位置予測モデルが記憶されている。強調位置予測モデルは、テキストの形態素解析結果及び係り受け解析結果の少なくとも一方から構成される特徴量と当該テキストの強調位置との関係を表すモデルである。すなわち、強調位置予測モデルは、テキストを構成する強調生起範囲（区間）が強調位置であるか否かと特徴量との関係を表すモデルである。

カテゴリ名辞書記憶部１０５には、アクセント句に含まれる単語が特徴語であるのか否かを示すカテゴリ名辞書が記憶されている。特徴語には、アクセント句末や文末の感嘆符の有無、句読点の有無を用いることができる。入力テキストが商品宣伝文であれば、商品名や商品を構成する語のアクセント句内での有無を用いることができる。入力テキストが対話文や物語文であれば、アクセント句内で対話や物語の流れの中で前に出てきた語が含まれているか否かを用いることができる。あるいは、一般のシソーラスのように、単語の意味属性を用いることも可能である。シソーラスの例として、例えば、「NTTコミュニケーション科学研究所監修、池原ほか編集、“日本語語彙大系”、岩波書店（参考文献５）」がある。あるいは、「かく」という平仮名表記の意味を確定させるための標準表記、すなわち「かく」に対して「欠く」か「書く」か「掻く」などのうちのどれと対応するのかをカテゴリ名辞書に記憶しておくことも可能である。カテゴリ名辞書があれば、品詞を見るだけでは区別できない特徴語の情報を用いることができ、強調の位置をより正確に予測できるようになる利点がある。

以下、図２を参照して、実施形態の強調位置予測方法を説明する。

ステップＳ１０１ａにおいて、解析結果読込部１０１は、解析結果格納部１１から、入力テキストの各強調生起範囲に対応する形態素解析結果を読み出す。ステップＳ１０１ｂにおいて、解析結果読込部１０１は、解析結果格納部１１から、入力テキストの各強調生起範囲に対応する係り受け解析結果を読み出す。ステップＳ１０１ａとＳ１０１ｂは、少なくとも一方を実行すればよい。ステップＳ１０１ａとＳ１０１ｂの両方を実行してもよい。いずれの解析結果を読み出すかは後述する特徴量の構成により定まる。読み出した解析結果は特徴量構成部１０２へ出力される。

ステップＳ１０２において、特徴量構成部１０２は、解析結果に対応する特徴量を生成する。特徴量構成部１０２は、入力テキストのすべての強調生起範囲についてそれぞれ特徴量を生成する。特徴量は、例えば、従来の音声合成のテキスト解析結果から得られる特徴量の要素のすべて、またはそれらの一部の要素の組み合わせからなる列（例えば、ベクトルや要素の結合値）を特徴量とする。生成された特徴量は、強調位置予測部１０３へ出力される。

図３に、複数の要素からなる列を特徴量とした例を示す。図３の例では、アクセント句を強調生起範囲としている。図３の例は、２番の要素（「他に」）と６番の要素（「カービングナイフ！」）のアクセント句に強調が置かれる事例である。

この実施形態の特徴量は、従来の音声合成のテキスト解析結果から得られる情報と、係り受け解析の結果を用いて組み上げることができる情報の組み合わせから構成される。

音声合成のテキスト解析結果から得られる情報は、具体的には以下の項目である。
・アクセント句のイントネーション句内での位置
・イントネーション句の文内での位置
・アクセント句の末尾にポーズが来るか否か
・アクセント句内や末尾に特徴的な語が来るか否か
・アクセント句の主たる内容語の出現形と品詞
・アクセント句の主たる機能語の出現形と品詞
係り受け解析の結果を用いて組み上げることができる情報は、具体的には以下の項目である。
・対比関係での比べられる側か比べる側かの種別
・並列関係での位置づけの種別
・アクセント句係り受け解析結果

図３の表には上から順に１行ずつアクセント句の情報を記載している。アクセント句の文字列は右端の「入力テキスト」の列の記載の通りである。「１）アクセント句番号」は説明のために用意した０から始まるアクセント句の番号である。この入力テキストの場合６で終わるが、テキストに含まれるアクセント句の数によって終了番号は異なる。

２）の列は、「アクセント句のイントネーション句内での位置」に対応する例である。図３の例では、アクセント句の位置がイントネーション句の末尾の位置であればＦで、末尾以外の位置であればＮで表わしている．
３）の列は、「イントネーション句の文内での位置」に対応する例である。図３の例では、イントネーション句の位置が文内の末尾であればＦで、文末以外であればＮで表わしている。

４）の列は、「アクセント句の末尾にポーズが来るか否か」に対応する例である。図３の例では、アクセント句の末尾にポーズがあればＹで、無ければＮで表わしている。

５）、６）、１１）の列は、「アクセント句内や末尾に特徴的な語が来るか否か」に対応する例である。図３の例では、５）の列でアクセント句末に感嘆符という特徴的な語が来るか否かを、６）の列でアクセント句末に句読点という特徴的な語があるか否かを、１１）の列でアクセント句が商品名やその構成品を表わす内容語という特徴的な語を含むか否かを、それぞれ含む場合にＹで、含まない場合にＮで表している。アクセント句内の各単語が特徴的な単語であるか否かは、カテゴリ名辞書記憶部１０５に記憶されたカテゴリ名辞書を参照して判別することができる。

７）、８）の列は、「アクセント句の主たる内容語の出現形と品詞」に対応する例である。図３の例では、右端の「入力テキスト」が形態素解析された結果から、主たる内容語が７）の列に、それに対応する品詞が８）の列に記載されている。

９）、１０）の列は、「アクセント句の主たる機能語の出現形と品詞」に対応する例である。図３の例では、右端の「入力テキスト」が形態素解析された結果から、主たる機能語が９）の列に、それに対応する品詞が１０）に記載されている。０番の「この」や６番の「カービングナイフ！」のように機能語を持たないアクセント句では、それらが存在しないことをＮで表わしている。

１２）の列は、「対比関係での比べられる側か比べる側かの種別」に対応する例である。図３の例では、１番の「万能包丁」と６番の「カービングナイフ」が「〜の他に…」という表現で比較されている。比較される２つのうち、比べられる側（すなわち、「〜」に位置する側）に関わるアクセント句をＣＥで、主たる側（「…」に位置する側）に関わるアクセント句をＣＲで表している。

１３）の列は、「並列関係での位置づけの種別」に対応する例である。図３の例では、２番の「肉」と３番の「魚」が「肉や魚」で並列関係がある。その関係の始まりをＰＢで、終わりをＰＥで表わしている。

その他、図示していないが、前述した「アクセント句間の係り受け解析結果」を用いてもよい。例えば、図３の０番の「この」は１番の「万能包丁の」に係るという情報が係り受け解析結果の例である。

また、図示していないが、カテゴリ名辞書から取り出された意味カテゴリ名を用いてもよい。例えば、図３の１番には「包丁」、３番には「肉」、４番には「魚」、６番には「ナイフ」があるが、参考文献５によれば、それぞれ「刃物」、「肉・卵」、「魚」、「刃物」という意味カテゴリ名が付与されており、これらを図３の１）から１３）までのベクトルに加えて用いることも可能である。

ステップＳ１０３において、強調位置予測部１０３は、強調位置予測モデル格納部１０４に格納された強調位置予測モデルと、特徴量構成部１０２で得られた特徴量とを用いて、入力テキストを構成する各強調生起範囲が強調位置であるか否かを識別する。

強調位置予測モデルは、図３に例示したような、２）から１３）までの項目すべて、または任意の組み合わせを特徴量として入力し、強調か非強調かを判定するモデルをサポートベクターマシン（SVM: Support Vector Machine）等の機械学習器を用いて構成したものである。強調位置予測モデルの構成は、前記の２）から１３）までのような特徴量とそれに対応する各強調生起範囲で強調マークが付与されるか否かという情報とが対になったデータを大量に用意して、それをサポートベクターマシンなどの機械学習器の学習処理にかけることで実施できる。これらの特徴量は学習データ内での分布に応じて、ある特徴量の存在だけで決まるというように支配的に強調位置決定に寄与する場合もあれば、他の特徴量と総合的に寄与する場合もある。

以下に強調位置予測部１０３の処理の詳細を例示する。各強調生起範囲i=0,…,I-1に対して得られた特徴量をx_iとし、強調生起範囲iが強調位置であるか否かを表す識別情報（すなわち、強調マークを付与するか否かを表す識別情報）をy_iとする。ただし、Iは1以上の整数である。例えば、Iは入力テキストに属する強調生起範囲の総数である。特徴量x_iはベクトル等である。識別情報y_iの例は、強調生起範囲iが強調位置である場合にy_i=1となり、強調生起範囲iが強調位置でない場合にy_i=0となる二値情報である。特徴量x_iの系列をx=(x₀,…,x_I-1)とし、識別情報y_iの系列をy=(y₀,…,y_I-1)とする。

この例では、強調位置予測モデルは、入力テキストの特徴量の系列xと識別情報の系列yとを対応付けるモデルである。例えば、強調位置予測モデルは、特徴量の系列xを入力変数とし、識別情報の系列yを出力変数とするモデルである。強調位置予測モデルに限定はないが、強調位置予測モデルの具体例は、系列ラベリング等に用いられる隠れマルコフモデル等の確率モデルである。

強調位置予測モデルは、例えば、学習用のテキストの形態素解析結果及び係り受け解析結果の少なくとも一方から構成される特徴量と、当該テキストの各強調生起範囲が強調位置であるか否かを表す識別情報との組からなる学習データを用い、一般の機械学習手法を実施することで構築できる。強調位置予測モデルの学習に用いられる特徴量の構成は、特徴量構成部１０２で得られる特徴量の構成と同じである。学習データの識別情報は人手で強調と判断された区間に付与しておく。機械学習手法の詳細は、例えば、「高村大也ほか著、“言語処理のための機械学習入門”、コロナ社（参考文献６）」等に記載されている。

強調位置予測モデルは、例えば、強調生起範囲を処理単位として、その処理単位、及び、その前後の単位に対応する特徴量から構成した特徴量の系列を入力とし、その処理単位での強調マークの有無を表す識別情報の系列を予測するためのモデルである。以下に隠れマルコフモデルで構築された強調位置予測モデルを例示する。

ただし、P(x,y)はx=(x₀,…,x_I-1)、y=(y₀,…,y_I-1)の同時確率であり、P(y_i|x_i)はx_iのもとでのy_iの条件付き確率であり、P(x_i|x_i-1)はx_i-1のもとでのx_iの条件付き確率である。x_-1は文の先頭の単語よりも前にあると仮定する文の開始位置という便宜上の強調予測範囲に関して得られる特徴量であり、定数を要素とするベクトルである。

強調位置予測部１０３は、強調位置予測モデル格納部１０４から強調位置予測モデルを読み込み、当該強調位置予測モデルの入力変数に特徴量構成部１０２から出力された特徴量の系列xを設定し、識別情報の系列yを予測し、当該識別情報の系列yを強調位置予測結果として出力する。例えば、別の方法として，隠れマルコフモデルで強調位置予測モデルが構成されている場合、入力された特徴量の系列xに対してP(x,y)を最大にする識別情報の系列yが出力される。

このような識別情報の系列yの探索は、例えば公知のビタビアルゴリズム（Viterbi algorithm）を用いて行うことができる。強調生起範囲を処理単位として、その処理単位での強調マークの有無を表す識別情報の系列yを、その単位、及び、その前後の単位に対応する特徴量から構成した特徴量の列を入力した強調位置予測モデルを用いて、文頭から文末までの処理単位ごとに強調マークを付与する場合と付与しない場合のすべての可能性を列挙して、文頭から文末まで大域的に、強調位置予測モデルが与える確率が最大の系列をビタビアルゴリズムで選択すればよい。あるいは、強調生起範囲に代えて、着目する単語、文節、アクセント句を処理単位として識別情報の系列yを得てもよい。すなわち、特徴量を得る処理単位と識別情報を得る処理単位とは、同一であってもよいし、異なっていてもよい。あるいは、処理単位の前後数単位間で確率の高い識別情報の系列に探索範囲を絞って探索してもよい。また、特徴量の構成に関わった範囲のみについて強調位置の予測を行うことにし、強調位置の予測自体を局所的に行なうことも可能である。これらの探索法自体は周知であり、例えば、上記の参考文献６に記載された方法で実施できる。

強調位置予測モデルは隠れマルコフモデルに限定されない。例えば、強調位置予測モデルは、決定木によって構成されてもよいし、条件付き確率場モデル（参考文献６の153頁式5.4に記載)において、yに強調か否かを、xに例えば図３に示した特徴量からなるベクトルを対応させることによって構成されてもよいし、サポートベクターマシン（参考文献６の118頁式4.18に記載)で構成されてもよい。決定木については「J.R.Quinlan， “C4.5: Programs for Machine Learning”, Morgan Kaufmann Publishers, San Mateo, California, 1993（参考文献７）」に詳細が記載されている。参考文献７のP.8のFigure1-3のような木のノードに、特徴量の系列xの１つが配置され、強調か非強調かの分類を、その木の葉に至るまで繰り返すことで強調位置の予測を行なうことができる。木の構築法も同書に詳しいが、一般的技術である。

以上のように、実施形態の強調位置予測装置及び方法では、テキストの言語情報に対応する特徴量とテキストの強調位置との関係を表す強調位置予測モデルを用い、入力テキストの強調位置を識別できる。また、実施形態の強調位置予測モデルを用いて予測された強調位置は、人手で決めた強調位置の情報の導入で音声合成の性能改善が確認されている非特許文献１などのモデルに整合した性質を持つ。その結果、声の高さが精度高く再現された自然な音声を合成できる。

なお、本発明は上述の実施の形態に限定されるものではない。例えば、強調位置予測装置が、入力テキストの形態素解析や係り受け解析を行う手段を備えていてもよいし、強調位置予測装置が、形態素解析結果や係り受け解析結果を格納する解析結果格納部を備えていてもよい。また上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な（non-transitory）記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。

このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。

上記実施形態では、コンピュータ上で所定のプログラムを実行させて本装置の処理機能が実現されたが、これらの処理機能の少なくとも一部がハードウェアで実現されてもよい。

１０強調位置予測装置
１１解析結果記憶部
１００制御部
１０１解析結果読込部
１０２特徴量構成部
１０３強調位置予測部
１０４強調位置予測モデル記憶部
１０５カテゴリ名辞書記憶部

Claims

テキスト解析結果から得られる特徴量と強調の有無を示す識別情報との関係を表す強調位置予測モデルを記憶する強調位置予測モデル記憶部と、
強調生起範囲で区切られた入力テキストを解析した解析結果から強調生起範囲ごとの特徴量の系列を生成する特徴量構成部と、
上記強調生起範囲ごとの特徴量の系列を上記強調位置予測モデルへ入力して強調生起範囲ごとの識別情報の系列を求める強調位置予測部と、
を含む強調位置予測装置。
請求項１に記載の強調位置予測装置であって、
上記特徴量は、アクセント句のイントネーション句内での位置、イントネーション句の文内での位置、アクセント句の末尾にポーズが来るか否か、アクセント句内や末尾に特徴的な語が来るか否か、アクセント句の主たる内容語の出現形と品詞、アクセント句の主たる機能語の出現形と品詞、対比関係での比べられる側か比べる側かの種別、並列関係での位置づけの種別及びアクセント句係り受け解析結果の任意の組み合わせから構成されるものである
強調位置予測装置。
請求項１または２に記載の強調位置予測装置であって、
上記テキスト解析結果は、テキストの形態素解析結果及び係り受け解析結果の少なくとも１つである
強調位置予測装置。
請求項１から３のいずれかに記載の強調位置予測装置であって、
単語が特徴語であるか否かを示すカテゴリ名辞書を記憶するカテゴリ名辞書記憶部をさらに含み、
上記特徴量構成部は、上記カテゴリ名辞書を用いて上記入力テキストに含まれる各単語が特徴語であるか否かを判別して上記特徴量に含めるものである
強調位置予測装置。
強調位置予測モデル記憶部に、テキスト解析結果から得られる特徴量と強調の有無を示す識別情報との関係を表す強調位置予測モデルが記憶されており、
特徴量構成部が、強調生起範囲で区切られた入力テキストを解析した解析結果から強調生起範囲ごとの特徴量の系列を生成する特徴量構成ステップと、
強調位置予測部が、上記強調生起範囲ごとの特徴量の系列を上記強調位置予測モデルへ入力して強調生起範囲ごとの識別情報の系列を求める強調位置予測ステップと、
を含む強調位置予測方法。
請求項１から４のいずれかに記載の強調位置予測装置としてコンピュータを機能させるためのプログラム。