JP6309852B2 - 強調位置予測装置、強調位置予測方法及びプログラム - Google Patents

強調位置予測装置、強調位置予測方法及びプログラム Download PDF

Info

Publication number
JP6309852B2
JP6309852B2 JP2014151460A JP2014151460A JP6309852B2 JP 6309852 B2 JP6309852 B2 JP 6309852B2 JP 2014151460 A JP2014151460 A JP 2014151460A JP 2014151460 A JP2014151460 A JP 2014151460A JP 6309852 B2 JP6309852 B2 JP 6309852B2
Authority
JP
Japan
Prior art keywords
emphasized
position prediction
feature
emphasis
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014151460A
Other languages
English (en)
Other versions
JP2016029413A (ja
Inventor
秀治 中嶋
秀治 中嶋
水野 秀之
秀之 水野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014151460A priority Critical patent/JP6309852B2/ja
Publication of JP2016029413A publication Critical patent/JP2016029413A/ja
Application granted granted Critical
Publication of JP6309852B2 publication Critical patent/JP6309852B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

この発明は、音声合成技術に関し、特に、音声の強調位置を予測する技術に関する。
例えば、映画のシーンに応じた台詞を発話する場面、童話の語り聞かせの場面、テレビなどのメディアを通じた商品宣伝の場面、及びコールセンタなどでの電話応対場面などで自然に発せられた「表現豊かな音声」において、強調は頻繁に行われている。音声合成によって生成される合成音においても、適切な強調を行うことにより、合成音の自然性が高まる。
非特許文献1にあるように、特定の区間が強調されて発話された場合、強調区間の基本周波数が読上げ調で発話された部分に比べて高くなる。従来の音声合成装置で、読み上げの音声合成に用いられる、読み、アクセント型、アクセント句境界の位置及びポーズの位置といった特徴量と、読み上げとは異なる日常の様々な表現豊かな音声だけから音声合成用モデルを構築し、そのモデルを用いて音声合成を行っても、このような強調区間での声の高さを十分に再現できない。
非特許文献1では、人手によって強調区間にマーク(以下、強調マークという)を付与し、それらの強調マークを含む学習データを用いて音声合成用モデルを再構築することで、声の高さの再現性能を改善している。
前野、能勢、小林、井島、中嶋、水野、吉岡、"多様な発話様式によるHMM音声合成のための韻律コンテキストの検討"、日本音響学会春季研究発表会、1-Q-28(d)、pp. 385-386、2011年
非特許文献1の手法によって音声合成を行うためには、合成対象の入力テキストの各区間に強調マークを付与するか否かを決定する必要がある。しかし、従来の音声合成では、これを自動で実現する方法は存在しなかった。そのため、テキストからの音声合成の自動化は実現されていない。
この発明は、入力テキストの言語情報に基づいて、入力テキストの強調区間を予測する強調位置予測技術を提供することを目的とする。
上記の課題を解決するために、この発明の強調位置予測装置は、テキスト解析結果から得られる特徴量と強調の有無を示す識別情報との関係を表す強調位置予測モデルを記憶する強調位置予測モデル記憶部と、強調生起範囲で区切られた入力テキストを解析した解析結果から強調生起範囲ごとの特徴量の系列を生成する特徴量構成部と、強調生起範囲ごとの特徴量の系列を強調位置予測モデルへ入力して強調生起範囲ごとの識別情報の系列を求める強調位置予測部と、を含む。
この発明によれば、入力テキストの言語情報に基づいて、入力テキストの強調区間を予測することができる。また、音声合成への応用だけではなく、強調と判断された箇所の文字を太字にする、括弧を加える、色を変える、などの修飾を加えることによって、テキスト上でも強調箇所を一目瞭然にすることが可能となる。
図1は、強調位置予測装置の機能構成を例示する図である。 図2は、強調位置予測方法の処理フローを例示する図である。 図3は、特徴量構成部が出力する特徴量の具体例を示す図である。
以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
実施形態の強調位置予測装置10は、制御部100、解析結果読込部101、特徴量構成部102、強調位置予測部103及び強調位置予測モデル記憶部104を有する。強調位置予測装置10は外部の装置が有する解析結果記憶部11にアクセス可能なように構成されている。解析結果記憶部11は、強調位置予測装置10自身が内部に有していてもよい。強調位置予測装置10は、さらにカテゴリ名辞書記憶部105を有していてもよい。強調位置予測装置10は、例えば、CPU(central processing unit)やRAM(random-access memory)等を備える公知のコンピュータに所定のプログラムが読み込まれて構成される装置である。強調位置予測装置10の少なくとも一部が集積回路等のハードウェアで構成されていてもよい。強調位置予測装置10は、制御部100の制御のもとで各処理を実行する。
強調位置予測装置10が備える各記憶部は、例えば、RAM(Random Access Memory)などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ(Flash Memory)のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。音声ドキュメント検索装置が備える各記憶部は、それぞれ論理的に分割されていればよく、一つの物理的な記憶装置に記憶されていてもよい。
解析結果記憶部11には、入力テキストに言語情報として形態素解析結果及び係り受け解析結果が付与された入力テキスト情報が記憶されている。入力テキストは、音声合成対象となる1個以上の単語からなる系列であり、この系列は後述する方法で強調生起範囲ごとに区切られている。
音声合成のテキスト解析内で動作する形態素解析は、テキストを単語ごとに分割し、それぞれの単語に品詞や読みなどの辞書的情報を付与する技術である。形態素解析は、例えば、「松本裕治、“形態素解析システム「茶筅」”、情報処理、vol. 41(11)、pp. 1208-1214、2000年(参考文献1)」に記載された方法によって実施できる。
音声合成のテキスト解析内で動作する係り受け解析は、形態素解析結果を入力として、複数の単語列からなる文節を構成し、品詞や単語の出現形や単語のアイディの関係に基づいて、文節間の係り受け関係を予測する技術である。係り受け解析は、例えば、「工藤拓、松本裕治、“チャンキングの段階適用による日本語係り受け解析”、情報処理学会論文誌、43(6)、pp. 1834-1842、2002年(参考文献2)」に記載された方法によって実施できる。
形態素解析及び係り受け解析の技術は従来技術であり、ここではそれらの詳しい説明は省略する。
例えば、アクセント句の先頭の文節の係り受け情報と最後の文節の係り受け情報をアクセント句間での係り受け情報として用いることができる。アクセント句は、1つ以上の文節から構成される系列である。声の高さのような韻律処理では、アクセント句を単位として処理を行う場合が多い。アクセント句の境界の予測は、例えば、「Nakajima, H., Miyazaki, N., Yoshida, A., Nakamura, T., Mizuno, H., “Creation and Analysis of a Japanese Speaking Style Parallel Database for Expressive Speech Synthesis”, in Proceedings of Oriental COCOSDA 2010, [online], [2014年7月3日検索], <インターネットURL:http://desceco.org/O-COCOSDA2010/proceedings/paper_30.pdf>(参考文献3)」に記載された方法により実施できることが知られている。
強調生起範囲は、所定の基準に基づいて定められた単語または単語列からなる区間である。どのような区間を強調生起範囲としてもよい。例えば、ポーズ位置とポーズ位置で挟まれた区間(イントネーション句)にある単語または単語列を1つの強調生起範囲とすることができる。ポーズ位置の予測は、例えば、「木暮監修、山森編著、“未来ねっと技術シリーズ4 メディア処理技術”、電気通信協会、pp. 146-149(参考文献4)」に記載された方法によって実行できる。あるいは、アクセント句を強調生起範囲としてもよい。あるいは、前記の係り受け解析の処理単位である文節を強調生起範囲としてもよい。なお、アクセント句とイントネーション句とは、単語列としては重複することがあるため、強調生起範囲は、アクセント句単位で決定するか、もしくはイントネーション句単位で決定することとなり、アクセント句とイントネーション句を混在させた強調生起範囲の決定は行わない方がよい。
強調位置予測モデル記憶部104には、強調位置予測モデルが記憶されている。強調位置予測モデルは、テキストの形態素解析結果及び係り受け解析結果の少なくとも一方から構成される特徴量と当該テキストの強調位置との関係を表すモデルである。すなわち、強調位置予測モデルは、テキストを構成する強調生起範囲(区間)が強調位置であるか否かと特徴量との関係を表すモデルである。
カテゴリ名辞書記憶部105には、アクセント句に含まれる単語が特徴語であるのか否かを示すカテゴリ名辞書が記憶されている。特徴語には、アクセント句末や文末の感嘆符の有無、句読点の有無を用いることができる。入力テキストが商品宣伝文であれば、商品名や商品を構成する語のアクセント句内での有無を用いることができる。入力テキストが対話文や物語文であれば、アクセント句内で対話や物語の流れの中で前に出てきた語が含まれているか否かを用いることができる。あるいは、一般のシソーラスのように、単語の意味属性を用いることも可能である。シソーラスの例として、例えば、「NTTコミュニケーション科学研究所監修、池原ほか編集、“日本語語彙大系”、岩波書店(参考文献5)」がある。あるいは、「かく」という平仮名表記の意味を確定させるための標準表記、すなわち「かく」に対して「欠く」か「書く」か「掻く」などのうちのどれと対応するのかをカテゴリ名辞書に記憶しておくことも可能である。カテゴリ名辞書があれば、品詞を見るだけでは区別できない特徴語の情報を用いることができ、強調の位置をより正確に予測できるようになる利点がある。
以下、図2を参照して、実施形態の強調位置予測方法を説明する。
ステップS101aにおいて、解析結果読込部101は、解析結果格納部11から、入力テキストの各強調生起範囲に対応する形態素解析結果を読み出す。ステップS101bにおいて、解析結果読込部101は、解析結果格納部11から、入力テキストの各強調生起範囲に対応する係り受け解析結果を読み出す。ステップS101aとS101bは、少なくとも一方を実行すればよい。ステップS101aとS101bの両方を実行してもよい。いずれの解析結果を読み出すかは後述する特徴量の構成により定まる。読み出した解析結果は特徴量構成部102へ出力される。
ステップS102において、特徴量構成部102は、解析結果に対応する特徴量を生成する。特徴量構成部102は、入力テキストのすべての強調生起範囲についてそれぞれ特徴量を生成する。特徴量は、例えば、従来の音声合成のテキスト解析結果から得られる特徴量の要素のすべて、またはそれらの一部の要素の組み合わせからなる列(例えば、ベクトルや要素の結合値)を特徴量とする。生成された特徴量は、強調位置予測部103へ出力される。
図3に、複数の要素からなる列を特徴量とした例を示す。図3の例では、アクセント句を強調生起範囲としている。図3の例は、2番の要素(「他に」)と6番の要素(「カービングナイフ!」)のアクセント句に強調が置かれる事例である。
この実施形態の特徴量は、従来の音声合成のテキスト解析結果から得られる情報と、係り受け解析の結果を用いて組み上げることができる情報の組み合わせから構成される。
音声合成のテキスト解析結果から得られる情報は、具体的には以下の項目である。
・アクセント句のイントネーション句内での位置
・イントネーション句の文内での位置
・アクセント句の末尾にポーズが来るか否か
・アクセント句内や末尾に特徴的な語が来るか否か
・アクセント句の主たる内容語の出現形と品詞
・アクセント句の主たる機能語の出現形と品詞
係り受け解析の結果を用いて組み上げることができる情報は、具体的には以下の項目である。
・対比関係での比べられる側か比べる側かの種別
・並列関係での位置づけの種別
・アクセント句係り受け解析結果
図3の表には上から順に1行ずつアクセント句の情報を記載している。アクセント句の文字列は右端の「入力テキスト」の列の記載の通りである。「1)アクセント句番号」は説明のために用意した0から始まるアクセント句の番号である。この入力テキストの場合6で終わるが、テキストに含まれるアクセント句の数によって終了番号は異なる。
2)の列は、「アクセント句のイントネーション句内での位置」に対応する例である。図3の例では、アクセント句の位置がイントネーション句の末尾の位置であればFで、末尾以外の位置であればNで表わしている.
3)の列は、「イントネーション句の文内での位置」に対応する例である。図3の例では、イントネーション句の位置が文内の末尾であればFで、文末以外であればNで表わしている。
4)の列は、「アクセント句の末尾にポーズが来るか否か」に対応する例である。図3の例では、アクセント句の末尾にポーズがあればYで、無ければNで表わしている。
5)、6)、11)の列は、「アクセント句内や末尾に特徴的な語が来るか否か」に対応する例である。図3の例では、5)の列でアクセント句末に感嘆符という特徴的な語が来るか否かを、6)の列でアクセント句末に句読点という特徴的な語があるか否かを、11)の列でアクセント句が商品名やその構成品を表わす内容語という特徴的な語を含むか否かを、それぞれ含む場合にYで、含まない場合にNで表している。アクセント句内の各単語が特徴的な単語であるか否かは、カテゴリ名辞書記憶部105に記憶されたカテゴリ名辞書を参照して判別することができる。
7)、8)の列は、「アクセント句の主たる内容語の出現形と品詞」に対応する例である。図3の例では、右端の「入力テキスト」が形態素解析された結果から、主たる内容語が7)の列に、それに対応する品詞が8)の列に記載されている。
9)、10)の列は、「アクセント句の主たる機能語の出現形と品詞」に対応する例である。図3の例では、右端の「入力テキスト」が形態素解析された結果から、主たる機能語が9)の列に、それに対応する品詞が10)に記載されている。0番の「この」や6番の「カービングナイフ!」のように機能語を持たないアクセント句では、それらが存在しないことをNで表わしている。
12)の列は、「対比関係での比べられる側か比べる側かの種別」に対応する例である。図3の例では、1番の「万能包丁」と6番の「カービングナイフ」が「〜の他に…」という表現で比較されている。比較される2つのうち、比べられる側(すなわち、「〜」に位置する側)に関わるアクセント句をCEで、主たる側(「…」に位置する側)に関わるアクセント句をCRで表している。
13)の列は、「並列関係での位置づけの種別」に対応する例である。図3の例では、2番の「肉」と3番の「魚」が「肉や魚」で並列関係がある。その関係の始まりをPBで、終わりをPEで表わしている。
その他、図示していないが、前述した「アクセント句間の係り受け解析結果」を用いてもよい。例えば、図3の0番の「この」は1番の「万能包丁の」に係るという情報が係り受け解析結果の例である。
また、図示していないが、カテゴリ名辞書から取り出された意味カテゴリ名を用いてもよい。例えば、図3の1番には「包丁」、3番には「肉」、4番には「魚」、6番には「ナイフ」があるが、参考文献5によれば、それぞれ「刃物」、「肉・卵」、「魚」、「刃物」という意味カテゴリ名が付与されており、これらを図3の1)から13)までのベクトルに加えて用いることも可能である。
ステップS103において、強調位置予測部103は、強調位置予測モデル格納部104に格納された強調位置予測モデルと、特徴量構成部102で得られた特徴量とを用いて、入力テキストを構成する各強調生起範囲が強調位置であるか否かを識別する。
強調位置予測モデルは、図3に例示したような、2)から13)までの項目すべて、または任意の組み合わせを特徴量として入力し、強調か非強調かを判定するモデルをサポートベクターマシン(SVM: Support Vector Machine)等の機械学習器を用いて構成したものである。強調位置予測モデルの構成は、前記の2)から13)までのような特徴量とそれに対応する各強調生起範囲で強調マークが付与されるか否かという情報とが対になったデータを大量に用意して、それをサポートベクターマシンなどの機械学習器の学習処理にかけることで実施できる。これらの特徴量は学習データ内での分布に応じて、ある特徴量の存在だけで決まるというように支配的に強調位置決定に寄与する場合もあれば、他の特徴量と総合的に寄与する場合もある。
以下に強調位置予測部103の処理の詳細を例示する。各強調生起範囲i=0,…,I-1に対して得られた特徴量をxiとし、強調生起範囲iが強調位置であるか否かを表す識別情報(すなわち、強調マークを付与するか否かを表す識別情報)をyiとする。ただし、Iは1以上の整数である。例えば、Iは入力テキストに属する強調生起範囲の総数である。特徴量xiはベクトル等である。識別情報yiの例は、強調生起範囲iが強調位置である場合にyi=1となり、強調生起範囲iが強調位置でない場合にyi=0となる二値情報である。特徴量xiの系列をx=(x0,…,xI-1)とし、識別情報yiの系列をy=(y0,…,yI-1)とする。
この例では、強調位置予測モデルは、入力テキストの特徴量の系列xと識別情報の系列yとを対応付けるモデルである。例えば、強調位置予測モデルは、特徴量の系列xを入力変数とし、識別情報の系列yを出力変数とするモデルである。強調位置予測モデルに限定はないが、強調位置予測モデルの具体例は、系列ラベリング等に用いられる隠れマルコフモデル等の確率モデルである。
強調位置予測モデルは、例えば、学習用のテキストの形態素解析結果及び係り受け解析結果の少なくとも一方から構成される特徴量と、当該テキストの各強調生起範囲が強調位置であるか否かを表す識別情報との組からなる学習データを用い、一般の機械学習手法を実施することで構築できる。強調位置予測モデルの学習に用いられる特徴量の構成は、特徴量構成部102で得られる特徴量の構成と同じである。学習データの識別情報は人手で強調と判断された区間に付与しておく。機械学習手法の詳細は、例えば、「高村大也ほか著、“言語処理のための機械学習入門”、コロナ社(参考文献6)」等に記載されている。
強調位置予測モデルは、例えば、強調生起範囲を処理単位として、その処理単位、及び、その前後の単位に対応する特徴量から構成した特徴量の系列を入力とし、その処理単位での強調マークの有無を表す識別情報の系列を予測するためのモデルである。以下に隠れマルコフモデルで構築された強調位置予測モデルを例示する。
Figure 0006309852
ただし、P(x,y)はx=(x0,…,xI-1)、y=(y0,…,yI-1)の同時確率であり、P(yi|xi)はxiのもとでのyiの条件付き確率であり、P(xi|xi-1)はxi-1のもとでのxiの条件付き確率である。x-1は文の先頭の単語よりも前にあると仮定する文の開始位置という便宜上の強調予測範囲に関して得られる特徴量であり、定数を要素とするベクトルである。
強調位置予測部103は、強調位置予測モデル格納部104から強調位置予測モデルを読み込み、当該強調位置予測モデルの入力変数に特徴量構成部102から出力された特徴量の系列xを設定し、識別情報の系列yを予測し、当該識別情報の系列yを強調位置予測結果として出力する。例えば、別の方法として,隠れマルコフモデルで強調位置予測モデルが構成されている場合、入力された特徴量の系列xに対してP(x,y)を最大にする識別情報の系列yが出力される。
このような識別情報の系列yの探索は、例えば公知のビタビアルゴリズム(Viterbi algorithm)を用いて行うことができる。強調生起範囲を処理単位として、その処理単位での強調マークの有無を表す識別情報の系列yを、その単位、及び、その前後の単位に対応する特徴量から構成した特徴量の列を入力した強調位置予測モデルを用いて、文頭から文末までの処理単位ごとに強調マークを付与する場合と付与しない場合のすべての可能性を列挙して、文頭から文末まで大域的に、強調位置予測モデルが与える確率が最大の系列をビタビアルゴリズムで選択すればよい。あるいは、強調生起範囲に代えて、着目する単語、文節、アクセント句を処理単位として識別情報の系列yを得てもよい。すなわち、特徴量を得る処理単位と識別情報を得る処理単位とは、同一であってもよいし、異なっていてもよい。あるいは、処理単位の前後数単位間で確率の高い識別情報の系列に探索範囲を絞って探索してもよい。また、特徴量の構成に関わった範囲のみについて強調位置の予測を行うことにし、強調位置の予測自体を局所的に行なうことも可能である。これらの探索法自体は周知であり、例えば、上記の参考文献6に記載された方法で実施できる。
強調位置予測モデルは隠れマルコフモデルに限定されない。例えば、強調位置予測モデルは、決定木によって構成されてもよいし、条件付き確率場モデル(参考文献6の153頁式5.4に記載)において、yに強調か否かを、xに例えば図3に示した特徴量からなるベクトルを対応させることによって構成されてもよいし、サポートベクターマシン(参考文献6の118頁式4.18に記載)で構成されてもよい。決定木については「J.R.Quinlan, “C4.5: Programs for Machine Learning”, Morgan Kaufmann Publishers, San Mateo, California, 1993(参考文献7)」に詳細が記載されている。参考文献7のP.8のFigure1-3のような木のノードに、特徴量の系列xの1つが配置され、強調か非強調かの分類を、その木の葉に至るまで繰り返すことで強調位置の予測を行なうことができる。木の構築法も同書に詳しいが、一般的技術である。
以上のように、実施形態の強調位置予測装置及び方法では、テキストの言語情報に対応する特徴量とテキストの強調位置との関係を表す強調位置予測モデルを用い、入力テキストの強調位置を識別できる。また、実施形態の強調位置予測モデルを用いて予測された強調位置は、人手で決めた強調位置の情報の導入で音声合成の性能改善が確認されている非特許文献1などのモデルに整合した性質を持つ。その結果、声の高さが精度高く再現された自然な音声を合成できる。
なお、本発明は上述の実施の形態に限定されるものではない。例えば、強調位置予測装置が、入力テキストの形態素解析や係り受け解析を行う手段を備えていてもよいし、強調位置予測装置が、形態素解析結果や係り受け解析結果を格納する解析結果格納部を備えていてもよい。また上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。
このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。
上記実施形態では、コンピュータ上で所定のプログラムを実行させて本装置の処理機能が実現されたが、これらの処理機能の少なくとも一部がハードウェアで実現されてもよい。
10 強調位置予測装置
11 解析結果記憶部
100 制御部
101 解析結果読込部
102 特徴量構成部
103 強調位置予測部
104 強調位置予測モデル記憶部
105 カテゴリ名辞書記憶部

Claims (5)

  1. テキスト解析結果から得られる特徴量と強調の有無を示す識別情報との関係を表す強調位置予測モデルを記憶する強調位置予測モデル記憶部と、
    強調生起範囲で区切られた入力テキストを解析した解析結果から強調生起範囲ごとの特徴量の系列を生成する特徴量構成部と、
    上記強調生起範囲ごとの特徴量の系列を上記強調位置予測モデルへ入力して強調生起範囲ごとの識別情報の系列を求める強調位置予測部と、
    を含み、
    上記特徴量は、アクセント句内や末尾に特徴的な語が来るか否か、アクセント句の主たる内容語の出現形と品詞、アクセント句の主たる機能語の出現形と品詞、対比関係での比べられる側か比べる側かの種別及び並列関係での位置づけの種別の任意の組み合わせから構成されるものである
    強調位置予測装置。
  2. 請求項1に記載の強調位置予測装置であって、
    単語についての意味カテゴリを示すカテゴリ名辞書を記憶するカテゴリ名辞書記憶部をさらに含み、
    上記特徴量構成部が生成する特徴量は、上記カテゴリ名辞書における意味カテゴリをさらに上記特徴量に含めるものである
    強調位置予測装置。
  3. 強調位置予測モデル記憶部に、テキスト解析結果から得られる特徴量と強調の有無を示す識別情報との関係を表す強調位置予測モデルが記憶されており、
    特徴量構成部が、強調生起範囲で区切られた入力テキストを解析した解析結果から強調生起範囲ごとの特徴量の系列を生成する特徴量構成ステップと、
    強調位置予測部が、上記強調生起範囲ごとの特徴量の系列を上記強調位置予測モデルへ入力して強調生起範囲ごとの識別情報の系列を求める強調位置予測ステップと、
    を含み、
    上記特徴量は、アクセント句内や末尾に特徴的な語が来るか否か、アクセント句の主たる内容語の出現形と品詞、アクセント句の主たる機能語の出現形と品詞、対比関係での比べられる側か比べる側かの種別及び並列関係での位置づけの種別の任意の組み合わせから構成されるものである
    強調位置予測方法。
  4. 請求項3に記載の強調位置予測方法であって、
    単語についての意味カテゴリを示すカテゴリ名辞書を記憶するカテゴリ名辞書記憶部をさらに含み、
    上記特徴量構成部が生成する特徴量は、上記カテゴリ名辞書における意味カテゴリをさらに上記特徴量に含めるものである
    強調位置予測方法。
  5. 請求項1または2に記載の強調位置予測装置としてコンピュータを機能させるためのプログラム。
JP2014151460A 2014-07-25 2014-07-25 強調位置予測装置、強調位置予測方法及びプログラム Active JP6309852B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014151460A JP6309852B2 (ja) 2014-07-25 2014-07-25 強調位置予測装置、強調位置予測方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014151460A JP6309852B2 (ja) 2014-07-25 2014-07-25 強調位置予測装置、強調位置予測方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016029413A JP2016029413A (ja) 2016-03-03
JP6309852B2 true JP6309852B2 (ja) 2018-04-11

Family

ID=55435326

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014151460A Active JP6309852B2 (ja) 2014-07-25 2014-07-25 強調位置予測装置、強調位置予測方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6309852B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024033975A1 (ja) * 2022-08-08 2024-02-15 日本電信電話株式会社 強調位置予測装置、強調位置予測方法、及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4218075B2 (ja) * 1998-03-02 2009-02-04 沖電気工業株式会社 音声合成装置およびそのテキスト解析方法
JP3690502B2 (ja) * 2001-04-19 2005-08-31 日本電信電話株式会社 韻律情報設定方法及び装置並びにプログラム及び記録媒体
KR100463655B1 (ko) * 2002-11-15 2004-12-29 삼성전자주식회사 부가 정보 제공 기능이 있는 텍스트/음성 변환장치 및 방법
WO2004066271A1 (ja) * 2003-01-20 2004-08-05 Fujitsu Limited 音声合成装置,音声合成方法および音声合成システム

Also Published As

Publication number Publication date
JP2016029413A (ja) 2016-03-03

Similar Documents

Publication Publication Date Title
US9280967B2 (en) Apparatus and method for estimating utterance style of each sentence in documents, and non-transitory computer readable medium thereof
Mairesse et al. Stochastic language generation in dialogue using factored language models
JP4215418B2 (ja) 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム
JP3768205B2 (ja) 形態素解析装置、形態素解析方法及び形態素解析プログラム
JP5257071B2 (ja) 類似度計算装置及び情報検索装置
WO2017127296A1 (en) Analyzing textual data
JP2008134475A (ja) 入力された音声のアクセントを認識する技術
JP2016024759A (ja) 言語モデル用の学習テキストを選択する方法及び当該学習テキストを使用して言語モデルを学習する方法、並びに、それらを実行するためのコンピュータ及びコンピュータ・プログラム
Kurimo et al. Modeling under-resourced languages for speech recognition
JP2019082931A (ja) 検索装置、類似度算出方法、およびプログラム
CN104750677A (zh) 语音传译装置、语音传译方法及语音传译程序
KR20170122755A (ko) 함의 페어 확장 장치, 그것을 위한 컴퓨터 프로그램, 및 질문 응답 시스템
Dumitrescu et al. Crowd-sourced, automatic speech-corpora collection–Building the Romanian Anonymous Speech Corpus
JP6082657B2 (ja) ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム
JP6775465B2 (ja) 対話ルール照合装置、対話装置、対話ルール照合方法、対話方法、対話ルール照合プログラム、及び対話プログラム
JP5342760B2 (ja) 訳語学習のためのデータを作成する装置、方法、およびプログラム
JP4054046B2 (ja) 意見性判定データベース作成方法及び装置及びプログラム及び意見性判定方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2015084047A (ja) 文集合作成装置、文集合作成方法および文集合作成プログラム
JP6309852B2 (ja) 強調位置予測装置、強調位置予測方法及びプログラム
Chen et al. Integrated expression prediction and speech synthesis from text
CN115101032B (zh) 用于生成文本的配乐的方法、装置、电子设备和介质
JP5976037B2 (ja) モデル学習装置、ランキング装置、方法、及びプログラム
JP6067616B2 (ja) 発話生成手法学習装置、発話生成手法選択装置、発話生成手法学習方法、発話生成手法選択方法、プログラム
JP6002598B2 (ja) 強調位置予測装置、その方法、およびプログラム
JP7102986B2 (ja) 音声認識装置、音声認識プログラム、音声認識方法および辞書生成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160914

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170822

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180313

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180315

R150 Certificate of patent or registration of utility model

Ref document number: 6309852

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150