JP4968036B2

JP4968036B2 - 韻律語グルーピング方法及び装置

Info

Publication number: JP4968036B2
Application number: JP2007322494A
Authority: JP
Inventors: チングオ; 伸之片江
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2006-12-13
Filing date: 2007-12-13
Publication date: 2012-07-04
Anticipated expiration: 2027-12-13
Also published as: JP2008152260A; CN101202041B; CN101202041A; US8392191B2; US20080147405A1

Description

本発明は、言語音声合成技術に関し、具体的に、入力された言語に対して韻律語をグルーピングする方法及び装置に関する。

言語において、複数の単語を連続して発音するとき、相互間に影響し、比較的に独立した、完全な韻律ブロックを形成する。このような韻律ブロックの韻律特徴は、言語音の自然度に大きな影響がある。通常、異なる韻律ブロックの組合せは異なるイントネーションになり、これによって、人間の発音に様々な話しぶりが生まれる。

一般的に、言語音における韻律ユニットは、主に韻律語、韻律フレーズ、イントネーション・フレーズを含む。言語の韻律は階層構造を有し、この階層構造の韻律は言語音のリズム（韻律）をもたらす。韻律ユニットの境界は、通常、言語音における韻律語境界での音節の中断、基音の変化、又は音長の変化に対応する。

韻律は合成言語音の自然度及び理解可能度に大きく影響する。言語音声合成装置において、韻律構造は、韻律パラメータ予測モデルに最も重要な情報を提供し、音節の中断、基音、音長などパラメータの予測を通じて、言語音声合成装置による音声の発生を制御し、合成言語音において各レベルの韻律ユニットに対応する韻律効果を実現し、自然かつ良い発音を得る。

言語処理技術の発展につれて、自然会話における韻律構造を理解することが益々要求され、さらに、合成言語音の自然度或いは言語音識別の正確度を効率よく向上し、自然言語への理解を深めるため、言語テキストから韻律構造を予測する方法の研究にも力を入れている。

韻律語とは、言語音ストリームにおける連続して発音する一組の音節であり、これらの音節の間に発音が緊密につながり中断は聞こえない。韻律語は韻律階層構造の中に最も低い層の要素である。一般的に言えば、韻律語の境界に感知され得る中断が現れる。言い換えれば、韻律語の内部に感知され得る中断がなく、中断は韻律語の境界にしか現れない。実際の言語音には、全ての韻律語の境界に中断が現れる訳ではない。韻律語の境界に感知可能な中断があっても特に問題がない。しかし、韻律語の内部に感知可能な中断があると、言語音は理解し難く又は不自然になる。従って、良好な韻律語グルーピング機能は合成言語音の自然度を改善することに非常に重要である。

特許文献１−５及び非特許文献１−７は、韻律語グルーピング及び合成言語音の自然度の改善に関する技術を開示している。

一般に、言語音声合成装置は、テキスト解析部、韻律パラメータ予測部、及び後段合成部を有する。

テキスト解析部は、分語、語特性標記、音声表記、韻律構造予測などを実行する。

例えば、中国語、日本語などの場合は、単語と単語との間に、区切り符号としてのスペースがないので、入力言語を単語毎に分節する必要がある。これを分語〔単語分割〕と称する。分語は、一般的に単語の類型に基づき解析により行われる。分語の結果は、通常、文法的な構造に近いが、韻律構造とは異なる。韻律構造予測とは、テキスト内容を韻律構造にマッピングし、テキストから韻律特徴（中断や、イントネーションなど）を予測するモデルを構築し、後続の韻律音響学パラメータの生成に用いられる。

韻律語は、語彙学上の「語」とは異なる。韻律語の形成（グルーピング）は、語義のみならず、言語音の韻律の特徴にも関連する。一つの韻律語は、複数の語彙学上の「語」からなることがあれば、比較的に長い語彙学上の「語」の一部に当たることもある。分語と語特性標記は、語彙学の知識に基づき、自然言語テキストに対して、分語及び語特性標記を行うことである。

図１はテキスト解析部による解析を説明する図である。

図１に示すように、ステップＳ１において、所定の言語テキストが入力される。ここは、例えば、「ある日、私たちは、他の学校の学生と一緒に山登りに行った。私たちは、誰も遅れることなく素早く山頂に登った」という文が入力される。

ステップＳ２において、入力テキストについて、分語（符号「／」）及び語特性標記（v, m, q, m, … ）を行い、以下の結果になる。

ある／v 日／m、私たち／q は／m 、／w 他／q の／v 学校／n の／c 学生／と／一緒に／山／登りに／行った／。／私たち／は／
、／誰も／遅れる／こと／なく／素早く／山／頂／に／登った／

ステップＳ３において、以下の韻律構造の予測が得られる。

ある／v 日／m、||| 私たち／q は／m || 、／w 他／q の／v | 学校／n の／c ||| 学生／と／一緒に／ || 山／ | 登り／行った／。／私たち／は／、／誰も／遅れる／こと／なく／素早く／山／頂／に／登った／ |||

ここで、一本の縦棒線「｜」は韻律語の境界を示し、二本の縦棒線「||」は韻律フレーズの境界を示し、三本の縦棒線「|||」はイントネーション・フレーズの境界を示す。

韻律フレーズの境界及びイントネーション・フレーズの境界は、必ず韻律語の境界でもある。韻律語グルーピングでは、分語及び語特性標記を行った上、韻律語の境界を確定する。また、韻律語のグルーピングは、更にハイレベル韻律ユニット予測、例えば、韻律フレーズ予測の基礎である。従って、韻律語グルーピングの性能は、合成言語音の自然度に大きな影響を有する。

従来技術において、幾つかの韻律語境界を予測する方法が提案された。例えば、classification and regression tree (CART)方法、規則に基づく方法、統計に基づく方法、自己回帰ニューラルネットワークに基づく方法などがある。これらの方法に、語の特性〔品詞〕（part of speech(POS)）及び語の長さが広く用いられている。

全体的に言うと、従来技術に係る韻律語境界予測の精度が十分ではない。境界予測のエラーは通常２種類ある。即ち、挿入型エラー（insertion error）と削除型エラー（deletion error）である。前述のように、実際の言語音において、全ての韻律語の境界に中断がある訳ではない。韻律語の境界に感知可能な中断がある場合は特に問題がないが、韻律語の内部に感知可能な中断があると、言語音は理解し難く又は不自然になる。従って、韻律語グルーピング時に生じる挿入型エラーは合成言語音に悪影響を与える。一方、削除型エラーは合成言語音に与える悪影響は少ない。

例えば、図１において、分語の結果、「山」、「頂」、「に」があった。ここで、「山」、「頂」、「に」のいずれもが単独音の単語であるので、それらを組み合わせれば、完全な韻律語「山頂に」になる。もし韻律語のレベルでこれらの単語が組み合わせられていなければ、合成言語音にこの一文は非常に不自然に聞こえる。具体的に、合成言語音にこれらの単語は一つずつ発音され、その間に感知できる中断がある。即ち、韻律予測（例えば、基音予測と音長予測）は、現在の音節が韻律語の境界にあるか、内部にあるかに非常に敏感である。逆に、「山頂に」は一つの韻律語とすれば、基音予測では多くの関連発音も考慮されるので、その基本曲線は自然に聞こえる。また、音長予測にも、この３つの音節の境界の特性はいずれも韻律内部型であるので、３つの音節「山」、「頂」、「に」が延ばされることはない。

米国特許第６，９９６，５２９号米国特許第６，１７３，２６２号米国特許第６，００３，００５号米国特許第５，８５０，６２９号米国特許第６，９７８，２３９号 Shih, C. L., "The Prosodic Domain of Tone Sandhi in Mandarin Chinese", PhD Dissertation, UC San Diego, 1986. Chu M. and Qian Y., "Locating boundaries for prosodic constituents in unrestricted Mandarin texts", Journal of Computational Linguistics and Chinese Language Processing, 6(1), 61-82, 2001. Dong H., Tao J. and Xu b., "Prosodic word prediction using the lexical information", International Conference on Natural Language Processing and Knowledge Engineering, Wuhan, 2005. Shao Y., Han, J., Liu T. and Zhao Y., "Prosodic word boundaries prediction for Mandarin text-to-speech", International Symposium on Tonal Aspects of Languages with Emphasis on Tone Languages, 159-162, Beijing, 2004. Dong M., Lua K.T. and Li H., "A probabilistic approach to prosodic word prediction for Mandarin Chinese TTS", 9th European Conference on Speech Communication and Technology, Lisbon, Portugal, 2005. Qin Shi and XiJun Ma, 2002. "Statistic prosody structure prediction", International Conference of the IEEE 2002 Workshop on Speech Synthesis, Santa Monica, Ca., 2002. Ying, Z., and Shi, X., "An RNN-based algorithm to detect prosodic phrase for Chinese TTS", International Conference on Acoustic, Speech and Signal Processing, 2001.

本発明の目的は、韻律語グルーピングにより生じるエラーを抑え、自然な言語音を得られる韻律語グルーピング方法及び装置を提供することにある。

本発明の韻律語グルーピング方法は、言語テキストを入力するステップと、前記言語テキストに対して分語及び語特性標記を行い、初期の韻律語列を生成するステップと、前記初期の韻律語列において、全ての単語境界に韻律語境界を表すグリッドを挿入し、グリッド韻律語列を生成するステップと、前記グリッド韻律語列における削除しようとするグリッドに記号を付するステップと、前記グリッド韻律語列における実際に削除すべきグリッドを判断するステップと、前記実際に削除すべきグリッドを削除し、残りのグリッドのうち、各２つのグリッドの間の単語をグルーピングし、韻律語を生成するステップとを含む。

本発明により、グリッドを挿入し、そして削除する方法をとることにより、複数の韻律語グルーピング方法を実行し、併用することができる。初期の韻律語列において、全ての単語境界に韻律語グリッドを挿入した後、複数の韻律語グルーピング方法を実行し、それぞれの方法は、必要でないと思われるグリッドを韻律語列から削除することができる。即ち、いずれか一つの韻律語グルーピング方法は削除すべきと判断すると、該当グリッドは削除される。これにより、韻律語グルーピング時に生じるエラーにより、言語音が理解しにくく、不自然である問題を解決する。

また、グリッドを挿入し、そして削除する方法をとることにより、複数の韻律語グルーピング方法を併用することができるので、新しい韻律語グルーピング方法を取り入れることは簡単である。

次に、添付した図面を参照しながら、本発明の好適な実施形態を詳細に説明する。

図２は、本発明の一実施形態に係る韻律語グルーピング装置２０を示す図である。

図２に示すように、韻律語グルーピング装置２０は、言語テキストを入力する入力部１０、言語テキストに対して分語及び語特性標記を行い、初期の韻律語列を生成する分語及び語特性標記部１１、初期の韻律語列において、全ての単語境界に韻律語境界を表すグリッドを挿入し、グリッド韻律語列を生成する韻律語グリッド挿入部１２、グリッド韻律語列において削除しようとするグリッドに記号を付し、実際に削除すべきグリッドを判断し、実際に削除すべきグリッドを削除する韻律語グリッド削除部１３、及び残りのグリッドのうち、各２つのグリッドの間の単語をグルーピングし、韻律語列を生成する韻律語生成部１４を含む。
また、韻律語グルーピング装置２０は、言語テキストに対して分語及び語特性標記の結果を記憶する記憶装置を有する。この分語及び語特性標記の結果に基づき初期の韻律語列を生成する。

また、韻律語グリッド削除部１３は、複数の韻律語グルーピング手段を有し、当該複数の韻律語グルーピング手段により、同一のグリッド韻律語列において削除しようとするグリッドに記号を付する。また、当該複数の韻律語グルーピング手段により、総合的に実際に削除すべきグリッドを判断する。

また、韻律語グルーピング装置２０は、総合的に削除しようとするグリッドを判断し、削除しようとするグリッドが削除される可能性（削除可能性と呼ぶ）を計算するグリッド削除可能性評価手段と、当該削除可能性に基づき、削除しようとするグリッドを削除するグリッド削除手段とを有する。

また、韻律語グルーピング装置２０は、韻律語生成部により生成された韻律語を分析し、韻律語グルーピング結果を生成する韻律語グルーピング結果分析部を有する。

韻律語グルーピング装置２０は、コンピュータ、サーバ、或いは、コンピュータネットワークにおいて具現され、その入力手段は、キーボード、マウス、通信インターフェースなどである。

図３は、本実施形態の韻律語グルーピング装置２０の動作を例示する図である。

図３に示すように、任意のテキスト１０１は韻律語グルーピング装置２０に入力される。分語及び語特性標記部１１は、言語テキスト１０１に対して分語及び語特性標記を行う。分語及び語特性標記部１１は、言語分析の基礎処理を行う。中国語、日本語などは、英語と異なり、単語と単語との間に区切り符号としてのスペースがないので、入力テキストをまず分語及び語特性標記処理を行う必要がある。分語及び語特性標記処理の結果１０３は、後続の処理に用いられる。１０３は分語及び語特性標記処理の結果を記憶する記憶装置も指す。

図３において、韻律語グルーピング部１０４は、韻律語グリッド挿入部１２、韻律語グリッド削除部１３、及び韻律語生成部１４からなる。韻律語グルーピング部１０４は、グリッド挿入・削除を行い、複数の韻律語グルーピング方法が実行して併用動作することができる。

言語テキストに対する分語及び語特性標記の結果は初期の韻律語列とする。当該初期の韻律語列において、全ての単語境界に韻律語グリッドを挿入し、複数の韻律語グルーピング方法が協働して実行され、韻律語のレベルで必要でないと思われるグリッドに削除の記号を付する。また、総合的に各グリッドを判断するか否かを判断し、実際に削除すべきと判断されたグリッドを削除する。これにより、韻律語グルーピング結果１０５が生成される。

図４は韻律語グルーピング部１０４の動作を例示する図である。

図４に示すように、韻律語初期化部２０１は、記憶装置１０３に記憶される分語及び語特性標記処理の結果を韻律語初期化する。具体的に、言語テキストに対する分語及び語特性標記の結果を初期韻律語列とする。そして、全ての単語境界に韻律語境界を表すグリッドを挿入し、グリッド韻律語列を生成する。

第1の韻律語グルーピング部２０２は第1の韻律語グルーピング規則に基づいて、分語及び語特性標記の初期結果について、韻律語グルーピングを行う。グリッド削除記号表示部２０３は、第1の韻律語グルーピング部２０２が第1の韻律語グルーピング規則に基づいて削除すべきと判断されたグリッドに、削除記号を付する。

第２の韻律語グルーピング部２０４は第２の韻律語グルーピング規則に基づいて、分語及び語特性標記の初期結果について、韻律語グルーピングを行う。グリッド削除記号表示部２０３は、第２の韻律語グルーピング部２０４が第２の韻律語グルーピング規則に基づいて削除すべきと判断されたグリッドに、削除記号を付する。

同様に、第Ｎの韻律語グルーピング部２０６は第Ｎの韻律語グルーピング規則に基づいて、分語及び語特性標記の初期結果について、韻律語グルーピングを行う。グリッド削除記号表示部２０３は、第Ｎの韻律語グルーピング部２０６が第Ｎの韻律語グルーピング規則に基づいて削除すべきと判断されたグリッドに、削除記号を付する。

第1の韻律語グルーピング部２０２、第２の韻律語グルーピング部２０４、第Ｎの韻律語グルーピング部２０６は、韻律語グリッド削除部１３に含まれる。

具体的に、第1の韻律語グルーピング部２０２、第２の韻律語グルーピング部２０４、第Ｎの韻律語グルーピング部２０６は、以下の方法で韻律語グルーピングを行う。
（１）バイナリ韻律ツリーに基づく韻律語グルーピング法である。当該方法は、大規模な記号言語資料から学習した言語モデルに基づいて、入力されたテキストに対して、再帰バイナリサーチ(recursive binary search)により、最も確率の高い言語音中断挿入点をサーチし、当該文に対応する最適な言語音中断バイナリツリーを構築する。バイナリツリーの構造に、階層状の言語音中断挿入点の情報が含まれているので、このバイナリツリーをバイナリ韻律ツリーに用いることができる。このバイナリ韻律ツリーはグリッド削除に基づく韻律語グルーピングに用いることができる。同じ親ノードを有する任意の２つの子ノードの間の韻律語グリッドに削除可の記号が付される。
（２）統計確率に基づく韻律語グルーピング法である。この方法は、語の特性（part of speech(POS)）及び語の長さ情報が韻律語の境界の予測に用いられる。この方法は、韻律語の境界を予測する際に、語の特性と語の長さは相互独立して無関係であると仮定する。よって、任意２つの言語学の単語は一つの韻律語を形成する確率は、この２つの単語の特性に基づき韻律語を形成する確率と、この２つの単語の長さに基づき韻律語を形成する確率とを含む。
（３）規則に基づく韻律語グルーピング法である。即ち、常用韻律語附属語について、対応する韻律語グルーピング規則を事前に設定する。例えば、中国語では、接尾語「子、系、了」など、助詞「的、得」、方位語「左右、以後、以前、以下、以上、以外」、その他動作の傾向を表す単語などは、頻繁に文書に現れる。これらの単語は通常固定された韻律語グルーピング方式を有し、或いは、一定の条件のもとで、固定された韻律語グルーピング方式を有する。これらの単語は適切に韻律語グルーピングされないと、合成言語音は非常に不自然に聞こえる。よって、以上の常用韻律語附属語について、それぞれの特別な韻律語グルーピング規則を設定し、これらの韻律語附属語を正しく韻律語グルーピングする。

また、中国語には、同じ動詞を繰り返して使う場合が多い。例えば、「談一談」、「想了想」などがある。分語処理において、これらの動詞は動詞フレーズとして分割される。実際に、これら繰り返して使う動詞は、韻律上同じ韻律語とすべきであるので、本実施形態では、このような動詞の繰り返しについても韻律語グルーピング規則を設定し、正しく韻律語グルーピングする。

以上の韻律語グルーピング方法は韻律語グルーピング部１０４において実行される。

図４に戻る。グリッド削除手段１３は、第1の韻律語グルーピング部２０２、第２の韻律語グルーピング部２０４、第Ｎの韻律語グルーピング部２０６が判断し、グリッド削除記号表示部２０３は削除記号を付した削除すべきグリッドについて総合的に判断し、削除する韻律語グリッドを特定する。

そして、残りのグリッドのうち、各隣接する２つのグリッドの間の単語をグルーピングし、韻律語列が生成され、韻律語グルーピング解析結果が得られる。

図５は、グリッド削除手段１３の動作を例示する図である。

ステップＳ３０１において、全ての初期のグリッドをスキャンする。

ステップＳ３０２において、まだ処理されていないグリッドがあるか否かを判断する。

ステップＳ３０３において、現在処理の対象となるグリッドに削除記号が付されているか否かを判断する。当該グリッドに第1の韻律語グルーピング部２０２、第２の韻律語グルーピング部２０４、第Ｎの韻律語グルーピング部２０６の何れかの判断により削除記号が付されている場合は、ステップＳ３０４に進む。そうではない場合は、ステップＳ３０１に戻る。

ステップＳ３０４において、グリッド削除手段によりグリッドを削除する。

図６は、グリッド削除手段１３の他の動作例を示す図である。

図６において、図５と重複する部分について説明を省略する。

ステップＳ４０１において、グリッド削除可能性評価手段（参照符号４０１を用いる）は、第1の韻律語グルーピング部２０２、第２の韻律語グルーピング部２０４、第Ｎの韻律語グルーピング部２０６の判断に基づきグリッド削除記号表示部２０３により付された削除記号を参照し、総合的にグリッドが削除される可能性である削除可能性を計算する。

ステップＳ４０２において、削除可能性の結果に基づき、現在処理対象となるグリッドを削除するか否かを判断する。削除すると判断した場合、ステップＳ３０４に進む。そうではない場合は、ステップＳ３０１に戻る。

グリッド削除可能性評価手段４０１は、投票の方法により評価を行う。最も簡単な投票方法として、第1の韻律語グルーピング部２０２、第２の韻律語グルーピング部２０４、第Ｎの韻律語グルーピング部２０６のうち、半分以上は当該グリッドを削除すべきと判断した場合は、グリッド削除可能性評価手段４０１は、当該グリッドを削除すると評価する。

本発明において、グリッド削除という方法を採用することにより、複数の韻律語グルーピング方法を実行して併用することができる。初期の韻律語列において、全ての単語境界に韻律語グリッドを挿入した後、複数の韻律語グルーピング方法は、それぞれ、必要でないと思われるグリッドを韻律語列から削除することができる。即ち、いずれか一つの韻律語グルーピング方法は削除すべきと判断すると、該当グリッドは削除される。これにより、韻律語境界挿入型エラーの数を減らし、韻律語グルーピングにおいて発生する挿入型エラーにより言語音が理解しにくく、不自然である問題を解決する。

また、グリッド削除という方法をとることにより、複数の韻律語グルーピング方法を併用することができるので、新しい韻律語グルーピング方法を取り入れることは簡単で、メンテナンスが容易である。

以上、本発明の好ましい実施形態を説明したが、本発明はこの実施形態に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は本発明の範囲に属する。

テキスト解析を説明する図である。本発明の一実施形態に係る韻律語グルーピング装置２０を示す図である。本実施形態の韻律語グルーピング装置２０の動作を例示する図である。韻律語グルーピング部１０４の動作を例示する図である。グリッド削除手段１３の動作を例示する図である。グリッド削除手段１３の他の動作例を示す図である。

符号の説明

１０入力部
１１分語及び語特性標記部
１２韻律語グリッド挿入部
１３韻律語グリッド削除部
１４韻律語生成部
２０韻律語グルーピング装置
１０１入力テキスト
１０３記憶装置
１０４韻律語グルーピング部
２０１韻律語初期化部
２０２第１の韻律語グルーピング部
２０３グリッド削除記号表示部
２０４第２の韻律語グルーピング部
２０６第Ｎの韻律語グルーピング部
４０１グリッド削除可能性評価手段

Claims

言語テキストを入力するステップと、
前記言語テキストに対して単語分割及び品詞標記を行い、全ての単語境界に韻律語境界を表す区切りであるグリッドを挿入することにより、初期のグリッド韻律語列を生成するステップと、
前記グリッド韻律語列において削除しようとするグリッドに記号を付することを複数の方法により行い、複数の記号付け結果を得るステップと、
前記複数の記号付け結果のうち少なくとも一つが削除すべきであると記号付けしているグリッドを削除すべきと判断する、または、前記複数の記号付け結果のうち半分以上が削除すべきであると記号付けしているグリッドを削除すべきと判断することによって、前記グリッド韻律語列において実際に削除すべきグリッドを判断するステップと、
前記実際に削除すべきグリッドを削除し、残りのグリッドのうち、各２つのグリッドの間の単語をグルーピングし、韻律語を生成するステップと、
を含む
韻律語グルーピング方法。
言語テキストを入力する入力部と、
前記言語テキストに対して単語分割及び品詞標記を行い、全ての単語境界に韻律語境界を表す区切りであるグリッドを挿入することにより、初期のグリッド韻律語列を生成する手段と、
前記グリッド韻律語列において削除しようとするグリッドに記号を付することを複数の韻律語グルーピング手段により行い、複数の記号付け結果を得、前記複数の記号付け結果のうち少なくとも一つが削除すべきであると記号付けしているグリッドを削除すべきと判断する、または、前記複数の記号付け結果のうち半分以上が削除すべきであると記号付けしているグリッドを削除すべきと判断することによって実際に削除すべきグリッドを判断し、前記実際に削除すべきグリッドを削除する韻律語グリッド削除部と、
残りのグリッドのうち、各２つのグリッドの間の単語をグルーピングし、韻律語列を生成する韻律語生成部と、
を含む、
韻律語グルーピング装置。
前記韻律語生成部により生成された韻律語を分析し、韻律語グルーピング結果を生成する韻律語グルーピング結果分析部を有する
請求項２に記載の韻律語グルーピング装置。
コンピュータに
言語テキストを入力するステップと、
前記言語テキストに対して単語分割及び品詞標記を行い、全ての単語境界に韻律語境界を表す区切りであるグリッドを挿入することにより、初期のグリッド韻律語列を生成するステップと、
前記グリッド韻律語列において削除しようとするグリッドに記号を付することを複数の方法により行い、複数の記号付け結果を得るステップと、
前記複数の記号付け結果のうち少なくとも一つが削除すべきであると記号付けしているグリッドを削除すべきと判断する、または、前記複数の記号付け結果のうち半分以上が削除すべきであると記号付けしているグリッドを削除すべきと判断することによって、前記グリッド韻律語列において実際に削除すべきグリッドを判断するステップと、
前記実際に削除すべきグリッドを削除し、残りのグリッドのうち、各２つのグリッドの間の単語をグルーピングし、韻律語を生成するステップと、
を実行させるための
韻律語グルーピングプログラム。
韻律語グルーピングプログラムを記憶したコンピュータ読み出し可能な記憶媒体であって、
前記韻律語グルーピングプログラムはコンピュータに
言語テキストを入力するステップと、
前記言語テキストに対して単語分割及び品詞標記を行い、全ての単語境界に韻律語境界を表す区切りであるグリッドを挿入することにより、初期のグリッド韻律語列を生成するステップと、
前記グリッド韻律語列における削除しようとするグリッドに記号を付することを複数の方法により行い、複数の記号付け結果を得るステップと、
前記複数の記号付け結果のうち少なくとも一つが削除すべきであると記号付けしているグリッドを削除すべきと判断する、または、前記複数の記号付け結果のうち半分以上が削除すべきであると記号付けしているグリッドを削除すべきと判断することによって、前記グリッド韻律語列における実際に削除すべきグリッドを判断するステップと、
前記実際に削除すべきグリッドを削除し、残りのグリッドのうち、各２つのグリッドの間の単語をグルーピングし、韻律語を生成するステップと、
を実行させる
読み出し可能な記憶媒体。