JP2004347955A

JP2004347955A - 文セット自動生成方法、装置、プログラムおよびその記憶媒体

Info

Publication number: JP2004347955A
Application number: JP2003146242A
Authority: JP
Inventors: Mitsuaki Isogai; 光昭磯貝; Hideyuki Mizuno; 秀之水野; Masanobu Abe; 匡伸阿部
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2003-05-23
Filing date: 2003-05-23
Publication date: 2004-12-09
Anticipated expiration: 2023-05-23
Also published as: JP4173404B2

Abstract

【課題】文の１部を加工することにより頻出する可変単語を効率良く収集することができる文セットを自動的に生成する文セット自動生成方法、装置、プログラムおよびその記憶媒体を提供する。
【解決手段】選択テキストの候補となる特定タスクのテキストがタスク文コーパス記憶部１に格納されたタスク文コーパスと、当該特定タスクに特有な単語の単語リスト２を用い、単語リスト２中の単語がタスク文コーパスに出現する頻度を求め、タスク文コーパス中の当該単語部分を単語シンボルに置換してシンボル文コーパスを求め、シンボル文コーパスから候補テキストの組み合わせをシンボルテキストセットとして選択し、テキストセットに含まれる単語シンボル部分に対して、単語シンボルのテキストセット中における出現順序に対応して、単語の出現頻度順に、頻度上位の単語から順に埋め込む文セット自動生成方法。
【選択図】図１

Description

【０００１】
【産業上の利用分野】
この発明は、文セット自動生成方法、装置、プログラムおよびその記憶媒体に関し、特に、特定タスク用文セットを生成するに際して、母集団の文コーパスから文を抽出する場合に、文の１部を加工することにより頻出する可変単語を効率良く収集することができる文セットを自動的に生成する文セット自動生成方法、装置、プログラムおよびその記憶媒体に関する。
【０００２】
【従来の技術】
近年の音声合成技術分野においては、大容量の記憶装置に数１０分から数１０時間の大量の肉声データを格納して音声データベースとし、入力されたテキストに応じて、適切な基準で音声データベースから適切な長さの音声素片を切り出してこれらを接続し、合成音声を作成するコーパスベース音声合成方法が提案されている（特許文献１参照）。このコーパスベース音声合成方法は、長い音声単位が入力テキストに合致した場合は肉声に近い高品質な音声合成がなされる。このために、音声合成の用途を、例えば交通情報案内、天気予報案内、株価情報案内その他の長い音声単位を取り扱う特定のタスクに限定すれば、音声データベースとして比較的小さな音声データベースを使用することに依っても肉声に近い高品質な合成音声を生成することができる。
【０００３】
この音声合成に用いる音声データベースを作成するには、肉声を収録するための読み上げ用文セット（テキストセット）を用意する必要がある。
従来、特定タスク用の文セットを生成する場合は、当該タスクによくありそうな文例を人手で考案したり、当該タスクの文例を収集してよくありそうな文を人手で選択したりして文セットを生成する。また、統計的な手法を用いて或る素片単位（１例として、３つ組み音韻）を定義し、文コーパスに含まれる素片単位の出現回数の表或いは出現率の表を作成し、文コーパス中の各文に含まれる単位の出現回数或いは出現率の累計値を選択基準スコアとして、スコアの高い文を文コーパスから逐次選択することにより文セットを生成する方法を利用して、特定タスクの文コーパスにこの方法を適用することにより、特定タスク用の文セットを生成したりしていた（非特許文献１参照）。
【０００４】
更に、特定タスクの文の特徴をよく表した文セット生成を可能とするために、素片単位として形態素、２連鎖形態素等の言語的な意味を持つ長い単位を用いた上で、各種の素片単位のスコアを荷重加算した複合スコアを文の選択基準のスコアとして用い、荷重加算の重み係数の設定によりタスク依存度を高める方法が提案されている（特許文献２参照）。
しかし、これら従来の方法に依っては、特定の言い回しの中に、地名、気温、価格等の可変単語部分が存在する場合に、この可変単語を重複して収集する可能性があり、文セットに無駄が生ずる問題があった。以下、この点について説明する。
【０００５】
従来法で生成した文セットに、次の様な文１〜文３があるものとする。
１．「明日の気温は１０度の予想です。」
２．「温度は１０度の見込みです。」
３．「最高気温は１０度の見通しです。」
ここで、可変部分とは、例えば、「明日の気温は１０度の予想です。」の「１０度」の部分を指す。
【０００６】
この例は、「１０度」が３回出現するが、これは可変であるので、他の温度、例えば、
１’．「明日の気温は１０度の予想です。」
２’．「温度は１１度の見込みです。」
３’．「最高気温は１２度の見通しです。」
とした方が、音声データベースの音声バリエーションが豊富になり、その結果、合成音声の品質は向上する。
【０００７】
【特許文献１】特許第２７６１５５２号明細書
【特許文献２】特願２００３−０３６６４９号明細書
【非特許文献１】ＪａｎＰ．Ｈ．ｖａｎＳａｎｔｅｎ，”Ｄｉａｇｎｏｓｔｉｃｐｅｒｃｅｐｔｕａｌｅｘｐｅｒｉｍｅｎｔｓｆｏｒｔｅｘｔ−ｔｏ−ｓｐｅｅｃｈｓｙｓｔｅｍｅｖａｌｕａｔｉｏｎ”，ＰｒｏｃＩＣＳＬＰ９２，ｐｐ５５５−５５８，１９９２）
【０００８】
【発明が解決しようとする課題】
この発明は、上述した問題に鑑みてなされたものであり、特定タスク用文セットを生成するに際して、母集団の文コーパスから文を抽出する場合に、文の１部を加工することにより頻出する可変単語を効率良く収集することができる文セットを自動的に生成する文セット自動生成方法、装置、プログラムおよびその記憶媒体を提供するものである。
【０００９】
【課題を解決するための手段】
選択テキストの候補となる特定タスクのテキストがディジタルデータとしてタスク文コーパス記憶部１に格納されたタスク文コーパスと、当該特定タスクに特有な単語の単語リスト２を用い、単語リスト２中の単語がタスク文コーパスに出現する頻度を求めてジャンル別単語頻度順テーブル３に格納する第１のステップと、単語リスト２に格納される単語がタスク文コーパスに出現した場合に、タスク文コーパス中の当該単語部分を単語シンボルに置換してシンボル文コーパスとしてシンボル文コーパス記憶部４に格納する第２のステップと、第２のステップにおいて求めたシンボル文コーパスから候補テキストの組み合わせをシンボルテキストセットとして選択してシンボルテキストセット記憶部５に格納する第３のステップと、第３のステップにおいて求めたテキストセットに含まれる単語シンボル部分に対して、単語シンボルのテキストセット中における出現順序に対応して、第１のステップにおいて求めた単語の出現頻度順に、頻度上位の単語から順に埋め込む第４のステップとを有する文セット自動生成方法を構成した。
【００１０】
先の文セット自動生成方法において、単語埋込処理は、シンボルテキストセット記憶部５中の単語シンボルの出現順序を表す変数ｎを１にリセットし、シンボルテキストセット記憶部５中のｎ番目の単語シンボルとその前後環境を取得し、ジャンル別単語頻度順テーブル３とジャンル別埋込フラグテーブル７を用いて単語シンボルへ埋め込む単語を決定し、単語シンボル部分に決定された単語を埋め込み、終了判定処理を行う工程を有する文セット自動生成方法を構成した。
【００１１】
そして、選択テキストの候補となる特定タスクのテキストがディジタルデータとして格納されたタスク文コーパス記憶部１を具備し、当該特定タスクに特有な単語を記憶する単語リスト２を具備し、単語リスト２中の単語がタスク文コーパスに出現する頻度を求めてジャンル別単語頻度順テーブル３に格納する単語出現頻度算出処理部１１を具備し、単語リスト２に格納される単語がタスク文コーパスに出現した場合に、タスク文コーパス中の当該単語部分を単語シンボルに置換してシンボル文コーパス記憶部４に格納する単語シンボル置換処理部１２を具備し、単語シンボル置換処理部１２により求めたシンボル文コーパスから候補テキストの組み合わせをシンボルテキストとして選択してシンボルテキストセット記憶部５に格納するテキストセット選択処理部１３を具備し、テキストセット選択処理部１３により求めたテキストセットに含まれる単語シンボル部分に対して、単語シンボルのテキストセット中における出現順序に対応して、単語出現頻度算出処理部１１により求めた単語の出現頻度順に、頻度上位の単語から順に埋め込む単語埋込処理部１４を具備する文セット自動生成装置を構成した。
【００１２】
また、タスク文コーパスが格納されたタスク文コーパス記憶部１と当該特定タスクに特有な単語の単語リスト２を参照して単語リスト２中の単語がタスク文コーパスに出現する頻度を求め、単語リスト２に格納される単語がタスク文コーパスに出現した場合に、タスク文コーパス中の当該単語部分を単語シンボルに置換してシンボル文コーパス記憶部４に格納し、シンボル文コーパスから候補テキストの組み合わせをシンボルテキストセットとして選択してシンボルテキストセット記憶部５に格納し、テキストセットに含まれる単語シンボル部分に対して、単語シンボルのテキストセット中における出現順序に対応して、単語の出現頻度順に、頻度上位の単語から順に埋め込む指令を、コンピュータに対してする文セット自動生成プログラムを構成した。
更に、先の文セット自動生成プログラムを記憶した記憶媒体を構成した。
【００１３】
【発明の実施の形態】
この発明は、選択テキストの候補となる特定タスクのテキストがディジタルデータとしてタスク文コーパス記憶部に格納されたタスク文コーパスと、当該特定タスクに特有な単語の単語リストを用い、単語リスト中の単語がタスク文コーパスに出現する頻度を求め、単語リストに格納される単語がタスク文コーパスに出現した場合にタスク文コーパス中の当該単語部分を単語シンボルに置換し、シンボル文コーパスから候補テキストの組み合わせをシンボルテキストセットとして選択し、テキストセットに含まれる単語シンボル部分に対して、単語シンボルのテキストセット中における出現順序に対応して、単語の出現頻度順に、単語を頻度上位の単語から順に埋め込む文セット自動生成方法、装置、プログラムおよびその記憶媒体である。
【００１４】
母集団の文コーパスから文を抽出する場合に、上述の如く文の１部を加工することにより頻出する可変単語を効率良く収集することができる。
この発明は、単語埋込処理において、単語シンボルの前、後或いは前後の音素或いは音節環境を考慮して、頻度上位の単語がより多くの環境を持つ様に、頻度上位の単語にとって初出の単語シンボルと環境の組み合わせが出現した場合には、頻度上位の単語を優先して埋込処理する構成とすることができる。
【００１５】
また、この発明は、タスクを交通情報案内とする様な場合は、地名、路線名、方向、距離、時刻を単語のジャンル毎に用意し、単語のジャンル毎に独立に、単語頻度計算、単語シンボル置換処理、単語埋込処理を行う構成とすることができる。
この発明は、一例として音声合成に用いる音声データベースの構築に必要な文の読み上げ用の文の集合である文セットを生成するのに用いられる。
【００１６】
【実施例】
この発明の実施例を図を参照して説明する。以下、交通情報案内をタスクの１例として用いて説明する。
図１において、タスク文コーパス記憶部１は、交通情報案内タスクから収集した大量のテキストを含んでいる。ジャンル別単語リスト２は当該タスクに特有な単語のジャンル、固有名詞、数値表現その他の事情を考慮して予め用意した単語リストである。ここで、単語のジャンルとして地名、路線名、方向、距離、時刻を定義している。これらは交通情報案内タスクにおいて可変な単語のジャンルの代表例である。単語リストの例を図２に示す。図２（ａ）は地名の単語リスト、図２（ｂ）は路線名の単語リスト、図２（ｃ）は方向の単語リスト、図２（ｄ）は距離の単語リスト、図２（ｅ）は時刻の単語リストである。
【００１７】
この実施例においては、単語シンボルの置き換え処理に際して、単語シンボルの前後環境として音節環境を考慮している。
先ず、単語出現頻度算出部１１は、ジャンル別単語リスト２中の単語がタスク文コーパス記憶部１に出現する頻度を単語のジャンル毎に求め、求められた単語出現頻度順を単語のジャンル毎に単語出現頻度順テーブル３に格納する。単語のジャンルを複数定義した場合は、この通りに単語のジャンル毎に単語出現頻度順テーブルを作成する。
【００１８】
図３は単語のジャンル毎に求めた単語出現頻度順テーブルの例を示す。図３（ａ）は地名の単語出現頻度順テーブルであり、図３（ｂ）は路線の単語出現頻度順テーブルであり、図３（ｃ）は方向の単語出現頻度順テーブルであり、図３（ｄ）は距離の単語出現頻度順テーブルであり、図３（ｅ）は時刻の単語出現頻度順テーブルである。
単語シンボル置換処理部１２は、タスク文コーパス記憶部１中の当該単語部分を単語シンボルに置換し、置換結果をシンボル文コーパス記憶部４に格納する。図４（ａ）はタスク文コーパス記憶部１に記憶される置換前のテキストの１例を示しており、図４（ｂ）は図４（ａ）のテキスト中の可変単語部分である「４号線」、「上り」、「三宅坂」、「笹塚」を、これらをそれぞれ代表するシンボルである路線、方向、地名、地名に置換した結果を示す。図４（ｂ）において記号＜と記号＞で囲まれた部分は単語のシンボルを示す。記号＜と記号＞で囲まれた文字列は単語のジャンルを示す。この置換処理は、タスク文コーパス記憶部１に含まれる全てのテキストに対して行う。
【００１９】
テキストセット選択処理部１３は、シンボル文コーパス記憶部４から、タスクに頻出する音響的或いは言語的な特徴を有するテキストの集合を選択し、シンボルテキストセットとしてシンボルテキストセット記憶部５に格納する。この選択には、先の特許文献２に記載される様なタスクに特徴的な表現を持つテキスト集合を効果的に選択することができる手法を用いる。また、単語シンボルは形態素の１種として扱う。
【００２０】
単語埋込処理部１４は、シンボルテキストセット記憶部５に含まれる単語シンボル部分に、単語出現頻度順テーブル３の単語出現頻度順序を元にして、単語を埋め込む。
以下、この単語埋込処理部１４について、図５〜図１２を用いて詳しく説明する。ここで、図５は図１の単語埋込処理部１４の詳細を示す図である。図６は実施例における単語埋込処理の途中経過にある文を示す図である。図７は実施例における単語埋め込みフラグテーブル（地名）を示す図である。図８は実施例における単語埋め込みフラグテーブル（路線）を示す図である。図９は実施例における単語埋め込みフラグテーブル（方向）を示す図である。図１０は実施例における単語埋め込みフラグテーブル（距離）を示す図である。図１１は、実施例における単語埋め込みフラグテーブル（時刻）を示す図である。
【００２１】
先ず、図５のＳ１０１において、シンボルテキストセット記憶部５中の単語シンボルの出現順序を表す変数ｎをリセット、即ち、ｎ＝１に設定する。
Ｓ１０２において、シンボルテキストセット記憶部５中のｎ番目の単語シンボルと、その前後環境を取得する。
Ｓ１０３において、ジャンル別単語頻度順テーブル３とジャンル別埋込フラグテーブル７を用いて、単語シンボルへ埋め込む単語を決定する。ジャンル別埋込フラグテーブル７は、どの単語と、環境を考慮した場合はどの環境の組み合わせが既に埋込済みであるかを記憶しておくテーブルである。単語シンボルのテキストセット記憶部５中での出現順序に対応して、単語出現頻度順に、頻度上位の単語から順に埋め込む。この処理の詳細を、例を用いて説明する。
【００２２】
ここで、単語埋込処理が図６に示す段階まで進んでいるとする。下線部は既に埋め込まれた単語である。このとき、各単語ジャンルの単語埋め込みフラグテーブル７は、先の図７〜図１１に示す状態にある。ここで、前後環境欄は、「前環境」および「後環境」の組み合わせを示す。ここにおける記号「＃」は、環境が無音であること、即ち、単語が文頭、文末、ポーズ直前、ポーズ直後の何れかに位置することを示す。そして、図中の数値１は或る単語とその前後環境の組み合わせについて埋込済みであることを示し、０は未だ埋め込まれていないことを示す。図７に示す例は「の江戸橋と」、「の江戸橋で」、「の江戸橋＃」および「の箱崎＃」は既に埋込済みであることを示す。
【００２３】
この図６の段階で、Ｓ１０２で取得する単語シンボルは、「中央環状線の上りの」に続く＜地名＞である。そして、記号＜の左側が‘の’であると共に、記号＞の右側が‘で’であるので、環境は「の−で」である。単語のジャンルは、地名であるので、図７の地名の単語埋込フラグテーブルを参照する。順位第１位の単語は「江戸橋」であるが、その環境「の−で」はフラグが１で既に埋込済みであり、「の江戸橋で」の組み合わせは既に埋込済みであることが分かる。そこで、次に、第２位「箱崎」の環境「の−で」のフラグを参照する。このフラグは０であり、「の箱崎で」の組み合わせは未だ埋め込まれていない。よって、埋め込むべき単語は「箱崎」であることが求まる。そして、単語埋込フラグテーブルの当該部分のフラグを１にする。なお、ここで、環境が単語埋込フラグテーブルで初出であった場合は、新しい環境列をテーブルに追加する。新しい環境の場合は、自動的に順位第１位の単語が埋込に用いられる。新しい環境の場合は、フラグは第１位の単語部分を１とおき、第２位以下は０とおく。
【００２４】
Ｓ１０４において、単語シンボル部分に「箱崎」を埋め込む。
以上の処理を行った結果、図１２に示される如く、「箱崎」が埋め込まれたテキストが置き換え済みテキストセット記憶部６に格納される。
Ｓ１０５において終了判定処理を行う。変数ｎが、テキストセット中の単語シンボルの総数Ｎと等しければ、終了する。
Ｎ＞ｎであれば、Ｓ１０６でｎを１加算し、次の単語シンボルの埋込処理を行うために、Ｓ１０２へと戻る。
【００２５】
以上の実施例において、単語埋込処理は、単語シンボルの前、後或いは前後の音素或いは音節環境を考慮して、頻度上位の単語がより多くの環境を持つ様に、頻度上位の単語にとって初出の単語シンボルと環境の組み合わせが出現した場合は、頻度上位の単語を優先して埋込処理する構成とすることができる。そして、タスクを交通情報案内とする様な場合、地名、路線名、方向、距離、時刻を単語のジャンル毎に用意し、単語のジャンル毎に独立に、単語頻度計算、単語シンボル置換処理、単語埋込処理を行う構成とすることができる。
【００２６】
以上の通りの処理により、タスク中の可変単語を、単語の環境を含めて重複なく文セットに含めることができる。そして、単語の出現頻度が高い程、より多くの環境バリエーションを持つ様な文セットを生成することができる。環境が一致していれば、合成音声の単語の接続部分が滑らかになるので合成音声の品質は向上する。即ち、頻出単語である程多くの環境バリエーションを持つことが望ましいので、この発明は合成音声の品質向上に効率的な文セットを提供することができるということができる。
【００２７】
この発明は、コンピュータを主要な構成要素として構成することができる。この場合、テキスト選択および加工プログラムをＣＤ−ＲＯＭ磁気ディスクその他の記録媒体からコンピュータにインストールし、或いは、通信回線を介してダウンロードしてそのプログラムをコンピュータで実行する。
この発明は、日本語テキストの文セットのみならず、他の言語のテキストにも適用することができる。
【００２８】
【発明の効果】
上述した通りであって、この発明に依れば、特定タスク用文セットを生成するに際して、母集団の文コーパスから抽出した文の１部を加工することにより、当該タスクの可変単語を効率良く収集することができる文セットを自動的に生成することができる。
即ち、この発明に依れば、タスク中の可変単語を、単語の環境を含めて重複なく文セットに含めることができる。そして、単語の出現頻度が高い程、より多くの環境バリエーションを持つ様な文セットを生成することができる。環境が一致していれば、合成音声の単語の接続部分が滑らかになるので合成音声の品質は向上する。即ち、頻出単語である程多くの環境バリエーションを持つことが望ましいので、この発明は合成音声の品質向上に効率的な文セットを提供することができるということができる。
【図面の簡単な説明】
【図１】実施例を説明する図。
【図２】単語リストの実施例を示す図。
【図３】単語出現頻度順テーブルの実施例を示す図。
【図４】置換処理される文および単語シンボルに置換された文を示す図。
【図５】単語埋込処理部の実施例の詳細を示す図。
【図６】単語埋込処理の途中経過にある文を示す図。
【図７】単語埋め込みフラグテーブル（地名）の実施例を示す図。
【図８】単語埋め込みフラグテーブル（路線）の実施例を示す図。
【図９】単語埋め込みフラグテーブル（方向）の実施例を示す図。
【図１０】単語埋め込みフラグテーブル（距離）の実施例を示す図。
【図１１】単語埋め込みフラグテーブル（時刻）の実施例を示す図。
【図１２】単語埋込処理を行った文の１例を示す図。
【符号の説明】
１タスク文コーパス記憶部２ジャンル別単語リスト
３単語出現頻度順テーブル４シンボル文コーパス記憶部
５シンボルテキストセット記憶部６置き換え済みテキストセット記憶部
７ジャンル別埋込フラグテーブル１１単語出現頻度算出部
１２単語シンボル置換処理部１３テキストセット選択処理部
１４単語埋込処理部

Claims

選択テキストの候補となる特定タスクのテキストがディジタルデータとしてタスク文コーパス記憶部に格納されたタスク文コーパスと、当該特定タスクに特有な単語の単語リストを用い、
単語リスト中の単語がタスク文コーパスに出現する頻度を求めてジャンル別単語頻度順テーブルに格納する第１のステップと、
単語リストに格納される単語がタスク文コーパスに出現した場合に、タスク文コーパス中の当該単語部分を単語シンボルに置換してシンボル文コーパスとしてシンボル文コーパス記憶部に格納する第２のステップと、
第２のステップにおいて求めたシンボル文コーパスから候補テキストの組み合わせをシンボルテキストセットとして選択してシンボルテキストセット記憶部に格納する第３のステップと、
第３のステップにおいて求めたテキストセットに含まれる単語シンボル部分に対して、単語シンボルのテキストセット中における出現順序に対応して、第１のステップにおいて求めた単語の出現頻度順に、頻度上位の単語から順に埋め込む第４のステップと、
を有することを特徴とする文セット自動生成方法。
請求項１に記載される文セット自動生成方法において、
単語埋込処理は、シンボルテキストセット記憶部中の単語シンボルの出現順序を表す変数ｎを１にリセットし、
シンボルテキストセット記憶部中のｎ番目の単語シンボルとその前後環境を取得し、
ジャンル別単語頻度順テーブルとジャンル別埋込フラグテーブルを用いて単語シンボルへ埋め込む単語を決定し、
単語シンボル部分に決定された単語を埋め込み、
終了判定処理を行う、
工程を有することを特徴とする文セット自動生成方法。
選択テキストの候補となる特定タスクのテキストがディジタルデータとして格納されたタスク文コーパス記憶部を具備し、
当該特定タスクに特有な単語を記憶する単語リストを具備し、
単語リスト中の単語がタスク文コーパスに出現する頻度を求めてジャンル別単語頻度順テーブルに格納する単語出現頻度算出処理部を具備し、
単語リストに格納される単語がタスク文コーパスに出現した場合に、タスク文コーパス中の当該単語部分を単語シンボルに置換してシンボル文コーパス記憶部に格納する単語シンボル置換処理部を具備し、
単語シンボル置換処理部により求めたシンボル文コーパスから候補テキストの組み合わせをシンボルテキストとして選択してシンボルテキストセット記憶部に格納するテキストセット選択処理部を具備し、
テキストセット選択処理部により求めたテキストセットに含まれる単語シンボル部分に対して、単語シンボルのテキストセット中における出現順序に対応して単語出現頻度算出処理部により求めた単語の出現頻度順に、頻度上位の単語から順に埋め込む単語埋込処理部を具備する、
ことを特徴とする文セット自動生成装置。
タスク文コーパスが格納されたタスク文コーパス記憶部と当該特定タスクに特有な単語の単語リストを参照して単語リスト中の単語がタスク文コーパスに出現する頻度を求め、
単語リストに格納される単語がタスク文コーパスに出現した場合に、タスク文コーパス中の当該単語部分を単語シンボルに置換してシンボル文コーパス記憶部に格納し、
シンボル文コーパスから候補テキストの組み合わせをシンボルテキストセットとして選択してシンボルテキストセット記憶部に格納し、
テキストセットに含まれる単語シンボル部分に対して、単語シンボルのテキストセット中における出現順序に対応して、単語の出現頻度順に、頻度上位の単語から順に埋め込む指令を、コンピュータに対してする文セット自動生成プログラム。
請求項４に記載される文セット自動生成プログラムを記憶した記憶媒体。