JPH07160709A - 自然語文解析装置、文リズムパターン選択装置及び文生成装置 - Google Patents
自然語文解析装置、文リズムパターン選択装置及び文生成装置Info
- Publication number
- JPH07160709A JPH07160709A JP5304361A JP30436193A JPH07160709A JP H07160709 A JPH07160709 A JP H07160709A JP 5304361 A JP5304361 A JP 5304361A JP 30436193 A JP30436193 A JP 30436193A JP H07160709 A JPH07160709 A JP H07160709A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- rhythm pattern
- rhythm
- phrase
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 本発明の目的は、所望の文リズムパターンを
有する文の生成を可能にするためにそのリズムパターン
を検出し、通常文と区別して文生成装置の入力に有用な
自然語文解析装置及、文リズムパターン選択装置及び、
特定のリズムパターンを有する文を生成する文生成装置
を提供することである。 【構成】 本発明は、本発明の文リズムパターン選択装
置300は、形態素解析手段201と、各文節の係り受
け関係を決定する係り受け解析手段202と、モーラ数
カウント手段203と、文節境界チェック手段204
と、句境界チェック手段205と、文リズムパターンを
決定するリズムパターン決定手段206と、リズムパタ
ーン決定手段206で決定された文リズムパターンから
所望の文リズムパターンを有する文を選択するリズム選
択手段301を有する。
有する文の生成を可能にするためにそのリズムパターン
を検出し、通常文と区別して文生成装置の入力に有用な
自然語文解析装置及、文リズムパターン選択装置及び、
特定のリズムパターンを有する文を生成する文生成装置
を提供することである。 【構成】 本発明は、本発明の文リズムパターン選択装
置300は、形態素解析手段201と、各文節の係り受
け関係を決定する係り受け解析手段202と、モーラ数
カウント手段203と、文節境界チェック手段204
と、句境界チェック手段205と、文リズムパターンを
決定するリズムパターン決定手段206と、リズムパタ
ーン決定手段206で決定された文リズムパターンから
所望の文リズムパターンを有する文を選択するリズム選
択手段301を有する。
Description
【0001】
【産業上の利用分野】本発明は、自然語文解析装置、文
リズムパターン選択装置及び文生成装置に係り、特に、
自然言語の特徴を抽出し、自然語文又は文のリズムパタ
ーンを判定する、さらに文を生成するための自然語解析
装置及び文リズムパターン選択装置及び文生成装置に関
する。
リズムパターン選択装置及び文生成装置に係り、特に、
自然言語の特徴を抽出し、自然語文又は文のリズムパタ
ーンを判定する、さらに文を生成するための自然語解析
装置及び文リズムパターン選択装置及び文生成装置に関
する。
【0002】例えば、結婚式の祝辞等のメッセージを作
成する際に、意図的に短歌や俳句形式の7拍(7モー
ラ)または5拍(5モーラ)の連続する文(以下、これ
を七五調文と記す)を作成する場合がある。メッセージ
を自動生成する時、七五調文を生成することができれ
ば、そのメッセージが与える印象をより強くすることが
できる。
成する際に、意図的に短歌や俳句形式の7拍(7モー
ラ)または5拍(5モーラ)の連続する文(以下、これ
を七五調文と記す)を作成する場合がある。メッセージ
を自動生成する時、七五調文を生成することができれ
ば、そのメッセージが与える印象をより強くすることが
できる。
【0003】
【従来の技術】図15は、従来の文生成装置の構成例を
示す。
示す。
【0004】同図に示す文生成装置は、初期生成部1
1、評価部12、修正部13及び、表出部14より構成
される。
1、評価部12、修正部13及び、表出部14より構成
される。
【0005】同図の文生成装置は、初期生成部11で生
成された文を書き換えていくタイプのものであり、評価
部12で文の長さ、文生成時間を評価対象として正解と
判定された文を出力し、誤りであると判定された場合に
は、修正部13で修正する語等を決定し、修正方法及び
修正すべき語を表出部14で修正し、再度評価部12に
入力し、評価を繰り返す。
成された文を書き換えていくタイプのものであり、評価
部12で文の長さ、文生成時間を評価対象として正解と
判定された文を出力し、誤りであると判定された場合に
は、修正部13で修正する語等を決定し、修正方法及び
修正すべき語を表出部14で修正し、再度評価部12に
入力し、評価を繰り返す。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の文生成装置は、例えば、七五調文を生成する場合
は、本来評価部12で入力された文が七五調であるかど
うかを判定しなければならないが、文の長さや生成時間
を評価部での評価対象としており、七五調文についての
評価を行わないため、文が七五調か否かを判定すること
は行っていない。従って、自然語文として文を扱うた
め、七五調のような文リズムを考慮した文の生成は不可
能である。
来の文生成装置は、例えば、七五調文を生成する場合
は、本来評価部12で入力された文が七五調であるかど
うかを判定しなければならないが、文の長さや生成時間
を評価部での評価対象としており、七五調文についての
評価を行わないため、文が七五調か否かを判定すること
は行っていない。従って、自然語文として文を扱うた
め、七五調のような文リズムを考慮した文の生成は不可
能である。
【0007】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、俳句、短歌等の所望の
文リズムパターンを有する文の生成を可能にするために
そのリズムパターンを検出し、通常文と区別して文生成
装置の入力に有用な自然語文解析装置及、文リズムパタ
ーン選択装置及び、特定のリズムパターンを有する文を
生成する文生成装置を提供することを目的とする。
で、上記従来の問題点を解決し、俳句、短歌等の所望の
文リズムパターンを有する文の生成を可能にするために
そのリズムパターンを検出し、通常文と区別して文生成
装置の入力に有用な自然語文解析装置及、文リズムパタ
ーン選択装置及び、特定のリズムパターンを有する文を
生成する文生成装置を提供することを目的とする。
【0008】
【課題を解決するための手段】図1は、本発明の原理構
成図である。
成図である。
【0009】本発明の自然語文解析装置200は、入力
された文について形態素解析し、文を単語及び文節単位
に分割し、各単語に読みを付与する形態素解析手段20
1と、形態素解析された各文節の係り受け関係を決定す
る係り受け解析手段202と、単語列のモーラ数を数え
るモーラ数カウント手段203と、単語列の最後尾が文
節境界と一致しているかどうかを調査する文節境界チェ
ック手段204と、単語列が係り受け木の複数の枝に跨
がっているかどうかを判断する句境界チェック手段20
5と、モーラ数カウント手段203、文節境界チェック
手段204及び句境界チェック手段205の各結果に基
づいて文のリズムパターンを決定するリズムパターン決
定手段206とを有する。
された文について形態素解析し、文を単語及び文節単位
に分割し、各単語に読みを付与する形態素解析手段20
1と、形態素解析された各文節の係り受け関係を決定す
る係り受け解析手段202と、単語列のモーラ数を数え
るモーラ数カウント手段203と、単語列の最後尾が文
節境界と一致しているかどうかを調査する文節境界チェ
ック手段204と、単語列が係り受け木の複数の枝に跨
がっているかどうかを判断する句境界チェック手段20
5と、モーラ数カウント手段203、文節境界チェック
手段204及び句境界チェック手段205の各結果に基
づいて文のリズムパターンを決定するリズムパターン決
定手段206とを有する。
【0010】また、本発明の文リズムパターン選択装置
300は、入力された文について形態素解析し、文を単
語及び文節単位に分割し、各単語に読みを付与する形態
素解析手段201と、形態素解析された各文節の係り受
け関係を決定する係り受け解析手段202と、単語列の
モーラ数を数えるモーラ数カウント手段203と、単語
列の最後尾が文節境界と一致しているかどうかを調査す
る文節境界チェック手段204と、単語列が係り受け木
の複数の枝に跨がっているかどうかを判断する句境界チ
ェック手段205と、モーラ数カウント手段203、文
節境界チェック手段204及び句境界チェック手段20
5の各結果に基づいて文の文リズムパターンを決定する
リズムパターン決定手段206と、リズムパターン決定
手段206で決定された文リズムパターンから所定のリ
ズムパターンを有する文を選択するリズム選択手段30
1とを有する。
300は、入力された文について形態素解析し、文を単
語及び文節単位に分割し、各単語に読みを付与する形態
素解析手段201と、形態素解析された各文節の係り受
け関係を決定する係り受け解析手段202と、単語列の
モーラ数を数えるモーラ数カウント手段203と、単語
列の最後尾が文節境界と一致しているかどうかを調査す
る文節境界チェック手段204と、単語列が係り受け木
の複数の枝に跨がっているかどうかを判断する句境界チ
ェック手段205と、モーラ数カウント手段203、文
節境界チェック手段204及び句境界チェック手段20
5の各結果に基づいて文の文リズムパターンを決定する
リズムパターン決定手段206と、リズムパターン決定
手段206で決定された文リズムパターンから所定のリ
ズムパターンを有する文を選択するリズム選択手段30
1とを有する。
【0011】図2は、本発明の原理構成図(その2)で
ある。
ある。
【0012】本発明の文生成装置400は、言語知識と
言語選択ルールに基づいて語選択を行うことにより初期
文を生成する初期生成部410と、生成された文又は修
正された文が所定の文リズムパターンであるか否かを判
定する評価手段420と、評価手段420により所定の
文リズムパターンであると判断された場合に、文を出力
する七五調文出力手段430と、評価手段420により
所定の文リズムパターンではないと判断された場合に、
文の修正規則の中から文を所定の文リズムパターンにな
るように修正するために最も優先度の高い修正規則46
0を選択する修正手続選択手段440と、修正手続選択
手段440により選択された修正規則460に従って評
価手段420において所定の文リズムパターン以外の文
であると判断された文を、所定の文リズムパターンにな
るように書き換え、評価手段420に転送する表出手段
450とを有する。
言語選択ルールに基づいて語選択を行うことにより初期
文を生成する初期生成部410と、生成された文又は修
正された文が所定の文リズムパターンであるか否かを判
定する評価手段420と、評価手段420により所定の
文リズムパターンであると判断された場合に、文を出力
する七五調文出力手段430と、評価手段420により
所定の文リズムパターンではないと判断された場合に、
文の修正規則の中から文を所定の文リズムパターンにな
るように修正するために最も優先度の高い修正規則46
0を選択する修正手続選択手段440と、修正手続選択
手段440により選択された修正規則460に従って評
価手段420において所定の文リズムパターン以外の文
であると判断された文を、所定の文リズムパターンにな
るように書き換え、評価手段420に転送する表出手段
450とを有する。
【0013】また、本発明の文生成装置400の評価手
段420は、初期生成手段410により生成された文に
ついて形態素解析し、文を単語及び文節単位に分割し、
各単語に読みを付与する形態素解析手段201と、形態
素解析された各文節の係り受け関係を決定する係り受け
解析手段202と、単語列のモーラ数を数えるモーラ数
カウント手段203と、単語列の最後尾が文節境界と一
致しているかどうかを調査する文節境界チェック手段2
04と、単語列が係り受け木の複数の枝に跨がっている
かどうかを判断する句境界チェック手段205と、モー
ラ数カウント手段203、文節境界チェック手段204
及び句境界チェック手段205の各結果に基づいて文の
文リズムパターンを決定するリズムパターン決定手段2
06と、リズムパターン決定手段206で決定された文
リズムパターンから七五調種別等の所望の種別を有する
文を選択するリズム選択手段301を含む。
段420は、初期生成手段410により生成された文に
ついて形態素解析し、文を単語及び文節単位に分割し、
各単語に読みを付与する形態素解析手段201と、形態
素解析された各文節の係り受け関係を決定する係り受け
解析手段202と、単語列のモーラ数を数えるモーラ数
カウント手段203と、単語列の最後尾が文節境界と一
致しているかどうかを調査する文節境界チェック手段2
04と、単語列が係り受け木の複数の枝に跨がっている
かどうかを判断する句境界チェック手段205と、モー
ラ数カウント手段203、文節境界チェック手段204
及び句境界チェック手段205の各結果に基づいて文の
文リズムパターンを決定するリズムパターン決定手段2
06と、リズムパターン決定手段206で決定された文
リズムパターンから七五調種別等の所望の種別を有する
文を選択するリズム選択手段301を含む。
【0014】
【作用】本発明の自然語解析装置は、まず、入力文を形
態素解析し、文を単語及び文節に分割し、各単語に読み
を付与し、係り受け解析を行い、文節同士の係り受け関
係を決定し、係り受け木を得る。次に、単語列のモーラ
数、単語列と文節境界の一致度、文節列と係り受け木の
関係を利用して、文のリズムパターンを決定する。そし
て、文リズムパターン選択装置は、文のリズムパターン
から所望の文のリズムパターンに合致する文を判定す
る。これにより、文生成装置において、所望の(例えば
七五調)文リズムパターンを有する文を生成する。
態素解析し、文を単語及び文節に分割し、各単語に読み
を付与し、係り受け解析を行い、文節同士の係り受け関
係を決定し、係り受け木を得る。次に、単語列のモーラ
数、単語列と文節境界の一致度、文節列と係り受け木の
関係を利用して、文のリズムパターンを決定する。そし
て、文リズムパターン選択装置は、文のリズムパターン
から所望の文のリズムパターンに合致する文を判定す
る。これにより、文生成装置において、所望の(例えば
七五調)文リズムパターンを有する文を生成する。
【0015】
【実施例】以下、図面とともに本発明の実施例を詳細に
説明する。
説明する。
【0016】以下では、第1の実施例として自然語文解
析装置、第2の実施例として文リズムパターン選択装
置、第3の実施例として文生成装置について説明する。
析装置、第2の実施例として文リズムパターン選択装
置、第3の実施例として文生成装置について説明する。
【0017】本発明において、第2の実施例の文リズム
パターン選択装置は、第1の実施例の自然語文解析装置
で出力された結果を用いて、所望の文リズムを解析する
装置であり、本実施例では七五調文を解析する装置とし
て説明する。第3の文生成装置は、第2の実施例の文リ
ズムパターン選択装置を文生成装置に適応して所望の文
リズムを有する文を生成するものである。
パターン選択装置は、第1の実施例の自然語文解析装置
で出力された結果を用いて、所望の文リズムを解析する
装置であり、本実施例では七五調文を解析する装置とし
て説明する。第3の文生成装置は、第2の実施例の文リ
ズムパターン選択装置を文生成装置に適応して所望の文
リズムを有する文を生成するものである。
【0018】《第1の実施例:自然語文解析装置》ま
ず、自然語文解析装置について説明する。
ず、自然語文解析装置について説明する。
【0019】図3は、本発明の第1の実施例の自然語文
解析装置のブロック図である。
解析装置のブロック図である。
【0020】自然語文解析装置10は、形態素解析部
1、係り受け解析部2、文リズムパターン判定部3から
構成される。このうち、文リズムパターン判定部3は、
最適パターン探索部4、単語毎の読みから文字列が何モ
ーラであるかをカウントし、形態素解析部1からの単語
境界、文節境界、読み等の情報によりカウント値を調整
するモーラ数カウント部5、文節境界チェック部6、句
境界チェック部7から構成される。
1、係り受け解析部2、文リズムパターン判定部3から
構成される。このうち、文リズムパターン判定部3は、
最適パターン探索部4、単語毎の読みから文字列が何モ
ーラであるかをカウントし、形態素解析部1からの単語
境界、文節境界、読み等の情報によりカウント値を調整
するモーラ数カウント部5、文節境界チェック部6、句
境界チェック部7から構成される。
【0021】図4は、本発明の第1の実施例の自然語文
解析装置の動作を示すフローチャートである。なお、こ
こでは、具体例として『ロンドンの春風優しい博物館』
という例により文リズムパターンを判定する手順を示
す。
解析装置の動作を示すフローチャートである。なお、こ
こでは、具体例として『ロンドンの春風優しい博物館』
という例により文リズムパターンを判定する手順を示
す。
【0022】ステップ1)第1に自然語解析装置10の
形態素解析部1は、形態素解析を行い、文を文節及び単
語に分割し、分割された単語に読み及び品詞を付与す
る。
形態素解析部1は、形態素解析を行い、文を文節及び単
語に分割し、分割された単語に読み及び品詞を付与す
る。
【0023】
【表1】
【0024】が得られる。上記の表のうち、1本の線は
単語境界を示し、2本の線は文節境界(単語境界でもあ
る)を表す。入力文の単語数をnw 、文節数nb とする
と、上記の例では、nw =5、nb =4となる。
単語境界を示し、2本の線は文節境界(単語境界でもあ
る)を表す。入力文の単語数をnw 、文節数nb とする
と、上記の例では、nw =5、nb =4となる。
【0025】ステップ2)次に、係り受け解析部2は、
係り受け解析を行い、文節同士の係り受け関係を得る。
この係り受け解析の結果として図5に示すような係り受
け木が構成される。また、図5に示す係り受け木は、以
下に示すリスト構造としても表される。
係り受け解析を行い、文節同士の係り受け関係を得る。
この係り受け解析の結果として図5に示すような係り受
け木が構成される。また、図5に示す係り受け木は、以
下に示すリスト構造としても表される。
【0026】
【表2】
【0027】これを、本実施例では、係り受け構造Gと
呼ぶ。但し、上記リストの1レコードは、 [対象文節 係り元文節(複数) 係り先文節]で、ni
l は係り元もしくは、係り先文節がないことを表す。ま
た、文節1は「ロンドンの」、文節2は「春風」、文節
3は「優しい」、文節4は「博物館」を意味する。
呼ぶ。但し、上記リストの1レコードは、 [対象文節 係り元文節(複数) 係り先文節]で、ni
l は係り元もしくは、係り先文節がないことを表す。ま
た、文節1は「ロンドンの」、文節2は「春風」、文節
3は「優しい」、文節4は「博物館」を意味する。
【0028】ステップ3)次に、文リズムパターン判定
部3は、単語・文節分割された入力文、各単語の読み及
び係り受け構造を用いて、文リズムパターンを判定す
る。この文リズムパターン判定部3の詳細な動作を以下
に説明する。
部3は、単語・文節分割された入力文、各単語の読み及
び係り受け構造を用いて、文リズムパターンを判定す
る。この文リズムパターン判定部3の詳細な動作を以下
に説明する。
【0029】文リズムパターン判定部3の最適パターン
探索部4で行われる最適なリズムパターンを探索する手
法として本実施例ではオプティマルサーチ(Optimal-se
arch) を用いる。オプティマルサーチに必要な評価値を
算出する手法として、図6、図7に示す評価値算出法で
行う。
探索部4で行われる最適なリズムパターンを探索する手
法として本実施例ではオプティマルサーチ(Optimal-se
arch) を用いる。オプティマルサーチに必要な評価値を
算出する手法として、図6、図7に示す評価値算出法で
行う。
【0030】評価値算出に必要なものは、単語列wi 〜
wj (以下、これを iwj と記す)、単語列wi 〜wj
の属する文節列bg 〜bh (同様にg bh と記す)、各
単語の読みyi 〜yj (i yj )、係り受け構造K、及
び仮定モーラrである。仮定モーラrは、対象単語列が
何モーラであるかを仮定したもので、評価値sは、単語
列がrモーラであるとした場合の不一致を表す。例え
ば、表1の具体例のうち、『春風優しい』の部分が7モ
ーラであると仮定した場合の評価値の算出では、 w3 =春風, w4 =優しい y3 =はるかぜ, y4 =やさしい b2 =[w3 ], b3 =[w4 ] r=7 及び係り受け構造Kが入力となる。即ち、評価値算出法
を関数とみなすと、本算出法は、f(w,b,y,r,
G)と表すことができる。
wj (以下、これを iwj と記す)、単語列wi 〜wj
の属する文節列bg 〜bh (同様にg bh と記す)、各
単語の読みyi 〜yj (i yj )、係り受け構造K、及
び仮定モーラrである。仮定モーラrは、対象単語列が
何モーラであるかを仮定したもので、評価値sは、単語
列がrモーラであるとした場合の不一致を表す。例え
ば、表1の具体例のうち、『春風優しい』の部分が7モ
ーラであると仮定した場合の評価値の算出では、 w3 =春風, w4 =優しい y3 =はるかぜ, y4 =やさしい b2 =[w3 ], b3 =[w4 ] r=7 及び係り受け構造Kが入力となる。即ち、評価値算出法
を関数とみなすと、本算出法は、f(w,b,y,r,
G)と表すことができる。
【0031】ステップ31)まず、文リズムパターン判
定部3のモーラ数カウント部5は、単語列のモーラ数r
をカウントする。モーラは、母音と子音を一組とした単
位で「拍」ともいう。例えば、「コンピュータ」という
単語は、「/ko//n//pyu//u//ta//
a/」という音で表されるので、6モーラの単語であ
る。文字列が何モーラであるかは、その読みから算出可
能である。
定部3のモーラ数カウント部5は、単語列のモーラ数r
をカウントする。モーラは、母音と子音を一組とした単
位で「拍」ともいう。例えば、「コンピュータ」という
単語は、「/ko//n//pyu//u//ta//
a/」という音で表されるので、6モーラの単語であ
る。文字列が何モーラであるかは、その読みから算出可
能である。
【0032】まず、単語列 iwj の各単語の読み iyj
をつなげ、これを読みyとする。前記の例では、 y=“はるかぜやさしい” である。
をつなげ、これを読みyとする。前記の例では、 y=“はるかぜやさしい” である。
【0033】ステップ32)モーラ数カウント部5は、
読みyのモーラ数をカウントする。基本的には、読みの
1文字を1モーラとして数えるが、拗音文字の場合に
は、モーラとして数えない。これをmとする。前記の例
では、m=8である。
読みyのモーラ数をカウントする。基本的には、読みの
1文字を1モーラとして数えるが、拗音文字の場合に
は、モーラとして数えない。これをmとする。前記の例
では、m=8である。
【0034】ステップ33)モーラ数カウント部5は、
形態素解析部1からの単語境界、文節境界、読み等の情
報によりカウント値を調整する。モーラ数カウント部5
は、m>仮定モーラrで、しかも、読みyの最終文字が
“ん”であったら、mから1を引く。前記の例では、読
みの最後の文字は“い”であるので、ここでは、何もし
ない。
形態素解析部1からの単語境界、文節境界、読み等の情
報によりカウント値を調整する。モーラ数カウント部5
は、m>仮定モーラrで、しかも、読みyの最終文字が
“ん”であったら、mから1を引く。前記の例では、読
みの最後の文字は“い”であるので、ここでは、何もし
ない。
【0035】ステップ34)最後に、m=8で読みyの
第4モーラと第5モーラの間に単語境界が存在したら、
mを7に設定する。前記の例では、m=8であり、第4
モーラ“ぜ”と第5モーラ“や”の間に単語境界が存在
するので、m=7を代入する。最終的にステップ31〜
34の処理でm=7が得られる。
第4モーラと第5モーラの間に単語境界が存在したら、
mを7に設定する。前記の例では、m=8であり、第4
モーラ“ぜ”と第5モーラ“や”の間に単語境界が存在
するので、m=7を代入する。最終的にステップ31〜
34の処理でm=7が得られる。
【0036】ステップ35)次に、文節境界チェック部
6は文節境界との一致を調べる。即ち、単語列の最終単
語wj の後に文節境界が存在するかどうかを調べる(ス
テップ35)。
6は文節境界との一致を調べる。即ち、単語列の最終単
語wj の後に文節境界が存在するかどうかを調べる(ス
テップ35)。
【0037】ステップ36)存在しない場合は、文節境
界不一致数np に1を、句境界不一致数nd に1を代入
し、ステップ47に移行する。
界不一致数np に1を、句境界不一致数nd に1を代入
し、ステップ47に移行する。
【0038】ステップ37)存在する場合には、文節境
界不一致数np に0を代入する。
界不一致数np に0を代入する。
【0039】前記の例では、最終単語「やさしい」の後
に文節境界が存在するので、ステッップ36を実行し、
np =0が得られる。
に文節境界が存在するので、ステッップ36を実行し、
np =0が得られる。
【0040】ステップ38)文節境界チェック部6は、
文節列 gbh が係り受け木の一つの枝であるかどうかを
調べる。調査方法は、先頭文節から係り元及び係り先文
節を手繰り、その結果得られた文節集合が gbh に一致
するか否かで判断する。文節列が係り受け木の複数の枝
に跨がっている場合には、一致しないはずである。
文節列 gbh が係り受け木の一つの枝であるかどうかを
調べる。調査方法は、先頭文節から係り元及び係り先文
節を手繰り、その結果得られた文節集合が gbh に一致
するか否かで判断する。文節列が係り受け木の複数の枝
に跨がっている場合には、一致しないはずである。
【0041】文節境界チェック部6は、単語列 iwj の
属する文節を gbh とする。前記の例では、文節列 2b
3 が処理対象文節となる。
属する文節を gbh とする。前記の例では、文節列 2b
3 が処理対象文節となる。
【0042】ステップ39)同一枝文節集合Eと展開文
節集合Dを初期化し、同一枝文節集合E先頭文節b
g を、展開集合Dには、先頭文節bg の係り元文節bg
f のうち、文節列 gbh に含まれるものを設定する。前
記の例では、先頭文節はb2 であり、b2 の係り元文節
はb3 であるので、 E=[b2 ] D=[b3 ] となる。
節集合Dを初期化し、同一枝文節集合E先頭文節b
g を、展開集合Dには、先頭文節bg の係り元文節bg
f のうち、文節列 gbh に含まれるものを設定する。前
記の例では、先頭文節はb2 であり、b2 の係り元文節
はb3 であるので、 E=[b2 ] D=[b3 ] となる。
【0043】ステップ40)次に、展開文節集合Dが空
になるまで、以下の処理を繰り返す。
になるまで、以下の処理を繰り返す。
【0044】ステップ41)展開文節集合Dの一つの要
素をbとし、これをDから削除する。ここで、展開文節
集合Dの中には文節b3 しか存在しないので、b=b3
とし、これを展開文節集合Dから削除する。
素をbとし、これをDから削除する。ここで、展開文節
集合Dの中には文節b3 しか存在しないので、b=b3
とし、これを展開文節集合Dから削除する。
【0045】ステップ42)文節bを同一枝集合Eに追
加する。
加する。
【0046】ステップ43)最後に文節bの係り元文節
bb と、係り先文節bf のうち、文節列 gbh に含ま
れ、しかも、展開文節集合Dにも同一枝文節集合Eにも
属さない文節を展開文節集合Dに追加する。文節b3 の
係り元文節はb2 で、係り先文節は、b4 であるが、文
節b2 は、処理対象文節ではないので、結果的にはこの
ステップでは何もしない。
bb と、係り先文節bf のうち、文節列 gbh に含ま
れ、しかも、展開文節集合Dにも同一枝文節集合Eにも
属さない文節を展開文節集合Dに追加する。文節b3 の
係り元文節はb2 で、係り先文節は、b4 であるが、文
節b2 は、処理対象文節ではないので、結果的にはこの
ステップでは何もしない。
【0047】現時点での同一文節集合Eと展開枝文節集
合Dは、以下のとおりである。
合Dは、以下のとおりである。
【0048】E=[b2 ,b3 ] D=Φ この時点では、展開文節集合Dは、空であるので、ステ
ップ40からステップ44へと進む。
ップ40からステップ44へと進む。
【0049】ステップ44)同一枝文節集合Eが処理対
象文節 gbh に一致しているかどうかを調べる。一致し
ている場合には、ステップ45の処理に移行し、不一致
の場合には、ステップ46に移行する。
象文節 gbh に一致しているかどうかを調べる。一致し
ている場合には、ステップ45の処理に移行し、不一致
の場合には、ステップ46に移行する。
【0050】ステップ45)一致している場合には、句
境界不一致数nd に0を代入し、ステップ47に移行す
る。
境界不一致数nd に0を代入し、ステップ47に移行す
る。
【0051】ステップ46)不一致の場合には、句境界
不一致数nd を用いて評価値sを算出する。本実施例で
は、sを線形関数 s=α|m−r|+βnp +・γnd で算出することとし、 α=0.23 β=0.10 γ=0.24 とする。前記の例では、 m=7 r=7 np =0 nd =0 であるので、評価値s=0となる。
不一致数nd を用いて評価値sを算出する。本実施例で
は、sを線形関数 s=α|m−r|+βnp +・γnd で算出することとし、 α=0.23 β=0.10 γ=0.24 とする。前記の例では、 m=7 r=7 np =0 nd =0 であるので、評価値s=0となる。
【0052】また、前述の例のうち、『ロンドンの春
風』の部分が7モーラであると仮定した場合の評価値の
算出では、ステップ31〜34の処理でm=9が得ら
れ、ステップ35〜37の処理ではnp (文節境界不一
致数)=0が得られ、ステップ38〜46の処理でnd
(句境界不一致数)=1が得られるので、評価値sは
0.70となる。
風』の部分が7モーラであると仮定した場合の評価値の
算出では、ステップ31〜34の処理でm=9が得ら
れ、ステップ35〜37の処理ではnp (文節境界不一
致数)=0が得られ、ステップ38〜46の処理でnd
(句境界不一致数)=1が得られるので、評価値sは
0.70となる。
【0053】以下、図4に示す上記ステップ3を前記の
例に適用した場合の動作を図8、図9を用いて説明す
る。図8、図9は、本発明の一実施例の文リズムパター
ン判定部の動作を示すフローチャートである。
例に適用した場合の動作を図8、図9を用いて説明す
る。図8、図9は、本発明の一実施例の文リズムパター
ン判定部の動作を示すフローチャートである。
【0054】図7に示すステップ11〜16では、文リ
ズムパターン集合Cに初期値を設定する。文リズムパタ
ーン集合Cは、現在候補となっている文リズムパターン
の集合で、一要素は、リズムパターンで区切られた単語
列、リズムパターン及び評価値から成り立っている。即
ち、Cの一要素は、
ズムパターン集合Cに初期値を設定する。文リズムパタ
ーン集合Cは、現在候補となっている文リズムパターン
の集合で、一要素は、リズムパターンで区切られた単語
列、リズムパターン及び評価値から成り立っている。即
ち、Cの一要素は、
【0055】
【数1】
【0056】である。だたし、 xry は、単語列 xwy
のリズムパターンである。
のリズムパターンである。
【0057】ステップ11)初期化処理の最初として、
文リスムパターン集合Cを空集合と設定する。
文リスムパターン集合Cを空集合と設定する。
【0058】ステップ12)次に、カウンタiに1を設
定する。
定する。
【0059】ステップ13)それが、入力単語数nw に
達するまで、ステップ14、15を繰り返す。
達するまで、ステップ14、15を繰り返す。
【0060】ステップ14)単語列 1wi について、仮
定モーラが“5”である場合の評価値si =f
( 1wi ,b, 1yi ,5,g)を算出し、リズムパタ
ーン [ 1ri ]= [5] と共に文リズムパターン集合Cに追加する。
定モーラが“5”である場合の評価値si =f
( 1wi ,b, 1yi ,5,g)を算出し、リズムパタ
ーン [ 1ri ]= [5] と共に文リズムパターン集合Cに追加する。
【0061】ステップ15)仮定モーラ 1ri =7の場
合についてステップ14と同様の処理を行う。
合についてステップ14と同様の処理を行う。
【0062】ステップ16)上記の処理を入力単語数n
w に達するまで繰り返す。前記の例にステップ11〜1
6を適用した場合の文リズムパターン集合Cは、以下の
とおりである。
w に達するまで繰り返す。前記の例にステップ11〜1
6を適用した場合の文リズムパターン集合Cは、以下の
とおりである。
【0063】
【数2】
【0064】となる。
【0065】以下のステップ17〜25は、最適パター
ン探索部4においてリズムパターンの最適な組み合わせ
を探索する。
ン探索部4においてリズムパターンの最適な組み合わせ
を探索する。
【0066】(ステップ17)文リズムパターン集合C
から、評価値sの最も小さな要素cmin を取得する。前
記の例では、単語列[[ロンドン、の]]、リズムパタ
ーン[5]の要素の評価値sが0と小さいので、これを
cmin とし、ステップ18に移行する。最終評価値要素
cmin の最終単語をここでは、“wx ”とする。
から、評価値sの最も小さな要素cmin を取得する。前
記の例では、単語列[[ロンドン、の]]、リズムパタ
ーン[5]の要素の評価値sが0と小さいので、これを
cmin とし、ステップ18に移行する。最終評価値要素
cmin の最終単語をここでは、“wx ”とする。
【0067】(ステップ18)次に、最小評価値要素c
min の評価値sが閾値δ値を越えているかどうかを調査
する。本実施例では、閾値δを0.4とする。もし、評
価値sが閾値δを越えていたら、ステップ27に移行す
る。また、評価値sが閾値δを越えていなければ、ステ
ップ19移行の処理を実行する。前記の例では、s=0
≦δであるので、ステップ19の処理に移行する。
min の評価値sが閾値δ値を越えているかどうかを調査
する。本実施例では、閾値δを0.4とする。もし、評
価値sが閾値δを越えていたら、ステップ27に移行す
る。また、評価値sが閾値δを越えていなければ、ステ
ップ19移行の処理を実行する。前記の例では、s=0
≦δであるので、ステップ19の処理に移行する。
【0068】(ステップ19)最小評価値要素cmin が
文の最後まで到達したかどうかを調べ、到達した場合に
は、ステップ26に移行し、到達していない場合にはス
テップ20に移行する。
文の最後まで到達したかどうかを調べ、到達した場合に
は、ステップ26に移行し、到達していない場合にはス
テップ20に移行する。
【0069】現時点では、最小評価値要素cmin は、文
の終わりに達していないため、ステップ20に移行す
る。
の終わりに達していないため、ステップ20に移行す
る。
【0070】(ステップ20)最小評価値要素cmin を
文リズムパターン集合Cから削除する。
文リズムパターン集合Cから削除する。
【0071】ステップ21〜25では、最小評価値要素
cmin と残りの単語列 x+1wn に対して、新たなリズム
パターンとその評価値を算出し、文リズムパターン集合
Cに追加する。
cmin と残りの単語列 x+1wn に対して、新たなリズム
パターンとその評価値を算出し、文リズムパターン集合
Cに追加する。
【0072】(ステップ21)まず、カウンタjにx+
1を代入する。
1を代入する。
【0073】(ステップ22)カウンタjが単語数nw
以下の間、ステップ23と24の処理を繰り返す。
以下の間、ステップ23と24の処理を繰り返す。
【0074】(ステップ23)最小評価値要素cmin の
単語列に x+1wj を加えたものと、仮定モーラr=5を
リズムパターンとして加えたものと、最小評価値要素c
mi n の評価値smin に x+1wj の評価値f( x+1wj ,
bx+1 yj ,r,g)を加えたものを文リズムパターン
集合Cに追加する。
単語列に x+1wj を加えたものと、仮定モーラr=5を
リズムパターンとして加えたものと、最小評価値要素c
mi n の評価値smin に x+1wj の評価値f( x+1wj ,
bx+1 yj ,r,g)を加えたものを文リズムパターン
集合Cに追加する。
【0075】(ステップ24)仮定モーラをr=7とし
て、ステップ23と同様の処理を行う。
て、ステップ23と同様の処理を行う。
【0076】(ステップ25)jが単語数nw 以下の
間、ステップ23と24の処理を繰り返す。
間、ステップ23と24の処理を繰り返す。
【0077】本実施例の前述の例の場合、ステップ21
〜25の処理で新たに文リズムパターン集合Cに加えら
れる要素は以下の6つである。 ・[[[ロンドン、の、春風]], [5,5 ],1.16 ] (m4,r=5,np =0,nd =0) ・[[[ロンドン、の、春風]], [5,7 ],0.70 ] (m4,r=7,np =0,nd =0) ・[[[ロンドン、の、春風、優しい]], [5,5 ],
2.08 ] (m7,r=5,np =0,nd =0) ・[[[ロンドン、の、春風、優しい]], [5,7 ],
1.62 ] (m7,r=7,np =0,nd =0) ・[[[ロンドン、の、春風、優しい、博物館]],
[5,5 ],2.99 ] (m=12,r=5,np =0,nd =0) ・[[[ロンドン、の、春風、優しい、博物館]],
[5,7 ],2.53 ] (m=12,r=7,np =0,nd =0) 次に、再びステップ17にもどり、文リズムパターン集
合Cから最小評価値要素cmin を選択する。現時点で
は、単語列[[ロンドン, の],[春風, 優しい]、リ
ズムパターン[5, 7]の要素が最小評価値0を持つ。
この要素は、評価値s=0≦閾値δであり、かつ文の終
端に達していないため、ステップ20〜25の処理を実
行する。その結果、新たに文リズムパターン集合Cに加
えられる要素は、以下の2つである。 ・[[[ロンドン,の],[春風、優しい], [博物
館]],[5,7,5 ],0] (m=5,r=5,np =0,nd =0) ・[[[ロンドン,の],[春風、優しい],[博物
館]],[5,7,7 ],0.23 ] (m=6,r=7,np =0,nd =0) ここで、再びステップ17に戻り、文リズムパターン集
合Cから、最小評価値要素cmin を選択する。現時点で
は、単語列[[ロンドン,の],[春風、優しい],
[博物館]]、リズムパターン[5,7,5]が最小評
価値0を持つ。これは、評価値s=0≦閾値δである
が、文の終端に達しているため、ステップ26の処理に
移行する。
〜25の処理で新たに文リズムパターン集合Cに加えら
れる要素は以下の6つである。 ・[[[ロンドン、の、春風]], [5,5 ],1.16 ] (m4,r=5,np =0,nd =0) ・[[[ロンドン、の、春風]], [5,7 ],0.70 ] (m4,r=7,np =0,nd =0) ・[[[ロンドン、の、春風、優しい]], [5,5 ],
2.08 ] (m7,r=5,np =0,nd =0) ・[[[ロンドン、の、春風、優しい]], [5,7 ],
1.62 ] (m7,r=7,np =0,nd =0) ・[[[ロンドン、の、春風、優しい、博物館]],
[5,5 ],2.99 ] (m=12,r=5,np =0,nd =0) ・[[[ロンドン、の、春風、優しい、博物館]],
[5,7 ],2.53 ] (m=12,r=7,np =0,nd =0) 次に、再びステップ17にもどり、文リズムパターン集
合Cから最小評価値要素cmin を選択する。現時点で
は、単語列[[ロンドン, の],[春風, 優しい]、リ
ズムパターン[5, 7]の要素が最小評価値0を持つ。
この要素は、評価値s=0≦閾値δであり、かつ文の終
端に達していないため、ステップ20〜25の処理を実
行する。その結果、新たに文リズムパターン集合Cに加
えられる要素は、以下の2つである。 ・[[[ロンドン,の],[春風、優しい], [博物
館]],[5,7,5 ],0] (m=5,r=5,np =0,nd =0) ・[[[ロンドン,の],[春風、優しい],[博物
館]],[5,7,7 ],0.23 ] (m=6,r=7,np =0,nd =0) ここで、再びステップ17に戻り、文リズムパターン集
合Cから、最小評価値要素cmin を選択する。現時点で
は、単語列[[ロンドン,の],[春風、優しい],
[博物館]]、リズムパターン[5,7,5]が最小評
価値0を持つ。これは、評価値s=0≦閾値δである
が、文の終端に達しているため、ステップ26の処理に
移行する。
【0078】(ステップ26)最小評価値要素cmin の
リズムパターンを文リズムパターンとして出力する。即
ち、前述の例では、自然言語文解析装置200の出力と
して、 リズムパターン:[5,7,5] が得られる。
リズムパターンを文リズムパターンとして出力する。即
ち、前述の例では、自然言語文解析装置200の出力と
して、 リズムパターン:[5,7,5] が得られる。
【0079】(ステップ27)ステップ18において、
評価値sが閾値δを越えていたら、“リズムパターン=
不明”を出力する。
評価値sが閾値δを越えていたら、“リズムパターン=
不明”を出力する。
【0080】《第2の実施例:文リズムパターン選択装
置》次に、本発明の第2の実施例として、文リズムパタ
ーン選択装置について説明する。文リズムパターン選択
装置は、ここでは、文リズムパターンとして七五調のリ
ズムパターンを有する文を選択するものとして説明す
る。
置》次に、本発明の第2の実施例として、文リズムパタ
ーン選択装置について説明する。文リズムパターン選択
装置は、ここでは、文リズムパターンとして七五調のリ
ズムパターンを有する文を選択するものとして説明す
る。
【0081】図10は、本発明の第2の実施例の文リズ
ムパターン選択装置のブロック図である。
ムパターン選択装置のブロック図である。
【0082】同図において、図3の自然語文解析装置と
同一構成部分には同一符号を付し、その説明を省略す
る。
同一構成部分には同一符号を付し、その説明を省略す
る。
【0083】図10に示す文リズムパターン選択装置
は、第1の実施例の自然語文解析装置200の構成に詩
歌種別判定部8を付加した構成である。従って、図11
に示す動作のフローチャートからもわかるように、点線
で囲まれたaの部分は自然語文解析装置300の動作で
あり、文リズムパターン選択装置300は、自然語文解
析装置300から出力された文リズムパターンを用いて
詩歌種別を判定する。
は、第1の実施例の自然語文解析装置200の構成に詩
歌種別判定部8を付加した構成である。従って、図11
に示す動作のフローチャートからもわかるように、点線
で囲まれたaの部分は自然語文解析装置300の動作で
あり、文リズムパターン選択装置300は、自然語文解
析装置300から出力された文リズムパターンを用いて
詩歌種別を判定する。
【0084】図12は、本発明の第2の実施例の文リズ
ムパターン選択装置の解析動作を示すフローチャートで
ある。
ムパターン選択装置の解析動作を示すフローチャートで
ある。
【0085】ステップ51〜54では、それぞれ、俳句
・川柳・短歌・施頭歌、長唄のリズムパターンであるか
どうかを調べる。もし、どれかのステップに合致した
ら、その詩歌種別を詩歌種別判定装置の出力とし(ステ
ップ55〜58)、どれにもあてはまらない場合には、
詩歌種別を通常文とする(ステップ59)。以下に示す
具体例では、リズムパターン[5,7,5]がステップ
51に合致するので、詩歌種別を俳句・川柳として出力
する。
・川柳・短歌・施頭歌、長唄のリズムパターンであるか
どうかを調べる。もし、どれかのステップに合致した
ら、その詩歌種別を詩歌種別判定装置の出力とし(ステ
ップ55〜58)、どれにもあてはまらない場合には、
詩歌種別を通常文とする(ステップ59)。以下に示す
具体例では、リズムパターン[5,7,5]がステップ
51に合致するので、詩歌種別を俳句・川柳として出力
する。
【0086】以下に、図11及び図12のフローチャー
トに基づいて具体例を説明する。『ロンドン橋がテムズ
河に落ちた』という文を具体例として、文リズムパター
ン及び詩歌種別を判定する手順を説明する。
トに基づいて具体例を説明する。『ロンドン橋がテムズ
河に落ちた』という文を具体例として、文リズムパター
ン及び詩歌種別を判定する手順を説明する。
【0087】ステップ1)まず、上記の例の形態素解析
を行う。『ロンドン橋がテムズ河に落ちた』について形
態素解析の結果として、
を行う。『ロンドン橋がテムズ河に落ちた』について形
態素解析の結果として、
【0088】
【表3】
【0089】が、得られる。
【0090】ステップ2)次に係り受け解析を行う。係
り受け木は図13に示される結果となるが、係り受け構
造として表すと、
り受け木は図13に示される結果となるが、係り受け構
造として表すと、
【0091】
【数3】
【0092】となる。但し、文節1は「ロンドン橋
が」、文節2は「テムズ河に」、文節3は、「落ちた」
の文節を意味する。
が」、文節2は「テムズ河に」、文節3は、「落ちた」
の文節を意味する。
【0093】ステップ3)次に、単語及び文節境界、各
単語の読み、係り受け構造を元に、文のリズムパターン
を判定する。
単語の読み、係り受け構造を元に、文のリズムパターン
を判定する。
【0094】ステップ4)まず、文リズムパターン集合
Cに初期値をセットする。初期値のセットについては、
第1の実施例の図8のフローチャートと同様であるの
で、詳細な説明は省略する。
Cに初期値をセットする。初期値のセットについては、
第1の実施例の図8のフローチャートと同様であるの
で、詳細な説明は省略する。
【0095】ここで、文リズムパターン集合Cの初期値
は以下のように設定される。
は以下のように設定される。
【0096】
【数4】
【0097】以下の処理は、図9に示す第1の実施例の
フローチャートに基づいて説明する。
フローチャートに基づいて説明する。
【0098】(ステップ17(図9))文リズム集合パ
ターンCから最小評価値要素cmi n を取得する。現時点
でcmin は、単語列[[ロンドン橋、が]]、リズムパ
ターン[7]が最小評価値s=0を持つ。
ターンCから最小評価値要素cmi n を取得する。現時点
でcmin は、単語列[[ロンドン橋、が]]、リズムパ
ターン[7]が最小評価値s=0を持つ。
【0099】(ステップ18)この最小評価値sは、閾
値δ以下であるので、ステップ19に移行し、また、s
≦δである場合には、ステップ27に移行する。
値δ以下であるので、ステップ19に移行し、また、s
≦δである場合には、ステップ27に移行する。
【0100】(ステップ19)ステップ18において、
s≦δであるので、ステップ20以下の処理を行う。
s≦δであるので、ステップ20以下の処理を行う。
【0101】ステップ20〜25の処理で、残りの単語
に関して処理を行うと、文リズムパターン集合Cに新た
に追加される要素は以下の8つである。 [[[ロンドン橋、が]], [テムズ河], [7,5 ],
0.34 ] (m=5,r=5,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河], [7,7 ],
0.80 ] (m=5,r=7,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河,に]], [7,
5 ],0.47 ] (m=6,r=5,np =0,nd =1) [[[ロンドン橋、が]], [テムズ河,に]], [7,
7 ],0.47 ] (m=6,r=7,np =0,nd =1) [[[ロンドン橋、が]], [テムズ河,に,落
ち]], [7,5 ],1.03 ] (m=8,r=5,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河,に,落
ち]], [7,7 ],0.57 ] (m=8,r=7,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河,に,落ち,
た]],[7,5 ],0.92 ] (m=9,r=5,np =0,nd =0) [[[ロンドン橋、が]], [テムズ河,に,落ち,
た]],[7,7 ],0.46 ] (m=9,r=7,np =0,nd =0) 再び、ステップ17に戻って最小評価値要素cmin を取
得すると、単語列 [[ロンドン橋, が], [テムズ河]] 及びリズムパターン[7,5 ]の要素が最小評価値s=
0.34を持つ。この要素は、閾値δ以下で、文の終端
まで達していないため、再び、ステップ20〜ステップ
25を実行する。この処理で新たに文リズムパターン集
合Cに追加されるのは、以下の6つである。 [[[ロンドン橋、が]], [テムズ河], [に]],
[7,5,5 ],1.26 ] (m=1,r=5,np =0,nd =0) [[[ロンドン橋、が]], [テムズ河], [に]],
[7,5,7 ],1.72 ] (m=1,r=7,np =0,nd =0) [[[ロンドン橋、が]], [テムズ河],[に,落
ち]],[7,5,5 ],1.04 ] (m=3,r=5,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河],[に,落
ち]],[7,5,7 ],1.60 ] (m=3,r=7,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河],[に,落
ち,た]],[7,5,5 ],0.57 ] (m=9,r=5,np =0,nd =0) [[[ロンドン橋、が]], [テムズ河],[に,落
ち,た]],[7,5,7 ],1.03 ] (m=4,r=7,np =0,nd =0) 上記の処理を入力単語数nw が無くなるまでステップ1
7に戻り、上記の処理を繰り返す。ここで、再び、ステ
ップ17の処理に戻ると、今度は、単語列[[ロンドン
橋、が]] 、リズムパターン[5]が最小評価値s=
0.46を持つ要素cmin として取得される。しかし、
これは、閾値δを越えているため、ステップ27に移行
する。
に関して処理を行うと、文リズムパターン集合Cに新た
に追加される要素は以下の8つである。 [[[ロンドン橋、が]], [テムズ河], [7,5 ],
0.34 ] (m=5,r=5,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河], [7,7 ],
0.80 ] (m=5,r=7,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河,に]], [7,
5 ],0.47 ] (m=6,r=5,np =0,nd =1) [[[ロンドン橋、が]], [テムズ河,に]], [7,
7 ],0.47 ] (m=6,r=7,np =0,nd =1) [[[ロンドン橋、が]], [テムズ河,に,落
ち]], [7,5 ],1.03 ] (m=8,r=5,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河,に,落
ち]], [7,7 ],0.57 ] (m=8,r=7,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河,に,落ち,
た]],[7,5 ],0.92 ] (m=9,r=5,np =0,nd =0) [[[ロンドン橋、が]], [テムズ河,に,落ち,
た]],[7,7 ],0.46 ] (m=9,r=7,np =0,nd =0) 再び、ステップ17に戻って最小評価値要素cmin を取
得すると、単語列 [[ロンドン橋, が], [テムズ河]] 及びリズムパターン[7,5 ]の要素が最小評価値s=
0.34を持つ。この要素は、閾値δ以下で、文の終端
まで達していないため、再び、ステップ20〜ステップ
25を実行する。この処理で新たに文リズムパターン集
合Cに追加されるのは、以下の6つである。 [[[ロンドン橋、が]], [テムズ河], [に]],
[7,5,5 ],1.26 ] (m=1,r=5,np =0,nd =0) [[[ロンドン橋、が]], [テムズ河], [に]],
[7,5,7 ],1.72 ] (m=1,r=7,np =0,nd =0) [[[ロンドン橋、が]], [テムズ河],[に,落
ち]],[7,5,5 ],1.04 ] (m=3,r=5,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河],[に,落
ち]],[7,5,7 ],1.60 ] (m=3,r=7,np =1,nd =1) [[[ロンドン橋、が]], [テムズ河],[に,落
ち,た]],[7,5,5 ],0.57 ] (m=9,r=5,np =0,nd =0) [[[ロンドン橋、が]], [テムズ河],[に,落
ち,た]],[7,5,7 ],1.03 ] (m=4,r=7,np =0,nd =0) 上記の処理を入力単語数nw が無くなるまでステップ1
7に戻り、上記の処理を繰り返す。ここで、再び、ステ
ップ17の処理に戻ると、今度は、単語列[[ロンドン
橋、が]] 、リズムパターン[5]が最小評価値s=
0.46を持つ要素cmin として取得される。しかし、
これは、閾値δを越えているため、ステップ27に移行
する。
【0102】(ステップ27)文リズムパターンの判定
装置の出力として『リズムパターン:不明』を出力す
る。
装置の出力として『リズムパターン:不明』を出力す
る。
【0103】ステップ4)詩歌種別判定部8は、上記の
ステップ26で出力された文リズムパターンより詩歌種
別を判定する。上記の具体例では、文リズムパターンは
不明であるので、図12に示すフローチャートのステッ
プ51〜54のいずれにも合致しないため、判定結果を
『詩歌種別:通常文』を出力する。
ステップ26で出力された文リズムパターンより詩歌種
別を判定する。上記の具体例では、文リズムパターンは
不明であるので、図12に示すフローチャートのステッ
プ51〜54のいずれにも合致しないため、判定結果を
『詩歌種別:通常文』を出力する。
【0104】なお、ステップ26において、リズムパタ
ーンが[5,7,5]が出力された場合には、詩歌種別
判定部8は、判定結果を『詩歌種別:俳句・川柳』とし
て出力する(ステップ55)。また、リズムパターンが
[5,7,5,7,7]が出力された場合には、判定結
果を『詩歌種別:短歌』とし、さらに、リズムパターン
が[5,7,7,5,7,7]が出力された場合には、
判定結果を『詩歌種別:施頭歌』とし、リズムパターン
[5,7,5,7,…,7,7]が出力された場合に
は、判定結果を『長歌』とする。それ以外の場合には、
上記ステップ27に示したように、『詩歌種別:通常
文』を出力する。
ーンが[5,7,5]が出力された場合には、詩歌種別
判定部8は、判定結果を『詩歌種別:俳句・川柳』とし
て出力する(ステップ55)。また、リズムパターンが
[5,7,5,7,7]が出力された場合には、判定結
果を『詩歌種別:短歌』とし、さらに、リズムパターン
が[5,7,7,5,7,7]が出力された場合には、
判定結果を『詩歌種別:施頭歌』とし、リズムパターン
[5,7,5,7,…,7,7]が出力された場合に
は、判定結果を『長歌』とする。それ以外の場合には、
上記ステップ27に示したように、『詩歌種別:通常
文』を出力する。
【0105】なお、上記の実施例では、この文リズムパ
ターン選択装置で選択される文を七五調の文として説明
したが、当該装置の詩歌種別判定部8を他の文種別の判
定部に種々変更が可能である。
ターン選択装置で選択される文を七五調の文として説明
したが、当該装置の詩歌種別判定部8を他の文種別の判
定部に種々変更が可能である。
【0106】《第3の実施例:文生成装置》次に本発明
の第3の実施例として、文生成装置について説明する。
の第3の実施例として、文生成装置について説明する。
【0107】本実施例は、文生成装置が七五調の文を生
成する場合について説明する。図14は、本発明の第3
の実施例の文生成装置の構成を示す。
成する場合について説明する。図14は、本発明の第3
の実施例の文生成装置の構成を示す。
【0108】同図に示す構成は、オペレータからの入力
等により修正されることが前提となる初期の文(草稿)
が作成される初期生成部410、初期生成部410で生
成された文について、本例では七五調であるかを判定す
るための評価部420、評価部420で七五調ではない
と判定された場合に、入力された文が七五調になるよう
に修正するための規則を修正規則460より選択する修
正手続選択部440、修正手続選択部440で選択され
た修正規則460に従って初期生成部410で生成され
た文を言語知識470、七五調規則480に従って修正
する表出部450、評価部420で七五調文であると判
断された文を出力する文出力部480より構成される。
等により修正されることが前提となる初期の文(草稿)
が作成される初期生成部410、初期生成部410で生
成された文について、本例では七五調であるかを判定す
るための評価部420、評価部420で七五調ではない
と判定された場合に、入力された文が七五調になるよう
に修正するための規則を修正規則460より選択する修
正手続選択部440、修正手続選択部440で選択され
た修正規則460に従って初期生成部410で生成され
た文を言語知識470、七五調規則480に従って修正
する表出部450、評価部420で七五調文であると判
断された文を出力する文出力部480より構成される。
【0109】評価部420は、前記第2の実施例の文リ
ズムパターン選択装置の構成と同様の構成であり、形態
素解析部1、係り受け解析部2、最適パターン探索部
4、モーラ数カウント部5、文節境界チェック部6、句
境界チェック部7を有する文リズムパターン判定部3及
び詩歌種別判定部8より構成される。従って、本実施例
の文生成装置の評価部420は、上記第1及び第2実施
例と同様の動作を行う。
ズムパターン選択装置の構成と同様の構成であり、形態
素解析部1、係り受け解析部2、最適パターン探索部
4、モーラ数カウント部5、文節境界チェック部6、句
境界チェック部7を有する文リズムパターン判定部3及
び詩歌種別判定部8より構成される。従って、本実施例
の文生成装置の評価部420は、上記第1及び第2実施
例と同様の動作を行う。
【0110】例えば、初期生成部410において、『ロ
ンドンの春風優しい博物館』が入力された場合に、評価
部420の最適パターン探索部4において、文のリズム
パターンが[5,7,5]出力され、詩歌種別判定部8
において、この文リズムパターンより七五調文であると
判定される。この場合には、詩歌種別判定部8の結果で
は、図12に示すリズムパターン[5,7,5]に合致
するため、詩歌種別が“俳句・川柳”と判定される。こ
れにより、表出部450では修正する必要がないため、
そのまま文出力部480に出力される。
ンドンの春風優しい博物館』が入力された場合に、評価
部420の最適パターン探索部4において、文のリズム
パターンが[5,7,5]出力され、詩歌種別判定部8
において、この文リズムパターンより七五調文であると
判定される。この場合には、詩歌種別判定部8の結果で
は、図12に示すリズムパターン[5,7,5]に合致
するため、詩歌種別が“俳句・川柳”と判定される。こ
れにより、表出部450では修正する必要がないため、
そのまま文出力部480に出力される。
【0111】また、『ロンドン橋がテムズ河に落ちた』
が初期生成部410で生成された場合は、評価部420
の最適パターン探索部4は、閾値δ=0.4とした場合
に、まず、単語列[[ロンドン橋, が]、リズムパター
ン[5]が最小評価値s=0.46を持つ要素cmin と
して取得されるが、これは、閾値δ(0.4)を越えて
いるため、文リズムパターン判定部3の判定結果は、
『リズムパターン:不明』を詩歌種別判定部8に出力す
る。次に、詩歌種別判定部8は、図12に示すフローチ
ャートに関して該当するものがないため、判定結果とし
て“詩歌種別;通常文”が出力される。評価部420の
判定結果は、七五調の文ではないため、この文を修正手
続選択部440に送る。
が初期生成部410で生成された場合は、評価部420
の最適パターン探索部4は、閾値δ=0.4とした場合
に、まず、単語列[[ロンドン橋, が]、リズムパター
ン[5]が最小評価値s=0.46を持つ要素cmin と
して取得されるが、これは、閾値δ(0.4)を越えて
いるため、文リズムパターン判定部3の判定結果は、
『リズムパターン:不明』を詩歌種別判定部8に出力す
る。次に、詩歌種別判定部8は、図12に示すフローチ
ャートに関して該当するものがないため、判定結果とし
て“詩歌種別;通常文”が出力される。評価部420の
判定結果は、七五調の文ではないため、この文を修正手
続選択部440に送る。
【0112】修正手続選択部440は、修正規則460
から当該文を七五調に変えるための規則を選択する。例
えば、入力された文を形態素解析し、単語毎に分割し
て、分割された単語の順序を変える等の規則を選択す
る。選択された規則を表出部450に渡す。
から当該文を七五調に変えるための規則を選択する。例
えば、入力された文を形態素解析し、単語毎に分割し
て、分割された単語の順序を変える等の規則を選択す
る。選択された規則を表出部450に渡す。
【0113】表出部450は、修正手続選択部440で
選択された規則に従って、言語知識よりモーラ数が不足
する場合には適切な語を補うか、削除し、規則に合致す
るように変更する。さらに必要であれば係り受け等の修
正を行い、さらに、修正された文が七五調規則480に
沿っているかを判断し、例えば、『ドッポンとロンドン
橋が落ちました』という文に修正し、評価部420に入
力する。
選択された規則に従って、言語知識よりモーラ数が不足
する場合には適切な語を補うか、削除し、規則に合致す
るように変更する。さらに必要であれば係り受け等の修
正を行い、さらに、修正された文が七五調規則480に
沿っているかを判断し、例えば、『ドッポンとロンドン
橋が落ちました』という文に修正し、評価部420に入
力する。
【0114】評価部420は、表出部450で修正され
た『ドッポンとロンドン橋が落ちました』について、上
記と同様の処理により七五調であるかの評価を行い、七
五調であれば文出力部430に出力する。
た『ドッポンとロンドン橋が落ちました』について、上
記と同様の処理により七五調であるかの評価を行い、七
五調であれば文出力部430に出力する。
【0115】なお、初期生成部410、修正手続選択部
440及び表出部450の詳しい動作等については、文
献『人工知能学会誌、Vol.8,No5,pp.639〜648 “文章生
成における推敲機能の実現について”1993年9月』を参
照されたい。
440及び表出部450の詳しい動作等については、文
献『人工知能学会誌、Vol.8,No5,pp.639〜648 “文章生
成における推敲機能の実現について”1993年9月』を参
照されたい。
【0116】このように、文生成装置400の評価部4
20に自然語文解析装置、文リズムパターン選択装置を
組み込むことにより、俳句、短歌等の七五調文を生成す
ることができる。
20に自然語文解析装置、文リズムパターン選択装置を
組み込むことにより、俳句、短歌等の七五調文を生成す
ることができる。
【0117】なお、上記の文生成装置400では、評価
部420で用いる文リズムパターンとして七五調を用い
たが、上記の実施例に限定されることなく、他の文リズ
ムパターンであってもよく、生成したい文の種類により
種々文リズムパターンの選択が可能である。
部420で用いる文リズムパターンとして七五調を用い
たが、上記の実施例に限定されることなく、他の文リズ
ムパターンであってもよく、生成したい文の種類により
種々文リズムパターンの選択が可能である。
【0118】
【発明の効果】上述のように本発明による自然語文解析
装置によれば、文のリズムパターンが判別することがで
きる。このリズムパターンから例えば七五調のリズムパ
ターンを持つ文を選択することができ、これを文生成装
置に適応することにより、当該文生成装置では、七五調
の文を生成することができる。
装置によれば、文のリズムパターンが判別することがで
きる。このリズムパターンから例えば七五調のリズムパ
ターンを持つ文を選択することができ、これを文生成装
置に適応することにより、当該文生成装置では、七五調
の文を生成することができる。
【0119】なお、本発明の文リズムパターン選択装置
において、リズムパターンを七五調とすることで自然語
文解析装置の出力である解析結果により、七五調文であ
ると判定した文のみを七五調文データベースに登録する
ことも可能である。
において、リズムパターンを七五調とすることで自然語
文解析装置の出力である解析結果により、七五調文であ
ると判定した文のみを七五調文データベースに登録する
ことも可能である。
【0120】このように、文のリズムパターンを得るこ
とにより所望のリズムパターンで構成される文の判別及
び生成が種々可能である。
とにより所望のリズムパターンで構成される文の判別及
び生成が種々可能である。
【図1】本発明の原理構成図(その1)である。
【図2】本発明の原理構成図(その2)である。
【図3】本発明の第1の実施例の自然言語解析装置のブ
ロック図である。
ロック図である。
【図4】本発明の第1の実施例の自然言語解析装置の動
作を示すフローチャートである。
作を示すフローチャートである。
【図5】本発明の第1の実施例の係り受け木を示す図で
ある。
ある。
【図6】本発明の第1の実施例の文リズムパターン判定
部の最適パターン探索部で行われる評価値算出方法を示
すフローチャート(その1)である。
部の最適パターン探索部で行われる評価値算出方法を示
すフローチャート(その1)である。
【図7】本発明の第1の実施例の文リズムパターン判定
部の最適パターン探索部で行われる評価値算出方法を示
すフローチャート(その2)である。
部の最適パターン探索部で行われる評価値算出方法を示
すフローチャート(その2)である。
【図8】本発明の第1の実施例の文リズムパターン判定
部の動作を示すフローチャート(その1)である。
部の動作を示すフローチャート(その1)である。
【図9】本発明の第1の実施例の文リズムパターン判定
部の動作を示すフローチャート(その2)である。
部の動作を示すフローチャート(その2)である。
【図10】本発明の第2の実施例の文リズムパターン選
択装置のブロック図である。
択装置のブロック図である。
【図11】本発明の第2の実施例の文リズムパターン選
択装置の動作を示すフローチャートである。
択装置の動作を示すフローチャートである。
【図12】本発明の第2の実施例の文リズムパターン選
択装置の解析動作を示すフローチャートである。
択装置の解析動作を示すフローチャートである。
【図13】本発明の第2の実施例の係り受け木を示す図
である。
である。
【図14】本発明の第3の実施例の文生成装置の構成図
である。
である。
【図15】従来の文生成装置の構成例を示す図である。
1 形態素解析部 2 係り受け解析部 3 文リズムパターン判定部 4 最適パターン探索部 5 モーラ数カウント部 6 文節境界チェック部 7 句境界チェック部 8 詩歌種別判定部 11 初期生成部 12 評価部 13 修正部 14 表出部 200 自然語文解析装置 201 形態素解析手段 202 係り受け解析手段 203 モーラ数カウント手段 204 文節境界チェック手段 205 句境界チェック手段 206 リズムパターン決定手段 300 文リズムパターン選択装置 301 リズム選択手段 400 文生成装置 410 初期生成手段、初期生成部 420 評価手段、評価部 430 出力手段、文出力部 440 修正手続選択手段、修正手続選択部 450 表出手段、表出部 460 修正規則 470 言語知識 480 七五調規則
Claims (5)
- 【請求項1】 入力された文について形態素解析し、該
文を単語及び文節単位に分割し、該各単語に読みを付与
する形態素解析手段と、 該形態素解析された各文節の係り受け関係を決定する係
り受け解析手段と、 単語列のモーラ数を数えるモーラ数カウント手段と、 該単語列の最後尾が文節境界と一致しているかどうかを
調査する文節境界チェック手段と、 該単語列が係り受け木の複数の枝に跨がっているかどう
かを判断する句境界チェック手段と、 該モーラ数カウント手段、該文節境界チェック手段及び
句境界チェック手段の各結果に基づいて該文の文リズム
パターンを決定するリズムパターン決定手段とを有する
ことを特徴とする自然語文解析装置。 - 【請求項2】 入力された文について形態素解析し、該
文を単語及び文節単位に分割し、該各単語に読みを付与
する形態素解析手段と、 該形態素解析された各文節の係り受け関係を決定する係
り受け解析手段と、 単語列のモーラ数を数えるモーラ数カウント手段と、 該単語列の最後尾が文節境界と一致しているかどうかを
調査する文節境界チェック手段と、 該単語列が係り受け木の複数の枝に跨がっているかどう
かを判断する句境界チェック手段と、 該モーラ数カウント手段、該文節境界チェック手段及び
句境界チェック手段の各結果に基づいて、該文の文リズ
ムパターンを決定するリズムパターン決定手段と、 該リズムパターン決定手段で決定された文リズムパター
ンから所定のリズムパターンを有する文を選択するリズ
ム選択手段とを有することを特徴とする文リズムパター
ン選択装置。 - 【請求項3】 前記リズム判定手段は、文リズムパター
ンが七五調である文を判定する七五調種別判定手段を含
む請求項2記載の文リズムパターン選択装置。 - 【請求項4】 言語知識と言語選択ルールに基づいて語
選択を行うことにより初期文を生成する初期生成部と、 生成された文又は修正された文の文リズムパターンに基
づいて該文が所定の文リズムパターンであるか否かを判
定する評価手段と、 該評価手段により所定の文のリズムであると判断された
場合に該文を出力する出力手段と、 該評価手段により所定の文のリズムではないと判断され
た場合に、文の修正規則の中から文を所定のリズムにな
るように修正するために最も優先度の高い修正規則を選
択する修正手続選択手段と、 該修正手続選択手段により選択された該修正規則に従っ
て該評価手段において所定のリズム以外の文であると判
断された文を、所定のリズムの文になるように書き換
え、該評価手段に転送する表出手段とを有することを特
徴とする文生成装置。 - 【請求項5】 前記評価手段は、 前記初期生成手段により生成された文について形態素解
析し、該文を単語及び文節単位に分割し、該各単語に読
みを付与する形態素解析手段と、 該形態素解析された各文節の係り受け関係を決定する係
り受け解析手段と、 単語列のモーラ数を数えるモーラ数カウント手段と、 該単語列の最後尾が文節境界と一致しているかどうかを
調査する文節境界チェック手段と、 該単語列が係り受け木の複数の枝に跨がっているかどう
かを判断する句境界チェック手段と、 該モーラ数カウント手段、該文節境界チェック手段呼び
句境界チェック手段の各結果に基づいて該文の文リズム
パターンを決定するリズムパターン決定手段と、 該リズムパターン決定手段で決定された文リズムパター
ンから所定のリズムパターンを有する文を選択するリズ
ム選択手段とを有する請求項4記載の文生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30436193A JP3341176B2 (ja) | 1993-12-03 | 1993-12-03 | 自然語文解析装置、文リズムパターン選択装置及び文生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30436193A JP3341176B2 (ja) | 1993-12-03 | 1993-12-03 | 自然語文解析装置、文リズムパターン選択装置及び文生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07160709A true JPH07160709A (ja) | 1995-06-23 |
JP3341176B2 JP3341176B2 (ja) | 2002-11-05 |
Family
ID=17932099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30436193A Expired - Fee Related JP3341176B2 (ja) | 1993-12-03 | 1993-12-03 | 自然語文解析装置、文リズムパターン選択装置及び文生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3341176B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019044534A1 (ja) * | 2017-08-31 | 2019-03-07 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
JP2019159780A (ja) * | 2018-03-13 | 2019-09-19 | 富士通株式会社 | 判定プログラム、判定装置、及び判定方法 |
-
1993
- 1993-12-03 JP JP30436193A patent/JP3341176B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019044534A1 (ja) * | 2017-08-31 | 2019-03-07 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
JPWO2019044534A1 (ja) * | 2017-08-31 | 2020-11-19 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
JP2019159780A (ja) * | 2018-03-13 | 2019-09-19 | 富士通株式会社 | 判定プログラム、判定装置、及び判定方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3341176B2 (ja) | 2002-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023005293A1 (zh) | 文本纠错方法、装置、设备及存储介质 | |
JP3973549B2 (ja) | 対訳依存構造対応付け装置、方法及びプログラム、並びに、対訳依存構造対応付けプログラムを記録した記録媒体 | |
JP5071373B2 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
KR20100116595A (ko) | 근사 문자열 매칭을 위한 아카이브를 관리하는 방법 및 시스템 | |
JPH0778165A (ja) | テキスト中のエラーストリングを検出する方法及びコンピュータシステム | |
JP2017058804A (ja) | 検出装置、方法およびプログラム | |
KR102618219B1 (ko) | 사전 학습된 언어 모델의 파라미터 및 사전 학습 단어장을미세 조정하는 방법 및 사전 학습된 언어 모델의 파라미터 및 사전 학습 단어장을 미세 조정하기 위한 전자 장치 | |
JPH07160709A (ja) | 自然語文解析装置、文リズムパターン選択装置及び文生成装置 | |
CN113536776B (zh) | 混淆语句的生成方法、终端设备及计算机可读存储介质 | |
CN113486163A (zh) | 一种基于音形泛化的模糊搜索方法 | |
JP2003280903A (ja) | ソースプログラム比較情報生成システム | |
JP4314271B2 (ja) | 単語間関連度算出装置、単語間関連度算出方法及び単語間関連度算出プログラム並びにそのプログラムを記録した記録媒体 | |
JP3387437B2 (ja) | 機械翻訳校正装置 | |
JPH0743728B2 (ja) | 要約文生成方式 | |
JP3029403B2 (ja) | 文章データ音声変換システム | |
JP3548372B2 (ja) | 文字認識装置 | |
JP3036591B2 (ja) | 音声認識装置 | |
JP3135221B2 (ja) | 用例主導型言語構造解析装置 | |
JPH11259482A (ja) | 複合名詞の機械翻訳方式 | |
JP3046872B2 (ja) | つづり−発音記号変換処理方式と例外語辞書管理データ登録処理方式 | |
JP3097225B2 (ja) | かな漢字変換装置 | |
JP3216725B2 (ja) | 文章構造解析装置 | |
JP2022114223A (ja) | ソースコード変更箇所抽出方法、ソースコード変更箇所抽出プログラム及びソースコード変更箇所抽出装置 | |
CN115186653A (zh) | 目标领域样本库建立方法、装置、计算机设备和存储介质 | |
JP2001265763A (ja) | 形態素解析方法および形態素解析プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |