JP3408830B2 - 日本語文構文解析装置 - Google Patents
日本語文構文解析装置Info
- Publication number
- JP3408830B2 JP3408830B2 JP33661692A JP33661692A JP3408830B2 JP 3408830 B2 JP3408830 B2 JP 3408830B2 JP 33661692 A JP33661692 A JP 33661692A JP 33661692 A JP33661692 A JP 33661692A JP 3408830 B2 JP3408830 B2 JP 3408830B2
- Authority
- JP
- Japan
- Prior art keywords
- clause
- modification
- phrase
- destination
- bunsetsu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Description
【0001】
【技術分野】本発明は、日本語文構文解析装置に関し、
より詳細には、処理系が小規模で、構文解析用辞書が不
要な日本語文構文解析装置に関する。例えば、日本語を
対象として文書検索システム、文書作業/校正支援シス
テム、文書キーワード抽出システム、文書要約システ
ム、音声合成システム、データベース検索システム等の
構文解析部に適用されるものである。
より詳細には、処理系が小規模で、構文解析用辞書が不
要な日本語文構文解析装置に関する。例えば、日本語を
対象として文書検索システム、文書作業/校正支援シス
テム、文書キーワード抽出システム、文書要約システ
ム、音声合成システム、データベース検索システム等の
構文解析部に適用されるものである。
【0002】
【従来技術】日本語文を扱う各種装置において、日本語
文の構造を明らかにすることは、さまざまな高度な機能
を実現する際に有効な情報を提供することになる。一般
に、自然言語文の構文解析では、品詞が与えられた単語
列を入力にして、構文規則を用いて構文構造を得る。し
かし、自然言語文では多数の曖昧な構文構造が得られる
ために、意味レベルの解析により曖昧さを解消して、構
文構造を絞ることを行う。実際の解析では構文解析と意
味解析を融合して行うことも多い。
文の構造を明らかにすることは、さまざまな高度な機能
を実現する際に有効な情報を提供することになる。一般
に、自然言語文の構文解析では、品詞が与えられた単語
列を入力にして、構文規則を用いて構文構造を得る。し
かし、自然言語文では多数の曖昧な構文構造が得られる
ために、意味レベルの解析により曖昧さを解消して、構
文構造を絞ることを行う。実際の解析では構文解析と意
味解析を融合して行うことも多い。
【0003】日本語文では、英語文のように構文の制約
が厳格でなく、語順の入れ替えが比較的自由なことか
ら、句の構造よりも、句と句の修飾/被修飾を示す依存
構造を直接導く係り受け解析が有効になっており、ま
た、構文情報だけによる解析方法はほとんど取られず、
意味情報を用いた構文意味解析を行うのが普通である。
なお、意味情報を用いた解析を行うと、意味レベルの解
析結果が得られるため、深いレベルの情報になるという
利点がある。
が厳格でなく、語順の入れ替えが比較的自由なことか
ら、句の構造よりも、句と句の修飾/被修飾を示す依存
構造を直接導く係り受け解析が有効になっており、ま
た、構文情報だけによる解析方法はほとんど取られず、
意味情報を用いた構文意味解析を行うのが普通である。
なお、意味情報を用いた解析を行うと、意味レベルの解
析結果が得られるため、深いレベルの情報になるという
利点がある。
【0004】しかし、意味レベルの解析を行うには、処
理系自体が複雑になるだけでなく、辞書には、品詞情報
に加えて意味情報を含めなくてはならず、その開発が難
しく、辞書も大規模化することになり、応用装置への負
担が大きくなる。意味レベルの解析では、妥当な修飾先
を優先的に選択するのに有用であると言われている。し
かし、修飾先の優先選択では、適切な選択を行うための
意味素の共起のような情報を設定すること自体が難し
く、また、その寄与は必ずしも大きいとはいえず、解析
正解率も十分高いとはいえない。
理系自体が複雑になるだけでなく、辞書には、品詞情報
に加えて意味情報を含めなくてはならず、その開発が難
しく、辞書も大規模化することになり、応用装置への負
担が大きくなる。意味レベルの解析では、妥当な修飾先
を優先的に選択するのに有用であると言われている。し
かし、修飾先の優先選択では、適切な選択を行うための
意味素の共起のような情報を設定すること自体が難し
く、また、その寄与は必ずしも大きいとはいえず、解析
正解率も十分高いとはいえない。
【0005】上述したように、日本語文の構文解析で
は、意味レベルの情報を使った処理を行うために、処理
系及び辞書や解析規則が大規模になっている。現在、最
も日本語解析が利用されている応用システムとしては、
日英機械翻訳システムがある。一般に、機械翻訳システ
ムは、システム自体が専用装置化されるような大規模な
ものであり、また、日本語解析部は、日英変換部と英語
生成部と並んで主要な部分の一つであり、日本語解析部
が意味レベルの解析により複雑で大規模なものになって
も、その必要性からして余り問題にはなっていない。
は、意味レベルの情報を使った処理を行うために、処理
系及び辞書や解析規則が大規模になっている。現在、最
も日本語解析が利用されている応用システムとしては、
日英機械翻訳システムがある。一般に、機械翻訳システ
ムは、システム自体が専用装置化されるような大規模な
ものであり、また、日本語解析部は、日英変換部と英語
生成部と並んで主要な部分の一つであり、日本語解析部
が意味レベルの解析により複雑で大規模なものになって
も、その必要性からして余り問題にはなっていない。
【0006】一方、日本語を扱う多くの他の各種応用シ
ステムでは、日本語の構文解析結果があれば、高度な機
能を付加できると考えられるが、辞書や処理系が大規模
であるというので、その応用システム全体における負担
が大きくなるため、容易に利用できないというのが現状
である。また、解析結果も意味レベルまで深くなくて
も、システムの負担が小さければ、単なる構文構造だけ
でよい場合も多いと考えられる。
ステムでは、日本語の構文解析結果があれば、高度な機
能を付加できると考えられるが、辞書や処理系が大規模
であるというので、その応用システム全体における負担
が大きくなるため、容易に利用できないというのが現状
である。また、解析結果も意味レベルまで深くなくて
も、システムの負担が小さければ、単なる構文構造だけ
でよい場合も多いと考えられる。
【0007】図5は、従来の日本語文構解析装置の構成
図で、図中、31は品詞付き形態素列/単語列、32は
構文解析辞書、33は構文解析部、34は構文解析規
則、35は構文構造である。品詞付き形態素列/単語列
31に対して、構文解析辞書32及び構文解析規則34
を用いて構文解析部33により構文解析が行なわれ、構
文構造を得ることができる。この場合、格情報や共起情
報といった情報を与える構文解析辞書を備えている。す
なわち、入力となる形態素列又は単語列に品詞(活用形
等を含む)以外にこうした情報が付加されている。
図で、図中、31は品詞付き形態素列/単語列、32は
構文解析辞書、33は構文解析部、34は構文解析規
則、35は構文構造である。品詞付き形態素列/単語列
31に対して、構文解析辞書32及び構文解析規則34
を用いて構文解析部33により構文解析が行なわれ、構
文構造を得ることができる。この場合、格情報や共起情
報といった情報を与える構文解析辞書を備えている。す
なわち、入力となる形態素列又は単語列に品詞(活用形
等を含む)以外にこうした情報が付加されている。
【0008】
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、単なる構文構造だけの解析結果ながら、処理系
や辞書の小規模で、従って、多くの応用システムに容易
に利用できるようにすること、また、構文解析用辞書が
不要で、従って、多くの応用システムに容易に利用でき
るようにすること、また、利用者の訂正対話機構を組み
込んで、人間の介在で解析正解率の向上が可能な構成と
すること、また、意味情報に基づき、解析レベルを深め
ること、また、日本語文の字種の特徴を利用して、小規
模辞書とコンパクトな処理にした形態素解析方法と前記
日本語文構文解析方法を組み合わせることで、小規模辞
書でコンパクトな処理の日本語解析系を提供すること、
さらに、前記日本語文構文解析方法に基づいた日本語文
構文解析装置を提供することを目的としてなされたもの
である。
もので、単なる構文構造だけの解析結果ながら、処理系
や辞書の小規模で、従って、多くの応用システムに容易
に利用できるようにすること、また、構文解析用辞書が
不要で、従って、多くの応用システムに容易に利用でき
るようにすること、また、利用者の訂正対話機構を組み
込んで、人間の介在で解析正解率の向上が可能な構成と
すること、また、意味情報に基づき、解析レベルを深め
ること、また、日本語文の字種の特徴を利用して、小規
模辞書とコンパクトな処理にした形態素解析方法と前記
日本語文構文解析方法を組み合わせることで、小規模辞
書でコンパクトな処理の日本語解析系を提供すること、
さらに、前記日本語文構文解析方法に基づいた日本語文
構文解析装置を提供することを目的としてなされたもの
である。
【0009】
【構成】本発明は、上記目的を達成するために、(1)
日本語文の形態素列あるいは単語列(以下、形態素列と
いう)を入力とし、構文解析辞書及び構文解析規則を参
照し、日本語文の構文構造を出力する日本語文構文解析
装置において、文節を構成する品詞情報とそれに由来す
る文節に付加する文節属性に基づいて、文節の構成を記
述した文節構成規則と、文節間の修飾可能性を記述した
文節間修飾可能性検出規則と、文節の修飾先を決定する
文節最尤修飾先例外規則と、品詞情報とそれに由来する
文節属性だけで記述された構文解析規則を有し、前記文
節構成規則に基づき、形態素列を文節列に変換し、文節
属性を付加する文節合成手段と、前記文節間修飾可能性
検出規則に基づき、各文節間の修飾可能性を検出する文
節間修飾可能性検出手段と、各文節の修飾先の決定にあ
たっては、最近接の修飾可能な文節を仮修飾先として、
順次遠方の修飾可能な文節について、前記文節最尤修飾
先例外規則に基づき検査し、例外条件を満たせば、その
都度その文節を仮修飾先としてつけかえ、修飾可能な文
節が尽きた時点で、仮修飾先となっている文節を最尤修
飾先と決定する文節最尤修飾先決定手段とを備えるこ
と、更には、(2)前記(1)において、前記文節最尤
修飾先決定手段が、修飾先を決定する文節を、文末側か
ら順次文頭側に遡って選んでゆくこと、更には、(3)
前記(1)において、前記文節最尤修飾先決定手段が、
修飾先を決定する文節を、修飾可能な文節が少ない側か
ら選んでゆくこと、更には、(4)前記(1)〜(3)
のいずれかにおいて、指示を受け付ける対話制御手段
と、指示に応じて文節間修飾可能性及び文節最尤修飾先
の状況を表示する文節間修飾状況表示手段とを有し、文
節修飾先変更指示があった場合に、文節最尤修飾先決定
を再度行い、その文節最尤修飾先決定において、指示し
た文節の修飾先を最優先に決定し、残る文節について順
次最尤修飾先を決定すること、更には、(5)前記
(1)〜(4)のいずれかの日本語文構文解析装置によ
る構文レベルの解析結果の内容を、構文意味解析辞書を
用いて、構文意味レベルの情報を付加した解析結果とす
ること、更には、(6)前記(1)〜(5)のいずれか
の日本語文構文解析装置の入力である形態素列を、漢字
かな混じり日本語文を入力とし、ひらがな以外の同一文
字種からなり、形態素辞書にない文字列に対し、複数の
特定の形態素品詞候補を与え、ひらがな文字列だけから
なる形態素をもつひらがな辞書と、助動詞、副詞、形式
名詞等の機能語やその他の例外語をもつ小規模な辞書と
を有する日本語文形態素解析手段を備えたこと、更に
は、(7)前記(1)〜(6)のいずれかの日本語文構
文解析装置を用い、日本語文を入力する入力手段と、構
文解析結果を出力する出力手段とを有することを特徴と
したものである。以下、本発明の実施例に基づいて説明
する。
日本語文の形態素列あるいは単語列(以下、形態素列と
いう)を入力とし、構文解析辞書及び構文解析規則を参
照し、日本語文の構文構造を出力する日本語文構文解析
装置において、文節を構成する品詞情報とそれに由来す
る文節に付加する文節属性に基づいて、文節の構成を記
述した文節構成規則と、文節間の修飾可能性を記述した
文節間修飾可能性検出規則と、文節の修飾先を決定する
文節最尤修飾先例外規則と、品詞情報とそれに由来する
文節属性だけで記述された構文解析規則を有し、前記文
節構成規則に基づき、形態素列を文節列に変換し、文節
属性を付加する文節合成手段と、前記文節間修飾可能性
検出規則に基づき、各文節間の修飾可能性を検出する文
節間修飾可能性検出手段と、各文節の修飾先の決定にあ
たっては、最近接の修飾可能な文節を仮修飾先として、
順次遠方の修飾可能な文節について、前記文節最尤修飾
先例外規則に基づき検査し、例外条件を満たせば、その
都度その文節を仮修飾先としてつけかえ、修飾可能な文
節が尽きた時点で、仮修飾先となっている文節を最尤修
飾先と決定する文節最尤修飾先決定手段とを備えるこ
と、更には、(2)前記(1)において、前記文節最尤
修飾先決定手段が、修飾先を決定する文節を、文末側か
ら順次文頭側に遡って選んでゆくこと、更には、(3)
前記(1)において、前記文節最尤修飾先決定手段が、
修飾先を決定する文節を、修飾可能な文節が少ない側か
ら選んでゆくこと、更には、(4)前記(1)〜(3)
のいずれかにおいて、指示を受け付ける対話制御手段
と、指示に応じて文節間修飾可能性及び文節最尤修飾先
の状況を表示する文節間修飾状況表示手段とを有し、文
節修飾先変更指示があった場合に、文節最尤修飾先決定
を再度行い、その文節最尤修飾先決定において、指示し
た文節の修飾先を最優先に決定し、残る文節について順
次最尤修飾先を決定すること、更には、(5)前記
(1)〜(4)のいずれかの日本語文構文解析装置によ
る構文レベルの解析結果の内容を、構文意味解析辞書を
用いて、構文意味レベルの情報を付加した解析結果とす
ること、更には、(6)前記(1)〜(5)のいずれか
の日本語文構文解析装置の入力である形態素列を、漢字
かな混じり日本語文を入力とし、ひらがな以外の同一文
字種からなり、形態素辞書にない文字列に対し、複数の
特定の形態素品詞候補を与え、ひらがな文字列だけから
なる形態素をもつひらがな辞書と、助動詞、副詞、形式
名詞等の機能語やその他の例外語をもつ小規模な辞書と
を有する日本語文形態素解析手段を備えたこと、更に
は、(7)前記(1)〜(6)のいずれかの日本語文構
文解析装置を用い、日本語文を入力する入力手段と、構
文解析結果を出力する出力手段とを有することを特徴と
したものである。以下、本発明の実施例に基づいて説明
する。
【0010】図1は、本発明による日本語文構文解析装
置の一実施例を説明するための構成図で、図中、1は品
詞付き形態素列/単語列、2は文節構成規則、3は文節
合成部、4は文節間修飾可能性検出規則、5は文節間修
飾可能性検出部、6は文節属性付文節列、7は文節最尤
修飾先決定規則、8は文節最尤修飾先決定部、9は修飾
可能文節対マトリクス、10は文節間修飾構造である。
置の一実施例を説明するための構成図で、図中、1は品
詞付き形態素列/単語列、2は文節構成規則、3は文節
合成部、4は文節間修飾可能性検出規則、5は文節間修
飾可能性検出部、6は文節属性付文節列、7は文節最尤
修飾先決定規則、8は文節最尤修飾先決定部、9は修飾
可能文節対マトリクス、10は文節間修飾構造である。
【0011】本実施例においては、構文解析辞書を必要
とせず、また、入力の形態素列/単語列にも品詞情報以
外は必要としない。たとえば、次の日本語例文、例文
1:“日本語のように単語間に切れ目を置かない膠着言
語の文の処理において、形態素解析は、第一の関門であ
る。”に対する品詞付き単語列とは、次の表1のような
ものである。
とせず、また、入力の形態素列/単語列にも品詞情報以
外は必要としない。たとえば、次の日本語例文、例文
1:“日本語のように単語間に切れ目を置かない膠着言
語の文の処理において、形態素解析は、第一の関門であ
る。”に対する品詞付き単語列とは、次の表1のような
ものである。
【0012】
【表1】
【0013】単語列中の各要素は、表記と“{ }”に
示された単語品詞からなっている。単語品詞には、「動
詞:置く=五カ未a」のように、活用単語には、原形
(置く)や活用型(カ行五段活用)、活用形(未然形
a)も与えられている。なお、ここでは、単語列の例を
示したが、単語の構成要素にまで分解した形態素列であ
っても、以下に示す方式/装置は、同様に実現できる。
本発明の日本語文構文解析方式では、上記の品詞情報と
構文解析のためのいくつかの規則により、たとえば、次
の表2のような日本語文の構文構造を出力する。
示された単語品詞からなっている。単語品詞には、「動
詞:置く=五カ未a」のように、活用単語には、原形
(置く)や活用型(カ行五段活用)、活用形(未然形
a)も与えられている。なお、ここでは、単語列の例を
示したが、単語の構成要素にまで分解した形態素列であ
っても、以下に示す方式/装置は、同様に実現できる。
本発明の日本語文構文解析方式では、上記の品詞情報と
構文解析のためのいくつかの規則により、たとえば、次
の表2のような日本語文の構文構造を出力する。
【0014】
【表2】
【0015】構文構造の曖昧さの解消を品詞情報と構文
解析規則だけで解決する実施例として、係り受け解析を
ベースとして構成したものである。まず、図1のような
単語品詞付き単語列を入力として、文節合成部3が、文
節構成規則2に基づき、文節属性付文節列6を出力す
る。次に、文節属性付文節列6を入力として、文節間修
飾可能性検出部5が、文節間修飾可能性検出規則4に基
づき、修飾可能文節対マトリクス9を求め、最後に、文
節最尤修飾先決定部8が、修飾可能文節対マトリクス9
と文節最尤修飾先決定規則7に基づき、各文節の尤もら
しい修飾先を決定する。以下に上記の規則及び処理部に
ついての実施例を順次示説明する。
解析規則だけで解決する実施例として、係り受け解析を
ベースとして構成したものである。まず、図1のような
単語品詞付き単語列を入力として、文節合成部3が、文
節構成規則2に基づき、文節属性付文節列6を出力す
る。次に、文節属性付文節列6を入力として、文節間修
飾可能性検出部5が、文節間修飾可能性検出規則4に基
づき、修飾可能文節対マトリクス9を求め、最後に、文
節最尤修飾先決定部8が、修飾可能文節対マトリクス9
と文節最尤修飾先決定規則7に基づき、各文節の尤もら
しい修飾先を決定する。以下に上記の規則及び処理部に
ついての実施例を順次示説明する。
【0016】(1)文節合成(A)
文節構成規則
文節構成規則は、ここでは、文節頭検出規則と文節属性
付加規則から構成した場合を示す。文節頭検出規則は、
単語列中の文節の先端になる単語を検出する条件で、次
の表3のように、その品詞候補と例外から構成する。
付加規則から構成した場合を示す。文節頭検出規則は、
単語列中の文節の先端になる単語を検出する条件で、次
の表3のように、その品詞候補と例外から構成する。
【0017】
【表3】
【0018】例外品詞並びは、文節頭品詞でも文節頭に
ならない場合を示すもので、第1例では文節頭候補とな
る名詞でも、先行する単語品詞(“(−)”内に示す)
が名詞の場合は、文節頭にならないことを示している。
文節属性付加規則は、文節頭を検出することで構成され
る文節ごとに、その性質を示す文節属性を付加する規則
である。文節属性としては、その修飾性を表わす修飾性
属性と被修飾性を表わす被修飾性属性とその他の補助属
性があり、たとえば、ここでは次の表4のような属性を
考える。文節属性は、次の文節間修飾可能性検出で参照
される。
ならない場合を示すもので、第1例では文節頭候補とな
る名詞でも、先行する単語品詞(“(−)”内に示す)
が名詞の場合は、文節頭にならないことを示している。
文節属性付加規則は、文節頭を検出することで構成され
る文節ごとに、その性質を示す文節属性を付加する規則
である。文節属性としては、その修飾性を表わす修飾性
属性と被修飾性を表わす被修飾性属性とその他の補助属
性があり、たとえば、ここでは次の表4のような属性を
考える。文節属性は、次の文節間修飾可能性検出で参照
される。
【0019】
【表4】
【0020】文節属性付加規則は、この各文節属性を設
定するための条件が記述された規則である。例文1に関
連する文節属性の規則を表5に挙げる。
定するための条件が記述された規則である。例文1に関
連する文節属性の規則を表5に挙げる。
【0021】
【表5】
【0022】表5の規則では、「体言句」属性は、文節
頭の単語品詞が、「名詞」、「数名詞」、「時副詞名
詞」、「副詞名詞」、…の場合に付加され、「の連体」
属性は、文節末の単語品詞が、「格助詞=ノ」の場合に
付加され、「連体形連体」属性は、品詞名の末尾が
「体」(連体形)、すなわち、たとえば、例文でいえば
「助動詞:ナイ=ク体」等の場合に付加されることを求
めている。ここで、文節属性は、基本的に品詞の構成だ
けで検出している。一部に「時」や「数」といった意味
レベルの属性もあるが、これは形態素解析を行うのに接
続の性質が異なるために立てた品詞による。
頭の単語品詞が、「名詞」、「数名詞」、「時副詞名
詞」、「副詞名詞」、…の場合に付加され、「の連体」
属性は、文節末の単語品詞が、「格助詞=ノ」の場合に
付加され、「連体形連体」属性は、品詞名の末尾が
「体」(連体形)、すなわち、たとえば、例文でいえば
「助動詞:ナイ=ク体」等の場合に付加されることを求
めている。ここで、文節属性は、基本的に品詞の構成だ
けで検出している。一部に「時」や「数」といった意味
レベルの属性もあるが、これは形態素解析を行うのに接
続の性質が異なるために立てた品詞による。
【0023】(B)文節合成部
文節合成部では、上記の文節構成規則1,2[文節頭検
出規則、文節属性規則]に基づき、次のような処理を行
う。入力単語列の先頭から単語を順次に検査し、文節頭
検出規則で次の文節頭(あるいは文末)を検出するごと
に、文節を合成しながら、その構成単語を文節属性規則
で検出して文節属性を設定していく。例文1の単語品詞
付き単語列からは、上記規則に基づき、次の表6のよう
な文節属性付きの文節列を得ることができる。
出規則、文節属性規則]に基づき、次のような処理を行
う。入力単語列の先頭から単語を順次に検査し、文節頭
検出規則で次の文節頭(あるいは文末)を検出するごと
に、文節を合成しながら、その構成単語を文節属性規則
で検出して文節属性を設定していく。例文1の単語品詞
付き単語列からは、上記規則に基づき、次の表6のよう
な文節属性付きの文節列を得ることができる。
【0024】
【表6】
【0025】(2)文節間修飾可能性検出
文節間修飾可能性検出規則
文節間修飾可能性検出規則は、日本語文中の文節がその
右側の文節を修飾する(係る)両者の文節属性上の条件
を規定する。簡単には、 ・連体性の文節属性をもつ文節が、体言性の文節を修飾
する。 ・連用性の文節属性をもつ文節が、用言性の文節を修飾
する。 という条件が基本になる。表7に、もう少し制約を強め
た例を記述するが、あくまで、文節属性と文節間の距離
だけによる。
右側の文節を修飾する(係る)両者の文節属性上の条件
を規定する。簡単には、 ・連体性の文節属性をもつ文節が、体言性の文節を修飾
する。 ・連用性の文節属性をもつ文節が、用言性の文節を修飾
する。 という条件が基本になる。表7に、もう少し制約を強め
た例を記述するが、あくまで、文節属性と文節間の距離
だけによる。
【0026】
【表7】
【0027】文節間修飾可能性検出部
文節間修飾可能性検出部では、上記の文節間修飾可能性
検出規則に基づき、次のような処理を行う。文節を順次
選択し、その文節とその右側にあるすべての文節との対
ごとに、文節間修飾可能検出規則と両文節の文節属性と
文節間距離に基づき、その修飾可能性を検出する。例文
1の文節属性付き文節列からは、上記規則に基づき、次
の表8のような修飾可能文節対を得ることができる。
検出規則に基づき、次のような処理を行う。文節を順次
選択し、その文節とその右側にあるすべての文節との対
ごとに、文節間修飾可能検出規則と両文節の文節属性と
文節間距離に基づき、その修飾可能性を検出する。例文
1の文節属性付き文節列からは、上記規則に基づき、次
の表8のような修飾可能文節対を得ることができる。
【0028】
【表8】
【0029】表8では、修飾可能文節対をマトリクス形
式で示した。たとえば、最下行の文節番号[1]の文節
「日本語のように」は、4と11の位置に〇が記されて
いるが、これは、その上を辿って突き当たる文節番号
[4]の文節「置かない」と文節番号[11]の文節
「である。」の文節を修飾可能であるということを示
す。これは、「日本語のように」の文節属性「体言句」
と「連用」のうち、「連用」が「置かない」の「動詞
句」及び、「である。」の「純コピュラ句」との組合せ
が、文節間修飾可能性規則Y.1及びC.1により検出
されたものである。
式で示した。たとえば、最下行の文節番号[1]の文節
「日本語のように」は、4と11の位置に〇が記されて
いるが、これは、その上を辿って突き当たる文節番号
[4]の文節「置かない」と文節番号[11]の文節
「である。」の文節を修飾可能であるということを示
す。これは、「日本語のように」の文節属性「体言句」
と「連用」のうち、「連用」が「置かない」の「動詞
句」及び、「である。」の「純コピュラ句」との組合せ
が、文節間修飾可能性規則Y.1及びC.1により検出
されたものである。
【0030】(3)文節最尤修飾先決定
最後の文節最尤修飾先決定部では、文節最尤修飾先決定
規則に基づき、各文節ごとに、前記の修飾可能文節対の
相手文節のうちの最尤修飾先を一つ選択する。表9に
は、その最尤修飾先の決定された状態を示す。
規則に基づき、各文節ごとに、前記の修飾可能文節対の
相手文節のうちの最尤修飾先を一つ選択する。表9に
は、その最尤修飾先の決定された状態を示す。
【0031】
【表9】
【0032】表9には、前記の修飾可能文節対マトリク
スで、最尤修飾先として決定された対を●で示してい
る。なお、・は、先に決定された修飾先による非交差制
約に違反する文節対であることを示す。
スで、最尤修飾先として決定された対を●で示してい
る。なお、・は、先に決定された修飾先による非交差制
約に違反する文節対であることを示す。
【0033】図2は、文節最尤修飾先決定部の処理の実
施例の処理フローを示す図である。
施例の処理フローを示す図である。
【0034】(A)文節最尤修飾先決定部
【0035】本実施例は、最尤修飾先文節として、近接
の修飾可能文節を優先的に選択する。従って、最近接の
文節は最優先するという原則に立ち、一方、例外規則に
より最尤修飾先付け替えを行うという方針に成り立つ。
この原則は、最も解釈しやすい自然言語文の構造的な性
質を第一に取り上げたものである。
の修飾可能文節を優先的に選択する。従って、最近接の
文節は最優先するという原則に立ち、一方、例外規則に
より最尤修飾先付け替えを行うという方針に成り立つ。
この原則は、最も解釈しやすい自然言語文の構造的な性
質を第一に取り上げたものである。
【0036】本実施例は、文節最尤修飾先決定を図2に
示すフローのように行う。 S1:[修飾先を決めるべき文節(修飾元文節)ごとの
ループ] ・修飾元文節を文末の文節を除いて、順次選択し、文節
が尽きるまで、S2〜S5の処理を繰り返し、S2が終
了した時点での仮修飾先を修飾元文節の最尤修飾先文節
とする。 S2:[修飾可能文節ごとのループ] ・修飾元文節について、その修飾先可能文節で、抑止文
節となっていない中から、近い側の文節から順次修飾先
候補文節取りあげ、修飾可能文節が尽きるまで、S5の
処理を繰り返す。 S3,S4:[仮修飾先の設定(付け替え)] ・修飾元文節の仮修飾先が、未設定ならば、現修飾先候
補文節をそのまま仮修飾先に設定する。すでに設定され
ていれば、現修飾先候補文節を文節最尤修飾先例外規則
によって検査し(S3)、最近接原則の例外であれば、
それを仮修飾先に設定する(S4)。 S5:[非交差制約による抑止対検出] ・S2で決定された修飾対に対し、非交差制約に違反す
る修飾可能文節対を抑止文節対として検出する。
示すフローのように行う。 S1:[修飾先を決めるべき文節(修飾元文節)ごとの
ループ] ・修飾元文節を文末の文節を除いて、順次選択し、文節
が尽きるまで、S2〜S5の処理を繰り返し、S2が終
了した時点での仮修飾先を修飾元文節の最尤修飾先文節
とする。 S2:[修飾可能文節ごとのループ] ・修飾元文節について、その修飾先可能文節で、抑止文
節となっていない中から、近い側の文節から順次修飾先
候補文節取りあげ、修飾可能文節が尽きるまで、S5の
処理を繰り返す。 S3,S4:[仮修飾先の設定(付け替え)] ・修飾元文節の仮修飾先が、未設定ならば、現修飾先候
補文節をそのまま仮修飾先に設定する。すでに設定され
ていれば、現修飾先候補文節を文節最尤修飾先例外規則
によって検査し(S3)、最近接原則の例外であれば、
それを仮修飾先に設定する(S4)。 S5:[非交差制約による抑止対検出] ・S2で決定された修飾対に対し、非交差制約に違反す
る修飾可能文節対を抑止文節対として検出する。
【0037】ここでは、修飾先の近接文節優先の原則に
基づいて、修飾先候補を近い側の文節から選択する方法
を規定しているが、修飾先を決めるべき文節(修飾元文
節)の選択については、特に規定していない。修飾元文
節の選択の有効な選択方法の例は後述する。なお、前記
の修飾マトリクス図では、すべての文節について、修飾
可能文節のうち、最近接の文節がそのまま選択されてい
る。
基づいて、修飾先候補を近い側の文節から選択する方法
を規定しているが、修飾先を決めるべき文節(修飾元文
節)の選択については、特に規定していない。修飾元文
節の選択の有効な選択方法の例は後述する。なお、前記
の修飾マトリクス図では、すべての文節について、修飾
可能文節のうち、最近接の文節がそのまま選択されてい
る。
【0038】(B)文節最尤修飾先例外規則今まで文
節最尤修飾先決定における規則は、文節最尤修
飾先決定規則としていたが、上の文節最尤修飾先決定部
で示されている通り、修飾可能文節対のうち近接する文
節程を優先する、すなわち、最近接の文節を最優先する
という暗黙の規則を処理に委ねることで、その例外規則
のみを規定するだけで済ませている。近接文節優先の原
則に対しては、次の表10,11のような項目が考えら
れる。
飾先決定規則としていたが、上の文節最尤修飾先決定部
で示されている通り、修飾可能文節対のうち近接する文
節程を優先する、すなわち、最近接の文節を最優先する
という暗黙の規則を処理に委ねることで、その例外規則
のみを規定するだけで済ませている。近接文節優先の原
則に対しては、次の表10,11のような項目が考えら
れる。
【0039】
【表10】
【0040】
【表11】
【0041】上記の例外規則は、修飾先の付け替えのた
めの、修飾元の文節の条件(“:”の左側)との仮修飾
先の文節あるいは付け替え候補の文節の条件(“:”の
右側)からなる例外適用の条件を簡略化した記述であ
る。詳細には、例外適用のための文節属性の条件によ
り、たとえば、次の表12のように規定する。
めの、修飾元の文節の条件(“:”の左側)との仮修飾
先の文節あるいは付け替え候補の文節の条件(“:”の
右側)からなる例外適用の条件を簡略化した記述であ
る。詳細には、例外適用のための文節属性の条件によ
り、たとえば、次の表12のように規定する。
【0042】
【表12】
【0043】表12中のA.2の例外規則は、主題文節
(「は」文節)の性質から通常、文末の文節を修飾する
という性質を表している。ただし、次のような場合のた
めに、重複修飾を避ける条件がついている。 例2:“彼はニューヨークへ行き、彼女はワシントンヘ
向かった。” この場合、重複修飾を避ける条件がなければ、「彼は」
も「彼女は」も「向かった。」を修飾することになる
が、この条件により、「彼は」の「行き」への仮修飾は
そのまま、付け替わらない。表12中のA.7の例外規
則は、「〜に対して」や「〜に基づき」のように、いわ
ゆる格助詞相当句と呼ばれる句には、最近接の文節以外
の文節からの修飾は、飛び越えて遠方の文節に付け替え
ることを示す。これは、格助詞相当句が1引数しかとら
ないことに基づく。ただし、遠方に修飾できる文節がな
ければ、この句への修飾に留まる。表12中のB.4の
他のいくつかの例外規則は、読点が付いた場合には、遠
方の文節を優先することを示している。文節最尤修飾先
例外処理では、例外規則に定められた、修飾元と仮修飾
先(近接側)、新修飾先候補(遠方側)の文節属性や文
節間距離の条件を検査し、例外(新修飾先候補が優先)
と判定された場合に、仮修飾先を付け替える。
(「は」文節)の性質から通常、文末の文節を修飾する
という性質を表している。ただし、次のような場合のた
めに、重複修飾を避ける条件がついている。 例2:“彼はニューヨークへ行き、彼女はワシントンヘ
向かった。” この場合、重複修飾を避ける条件がなければ、「彼は」
も「彼女は」も「向かった。」を修飾することになる
が、この条件により、「彼は」の「行き」への仮修飾は
そのまま、付け替わらない。表12中のA.7の例外規
則は、「〜に対して」や「〜に基づき」のように、いわ
ゆる格助詞相当句と呼ばれる句には、最近接の文節以外
の文節からの修飾は、飛び越えて遠方の文節に付け替え
ることを示す。これは、格助詞相当句が1引数しかとら
ないことに基づく。ただし、遠方に修飾できる文節がな
ければ、この句への修飾に留まる。表12中のB.4の
他のいくつかの例外規則は、読点が付いた場合には、遠
方の文節を優先することを示している。文節最尤修飾先
例外処理では、例外規則に定められた、修飾元と仮修飾
先(近接側)、新修飾先候補(遠方側)の文節属性や文
節間距離の条件を検査し、例外(新修飾先候補が優先)
と判定された場合に、仮修飾先を付け替える。
【0044】次の実施例は、修飾先を決定するべき文節
の選択方法である。ここでは、上記で規定しなかった修
飾先を決めるべき文節(修飾元文節)の選択方法とし
て、文末側の文節から順次に選択するものである。ただ
し、文末の文節は、後方に文節がないので、選択する必
要はない。この選択方式は、日本語文では、文節は後方
のいずれかの文節を修飾するという原側から、文末側の
文節ほどのその後方の文節が少ない、すなわち、潜在的
に修飾しうる文節が少ない、つまり、それだけ潜在的に
曖昧さが少ないので、修飾先決定の誤りが少ないという
性質があることに基づいている。この選択方式に基づ
き、前記の「例文1の修飾可能文節対マトリクスの例」
に示された状況での文節最尤修飾先決定の処理を表13
に示す。
の選択方法である。ここでは、上記で規定しなかった修
飾先を決めるべき文節(修飾元文節)の選択方法とし
て、文末側の文節から順次に選択するものである。ただ
し、文末の文節は、後方に文節がないので、選択する必
要はない。この選択方式は、日本語文では、文節は後方
のいずれかの文節を修飾するという原側から、文末側の
文節ほどのその後方の文節が少ない、すなわち、潜在的
に修飾しうる文節が少ない、つまり、それだけ潜在的に
曖昧さが少ないので、修飾先決定の誤りが少ないという
性質があることに基づいている。この選択方式に基づ
き、前記の「例文1の修飾可能文節対マトリクスの例」
に示された状況での文節最尤修飾先決定の処理を表13
に示す。
【0045】
【表13】
【0046】(a)最初に修飾元の対象として、文末か
ら2番目の「関門」が選択される。「関門」の修飾可能
文節の最近接の文節は「である。」であり、仮修飾先と
して選択されるが、より遠方には、文節はないので、こ
れが修飾先として表14のように決定される。
ら2番目の「関門」が選択される。「関門」の修飾可能
文節の最近接の文節は「である。」であり、仮修飾先と
して選択されるが、より遠方には、文節はないので、こ
れが修飾先として表14のように決定される。
【0047】
【表14】
【0048】(b)次は文末から3番目の「第一の」が
選択される。「第一の」の修飾可能文節の最近接の文節
は「関門」であり、仮修飾先として選択されるが、より
遠方には、修飾可能文節はないので、これが修飾先とし
て表15のように決定される。
選択される。「第一の」の修飾可能文節の最近接の文節
は「関門」であり、仮修飾先として選択されるが、より
遠方には、修飾可能文節はないので、これが修飾先とし
て表15のように決定される。
【0049】
【表15】
【0050】(c)次は文末から4番目の「形態素解析
は」が選択される。「形態素解析は」の修飾可能文節の
最近接の文節は「である。」であり、仮修飾先として選
択されるが、より遠方には文節はないので、これが修飾
先として表16のように決定される。この時、この文節
間の修飾関係により、この修飾関係と交差する次の修飾
可能文節対が抑止される。「文の」、「膠着言語の」及
び「置かない」の各文節から、「関門」、「第一の」の
各文節への修飾。
は」が選択される。「形態素解析は」の修飾可能文節の
最近接の文節は「である。」であり、仮修飾先として選
択されるが、より遠方には文節はないので、これが修飾
先として表16のように決定される。この時、この文節
間の修飾関係により、この修飾関係と交差する次の修飾
可能文節対が抑止される。「文の」、「膠着言語の」及
び「置かない」の各文節から、「関門」、「第一の」の
各文節への修飾。
【0051】
【表16】
【0052】(d)文末から5番目の「処理におい
て、」についても同様に、修飾可能文節の最近接の文節
「である。」が修飾先として表17のように決定され
る。この文節間の修飾関係によっても、この修飾関係と
交差する次の修飾可能文節対が抑止される。「文の」、
「膠着言語の」及び「置かない」の各文節から、「形態
素解析は」の各文節への修飾。
て、」についても同様に、修飾可能文節の最近接の文節
「である。」が修飾先として表17のように決定され
る。この文節間の修飾関係によっても、この修飾関係と
交差する次の修飾可能文節対が抑止される。「文の」、
「膠着言語の」及び「置かない」の各文節から、「形態
素解析は」の各文節への修飾。
【0053】
【表17】
【0054】(e)次は、文末から6番目の「文の」が
選択される。「文の」の修飾可能文節の最近接は「処理
において、」であり、仮修飾先として選択されるが、よ
り遠方の修飾可能文節は、すでに抑止されているので、
これが修飾先として表18のように決定される。
選択される。「文の」の修飾可能文節の最近接は「処理
において、」であり、仮修飾先として選択されるが、よ
り遠方の修飾可能文節は、すでに抑止されているので、
これが修飾先として表18のように決定される。
【0055】
【表18】
【0056】(f)次は、文末から7番目の「膠着言語
の」が選択される。「膠着言語の」の修飾可能文節の最
近接の文節は「文の」であり、仮修飾先として選択され
る。次に、遠方の修飾可能文節「処理において、」は、
例外規則により検出されない。さらに、より遠方の修飾
可能文節は、すでに抑止されているので、「文の」が修
飾先として表19のように決定される。
の」が選択される。「膠着言語の」の修飾可能文節の最
近接の文節は「文の」であり、仮修飾先として選択され
る。次に、遠方の修飾可能文節「処理において、」は、
例外規則により検出されない。さらに、より遠方の修飾
可能文節は、すでに抑止されているので、「文の」が修
飾先として表19のように決定される。
【0057】
【表19】
【0058】(g)次は、文末から8番目の「置かな
い」が選択される。「置かない」の修飾可能文節の最近
接の文節は「膠着言語の」であり、仮修飾先として選択
される。次に、遠方の修飾可能文節「文の」は、例外規
則により検出されない。次に、遠方の修飾可能文節「処
理において、」も例外規則により検出されない。さら
に、より遠方の修飾可能文節は、すでに抑止されている
ので、「膠着言語の」が修飾先として表20のように決
定される。
い」が選択される。「置かない」の修飾可能文節の最近
接の文節は「膠着言語の」であり、仮修飾先として選択
される。次に、遠方の修飾可能文節「文の」は、例外規
則により検出されない。次に、遠方の修飾可能文節「処
理において、」も例外規則により検出されない。さら
に、より遠方の修飾可能文節は、すでに抑止されている
ので、「膠着言語の」が修飾先として表20のように決
定される。
【0059】
【表20】
【0060】(h)次は、文末から10番目の「切れ目
を」が選択される。「切れ目を」の修飾可能文節の最近
接の文節は「置かない」であり、仮修飾先として選択さ
れるが、より遠方の修飾先には、文節はないので、これ
が修飾先として表21のように決定される。
を」が選択される。「切れ目を」の修飾可能文節の最近
接の文節は「置かない」であり、仮修飾先として選択さ
れるが、より遠方の修飾先には、文節はないので、これ
が修飾先として表21のように決定される。
【0061】
【表21】
【0062】(i)次は、文末から11番目の「単語間
に」が選択される。「単語間に」の修飾可能文節の最近
接の文節は「置かない」であり、仮修飾先として選択さ
れるが、より遠方の修飾先には、文節はないので、これ
が修飾先として表22のように決定される。
に」が選択される。「単語間に」の修飾可能文節の最近
接の文節は「置かない」であり、仮修飾先として選択さ
れるが、より遠方の修飾先には、文節はないので、これ
が修飾先として表22のように決定される。
【0063】
【表22】
【0064】(j)最後に、文末から12番目、文頭の
「日本語のように」が選択される。「日本語のように」
の修飾可能文節の最近接の文節は「置かない」であり、
仮修飾先として選択される。次に、遠方の修飾可能文節
「である。」は、例外規則により検出されない。より遠
方には、文節はないので、「置かない」が修飾先として
表23のように決定される。
「日本語のように」が選択される。「日本語のように」
の修飾可能文節の最近接の文節は「置かない」であり、
仮修飾先として選択される。次に、遠方の修飾可能文節
「である。」は、例外規則により検出されない。より遠
方には、文節はないので、「置かない」が修飾先として
表23のように決定される。
【0065】
【表23】
【0066】次の簡単な例文で、修飾先の付け替えの例
を見る。 例文3:“彼はニューヨークを経由して、ワシントンに
向かった。” 例文3では、次の表24のように修飾可能文節対が得ら
れる。
を見る。 例文3:“彼はニューヨークを経由して、ワシントンに
向かった。” 例文3では、次の表24のように修飾可能文節対が得ら
れる。
【0067】
【表24】
【0068】文節番号4「ワシントンに」と文節3「経
由して、」の修飾先は、直ちに決まり、文節2「ニュー
ヨークを」は、修飾可能文節が2つあるが、遠方の「向
かった」は例外にあたらない。文節番号2「彼は」は、
修飾可能な最近接の文節「経由して、」に対して、遠方
の文節「向かった。」は、修飾元文節が「主題主格」で
あり、「向かった。」は「主題主格」の文節に修飾され
ていないので、仮修飾先の付け替えがおこり、それがそ
のまま決まって、最終的に次の表25のようになる。
由して、」の修飾先は、直ちに決まり、文節2「ニュー
ヨークを」は、修飾可能文節が2つあるが、遠方の「向
かった」は例外にあたらない。文節番号2「彼は」は、
修飾可能な最近接の文節「経由して、」に対して、遠方
の文節「向かった。」は、修飾元文節が「主題主格」で
あり、「向かった。」は「主題主格」の文節に修飾され
ていないので、仮修飾先の付け替えがおこり、それがそ
のまま決まって、最終的に次の表25のようになる。
【0069】
【表25】
【0070】一方、例文2では、文頭の「彼は」の修飾
に関して、遠方の「向かった。」は、既に、「彼女は」
の「主格主題」文節の修飾を受けているので、付け替え
は起こらず、次の表26のようになる。
に関して、遠方の「向かった。」は、既に、「彼女は」
の「主格主題」文節の修飾を受けているので、付け替え
は起こらず、次の表26のようになる。
【0071】
【表26】
【0072】上述とは異なる修飾先を決めるべき文節
(修飾元文節)の選択方法を説明する。すなわち、修飾
可能な文節が少ない側から選んでゆくという方法をと
る。ここで、修飾可能文節では非交差制約で抑止された
分は除く。この選択方式は、修飾しうる文節が少ない文
節から選択することで、修飾先決定の誤りを少なくす
る。この選択方式に基づき、前記の「例文1の修飾可能
文節対マトリクスの例」に示された状況での文節最尤修
飾先決定の処理をたどると次の表27〜表32のように
なる。なお、修飾可能文節の数が同じなら、文末側の文
節を選択することにする。
(修飾元文節)の選択方法を説明する。すなわち、修飾
可能な文節が少ない側から選んでゆくという方法をと
る。ここで、修飾可能文節では非交差制約で抑止された
分は除く。この選択方式は、修飾しうる文節が少ない文
節から選択することで、修飾先決定の誤りを少なくす
る。この選択方式に基づき、前記の「例文1の修飾可能
文節対マトリクスの例」に示された状況での文節最尤修
飾先決定の処理をたどると次の表27〜表32のように
なる。なお、修飾可能文節の数が同じなら、文末側の文
節を選択することにする。
【0073】
【表27】
【0074】最初の4文節までは、表17の例と同じ順
次になる。
次になる。
【0075】
【表28】
【0076】「文の」の修飾可能文節数が1となったの
で、次も表17と同じ順番になる。
で、次も表17と同じ順番になる。
【0077】
【表29】
【0078】以下は、修飾可能文節数1の「切れ目
を」、「単語間に」の選択が行われる。
を」、「単語間に」の選択が行われる。
【0079】
【表30】
【0080】次は、修飾可能文節数が2の文節で、文末
側からの「膠着言語の」、次に文頭の「日本語のよう
に」が選択される。
側からの「膠着言語の」、次に文頭の「日本語のよう
に」が選択される。
【0081】
【表31】
【0082】最後に、修飾可能文節数が3の文節「置か
ない」が選択される。
ない」が選択される。
【0083】
【表32】
【0084】今までに説明した実施例では、構文解析に
おける曖昧さを構文的な情報だけに頼って解消してい
る。また、一般の意味レベルの解析により曖昧さを解消
したとしても、人間の知識や文脈などを考慮しないと、
自然言語文の曖昧さは十分には解消されるものではな
い。こうした不完全さを補完するために、利用者との対
話機構によって、より適切な解析結果を導く方法が対話
型文章解析方法としてすでに提案されている。これは、
システム側から曖昧さを解消するための効率的な質問を
発し、その回答に基づき、曖昧さを解消するシステム主
導対話と、利用者が解析結果を見て、必要に応じて訂正
指示を行うユーザ主導対話がある。
おける曖昧さを構文的な情報だけに頼って解消してい
る。また、一般の意味レベルの解析により曖昧さを解消
したとしても、人間の知識や文脈などを考慮しないと、
自然言語文の曖昧さは十分には解消されるものではな
い。こうした不完全さを補完するために、利用者との対
話機構によって、より適切な解析結果を導く方法が対話
型文章解析方法としてすでに提案されている。これは、
システム側から曖昧さを解消するための効率的な質問を
発し、その回答に基づき、曖昧さを解消するシステム主
導対話と、利用者が解析結果を見て、必要に応じて訂正
指示を行うユーザ主導対話がある。
【0085】上記の実施例は、少ない知識量で解析を行
っている方式上の性質から、前記の利用者との対話によ
る補完が有効である。ここでは、利用者による指示を受
け付ける対話制御手段と、利用者の指示に応じて、文節
間修飾可能性及び文節最尤修飾先の状況を表示する文節
間修飾状況表示手段とを有し、文節修飾先変更指示があ
った場合に、文節最尤修飾先決定を再度行い、その文節
最尤修飾先決定において、利用者が指示した文節の修飾
先を最優先に決定し、残る文節について、順次最尤修飾
先を決定することで、前記のユーザ主導対話機構を実現
するものである。
っている方式上の性質から、前記の利用者との対話によ
る補完が有効である。ここでは、利用者による指示を受
け付ける対話制御手段と、利用者の指示に応じて、文節
間修飾可能性及び文節最尤修飾先の状況を表示する文節
間修飾状況表示手段とを有し、文節修飾先変更指示があ
った場合に、文節最尤修飾先決定を再度行い、その文節
最尤修飾先決定において、利用者が指示した文節の修飾
先を最優先に決定し、残る文節について、順次最尤修飾
先を決定することで、前記のユーザ主導対話機構を実現
するものである。
【0086】図3は、本発明による日本語文構文解析装
置の他の実施例を示す構成図で、図中、11は対話制御
部、12は表示機能で、その他、図1と同じ作用をする
部分は同一の符号を付してある。図4は、図3における
文節最尤修飾先決定手段の処理フローである。ここで説
明に用いる例文4とその単語列、文節列、修飾可能文節
対、最尤修飾先決定結果を示す。例文4:“指定された
相手に指定された時刻にメッセージを届けること。”
置の他の実施例を示す構成図で、図中、11は対話制御
部、12は表示機能で、その他、図1と同じ作用をする
部分は同一の符号を付してある。図4は、図3における
文節最尤修飾先決定手段の処理フローである。ここで説
明に用いる例文4とその単語列、文節列、修飾可能文節
対、最尤修飾先決定結果を示す。例文4:“指定された
相手に指定された時刻にメッセージを届けること。”
【0087】
【表33】
【0088】
【表34】
【0089】
【表35】
【0090】例文4の解析結果では、「相手に」の修飾
先が、次の「指定された」になっているが、「届ける」
を修飾する方が尤もらしい。これは、動詞「届ける」が
「が」、「を」、「に」の3つの格を要求することに基
づく。本発明では、格情報をもたないため、「届ける」
を優先するのは困難である(なお、意味レベルの解析で
は、こうした格情報をもって解析するが、「相手に」が
「指定された」の近接修飾との競合で判断するため、
「届ける」の選択を行えるとは限らず、両者の差は、必
ずしも大きくはない)。
先が、次の「指定された」になっているが、「届ける」
を修飾する方が尤もらしい。これは、動詞「届ける」が
「が」、「を」、「に」の3つの格を要求することに基
づく。本発明では、格情報をもたないため、「届ける」
を優先するのは困難である(なお、意味レベルの解析で
は、こうした格情報をもって解析するが、「相手に」が
「指定された」の近接修飾との競合で判断するため、
「届ける」の選択を行えるとは限らず、両者の差は、必
ずしも大きくはない)。
【0091】
【表36】
【0092】図3にあるように、文節修飾先決定部の処
理が終了すると対話制御部が起動され、対話モードに入
る。利用者は、この対話モードにおいて、ここでは、
“M”を指定することで、文節間修飾状況表示手段によ
り、文節間修飾可能性及び文節最尤修飾先の状況を見る
ことができる。本実施例では、文節間修飾状況表示とし
て、修飾可能文節対マトリクスの表示を用いた。この内
部データは、修飾可能文節番号の対、修飾決定した文節
番号の対、非交差制約で抑止された修飾可能文節番号の
対のリスト等で表現できるが、このデータから上記マト
リクスを表示することは極めて容易である。このマトリ
クス表示では、修飾可能文節対の交点位置にマークが記
されているので、利用者はこれで、修飾可能文節対を知
ることができる。さらには、“●”で修飾決定された文
節対や“・”で非交差制約で抑止された文節対も知るこ
とができる。
理が終了すると対話制御部が起動され、対話モードに入
る。利用者は、この対話モードにおいて、ここでは、
“M”を指定することで、文節間修飾状況表示手段によ
り、文節間修飾可能性及び文節最尤修飾先の状況を見る
ことができる。本実施例では、文節間修飾状況表示とし
て、修飾可能文節対マトリクスの表示を用いた。この内
部データは、修飾可能文節番号の対、修飾決定した文節
番号の対、非交差制約で抑止された修飾可能文節番号の
対のリスト等で表現できるが、このデータから上記マト
リクスを表示することは極めて容易である。このマトリ
クス表示では、修飾可能文節対の交点位置にマークが記
されているので、利用者はこれで、修飾可能文節対を知
ることができる。さらには、“●”で修飾決定された文
節対や“・”で非交差制約で抑止された文節対も知るこ
とができる。
【0093】利用者は、この表示により、文節番号2
「相手に」が次の「指定された」を修飾することに疑問
をもち、さらに文節番号6「届ける」を修飾可能である
ことを知り、この修飾関係がより妥当と判定した場合
は、“2−6”のように文節番号の対を指定すること
で、文節の修飾先を変更指示することができる。これが
文節修飾先変更指示受付手段となる(変更指示は、複数
同時に行っても構わない)。
「相手に」が次の「指定された」を修飾することに疑問
をもち、さらに文節番号6「届ける」を修飾可能である
ことを知り、この修飾関係がより妥当と判定した場合
は、“2−6”のように文節番号の対を指定すること
で、文節の修飾先を変更指示することができる。これが
文節修飾先変更指示受付手段となる(変更指示は、複数
同時に行っても構わない)。
【0094】本発明では、変更指示があった時点で、再
度、文節最尤修飾先決定を行う(図3)。この際、修飾
元の文節の選択は、まず、利用者の変更指示を行った修
飾文節対を選択し、その修飾元文節に対する修飾先文節
を決定し(図4,S1)、さらに、その文節対に対して
の非交差制約による抑止対を求める(図4,S2)。利
用者の変更指示についてすべて変更した後に、残る修飾
先未決定の文節について、請求項2あるいは3の方法で
残りの修飾先を決定していく(図4,S3〜S7)。
度、文節最尤修飾先決定を行う(図3)。この際、修飾
元の文節の選択は、まず、利用者の変更指示を行った修
飾文節対を選択し、その修飾元文節に対する修飾先文節
を決定し(図4,S1)、さらに、その文節対に対して
の非交差制約による抑止対を求める(図4,S2)。利
用者の変更指示についてすべて変更した後に、残る修飾
先未決定の文節について、請求項2あるいは3の方法で
残りの修飾先を決定していく(図4,S3〜S7)。
【0095】文節最尤修飾先の再決定された後の解析構
造では、変更指示が反映された結果になっているととも
に、選択順序が異なることがわかると同時に、マトリク
スでは修飾先の順序が異なるために非交差抑止の文節対
も異なっているのがわかる。なお、対話モードでは、文
節の修飾状況表示や修飾先変更指示の他の指示を受付
け、それに伴う処理を含めることは妨げない。
造では、変更指示が反映された結果になっているととも
に、選択順序が異なることがわかると同時に、マトリク
スでは修飾先の順序が異なるために非交差抑止の文節対
も異なっているのがわかる。なお、対話モードでは、文
節の修飾状況表示や修飾先変更指示の他の指示を受付
け、それに伴う処理を含めることは妨げない。
【0096】これまでは、解析結果として、単に構文構
造を求めるだけで、構造要素間の修飾関係の種類は検出
していない。文の意味解釈等の深いレベルの処理を行う
場合には、こうした修飾間の関係の種類があることが望
ましい。従来の構文解析方式/装置は、このために意味
レベルでの解析を行っている側面もある。ここでは、こ
れまでの日本語文構文解析方式の結果を構文意味解析辞
書を参照して、構文意味レベルに深める構成をとること
により、従来の構文意味レベルの解析結果を得る日本語
解析技術より、見通しのよい解析方式を実現する。すな
わち、従来は構文解析と意味解析を混在していたところ
を、意味解析部分を修飾関係にある構造要素(文節等)
間の修飾関係の種類を検出する処理を行うだけに限定す
ることができる。付加される処理は、従来技術から容易
に実現できる。
造を求めるだけで、構造要素間の修飾関係の種類は検出
していない。文の意味解釈等の深いレベルの処理を行う
場合には、こうした修飾間の関係の種類があることが望
ましい。従来の構文解析方式/装置は、このために意味
レベルでの解析を行っている側面もある。ここでは、こ
れまでの日本語文構文解析方式の結果を構文意味解析辞
書を参照して、構文意味レベルに深める構成をとること
により、従来の構文意味レベルの解析結果を得る日本語
解析技術より、見通しのよい解析方式を実現する。すな
わち、従来は構文解析と意味解析を混在していたところ
を、意味解析部分を修飾関係にある構造要素(文節等)
間の修飾関係の種類を検出する処理を行うだけに限定す
ることができる。付加される処理は、従来技術から容易
に実現できる。
【0097】日本語文の字種の特徴を利用して、小規模
辞書だけで形態素解析を行う形態素解析方式の提案があ
る。この解析結果は、本請求項の入力となりうる品詞付
きの形態素列あるいは単語列である。これまでの日本語
文構文解析方式は、日本語文を形態素列あるいは単語列
に変換し、当該方式の入力とする形態素解析方式等につ
いては、何も限定していないが、前記の小規模辞書によ
る形態素解析方式と組み合わせることで、全体として、
形態素解析の小規模辞書だけで、日本語文の解析結果を
導く日本語文解析方式である。この実現は、前記形態素
解析方式の結果をこれまでの構文解析方式の入力とする
ことで、容易に実現できる。
辞書だけで形態素解析を行う形態素解析方式の提案があ
る。この解析結果は、本請求項の入力となりうる品詞付
きの形態素列あるいは単語列である。これまでの日本語
文構文解析方式は、日本語文を形態素列あるいは単語列
に変換し、当該方式の入力とする形態素解析方式等につ
いては、何も限定していないが、前記の小規模辞書によ
る形態素解析方式と組み合わせることで、全体として、
形態素解析の小規模辞書だけで、日本語文の解析結果を
導く日本語文解析方式である。この実現は、前記形態素
解析方式の結果をこれまでの構文解析方式の入力とする
ことで、容易に実現できる。
【0098】以上説明した日本語文構文解析方法を用い
て、日本語文を入力する手段と構文解析結果を出力する
手段とを設けることで日本語文構文解析装置を実現す
る。なお、日本語文の入力手段としては、日本語文書フ
ァイルから文を切り出したり、対話適に日本語文を入力
するなど複数の入力方法があるが、これらのいずれかに
限定するものではないし、複数備えることも妨げない。
また、結果の出力手段については、その形式、出力媒体
については、特に規定するものではない。
て、日本語文を入力する手段と構文解析結果を出力する
手段とを設けることで日本語文構文解析装置を実現す
る。なお、日本語文の入力手段としては、日本語文書フ
ァイルから文を切り出したり、対話適に日本語文を入力
するなど複数の入力方法があるが、これらのいずれかに
限定するものではないし、複数備えることも妨げない。
また、結果の出力手段については、その形式、出力媒体
については、特に規定するものではない。
【0099】
【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。 (1)単なる構文構造だけの解析結果ながら、処理系が
小規模で、構文解析用辞書が不要な日本語文構文解析方
法であり、多くの応用システムに容易に利用できる。す
なわち、従来、負担の大きさから取り組んでいなかった
新しい応用システムを展開する。また、従来、日本語文
書に対し、表層的な文字列検査あるいは形態素解析結果
しか利用していなかった応用システムに、小さな負担で
構文解析結果も利用できるようにして、より高度な機能
あるいは新機能を展開する。また、従来の応用システム
を軽量化して、下位機種に展開する。 (2)前記の日本語文構文解析方法に利用者の訂正対話
機構を組み込むことで、対話的な利用形態では、必要に
応じて精度の高い解析結果を得る効果がある。 (3)前記の日本語文構文解析方法の結果を意味情報に
基づき、解析レベルを深める構成とすることで、意味レ
ベルの結果を得る日本語文構文解結方法の構成の見通し
をよくし、実現を容易にする効果がある。 (4)日本語文の字種の特徴を利用して、小規模辞書と
コンパクトな処理にした形態素解析方法と前記の日本語
文構文解析方法を組み合わせることで、小規模辞書でコ
ンパクトな処理の日本語文解析系を提供する。 (5)前記の日本語文構文解析方法に基づいた日本語文
構文解析装置あるいは日本語文解析装置を提供する。
と、以下のような効果がある。 (1)単なる構文構造だけの解析結果ながら、処理系が
小規模で、構文解析用辞書が不要な日本語文構文解析方
法であり、多くの応用システムに容易に利用できる。す
なわち、従来、負担の大きさから取り組んでいなかった
新しい応用システムを展開する。また、従来、日本語文
書に対し、表層的な文字列検査あるいは形態素解析結果
しか利用していなかった応用システムに、小さな負担で
構文解析結果も利用できるようにして、より高度な機能
あるいは新機能を展開する。また、従来の応用システム
を軽量化して、下位機種に展開する。 (2)前記の日本語文構文解析方法に利用者の訂正対話
機構を組み込むことで、対話的な利用形態では、必要に
応じて精度の高い解析結果を得る効果がある。 (3)前記の日本語文構文解析方法の結果を意味情報に
基づき、解析レベルを深める構成とすることで、意味レ
ベルの結果を得る日本語文構文解結方法の構成の見通し
をよくし、実現を容易にする効果がある。 (4)日本語文の字種の特徴を利用して、小規模辞書と
コンパクトな処理にした形態素解析方法と前記の日本語
文構文解析方法を組み合わせることで、小規模辞書でコ
ンパクトな処理の日本語文解析系を提供する。 (5)前記の日本語文構文解析方法に基づいた日本語文
構文解析装置あるいは日本語文解析装置を提供する。
【図1】 本発明による日本語文構文解析方法及びその
装置の一実施例を説明するための構成図である。
装置の一実施例を説明するための構成図である。
【図2】 本発明による文節最尤修飾先決定手段の処理
フローを示す図である。
フローを示す図である。
【図3】 本発明による日本語文構文解析方法及びその
装置の他の実施例を示す図である。
装置の他の実施例を示す図である。
【図4】 図3における文節最尤修飾先決定手段の処理
フローを示す図である。
フローを示す図である。
【図5】 従来の日本語文構文解析方法及びその装置を
示す図である。
示す図である。
1…品詞付き形態素列/単語列、2…文節構成規則、3
…文節合成部、4…文節間修飾可能性検出規則、5…文
節間修飾可能性検出部、6…文節属性付文節列、7…文
節最尤修飾先決定規則、8…文節最尤修飾先決定部、9
…修飾可能文節対マトリクス、10…文節間修飾構造。
…文節合成部、4…文節間修飾可能性検出規則、5…文
節間修飾可能性検出部、6…文節属性付文節列、7…文
節最尤修飾先決定規則、8…文節最尤修飾先決定部、9
…修飾可能文節対マトリクス、10…文節間修飾構造。
─────────────────────────────────────────────────────
フロントページの続き
(58)調査した分野(Int.Cl.7,DB名)
G06F 17/21 - 17/28
Claims (7)
- 【請求項1】 日本語文の形態素列あるいは単語列(以
下、形態素列という)を入力とし、構文解析辞書及び構
文解析規則を参照し、日本語文の構文構造を出力する日
本語文構文解析装置において、文節を構成する品詞情報
とそれに由来する文節に付加する文節属性に基づいて、
文節の構成を記述した文節構成規則と、文節間の修飾可
能性を記述した文節間修飾可能性検出規則と、文節の修
飾先を決定する文節最尤修飾先例外規則と、品詞情報と
それに由来する文節属性だけで記述された構文解析規則
を有し、前記文節構成規則に基づき、形態素列を文節列
に変換し、文節属性を付加する文節合成手段と、前記文
節間修飾可能性検出規則に基づき、各文節間の修飾可能
性を検出する文節間修飾可能性検出手段と、各文節の修
飾先の決定にあたっては、最近接の修飾可能な文節を仮
修飾先として、順次遠方の修飾可能な文節について、前
記文節最尤修飾先例外規則に基づき検査し、例外条件を
満たせば、その都度その文節を仮修飾先としてつけか
え、修飾可能な文節が尽きた時点で、仮修飾先となって
いる文節を最尤修飾先と決定する文節最尤修飾先決定手
段とを備えることを特徴とする日本語文構文解析装置。 - 【請求項2】 前記文節最尤修飾先決定手段が、修飾先
を決定する文節を、文末側から順次文頭側に遡って選ん
でゆくことを特徴とする請求項1記載の日本語文構文解
析装置。 - 【請求項3】 前記文節最尤修飾先決定手段が、修飾先
を決定する文節を、修飾可能な文節が少ない側から選ん
でゆくことを特徴とする請求項1記載の日本語文構文解
析装置。 - 【請求項4】 指示を受け付ける対話制御手段と、指示
に応じて文節間修飾可能性及び文節最尤修飾先の状況を
表示する文節間修飾状況表示手段とを有し、文節修飾先
変更指示があった場合に、文節最尤修飾先決定を再度行
い、その文節最尤修飾先決定において、指示した文節の
修飾先を最優先に決定し、残る文節について順次最尤修
飾先を決定することを特徴とする請求項1〜3いずれか
1項に記載の日本語文構文解析装置。 - 【請求項5】 請求項1〜4のいずれか1項に記載の日
本語文構文解析装置による構文レベルの解析結果の内容
を、構文意味解析辞書を用いて、構文意味レベルの情報
を付加した解析結果とすることを特徴とする日本語文構
文解析装置。 - 【請求項6】 請求項1〜5のいずれか1項に記載の日
本語文構文解析装置の入力である形態素列を、漢字かな
混じり日本語文を入力とし、ひらがな以外の同一文字種
からなり、形態素辞書にない文字列に対し、複数の特定
の形態素品詞候補を与え、ひらがな文字列だけからなる
形態素をもつひらがな辞書と、助動詞、副詞、形式名詞
等の機能語やその他の例外語をもつ小規模な辞書とを有
する日本語文形態素解析手段を備えたことを特徴とする
日本語文構文解析装置。 - 【請求項7】 請求項1〜6のいずれか1項に記載の日
本語文構文解析装置を用い、日本語文を入力する入力手
段と、構文解析結果を出力する出力手段とを有すること
を特徴とする日本語文構文解析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33661692A JP3408830B2 (ja) | 1992-11-24 | 1992-11-24 | 日本語文構文解析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33661692A JP3408830B2 (ja) | 1992-11-24 | 1992-11-24 | 日本語文構文解析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06162077A JPH06162077A (ja) | 1994-06-10 |
JP3408830B2 true JP3408830B2 (ja) | 2003-05-19 |
Family
ID=18301002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33661692A Expired - Fee Related JP3408830B2 (ja) | 1992-11-24 | 1992-11-24 | 日本語文構文解析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3408830B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5533359B2 (ja) * | 2010-07-05 | 2014-06-25 | 富士ゼロックス株式会社 | 文校正プログラム及び文校正装置 |
-
1992
- 1992-11-24 JP JP33661692A patent/JP3408830B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
黒橋禎夫・長尾真,長い日本文における並列構造の推定,情報処理学会論文誌,日本,1992年 8月15日,Vol.33,No.8,p.1022−p.1031 |
Also Published As
Publication number | Publication date |
---|---|
JPH06162077A (ja) | 1994-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bender | Linguistic fundamentals for natural language processing: 100 essentials from morphology and syntax | |
US6470306B1 (en) | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens | |
US5878386A (en) | Natural language parser with dictionary-based part-of-speech probabilities | |
US6393389B1 (en) | Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions | |
US20060200336A1 (en) | Creating a lexicon using automatic template matching | |
US20060200338A1 (en) | Method and system for creating a lexicon | |
Smadja et al. | Using collocations for language generation 1 | |
JPH0383167A (ja) | 自然言語処理方法 | |
KR20160138077A (ko) | 기계 번역 시스템 및 방법 | |
US20060200337A1 (en) | System and method for template authoring and a template data structure | |
WO2002039318A1 (en) | User alterable weighting of translations | |
Wehrli et al. | The fips multilingual parser | |
Garside et al. | Higher-level annotation tools | |
Gershman | A framework for conceptual analyzers | |
JP3408830B2 (ja) | 日本語文構文解析装置 | |
Narayanan et al. | Iconic sql: Practical issues in the querying of databases through structured iconic expressions | |
JP3253311B2 (ja) | 言語処理装置および言語処理方法 | |
JPH04111063A (ja) | 複数文翻訳における訳語選択方法およびこれを用いた機械翻訳システム | |
JPH0561902A (ja) | 機械翻訳システム | |
Hsu et al. | The fact that these are opinions: Processing and acceptability patterns of subjective vs. objective information embedded under the fact that | |
JP2915225B2 (ja) | 文書作成装置 | |
Pouramini et al. | Annotation of grammatical function in the Persian treebank | |
JPH0244462A (ja) | 自然言語処理装置 | |
JPH04130577A (ja) | 自然言語処理装置 | |
JP2856775B2 (ja) | 文書作成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090314 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100314 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110314 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120314 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |