JPH09231221A - 文章解析方法および文章解析装置 - Google Patents

文章解析方法および文章解析装置

Info

Publication number
JPH09231221A
JPH09231221A JP8038389A JP3838996A JPH09231221A JP H09231221 A JPH09231221 A JP H09231221A JP 8038389 A JP8038389 A JP 8038389A JP 3838996 A JP3838996 A JP 3838996A JP H09231221 A JPH09231221 A JP H09231221A
Authority
JP
Japan
Prior art keywords
analysis
rule
context
result
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8038389A
Other languages
English (en)
Inventor
Eiji Komatsu
英二 小松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8038389A priority Critical patent/JPH09231221A/ja
Publication of JPH09231221A publication Critical patent/JPH09231221A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 自然言語で表現された文章を形態素解析、構
文解析、文脈解析の順に行ない該文章を解析するに当た
り、精度良く解析出来る方法を提供する。 【解決手段】 記憶部13に一般的な形態素、構文、文脈
の各解析規則の他に、(a) 形態素解析結果を修正する手
続きを含む構文解析規則、(b) 形態素解析結果を修正す
る手続きを含む文脈解析規則、(c) 構文解析結果を修正
する手続きを含む文脈解析規則、(d) 形態素解析結果お
よび構文解析結果を修正する手続きを含む文脈解析規則
のうちの少なくとも1種を追加格納する。構文、文脈の
各解析を実施する際、解析規則が追加された解析につい
ては、追加された規則も適用し解析結果を決める。解析
結果を決定した根拠とした解析規則中に追加された解析
規則があるかを判定する。該規則がある場合前記決定さ
れた解析結果を追加された規則に従い修正する。そうで
ない場合はそのまま最終解析結果とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は自然言語で表現された
文章を解析する方法およびその実施に好適な装置に関す
るものである。
【0002】
【従来の技術】自然言語で表現された文章を解析するた
めの従来方法として、例えば文献(野村浩郷:自然言語
処理の基礎技術,(社)電子情報通信学会発行,昭和63
年3月30日初版発行,PP1-23 )に開示された方法があ
る。この方法は、形態素解析、構文解析、文脈解析を順
に行なって、最終的な解析結果を得るものであった。こ
の方法では、前の解析の結果が、次の解析の入力とされ
る。
【0003】
【発明が解決しようとする課題】しかしながら、上述の
従来方法では、形態素解析又は構文解析で間違った解析
結果を出力すると、その解析結果を入力として行われる
次段の構造解析又は文脈解析の解析結果は保証されない
という欠点があった。具体例で言えば、例えば、形態素
解析で得た形態素「と」が格助詞か並列助詞かの区別
は、構文構造まで生成しないと区別できないため、形態
素解析だけで正しい形態素解析結果を得ることは難し
い。また、形態素解析で得た形態素「そこで」が接続詞
なのか代名詞と助詞とが連続したものなのかの区別は文
脈構造まで生成しないと区別できないため、やはり形態
素解析だけで正しい形態素解析結果を出力することは難
しい。同様に、構文解析についても、上記と同じ理由で
正しい構文解析結果が得られない場合が生じる。このた
め、文章の最終的な解析結果が保証されない場合が生じ
る。
【0004】
【課題を解決するための手段】そこで、この出願の文章
解析方法によれば、記憶手段に格納してある形態素解析
規則、構文解析規則、文脈解析規則を適用して形態素解
析、構文解析および文脈解析を順に行ない文章を解析す
る方法において、以下の手順を含むことを特徴とする。
【0005】先ず、前記記憶手段に、(a) 形態素解析結
果を修正する手続きを含む構文解析規則、(b) 形態素解
析結果を修正する手続きを含む文脈解析規則、(c) 構文
解析結果を修正する手続きを含む文脈解析規則、(d) 形
態素解析結果を修正する手続きおよび構文解析結果を修
正する手続きを含む文脈解析規則のうちの少なくとも1
種の解析規則を、追加格納しておく。そして、構文解析
および文脈解析それぞれを実施する際、前記のごとく解
析規則が追加された解析については、当該追加された規
則も含む解析規則を適用して解析結果を決定する。
【0006】次に、該解析結果を決定した根拠とした解
析規則中に前記追加された解析規則があるか否かを判定
する。そして、追加された規則があると判定された場合
は前記決定された解析結果を前記追加された規則に従い
修正してそれを当該解析の最終解析結果とし、一方、追
加された規則がないと判定された場合は前記決定された
解析結果を当該解析の最終解析結果とする。
【0007】この発明の文章解析方法によれば、形態素
解析規則では扱えない入力に対する解析規則(この発明
で言う修正手続きを含む規則)が構文解析規則およびま
たは文脈解析規則に含まれるようになる。また、構文解
析規則では扱えない入力に対する解析規則(この発明で
言う修正手続きを含む規則)が文脈解析規則に含まれる
ようになる。そして、修正手続きを含む解析規則をも用
いた解析がなされる。そして、修正手続きを含む解析規
則を適用して決定された解析結果についてはその修正規
則に従う修正がされてそれがその解析での最終解析結果
とされる。
【0008】また、この出願の文章解析装置によれば、
形態素解析規則、通常の構文解析規則および通常の文脈
解析規則を記憶していると共に、(a) 形態素解析結果を
修正する手続きを含む構文解析規則、(b) 形態素解析結
果を修正する手続きを含む文脈解析規則、(c) 構文解析
結果を修正する手続きを含む文脈解析規則、(d) 形態素
解析結果を修正する手続きおよび構文解析結果を修正す
る手続きを含む文脈解析規則のうちの少なくとも1種の
規則をさらに記憶している解析規則記憶部と、前記形態
素解析規則を適用し形態素解析結果を決定する形態素解
析部と、前記構文解析規則(ただし前記修正手続きを含
む構文解析規則を記憶部に記憶させてある場合は該規則
も含む)を適用して構文解析結果を決定する構文解析部
と、前記文脈解析規則(ただし前記修正手続きを含む文
脈解析規則を記憶部に記憶させてある場合は該規則も含
む)を適用して文脈解析結果を決定する文脈解析部と、
前記構文解析部および前記文脈解析部のうち前記修正手
続きを含む解析規則をも適用して解析をした解析部の解
析結果について、該解析結果を決定した根拠とした解析
規則中に前記追加された解析規則があるか否かを判定す
る解析規則判定部と、追加された規則があると判定され
た場合は前記決定された解析結果を前記追加された規則
に従い修正してそれを当該解析部の最終解析結果とし、
追加された規則がないと判定された場合は前記決定され
た解析結果を当該解析部の最終解析結果とする修正処理
実行部とを具えたことを特徴とする。
【0009】この発明の文章解析装置によれば、上述の
文章解析方法の発明を容易に実施することができる。
【0010】なお、これら文章解析方法および文章解析
装置のそれぞれの発明の実施に当たり、形態素解析、構
文解析、文脈解析それぞれは以下のように行なうのが良
い。先ず、形態素解析、構文解析、文脈解析それぞれの
解析規則は、各解析単位で個々の規則に優先度が予め付
与された規則としておく。そして、形態素、構文および
文脈の各解析に当たっては、解析規則を適用して全ての
解を求めそれらを例えばグラフスタック形式(フォーレ
スト形式とも称される。)で保存する。そして、これら
解を求めた根拠とした解析規則の優先度の和(解析規則
が1つである場合はその優先度)が最大となっている解
を当該解析における解析結果として決定する。このよう
な構成とした場合、各解析で優先度に基づいた解析結果
が先ず決定される。また、この決定された解析結果であ
ってこれを決定した根拠とした解析規則中に修正手続き
を含む規則があった(使用されていた)解析結果につい
て修正がなされる。そしてグラフスタックを用いるの
で、形態素解析および又は構文解析では修正可能かどう
かの判断が容易に行なえる。
【0011】
【発明の実施の形態】以下、図面を参照してこの文章解
析方法および文章解析装置の各発明の実施の形態につい
て説明する。
【0012】図1はこの文章解析装置の発明の実施の形
態を示した構成図である。図1において11は入力部、
13は解析規則記憶部、15は解析用辞書、17は形態
素解析部、19は構文解析部、21は文脈解析部、23
a,23bそれぞれは解析規則判定部、25a,25b
それぞれは修正処理実行部、27は出力部をそれぞれ示
す。
【0013】ここで、入力部11は、解析対象の文章を
入力するためのものである。この入力部11は、任意好
適なもので構成出来、例えばコンピュータのキーボード
およびそれに付随する手段により構成出来る。
【0014】また、解析規則記憶部13は、形態素、構
文、文脈の各解析に適用する規則を格納しているもので
ある。これは、例えばコンピュータに内蔵の記憶媒体或
は外部の好適な記憶媒体で構成出来る。なお、この実施
の形態の場合の解析規則記憶部13は、形態素解析規則
記憶部13aと、構文解析規則記憶部13bと、文脈解
析規則記憶部13cとで構成してある。
【0015】ここで形態素解析規則記憶部13aは、任
意好適な形態素解析規則を格納しているものである。表
1に形態素解析規則の一例を示す。
【0016】
【表1】
【0017】この表1の例では、名詞と助詞に関する接
続可能性のみを示してある。この表1において、「接続
可能()」は、第2項の形態素が第1項の形態素の後ろ
に接続可能であることを表す。「 = 」は、=の左側
の記号が属性を表し、=の右側の記載事項が属性値を表
す。「形態素()」は、括弧の中に列挙された属性、属
性値の組を性質として持つ形態素を表す。「RC」は右
側接続属性を表し、「LC」は左側接続属性を表
す。「:」の後の数字は各規則の優先度を表す。この表
1に示した形態素解析規則の例では、規則1により、名
詞と格助詞(例えば「フランス」の後に格助詞の「と」
が続く)、或は、規則2により、名詞と並列助詞(例え
ば「フランス」の後に並列助詞の「と」が続く)、或
は、規則3により、格助詞と名詞(例えば「父とイギリ
スへ行った。」のように、格助詞の「と」の後に「イギ
リス」が続く)、或は、規則4により、並列助詞と名詞
(例えば「フランスとイギリスへ行った。」のように、
並列助詞の「と」の後に「イギリス」が続く)は接続可
能であるが、格助詞同士(例えば格助詞「と」の後に並
列助詞「と」が続く)は、適当な規則がないので接続不
可能であることが規定される。
【0018】また、構文解析規則記憶部13bは、通常
の構文解析規則を記憶すると共に、形態素解析結果を修
正するための手続きを含む構文解析規則を追加記憶して
いるものである。ここで、通常の構文解析規則とは2つ
の文節の修飾関係を決定するため一般に用いられる構文
解析規則をいう。一方、形態素解析結果を修正するため
の手続きを含む構文解析規則とは、上記の通常の構文解
析規則に形態素解析結果を修正する手続きを含ませた構
文解析規則をいうものとする。なお、これらの構文解析
規則を区分けしたい場合は、前者を通常の構文解析規則
と称し、後者を「修正手続きを含む構文解析規則」と称
することとする(文章解析方法の発明において同
じ。)。表2に構文解析規則の一例を示す。ただしこの
表2の例では、名詞と助詞とからなる文節に関する規則
のみを示してある。
【0019】
【表2】
【0020】この表2において、「{」と「}」とで囲
まれた部分はサブルーチンを示し、「@{」と「}」と
で囲まれた部分は、1文の構文解析が終了した時点でか
つ解析規則判定部23の判定結果に応じて実行されるサ
ブルーチンを示す。「文節()」は、括弧の中に列挙さ
れた属性、属性値の組を性質として持つ文節を表す。
「POS」は形態素の品詞(a part of speech) を表
す。「CTR」は、文節の中心(center)となる自立語を
表す。「HW」は、形態素の見出しを表しHead Word の
略称である。「END」は、文節の最後にある形態素を
表す。「連用修飾()」は、第1項の文節が第2項の文
節を連用修飾することを表す。「連帯修飾()」は、第
1項の文節が第2項の文節を連用修飾することを表す。
「:」の後の数値は各規則の優先度を表す。
【0021】この表2に示した構文解析規則のうちの規
則1は、通常の構文解析規則であり、名詞に格助詞
「と」がついている場合は名詞が動詞を連体修飾すると
いう規則である。また規則2も、通常の構文解析規則で
あり、名詞に並列助詞「と」がついている場合は名詞が
意味的に類似した他の名詞を連体修飾するという規則で
ある。また規則3は、この発明でいう、修正手続きを含
む構文解析規則に相当するものである。具体的には、名
詞に格助詞「と」がついている場合でも形態素解析で格
助詞「と」を並列助詞「と」に修正することができ、連
体修飾が可能で、かつ、意味的に類似した名詞がある場
合には、格助詞「と」を並列助詞「と」に変更して、意
味的類似性のある名詞に連体修飾させることができると
いう規則である。規則4および規則5は、それぞれ通常
の構文解析規則であり、規則4は名詞に格助詞「へ」が
ついている場合は名詞が動詞を連体修飾するという規
則、規則5は名詞に格助詞「を」がついている場合は、
名詞が動詞を連体修飾するという規則である。なお表2
の例では、名詞と助詞とからなる文節のみしか記述して
いないが、他の品詞からなる文節についても、説明は省
略しているが適当な規則があるものと仮定する。
【0022】また、文脈解析規則記憶部13cは通常の
構文解析規則を記憶すると共に、この実施の形態では、
構文解析結果を修正するための手続きを含む文脈解析規
則、形態素解析結果を修正するための手続きおよび構文
解析結果を修正するための手続きを含む文脈解析規則を
追加記憶しているものである。もちろん、形態素解析結
果を修正するための手続きを含む文脈解析規則を追加規
則しているものであっても良い。ここで、通常の文脈解
析規則とは、文同士が関係を持ち得るかどうか、また、
持つとするとその関係は例えば表3で定義した文と文と
の関係のうちのどの関係にあるかを決定するため一般に
用いられる文脈解析規則をいう。
【0023】
【表3】
【0024】これに対し、形態素解析結果を修正するた
めの手続きおよび又は構文解析規則を修正するための手
続きを含む文脈解析規則とは、上記の通常の文脈解析規
則に形態素解析結果を修正する手続きおよび又は構文解
析結果を修正する手続きを含ませた文脈解析規則をいう
ものとする。これらの文脈解析規則を区分けしたい場合
は、前者を通常の文脈解析規則と称し、後者を「修正手
続きを含む文脈解析規則」と称することとする(文章解
析方法の発明において同じ。)。文脈解析規則の一例を
表4に示す。ただし、表4では、後の例文(図2参照)
による解析手順の説明に必要な文脈解析規則のみを示し
てある。
【0025】
【表4】
【0026】この表4において、「{」と「}」とで囲
まれた部分はサブルーチンを示し、「@{」と「}」と
で囲まれた部分は、文章の文脈解析が終了した時点でか
つ解析規則判定部23の判定結果に応じて実行されるサ
ブルーチンを示す。「SW」は文の先頭にある形態素列
を表す。「/」は2つの形態素が連続した構造を表す。
* 」は任意の文節を表す。「IW」は文のどこかに含
まれている形態素列を表す。「原因結果()」は、第1
項の文と第2項の文が原因結果の関係であることを表
す。「展開()」は、第1項の文と第2項の文とが展開
の関係であることを表す。「並列()」は、第1項の文
と第2項の文とが並列な関係であることを表す。「:」
の後の数値は優先度を表す。この表4に示した文脈解析
規則のうち、規則1はこの発明でいう追加の文脈解析規
則に相当する規則である。具体的には、:「ある文
(第1項の文と言う。)の後に第2項の文として接続詞
「そこで」が先頭にある文があり、:第1項の文に場
所を表す名詞があり、:第1項の文は第2項の文の原
因ではなく、:形態素解析規則と形態素解析用辞書に
含まれている情報を用いて「そこで(接続詞)」を「そ
こ(代名詞)/で(助詞)」の連続という結果を生成す
ることができ、かつ、:構文解析規則と構文解析用辞
書に含まれている情報を用いて、修正された形態素解析
結果を解析することができる場合に、形態素解析の結果
を修正し、構文解析の結果である2つの文を結び付け、
「展開」という関係を与えるという規則である。また、
規則5も修正規則を含む文脈解析規則に相当し、具体的
には、構文解析結果を修正する手続きを含む文脈解析規
則に相当する。残りの規則2〜4は、それぞれ通常の文
脈解析規則である。
【0027】解析用辞書15は、この場合、形態素解析
用辞書15aと、構文解析用辞書15bと、文脈解析用
辞書15cとで構成してある。そして、形態素解析用辞
書15aは形態素解析部17が必要とする情報を格納し
ているものである。構文解析用辞書15bは構文解析部
19が必要とする情報を格納しているものである。文脈
解析用辞書15cは文脈解析部21が必要とする情報を
格納しているものである。これら辞書15a〜15c
は、所定情報を格納した記憶媒体例えばコンピュータに
内蔵の記憶媒体或は外部の好適な記憶媒体等で構成出来
る。これらの辞書の一例として、形態素解析用辞書15
aの一例を表5に示す。
【0028】
【表5】
【0029】この場合の形態素解析用辞書15aには形
態素の見出し(HW)、品詞(POS)、左側接続属性
(LC)、右側接続属性(RC)が格納されている。左
側接続属性は、形態素の左側にどのような形態素が接続
できるかを規定するために用いられる属性であり、左側
に接続可能な形態素解析に基づいたカテゴリが決められ
ている。また、右側接続属性は、形態素の左側にどのよ
うな形態素が接続できるかを規定するために用いられる
属性であり、右側に接続可能な形態素解析に基づいたカ
テゴリが決められている。品詞と接続属性とは1対1に
は対応しておらず、品詞が同じでも接続属性が異なるこ
とがあり、逆に品詞が異なっても接続属性が同じことも
ある。
【0030】形態素解析部17は、解析対象の文章に形
態素解析規則を適用して、解析対象の文章を形態素解析
するものである。構文解析部19は、形態素解析結果を
用いかつこれに構文解析規則を適用して、解析対象の文
章を構文解析するものである。文脈解析部21は、構文
解析の結果を用いかつこれに文脈解析規則を適用して、
解析対象の文章を文脈解析するものである。またこの実
施の形態の各解析部17、19、21それぞれは、対応
する解析規則を適用して各解析において全ての解を求め
それをグラフスタック形式で保存する構成としてあり、
しかも、これら解を求めた根拠とした解析規則の優先度
の和が最大となっている解を当該解析における解析結果
として決定する構成としてある。これら解析部17,1
9,21それぞれは、例えばコンピュータで構成出来
る。
【0031】解析規則判定部23a,23bそれぞれ
は、各解析部が解析結果を決定した際の根拠とした解析
規則中に、前記追加された解析規則があるか否かを判定
するものである。ここでは構文解析部19から出力され
る解析結果についての当該判定は解析規則判定部23a
が担当し、文脈解析部21から出力される解析結果につ
いての当該判定は解析規則判定部23bが担当する構成
としてある。もちろん、解析規則判定部23を、構文解
析部19および文脈解析部21に共通な1つのものとし
ても良い。この解析規則判定部23a,23bは、例え
ばコンピュータで構成出来る。なお、追加された規則が
あるか否かは、例えば、全ての規則に予めコードを付け
ておき、追加の構文解析規則や追加の文脈解析規則のコ
ードに該当するコードが、上記の解析結果を決定した際
の根拠とした解析規則中にあるか否かを調べることによ
り行なえる。
【0032】修正処理実行部25a,25bそれぞれ
は、解析規則判定部23において追加された規則すなわ
ち追加の構文解析規則およびまたは追加の文脈解析規則
があると判定された場合は、前記決定された解析結果を
前記追加された規則に従い修正してそれを当該解析の最
終解析結果とし、追加された規則がないと判定された場
合は前記決定された解析結果を当該解析の最終解析結果
とするものである。ここでは構文解析部19から出力さ
れる解析結果についての処理は修正処理実行部25aが
担当し、文脈解析部21から出力される解析結果につい
ての処理は修正処理実行部25bが担当する構成として
ある。もちろん、修正処理実行部25を、構文解析部1
9および文脈解析部21に共通な1つのものとしても良
い。この解析規則判定部23a,23bは、例えばコン
ピュータで構成出来る。
【0033】出力部27は文章の解析結果や必要によっ
ては処理の途中経過などを出力するものである。この出
力部27は任意好適なもので構成出来、例えばディスプ
レイ、プリンタなどにより構成出来る。
【0034】次に、文章解析方法の実施の形態について
図1に加え図2〜図10を参照して説明する。ここで図
2は、解析対象の文章、ここでは第1〜第3の3つの文
からなり『フランスとイギリスヘ行く。そこで観光をす
る。次にイタリアへ行く。』という文章を示した図であ
る。また、図3は文章解析の手順を示した流れ図、図4
〜図10は、形態素解析、構文解析および文脈解析それ
ぞれの様子を説明する図である。
【0035】解析対象の文章は入力部11から形態素解
析部17へ送られる。形態素解析部17は、この文章の
各文に対して形態素解析を行う(図3のステップS
1)。詳細には形態素解析部17は、形態素解析用辞書
15a中の情報及び形態素解析規則記憶部13a中の解
析規則を用い、全ての解を求めこれらをグラフスタック
形式で保存する。それぞれの形態素には、品詞を付与す
る。ここでグラフスタック形式とは、異なった解析規則
や辞書情報を用いて形態素解析して得た複数の解につい
て同じ構造の部分は共有するようにして、解を圧縮した
データ構造である(以下の、構文、文脈の各解析におい
て同じ。)。図4に、図2中の第1文に対する形態素解
析で得られるグラフスタックを示した。図4に示したよ
うに、形態素解析の場合はグラフスタック構造にするた
めに形態素に文頭、文末と呼ぶダミーのノードが付け加
えられる。また、この図4において、r1〜r4は、そ
れぞれ表1に示した形態素解析規則中の規則1〜規則4
を意味し、rは規則1〜規則4或は表1では記載を省略
した他の形態素解析規則のいずれかを意味し、( )内
の数値はこれら規則に付与された優先度を意味する。次
に、形態素解析部17は、上記各解を求めた根拠とした
解析規則の優先度の和が最大となっている解を当該解析
における解析結果として決定する。図4の各解の例でい
えば、r1とr3とを適用した解ではこれら規則の優先
度の和が8、一方、r2とr4とを適用した解ではこれ
ら規則の優先度の和が7であるので、r1とr3とを適
用し求めた解が、この第1文に関する形態素解析の解析
結果と決定される。また、図5に、図2中の第2文に対
する形態素解析で得られるグラフスタックを示した。た
だしこの図5では、適用した規則の番号は省略し、単に
rと記載している。この第2文についても、上記第1文
の場合と同様に優先度の和に基づいて解析結果が決定さ
れる。図示は省略するが第3文についても上記と同様な
手順で全ての解を求め、そして優先度に基づいて解析結
果が決定される。このような手順で決定される形態素解
析結果について、第1文および第2文のみについて、図
6に示した。なお、図6において、形態素は見出しの後
に括弧付きの品詞を付けて表した。また、形態素の区切
りは「/」により表した。こうして決定される形態素解
析結果は、例えば解析対象文章に含まれる全ての文に対
する形態素解析が終了した時点で、構文解析部19へ送
られる。
【0036】また、構文解析部19は、すべての形態素
解析の結果に対して、構文解析を行なう(図3のステッ
プS2)。構文解析には、構文解析用辞書および構文解
析規則を用る。構文解析は、先ず、形態素解析結果から
文節を作成し、さらに、文末に位置する文節以外の文節
が、後続のいずれかの文節を修飾するように、修飾関係
を決定する。この決定は、修飾関係が交差しないように
行なう。修飾関係が交差とか、非交差とかは、周知のこ
とであるが、その一例を図7に示した。そして構文解析
部19は、構文解析用辞書15b中の情報及び構文解析
規則記憶部13b中の解析規則を用い、全ての解を求め
これらをグラフスタック形式で保存する。図8に、図2
中の第1文に対する構文解析で得られるグラフスタック
を示した。図8に示したように、構文解析の場合はグラ
フスタック構造にするためにrootと呼ばれるダミー
のノードが付け加えられる。また、この図8において、
r1,r3,r4は、それぞれ表2に示した構文解析規
則中の規則1,規則3,規則4を意味し、( )内の数
値はこれら規則に付与された優先度を意味する。この図
8に示した例の場合は、規則3により決定された解が、
優先度が最大であるので、構文解析結果と決定される。
なお、詳細は後述するが、この規則3は修正手続きを含
む構文解析規則であるので、ここで決定された解析結果
は後に修正を受けることになる。第2文および第3文に
ついても第1文の場合と同様に、規則を適用して全ての
解を求め、それらをグラフスタック形式で保存し、さら
に、これら解から優先度に基づき構文解析結果を決定す
る。第2文についての得られた解のグラフスタックを図
9に示した。なお、この図9では適用された規則番号は
省略してあり単にrとのみ記載してある。
【0037】次に、解析規則判定部23aは、構文解析
部19により決定された第1〜第3文それぞれの解析結
果について、該解析結果を決定した根拠とした解析規則
中に前記追加された解析規則があるか否かを判定する
(図3のステップS3)。ここで挙げた解析文章(図2
参照)の例では、第1文について構文解析結果を決定し
た解析規則中に、追加された解析規則(すなわち修正手
続きを含む構文解析規則)が存在している。すなわち、
図8を用い既に説明したように第1文について決定され
た構文解析結果はr3(規則3)の規則を適用した解で
ある。そして、規則3は表2に記載の通り、格助詞
「と」を並列助詞「と」に修正する手続きを含む構文解
析規則であるので、修正処理実行部25aは、形態素解
析結果および当該構文解析結果を修正する(図3のステ
ップS4)。修正手続きは例えば次のように行なう。修
正処理実行部25aは、形態素解析部17に保存してあ
るグラフスタックを参照し形態素解析の解として並列助
詞「と」があるか否かを調べる。解があるか否かを調べ
るのは、解がないのに修正をすると、形態素解析の結果
として存在し得ない解析結果となってしまう恐れがある
から、それを防止するためである。ここでは並列助詞
「と」という解があるので、修正処理実行部25は、形
態素解析結果について規則3に含まれる修正手続きを実
行し、また、構文解析結果についても同様に修正する。
この修正した構文解析規則はここでの最終解析結果とし
て文脈解析部21に送られる。図10(A)に第1文に
ついての構文解析の様子を示した。この図10(A)に
は格助詞の「と」が規則3により並列助詞の「と」に修
正された様子が示されている。なお、この図10(A)
の記述においては、文節は説明上必要な単語を除いて品
詞を省略した形態素列で表してある。さらに、修飾関係
は「(,)」により表してある。さらに、修飾の種類は
省略してある。
【0038】第2文および第3文についても、決定した
構文解析結果について該決定した根拠とした規則中に修
正手続きを含む構文解析規則が存在しているか否か等の
一連の処理を上記の第1文の手順と同様な手順で実行す
る。そして、修正手続きを含む構文解析規則が存在して
いる場合は、上記第1文の場合の手順に従い形態素解析
結果および構文解析結果を修正し、そしてこの修正した
結果をこの処理段階での最終解析結果として文脈解析部
21に送り、またそうでない場合は現在決定されている
解析結果をこの処理段階での最終解析結果として文脈解
析部21に送る。
【0039】文脈解析部21は、構文解析結果に対し
て、文脈解析を行なう(図3のステップS5)。詳細に
は文脈解析部21は、文脈解析用辞書15c中の情報及
び文脈解析規則記憶部13b中の解析規則を用い、全て
の解を求めこれらをグラフスタック形式(図示せず)で
保存する。そして、これら解のうちの、これら解を決定
した根拠となった文脈解析規則の優先度(表4中の各規
則の末尾の数値)の和が最大となった解を文脈解析結果
と決定する(図3のステップS5)。図11中のP1で
示した解析結果は、解析対象の文章(図2のもの)につ
いて文脈解析をして得た全ての解の中から上記優先度の
和が最大となった解すなわち決定された文脈解析結果で
ある。また、図11においてP2は後に説明するが修正
された文脈解析結果である。なお、この図11に示した
文脈解析結果P1、P2については、文は構文構造によ
り表してある。さらに、文と文との関係は「[;]」に
より表してある。さらに、文と文との関係の種類は省略
してある。
【0040】次に、解析規則判定部23bは、上記の文
脈解析結果P1を決定した根拠中に修正手続きを含む文
脈解析規則があるか否かを判定する(図3のステップS
6)。この判定において、この図11のP1で示した解
析結果を決定する根拠とした規則中に修正手続きを含む
文脈解析規則1(表4参照)が含まれていたとする(図
11では図示を省略している)。すなわち、接続詞「そ
こで」を、代名詞「そこ」と格助詞「で」とに修正する
手続きが含まれているとする。すると、修正処理実行部
25bはこの決定された文脈解析結果を修正する。この
修正手続きを例えば次のように行なう。修正処理実行部
25bは、構文解析部19に保存してあるグラフスタッ
ク(図9参照)を参照し構文解析の解として代名詞「そ
こ」と格助詞「で」があるか否かを調べる。解があるか
否かを調べるのは、解がないのに修正をすると、構文解
析の結果として存在し得ない解析結果となってしまう恐
れがあるから、それを防止するためである。ここでは解
があるので、さらに形態素解析部17に保存してあるグ
ラフスタック(図5参照)を参照し形態素解析の解とし
て代名詞「そこ」と格助詞「で」の形態素があるか否か
を調べる。解の有無を調べるのは上記と同じ理由であ
る。形態素解析17に保存されているグラフスタック中
には目的の解があり、また、構文解析部19に保存され
ているグラフスタック中にも目的の解があるので、修正
処理実行部25bは形態素解析結果、構文解析結果およ
び文脈解析結果それぞれの、接続詞「そこで」の部分を
代名詞「そこ」および格助詞「で」に修正する(図3の
ステップS7)。このように修正が済んだ文脈解析結果
を図11のP2部分に示す。
【0041】この図11のP2に示した最終的な文脈解
析結果から理解出来るように、従来方法では「フランス
/と」における「と」は、格助詞と誤解析され、「そこ
で」は接続詞と誤解析されてしまうところを、本発明の
方法によれば、『フランス/と(並列助詞)」および
「そこ(代名詞)/で(格続詞)』と正確に解析された
文脈解析規則が得られる。よって、この出願に係る文章
解析方法および文章解析装置の有用性が理解出来る。
【0042】なお、この出願の各発明は、例えば入力文
の誤りを修正する校正機能を具えた文章解析方法や文章
解析装置等、他の機能を有した文章解析方法や文章解析
装置に対しても適用出来る。
【0043】
【発明の効果】上述した説明から明らかなように、この
文章解析方法の発明によれば、形態素、構文、文脈の各
解析規則を記憶している前記記憶手段に、形態素解析結
果を修正する手続きおよび又は構文解析結果を修正する
手続きを含む解析規則を追加格納し、構文解析および文
脈解析それぞれを実施する際、前記のごとく解析規則が
追加された解析については、当該追加された規則も含む
解析規則を適用して解析結果を決定する。そして、該解
析結果を決定した根拠とした解析規則中に前記追加され
た解析規則があるか否かを判定し、追加された規則があ
ると判定された場合は前記決定された解析結果を追加さ
れた規則に従い修正してそれを最終解析結果とし、そう
でない場合て前記決定された解析結果をそのまま最終解
析結果とする。よって、後段の解析結果が前段の解析結
果にフィードバックされるので、形態素解析の精度や構
文解析の精度が従来に比べ向上する。
【0044】また、文章解析装置の発明によれば、所定
の、解析規則記憶部、形態素解析部、構文解析部、文脈
解析部、解析規則判定部および修正処理実行部を具えた
ので、上述の文章解析方法の発明を容易に実施すること
が出来る。
【図面の簡単な説明】
【図1】文章解析装置の実施の形態の説明図である。
【図2】解析対象の文章例を示した図である。
【図3】文章解析方法の実施の形態の説明図であり、解
析手順を示した流れ図である。
【図4】形態素解析の説明図(その1)であり、解析対
象文章の第1文について形態素解析をして得たグラフス
タックを示した図である。
【図5】形態素解析の説明図(その2)であり、解析対
象文章の第2文について形態素解析をして得たグラフス
タックを示した図である。
【図6】形態素解析の説明図(その3)であり、解析対
象文章における第1文および第2文それぞれについて決
定された形態素解析結果を示した図である。
【図7】構文解析の説明図(その1)であり、文節の修
飾関係に関しての交差と非交差の説明図である。
【図8】構文解析の説明図(その2)であり、解析対象
文章の第1文について構文解析をして得たグラフスタッ
クを示した図である。
【図9】構文解析の説明図(その3)であり、解析対象
文章の第2文について構文解析をして得たグラフスタッ
クを示した図である。
【図10】構文解析の説明図(その4)であり、解析対
象文章における第1文および第2文それぞれについて決
定された構文解析結果を示した図である。
【図11】文脈解析の説明図であり、決定された解析結
果P1と修正された解析結果P2とを示した図である。
【符号の説明】
11:入力部 13:解析規則記憶部 15:解析用辞書 17:形態素解析部 19:構文解析部 21:文脈解析部 23a,23b:解析規則判定部 25a,25b:修正処理実行部 27:出力部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 記憶手段に格納してある形態素解析規
    則、構文解析規則、文脈解析規則を適用して形態素解
    析、構文解析および文脈解析を順に行ない文章を解析す
    る方法において、 前記記憶手段に、(a) 形態素解析結果を修正する手続き
    を含む構文解析規則、(b) 形態素解析結果を修正する手
    続きを含む文脈解析規則、(c) 構文解析結果を修正する
    手続きを含む文脈解析規則、(d) 形態素解析結果を修正
    する手続きおよび構文解析結果を修正する手続きを含む
    文脈解析規則のうちの少なくとも1種の解析規則を、追
    加格納し、 構文解析および文脈解析それぞれを実施する際、前記の
    ごとく解析規則が追加された解析については、当該追加
    された規則も含む解析規則を適用して解析結果を決定
    し、 該解析結果を決定した根拠とした解析規則中に前記追加
    された解析規則があるか否かを判定し、 追加された規則があると判定された場合は前記決定され
    た解析結果を前記追加された規則に従い修正してそれを
    当該解析の最終解析結果とし、追加された規則がないと
    判定された場合は前記決定された解析結果を当該解析の
    最終解析結果とすることを特徴とする文章解析方法。
  2. 【請求項2】 請求項1に記載の文章解析方法におい
    て、 前記記憶手段に記憶させる形態素解析、構文解析、文脈
    解析の各解析規則は、形態素、構文、文脈の各規則ごと
    で個々の規則に優先度を予め付与したものとしておき、 形態素、構文および文脈の各解析に当たっては、前記解
    析規則を適用してそれぞれ全ての解を求めそれらをグラ
    フスタック形式で保存し、かつ、これら解を求めた根拠
    とした解析規則の優先度の和(解析規則が1つである場
    合はその優先度)が最大となっている解を当該解析にお
    ける解析結果として決定することを特徴とする文章解析
    方法。
  3. 【請求項3】 形態素解析規則、通常の構文解析規則お
    よび通常の文脈解析規則を記憶していると共に、(a) 形
    態素解析結果を修正する手続きを含む構文解析規則、
    (b) 形態素解析結果を修正する手続きを含む文脈解析規
    則、(c) 構文解析結果を修正する手続きを含む文脈解析
    規則、(d) 形態素解析結果を修正する手続きおよび構文
    解析結果を修正する手続きを含む文脈解析規則のうちの
    少なくとも1種の規則をさらに記憶している解析規則記
    憶部と、 前記形態素解析規則を適用し形態素解析結果を決定する
    形態素解析部と、 前記構文解析規則(ただし前記修正手続きを含む構文解
    析規則を前記記憶部に記憶させてある場合は該規則も含
    む)を適用して構文解析結果を決定する構文解析部と、 前記文脈解析規則(ただし前記修正手続きを含む文脈解
    析規則を前記記憶部に記憶させてある場合は該規則も含
    む)を適用して文脈解析結果を決定する文脈解析部と、 前記構文解析部および前記文脈解析部のうち前記修正手
    続きを含む解析規則をも適用して解析をした解析部の解
    析結果について、該解析結果を決定した根拠とした解析
    規則中に前記追加された解析規則があるか否かを判定す
    る解析規則判定部と、 追加された規則があると判定された場合は前記決定され
    た解析結果を前記追加された規則に従い修正してそれを
    当該解析部の最終解析結果とし、追加された規則がない
    と判定された場合は前記決定された解析結果を当該解析
    部の最終解析結果とする修正処理実行部とを具えたこと
    を特徴とする文章解析装置。
  4. 【請求項4】 請求項3に記載の文章解析装置におい
    て、 前記解析規則記憶部は、形態素解析、構文解析、文脈解
    析の各規則ごとに個々の規則に優先度が予め付与された
    規則を格納した記憶部としてあり、 前記形態素解析部、構文解析部および文脈解析部それぞ
    れは、前記格納された解析結果を適用して全ての解を求
    めこれらをグラフスタック形式で保存し、かつ、該全て
    の解のうちの各解を求めた根拠とした解析規則の優先度
    の和(解析規則が1つである場合はその優先度)が最大
    となっている解を当該解析における解析結果として決定
    する解析部としてあることを特徴とする文章解析装置。
JP8038389A 1996-02-26 1996-02-26 文章解析方法および文章解析装置 Pending JPH09231221A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8038389A JPH09231221A (ja) 1996-02-26 1996-02-26 文章解析方法および文章解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8038389A JPH09231221A (ja) 1996-02-26 1996-02-26 文章解析方法および文章解析装置

Publications (1)

Publication Number Publication Date
JPH09231221A true JPH09231221A (ja) 1997-09-05

Family

ID=12523936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8038389A Pending JPH09231221A (ja) 1996-02-26 1996-02-26 文章解析方法および文章解析装置

Country Status (1)

Country Link
JP (1) JPH09231221A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022539138A (ja) * 2019-07-02 2022-09-07 サービスナウ, インコーポレイテッド 自然言語理解(nlu)フレームワークを使用して意味探索を実行するシステムおよび方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022539138A (ja) * 2019-07-02 2022-09-07 サービスナウ, インコーポレイテッド 自然言語理解(nlu)フレームワークを使用して意味探索を実行するシステムおよび方法

Similar Documents

Publication Publication Date Title
Hajič Building a syntactically annotated corpus: The prague dependency treebank
JP2007265458A (ja) 複数の圧縮オプションを生成する方法およびコンピュータ
CA2504111A1 (en) Critiquing clitic pronoun ordering in french
US20010029443A1 (en) Machine translation system, machine translation method, and storage medium storing program for executing machine translation method
JP2003099426A (ja) 自然言語処理装置およびその制御方法ならびにプログラム
US20200097549A1 (en) Semantic processing method, electronic device, and non-transitory computer readable recording medium
US7389220B2 (en) Correcting incomplete negation errors in French language text
JPH09231221A (ja) 文章解析方法および文章解析装置
JPH05151261A (ja) 時制推敲支援システム
JP3433827B2 (ja) 句構造抽出装置
JP3222173B2 (ja) 日本語構文解析システム
JP3339006B2 (ja) 機械翻訳装置における並列名詞句処理装置
US20030088858A1 (en) Closed-loop design methodology for matching customer requirements to software design
JPH08235180A (ja) 機械翻訳装置
JP2002351871A (ja) 形態素解析装置、形態素解析方法、プログラムおよび記録媒体
JP3747957B2 (ja) 接続テーブル編集装置
JPH05143640A (ja) 日本語構文解析システム
JPH09212507A (ja) 文字処理装置と文字列の解析方法
JPH0934894A (ja) 補語情報の記述方法
DeRose For Builders of SGML DTDs and SGML Declarations
JPH0887506A (ja) パターン照合併用型翻訳処理装置
JPH09185623A (ja) 言語処理装置及び方法
Silberztein Translation by Michael Long, Université de Moncton
JPH04310181A (ja) コンピュータ利用の日本語解析方法
JPH01231167A (ja) 日本語文章処理方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030924