JPS58175075A

JPS58175075A - 構文分析方式

Info

Publication number: JPS58175075A
Application number: JP57057921A
Authority: JP
Inventors: Masaie Amano; 天野　真家; Hideki Hirakawa; 秀樹平川
Original assignee: Toshiba Corp; Tokyo Shibaura Electric Co Ltd
Current assignee: Toshiba Corp
Priority date: 1982-04-07
Filing date: 1982-04-07
Publication date: 1983-10-14

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は与えられた原文中の辞書に未登録な単語の存在
によって生じる上記原文の構文分析不能事態を効果的に
回避することのできる実用性の高い構文分析方５ｔ、に
関する。

〔発明の技術的背景とその問題点〕

近時、計算機システムを利用した文章解析・作成装置が
注目されている。中でも、与えられた文章の構文を自動
分析し、その分析結果に従って文書作成・編集を行うこ
ともなされている。

しかして、与えられた文章（原文）の構文分析を行５場
合、一般に単語と共にその属性が登録された辞書を用い
て上記原文を構成する各単＃ＭＯ属性をそれぞれ求め、
これらの属性の繋が）関係と丈法規期とによって分析処
理がなされる。ところが、一般的に文章を構成する可能
性のある単語が全て辞書に登録されているとはいえず、
しばしば未登録単語が上記分析すべき原文中Ｋ１Ｉ４わ
れｂことが多い、この場合、その単＠に対する属性を決
定することができない為、構文分析が不可能となる。そ
して、その文章に対する他層を中断ぜざるを得ないと云
う不慮の事態が発生することＫなる。

〔発明の目的〕

本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、与えられ九文章中に辞書に未登
録な単断が含まれ、そＯ単語に対して辞書引きによって
属性を与えることがで龜ないような場合であっても上記
文章の構文分析を効果的に行うことのできる実用性の高
い構文分析方式を提供することにある。

〔発明の概要〕

本発明は、与えられた文章（原文）を構成する各単１ｍ
１に辞書引きＫよってそれぞれ属性を与え、これらの属
性の繋が夛関係から上記文章の構文を分析すると共に１
この構文分析中に上記辞書１龜によって属性が与えられ
なかった単語が見出されたとき、上記構文分析の文法規
則上期待される属性を上記単語に与えて前記構文分析を
継続させるようにし友ものである。

〔発明の効果〕

従って本発明によれば、辞書引きによって属性が与えら
れなかつ九単語が存在しても、つま夛原文申に辞書に登
録されていない単語が存在しても、その属性を文法規則
上から推定してこれを与えて構文分析を行うので、構文
分析不能による文章処理の中断を招くことがない、しか
もめらゆゐ単語を登録した大容量の辞書を準備する必要
がないので汎用性に富み、その実用的利点が絶大である
等の効果を奏すゐ。

〔発明の実施例〕

以下、ｇｉｇｉを参照して本発明方式〇一実施例につき
説明する。

構文分析に供され為文章（原文）は、先ずそれを構成す
る単ｌｌｋ区分され、各単語について辞書を検索してそ
の属性が調べられる。辞書は、複数の単語をその属性の
情報と共にそれぞれ対応して登録したものであり、上記
属性は例えば華論の品詞情報として与えられる。この品
關の情報は、例えば次表の如く示される。

しかして次に、上記各単語に付され丸属性の繋が〉関係
から、所定の文法規則に従って前記原文の構文分析が行
われる。

第１図（ａ）〜（ｃ）は文法規則の一例を示すもので○
印はステート、９印は最終ステートを示してお）、上記
各ステートを結ぶラインはアークを示している。構文分
析は上記アークを介して各ステートを辿ることによ）行
われる。

ζこで今、縞２図に示すようにｒ　Ｉ　ＥＡＴ　ＡＮＡ
ＰＰＬＥ　Ｊなる原文が構文分析の為に与えられ九とす
る。そして、この原文中の［ムＰＰＬＩ　Ｊ　ｌｋる単
語が辞書く未登録であったとする。この場合、辞書引き
によって！２図に示すようにｒＩＪなる単語には「Ｎ」
なる属性が、ｒ　ＥＡＴ　ＪなるｊＩＬＪＷＫはｒ　Ｖ
Ｔ　Ｊなる属性が、「ｌ」なる単語にはｒ　ＤＩ丁」な
る属性がそれヤれ付される。しかし、「ムＰＰＬＩ　Ｊ
　＊る単語については、辞書に登録されていないことか
ら、その属性が不明となっている。

そこでこのような状履くおいて、これらの属性の繋がル
関係から次のようにして、その構文分析が行われる。こ
の構文分析は先ず、ステートＳから、アークＮＰを辿る
ことによって行われる。このアータＮＰＫ示される文法
規則の下位構造は＠ＩＩＩ（ｂＪＫ示される通夛であシ
、前記与えられた原文の最初の単語の属性がＮであるこ
とから、ステートＮＰよりアークＮを辿ってその最終ス
テー）（ｉＫ行會つく、この最終ステートＱｍへの到達
によって上位の文法構造に復帰し、そのステートｑ＊Ｋ
Ｊ！る。これＫよ夕、先ずアークＮＰＫ対する文法処理
が終了する。

しかるのち、今Ｒ＃ｉステー）１１１からアークｖＰを
辿るが、このアークＶＰＯ下位構造が＠１図（ｃ）　Ｋ
示されることから、ステー）ＶＰから発するアータＶ丁
をチェックする。与えられた原文の第２番目の単語の属
性がこれに一致することから、このアークＶＴを辿９、
ステートｑ＠に到着する。

しかして、このステートｑ−からは、アークＮＰが出て
いるので、先に説明した第１図（ｂ）に示す文法構造の
チェックに移る。この文法構造にあっては、ステー）Ｎ
Ｐより出発するアークはＤＩＣＴとＮであル、与えられ
た原文ｏ１ｇｓ１００単語の属性がｒ　ＤＥＴ　Ｊであ
ることから上記アークＤＥＴをｍシ、ステートｑｓＫ到
達する０以上により、原文の最初から３語までの単語に
対する構文分析が完了する。

次に、ステートｑ１からの文法規則を分析する訳である
が、原文の！４番目の檗ＩＩｇＫついては、その属性が
与えられていないことから、その属性について次のよう
な推定が行われる。即ち、文法規則上、ステートｑｓよ
り出発するアークはＮとムＤＪとの２つ番や、上記「廿
ＰＩＪ　Ｊなる単＠Ｏ属性として文法規則上ｒＮＪｌる
いは「ムＤＪ　Ｊが期待される。そこで先ず上記期待さ
れる属性ｒ　ＤＥＴ　Ｊを「ムＰＰＬＥ　Ｊなる単暗に
与えて゛、その構文分析を行う、しかし、この−合には
アークＡＤＪによって到達するステー）（１４が最終ス
テートでなく、シかも原文中に終に続く単語が存在しな
ｉことから、構文分析に失敗する。この結果、上記属性
の仮定が−っていることが判る。しかるのち、今度はｒ
　ＡＰＰＬＥ　Ｊなる単語の属性として、残された属性
「Ｎ」を仮定し、文法規則に従う構文分析を行う、この
場合、ステー）ＱｌからアークＮを辿って最終ステー）
Ｑｌに到達し、これによって第１図（ｃ）に示す最終ス
テー）ｑｙＫ復帰したのち、更に同図（１）Ｋ示す最終
ステートｑ雪に復帰して、その構文分析に区切）がつく
、同時に原文を構成する単語の属性チェックが尽きるこ
とによシ、ここに構文分析の成功結果を得ることになる
。

以上のように、原文に対する構文分析は、その構文分析
中に属性の付されていない単語が出現したとき、そＯ単
語に対して文法規則上期待される属性を推定し、これを
与えて上記構文分析を継続させるととくよって行われる
。従って、辞書に未登録な単語を含む文章が与えられた
場合であっても、その構文分析を効果的に行うことがで
き、これによって文章処理が中断されるような不具合を
招くことがない、しかも上述したように辞書に未登録な
単語を含む文章に対しても、その単語に過当な属性を与
えて構文分析を実行することができるので、辞書として
あらゆる出現可能性のある単語を登録する為の大容量の
ものを準備する必要がない等の実用上絶大なる効果を奏
する。

さて、第３図は上述した構文分析を行う実行プログラム
の処理フローの一例を示すものである。ｉち、このプロ
グラムが起動１され友とき、先ずステップ２において与
えられた原文を構成する各単語に対して辞書引きを行い
、各単語にそれぞれ属性を与える。しかるのち次のステ
ツｆｓでは、上記原文を構成する各単語についてサーブ
し、その全てに属性が与えられているか否かをチェック
する。そして、ステツｆ４において上記チェック結果を
判定し、全ての巣飴に属性が付けられている場合には、
ステツｆ５においてその構文分析を実行する。この構文
分析は＃述した第１図（１）〜（ａ）　Ｋ示す如き文法
規則に従って行われる。

一方、ステラ７’４における判定によって、属性が付け
られていない単語が残されてｂると判定された場合、そ
の状態のままステツ１６によって構文分析が行われる。

しかるのち、ステップ７を介してその構文分析の成功・
不成功の判定がなされ九のち、ステラ７’ＪＫて属性の
ついていない単語が存在するか否かの判定が行われ、ス
テラｆ夕でその結果が弁別される。そして、ステップＩ
Ｏにおいて、上記属性の与えられていない単語に対して
文法規則上からその属性が推定され、これが与えられる
。以後、ステツ！６〜１０が繰返して実行される。

このようなルーテンによる属性の推定と、その構文分析
が繰返して行われ、ステツｆ６の構文分析が成功した場
合、ステップ７の＋Ｕ足によ９成功が見出されて、その
処理を終える。またステップ１により、属性のついてい
ない事始のチェックがなされ、文法規則上、それについ
て期待される属性がなくなつ九場合には、ステツｆ＃の
判定によって、その処理を終了する“ことになる。

以上の制御フローによって、前述した構文分析処理が簡
易にして効果的に実行されることになる。そして、上述
した如く、辞書に未登録な単語を含む原文につめても、
その構文分析を効果的に行うことが可能となる。従って
、その実用的利点は絶大であり、構文分析の一形態とし
て非常に有用である。

尚、本発明は上記実施例に限定されるものではない１例
えば推定し九属性によって構文分析の成功結果が複数得
られる場合もあるが、このような場合には、これらの全
てを分析結果として得るようにすればよい、また一つの
文章中に辞１ｉＦＫ未登録な単一が複数個存在する場合
もあるが、そのときには未登録単語が出現する都度、そ
の属性の推定処ｍを行うようにすればよい。

また文法規則は上記蕗１図葎）〜（ｃ）に示すものに限
定されないとは勿論のことであシ、属性として品詞の情
報に限定されないことも云うまでもない、要するに本発
明はその要旨を逸脱しないｍ囲で種々変形し、応用して
実施することができる。

【図面の簡単な説明】

図は本発明の一実施例を説明する為のもので、第１図（
ａ）〜（ｃ）は文法規則の一例を示す図、第２図は与え
られ九原文例とその属性の関係を示す図、第３図は実施
例に係る構文分析処理の制御フローを示す図である。２・・・辞書引き処理、３・・・属性付けの判定処理、
５．６・・・構文分析処理、１０・・・属性の推定処塊
。出願人代理人　　弁理士　鈴　江　武　彦牙１図牙　２図牙３図

Claims

【特許請求の範囲】

複数の単語とその属性の情報とをそれぞれ対応させて登
録した辞書と、この辞書を検索して、与えられた原文を
構成する各単語にそれぞれ属性を与える辞書引き手段と
、この手段によ〕与えられた各単語の属性の関係から上
記原文の構文を分析する手段と、仁の構文分析中に前記
辞書引きＫよる属性の与えられていない単語が見出され
たとき上記構文分析の文法規則上期待される属性を上記
填語に与えて前記構文分析を継続させる手段とを具備し
たことを特徴とする構文分析方式。