JP2504447B2 - 日本語文節間係り受け解析装置 - Google Patents
日本語文節間係り受け解析装置Info
- Publication number
- JP2504447B2 JP2504447B2 JP62052198A JP5219887A JP2504447B2 JP 2504447 B2 JP2504447 B2 JP 2504447B2 JP 62052198 A JP62052198 A JP 62052198A JP 5219887 A JP5219887 A JP 5219887A JP 2504447 B2 JP2504447 B2 JP 2504447B2
- Authority
- JP
- Japan
- Prior art keywords
- dependency
- bunsetsu
- phrase
- pair
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】 (発明の属する技術分野) 本発明は、入力装置から読み込まれた日本文の構造を
解析する日本語構文解析装置に関するものである。
解析する日本語構文解析装置に関するものである。
(従来の技術) 従来、日本文における係り受け解析としては、いわゆ
る句構造文法に従って、各文節の働きを数種〜数十種に
分割し、この分類に従って、 係りの文節は受けの文節より前に置かれる、 係りの文節は受けの文節を1つしか持ちえない、 係り受けの関係に交叉はない、 という係り受けの一般的法則を用いて、 係り受けの関係は規則的・意味的に許される限り最も
近い位置にある文節間で成り立つ、 という経験的な法則に沿って、各文節間の係り受けを試
行錯誤しながら認定することにより、文全体の係り受け
パターンを決定する態様がよく知られている。
る句構造文法に従って、各文節の働きを数種〜数十種に
分割し、この分類に従って、 係りの文節は受けの文節より前に置かれる、 係りの文節は受けの文節を1つしか持ちえない、 係り受けの関係に交叉はない、 という係り受けの一般的法則を用いて、 係り受けの関係は規則的・意味的に許される限り最も
近い位置にある文節間で成り立つ、 という経験的な法則に沿って、各文節間の係り受けを試
行錯誤しながら認定することにより、文全体の係り受け
パターンを決定する態様がよく知られている。
(発明が解決しようとする問題点) 上述の従来技術が用いている経験的法則は、格要素
と用言の親和性などの意味的な解析を行ないながら適用
するのでなければ、正しい係り受けを見落としてしまう
場合がある(例えば、「(a)彼が、(b)白い、
(c)家に、(d)住む」において、単にを適用すれ
ば(a)の係り先は(b)になってしまうため、意味的
な解析を行なって(a)が(b)に係りえないことを調
べておく必要がある)。
と用言の親和性などの意味的な解析を行ないながら適用
するのでなければ、正しい係り受けを見落としてしまう
場合がある(例えば、「(a)彼が、(b)白い、
(c)家に、(d)住む」において、単にを適用すれ
ば(a)の係り先は(b)になってしまうため、意味的
な解析を行なって(a)が(b)に係りえないことを調
べておく必要がある)。
すなわち、従来の技術では一般に係り受け解析を意味
解析の前段の処理として位置付けているにも拘らず、係
り受け解析を行なうために意味的な解析を行なう必要が
あるという入り組んだ構造を持っているため、処理を構
成する上で見通しが悪くなるという欠点を持っていた。
解析の前段の処理として位置付けているにも拘らず、係
り受け解析を行なうために意味的な解析を行なう必要が
あるという入り組んだ構造を持っているため、処理を構
成する上で見通しが悪くなるという欠点を持っていた。
また、上記技術においては、全ての係り受けパターン
の相対的な優劣を比較することは難しく、1つの係り受
けパターンに対して意味解析などによって妥当性を評価
してみて、それが適当であると判定されればそのまま先
に進むが、不適当であると判定されれば後戻りして別の
係り受けの解を求めるようにする制御が必要で、曖昧さ
がある場合にその曖昧さを残したまま解析を進めるのが
困難であった。
の相対的な優劣を比較することは難しく、1つの係り受
けパターンに対して意味解析などによって妥当性を評価
してみて、それが適当であると判定されればそのまま先
に進むが、不適当であると判定されれば後戻りして別の
係り受けの解を求めるようにする制御が必要で、曖昧さ
がある場合にその曖昧さを残したまま解析を進めるのが
困難であった。
(発明の目的) 本発明の目的は、上記技術の欠点を解決し、不適当な
係り受けの発生を防ぎながら曖昧さを解析の多義として
残した形で係り受けの解を得ることにある。
係り受けの発生を防ぎながら曖昧さを解析の多義として
残した形で係り受けの解を得ることにある。
(問題点を解決するための手段) 本発明の上記目的は、文節単位に区切られかつ文節が
単語単位に区切られた日本文を入力し,文節間の係り受
けの有意なパターンを出力する日本語文節間係り受け解
析装置において, 係り元となる文節の単語構成と係り先となる文節の単
語構成の組に対して成立する係り受け属性を保持してい
る文節対係り受け判定辞書と, 前記入力された日本文で係り受けが成立しうる文節対
を抽出し,該抽出した文節対の係り受け属性を求める文
節対係り受け判定処理部と, 係り受け属性の種類と前記入力された日本文に複数の
係り受け属性の種類が有る場合の処理優先順位との組に
して保持している係り受けパターン生成辞書と, 前記文節対係り受け判定処理部で求められた各文節対
の係り受け属性について前記パターン生成辞書より処理
優先順位を求め,該優先順位が高い係り受け属性で関係
付けられている文節対から順に係り受けを多義として展
開して係り受けパターンを生成する係り受けパターン生
成処理部 を有する ことを特徴とする日本語文節間係り受け解析装置によっ
て達成される。
単語単位に区切られた日本文を入力し,文節間の係り受
けの有意なパターンを出力する日本語文節間係り受け解
析装置において, 係り元となる文節の単語構成と係り先となる文節の単
語構成の組に対して成立する係り受け属性を保持してい
る文節対係り受け判定辞書と, 前記入力された日本文で係り受けが成立しうる文節対
を抽出し,該抽出した文節対の係り受け属性を求める文
節対係り受け判定処理部と, 係り受け属性の種類と前記入力された日本文に複数の
係り受け属性の種類が有る場合の処理優先順位との組に
して保持している係り受けパターン生成辞書と, 前記文節対係り受け判定処理部で求められた各文節対
の係り受け属性について前記パターン生成辞書より処理
優先順位を求め,該優先順位が高い係り受け属性で関係
付けられている文節対から順に係り受けを多義として展
開して係り受けパターンを生成する係り受けパターン生
成処理部 を有する ことを特徴とする日本語文節間係り受け解析装置によっ
て達成される。
(作 用) 本発明においては、従来の態様が1つずつ係り受け解
析結果を求めていた点に鑑みて、総当たり的に係り受け
解析結果を求めることにより曖昧さを解析の多義として
残すようにし、この際、係り受けの強いものを先に認定
することによって、係り受けの弱いものに判う不適当な
解析多義の発生を抑えるようにしている。
析結果を求めていた点に鑑みて、総当たり的に係り受け
解析結果を求めることにより曖昧さを解析の多義として
残すようにし、この際、係り受けの強いものを先に認定
することによって、係り受けの弱いものに判う不適当な
解析多義の発生を抑えるようにしている。
(実施例) 以下、本発明の一実施例について図面により説明す
る。
る。
第1図は本発明を適用した日本語構文解析システム全
体の基本ブロック図を示したものである。
体の基本ブロック図を示したものである。
入力装置1から入力される単語分割された日本文に対
し、文節対係り受け判定辞書5を用いる文節対係り受け
判定処理部2により、文節対の係り受けの有無を、また
係り受けが成立しうる場合は係り受け属性を同時に求め
る。
し、文節対係り受け判定辞書5を用いる文節対係り受け
判定処理部2により、文節対の係り受けの有無を、また
係り受けが成立しうる場合は係り受け属性を同時に求め
る。
次に、係り受けの成立する文節対を係り受けパターン
生成処理部3で、係り受けパターン生成辞書6による制
御に従って組み合わせ、文全体の係り受けパターンを求
め、出力装置4から出力する。
生成処理部3で、係り受けパターン生成辞書6による制
御に従って組み合わせ、文全体の係り受けパターンを求
め、出力装置4から出力する。
第2図は単語分割された入力日本文の例であり、 第3図は文節対係り受け判定辞書の構成例、 第4図は文節対係り受け判定処理部の動作例、 第5図は係り受けパターン生成辞書の構成例、 第6図は係り受けパターン生成処理部の動作例、 第7図は文節対係り受け判定処理部のフローチャー
ト、 第8図は係り受けパターン生成処理部のフローチャー
トである。
ト、 第8図は係り受けパターン生成処理部のフローチャー
トである。
以下、第2図の例に対する第1図における2・3の各
処理部の動作を第3図〜第6図を用いて説明する。
処理部の動作を第3図〜第6図を用いて説明する。
まず、文節対係り受け判定処理部2の動作は第7図の
通りであり、その動作例を第3図,第4図を用いて説明
する。
通りであり、その動作例を第3図,第4図を用いて説明
する。
本処理部では、文節を構成する単語の文法情報に対し
て、第3図で与えるような係り受け成立の条件を適用す
ることにより、係り受けの成立しうる文節対を調べ、同
時にその係り受け属性を求める。例えば、文節No.1と文
節No.2の文節対にはルールNo.304のルールが適用できる
ので、係り受け属性は「格関係」となる。
て、第3図で与えるような係り受け成立の条件を適用す
ることにより、係り受けの成立しうる文節対を調べ、同
時にその係り受け属性を求める。例えば、文節No.1と文
節No.2の文節対にはルールNo.304のルールが適用できる
ので、係り受け属性は「格関係」となる。
文節No.1と文節No.3の文節対にはルールNo.303のルー
ルが適用できるので、係り受け属性は「名詞名詞修飾」
となる。文節No.1と文節No.4の文節対には適用できるル
ールがないため、係り受けが成立しえない。
ルが適用できるので、係り受け属性は「名詞名詞修飾」
となる。文節No.1と文節No.4の文節対には適用できるル
ールがないため、係り受けが成立しえない。
以下同様にして、第4図における係り受け属性を得
る。
る。
次に、係り受けパターン生成処理部3の動作は第8図
の通りであり、その動作を第5図、第6図を用いて説明
する。
の通りであり、その動作を第5図、第6図を用いて説明
する。
本処理部では、第5図に示した係り受けパターン生成
辞書のルールを、ルールNo.1のルールから順に1回ずつ
適用することにより係り受けパターンを生成する。
辞書のルールを、ルールNo.1のルールから順に1回ずつ
適用することにより係り受けパターンを生成する。
例えば、文番号201の文では、第4図に示したように
“名詞名詞修飾”(文節No.1→文節No.3)、“埋込修
飾”(文節No.2→文節No.3)、“格関係”(文節No.1→
文節No.2、文節No.3→文節No.4)の3種類の係り受けが
成立する可能性があるので、第5図のうちルールNo.1,N
o.5,No.8の格ルールをこの順に1回ずつ適用する。
“名詞名詞修飾”(文節No.1→文節No.3)、“埋込修
飾”(文節No.2→文節No.3)、“格関係”(文節No.1→
文節No.2、文節No.3→文節No.4)の3種類の係り受けが
成立する可能性があるので、第5図のうちルールNo.1,N
o.5,No.8の格ルールをこの順に1回ずつ適用する。
第6図の状態X0は係り受けパターン生成処理部におけ
る対象文の初期状態である。まず,3種類の係り受けの関
係の強さの順序を第5図に示した係り受けパターン生成
辞書を参考にして判定する。まず,最も係り受け関係の
強いルールNo.1(“名詞名詞修飾”)を適用して,文節
No.1(“屋根の”)から文節No.3(“家に”)への係り
受けを固定した状態X1aを得る。このとき,文節No.3か
らは文節No.2(“白い”)への“格関係”の係り受け
(ルールNo.8)も成立する可能性もあるため(第4図参
照),文節No.1が未処理のままの状態X1bも作成してお
く。状態X1bば状態X0と同じ内容であり,状態X0をコピ
ーして得られる。このようにして入力文における最強の
係り受け関係のルールNo.1についての処理を終える。
る対象文の初期状態である。まず,3種類の係り受けの関
係の強さの順序を第5図に示した係り受けパターン生成
辞書を参考にして判定する。まず,最も係り受け関係の
強いルールNo.1(“名詞名詞修飾”)を適用して,文節
No.1(“屋根の”)から文節No.3(“家に”)への係り
受けを固定した状態X1aを得る。このとき,文節No.3か
らは文節No.2(“白い”)への“格関係”の係り受け
(ルールNo.8)も成立する可能性もあるため(第4図参
照),文節No.1が未処理のままの状態X1bも作成してお
く。状態X1bば状態X0と同じ内容であり,状態X0をコピ
ーして得られる。このようにして入力文における最強の
係り受け関係のルールNo.1についての処理を終える。
次に,先の3種類の係り受けのうち,2番目に係り受け
関係の強いルールNo.5(“埋込修飾”)をルールNo.1の
処理結果,即ち状態X1aとX1bに適用する。入力文(“屋
根の白い家に住む”)では埋め込み修飾は文節No.2から
文節No.3への係り受けとして存在している(第4図参
照)。ルールNo.5の適用により,状態X1aは状態X2aに,
状態X1bは状態X2bが得られる。(第6図) 最後に,先の3種類の係り受けのうち,最も係り受け
関係の弱いルールNo.8(‘格関係”)を上記結果に適用
する。“格関係”は,文節No.1(“屋根の”)から文節
No.2(“白い”)及び文節No.3(“家に”)から文節N
o.4(“住む”)に存在している。
関係の強いルールNo.5(“埋込修飾”)をルールNo.1の
処理結果,即ち状態X1aとX1bに適用する。入力文(“屋
根の白い家に住む”)では埋め込み修飾は文節No.2から
文節No.3への係り受けとして存在している(第4図参
照)。ルールNo.5の適用により,状態X1aは状態X2aに,
状態X1bは状態X2bが得られる。(第6図) 最後に,先の3種類の係り受けのうち,最も係り受け
関係の弱いルールNo.8(‘格関係”)を上記結果に適用
する。“格関係”は,文節No.1(“屋根の”)から文節
No.2(“白い”)及び文節No.3(“家に”)から文節N
o.4(“住む”)に存在している。
文節No.1から文節No.2への格関係係り受け;状態X2a
では,既に,文節No.1からの係り先は,より強い係り受
け関係“名詞名詞修飾”により決定されているので,状
態X2aを状態X3aとする。状態X2bについては文節No.1か
ら文節No.2への係り受けを設定して状態X3bを得る。
では,既に,文節No.1からの係り先は,より強い係り受
け関係“名詞名詞修飾”により決定されているので,状
態X2aを状態X3aとする。状態X2bについては文節No.1か
ら文節No.2への係り受けを設定して状態X3bを得る。
文節No.3から文節No.4への格関係係り受け;状態X3a,
状態X3bの文節No.3から文節No.4へのルールNo.8の係り
受け関係を適用し,状態X4a,状態X4bを得る。
状態X3bの文節No.3から文節No.4へのルールNo.8の係り
受け関係を適用し,状態X4a,状態X4bを得る。
以上で入力文の文節間に生じ得る係り受け関係の有意
な組合せパターンが生成されたことになる。
な組合せパターンが生成されたことになる。
第2図に示す文番号202についても同様に処理して,
第6図の状態Y3a,Y3bが得られる。
第6図の状態Y3a,Y3bが得られる。
このようにして得られた解析の多義は、文番号201の
「屋根の白い家に住む」と「彼の白い家に住む」、文番
号202の「屋根が白い家に住む」と「彼が白い家に住
む」の比較からわかるように、名詞と形容詞または動詞
の親和性を考慮していないために生じるものであり、本
発明に基づく装置による処理の後で意味的な親和性を考
慮することにより容易に正解パターンに絞り込むことが
できる。
「屋根の白い家に住む」と「彼の白い家に住む」、文番
号202の「屋根が白い家に住む」と「彼が白い家に住
む」の比較からわかるように、名詞と形容詞または動詞
の親和性を考慮していないために生じるものであり、本
発明に基づく装置による処理の後で意味的な親和性を考
慮することにより容易に正解パターンに絞り込むことが
できる。
(発明の効果) 以上説明したように、本発明によると、日本語の表現
に合わない解析多義の発生を抑えながら、日本文の曖昧
さを解析多義として残すことができる。
に合わない解析多義の発生を抑えながら、日本文の曖昧
さを解析多義として残すことができる。
また、係り受け解析処理の中に意味的な解析を行なう
処理を必要としないため、意味解析を行なうシステムと
組み合わせたとき、全体の制御を見通しよく構成でき
る。
処理を必要としないため、意味解析を行なうシステムと
組み合わせたとき、全体の制御を見通しよく構成でき
る。
第1図は本発明を適用した日本語構文解析システム全体
の基本ブロック図、 第2図は単語分割された入力日本文の例、 第3図は文節対係り受け判定辞書の構成例、 第4図は文節対係り受け判定処理部の動作例、 第5図は係り受けパターン生成辞書の構成例、 第6図は係り受けパターン生成処理部の動作例、 第7図は文節対係り受け判定処理部のフローチャート、 第8図は係り受けパターン生成処理部のフローチャート
である。 1……入力装置、 2……文節対係り受け判定処理部、 3……係り受けパターン生成処理部、 4……出力装置、 5……文節対係り受け判定辞書、 6……係り受けパターン生成辞書。
の基本ブロック図、 第2図は単語分割された入力日本文の例、 第3図は文節対係り受け判定辞書の構成例、 第4図は文節対係り受け判定処理部の動作例、 第5図は係り受けパターン生成辞書の構成例、 第6図は係り受けパターン生成処理部の動作例、 第7図は文節対係り受け判定処理部のフローチャート、 第8図は係り受けパターン生成処理部のフローチャート
である。 1……入力装置、 2……文節対係り受け判定処理部、 3……係り受けパターン生成処理部、 4……出力装置、 5……文節対係り受け判定辞書、 6……係り受けパターン生成辞書。
Claims (1)
- 【請求項1】文節単位に区切られかつ文節が単語単位に
区切られた日本文を入力し,文節間の係り受けの有意な
パターンを出力する日本語文節間係り受け解析装置にお
いて, 係り元となる文節の単語構成と係り先となる文節の単語
構成の組に対して成立する係り受け属性を保持している
文節対係り受け判定辞書と, 前記入力された日本文で係り受けが成立しうる文節対を
抽出し,該抽出した文節対の係り受け属性を求める文節
対係り受け判定処理部と, 係り受け属性の種類と前記入力された日本文に複数の係
り受け属性の種類が有る場合の処理優先順位とを組にし
て保持している係り受けパターン生成辞書と, 前記文節対係り受け判定処理部で求められた各文節対の
係り受け属性について前記パターン生成辞書より処理優
先順位を求め,該優先順位が高い係り受け属性で関係付
けられている文節対から順に係り受けを多義として展開
して係り受けパターンを生成する係り受けパターン生成
処理部 を有する ことを特徴とする日本語文節間係り受け解析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62052198A JP2504447B2 (ja) | 1987-03-09 | 1987-03-09 | 日本語文節間係り受け解析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62052198A JP2504447B2 (ja) | 1987-03-09 | 1987-03-09 | 日本語文節間係り受け解析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63219072A JPS63219072A (ja) | 1988-09-12 |
JP2504447B2 true JP2504447B2 (ja) | 1996-06-05 |
Family
ID=12908087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62052198A Expired - Lifetime JP2504447B2 (ja) | 1987-03-09 | 1987-03-09 | 日本語文節間係り受け解析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2504447B2 (ja) |
-
1987
- 1987-03-09 JP JP62052198A patent/JP2504447B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS63219072A (ja) | 1988-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Geurts et al. | Domain restriction | |
Leffa | Clause processing in complex sentences | |
JP2504447B2 (ja) | 日本語文節間係り受け解析装置 | |
JP3017098B2 (ja) | 自然言語処理装置および方法 | |
Di Sciullo | Domains of argument structure asymmetries | |
KR102661819B1 (ko) | 시간적 관계정보의 컨텍스트 이해를 위한 오픈 도메인 정보 활용 방법 | |
JPH0656614B2 (ja) | 生成文法自動生成装置 | |
Fujita et al. | An automatic method of creating valency entries using plain bilingual dictionaries | |
JPH10269215A (ja) | 自然言語解析装置 | |
Seeker | Modeling the interface between morphology and syntax in data-driven dependency parsing | |
JPH03125264A (ja) | キーワード抽出装置 | |
JPH0754524B2 (ja) | 日本語文節間係り受け解析装置 | |
JPH1091628A (ja) | 構文解析システム | |
JPH04372060A (ja) | 日本語解析装置 | |
JPH064570A (ja) | 構文解析システム及び構文解析制御方式 | |
JPH0934894A (ja) | 補語情報の記述方法 | |
JPH0262666A (ja) | 文生成方式 | |
DI SCIULLO | New Trends in Software Methodologies, Tools and Techniques 207 H. Fujita and M. Mejri (Eds.) IOS Press, 2005 2005 The authors. All rights reserved. Handling Pronouns Intelligently | |
JPH05143638A (ja) | 自然言語解析方法 | |
JPH0528180A (ja) | 構文解析制御方式 | |
JPS61281367A (ja) | 英語解析における名詞句決定方式 | |
Clauses et al. | RECENTLY DOG CHASE CAT COME HOME | |
JPH0650503B2 (ja) | 情報抽出装置 | |
Wenjie | A-not-A Questions in Mandarin Chinese: An HPSG Account | |
JPS63219069A (ja) | 日本語文節間係り受け解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |