JP2504449B2 - 日本語文節間係り受け解析装置 - Google Patents

日本語文節間係り受け解析装置

Info

Publication number
JP2504449B2
JP2504449B2 JP62053175A JP5317587A JP2504449B2 JP 2504449 B2 JP2504449 B2 JP 2504449B2 JP 62053175 A JP62053175 A JP 62053175A JP 5317587 A JP5317587 A JP 5317587A JP 2504449 B2 JP2504449 B2 JP 2504449B2
Authority
JP
Japan
Prior art keywords
dependency
phrase
processing unit
bunsetsu
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62053175A
Other languages
English (en)
Other versions
JPS63220362A (ja
Inventor
諭 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP62053175A priority Critical patent/JP2504449B2/ja
Publication of JPS63220362A publication Critical patent/JPS63220362A/ja
Application granted granted Critical
Publication of JP2504449B2 publication Critical patent/JP2504449B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 (発明の属する技術分野) 本発明は、入力装置から読み込まれた日本文の構造を
解析する日本語構文解析装置に関するものである。
(従来の技術) 従来、日本文における係り受け解析としては、いわゆ
る句構造文法に従って、各文節の働きを数種〜数十種に
分類し、この分類に従って、 係りの文節は受けの文節より前に置かれる、 係りの文節は受けの文節を1つしか持ちえない、 係り受けの関係に交叉はない、という係り受けに関す
る一般的な法則を用いて、各文節間の係り受けを試行錯
誤しながら認定することにより、文全体の係り受けパタ
ーンを決定する態様がよく知られており、この態様では
主体的表現に関する係り受け(例えば、「本を決して読
みはしない」における「決して」と「…ない」の呼応)
は対象外として扱わないか、例外処理(例えば、「決し
て」に対して「否定」の様相を含む述語文節を捜し出し
て係り受けを修正する)により対処するかしていた。
(発明が解決しようとする問題点) 上述の従来技術が用いている一般的法則のうち、に
は、「(a)本を、(b)決して、(c)読みは、
(d)しない」のような文において、(b)→(d)の
「ない」のような陳述の呼応がある場合に、一般的な係
り受けである(a)→(c)との間で係り受けの交叉を
生じることが知られている。
また、「(a)私は、(b)昨日、(c)走った」に
おいて、細かく見ればやはり一般的な係り受けである
(a)→(c)の「走っ」と、時に関する係り受けであ
る(b)→(c)の「た」との間で交叉を生じている。
すなわち、上記従来技術においては、主として客体的
な表現の係り受けを各文節間の係り受けが交叉しないよ
うに組み合わせるため、客体的表現とは異質な主体的表
現に関する係り受けを扱うためには、扱う主体的表現の
種類の数だけ例外処理を用意する必要があり、さらにこ
れらの例外処理相互の無矛盾性が保てなければ所期の結
果が得られないという問題がある。
(発明の目的) 本発明の目的は、上記従来技術の欠点を解決し、日本
文の係り受け解析の精度向上とその制御の簡易化を同時
に実現することにある。
(問題点を解決するための手段) 本発明の上記目的は、1個以上の単語から成りひとま
とまりの表現を表している文節を単位として区切られた
日本文を入力し,該日本文を構成する文節間の係り受け
関係を出力する日本語文解析装置において, 格助詞や副助詞を伴い,活用語の場合はその語形変化
を含む自立語から発生する客体的係り,並びに,客体的
受けをそれぞれ保持した客体的係り受け解析辞書と, 格助詞や副助詞を伴い,活用語の場合はその語形変化
を含む自立語と他の自立語との間に成立する客体的表現
を前記入力文から抽出し,客体的係り受け関係を解析し
て係り受け関係が成立しうる文節対を出力する客体的係
り受け解析処理部と, 陳述副詞・接続詞・係助詞が要求するまたは拒否する
主体的係りと,終助詞・助動詞・零陳述記号から発生す
るまたは拒否する主体的受けとをそれぞれ保持した主体
的係り受け解析辞書と, 陳述副詞・接続詞・係助詞と終助詞・助動詞・零陳述
記号との間で成立する話者の主張の態度や確信度または
時間的な関係を表す主体的表現を前記入力文から抽出
し,主体的係り受け関係を解析して係り受け関係が成立
しうる文節対と係り受け関係が成立し得ない文節対とを
出力する主体的係り受け解析処理部と, 前記客体的係り受け解析処理部と前記主体的係り受け
解析処理部との各出力を入力し,係り元文節の係り先の
候補文節が,前記主体的係り受け解析処理部と前記客体
的係り受け解析処理部との両方から出力されている場
合,前記主体的係り受け解析処理部から出力された候補
文節が,前記係り元文節と係り受け関係が成立し得る文
節の場合には該文節を前記係り元文節に対する係り先文
節として出力し,前記係り元文節と係り受け関係が成立
し得ない文節の場合には前記主体的係り受け解析処理部
から出力された候補文節を前記係り元文節に対する係り
先文節として出力する係り受け認定処理部と を有する ことを特徴とする日本語文節間係り受け解析装置によっ
て達成される。
(作 用) 本発明においては、従来の態様が種々の係り受けを単
一の枠組みの中で捉えようとしていた点を鑑みて、客体
的表現と主体的表現とを別の枠組みで扱うようにし、こ
の両者の相互関係で両者の解析多義を制約させることに
より解析多義の極小化を図っている。
(実施例) 以下、本発明の一実施例について図面により説明す
る。
第1図は本発明を適用した日本語構文解析システム全
体の基本ブロック図を示したものである。入力装置1か
ら入力される単語分割された日本文に対し、客体的係り
受け解析辞書3を用いる客体的係り受け解析処理部2に
よる処理と、主体的係り受け解析辞書5を用いる主体的
係り受け解析処理部4による処理とを並列的に進め、客
体的係り受け解析結果と主体的係り受け解析結果とを得
る。この2種類の結果に基づいて、係り受け認定処理部
6で入力文全体に対する係り受けを決定し、出力装置7
から出力する。
第2図は単語分割された入力日本文の例であり、 第3図は客体的係り受け解析辞書3の構成例、 第4図は客体的係り受け解析処理部2の動作例、 第5図は主体的係り受け解析辞書5の構成例、 第6図は主体的係り受け解析処理部4の動作例、 第7図は係り受け認定処理部6の動作例、 第8図は係り受け認定処理部6により得られる文の構
造、 第9図は客体的係り受け解析処理部の処理フローチャ
ート、 第10図は主体的係り受け解析処理部の処理フローチャ
ート、 第11図は係り受け認定処理部の処理フローチャートで
ある。
以下、第2図の例に対する第1図における客体的係り
受け解析処理部2、主体的係り受け解析処理部4、係り
受け認定処理部6の各処理部の動作を、第3図〜第8図
を用いて説明する。
まず、客体的係り受け解析処理部2の動作は第9図の
通りであり、その動作例を第3図・第4図を用いて説明
する。
本処理部では、文節を構成する単語の文法情報に対し
て、第3図で与えるような文節の構造の条件を適用する
ことにより、各文節の客体的係りと客体的受けの性質を
表すシンボルを生成し、客体的係り→客体的受けのシン
ボルの一致/不一致から文節間の客体的係り受けの有無
を判定する。
例えば、第4図に示すように、文番号201の場合、文
節番号1の文節構造に対してはルールNo.301の適用によ
る客体的係り“ヲ静述語”とルールNo.351の適用による
客体的受け“名詞”を、文節番号2の文節構造に対して
はルールNo.305の適用による客体的係り“述語”を(客
体的受けは適用可能なルールがないため、生成されな
い)、文節番号3の文節構造に対してはルールNo.306の
適用による客体的係り“動述語”とルールNo.356の適用
による客体的受け“ガヲ静述語”を、文節番号4の文節
構造に対してはルールNo.355の適用による客体的受け
“ガヲ動述語”を(客体的係りは適用可能なルールがな
いため、生成されない)それぞれ生成し、次いで、客体
的係りのシンボルを構成する文字が全て客体的受けのシ
ンボルを構成する文字として含まれているか否かをもっ
てシンボルの一致/不一致の判定とすることにより、す
なわち、文節番号1の客体的係り“ヲ静述語”の各文字
は、文節番号3の客体的受け“ガヲ静述語”の構成文字
として全て含まれているため、文節番号1は文節番号3
との係り受けは「成立」とするが、文節番号4の客体的
受け“ガヲ動述語”の構成文字には“静”の文字が含ま
れていないため、文節1と文節4との係り受けは「不成
立」とするなどとして、客体的係り受けの可能性を得
る。
以下同様にして、第4図における係り先文節番号とし
て示すように、客体的係り受けの可能性を得る。
次に、主体的係り受け解析処理部4の動作は第10図の
通りであり、その動作例を第5図・第6図を用いて説明
する。
本処理部では、文節を構成する単語のうち、第5図で
与えるような特定の単語に対して、主体的係りと主体的
受けの性質を表すシンボルを生成し、主体的係り→主体
的受けのシンボルの一致/不一致から文節間の主体的係
り受けの有無を判定する。
例えば、第6図に示すように、文番号201の場合、文
節番号2の“決して”に対してはルールNo.501の適用に
よる主体的係り“否定”を、文節番号3の“は”に対し
てはルールNo.502の適用による主体的係り“題述”を、
文節番号4の“ない”に対してはルールNo.551の適用に
よる主体的受け“否定”と、ルールNo.553の適用による
同じく主体的受け“題述”とをそれぞれ生成し、次いで
主体的係りのシンボルと主体的受けのシンボルとの一致
/不一致により、文節番号2と文節番号4とは“否定”
の係り受け成立、文節番号3と文節番号4とは“題述”
の係り受け成立、と判定し、主体的係り受けの可能性を
得る。
なお、文番号203の文節番号1の“−過去”のように
“−”が付加されたシンボル名を持つものは、“−”を
持たないシンボルとの係り受けの「絶対的不成立」を表
すもので、不当な係り受けを排除するために積極的に用
いる。
第2図のような入力に対して、本処理部は第6図の係
り受け文節番号として示すような主体的係り受けの可能
性を出力する。
最後に、係り受け認定処理部6の動作は第11図の通り
であり、その動作例を第7図・第8図を用いて説明す
る。
本処理部では、客体的係り受けのうち、主体的係り受
けが「絶対的不成立」のものを取り除き、主体的係り受
けも同時に成立しているものを優先する形で、係り受け
を認定する。
例えば、第7図に示すように、文番号201の文節番号
2では文節番号4との係り受けが、文番号202の文節番
号1では文節番号4との係り受けがそれぞれ優先され、
文番号203の文節番号1では文節番号4との係り受けが
「絶対的不成立」として排除され、結果として文節番号
3との係り受けが成立する。
この結果、文番号201では話者の主張の態度(決して
…ない)とその内容(本を読む)とが入り組んでいるこ
とがわかり、文番号202では「約束したのは昨日であ
る」ことがわかり、文番号203では「明日公園に行く」
ということがわかる。
これらの文の構造を時枝文法風の構造図で示すと第8
図のようになる。
また、文番号204では、文節番号1と文節番号2との
間には“題述”の主体的係り受けのみ成立し、“過去”
の主体的係り受けは成立しないことがわかるので、この
文における助動詞“た”は過去ではなく、いわゆる詠嘆
を表していることが推定できる。
この文の構造を時枝文法風の構造図で示すと第8図の
ようになる。
(発明の効果) 以上説明したように、本発明によると、話者の主張の
態度や確信度または時間的な関係を正しく捉えるととも
に、日本語の文節間の係り受け関係として適切なものを
簡単な制御によって得ることができる。
また、例えば機械翻訳システムに本発明を適用する
と、日本語以外の言語では特に日本語と表現の仕方の異
なる主体的表現を分離して扱うことが可能となる。
【図面の簡単な説明】
第1図は本発明を適用した日本語構文解析システムの全
体の基本ブロック図、 第2図は単語分割された入力日本文の例、 第3図は客体的係り受け解析辞書の構成例、 第4図は客体的係り受け解析処理部の動作例、 第5図は主体的係り受け解析辞書の構成例、 第6図は主体的係り受け解析処理部の動作例、 第7図は係り受け認定処理部の動作例、 第8図は係り受け認定処理部により得られる文構造、 第9図は客体的係り受け解析処理部の処理フローチャー
ト、 第10図は主体的係り受け解析処理部の処理フローチャー
ト、 第11図は係り受け認定処理部の処理フローチャートであ
る。 1……入力装置、 2……客体的係り受け解析処理部、 3……客体的係り受け解析辞書、 4……主体的係り受け解析処理部、 5……主体的係り受け解析辞書、 6……係り受け認定処理部、 7……出力装置。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】1個以上の単語から成りひとまとまりの表
    現を表している文節を単位として区切られた日本文を入
    力し,該日本文を構成する文節間の係り受け関係を出力
    する日本語文解析装置において, 格助詞や副助詞を伴い,活用語の場合はその語形変化を
    含む自立語から発生する客体的係り,並びに,客体的受
    けをそれぞれ保持した客体的係り受け解析辞書と, 格助詞や副助詞を伴い,活用語の場合はその語形変化を
    含む自立語と他の自立語との間に成立する客体的表現を
    前記入力文から抽出し,客体的係り受け関係を解析して
    係り受け関係が成立しうる文節対を出力する客体的係り
    受け解析処理部と, 陳述副詞・接続詞・係助詞が要求するまたは拒否する主
    体的係りと,終助詞・助動詞・零陳述記号から発生する
    または拒否する主体的受けとをそれぞれ保持した主体的
    係り受け解析辞書と, 陳述副詞・接続詞・係助詞と終助詞・助動詞・零陳述記
    号との間で成立する話者の主張の態度や確信度または時
    間的な関係を表す主体的表現を前記入力文から抽出し,
    主体的係り受け関係を解析して係り受け関係が成立しう
    る文節対と係り受け関係が成立し得ない文節対とを出力
    する主体的係り受け解析処理部と, 前記客体的係り受け解析処理部と前記主体的係り受け解
    析処理部との各出力を入力し,係り元文節の係り先の候
    補文節が,前記主体的係り受け解析処理部と前記客体的
    係り受け解析処理部との両方から出力されている場合,
    前記主体的係り受け解析処理部から出力された候補文節
    が,前記係り元文節と係り受け関係が成立し得る文節の
    場合には該文節を前記係り元文節に対する係り先文節と
    して出力し,前記係り元文節と係り受け関係が成立し得
    ない文節の場合には前記主体的係り受け解析処理部から
    出力された候補文節を前記係り元文節に対する係り先文
    節として出力する係り受け認定処理部と を有する ことを特徴とする日本語文節間係り受け解析装置。
JP62053175A 1987-03-10 1987-03-10 日本語文節間係り受け解析装置 Expired - Lifetime JP2504449B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62053175A JP2504449B2 (ja) 1987-03-10 1987-03-10 日本語文節間係り受け解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62053175A JP2504449B2 (ja) 1987-03-10 1987-03-10 日本語文節間係り受け解析装置

Publications (2)

Publication Number Publication Date
JPS63220362A JPS63220362A (ja) 1988-09-13
JP2504449B2 true JP2504449B2 (ja) 1996-06-05

Family

ID=12935522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62053175A Expired - Lifetime JP2504449B2 (ja) 1987-03-10 1987-03-10 日本語文節間係り受け解析装置

Country Status (1)

Country Link
JP (1) JP2504449B2 (ja)

Also Published As

Publication number Publication date
JPS63220362A (ja) 1988-09-13

Similar Documents

Publication Publication Date Title
KR101099177B1 (ko) 기계 번역기를 훈련하기 위한 방법 및 시스템
US20050086047A1 (en) Syntax analysis method and apparatus
JPH0644296A (ja) 機械翻訳装置
GB2295470A (en) Machine translation system
Zong et al. Approach to spoken Chinese paraphrasing based on feature extraction.
JP2504449B2 (ja) 日本語文節間係り受け解析装置
Green et al. NP subject detection in verb-initial Arabic clauses
Osborne et al. Learning unification-based grammars using the Spoken English Corpus
JPH0769914B2 (ja) 日本語文節間係り受け解析装置
JP2661934B2 (ja) 日本語処理システム
Murata et al. Resolution of verb ellipsis in Japanese sentence using surface expressions and examples
JP3007397B2 (ja) 言語処理装置
Nakaiwa Automatic extraction of rules for anaphora resolution of Japanese zero pronouns in Japanese–English machine translation from aligned sentence pairs
JP4103311B2 (ja) 自然言語処理装置及び方法
JPS6344276A (ja) 生成文法自動生成装置
JPS62272357A (ja) 機械翻訳システムにおける入力文のエラ−表示方式
JPH03259376A (ja) 日本語長文分割支援装置
JP2770536B2 (ja) 文章解析装置
JPH07121543A (ja) 会話文解析装置
Poibeau Corpus-based Learning for Information Extraction
JPH05143640A (ja) 日本語構文解析システム
JPH08278973A (ja) 並列句解析装置および学習データ作成装置
JPH02226364A (ja) 構文解析装置
JPS63178369A (ja) 自然言語解析装置
JPS63219073A (ja) 自然言語解析装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term