JPH05143640A - 日本語構文解析システム - Google Patents

日本語構文解析システム

Info

Publication number
JPH05143640A
JPH05143640A JP3331175A JP33117591A JPH05143640A JP H05143640 A JPH05143640 A JP H05143640A JP 3331175 A JP3331175 A JP 3331175A JP 33117591 A JP33117591 A JP 33117591A JP H05143640 A JPH05143640 A JP H05143640A
Authority
JP
Japan
Prior art keywords
word
analysis
japanese
meaning
participial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3331175A
Other languages
English (en)
Other versions
JP3369584B2 (ja
Inventor
Akira Takagi
朗 高木
Koji Arihara
浩司 有原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CSK Corp
Original Assignee
CSK Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSK Corp filed Critical CSK Corp
Priority to JP33117591A priority Critical patent/JP3369584B2/ja
Publication of JPH05143640A publication Critical patent/JPH05143640A/ja
Application granted granted Critical
Publication of JP3369584B2 publication Critical patent/JP3369584B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 本発明は、「こと」、「もの」あるいは
「の」といった意味不定の語を先行詞とする連体修飾節
を含む日本語文に対し、該連体修飾節の種類を正確に判
定し、正確な構文解析を行なう日本語構文解析システム
を提供することを目的とする。 【構成】 本発明の日本語構文解析システムは、係り受
け解析もしくは句構造解析を行い解析木を作成する局所
的構文解析部61と、該解析木を分析し、所定の解析規
則に従って上記日本語複文に含まれる連体修飾節の種類
を判定して必要に応じて上記解析木を修正する大域的構
文解析部62とを備え、上記大域的構文解析部62は、
上記連体修飾節の係る語が意味不定の語である場合に、
該意味不定の語と該意味不定の語が係る後の述語との間
の格関係を判断して、上記述語との格関係において定義
される意味制約情報を上記意味不定の語に付加し、該付
加された意味制約情報に基づいて上記意味不定の語と上
記連体修飾節中の述語との間の格関係を判断して上記連
体修飾節の種類を決定することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語文の句構造や係
り受け構造を機械的に解析する日本語構文解析システム
に関し、特に連体修飾節を含む日本語文において連体修
飾節の格を判断し得る日本語構文解析システムに関す
る。
【0002】
【従来の技術及び解決しようとする課題】従来、日本語
文の構文解析を機械的に行う場合、単語がもつ品詞等の
文法情報や他の語からの係りの可能性を制御する為の意
味制約情報等を手がかりに、句構造や係り受け構造が抽
出されている。また、日本語文が連体修飾節、すなわち
連体修飾を行う埋め込み文が含まれている場合、該連体
修飾節の種類の判断が行われて節構造が判定されてい
る。
【0003】ところで、連体修飾節の種類は、該連体修
飾節が修飾する語(以下、この語を先行詞と書く。)が
節内の述語に対して何らかの格関係を持ち得るか否か、
あるいは先行詞が内容属性を有し「〜という」等の同格
節を受け得るか等に基づいて判断される。
【0004】しかし、先行詞が「こと」、「もの」ある
いは「の」というような単独では意味を特定できない語
である場合、また多義の巾が大きく、節内の述語との関
係だけでは、その意味を特定できない語である場合に
は、上記の方法では連体修飾節の種類を判断できず、節
構造を判定することができない。
【0005】本発明は、上述のような意味不定の語を先
行詞とする連体修飾節を含む日本語文に対し、該連体修
飾節の種類を正確に判定し得る日本語構文解析システム
を提供することを目的とする。
【0006】
【課題を解決するための手段】上記の目的を達成するた
め本発明は、形態素解析を施された連体修飾節を含む日
本語複文を入力し、該日本語複文の構文解析を行う日本
語構文解析システムにおいて、上記形態素解析により得
られた各単語の文法情報及び意味情報を利用し解析規則
に従って係り受け解析もしくは句構造解析を行い、解析
木を作成する局所的構文解析部と、上記局所的構文解析
部によって作成された解析木を分析し、所定の解析規則
に従って上記日本語複文に含まれる連体修飾節の種類を
判定し、必要に応じて上記解析木を修正する大域的構文
解析部とを備え、上記大域的構文解析部は、上記連体修
飾節の係る語が意味不定の語である場合に、該意味不定
の語と該意味不定の語が係る後の述語との間の格関係を
判断して、上記述語との格関係において定義される意味
制約情報を上記意味不定の語に付加し、該付加された意
味制約情報に基づいて上記意味不定の語と上記連体修飾
節中の述語との間の格関係を判断して上記連体修飾節の
種類を決定することを特徴とする。
【0007】
【実施例】以下、本発明の実施例について図面を参照し
て説明する。第5図は本発明の一実施例に係る日本語構
文解析システムの構成を示すブロック図である。
【0008】本実施例の構文解析システムは、日本語文
を入力して該日本語文の係り受け構造を解析する解析処
理装置1と、単語間の係り受けに関する情報を格納した
品詞マトリクステーブル5とで構成される。
【0009】図示のように上記解析処理装置1には、形
態素解析部2によって入力した日本語文を単語ごとに分
割し日本語辞書4を参照して各単語に文法情報及び意味
情報を付加する形態素解析処理が施された単語列が入力
される。ここで日本語辞書4には、各単語の品詞、意味
素性、格等の文法情報及び意味情報が登録されている。
【0010】上記解析処理装置1は、形態素解析により
得られた各単語の文法情報及び意味情報を利用し品詞マ
トリクステーブル5に格納した解析規則に従って単語相
互の係り受け関係を判定し、単語間の係り受け関係を表
す解析木を作成する局所的構文解析部61と、局所的構
文解析部61によって作成された係り受け関係を表す解
析木を分析し、所定の解析規則に従って上記解析木を修
正する大域的構文解析部62とを備えてなる。
【0011】上記大域的構文解析部62は、解析する日
本語文が連体修飾節を含む場合に該連体修飾節の種類を
決定する。特に、上記連体修飾節の係る語が意味不定の
語である場合に、該意味不定の語と該意味不定の語が係
る後の述語との間の格関係を判断して、上記述語との格
関係において定義される意味制約情報を上記意味不定の
語に付加し、該付加された意味制約情報に基づいて上記
意味不定の語と上記連体修飾節中の述語との間の格関係
を判断して上記連体修飾節の種類を決定する。
【0012】上記品詞マトリクステーブル5は、係る語
と係られる語の品詞の組合せに応じた解析規則、すなわ
ち、2つの単語相互の組合せに対応する規則を格納す
る。
【0013】なお本実施例では、処理アルゴリズムの簡
潔さ等に鑑み、係り受け解析を文節間ではなく、単語間
の意味的依存的関係を解析するという形式で行うことと
して構文解析の説明を行うが、以下の記述は、文節間の
係り受け解析や句構造解析に基づく構文解析において
も、同様に適用しうる。
【0014】次に、第1図乃至第4図を参照して本実施
例の作用について説明する。第1図は本実施例の構文解
析システムに「昨日買ったのを売った」という文を入力
した場合の解析処理を示す。なお、第1図には、形態素
解析処理部2により「昨日/買った/の/を/売った」
のように分割した単語列を入力した場合の解析処理装置
1による処理を示してある。
【0015】解析処理装置1の局所的構文解析部61
は、上記単語ごとに係り受け関係を順次判断していく
が、において述語「買った」が「の」を修飾している
ことから「昨日」と「買った」が連体修飾節を形成する
ことを検出する。
【0016】次に、において大域的構文解析部62が
上記連体修飾節の種類を決定しようとするが、「の」の
意味が不定であるため何格か決定することができない。
そこで、仮に主格関係節であるとしておき、次の処理へ
進む。ここで、図中C1は連体修飾節を示す。また、
[PN]は仮想的に置かれた代名詞を示し、(sbj) は
[PN]が述語「買った」の主格であることを示す。こ
れによってC1は主格関係節を示すこととなる。
【0017】次に、局所的構文解析部61は、におい
て「の」と「を」の係り受け関係を判断し、次いでに
おいて「を」と「売った」の係り受け関係を判断する。
ここでは両方共係り受け関係が成立する。この際、大域
的構文解析部62は、第2図(b) に示す「売った」の格
スロット41を参照して「の」が何格として「売った」
に係っているか判断する。ここでは対象格と認識する。
そして、「売った」の対象格に定義される意味素性[商
品]を「の」に付加する。これによって、「の」は商品
を示すことが判断される。
【0018】この後、において大域的構文解析部62
は、「の」が商品を示すことを条件として加え、連体修
飾節C1の格の種類を再度判断する。第2図(a) に示す
ように、「買った」に対して商品を示す「の」は対象格
として係ることから連体修飾節C1は対象格関係節であ
ると判断され、主格関係節から対象格関係節に訂正され
る。ここで、図中(dobj)は[PN]が述語「買った」
の対象格であることを示す。
【0019】以上で本例文における解析処理を終了す
る。
【0020】次に第3図を参照して、本実施例に「昨日
買ったのを後悔している」という文を入力した場合の解
析処理を説明する。なお、本解析例において、連体修飾
節C2を主格関係節と仮定するまでの処理は、第1図の
解析例と同様であるため省略する。
【0021】局所的構文解析部61がで意味不定の
「の」と「を」の係り受け関係を判断し、次いでで
「を」と「後悔している」の係り受け関係を判断した
後、大域的構文解析部62は、第4図に示す「後悔して
いる」の格スロット41を参照して「の」が何格として
「後悔している」に係っているか判断する。ここでは対
象格と認識する。そして、「後悔している」の対象格に
定義される意味素[行為内容]を「の」に付加する。こ
れによって、「の」は行為内容を示すことが判断され
る。
【0022】この後、において大域的構文解析部62
は、「の」が行為内容を示すことを条件として加え、連
体修飾節C2の格の種類を再度判断する。しかし、第2
図(a) に示したように「買った」には行為内容が係るべ
き格は存在しない。したがって、行為内容を示す「の」
は何格としても「買った」に係れないこととなる。そこ
で連体修飾節C2は内容節に訂正される。ここで内容節
とは、修飾するべき語の内容を示す一連の文であって、
「〜という・・・(被修飾語)」という形で表現し得る
ものである。
【0023】第3図において、[TH−PN]は仮想的
に置かれた代名詞を示し、これと直前に示される(とい
う)とでC2が内容節であることを示す。これは、上述
のように内容節を形成する文が「〜という(被修飾
語)」という形で表現し得ることによる。なお、内容節
中に文と先行詞の間を接続する「という」もしくはそれ
と同等な語句が陽に表現されているときは[TH−P
N]の前に(という)を付加する必要はない。
【0024】以上で本例文における解析処理を終了す
る。
【0025】ここで、第1図と第3図に示した例文を比
較すると、同じ形態の文章でありながら、「の」の意味
が不定であるため動詞「売った」と「後悔している」の
違いにより連体修飾節の種類が異なっている。このよう
な場合にも本実施例によれば、上述の処理により動詞の
種類から「の」の意味を推定し、連体修飾節の種類を正
確に判断することができる。
【0026】
【発明の効果】以上説明したように、本発明の日本語構
文解析システムは、日本語文における単語相互の係り受
け関係を判定する局所的構文解析部と、該局所的構文解
析部の判定結果を分析し連体修飾節の種類を判断し必要
に応じて上記判定結果を修正する大域的構文解析部とを
備えたため、文の係り受け構造の判定手段の適用範囲を
拡げ、性能の向上を図ることができるという効果があ
る。
【0027】また、大域的構文解析部が、先行詞とその
先行詞が係る後方の述語との関係により先行詞の意味を
推定して連体修飾節の種類を決定することとしたため、
先行詞が「こと」、「もの」あるいは「の」といった意
味不定の語であっても該先行詞に係る連体修飾節の種類
を性格に判断することができるという効果がある。
【図面の簡単な説明】
【図1】第5図の実施例による解析処理例を示す図であ
る。
【図2】第1図の述語の格スロットを示す図である。
【図3】第5図の実施例による他の解析処理例を示す図
である。
【図4】第3図の述語の格スロットを示す図である。
【図5】本発明の一実施例に係る日本語構文解析システ
ムを示すブロック図である。
【符号の説明】
1:解析処理装置 61:局所的構文解析部 62:大域的構文解析部 C1:連体修飾節 C2:連体修飾節
【手続補正書】
【提出日】平成3年12月27日
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】図5
【補正方法】変更
【補正内容】
【図5】

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 形態素解析を施された連体修飾節を含む
    日本語複文を入力し、該日本語複文の構文解析を行う日
    本語構文解析システムにおいて、 上記形態素解析により得られた各単語の文法情報及び意
    味情報を利用し解析規則に従って係り受け解析もしくは
    句構造解析を行い、解析木を作成する局所的構文解析部
    と、 上記局所的構文解析部によって作成された解析木を分析
    し、所定の解析規則に従って上記日本語複文に含まれる
    連体修飾節の種類を判定し、必要に応じて上記解析木を
    修正する大域的構文解析部とを備え、 上記大域的構文解析部は、上記連体修飾節の係る語が意
    味不定の語である場合に、該意味不定の語と該意味不定
    の語が係る後の述語との間の格関係を判断して、上記述
    語との格関係において定義される意味制約情報を上記意
    味不定の語に付加し、該付加された意味制約情報に基づ
    いて上記意味不定の語と上記連体修飾節中の述語との間
    の格関係を判断して上記連体修飾節の種類を決定するこ
    とを特徴とする日本語構文解析システム。
JP33117591A 1991-11-20 1991-11-20 日本語構文解析装置 Expired - Fee Related JP3369584B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33117591A JP3369584B2 (ja) 1991-11-20 1991-11-20 日本語構文解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33117591A JP3369584B2 (ja) 1991-11-20 1991-11-20 日本語構文解析装置

Publications (2)

Publication Number Publication Date
JPH05143640A true JPH05143640A (ja) 1993-06-11
JP3369584B2 JP3369584B2 (ja) 2003-01-20

Family

ID=18240727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33117591A Expired - Fee Related JP3369584B2 (ja) 1991-11-20 1991-11-20 日本語構文解析装置

Country Status (1)

Country Link
JP (1) JP3369584B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001148814A (ja) * 1999-08-26 2001-05-29 Matsushita Electric Ind Co Ltd テレビジョン及びマルチメディアの検索及び要求に対して自然言語のモダリティーを可能にする汎用遠隔制御
US8117023B2 (en) 2006-12-06 2012-02-14 Honda Motor Co., Ltd. Language understanding apparatus, language understanding method, and computer program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001148814A (ja) * 1999-08-26 2001-05-29 Matsushita Electric Ind Co Ltd テレビジョン及びマルチメディアの検索及び要求に対して自然言語のモダリティーを可能にする汎用遠隔制御
US8117023B2 (en) 2006-12-06 2012-02-14 Honda Motor Co., Ltd. Language understanding apparatus, language understanding method, and computer program

Also Published As

Publication number Publication date
JP3369584B2 (ja) 2003-01-20

Similar Documents

Publication Publication Date Title
Bouma et al. Alpino: Wide-coverage computational analysis of Dutch
JPH0644296A (ja) 機械翻訳装置
JPH0242572A (ja) 共起関係辞書生成保守方法
JP2001523019A (ja) テキストの本文の談話構造の自動認識
JPH05143640A (ja) 日本語構文解析システム
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
US20020133331A1 (en) Correcting incomplete negation errors in French language text
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3222173B2 (ja) 日本語構文解析システム
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2661934B2 (ja) 日本語処理システム
JP4114580B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH04184677A (ja) 日本語構文解析システム
JP3810809B2 (ja) 構文解析装置
JPH0795323B2 (ja) 自然言語処理装置
JP3827191B2 (ja) 係り受け関係解析装置
Min et al. Integrated control of chart items for error repair
JP4033012B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH04372060A (ja) 日本語解析装置
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2004280509A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2504449B2 (ja) 日本語文節間係り受け解析装置
Min et al. Integrated correction of ill-formed sentences
JPH04283865A (ja) 自然言語の意味処理方法及び意味処理装置
JPH07200592A (ja) 文章処理装置

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081115

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081115

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091115

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091115

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101115

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111115

Year of fee payment: 9

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111115

Year of fee payment: 9

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111115

Year of fee payment: 9

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees