JPS63204462A - 日本語解析処理方式 - Google Patents

日本語解析処理方式

Info

Publication number
JPS63204462A
JPS63204462A JP62038246A JP3824687A JPS63204462A JP S63204462 A JPS63204462 A JP S63204462A JP 62038246 A JP62038246 A JP 62038246A JP 3824687 A JP3824687 A JP 3824687A JP S63204462 A JPS63204462 A JP S63204462A
Authority
JP
Japan
Prior art keywords
syntax
analysis
normalization
circuit
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62038246A
Other languages
English (en)
Inventor
Takeshi Yumura
湯村 武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP62038246A priority Critical patent/JPS63204462A/ja
Publication of JPS63204462A publication Critical patent/JPS63204462A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は、日本語情報の検索、機械翻訳、日本語による
マン−マシン・コミュニケーションなどのシステムにお
ける日本語文章の解析処理方式に関する。
く口)従来技術 一般に、日本語解析処理システムは、特公昭57−16
373号に示す如く、第4図に示すような構成を成す。
(1)は原文人力装置であり解析すべき文が入力される
。(2)は形態素解析処理部であり、(3)は構文解析
メイン処理部であり、(4)は意味解析処理部である。
そして、く5)は、解析結果出力装置である。これらの
処理は、システム内蔵の日本語辞1!J(6)を参照し
て解析きれる。
従来の日本語の構文が新方式では、入力された文に9い
て、形態素に分割してそれぞれの語句の係り先とその役
割(意味)関係を求めでいく方式である。しかし、日本
語文をそのまま解析しても、必ずしも良好な結果は得ら
れないのが、現状である。
(ハ)発明が解決しようとする問題点 本発明は、このような事情を考慮してなされたものであ
る。たとえば、「我々の知らない世界。
という文が原文人力装f!t(1)に入力きれた場合、
形態素解析処理部(2〉での解析によって、[謬:i>
4晶>久智詰翁轟鯖久■、]のように形態素〈単語)に
分割される。そして構文解析メイン処理部(3)では、
よ3のおのの単語の係り先と意味的な役割を調べること
になる。一般的には、助詞「のJに導かれる語句(「我
々J)の係り先は名詞である。ところが、この例の場合
には、′我々の、の係り先は、動詞「知る」であり、′
知る」の動作主体として働いている。すなわら、このま
までは日本語解析に失敗してしまうことになる。
〈二)問題点を解決するための手段 本発明の日本語解析方式では、第1図に示すように、入
力(1)された文章に形態素解析(2)を施した結果を
、正規化回路(8)に通すことによって、入力文を標準
化してから、構文解析メイン処理(3)へ出力するもの
である。ずなわら、正規化回路(8)によっ工、特定の
構文パターンを検出し、その書き換えや情報の付加を行
なった後に構文解析メイン処理(3)に引き渡す事とな
る。
(ホ)作用 本発明によれば、入力された原文は正規化回路(8)に
よって正規化(標準化)が行なわれ、構文解析のメイン
処理に引き渡される。よって構文解析のメイン処理では
、標準的な構文パターンを扱えばよく、その負荷が軽減
されるとともに、的確な構文解析が可能となる。
くべ〉 実施例 以下に本発明の実施例につき説明する。
第3図は、本発明の構成図であり、その入力文とその出
力結果の例である。例えば、「我々の知らない世界、と
いう文が入力された場合、まず形態素解析部(2)によ
って、従来同様 [(Wr2>//(錯。久認糺久古鯖ジ1帽]のように
(形態素)単語に分割される。
本発明方式の特徴とするところは、このような文に対し
て正規化回路(7)が働き、 我々/ が /知る/ ない 7世界 のように助詞「の、が「が」に置き替えられ、入力文が
標準化される。これにより、構文解析メイン処理(3)
では、名詞句1我々」の係り先は動詞1知る」と判断し
、埋め込み文の処理において動詞の格パターンの辞書照
合によって1我々Jが「知る。の動作主体であることを
求めることができる。
この正規化回路(7)は、特定の構文パターンを検出r
る第1の回路部(71)とその検出きれた構文パターン
に対する正規化処理を行なう第2の回路部に分けられる
。特定の構文パターンを検出する第1の回路部では、特
定の見出し語(キーワード)が存在する場合に、トリガ
ーがかかり、正規化すべき構文であるかの検出を行なう
。この第1の回路部(71)は、特定の条件を満たす単
語の見出し語や品詞、意味票性あるいは活用形などを入
力文全体にわたって参照できる。
例えば、「我々の知らない世界、のような、動作主体と
して助詞「の」が使われるのは、埋め込み文(述語を含
む文が名詞に続いているような形態の文)である。しか
し受動態の文では起こりにくいという事実から、検出回
路のフローは、第3図のようになる。これらの検出回路
で、マツチングを試み、正規化が必要であるかを調べる
。よって、この例の検出回路では、「我々の知らない世
界、については正規化(標準化)が必要であると判断さ
れるが、′彼の壊された花瓶」に対しては正規化を施す
必要はないと判断される。
正規化が必要と判断されれば、正規化処理の為の第2の
回路<72)が起動されて、入力文の正規化が行なわれ
る。正規化回路では、第1の回路で検出した構文に対し
て書き換えを行なう。そこでこのような埋め込み文にお
ける主体を表わす助詞「の」は、助詞「が」に置き替え
れる。
(!・)発明の効果 以上述べたように、本発明方式によれば、自然言語が持
つ例外的な構文でも、正規化することによって、構文解
析メイン処理の負担の軽減をはがることができ、解析効
率の向上を図ることができるとともに、的確な構文解析
が可能となる。
【図面の簡単な説明】
第1図は本発明方式による日本語解析処理システムの構
成図、第211は正規化回路の構成上入力文とその出力
結果の例を示す図、第3図はフロー図、第4図は従来シ
ステムの構成図。 (1)・・・原文人力装置、(2)・・・形態素解析処
理部、(3)・・・構文解析メイン処理部、(4)・・
・意味解析処理部、(5)・・・解析結果出力部、(6
)・・・日本語辞書、(7)・・・正規化回路、(71
)・・・第1の回路、(72)・・・第2の回路。

Claims (1)

    【特許請求の範囲】
  1. (1)機械翻訳システムなどの日本語解析処理を必要と
    するシステムにおいて、入力文を形態素解析した後、日
    本語文の正規化機能を有する正規化回路にて正規化し、
    該回路にて正規化された日本語文を構文解析あるいは意
    味解析処理を施すことを特徴とする日本語解析処理方式
JP62038246A 1987-02-20 1987-02-20 日本語解析処理方式 Pending JPS63204462A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62038246A JPS63204462A (ja) 1987-02-20 1987-02-20 日本語解析処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62038246A JPS63204462A (ja) 1987-02-20 1987-02-20 日本語解析処理方式

Publications (1)

Publication Number Publication Date
JPS63204462A true JPS63204462A (ja) 1988-08-24

Family

ID=12519950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62038246A Pending JPS63204462A (ja) 1987-02-20 1987-02-20 日本語解析処理方式

Country Status (1)

Country Link
JP (1) JPS63204462A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59201172A (ja) * 1983-04-28 1984-11-14 Nec Corp 曖味さ解析方式
JPS6217872A (ja) * 1985-07-17 1987-01-26 Ricoh Co Ltd 日本語理解装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59201172A (ja) * 1983-04-28 1984-11-14 Nec Corp 曖味さ解析方式
JPS6217872A (ja) * 1985-07-17 1987-01-26 Ricoh Co Ltd 日本語理解装置

Similar Documents

Publication Publication Date Title
JPH0242572A (ja) 共起関係辞書生成保守方法
JPH07282055A (ja) 文解析方法および装置
JPH02281372A (ja) 機械翻訳装置における挿入副詞句処理方法
JPS63204462A (ja) 日本語解析処理方式
Bolioli et al. Jdii: Parsing italian with a robust constraint grammar
Arens et al. Phrasal analysis of long noun sequences
JP2004287679A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3309896B2 (ja) 発話解析装置
JPH07175808A (ja) 自然言語処理装置
JPH0287273A (ja) 自動翻訳装置
JPH0157826B2 (ja)
Das et al. Acquiring verb subcategorization frames in Bengali from corpora
JP2546486B2 (ja) 文書解析方法および装置
JPH0320866A (ja) テキストベース検索方式
Ting et al. Using a dependency structure parser without any grammar formalism to analyse a software manual corpus
JP2504449B2 (ja) 日本語文節間係り受け解析装置
Casbeer et al. A link grammar parser for Arabic
JPH03252862A (ja) 文章解析装置
JPH0340067A (ja) 文章検索方式
Loatman PRC Inc: Description of the PAKTUS System Used for MUC-3
JPH0850588A (ja) 未知語登録装置
JPH04372060A (ja) 日本語解析装置
JPH04184677A (ja) 日本語構文解析システム
JPH0256691B2 (ja)
Stamatatos et al. 5HOHYDQW: RUN