JPS63204462A - 日本語解析処理方式 - Google Patents
日本語解析処理方式Info
- Publication number
- JPS63204462A JPS63204462A JP62038246A JP3824687A JPS63204462A JP S63204462 A JPS63204462 A JP S63204462A JP 62038246 A JP62038246 A JP 62038246A JP 3824687 A JP3824687 A JP 3824687A JP S63204462 A JPS63204462 A JP S63204462A
- Authority
- JP
- Japan
- Prior art keywords
- syntax
- analysis
- normalization
- circuit
- japanese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 33
- 238000010606 normalization Methods 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims 1
- 230000021615 conjugation Effects 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イ)産業上の利用分野
本発明は、日本語情報の検索、機械翻訳、日本語による
マン−マシン・コミュニケーションなどのシステムにお
ける日本語文章の解析処理方式に関する。
マン−マシン・コミュニケーションなどのシステムにお
ける日本語文章の解析処理方式に関する。
く口)従来技術
一般に、日本語解析処理システムは、特公昭57−16
373号に示す如く、第4図に示すような構成を成す。
373号に示す如く、第4図に示すような構成を成す。
(1)は原文人力装置であり解析すべき文が入力される
。(2)は形態素解析処理部であり、(3)は構文解析
メイン処理部であり、(4)は意味解析処理部である。
。(2)は形態素解析処理部であり、(3)は構文解析
メイン処理部であり、(4)は意味解析処理部である。
そして、く5)は、解析結果出力装置である。これらの
処理は、システム内蔵の日本語辞1!J(6)を参照し
て解析きれる。
処理は、システム内蔵の日本語辞1!J(6)を参照し
て解析きれる。
従来の日本語の構文が新方式では、入力された文に9い
て、形態素に分割してそれぞれの語句の係り先とその役
割(意味)関係を求めでいく方式である。しかし、日本
語文をそのまま解析しても、必ずしも良好な結果は得ら
れないのが、現状である。
て、形態素に分割してそれぞれの語句の係り先とその役
割(意味)関係を求めでいく方式である。しかし、日本
語文をそのまま解析しても、必ずしも良好な結果は得ら
れないのが、現状である。
(ハ)発明が解決しようとする問題点
本発明は、このような事情を考慮してなされたものであ
る。たとえば、「我々の知らない世界。
る。たとえば、「我々の知らない世界。
という文が原文人力装f!t(1)に入力きれた場合、
形態素解析処理部(2〉での解析によって、[謬:i>
4晶>久智詰翁轟鯖久■、]のように形態素〈単語)に
分割される。そして構文解析メイン処理部(3)では、
よ3のおのの単語の係り先と意味的な役割を調べること
になる。一般的には、助詞「のJに導かれる語句(「我
々J)の係り先は名詞である。ところが、この例の場合
には、′我々の、の係り先は、動詞「知る」であり、′
知る」の動作主体として働いている。すなわら、このま
までは日本語解析に失敗してしまうことになる。
形態素解析処理部(2〉での解析によって、[謬:i>
4晶>久智詰翁轟鯖久■、]のように形態素〈単語)に
分割される。そして構文解析メイン処理部(3)では、
よ3のおのの単語の係り先と意味的な役割を調べること
になる。一般的には、助詞「のJに導かれる語句(「我
々J)の係り先は名詞である。ところが、この例の場合
には、′我々の、の係り先は、動詞「知る」であり、′
知る」の動作主体として働いている。すなわら、このま
までは日本語解析に失敗してしまうことになる。
〈二)問題点を解決するための手段
本発明の日本語解析方式では、第1図に示すように、入
力(1)された文章に形態素解析(2)を施した結果を
、正規化回路(8)に通すことによって、入力文を標準
化してから、構文解析メイン処理(3)へ出力するもの
である。ずなわら、正規化回路(8)によっ工、特定の
構文パターンを検出し、その書き換えや情報の付加を行
なった後に構文解析メイン処理(3)に引き渡す事とな
る。
力(1)された文章に形態素解析(2)を施した結果を
、正規化回路(8)に通すことによって、入力文を標準
化してから、構文解析メイン処理(3)へ出力するもの
である。ずなわら、正規化回路(8)によっ工、特定の
構文パターンを検出し、その書き換えや情報の付加を行
なった後に構文解析メイン処理(3)に引き渡す事とな
る。
(ホ)作用
本発明によれば、入力された原文は正規化回路(8)に
よって正規化(標準化)が行なわれ、構文解析のメイン
処理に引き渡される。よって構文解析のメイン処理では
、標準的な構文パターンを扱えばよく、その負荷が軽減
されるとともに、的確な構文解析が可能となる。
よって正規化(標準化)が行なわれ、構文解析のメイン
処理に引き渡される。よって構文解析のメイン処理では
、標準的な構文パターンを扱えばよく、その負荷が軽減
されるとともに、的確な構文解析が可能となる。
くべ〉 実施例
以下に本発明の実施例につき説明する。
第3図は、本発明の構成図であり、その入力文とその出
力結果の例である。例えば、「我々の知らない世界、と
いう文が入力された場合、まず形態素解析部(2)によ
って、従来同様 [(Wr2>//(錯。久認糺久古鯖ジ1帽]のように
(形態素)単語に分割される。
力結果の例である。例えば、「我々の知らない世界、と
いう文が入力された場合、まず形態素解析部(2)によ
って、従来同様 [(Wr2>//(錯。久認糺久古鯖ジ1帽]のように
(形態素)単語に分割される。
本発明方式の特徴とするところは、このような文に対し
て正規化回路(7)が働き、 我々/ が /知る/ ない 7世界 のように助詞「の、が「が」に置き替えられ、入力文が
標準化される。これにより、構文解析メイン処理(3)
では、名詞句1我々」の係り先は動詞1知る」と判断し
、埋め込み文の処理において動詞の格パターンの辞書照
合によって1我々Jが「知る。の動作主体であることを
求めることができる。
て正規化回路(7)が働き、 我々/ が /知る/ ない 7世界 のように助詞「の、が「が」に置き替えられ、入力文が
標準化される。これにより、構文解析メイン処理(3)
では、名詞句1我々」の係り先は動詞1知る」と判断し
、埋め込み文の処理において動詞の格パターンの辞書照
合によって1我々Jが「知る。の動作主体であることを
求めることができる。
この正規化回路(7)は、特定の構文パターンを検出r
る第1の回路部(71)とその検出きれた構文パターン
に対する正規化処理を行なう第2の回路部に分けられる
。特定の構文パターンを検出する第1の回路部では、特
定の見出し語(キーワード)が存在する場合に、トリガ
ーがかかり、正規化すべき構文であるかの検出を行なう
。この第1の回路部(71)は、特定の条件を満たす単
語の見出し語や品詞、意味票性あるいは活用形などを入
力文全体にわたって参照できる。
る第1の回路部(71)とその検出きれた構文パターン
に対する正規化処理を行なう第2の回路部に分けられる
。特定の構文パターンを検出する第1の回路部では、特
定の見出し語(キーワード)が存在する場合に、トリガ
ーがかかり、正規化すべき構文であるかの検出を行なう
。この第1の回路部(71)は、特定の条件を満たす単
語の見出し語や品詞、意味票性あるいは活用形などを入
力文全体にわたって参照できる。
例えば、「我々の知らない世界、のような、動作主体と
して助詞「の」が使われるのは、埋め込み文(述語を含
む文が名詞に続いているような形態の文)である。しか
し受動態の文では起こりにくいという事実から、検出回
路のフローは、第3図のようになる。これらの検出回路
で、マツチングを試み、正規化が必要であるかを調べる
。よって、この例の検出回路では、「我々の知らない世
界、については正規化(標準化)が必要であると判断さ
れるが、′彼の壊された花瓶」に対しては正規化を施す
必要はないと判断される。
して助詞「の」が使われるのは、埋め込み文(述語を含
む文が名詞に続いているような形態の文)である。しか
し受動態の文では起こりにくいという事実から、検出回
路のフローは、第3図のようになる。これらの検出回路
で、マツチングを試み、正規化が必要であるかを調べる
。よって、この例の検出回路では、「我々の知らない世
界、については正規化(標準化)が必要であると判断さ
れるが、′彼の壊された花瓶」に対しては正規化を施す
必要はないと判断される。
正規化が必要と判断されれば、正規化処理の為の第2の
回路<72)が起動されて、入力文の正規化が行なわれ
る。正規化回路では、第1の回路で検出した構文に対し
て書き換えを行なう。そこでこのような埋め込み文にお
ける主体を表わす助詞「の」は、助詞「が」に置き替え
れる。
回路<72)が起動されて、入力文の正規化が行なわれ
る。正規化回路では、第1の回路で検出した構文に対し
て書き換えを行なう。そこでこのような埋め込み文にお
ける主体を表わす助詞「の」は、助詞「が」に置き替え
れる。
(!・)発明の効果
以上述べたように、本発明方式によれば、自然言語が持
つ例外的な構文でも、正規化することによって、構文解
析メイン処理の負担の軽減をはがることができ、解析効
率の向上を図ることができるとともに、的確な構文解析
が可能となる。
つ例外的な構文でも、正規化することによって、構文解
析メイン処理の負担の軽減をはがることができ、解析効
率の向上を図ることができるとともに、的確な構文解析
が可能となる。
第1図は本発明方式による日本語解析処理システムの構
成図、第211は正規化回路の構成上入力文とその出力
結果の例を示す図、第3図はフロー図、第4図は従来シ
ステムの構成図。 (1)・・・原文人力装置、(2)・・・形態素解析処
理部、(3)・・・構文解析メイン処理部、(4)・・
・意味解析処理部、(5)・・・解析結果出力部、(6
)・・・日本語辞書、(7)・・・正規化回路、(71
)・・・第1の回路、(72)・・・第2の回路。
成図、第211は正規化回路の構成上入力文とその出力
結果の例を示す図、第3図はフロー図、第4図は従来シ
ステムの構成図。 (1)・・・原文人力装置、(2)・・・形態素解析処
理部、(3)・・・構文解析メイン処理部、(4)・・
・意味解析処理部、(5)・・・解析結果出力部、(6
)・・・日本語辞書、(7)・・・正規化回路、(71
)・・・第1の回路、(72)・・・第2の回路。
Claims (1)
- (1)機械翻訳システムなどの日本語解析処理を必要と
するシステムにおいて、入力文を形態素解析した後、日
本語文の正規化機能を有する正規化回路にて正規化し、
該回路にて正規化された日本語文を構文解析あるいは意
味解析処理を施すことを特徴とする日本語解析処理方式
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62038246A JPS63204462A (ja) | 1987-02-20 | 1987-02-20 | 日本語解析処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62038246A JPS63204462A (ja) | 1987-02-20 | 1987-02-20 | 日本語解析処理方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63204462A true JPS63204462A (ja) | 1988-08-24 |
Family
ID=12519950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62038246A Pending JPS63204462A (ja) | 1987-02-20 | 1987-02-20 | 日本語解析処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63204462A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59201172A (ja) * | 1983-04-28 | 1984-11-14 | Nec Corp | 曖味さ解析方式 |
JPS6217872A (ja) * | 1985-07-17 | 1987-01-26 | Ricoh Co Ltd | 日本語理解装置 |
-
1987
- 1987-02-20 JP JP62038246A patent/JPS63204462A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59201172A (ja) * | 1983-04-28 | 1984-11-14 | Nec Corp | 曖味さ解析方式 |
JPS6217872A (ja) * | 1985-07-17 | 1987-01-26 | Ricoh Co Ltd | 日本語理解装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0242572A (ja) | 共起関係辞書生成保守方法 | |
JPH07282055A (ja) | 文解析方法および装置 | |
JPH02281372A (ja) | 機械翻訳装置における挿入副詞句処理方法 | |
JPS63204462A (ja) | 日本語解析処理方式 | |
Bolioli et al. | Jdii: Parsing italian with a robust constraint grammar | |
Arens et al. | Phrasal analysis of long noun sequences | |
JP2004287679A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP3309896B2 (ja) | 発話解析装置 | |
JPH07175808A (ja) | 自然言語処理装置 | |
JPH0287273A (ja) | 自動翻訳装置 | |
JPH0157826B2 (ja) | ||
Das et al. | Acquiring verb subcategorization frames in Bengali from corpora | |
JP2546486B2 (ja) | 文書解析方法および装置 | |
JPH0320866A (ja) | テキストベース検索方式 | |
Ting et al. | Using a dependency structure parser without any grammar formalism to analyse a software manual corpus | |
JP2504449B2 (ja) | 日本語文節間係り受け解析装置 | |
Casbeer et al. | A link grammar parser for Arabic | |
JPH03252862A (ja) | 文章解析装置 | |
JPH0340067A (ja) | 文章検索方式 | |
Loatman | PRC Inc: Description of the PAKTUS System Used for MUC-3 | |
JPH0850588A (ja) | 未知語登録装置 | |
JPH04372060A (ja) | 日本語解析装置 | |
JPH04184677A (ja) | 日本語構文解析システム | |
JPH0256691B2 (ja) | ||
Stamatatos et al. | 5HOHYDQW: RUN |