JPH0236473A - 日本語解析装置 - Google Patents

日本語解析装置

Info

Publication number
JPH0236473A
JPH0236473A JP63186524A JP18652488A JPH0236473A JP H0236473 A JPH0236473 A JP H0236473A JP 63186524 A JP63186524 A JP 63186524A JP 18652488 A JP18652488 A JP 18652488A JP H0236473 A JPH0236473 A JP H0236473A
Authority
JP
Japan
Prior art keywords
processing
clause
dependency
candidates
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63186524A
Other languages
English (en)
Inventor
Katsuhiko Fujita
克彦 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63186524A priority Critical patent/JPH0236473A/ja
Publication of JPH0236473A publication Critical patent/JPH0236473A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、自然言語処理、例えば機械翻訳システムの構
文解析等の日本語解析装置に関する。
従来の技術 従来、この種の日本語解析装置では、構文解析用の辞書
と文法とを用いて係り受け解析を行うようにしている。
この場合、係り受け関係が1つだけでなく、当該文節が
自己よりも後方の文節に対して有する係り受け関係の候
補が複数の場合もある。この点、従来にあっては、全て
の構文解析結果を自動的に作成してから、それを表示し
てオペレータに選択させる方法がある。
発明が解決しようとする間層点 しかし、このような方法によると、途中の演算量、メモ
リ容量が大きくなってしまい、効率の悪いものである。
また、選択する時に、各結果の違いを見逃しやすい。例
えば、[私は去年札幌で知リ合った少年に手紙をもらっ
た。」という例文を考える。この例文の場合、従来方式
によると、第9図(a)〜(cl)に示すような複数の
結果が必要となるが、これらを全て計算し、保持するこ
とは、大きな負担となってしまう。また、ユーザが二の
ような木構造全体を見て選ぶ時にはその文が長いと正し
い結果を見つけにくいものでもある。
問題点を解決するための手段 構文解析用の辞書と文法とを用いて係り受け解析を行う
日本語解析装置において、文節単位の係り受け処理中に
当該文節が自己よりも後方の文節に対して有する係り受
け関係の候補が複数ある時にその都度その旨を表示する
表示手段を設け、この表示手段による表示に基づき複数
の係り受け関係の候補中から係り先を選択決定しその後
の処理に供する選択手段を設ける。
この際、文節単位の処理は文末側の文節から行うように
する。
作用 文節単位での係り受け処理中に、係り受け関係の候補が
複数個出現したら、その段階で表示手段にその旨が表示
され、選択手段を通してオペレータによる係り先決室の
選択決定に供される。そして、オペレータによる係り先
の選択決定がなされると、その結果に基づいて、さらに
次の文節の解析処理に移行する。つまり、全ての構文解
析結果を自動的に作成してから表示・選択に供する従来
方式に対し、文節単位による解析の途中でオペレータと
の対話型により順次係り受け関係を特定しながら、解析
処理を進めることになり、適切かつ効率のよい解析とな
る。また、メモリ容量も少ないものとなる。
この際、処理対象文節と後方の文節との間の係り受けを
問題とするが、文節単位での処理を文末側の文節から順
に行うので、全文処理を待つ必要はない。
実施例 本発明の一実施例を第1図ないし第8図に基づいて説明
する。第1図に全体のブロック図構成を示す。概略的に
は、読み込み部1により形態素解析結果ファイル2から
読み込まれた文に対し、対話型構文解析部3で一定の順
序に従い文節単位で処理することになる。このような文
節単位の処理中に、表示手段としてのCRT等による表
示装置4と選択手段としてのキーボード等の入力装置5
とが随時使用され、対話型にて処理し得るように構成さ
れている。
ここに、前記対話型構文解析部3は処理対象文節決定部
6と、係り受け処理部7と、係り先決走部8なる処理部
とともに、係り受け処理に供する構文解析用辞書・文法
9と、候補メモリ10と、解析結果メモリ11とを有し
ている。これにより、対話型構文解析部3では、概略的
に、一定の順序に従って文節単位で、溝文用解析辞言・
文法9を用いた係り受け処理部7による係り受け処理と
、これにより得られた係り受け関係の候補の表示装置4
への表示とオペレータの入力装置5操作による選択に基
づく係り先決走部8による係り先決室処理とを行うこと
により、オペレータが意図した構文解析結果が随時の対
話型処理で得られるものである。第2図のフローチャー
トはこのような処理の概略を示すものである。
ここに、処理対象文節決定部6では、第3図のフローチ
ャートに示すような処理が行われる。即ち、読み込み部
1によって形態素解析結果ファイル2から読み込まれた
文に対し、それが新しい文の処理であるか否か判別する
。最初であれば、新しい文であるので、この場合には、
文末の文節を処理対象文節とする。即ち、文節単位の処
理を文頭側からではなく、文末側の文節から行うもので
ある。その後の文節の場合であれば、新しい文の処理で
はないので、処理済みの文節の1つ前の文節(文末側か
らの処理によるため)を処理対象文節とする。
また、係り受け処理部7では、第4図のフローチャート
に示すような処理が行われる。即ち、構文解析用辞書・
文法9を用い、処理対象文節と、その後方にある文節(
1つ以上)との間に成立する係り受け関係を全て見つけ
、その結果を候補メモリ10に保存する。この場合、文
末側の文節から処理しているので、当該文節が自己より
も後方の文節(先の処理文節)に対して係り受け関係の
候補があるかを随時判断できる。
係り先決走部8では、第5図のフローチャートに示すよ
うな処理が行われる。まず、文節単位の処理中において
、候補メモリ10中に複数の係り受け関係があるか否か
判別する。複数の係り受け関係の候補が存在する時には
、その旨が表示装置4に表示される。そこで、オペレー
タの選択操作待ちとなる。このような表示装置4におけ
る表示に基づきオペレータが人力装置5を操作し、オペ
レータの意図する所望の係り先を選択決定すると、その
結果が解析結果メモリ11に書込まれる。よって、オペ
レータの選択決定した係り受け関係に特定された状態で
、後続の文節の処理がさらに進められることになる。
このような処理を、前述した「私は去年札幌で知り合っ
た少年に手紙をもらった。」という例文についての解析
の場合で説明する。まず、形態素解析結果ファイル2中
での当該例文のデータ構造の模式図を示すと第6図のよ
うになる。図中、枠で囲んで示す部分が各々文節を意味
し、枠内中に所々にある「/」は文節中の単語の区切り
を意味する。このようなデータが読み込み部1により読
み込まれる。ここで、処理対象文節決定部6では新しい
文がきたことを知り、最初に文末の文節「もらっ/た/
。」を処理対象文節とする。これを受けて、係り受け処
理部7では、この「もらつ/た/。」という文節と、そ
れより後方の文節との係り受け処理を行おうとするが、
この場合であれば、文末の文節であり後方には何も文節
が存在しないので、何も処理せずリターンする。これは
、係り先決走部8でも同様であり、候補メモリ10には
未だ係り受け関係の候補がないので、結果(実質的には
、何もない)を解析結果メモリ11に書込み、次の文節
の処理に進む。次の文節としては、処理済みの「もらつ
/た/。」なる文節の直前の文節「手紙/をjが処理対
象文節となる。
係り受け処理部7では構文解析用辞書・文法9を参照す
ると、当該文節「手紙/を」と、後方の処理済み文節「
もらっ/た/。」との間には係り受け関係があることを
知り、これを候補メモリ10に保存する。このような処
理は従来から行われている公知事項である。そして、係
り先決走部8では、候補メモリ10中に第7図(a)に
示すように1つの係り受け関係しか保持されていないの
で、この結果を解析結果メモリ11に書込み、次の文節
の処理に進む。
このようにして、文末の文節から文節単位での解析処理
を進めていく。いま、「札幌/で」なる文節が処理対象
文節となり、その係り受け関係の処理に入ると、ここで
は当該文節「札幌/で」は、後方にある「知り合っ/た
」と「もらっ/た/。」との2つの文節と係り受け関係
の可能性のあることが判る。そこで、候補メモリ10中
には第7図(b)に示すように2つの係り受け関係の候
補が記憶される。そして、係り先決走部8の処理に移行
すると、この場合には、候補メモリ10中に複数の候補
が存在するので、その旨を例えば第8図に示すような形
式で表示装置4の画面上に表示する。
このような表示により、オペレータによる選択決定を示
唆する。そこで、オペレータが人力装置5操作により所
望の係り受け関係のほうを選択決定すると、決定された
1つの係り受け関係のみが解析結果メモリ11に書込ま
れる。即ち、オペレータの選択決定により係り先が特定
されるため、係り先の曖昧さのない状態で次の文節の解
析処理に移行することになる。
このように、本実施例によれば、文節単位での解析処理
の途中で、対話型により、オペレータからの情報を積極
的に利用することができ、この結果、オペレータの意図
に、より適合する解析結果が得られることになる。これ
は、従来のように全ての可能な解析結果を作成してから
選択する方式に比べ、メモリ容量が少なくて済むだけで
なく、オペレータの選択操作性もよいため選択ミスも減
ることになる。さらには、このように、処理途中で係り
受け関係の情報が得られるため、例えば本例の「札幌/
で」なる文節処理で当該文節「札幌/で」が「もらっ/
た/。」なる文節に係ることが決定されたとすれば、「
去年」と「私/は」との双方の文節が「もらっ/た/。
」なる文節にしか係らなぐなり、その以降の処理量も一
般に少なくなる(非交差の原則)。
発明の効果 本発明は、上述したように文節単位の係り受け処理中に
当該文節が自己よりも後方の文節に対して有する係り受
け関係の候補が複数ある時にその都度その旨を表示する
表示手段を設け、この表示に基づき複数の係り受け関係
の候補中から係り先を選択決定しその後の処理に供する
選択手段を設けたので、文節単位による解析の途中で対
話型によりオペレータからの情報を積極的に利用するこ
とができ、オペレータの意図に即して良好なる解析結果
を得る一助となり、かつ、メモリ容量的にも選択操作的
にも従来方式に比して極めて有利でミスの少ないものと
なり、さらには、その後の文節解析においても係り受け
関係が既に絞られているため、非交差の原則等により、
以降の処理量を減することもできる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
全体処理を示す概略フローチャート、第3図は処理対象
文節決定部の処理を示すフローチャート、第4図は係り
受け処理部の処理を示すフローチャート、第5図は係り
先決走部の処理を示すフローチャート、第6図は形態素
解析結果ファイル中のデータ構造の模式図、第7図は候
補メモリ中の記憶データ例を示す模式図、第8図は表示
例を示す正面図、第9図は従来方式を示す模式図である
。 4・・表示手段、5・・・選択手段、9・・・構文解析
用辞書・文法 、%(,31図

Claims (1)

  1. 【特許請求の範囲】 1、構文解析用の辞書と文法とを用いて係り受け解析を
    行う日本語解析装置において、文節単位の係り受け処理
    中に当該文節が自己よりも後方の文節に対して有する係
    り受け関係の候補が複数ある時にその都度その旨を表示
    する表示手段を設け、この表示手段による表示に基づき
    複数の係り受け関係の候補中から係り先を選択決定しそ
    の後の処理に供する選択手段を設けたことを特徴とする
    日本語解析装置。 2、文節単位の処理を、文末側の文節から順に行うこと
    を特徴とする請求項1記載の日本語解析装置。
JP63186524A 1988-07-26 1988-07-26 日本語解析装置 Pending JPH0236473A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63186524A JPH0236473A (ja) 1988-07-26 1988-07-26 日本語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63186524A JPH0236473A (ja) 1988-07-26 1988-07-26 日本語解析装置

Publications (1)

Publication Number Publication Date
JPH0236473A true JPH0236473A (ja) 1990-02-06

Family

ID=16190003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63186524A Pending JPH0236473A (ja) 1988-07-26 1988-07-26 日本語解析装置

Country Status (1)

Country Link
JP (1) JPH0236473A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5204514A (en) * 1991-02-22 1993-04-20 Olympus Optical Co., Ltd. Information recording/reproducing method capable of fast-accessing

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5204514A (en) * 1991-02-22 1993-04-20 Olympus Optical Co., Ltd. Information recording/reproducing method capable of fast-accessing

Similar Documents

Publication Publication Date Title
JPS61150068A (ja) 翻訳編集装置
US6697777B1 (en) Speech recognition user interface
US4833611A (en) Machine translation system
JP2633824B2 (ja) 仮名漢字変換装置
JPH0236473A (ja) 日本語解析装置
JPS6118074A (ja) プレ・エデイツト方式
JP2570681B2 (ja) ワード・プロセッサ
JPH08137892A (ja) 文書検索方法及び文書検索装置
JPH09179868A (ja) 対訳文対応付け支援システム
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JP2001014304A (ja) 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体
JP2936761B2 (ja) 日本語文書の校正装置
JPH06223113A (ja) 電子ファイリング装置
JPH04281558A (ja) 文書検索方法および装置
JP3192686B2 (ja) 自然言語処理システム
JPH03233669A (ja) 文書作成装置
JPH0628396A (ja) 電子化辞書装置
JPH08153112A (ja) 文書作成装置及び文書作成方法
JPH0475550B2 (ja)
JPH05151259A (ja) 文入力処理方式
JPH08235177A (ja) 情報処理装置
JPH05242141A (ja) 機械翻訳装置
JPH08329107A (ja) 文書作成装置及び文書作成方法
JPH086950A (ja) キーワード翻訳機能付き機械翻訳装置
JPS60526A (ja) 情報処理装置