JPS61134866A - 日本語解析装置 - Google Patents

日本語解析装置

Info

Publication number
JPS61134866A
JPS61134866A JP59255805A JP25580584A JPS61134866A JP S61134866 A JPS61134866 A JP S61134866A JP 59255805 A JP59255805 A JP 59255805A JP 25580584 A JP25580584 A JP 25580584A JP S61134866 A JPS61134866 A JP S61134866A
Authority
JP
Japan
Prior art keywords
word
stack
analysis
input
syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59255805A
Other languages
English (en)
Inventor
Toshiyuki Tanbe
丹部 敏行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59255805A priority Critical patent/JPS61134866A/ja
Publication of JPS61134866A publication Critical patent/JPS61134866A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、日本語解析装置に関し、詳細には、カナ漢字
変換等における入力段階で、構文解析を行い、入力し終
えた段階で文の構造を決定する日本語解析装置に関する
ものである。
従来技術 従来9機械翻訳装置において、カナ漢字変換で日本語の
入力と日本語構文解析とは、別の処理過程で行われてい
た。そのため、(イ)日本語構文解析のため1日本語を
入力するときに用いられる文節の区切り等の情報が使用
できないので、文節の区切りを誤る可能性があること、
(ロ)形態素解析を2回行う必要がある。つまり、カナ
漢字変換のときと、構文解析の前段階のときの2度であ
る。
また、従来、人間が構文解析に介入しないため、(イ)
複数の解が出てしまう、(ロ)処理時間がかかる、(ハ
)文法が複雑になる1等の欠点があった。
目    的 本発明の目的は、このような欠点を改善し、カナ漢字変
換等の入力段階で、同時に構文解析を行い、文の入力終
了と同時に文の構造が決定され。
かつ、ユーザの介入により文の構造を正確に決定できる
日本語解析装置を提供することにある。
構   成 上記目的を達成するため、本発明の日本語解析装置は、
CRTディスプレイとキーボードと制御装置とを有する
日本語解析装置において、カナ漢字変換を行い、各単語
に品詞等を付加する形態素解析手段と、入力単語および
スタック内単語を文法辞書用いて係り受け関係を調べ、
構文木構造を作る構文解析手段と、解析途中の木構造お
よびその後方の修飾性を格納するスタックと、各単語の
係り受けの記入されている文法辞書と、形態素処理およ
び構文解析処理を切換える解析モード切換え手段とを有
することに特徴がある。
以下、本発明の構成を、実施例により説明する。
第1図は、本発明は一実施例を示す全体構成図である。
第1図において、AはCRTディスプレイ、BはOKキ
ー、Noキーを備えたキーボード、Cは制御装置、Dは
入力に応じて1文字列、次候補キーはEに、上記以外は
Fに、それぞれ切換え、形態素と構文解析処理を切換る
解析モード切換え装置、Eはカナ漢字変換処理を行い、
各単語に品詞等を付加する形態素解析装置、Fは入力単
語とスタックG内の単語を文法辞書■を用いて、係り受
け関係を調べ、構文木構造を作り上げる構文解析装置、
Gは木構造とその構造の代表的な後方の修飾性を格納す
るスタック、Hはカナ表記、漢字表記、品詞等の情報が
記入されている日本語辞書、■は入力単語とスタック内
単語の係り受け関係を、品詞等を用いてチェックするた
めの規則が記入されている文法辞書である。
第1図の動作を、第6図のフローチャートを用いて説明
する。
先ず、オペレータが「ウラクシ1」とキーボードから入
力する(ステップ1,2)。入力文字列は、C→D−+
Eと送られ、形態素解析装置Eで従来と同じ技術により
カナ漢字変換を行い、品詞等が付加される(ステップ3
,4)。 すなわち、第7図(a)に示すように、 ((形容詞(連体)))         ・・・(1
)と変換される。この結果、E→C−+Aと送られ、C
RTディスプレイAK表示される(ステップ5)。
ここで、オペレータが次候補キー以外のキーを押すと、
上記第7図(a)の結果が4構文解析装置1Fにに送ら
れる。ここでは、第7図(、)の品詞(形容詞(連体)
)をキーとして文法辞書■を引き、スタックGのトップ
と係り受けのチェックを行うが、スタックGは現在空き
のため、第7図(a)の内容はスタックGにブツシュさ
れる。
次l;、オペレータは「ニホン」を入力するステップ6
)。 これは、カナ漢字変換され、CRTディスプレイ
Aに送られて表示され、オペレータのチェックを受けて
構文解析装置i1Fに送られる。
(日本((名詞)(の(助詞(連体))))  ・・・
(2)上記(2)の自立語部分の品詞(名詞)をキーと
して、文法辞書■を引き、スタックGのトップをチェッ
クする(ステップ7.9)。 入力単語の品詞(名詞)
とスタック・トップとの品詞(形容詞(連体))は、文
法辞書Iにより係り受け関係が成立4一 つので、CRTディスプレイAに、「美しい」と「日本
」は係り受けが成立することを表示する(ステップto
、ti)。オペレータが、この係り受け関係を見て、意
図するものであれば、OKキーを押すステップ12)。
 これによって、これらは、下記(3)のようにまとめ
上げられ、入力単語となる(ステップ13)。このこと
により、スタックGのトップはポツプされる(Gは空き
となる)(ステップ14)。
(日本((名詞)(の(助詞(連体))))(美しい(
形容詞(連体))))     ・・・・(3)スタッ
クGが空きのため、上記(3)は、スタックGにブツシ
ュされる。第7図(b)は、ひのときのスタックGの内
容を示す。
次に、オペレータが「ヤマ」を入力する(ステップ2)
。同じように形態素解析され(ステップ3)、下記のよ
うになる。
(山((名詞)(の(助詞(連体)))))・・・・(
4)次に、単11(3)のスタック・トップと単!l(
4)の係り受けがチェックされる(ステップ7.9)。
つまり、単語(3)の修飾性の項に入っている品詞(助
詞(連体))と単語(4)の品1!iT(名詞)は、文
法辞書Iにより係り受け関係が成立つので、CRTディ
スプレイAにこのことを表示するステップ11.)。こ
こで、オペレータは、この関係が自分の意図するもので
はない場合、NOのキーを押す(ステップ12)。これ
により、単W¥4(3)と(4)はまとめられず、(4
)はスタックGのトップにブツシュされる(ステップ1
5)。この時のスタックGを、第7図(c)に示す。
次に、「ケシキ」が入力され、同じように形態素解析さ
れ、下記のようになる(ステップ3)。
(景色(名詞))          ・・・・・(5
)単語(5)とスタッカ内の(3)、(4)の係り受け
がチェックされる(ステップ7.9)。文法辞書■より
、単118(5)と(3)、(4)の係り受けが成立つ
ことがCRTディスプレイAに表示され(ステップ11
)、 オペレータによりOKキーが押されたとする(ス
テップ12)。これにより1次のようにまとめ上げられ
、スタックGにブツシュされる(ステップ13)。
(景色(名詞)(山((名詞)(の(助詞(連体)))
))(日本((名詞)(の(助詞(連体)))(美しい
(形容詞(連体)))))・・・(6)この時、スタッ
クGは、第7図(d)に示すようになる。
次に、オペレータより、「。」 (句点:文の区切り記
号)が入力されて、 「美しい日本の山の景色。」 という文の解析が終了する。この文の構文木は、(6)
である。
第2図は、第1図のスタックに格納された木構造および
修飾性のフォーマット図である。
スタックGには、第2図に示すように、木構造と修飾性
が格納される。
嘲 第3図は、第1図のスタックに格納された入力単語の解
析衣である。
解析衣には、被修飾文節である入力単語の情報と、修飾
文節であるスタック内単語情報が格納される。このうち
、nはスタッカ・トップの番号、n −1は、スタック
・トップの1つ前を表わす番号である。
第4図は1本発明の他の実施例を示す日本語解析装置の
全体ブロック図である。
第4図において、A−Hは第1図の装置と全く同じであ
り、1′のみが異なる。■′は、文節間の係り受け関係
を II 1 $1 (関係あり)、II O#l (
関係なし)で表わした文法機である。A−Hの動作は、
第1図で説明したと全く同じであり、構文解析装置Fは
、第6図のステップ9&:おいて、入力単語をキーとし
て文法機■を用い、スタック内単語と係り受けをチェッ
クする。
第5図は、第4図の文法機のフォーマット図である。
文法機は、縦方向に入力単語に対応する品詞を配列し、
横方向にはスタック内単語に対応する品詞を配列する。
係り受け関係をチェックするため、入力単語の品詞をキ
ーとして、行を検索し、111 #1の立っている列の
品詞と、スタック内単語の品詞をチェックし、一致した
ならば、まとめあげ、不一致であれば、検索を続け、最
後までチェックして、一致したものがなければ、係り受
けがないと判定する。
このようにして、第4図においても、カナ漢字変換等で
入力している段階で、同時に構文解析を行い、かつユー
ザが介入するため、文を入力し終えた段階で文の構造が
決定するとともに、文の構造を正確に一意的に決定でき
る。
効   果 以上説明したように、本発明によれば、日本語入力時の
文節の区切り番−関する情報を利用できるため、正確な
文節の区切りを認識できる。また、形態素解析は一度だ
けですみ、かつ人間が介入するため、正確な文の構造を
一意に決定できるとともに、文法も簡単なものでよい。
【図面の簡単な説明】
第1図は本発明の一実施例を示す日本語解析装置のブロ
ック図、第2図は第1図のスタックに格納された木構造
および修飾性のフォーマット図、第31!lは第1図の
スタックに格納された入力単語の解析表、第4図は本発
明の他の実施例を示す日本語解析装置のブロック図、第
5図は第4図の文法表のフォーマット図、第6図は第1
図、第4図の動作フローチャートである。 A:CRTディスプレイ、B:キーボード、C:制御装
置、D=解析モード切換え装置、E:形態素解析装置、
F:構文解析装置、Gニスタック、H:日本語辞書、I
:文法辞書、■′ :文法表。 <     の 手続補正書(自発) 昭和60年1月21日

Claims (2)

    【特許請求の範囲】
  1. (1)CRTディスプレイとキーボードと制御装置とを
    有する日本語解析装置において、カナ漢字変換を行い、
    各単語に品詞等を付加する形態素解析手段と、入力単語
    およびスタック内単語を文法辞書用いて係り受け関係を
    調べ、構文木構造を作る構文解析手段と、解析途中の木
    構造およびその後方の修飾性を格納するスタックと、各
    単語の係り受けの記入されている文法辞書と、形態素処
    理および構文解析外環を切換える解析モード切換え手段
    とを有することを特徴とする日本語解析装置。
  2. (2)上記文法辞書は、各単語の係り受けの有無を“0
    ”、“1”で示した文法表に置き換えられることを特徴
    とする特許請求の範囲第1項記載の日本語解析装置。
JP59255805A 1984-12-05 1984-12-05 日本語解析装置 Pending JPS61134866A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59255805A JPS61134866A (ja) 1984-12-05 1984-12-05 日本語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59255805A JPS61134866A (ja) 1984-12-05 1984-12-05 日本語解析装置

Publications (1)

Publication Number Publication Date
JPS61134866A true JPS61134866A (ja) 1986-06-21

Family

ID=17283875

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59255805A Pending JPS61134866A (ja) 1984-12-05 1984-12-05 日本語解析装置

Country Status (1)

Country Link
JP (1) JPS61134866A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61221876A (ja) * 1985-03-08 1986-10-02 Sharp Corp 構文解析装置
JPH01118961A (ja) * 1987-10-30 1989-05-11 Brother Ind Ltd 翻訳装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61221876A (ja) * 1985-03-08 1986-10-02 Sharp Corp 構文解析装置
JPH0550777B2 (ja) * 1985-03-08 1993-07-29 Sharp Kk
JPH01118961A (ja) * 1987-10-30 1989-05-11 Brother Ind Ltd 翻訳装置

Similar Documents

Publication Publication Date Title
JPH0335354A (ja) 機械翻訳装置における略称付き固有名詞処理方法
JPS6140673A (ja) 外国語作文用翻訳方法、および翻訳機
JPS58192173A (ja) 機械翻訳装置
JPH0344764A (ja) 機械翻訳装置
JPS61134866A (ja) 日本語解析装置
JPS6190269A (ja) 翻訳方式
JPS5822767B2 (ja) 和文タイプライタ
JPH05151256A (ja) 機械翻訳方法および機械翻訳装置
JPS59103136A (ja) カナ漢字変換処理装置
JP3995186B2 (ja) 構文解析装置
JPS62163174A (ja) 機械翻訳装置
JPH0580021B2 (ja)
JPH01112368A (ja) 機械翻訳装置
JP3342036B2 (ja) かな漢字変換装置
JPS6386071A (ja) 自然言語翻訳方式
JPS6190268A (ja) 翻訳方式
JPH0414168A (ja) 文書作成装置
JPH01118961A (ja) 翻訳装置
JPH03122717A (ja) プログラムコメント文生成装置
JPH01112367A (ja) 機械翻訳装置
JPS60247787A (ja) 文章変換装置
JPS63173156A (ja) 言語情報提供装置
JPH03179561A (ja) 機械翻訳装置
JPS6190271A (ja) 入力語の探索表示方式
JPH0232460A (ja) 文書処理装置