JPS6133569A - かな漢字変換装置 - Google Patents
かな漢字変換装置Info
- Publication number
- JPS6133569A JPS6133569A JP15597584A JP15597584A JPS6133569A JP S6133569 A JPS6133569 A JP S6133569A JP 15597584 A JP15597584 A JP 15597584A JP 15597584 A JP15597584 A JP 15597584A JP S6133569 A JPS6133569 A JP S6133569A
- Authority
- JP
- Japan
- Prior art keywords
- item
- notation
- words
- conjugation
- order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技術分野
本発明はかな漢字変換装置に関し、特に、かな漢字変換
装置の変換辞書に関する。
装置の変換辞書に関する。
従来技術
単語単位、文節単位のかな漢字変換用の変換辞書は5体
言はそのままの形で、用言は語幹を収納し、活用語尾は
別表で参照するシステムが一般的である。第11図に従
来の変換辞書の構成例を、第12図に従来の用言の活用
語足表の例を示す。
言はそのままの形で、用言は語幹を収納し、活用語尾は
別表で参照するシステムが一般的である。第11図に従
来の変換辞書の構成例を、第12図に従来の用言の活用
語足表の例を示す。
第11図に示したように、変換辞書は「読み」。
「表記」、「品詞活用1.r使用順位」の各項目からな
る。第1図中、*印は便宜上、動詞の終止形の活用語尾
を示すことを意味する。
る。第1図中、*印は便宜上、動詞の終止形の活用語尾
を示すことを意味する。
「使用順位」の項目は、単語が使用されるごとにその順
位が変更され、同一の「読み」に対応する複数単語間の
使用順位が示される。用言の場合、[表記」の項目には
語幹のみが示され、「品詞活用」の項目にはその活用の
種類が示されてし)る。
位が変更され、同一の「読み」に対応する複数単語間の
使用順位が示される。用言の場合、[表記」の項目には
語幹のみが示され、「品詞活用」の項目にはその活用の
種類が示されてし)る。
このように、用言は語幹で登録されているため、例えば
、終止形が「咲く」という用言は、読み「さく」では検
索することができず、「さ」で検索する必要がある。
、終止形が「咲く」という用言は、読み「さく」では検
索することができず、「さ」で検索する必要がある。
かな漢字変換する際、変換辞書からひいた用言の語幹は
、その活用の種類に応じた活用語尾表の「活用語尾」の
項目と結合した形で入力文字列と比較され、その用言が
入力文字列と合致してし)るか否か比較参照される。こ
の場合、例えば「か行五段」の活用語尾を有する用言は
、第12図に示したような活用語尾表を用いて参照され
るが、第12図に示すように、活用語尾表には「使用順
位」の項目を設けていない。そのため、入力文字列の「
さく」に対し、「咲」の使用順位は学習できても「咲く
Jの使用順位は学習できないこととなる。
、その活用の種類に応じた活用語尾表の「活用語尾」の
項目と結合した形で入力文字列と比較され、その用言が
入力文字列と合致してし)るか否か比較参照される。こ
の場合、例えば「か行五段」の活用語尾を有する用言は
、第12図に示したような活用語尾表を用いて参照され
るが、第12図に示すように、活用語尾表には「使用順
位」の項目を設けていない。そのため、入力文字列の「
さく」に対し、「咲」の使用順位は学習できても「咲く
Jの使用順位は学習できないこととなる。
このように、単語使用順位を変換辞書に学習する方式で
は、体言と用言の使用順位の学習情報が同等に扱われず
、同音意義語選択で用言を選んだとしても、次に同じ読
みを入力した場合、体言が優先されるという不具合があ
った。特に、入力したかな文字列と変換辞書の単語の読
みを比較して、できるだけ長く一致する単語を答として
取り出してくる最長−教法では、その弊害が大きい。
は、体言と用言の使用順位の学習情報が同等に扱われず
、同音意義語選択で用言を選んだとしても、次に同じ読
みを入力した場合、体言が優先されるという不具合があ
った。特に、入力したかな文字列と変換辞書の単語の読
みを比較して、できるだけ長く一致する単語を答として
取り出してくる最長−教法では、その弊害が大きい。
第13図は、上記弊害を除去した従来の変換辞書構成図
である。本変換辞書では、用言の活用語尾まで含めて一
個の単語としているため、体言と用言の学習情報が同等
に扱われる。しかし、用言そのものだけでも変換辞書中
の2〜4割を占めており、用言1語につき10 前後も
ある活用語尾を単純に格納すると変換辞書容量が大幅に
増大するという欠点がある。
である。本変換辞書では、用言の活用語尾まで含めて一
個の単語としているため、体言と用言の学習情報が同等
に扱われる。しかし、用言そのものだけでも変換辞書中
の2〜4割を占めており、用言1語につき10 前後も
ある活用語尾を単純に格納すると変換辞書容量が大幅に
増大するという欠点がある。
また、単語の使用情報を短期的に学習する方式として、
同音意義語の中から一つを選択すると、その単語を別の
小さな辞書(暫定辞書)に登録し、次に同じ同音意義語
が出現したときには、優先的にその単語を出力する方式
がある。この方式は、最も直前に使った単語が優先され
る1ast 1n−first out、を原理として
いる。しかし、順に新たな学習内容を登録していくと、
暫定辞書の容量を越えた古い学習内容は抹消されてしま
うという欠点がある。
同音意義語の中から一つを選択すると、その単語を別の
小さな辞書(暫定辞書)に登録し、次に同じ同音意義語
が出現したときには、優先的にその単語を出力する方式
がある。この方式は、最も直前に使った単語が優先され
る1ast 1n−first out、を原理として
いる。しかし、順に新たな学習内容を登録していくと、
暫定辞書の容量を越えた古い学習内容は抹消されてしま
うという欠点がある。
目 的
本発明の目的は、上記のような従来技術の欠点を解消し
、変換辞書の容量の増加を抑制しつつ、体言と用言の使
用順位を同等に学習し得るかな漢字変換装置を提供する
ことにある。
、変換辞書の容量の増加を抑制しつつ、体言と用言の使
用順位を同等に学習し得るかな漢字変換装置を提供する
ことにある。
構 成
上記目的を達成するため、本発明は、読み部と、「表記
」、「品詞活用」、「使用順位」の項目を有する表記部
とを備えた変換辞書、および前記「使用順位」の項目を
学習する手段を有するかな漢字変換装置において、読み
が同一である体言と用言の語幹を、前記変換辞書の同一
の前記読み部に対応する前記「表記」の項目に一緒に収
納し。
」、「品詞活用」、「使用順位」の項目を有する表記部
とを備えた変換辞書、および前記「使用順位」の項目を
学習する手段を有するかな漢字変換装置において、読み
が同一である体言と用言の語幹を、前記変換辞書の同一
の前記読み部に対応する前記「表記」の項目に一緒に収
納し。
かつ該用言に関しては各活用形をも前記「品詞活用」の
項目に収納し、該「品詞活用」の項目に収納された全て
の用言の各活用形、および体言に対する使用順位情報を
前記「使用順位」の項目に収納し、同一の前記「表記」
の項目に対し前記「品詞活用」の項目が複数ある場合は
該「表記」の項目の記載を1つにし゛たことに特徴があ
る。
項目に収納し、該「品詞活用」の項目に収納された全て
の用言の各活用形、および体言に対する使用順位情報を
前記「使用順位」の項目に収納し、同一の前記「表記」
の項目に対し前記「品詞活用」の項目が複数ある場合は
該「表記」の項目の記載を1つにし゛たことに特徴があ
る。
以下、本発明の構成を一実施例により詳細に説明する。
第9図は本発明の一実施例を示すかな漢字変換装置のブ
ロック図である。
ロック図である。
図において、1は入力部、2は入力前処理部、3は候補
抽出部、4は変換情報管理部、5は出力制御部、6は表
示部、そして7は変換制御部である。
抽出部、4は変換情報管理部、5は出力制御部、6は表
示部、そして7は変換制御部である。
入力部lは、例えば、下記の制御キーを有するキーボー
ドである。
ドである。
(1)変換キー:読みを入力し、このキーを押下するこ
とにより、入力文字列を漢字かな混じり文に変換する。
とにより、入力文字列を漢字かな混じり文に変換する。
この機能は1句読点等の文の切れ目であることがはっき
りした特殊記′号の入力によって起動させることもでき
る。
りした特殊記′号の入力によって起動させることもでき
る。
(2)次候補キー:単語区切りにカーソルを位置づけ、
このキーを押下することにより該単語区切りの次候補が
表示される。
このキーを押下することにより該単語区切りの次候補が
表示される。
日本語文が仮名文(英文字でも良い)で入力されると、
変換制御部7の制御のもとに以下のような処理を経て、
漢字かな混じり文として出力される。なお、第9図にお
いて、太い白線矢印は取扱うデータの流れを、また、実
線矢印は制御信号の流れを示している。入力前処理部2
は、入力文字列の種類(英数字、記号、カタ仮名、平板
名2区切り記号等)や、上記制御キーの操作を認識し、
変換対象となる仮名文字列を抽出する。
変換制御部7の制御のもとに以下のような処理を経て、
漢字かな混じり文として出力される。なお、第9図にお
いて、太い白線矢印は取扱うデータの流れを、また、実
線矢印は制御信号の流れを示している。入力前処理部2
は、入力文字列の種類(英数字、記号、カタ仮名、平板
名2区切り記号等)や、上記制御キーの操作を認識し、
変換対象となる仮名文字列を抽出する。
候補抽出部3は、第10図に示すように、候補抽出制御
部31、候補単語記憶部32、辞書検索部33、および
変換辞書34で構成されており。
部31、候補単語記憶部32、辞書検索部33、および
変換辞書34で構成されており。
前記入力前処理部2で抽出された仮名文字列を、変換制
御部7を介して受取り、該文字列に対応する変換候補を
変換辞書34を参照して抽出し、一旦、候補単語記憶部
32に記憶する。これらの操作は、変換制御部7の制御
のもとに、候補抽出制御部31により制御される。
御部7を介して受取り、該文字列に対応する変換候補を
変換辞書34を参照して抽出し、一旦、候補単語記憶部
32に記憶する。これらの操作は、変換制御部7の制御
のもとに、候補抽出制御部31により制御される。
変換情報管理部4は、候補抽出部3の辞書検索部33を
介して変換辞書34をアクセス可能に構成されており、
オペレータの入力情報、および変換候補情報等を蓄積管
理する機能を有する。出力制御部5は、変換制御部7の
制御のもとに入力文字列や変換文字列の表示部6への表
示を制御する。
介して変換辞書34をアクセス可能に構成されており、
オペレータの入力情報、および変換候補情報等を蓄積管
理する機能を有する。出力制御部5は、変換制御部7の
制御のもとに入力文字列や変換文字列の表示部6への表
示を制御する。
ここで、「かな」で入力された入力文字列中に漢字かな
混じり文に変換すべき文字列がある場合。
混じり文に変換すべき文字列がある場合。
オペレータが制御キーの1つである前記変換キーを押下
すると、候補抽出部3により変換候補の文字(漢字、お
よび「かな」)が抽出され、出力制御部5により表示部
6に表示される。変換すべき文字列中の同一の「読み」
に対し変換候補が複数ある場合は、変換制御部7の制御
のもとに、まず、当該「読み」に対する第1の変換候補
(使用順位の最も高いもの:使用順位については後述す
る)が表示される。オペレータは、表示された第1の変
換候補が意図する漢字、または漢字かな混じり文と異な
る場合は、次の変換候補を表示させるための制御キー(
例えば、前記次候補キー)を押下して順次変換候補を表
示させ、所望する変換候補を選択することができる。
すると、候補抽出部3により変換候補の文字(漢字、お
よび「かな」)が抽出され、出力制御部5により表示部
6に表示される。変換すべき文字列中の同一の「読み」
に対し変換候補が複数ある場合は、変換制御部7の制御
のもとに、まず、当該「読み」に対する第1の変換候補
(使用順位の最も高いもの:使用順位については後述す
る)が表示される。オペレータは、表示された第1の変
換候補が意図する漢字、または漢字かな混じり文と異な
る場合は、次の変換候補を表示させるための制御キー(
例えば、前記次候補キー)を押下して順次変換候補を表
示させ、所望する変換候補を選択することができる。
以上述べた処理は、従来のかな漢字変換処理においても
行われていた処理であり、この処理過程におい“C1以
下に述べる本発明の特徴となる前記辞書検索部33.変
換辞書34が有効に利用される。
行われていた処理であり、この処理過程におい“C1以
下に述べる本発明の特徴となる前記辞書検索部33.変
換辞書34が有効に利用される。
第1図は本発明の第1の実施例による前記変換辞書34
の辞書構成を示す図である。
の辞書構成を示す図である。
本辞書構成は1体言と用語の語幹の読みが同一の場合、
その体言と用言の語幹とを同一の「読み」の項目に収納
し、かつ、用言については、活用語尾をも収納し7、そ
の各々に使用順位の情報を持たせている。「使用順位」
は、例えば、用言「去る」の仮定形と命令形のように、
−同一語幹に対する活用形が同一の場合、それらの間で
も順位付けを行っている。また、例えば、[去るJの終
止形、連体形と、名詞「猿」のように、用言の活用形を
も含めた「読み」と名詞等の「読み」が同一である場合
は、それらの間でも順位付けを行っている。すなわち、
同一の「読み」に対応する品詞活用(単語)間の使用順
位の学習は、体言同士、または用言同士のみで行うので
はなく1体言、用言を通して行う。第1図では、**印
で示した「さる」という[読み」に対して、1位が「去
る」(連体形)、2位が「猿」(名詞)、3位が「去る
」(終止形)の順になっている。なお、第1図中*印は
、「表記」の項目に動詞の終止形の活用語尾、また「品
詞活用」の項目に動詞の各活用語尾を便宜上示すことを
意味している。
その体言と用言の語幹とを同一の「読み」の項目に収納
し、かつ、用言については、活用語尾をも収納し7、そ
の各々に使用順位の情報を持たせている。「使用順位」
は、例えば、用言「去る」の仮定形と命令形のように、
−同一語幹に対する活用形が同一の場合、それらの間で
も順位付けを行っている。また、例えば、[去るJの終
止形、連体形と、名詞「猿」のように、用言の活用形を
も含めた「読み」と名詞等の「読み」が同一である場合
は、それらの間でも順位付けを行っている。すなわち、
同一の「読み」に対応する品詞活用(単語)間の使用順
位の学習は、体言同士、または用言同士のみで行うので
はなく1体言、用言を通して行う。第1図では、**印
で示した「さる」という[読み」に対して、1位が「去
る」(連体形)、2位が「猿」(名詞)、3位が「去る
」(終止形)の順になっている。なお、第1図中*印は
、「表記」の項目に動詞の終止形の活用語尾、また「品
詞活用」の項目に動詞の各活用語尾を便宜上示すことを
意味している。
このようにすることにより、体言と用言の使用順位を同
等に扱うことが可能となる。
等に扱うことが可能となる。
また、同一の「表記」の項目に対し「品詞活用」の項目
が複数存在する場合は、「表記」の項目の記載を1つに
して重複記載を避けることにより、記憶容量の増大を抑
制している。
が複数存在する場合は、「表記」の項目の記載を1つに
して重複記載を避けることにより、記憶容量の増大を抑
制している。
第2図は1本発明の第2の実施例による変換辞書34の
記憶構造を示す図である。
記憶構造を示す図である。
本記憶構造は、可変長構造の類ファイルとなっており、
読み部aに続いて表記部すを有し、表記部すは[品詞活
用」、「表記J、r使用順位」の項目層に記載されてい
る。また、表記部すは、その直前の読み部aから次の読
み部aが現われるところまでを、該直前の読み部aに対
応する表記部すとする。なお、(動ら用)、(動ら促)
、(名)・・・等は「品詞活用」の種類を略称したもの
であり、それぞれ、ら行動側の連用形、ら行動側の促音
便形2名詞であることを示す。
読み部aに続いて表記部すを有し、表記部すは[品詞活
用」、「表記J、r使用順位」の項目層に記載されてい
る。また、表記部すは、その直前の読み部aから次の読
み部aが現われるところまでを、該直前の読み部aに対
応する表記部すとする。なお、(動ら用)、(動ら促)
、(名)・・・等は「品詞活用」の種類を略称したもの
であり、それぞれ、ら行動側の連用形、ら行動側の促音
便形2名詞であることを示す。
読み部aの「読み」;「さ」に対する表記部すの「表記
」;「差」のように、同一の「表記Jに対し名詞、用言
の活用形等の「品詞活用」が複数存在する場合は、各「
品詞活用」の種別と、その種別ごとの「使用順位」の情
報を有する。1つの「表記」に属する複数の「品詞活用
」、「使用順位」の対応関係は、上記の「差」を例にと
ると。
」;「差」のように、同一の「表記Jに対し名詞、用言
の活用形等の「品詞活用」が複数存在する場合は、各「
品詞活用」の種別と、その種別ごとの「使用順位」の情
報を有する。1つの「表記」に属する複数の「品詞活用
」、「使用順位」の対応関係は、上記の「差」を例にと
ると。
「品詞活用」;(名)、(動さ用1)、(動さ用2)が
それぞれ「使用順位J ; (1)、(2)、(3
)に対応している。
それぞれ「使用順位J ; (1)、(2)、(3
)に対応している。
読み部aの始点は、第3図(A)に示した「読み索引ノ
により示される。「読み索引」は「読み」と、その[読
み」が変換辞書本体ファイル(第3図(B):この記憶
構造は第2図に示した通りである)のどこに記載されて
いるかを示す「辞書アドレス」の2つの項目を有し、前
記候補抽出部3の辞書検索部33に格納されている。な
お、「読み索引」中の「読み」は、「読み」の深さごと
に五十音順に格納されている。
により示される。「読み索引」は「読み」と、その[読
み」が変換辞書本体ファイル(第3図(B):この記憶
構造は第2図に示した通りである)のどこに記載されて
いるかを示す「辞書アドレス」の2つの項目を有し、前
記候補抽出部3の辞書検索部33に格納されている。な
お、「読み索引」中の「読み」は、「読み」の深さごと
に五十音順に格納されている。
第3図(B)に示した「さ」のように、辞書検索対象の
「読み」が「読み索引」中にない場合は、辞書検索対象
の「読み」に、前部で一番近い[読み索引」中の「読み
」対応の「辞書アドレス」により、第3図(B)に示し
た変換辞書本体ファイルをアクセスし、順に比較して辞
書検索対象と一致する「読み」を探索する。
「読み」が「読み索引」中にない場合は、辞書検索対象
の「読み」に、前部で一番近い[読み索引」中の「読み
」対応の「辞書アドレス」により、第3図(B)に示し
た変換辞書本体ファイルをアクセスし、順に比較して辞
書検索対象と一致する「読み」を探索する。
このようにして、「読み索引」により変換辞書34(変
換辞書本体ファイル)から該当する「読み」を引き当て
ると、その「読み」に属する表記部すをすべて前記候補
単語列記憶部32に格納する。この後、「使用順位J等
を参照して候補抽出制御部31の制御のもとに適切な「
表記Jが抽出され、変換文字列信号が出力される。
換辞書本体ファイル)から該当する「読み」を引き当て
ると、その「読み」に属する表記部すをすべて前記候補
単語列記憶部32に格納する。この後、「使用順位J等
を参照して候補抽出制御部31の制御のもとに適切な「
表記Jが抽出され、変換文字列信号が出力される。
次に、本実施例における辞書項目のコードの例を第4図
により説明する。なお、図中、コードは16進数で示し
である。
により説明する。なお、図中、コードは16進数で示し
である。
図において、読み部aは1文字を2バイトで表すJIS
6226規格の漢字コードにより記載されている。表記
部す中の[表記」のコード、は2バイトからなり、各バ
イトの最上位ビットは常に1′である。「品詞活用」、
「使用順位情報」は1バイトからなり、各バイトの最上
位ビットは常に0′とする。このように表記部すを構成
した場合、各コードの最上位ビットに着目すると。
6226規格の漢字コードにより記載されている。表記
部す中の[表記」のコード、は2バイトからなり、各バ
イトの最上位ビットは常に1′である。「品詞活用」、
「使用順位情報」は1バイトからなり、各バイトの最上
位ビットは常に0′とする。このように表記部すを構成
した場合、各コードの最上位ビットに着目すると。
「表記」のコードは(1,1)となり、その両側には[
品詞活用」のコード、「使用順位情報」のコードの0′
がバイト単位で同数ずつ並ぶこととなり1表記部すの区
切りが項目のコードにより判別できる。なお、図の備考
欄の「2進整数(1〜127まで)」は、1バイト・コ
ードの最上位ビットを0′に固定したため、そのコード
の内容は残りの7ビツトで示されるという意味である。
品詞活用」のコード、「使用順位情報」のコードの0′
がバイト単位で同数ずつ並ぶこととなり1表記部すの区
切りが項目のコードにより判別できる。なお、図の備考
欄の「2進整数(1〜127まで)」は、1バイト・コ
ードの最上位ビットを0′に固定したため、そのコード
の内容は残りの7ビツトで示されるという意味である。
なお、第4図の読み部aを[ひらがな」、または1片カ
ナ」に限定すれば、そのコードは1バイトコードで済み
、変換辞書34の容量を低減することができる。この場
合、その最上位ビットを「表記」の最上位ビットと同じ
値、すなわち1′とし、残りの7ビツトで2進表現する
。そうすると、バイト単位で最上位ビットを順次読んだ
場合、最上位ビットがl′であれば、それは読み部aの
コード、最上位ビットが1’、’1’と2個連続する場
合は[表記」、最上位ビットが0′の場合は「品詞活用
」または「使用順位」であると、容易に判定することが
できる。
ナ」に限定すれば、そのコードは1バイトコードで済み
、変換辞書34の容量を低減することができる。この場
合、その最上位ビットを「表記」の最上位ビットと同じ
値、すなわち1′とし、残りの7ビツトで2進表現する
。そうすると、バイト単位で最上位ビットを順次読んだ
場合、最上位ビットがl′であれば、それは読み部aの
コード、最上位ビットが1’、’1’と2個連続する場
合は[表記」、最上位ビットが0′の場合は「品詞活用
」または「使用順位」であると、容易に判定することが
できる。
読み部aの最上位ビットを0′に固定した場合は、最上
位ビットを1′に固定とだ場合はど容易に読み部aのコ
ード登判定することはできないが、上記のように、「表
記」の両側に対称的に並んだ「品詞活用」と「使用順位
」し;より、判定することができる。
位ビットを1′に固定とだ場合はど容易に読み部aのコ
ード登判定することはできないが、上記のように、「表
記」の両側に対称的に並んだ「品詞活用」と「使用順位
」し;より、判定することができる。
第4図において、読み部aの「読み」を2バイト漢字コ
ードの下位コードを使い、その先頭に1バイトのセパレ
ータコードを付けた場合は、読み部aは2バ、イトコー
ドとなり、上記の1バイトコードの読み部aより長くな
るが、「読み」は容易に漢字コードに変換することがで
き、また、1つの「読み」の範囲を容易に判別すること
ができる。
ードの下位コードを使い、その先頭に1バイトのセパレ
ータコードを付けた場合は、読み部aは2バ、イトコー
ドとなり、上記の1バイトコードの読み部aより長くな
るが、「読み」は容易に漢字コードに変換することがで
き、また、1つの「読み」の範囲を容易に判別すること
ができる。
このようにして、順ファイル・可変長構造の変換辞書に
おいて、表記部すの区切り、および次の読み部aの位置
を判別することができ、適切な変換候補を抽出すること
ができる。
おいて、表記部すの区切り、および次の読み部aの位置
を判別することができ、適切な変換候補を抽出すること
ができる。
第5図は1本発明の第3の実施例による変換辞書34の
記憶構造を示す図である。
記憶構造を示す図である。
本記憶構造は、第2の実施例と同様に可変長の順ファイ
ルとなっており、読み部aに続いて表記部すを有し、裏
話部すは「品詞情報」、「表記」。
ルとなっており、読み部aに続いて表記部すを有し、裏
話部すは「品詞情報」、「表記」。
「使用順位」の項目順に記載されている。
ただし、用言については、品詞および活用分類が決ると
各活用形は別表で規定することができるので、各活用形
は変換辞書本体ファイルから除外している。このことに
より、第2の実施例のように活用形まで規定した「品詞
活用」コードを使う必要がなくなる。したがって、用言
類に対し、別表で規定した順序で「使用順位」を連続し
て収納している。
各活用形は別表で規定することができるので、各活用形
は変換辞書本体ファイルから除外している。このことに
より、第2の実施例のように活用形まで規定した「品詞
活用」コードを使う必要がなくなる。したがって、用言
類に対し、別表で規定した順序で「使用順位」を連続し
て収納している。
その別表を第6図に示す。
別表は、第6図(A)に示した「活用形表索引」と「活
用形表本体」とにより構成され、第5図に示した変換辞
書本体ファイル中の「品詞活用」に対し、活用形を参照
することができる。例えば、第5図に示した変換辞書本
体ファイル中の読み部a; 「さ」の表記部すを順に読
み出すには、まず、初めの「品詞活用」をみると「動詞
ら行五段」であり、第6図(A)の「活用形表索引」の
当該部分の「活用形個数」は9個となっているので、変
換辞書本体ファイル中で、表記「去」の後に9個の「使
用順位」が並んでいることがわかる。具体的な個々の活
用形は、「活用形表索引」中の[本体収納先頭アドレス
」により第6図(B)に示した「活用形表本体」をアク
セスすることにより認識することができる。
用形表本体」とにより構成され、第5図に示した変換辞
書本体ファイル中の「品詞活用」に対し、活用形を参照
することができる。例えば、第5図に示した変換辞書本
体ファイル中の読み部a; 「さ」の表記部すを順に読
み出すには、まず、初めの「品詞活用」をみると「動詞
ら行五段」であり、第6図(A)の「活用形表索引」の
当該部分の「活用形個数」は9個となっているので、変
換辞書本体ファイル中で、表記「去」の後に9個の「使
用順位」が並んでいることがわかる。具体的な個々の活
用形は、「活用形表索引」中の[本体収納先頭アドレス
」により第6図(B)に示した「活用形表本体」をアク
セスすることにより認識することができる。
次の「表記」については、その「品詞活用」は体言であ
り、活用しないので、別表を参照することなく、変換辞
書本体ファイルからすべての情報を得ることができる。
り、活用しないので、別表を参照することなく、変換辞
書本体ファイルからすべての情報を得ることができる。
第7図は、第5図に示した変換辞書本体ファイルの辞書
項目のコード例を示す図である。
項目のコード例を示す図である。
本図は、第4図に示した第2の実施例における辞書項目
のコード例とほぼ同様である。ただし。
のコード例とほぼ同様である。ただし。
第5図に示した変換辞書本体ファイル中では「表記」が
同じ「差」である「名詞」と「さ行五段動詞」は同一の
表記部す内に記載しているが、上記別表を使用する関係
上、本辞書項目のコードは。
同じ「差」である「名詞」と「さ行五段動詞」は同一の
表記部す内に記載しているが、上記別表を使用する関係
上、本辞書項目のコードは。
「名詞」と「さ行五段動詞」とを別々・の表記部すに記
載している。
載している。
第8図は5本発明の一実施例によるかな漢字変換処理の
動作概要を示すフローチャートである。
動作概要を示すフローチャートである。
まず、入力装置1により、かな文字列を入力する(10
1)。入力されたかな文字列の位置にカーソルが位置し
ているか否かを判断し、もし否であればカーソルの移動
を待ち、移動後の位置を記憶する(102,103)、
カーソル位置の入力文字列に対し、かな漢字変換要求が
なければ処理モートを無変換モードにセットし、かな漢
字変換要求があれば上記辞書検索部33は変換辞書34
を検索する(104,105,106)。検索の結果、
変換すべき文字列の「読み」に対応する「表記」の全て
を抽出し、それらを変換候補として候補単語列記憶部3
2に格納する(107)。候補抽出制御部31は、候補
単語列記憶部32に格納された変換候補の中から最高使
用順位の単語を抽出し、韓示部6に表示する(108)
。もし表示された単語が所望の単語でない場合は、オペ
レータは次候補キーを押下して変換候補の単語を順次表
示させ、所望の単語を選択する(109.tto、tt
t)。
1)。入力されたかな文字列の位置にカーソルが位置し
ているか否かを判断し、もし否であればカーソルの移動
を待ち、移動後の位置を記憶する(102,103)、
カーソル位置の入力文字列に対し、かな漢字変換要求が
なければ処理モートを無変換モードにセットし、かな漢
字変換要求があれば上記辞書検索部33は変換辞書34
を検索する(104,105,106)。検索の結果、
変換すべき文字列の「読み」に対応する「表記」の全て
を抽出し、それらを変換候補として候補単語列記憶部3
2に格納する(107)。候補抽出制御部31は、候補
単語列記憶部32に格納された変換候補の中から最高使
用順位の単語を抽出し、韓示部6に表示する(108)
。もし表示された単語が所望の単語でない場合は、オペ
レータは次候補キーを押下して変換候補の単語を順次表
示させ、所望の単語を選択する(109.tto、tt
t)。
この時、変換候補の単語は、使用順位の高い順に表示さ
れるので、所望の単語の選択時間を短縮することができ
る。
れるので、所望の単語の選択時間を短縮することができ
る。
選択された単語は、変換辞書34中で、その使用順位情
報(当該単語と同一の「読み」に対応する単語間での使
用順位)が学習される(112)。
報(当該単語と同一の「読み」に対応する単語間での使
用順位)が学習される(112)。
この際、上記のように同一の「読み」の項に、体言、用
言が一緒に記載され、その各々に使用順位情報が付加さ
れるので、体言と用言の使用順位が同等に学習される。
言が一緒に記載され、その各々に使用順位情報が付加さ
れるので、体言と用言の使用順位が同等に学習される。
その後、変換文字列に編集され1編集結果が表示されて
かな漢字変換処理が終了する(113,114)。
かな漢字変換処理が終了する(113,114)。
効 果
以上説明したように1本発明のかな漢字変換装置によれ
ば、変換辞書の記憶容量の増加を抑制しつつ1体言と用
言の使用順位を同等に学習することができる。
ば、変換辞書の記憶容量の増加を抑制しつつ1体言と用
言の使用順位を同等に学習することができる。
第1図は本発明の第1の実施例による変換辞書の構成を
示す図、第2図は本発明の第2の実施例による変換辞書
の記憶構造を示す図、第3図は第2図の変換辞書をアク
セスするための「読み索引」を示す図、第4図は第2図
に示した変換辞書の辞書項目のコード例を示す図、第5
図は本発明の第3の実施例による変換辞書の記憶構造を
示す図、第6図は第3の実施例において使用する別表を
示す図、第7図は第5図に示した変換辞書の辞書項目の
コード例を示す図、第8図は本発明の一実施例によるか
な漢字変換装置の動作を示すフローチャート、第9図は
本発明の一実施例によるかな漢字変換装置のブロック図
、第10図は第9図における候補抽出部の詳細ブロック
図、第11図、第12図、第13図は従来の変換辞書の
構成を示す図である。 l:入力部、2:入力前処理部、3:候補抽出部、4:
変換情報管理部、5:出力制御部、6:表示部、7:変
換制御部、31:候補抽出部、32:候補単語列記憶部
、33:辞書検索部、34:変換辞書。 第 1 図 第 4 図 第 7 図 第 8 図 第 10 図 第 12 図 「−− 第 13 図 手続補正書(自発) 昭和59年8月24日 を 2、発明の名称 かな漢字変換装置 3 補正をする者 事件との関係 特許出願人 住 所 東京都大田区中馬込1丁目3番6号氏
名(名称ン (674)株式会社 リ コ −
代表者 浜 1) 広 4、代理人 および図面 7、J 補正の内容 別紙のとおり (a)明細書第2頁下から2行目の「第1図中、」「第
11図中、」と補正する。 (b)第4図、第6図、第7図および第8図を、そぞれ
別添の図面のとおりに補正する。 第 4 図 第 7 図 第 8 図 手続補正書(自発) 昭和59年9月13日 昭和59年特 許 願第155975号2、発明の名
称 かな漢字変換装置 3、 補正をする者 事件との関係 特許出願人 4、代理人 ン 5・箆 補正により増加する発明の数 な しく
、)明細書第18頁第12行目の「韓示部6」を。 「表示部6」に補正する。 (b)第7図を別添の図面のとおりに補正する。
示す図、第2図は本発明の第2の実施例による変換辞書
の記憶構造を示す図、第3図は第2図の変換辞書をアク
セスするための「読み索引」を示す図、第4図は第2図
に示した変換辞書の辞書項目のコード例を示す図、第5
図は本発明の第3の実施例による変換辞書の記憶構造を
示す図、第6図は第3の実施例において使用する別表を
示す図、第7図は第5図に示した変換辞書の辞書項目の
コード例を示す図、第8図は本発明の一実施例によるか
な漢字変換装置の動作を示すフローチャート、第9図は
本発明の一実施例によるかな漢字変換装置のブロック図
、第10図は第9図における候補抽出部の詳細ブロック
図、第11図、第12図、第13図は従来の変換辞書の
構成を示す図である。 l:入力部、2:入力前処理部、3:候補抽出部、4:
変換情報管理部、5:出力制御部、6:表示部、7:変
換制御部、31:候補抽出部、32:候補単語列記憶部
、33:辞書検索部、34:変換辞書。 第 1 図 第 4 図 第 7 図 第 8 図 第 10 図 第 12 図 「−− 第 13 図 手続補正書(自発) 昭和59年8月24日 を 2、発明の名称 かな漢字変換装置 3 補正をする者 事件との関係 特許出願人 住 所 東京都大田区中馬込1丁目3番6号氏
名(名称ン (674)株式会社 リ コ −
代表者 浜 1) 広 4、代理人 および図面 7、J 補正の内容 別紙のとおり (a)明細書第2頁下から2行目の「第1図中、」「第
11図中、」と補正する。 (b)第4図、第6図、第7図および第8図を、そぞれ
別添の図面のとおりに補正する。 第 4 図 第 7 図 第 8 図 手続補正書(自発) 昭和59年9月13日 昭和59年特 許 願第155975号2、発明の名
称 かな漢字変換装置 3、 補正をする者 事件との関係 特許出願人 4、代理人 ン 5・箆 補正により増加する発明の数 な しく
、)明細書第18頁第12行目の「韓示部6」を。 「表示部6」に補正する。 (b)第7図を別添の図面のとおりに補正する。
Claims (2)
- (1)読み部と、「表記」、「品詞活用」、「使用順位
」の項目を有する表記部を備えた変換辞書、および前記
「使用順位」の項目を学習する手段を有するかな漢字変
換装置において、読みが同一である体言と用言の語幹を
、前記変換辞書の同一の前記読み部に対応する前記「表
記」の項目に一緒に収納し、かつ該用言に関しては各活
用形をも前記「品詞活用」の項目に収納し、該「品詞活
用」の項目に収納された全ての体言、および用言の各活
用形に対する使用順位情報を前記「使用順位」の項目に
収納し、同一の前記「表記」の項目に対し前記「品詞活
用」の項目が複数ある場合は該「表記」の項目の記載を
1つにしたことを特徴とするかな漢字変換装置。 - (2)前記変換辞書は、1個の前記読み部の次に該読み
部に対する複数個の前記表記部が並び、該表記部は前記
「品詞活用」、前記「表記」、前記「使用順位」の項目
順に並ぶよう構成し、これら各項目は1バイトまたは2
バイトのコードで記憶し、それら各バイトの最上位ビツ
トを特定の値に固定したことを特徴とする特許請求の範
囲第1項記載のかな漢字変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15597584A JPS6133569A (ja) | 1984-07-26 | 1984-07-26 | かな漢字変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15597584A JPS6133569A (ja) | 1984-07-26 | 1984-07-26 | かな漢字変換装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6133569A true JPS6133569A (ja) | 1986-02-17 |
Family
ID=15617622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15597584A Pending JPS6133569A (ja) | 1984-07-26 | 1984-07-26 | かな漢字変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6133569A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0336661A (ja) * | 1989-07-03 | 1991-02-18 | Ricoh Co Ltd | 自然言語処理装置 |
-
1984
- 1984-07-26 JP JP15597584A patent/JPS6133569A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0336661A (ja) * | 1989-07-03 | 1991-02-18 | Ricoh Co Ltd | 自然言語処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6275789B1 (en) | Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language | |
Buckwalter | Issues in Arabic morphological analysis | |
JPS6133569A (ja) | かな漢字変換装置 | |
Sahala | Neural Lemmatization and POS-tagging models for Coptic, Demotic and Earlier Egyptian | |
JPH0578058B2 (ja) | ||
JP2003178087A (ja) | 外国語電子辞書検索装置および方法 | |
JPH0140372B2 (ja) | ||
JPH0246976B2 (ja) | ||
JP3285149B2 (ja) | 外国語電子辞書検索方法及び装置 | |
Alexander | A Dictionary of the Cherokee Indian Language. | |
GB1596411A (en) | Translation system | |
JP2008140074A (ja) | 例文検索装置および例文検索処理プログラム | |
JPS6057421A (ja) | 文書作成装置 | |
JPH039502B2 (ja) | ||
JPS59103136A (ja) | カナ漢字変換処理装置 | |
Wien | Nine problems concerning Arabic | |
JPS62144269A (ja) | 情報検索装置 | |
JPS60205661A (ja) | かな漢字変換装置 | |
JPS59121425A (ja) | 「へい」音漢字変換装置 | |
JPH03129568A (ja) | 文書処理装置 | |
JPS5998236A (ja) | 日本文入力装置 | |
Szanser | Elastic Matching of Coded Strings and its Applications | |
JPS60136863A (ja) | カナ漢字変換装置における短縮変換方式 | |
JPS63115264A (ja) | 文書処理装置 | |
JPS6380361A (ja) | 言語情報処理装置 |