JP3537888B2 - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JP3537888B2
JP3537888B2 JP25038494A JP25038494A JP3537888B2 JP 3537888 B2 JP3537888 B2 JP 3537888B2 JP 25038494 A JP25038494 A JP 25038494A JP 25038494 A JP25038494 A JP 25038494A JP 3537888 B2 JP3537888 B2 JP 3537888B2
Authority
JP
Japan
Prior art keywords
word
dictionary
candidate
occurrence
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP25038494A
Other languages
English (en)
Other versions
JPH08115318A (ja
Inventor
明 濱田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP25038494A priority Critical patent/JP3537888B2/ja
Publication of JPH08115318A publication Critical patent/JPH08115318A/ja
Application granted granted Critical
Publication of JP3537888B2 publication Critical patent/JP3537888B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、かな漢字変換装置に関
し、より詳細には、日本語ワードプロセッサなどのかな
漢字変換に用いられる共起(用例)辞書の構造及びその
共起辞書を用いたかな漢字変換装置に関するものであ
る。
【0002】
【従来の技術】従来の文書作成装置について記載した公
知文献としては、例えば、特開平5−151199号公
報がある。この公報のものは、入力された読み文字列が
仮名漢字変換処理手段により仮名漢字変換辞書から同音
語を検索する。さらに、共起処理手段で前後の単語の意
味的結び付きの高いもの同志が共起辞書を検索すること
により選択され、共起関係に強弱の違いをアトリビュー
ション表示の違いで表す共起表示手段により、同音語の
単語同志の意味的結び付きの強弱関係がユーザに分かる
ように表示され、それを確認して同音語が希望のものか
をいちいちチェックし、確定するというような煩わしい
処理を軽減することができるものである。
【0003】前記特開平5−151199号公報にも述
べられているように、入力された仮名文字列と仮名漢字
変換辞書の見出しのマッチングによって生成された変換
候補に対して、結合しやすい単語の組み合わせを格納し
た共起辞書(用例辞書)を参照することで、これらの単
語を含む候補を優先し、変換効率を上げることは従来よ
り行われてきた。
【0004】図11は、従来の共起辞書検索の概念を示
すブロック図で、図中、30は候補バッファ、31は後
側単語逐次取出し手段、32はインデックス検索手段、
33は共起辞書インデックス、34は前側単語逐次取出
し手段、35は辞書本体検索手段、36は共起辞書本
体、37は優先組合せ決定手段である。
【0005】後側単語逐次取出し手段31によって候補
バッファ30から後側単語を一つ取り出し、この後側単
語でインデックス検索手段32によって共起辞書インデ
ックス33を検索する。これで共起辞書本体の検索範囲
が限定される。そこで、前側単語逐次取出し手段34に
よって前側単語を一つ取り出し、この前側単語で辞書本
体検索手段35によって共起辞書本体36を検索する。
後側単語の同音語の数だけインデックスを検索して本体
の検索範囲を変えていき、そのつど前側単語の同音語の
数だけ辞書本体を検索することになる。見つかった優先
組み合わせは、優先組合せ決定手段37で一つに絞ら
れ、候補バッファ30に書き込まれる。
【0006】図12は、従来の共起辞書の構造の概念を
示す説明図で、図中の参照番号は、図11と同じであ
る。例えば、「…しがいせん…」という仮名入力が「し
がい」と「せん」という単語に解析されて候補バッファ
30に格納されている場合、共起辞書インデックス33
と共起辞書本体36を検索することで、「市街戦」か
「紫外線」という組み合わせを優先すればよいことが判
ることになる。
【0007】
【発明が解決しようとする課題】しかしながら、単語対
単語の組み合わせを格納した共起辞書では、候補単語の
同音語の組み合わせの回数だけ共起辞書本体を検索する
必要があった。もし、途中で優先する組み合わせが見つ
かったとしても、例のように優先する組み合わせが複数
存在する可能性がある場合には、途中で検索を打ち切る
こともできなくなる。図11のブロック図で説明したよ
うに、単語の組み合わせを格納した辞書では、同音語に
ついて検索を繰り返すことで処理に時間がかかってい
た。また、同音語の組み合わせの中に優先組み合わせが
複数ある場合は、候補バッファに複数の優先組み合わせ
を格納できる場所を用意するか、候補バッファを節約す
るために、組み合わせを一つに絞る必要があった。
【0008】本発明は、このような実情に鑑みてなされ
たもので、統語処理を一括して行う同音語グループ間の
共起単語の組み合わせの集合を、同音語グループの組み
合わせと対応付けて格納したかな漢字変換用共起辞書
用いたかな漢字変換装置を提供することを目的としてい
る。
【0009】
【課題を解決するための手段】本発明は、上記課題を解
決するために、単語の表記をその品詞とともに読み仮名
順に記憶した単語辞書と、同じ読みで同じ品詞の同音語
グループを当該グループに含まれ前記単語辞書上で先頭
に格納された代表単語アドレスで識別し、各同音語グル
ープ間の共起関係を当該代表単語アドレスの組み合わせ
で記憶するとともに、共起関係にある同音語グループに
含まれる単語間の共起関係を代表単語アドレスからの格
納順を示す順序情報の組み合わせで記憶する共起辞書
と、入力手段から入力される仮名文字列と前記単語辞書
の読み仮名とのマッチング結果である候補単語を格納す
る候補バッファと、前記候補バッファに先頭単語候補と
それに続く後側単語候補とが記憶されている場合に、先
頭単語候補が含まれる同音語グループと、後側単語候補
が含まれる同音語グループ間の共起関係の有無を前記共
起辞書から検索し、共起関係にあるとき、前記候補バッ
ファに格納された先頭単語候補と後側単語候補から有効
な組み合わせ候補を、各同音語グループに含まれる単語
間の共起関係を、前記順序情報を参照して決定する検索
手段とを有することを特徴としたものである。
【0010】
【作用】本発明によるかな漢字変換装置に用いられる
な漢字変換用共起辞書は、かな漢字変換において一括し
て統語処理される同音語グループ間で共起する単語の組
み合わせの集合を、同音語グループの組み合わせと対応
づけて格納し、また、かな漢字変換において一括して統
語処理される同音語グループ間の単語の組み合わせが全
て無意味であることを示すマークを、同音語グループの
組み合わせと対応づけて格納したので、同音語を持つ候
補同士の組み合わせでも共起辞書の検索は1回で済ます
ことができ、優先する単語の組み合わせが複数ある場合
でも、それらの集められたアドレスを候補バッファに格
納することで、候補バッファの容量を増大することなく
対応できる。また、単語の組み合わせを優先順に配列し
ておけば、点数づけをしなくても先頭のものが最優先で
あることがわかるようになる。
【0011】
【実施例】実施例について、図面を参照して以下に説明
する。本発明では、候補バッファでまとめられ、語尾処
理や付属語の接続チェックなど統語処理を一括して行う
同音語を、共起辞書でもまとめて処理することを提案し
ている。図1は、本発明における共起辞書検索の概念を
説明するためのブロック図で、図中、10は候補バッフ
ァ、11は後側単語先頭取出し手段、12はインデック
ス検索手段、13は共起辞書インデックス、14は前側
単語先頭取出し手段、15は辞書本体検索手段、16は
共起辞書本体、17は単語ペアデータである。
【0012】後側単語先頭取出し手段11によって代表
単語として候補バッファ10から後側の先頭単語を取り
出し、この後側単語でインデックス検索手段12によっ
て共起辞書インデックス13を検索する。これで、共起
辞書本体の検索範囲が限定される。そこで、前側単語先
頭取出し手段14によって代表単語として前側の先頭単
語を取り出し、この前側単語で辞書本体検索手段15に
よって共起辞書本体16を検索する。検索はこれだけで
終わり、優先すべき単語の組み合わせがあるかどうか判
る。優先すべき組み合わせがあれば、それが格納されて
いるアドレスを候補バッファ10に書き込んでおけば、
必要な際にいつでも単語ペアデータ17を参照すること
ができることになる。
【0013】本発明によれば、同音語を持つ候補同士の
組み合わせでも、共起辞書の検索は1回で済ますことが
できる。また、優先する単語の組み合わせが複数ある場
合でも、それらの集められたアドレスを候補バッファに
格納することで、候補バッファの容量を増大することな
く対応できる。さらに、単語の組み合わせを優先順に配
列しておけば、点数づけをしなくても先頭のものが最優
先であることがわかるようになる。
【0014】図2は、本発明における共起辞書の構造の
概念を示す説明図で、図中の参照番号は図1と同じであ
る。インデックス13の「線」と辞書本体16の「市
街」は、候補バッファ10のそれぞれの同音語を代表し
ている。優先する単語の組み合わせは、単語ペアデータ
17に格納されている。インデックス13と辞書本体1
6に格納された同音語グループ間の組み合わせと、単語
ペアデータ17の単語の組み合わせデータは、図中の☆
☆で示されるような単語ペアデータ17へのアドレスデ
ータによって対応が取れるようになっている。
【0015】図3は、本発明によるかな漢字変換装置の
一実施例を説明するためのブロック図で、図中、21は
制御部、22は表示部、23は入力部、24は接尾語辞
書、25は自立語辞書、26は候補バッファ、27は共
起辞書インデックス、28は共起辞書本体、29は単語
ペアデータである。
【0016】制御部21は、かな漢字変換用の文法テー
ブル・プログラムなど図に明示していないものを含んで
いる。表示部22はCRT(Cathode Ray Tube:陰極線
管)またはLCD(Liquid Crystal Display:液晶ディ
スプレイ)からなり、変換候補の確認などに使用する。
入力部23はキーボード等からなり、かな文字の入力・
かな漢字変換の指示などを行う。接尾語辞書24と自立
語辞書25は、読み仮名から検索できるようになってい
て、表記や品詞情報などが参照できるようになってい
る。候補バッファ26は、接尾語辞書24及び自立語辞
書25を検索して生成した候補を蓄える。
【0017】図4は自立語辞書、図5は接尾語辞書の内
容を示している図である。変換処理中は、辞書の格納順
(接尾語は+300000)を単語番号として、個々の単語を
識別している。図6は、「しがいせん」が「しがい」と
「せん」の単語の組み合わせとして解析された候補が蓄
えられている候補バッファの部分を示している図であ
る。候補単語は、同音語のうち先頭の単語番号(最も若
い単語番号)と同音語の数で示されている。統語的にも
同等で一つにまとめる同音語は、8個までに制限してお
り、同音語が9個以上になった場合は、別候補として候
補バッファ26の中で別々に蓄えられることになる。図
7は、「きんかい」が「きんか」と「い」の単語の組み
合わせとして解析された候補が蓄えられている候補バッ
ファの部分を示している。
【0018】図8は、接尾語と自立語の関連の共起辞書
の内容を示している図である。共起辞書インデックス2
7側に接尾語,共起辞書本体28側に自立語の同音語グ
ループが格納されている。候補バッファ26に合わせ
て、同音語は先頭の単語番号で表現している。単語ペア
データ29は、単語の組み合わせを同音語中の順序(単
語番号−先頭の単語番号)で表現している。1つにまと
めて扱う同音語を8個までに限定しているため、一つの
単語は0〜7の3ビットで、一つの組み合わせは6ビッ
トで表現できることになる。普通に単語番号同士の組み
合わせで表現すると、この語数では一つの単語番号だけ
で16ビット以上必要なので、このように単語を同音語
中の順序で表現することで、辞書容量が節約できる。
【0019】ここでは、[ ]でくくられた数字のう
ち、前が接尾語、後が自立語の順番を示している。ま
た、各数字を4ビット、つまり組み合わせを8ビット
(=1バイト)に拡張すれば、単語の順番以外にマーカ
ーなどとして利用することができる。この例で、[8,
8]は優先すべき組み合わせと有効な組み合わせのセパ
レータで、これより後の組み合わせは、第1候補として
は抑制するなど、組み合わせの中の優先度合いを分ける
働きをしている。
【0020】この場合に、優先と有効以外の組み合わせ
は、無効ということで候補にはならなくなる。セパレー
タ無しの場合は、全部の組み合わせを有効として扱う。
一方、[9,9]は、その同音語の組み合わせが全て無
効であることを示すマーカーである。このように、検索
の手間がかからず、単語の組み合わせを小容量で表現で
きるので、単語の組み合わせの優先だけでなく、有効無
効の切り分けにも共起辞書を利用することが容易にな
る。
【0021】図9は、候補バッファの単語番号からの共
起辞書の検索を行うためのフローチャートである。以
下、各ステップ(S)に従って順に説明する。ステップS1 :候補バッファ26から後単語(この場
合、接尾語)の単語番号を取り出す。ステップS2へ進
む。ステップS2 :後単語番号で共起辞書インデックス27
を検索する。ステップS3へ進む。ステップS3 :後単語番号が共起辞書インデックス27
にあれば、それに対応するデータで共起辞書本体28の
検索範囲を限定する。ステップS4へ進む。後単語番号
が共起辞書インデックス27になければ、共起辞書で優
先または無効にする組み合わせはないということで検索
処理を終える。ステップS4 :候補バッファ26から前単語(この場
合、自立語)の単語番号を取り出す。ステップS5へ進
む。
【0022】ステップS5:前単語番号で共起辞書本体
28を検索する。ステップS6へ進む。ステップS6 :前単語番号が共起辞書本体28にあれ
ば、それに対応するアドレスデータを持ってステップS
7へ進む。前単語番号が共起辞書本体28になければ、
共起辞書で優先または無効にする組み合わせはないとい
うことで検索処理を終える。ステップS7 :単語ペアデータ29へのアドレスデータ
を候補バッファ26へ格納する。図7のように、アドレ
スの指す先のデータが[9,9]なら、この組み合わせ
全部が無効ということで候補バッファから候補を削除し
てもよい。検索処理を終わる。
【0023】ここでは、自立語・接尾語の組み合わせを
例にして説明したが、自立語・自立語や接頭語・自立語
の組み合わせでも本質的な違いはない。また、後単語側
をインデックスにしたが、接頭語・自立語では、前の接
頭語をインデックスに格納してもよい。[8,8]とは
別に、[8,9]というセパレータを用意して、優先と
無効を示して他は有効な組み合わせということにしてお
いて、単語の組み合わせが少なくなるように[8,8]
と使い分けるようにしてもよい。つまり、有効な組み合
わせが少ない場合は[8,8]を使用し、無効な組み合
わせが少ない場合は[8,9]を利用すれば、単語ペア
データの容量が節約できることになる。セパレータの後
の有効無効の切り分けには、図10に示すように、同音
語中の順序に対応したビットマップ30を用いてもよ
い。
【0024】
【発明の効果】以上の説明から明らかなように、本発明
によると、同音語を持つ候補同士の組み合わせでも共起
辞書の検索は1回で済ますことができる。また、優先す
る単語の組み合わせが複数ある場合でも、それらの集め
られたアドレスを候補バッファに格納することで、候補
バッファの容量を増大することなく対応できる。さら
に、単語の組み合わせを優先順に配列しておけば、点数
づけをしなくても先頭のものが最優先であることがわか
るようになる。
【図面の簡単な説明】
【図1】本発明における共起辞書検索の概念を示すブロ
ック図である。
【図2】本発明における共起辞書の構造の概念を示す説
明図である。
【図3】本発明におけるかな漢字変換装置の一実施例を
説明するためのブロック図である。
【図4】本発明における自立語辞書の内容を示す説明図
である。
【図5】本発明における接尾語辞書の内容を示す説明図
である。
【図6】本発明における候補バッファの内容を示す説明
図(その1)である。
【図7】本発明における候補バッファの内容を示す説明
図(その2)である。
【図8】本発明における共起辞書の構造と内容を示す説
明図である。
【図9】本発明における共起辞書の検索手順を示すフロ
ーチャートである。
【図10】本発明における単語ペアデータの格納の別方
法を示す説明図である。
【図11】従来の共起辞書検索の概念を示すブロック図
である。
【図12】従来の共起辞書の構造の概念を示す説明図で
ある。
【符号の説明】
10…候補バッファ、11…後側単語先頭取出し手段、
12…インデックス検索手段、13…共起辞書インデッ
クス、14…前側単語先頭取出し手段、15…辞書本体
検索手段、16…共起辞書本体、17…単語ペアデー
タ、21…制御部、22…表示部、23…入力部、24
…接尾語辞書、25…自立語辞書、26…候補バッフ
ァ、27…共起辞書インデックス、28…共起辞書本
体、29…単語ペアデータ、30…ビットマップ。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/26

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 単語の表記をその品詞とともに読み仮名
    順に記憶した単語辞書と、同じ読みで同じ品詞の同音語
    グループを当該グループに含まれ前記単語辞書上で先頭
    に格納された代表単語アドレスで識別し、各同音語グル
    ープ間の共起関係を当該代表単語アドレスの組み合わせ
    で記憶するとともに、共起関係にある同音語グループに
    含まれる単語間の共起関係を代表単語アドレスからの格
    納順を示す順序情報の組み合わせで記憶する共起辞書
    と、入力手段から入力される仮名文字列と前記単語辞書
    の読み仮名とのマッチング結果である候補単語を格納す
    る候補バッファと、前記候補バッファに先頭単語候補と
    それに続く後側単語候補とが記憶されている場合に、先
    頭単語候補が含まれる同音語グループと、後側単語候補
    が含まれる同音語グループ間の共起関係の有無を前記共
    起辞書から検索し、共起関係にあるとき、前記候補バッ
    ファに格納された先頭単語候補と後側単語候補から有効
    な組み合わせ候補を、各同音語グループに含まれる単語
    間の共起関係を、前記順序情報を参照して決定する検索
    手段とを有することを特徴とするかな漢字変換装置。
JP25038494A 1994-10-17 1994-10-17 かな漢字変換装置 Expired - Lifetime JP3537888B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25038494A JP3537888B2 (ja) 1994-10-17 1994-10-17 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25038494A JP3537888B2 (ja) 1994-10-17 1994-10-17 かな漢字変換装置

Publications (2)

Publication Number Publication Date
JPH08115318A JPH08115318A (ja) 1996-05-07
JP3537888B2 true JP3537888B2 (ja) 2004-06-14

Family

ID=17207123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25038494A Expired - Lifetime JP3537888B2 (ja) 1994-10-17 1994-10-17 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JP3537888B2 (ja)

Also Published As

Publication number Publication date
JPH08115318A (ja) 1996-05-07

Similar Documents

Publication Publication Date Title
EP0378848A2 (en) Method for use of morphological information to cross reference keywords used for information retrieval
JPS619753A (ja) 文書処理装置における頻発熟語の自動登録方法
JP3537888B2 (ja) かな漢字変換装置
JP2621999B2 (ja) 文書処理装置
JP3187671B2 (ja) 電子辞書表示装置
JPH08185396A (ja) 中国語漢字検索方式
JPH0140372B2 (ja)
JP3329476B2 (ja) かな漢字変換装置
JPS61184676A (ja) 仮名漢字変換方式
JPH1097538A (ja) 機械翻訳装置
JPH0260022B2 (ja)
JPS6389976A (ja) 言語解析装置
JP3281214B2 (ja) 辞書検索装置
JP3847869B2 (ja) 文字列変換装置及び方法
JPH0721212A (ja) 文書処理装置
JPH0336660A (ja) 文書作成装置
JPH0816569A (ja) 文書処理装置
JPS62202259A (ja) 文書作成装置
JPS5920077A (ja) 電子式翻訳機の変化語形翻訳方式
JPS60251461A (ja) 仮名漢字変換装置
JPS6024502B2 (ja) 電子式翻訳機
JPS6116117B2 (ja)
JPH0368071A (ja) 英単語検索装置
JPH086951A (ja) 電子辞書引き装置
JPH10154141A (ja) かな漢字変換装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040316

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040318

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080326

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090326

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100326

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100326

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110326

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120326

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120326

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 9