JPH03252758A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH03252758A
JPH03252758A JP2051009A JP5100990A JPH03252758A JP H03252758 A JPH03252758 A JP H03252758A JP 2051009 A JP2051009 A JP 2051009A JP 5100990 A JP5100990 A JP 5100990A JP H03252758 A JPH03252758 A JP H03252758A
Authority
JP
Japan
Prior art keywords
kana
word
priority
kanji
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2051009A
Other languages
English (en)
Inventor
Yutaka Oyama
裕 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2051009A priority Critical patent/JPH03252758A/ja
Publication of JPH03252758A publication Critical patent/JPH03252758A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、かな漢字変換装置に関するものであり、特に
、かな漢字変換の際に検索または表示する単語数を制限
するかな漢字変換装置に関する。
(従来の技術) 計算機による文書処理技術の向上に伴い、日本語ワード
プロセッサをはじめとした文書処理装置が一般的に使用
されるようになってきた。文書処理装置の利用者は、各
種機能を使用することにより、効率よく文書を作成する
ことができる。この種の日本語処理装置の入力機能とし
て、かな漢字変換は、所望の漢字かな混じり文字列をそ
の読み情報によって人力した後に、単語辞書検索や文法
検定処理によって漢字かな混じり文字列に変換するもの
である。字種の多い漢字かな混じり文字列を、仮名やロ
ーマ字の形態でキーボードなどの標準高速文字人力手段
から入力できるため、広く普及している。
ところで、このような従来の例では、実際にかな漢字変
換を行った際に、変換結果が一意に決定されないことが
ある(同音語の発生)。例えば、「きしゃがはしる]と
入力した場合に、「きしゃ」を読みとする単語として「
記者J 「汽車」 [貴社][帰社1 [喜捨1が辞書
に収められていると、[記者が走るJ [汽車が走るJ
 「貴社が走る」[帰社が走るJ 「喜捨が走る」が出
力候補として得られ、最終的には利用者が所望のものを
選択することになる。なお、かな漢字変換の詳細につい
ては、電子情報通信学会誌87年8月号F仮名漢字変換
アルゴリズム」等で紹介されている。
(発明が解決しようとする課題) このように、かな漢字変換は日本語の文章を入力する上
で有効な手段である。しかしながら、辞書に単語が登録
されていないと変換ができないため、変換時の正解率を
上げるためには、より多くの単語を辞書に収めておく必
要がある。そして、単語数を増加させると、辞書検索時
間も増加するため、かな漢字変換に要する時間が増加す
るという欠点がある。また、変換処理に使用するバッフ
ァ等の作業メモリ領域も増大する。さらに、単語数が増
加するにつれ、同音語の発生する可能性や同音語数が多
くなり、利用者に表示される候補数が増大するため、結
果的に利用者の負担を大きくしてしまう。
本発明の目的は、前述の従来の技術にみられた課題を克
服し、かな漢字変換字に変換に使用する単語の範囲を限
定することのできるかな漢字変換装置を提供することに
ある。
(課題を解決するための手段) 本発明は、かな漢字変換を行う対象であるかな文字列を
人力する入力手段と、単語の読み、表記および文法情報
を収めた単語辞書と、前記入力手段から人力されたかな
文字列に対応する単語を前記単語辞書から検索する辞書
検索手段と、該辞書検索手段で検索された前記単語をも
とじ漢字かな混じり文字列を生成するかな漢字変換手段
と、該漢字かな混じり文字列を表示する表示手段を備え
たかな漢字変換装置において、前記単語辞書に収めた単
語に対して予め優先度を付与しておくとともに、かな漢
字変換対象とする単語の優先度を指定するための優先度
指定手段を備え、前記辞書検索手段は、前記優先度指定
手段で指定された優先度が付与された単語のみを前記単
語辞書から検索することを特徴とするかな漢字変換装置
である。
また、かな漢字変換を行う対象であるかな文字列を入力
する人力手段と、単語の読み、表記および文法情報を収
めた単語辞書と、前記人力手段から人力されたかな文字
列に対応する単語を前記単語辞書から検索する辞書検索
手段と、該辞書検索手段で検索された前記単語をもとに
漢字かな混じり文字列を生成するかな漢字変換手段と、
該漢字かな混じり文字列を表示する表示手段を備えたか
な漢字変換装置において、前記単語辞書に収めた単語に
対して予め優先度を付与しておくとともに、前記かな漢
字変換装置で生成された前記漢字かな混じり文字列数が
予め定めたしきい値を越える場合に前記優先度の高い単
語を含む前記漢字かな混じり文字列を優先して前記表示
手段に表示する候補限定手段を有することを特徴とする
かな漢字変換装置である。
さらに、このかな漢字変換において、候補限定手段にか
えて前記優先度の高い単語を含む前記漢字かな混じり文
字列を前記表示手段に送るための候補形成手段を有する
ことを特徴とするかな漢字変換装置である。
(作用) 本発明では、単語辞書内の各単語に予め優先度を付与し
ておく。さらに、辞書内のどの優先度の単語までを変換
処理対象にするかの指定に応じて、実際の変換時には、
指定された優先度の単語のみを用いてかな漢字変換処理
を行う。また、かな漢字変換の結果同音語が多く生じた
場合に、優先度の高い単語を含む漢字かな混じり文字列
候補を優先して、利用者に表示する。また、単語の優先
度毎に、その単語を含む候補を表示する。
(実施例) 以下、本発明について図面を参照して説明する。
第1図は本発明の第1の実施例を示すブロック図である
。図において、1はかな漢字変換に使用するかな文字列
の入力および変換開始指示や同音語選択指示などを行う
入力手段、2は少なくとも単語の読み、表記、文法情報
および単語の優先度を収めた単語辞書、3は単語辞書2
から単語を検索する辞書検索手段、4は入力手段1から
渡されるかな文字列をもとに辞書検索手段3に単語検索
指示を出し、得られた単語の文法情報などをもとに漢字
かな混じり文字列(候補)を生成するかな漢字変換手段
、5は生成された漢字かな混じり文字列(候補)を書き
込むための候補バッファ、6はかな漢字変換結果などを
表示する表示手段、7は辞書検索手段3に検索対象単語
の優先度を指示するだめの優先度指定手段である。第1
図において、入力手段1および優先度指定手段7はキー
ボードで、単語辞書2はROMや磁気ディスクで、辞書
検索手段3およびかな漢字変換手段4はマイクロプロセ
ッサで、候補バッファ5はRAMなどで、表示手段6は
CRTデイスプレィなどで実現することができるため、
詳細な説明は省略する。また、第2図は単語辞書2にお
いて「きしゃ」に対応する部分を表した概念図である。
第2図では、単語の読み、表記、文法情報、優先度が収
められている。各単語の優先度は、適用分野や丁寧度、
使用頻度等に応じて設定したり、[○万語辞書1のよう
に単語数の制約などに応じて設定することができる。
また、第7図は辞書検索手段3の実施例を表すブロック
図である。701はかな漢字変換手段4から渡される検
索用文字列を一時確保するための検索文字列バッファ、
702は検索文字列をもとに、その部分文字列を生成す
る部分文字列生成手段、703は生成された部分文字列
を一時確保するための部分文字列バッファ、704は部
分文字列をもとに単語辞書2内の単語を抽出する辞書情
報照合手段、705は、抽出した単語を一時確保するた
めの抽出単語バッファ、706は優先度指定手段7より
与えられる優先度をもとに、出力すべき単語を選定する
優先度照合手段、707はかな漢字変換手段4に出力す
る単語を確保するための出力単語バッファである。
以下、[きしゃが]をかな漢字変換する場合を想定して
説明する。
ここでは利用者が、優先度が3よりも高いものすべてを
表示させたい場合を想定する。利用者は、優先度指定手
段7で[優先度=3Jを指定する。ここで利用者が、人
力手段1より[きしゃがJを入力してかな漢字変換指示
を出したものとする。かな漢字変換手段4は「きしやが
Jを受け、かな漢字変換するべく、辞書検索手段3に検
索要求を出す。
[きしゃがJが検索文字列バッファ701に収められる
と、部分文字列生成手段702は、[きしゃがJの部分
文字列である[きしゃJ [がJなどを生成して部分文
字列バッファ703に収める。辞書情報照合手段704
は、部分文字列バッファ703の内容に一致する読みを
有する単語を単語辞書2より抽出し、抽出単語バッファ
705に収める。この結果、抽出単語バッファ705に
は、「記者J 「汽車」 「貴社」 [帰社J [喜捨
J [がJが収められたものとする。優先度照合手段7
06は、優先度指定手段7がら優先度=3が与えられて
いるので、抽出単語バッファ705内の単語のうちで優
先度が3より高いもの(この場合前記のすべての単語)
を出力単語バッファ707に収める。これらの一連の手
順で、[記者J 「汽車J 「貴社」 「帰社J 「喜
捨」 [がJががな漢字変換手段4に渡される。その結
果、「記者が」 [汽車がJ [貴社が」 [帰社がJ
 [喜捨がJが、かな漢字変換手段4によって生成され
、候補バッファ5に格納され、表示手段6に表示される
次に、[優先度=IJを指定した場合を例にとる。上記
の説明のうち、抽出単語バッファ705に単語が収めら
れるまでの手順は同一である。優先度照合手段706は
、優先度指定=1であるため、抽出単語バッファ705
の中で優先度が1の単語「記者」「貴社」 「帰社J 
「が」のみを出力単語バッファ707に送る。その結果
、[記者が」 [貴社がJ [帰社がJが生成され、表
示手段6に表示される。これら一連の手順により、優先
度に応じて生成される候補を限定することができる。
なお、上記第1の実施例の説明では、優先度指定を優先
度指定手段7を用いて利用者自身が行っているが、RO
Mなどの記憶手段によって、予め与えておくことも可能
である。
第3図は、本発明の第2の実施例を示すブロック図であ
る。図において、人力手段1から表示手段6までは、第
1図と同一のものである。8はかな漢字変換手段4で生
成された漢字かな混じり文字列の数が予め定めたしきい
値を越える場合に、前記優先度に応じて漢字かな混じり
文字列を限定する候補限定手段である。また、第4図は
候補限定手段8の実施例を示すブロック図である。図に
おいて、401は候補限定手段8の動作を制御する候補
限定制御部、402はかな漢字変換手段4がら変換結果
候補とそれを構成する単語の優先度を受は取るための変
換結果バッファ、403は変換結果バッファ402の変
換結果候補の中から、出力する条件を満たすものを抽出
する候補抽出手段、404は候補抽出手段403によっ
て抽出された結果を格納する抽出候補バッファ、405
は優先度の値を収める優先度カウンタ、406は候補抽
出手段403によって抽出された候補の累積数を計数す
る候補計数手段、407は、所定数の候補が抽出された
が否かを検定する候補数検定手段である。以下、出力対
象とする候補数(しきい値)=4が予め設定され候補数
検定手段407に収められているものとし、「きしゃが
」をがな漢字変換する場合を想定して第2の実施例を説
明する。なお、単語辞書2の中には、第2図の単語が収
められているものとする。また、優先度カウンタ405
内の優先度は1、候補計数手段406内の抽出候補数は
0に、予め設定されているものとする。
利用者が、入力手段1より[きしゃが1を入力してかな
漢字変換指示を出し、かな漢字変換手段4が、[記者が
] 「汽車がJ 「貴社が」 「帰社が」[喜捨が1を
生成するところまでは、第1の実施例における説明と同
様である。作成された候補は、候補内で使用された単語
の優先度とともに候補限定手段8に渡され、候補限定制
御部401の制御のもとて変換結果バッファ402に収
められる。変換結果バッファ402の実施例を第8図に
示す。なお、第8図において、変換結果候補の優先度と
して自立語部分(名詞・す変名側)の優先度を使用して
いるが、これに限定されるものではない。
変換結果バッファ402に変換結果が収められると、候
補抽出手段403は、候補限定制御部401の制御のも
と、優先度カウンタ405の示す優先度の候補を抽出候
補バッファ404に渡す。この時点で優先度=1である
ので、優先度が1である[記者が」「貴社力月 「帰社
が」が抽出候補バッファ404に渡される。さらに、候
補計数手段406は候補限定制御部401の制御のもと
、抽出候補バッファ404に送られた候補の数(=3)
を記憶する。ここで候補数検定手段407は候補限定制
御部401の制御のもと、候補係数手段406が保有す
る累積候補数がしきい値に到達したか否かを調べる。こ
の時点ではまだ到達していないので、その旨を受けた候
補限定制御部401は、優先度カウンタ405を1つ進
める(=2になる)とともに、候補抽出手段403に対
して再び抽出要求を出す。候補抽出手段403は、上記
と同様の手順で変換結果バッファ402内の候補の中か
ら優先度=2のもの[汽車力月を抽出して、抽出候補バ
ッファ404に収める。この時点で、候補計数手段40
6も新たに抽出された候補数(=1)を加え、累積数=
4になる。
候補数検定手段407は、累積数がしきい値に到達した
ため、その旨を候補限定制御部401に伝える。ここで
候補限定制御部401は、候補の抽出を終了し、抽出候
補バッファ404に収められた[記者力月 [貴社が]
 「帰社が」 「汽車が」を出力して、処理を終了する
。これらの一連の手順により、[きしゃが]のかな漢字
変換結果として、優先度の高い上位4つだけを、表示手
段6に表示することができる。
なお、本実施例では、同一優先度を有する候補が複数個
ある場合に、これらすべてが表示対象となる(表示候補
数がしきい値を越える)が、表示候補をしきい値以内に
抑える方式も容易に実現することができる。
第5図は、本発明の第3の実施例を示すブロック図であ
る。図において、入力手段1がら表示手段6までは、第
1図と同一のものである。9は、候補バッファ5に収め
られた漢字がな混じり文字列候補の中から、表示手段6
に表示する候補を形成する候補形成手段である。また、
第6図は候補形成手段9の実施例を示すブロック図であ
る。601は、候補形成手段9の制御を行う候補形成制
御部、602は候補バッファ5から所定の優先度の候補
を抽出する候補抽出手段、603は優先度の値を収める
優先度カウンタ、604は候補抽出手段602によって
抽出された結果を格納する抽出候補バッファ、605は
、抽出候補バッファ604の中から表示する候補を取り
出して表示フォーマットを形成し、表示手段6に出力す
る表示候補形成手段である。以下、[きしゃが]をがな
漢字変換して「汽車が」を得る場合を想定して第3の実
施例を説明する。なお、単語辞書2の中には、第2図の
単語が収められているものとする。また、優先度カウン
タ603の内の優先度は1に予め設定されており、抽出
候補バッファ604は空であるものとする。
利用者が、入力手段1より「きしやが」を入力してかな
漢字変換指示を出し、かな漢字変換手段4が、変換結果
である[記者が] [汽車が] 「貴社が」 「帰社が
」 「喜捨が」およびその優先度を生成するところまで
は、第2の実施例における説明と同様である。変換結果
は候補バッファ5に収められる。候補バッファ5の内容
は、例えば第8図のようになる。ここで候補形成制御部
601は、候補抽出手段602に候補の抽出指示を与え
る。候補抽出手段602は、優先度カウンタ603の示
す優先度(=1)と同じ優先度を持つ候補を抽出候補バ
ッファ604に収める。抽出候補バッファ604には、
優先度が1である「記者が1 「貴社が」 「帰社が」
が収められる。
ここで表示候補形成手段605は、抽出候補バッファ6
04内の候補のうちで一度に表示出来る候補数分を取り
出し、表示手段6に表示する。表示方法は、CRT画面
上での最下行などの所定の位置への表示など、ワードプ
ロセッサ等で通常行われているので、詳細の説明を省略
する。抽出候補バッファ604内の候補のうちで表示候
補形成手段605に取り出されたものは抽出候補バッフ
ァ604から除外される(使用済のタグが与えられる形
式でもよい。)例えば、表示手段6が一度に10個の候
補を表示できる場合には、抽出候補バッファ604に収
められた3つの候補すべてが表示され、抽出候補バッフ
ァ604は空になる。候補形成制御部601は、この時
点で入力手段1からの利用者の指示待ち状態となる。こ
こで、表示された候補の中に「汽車が」が無いので、利
用者が別候補の表示を要求したものとする。別候補表示
の要求は、入力手段1から候補形成制御部601に与え
られる。候補形成制御部601は、要求を受けると、優
先度カウンタ603の優先度を1がら2に変更し、候補
抽出手段602に候補の抽出指示を与える。
候補抽出手段602は、上記の手順で候補バッファ5よ
り[汽車が]を抽出して抽出候補バッファ604に収め
る。表示候補形成手段605は、これを表示手段6に表
示する。この時点で利用者が所望する[汽車が1が表示
されたため、利用者がことを採用する旨の指示を人力手
段1に与えると、候補形成制御部601は候補形成手段
9の処理を終了する。これら−連の手段により、表示手
段6に優先度の高い単語を優先して表示することが可能
となる。
なお、実施例では、優先度の違う候補は表示手段6に同
時に表示されない方式について説明しているが、表示手
段6の表示可能な候補数が抽出された候補数を」二回る
場合に、優先度が低い候補を表示可能な数だけ同時に表
示する方式も容易に実現することが出来る。
(発明の効果) 本発明を用いることにより、かな漢字変換に使用する単
語の範囲を制限したり、表示対象候補の制御を行うこと
ができる。
【図面の簡単な説明】
第1図は本発明の第1の実施例を示すブロック図、第2
図は単語辞書2の一部分を示す概念図、第3図は本発明
の第2の実施例を示すブロック図、第4図は候補限定手
段8の実施例を示すブロック図、第5図は本発明の第3
の実施例を示すブロック図、第6図は、候補形成手段9
の実施例を示すブロック図、第7図は辞書検索手段3の
実施例を示すブロック図、第8図は、かな漢字変換結果
の例を示す概念図である。 1・・・人力手段、2・・・単語辞書、3.・・辞書検
索手段、4、・、かな漢字変換手段、5・・・候補バッ
ファ、6・・・表示手段、7・・・優先度指定手段、8
・、・候補限定手段、9・・・候補形成手段。

Claims (3)

    【特許請求の範囲】
  1. (1)かな漢字変換を行う対象であるかな文字列を入力
    する入力手段と、単語の読み、表記および文法情報を収
    めた単語辞書と、前記入力手段から入力されたかな文字
    列に対応する単語を前記単語辞書から検索する辞書検索
    手段と、該辞書検索手段で検索された前記単語をもとに
    漢字かな混じり文字列を生成するかな漢字変換手段と、
    該漢字かな混じり文字列を表示する表示手段を備えたか
    な漢字変換装置において、前記単語辞書に収めた単語に
    対して予め優先度を付与しておくとともに、かな漢字変
    換対象とする単語の優先度を指定するための優先度指定
    手段を備え、前記辞書検索手段は、前記優先度指定手段
    で指定された優先度が付与された単語のみを前記単語辞
    書から検索することを特徴とするかな漢字変換装置。
  2. (2)かな漢字変換を行う対象であるかな文字列を入力
    する入力手段と、単語の読み、表記および文法情報を収
    めた単語辞書と、前記入力手段から入力されたかな文字
    列に対応する単語を前記単語辞書から検索する辞書検索
    手段と、該辞書検索手段で検索された前記単語をもとに
    漢字かな混じり文字列を生成するかな漢字変換手段と、
    該漢字かな混じり文字列を表示する表示手段を備えたか
    な漢字変換装置において、前記単語辞書に収めた単語に
    対して予め優先度を付与しておくとともに、前記かな漢
    字変換装置で生成された前記漢字かな混じり文字列数が
    予め定めたしきい値を越える場合に前記優先度の高い単
    語を含む前記漢字かな混じり文字列を優先して前記表示
    手段に表示する候補限定手段を有することを特徴とする
    かな漢字変換装置。
  3. (3)かな漢字変換を行う対象であるかな文字列を入力
    する入力手段と、単語の読み、表記および文法情報を収
    めた単語辞書と、前記入力手段から入力されたかな文字
    列に対応する単語を前記単語辞書から検索する辞書検索
    手段と、該辞書検索手段で検索された前記単語をもとに
    漢字かな混じり文字列を生成するかな漢字変換手段と、
    該漢字かな混じり文字列を表示する表示手段を備えたか
    な漢字変換装置において、前記単語辞書に収めた単語に
    対して予め優先度を付与しておくとともに、前記優先度
    の高い単語を含む前記漢字かな混じり文字列を前記表示
    手段に送るための候補形成手段を有することを特徴とす
    るかな漢字変換装置。
JP2051009A 1990-03-01 1990-03-01 かな漢字変換装置 Pending JPH03252758A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2051009A JPH03252758A (ja) 1990-03-01 1990-03-01 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2051009A JPH03252758A (ja) 1990-03-01 1990-03-01 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH03252758A true JPH03252758A (ja) 1991-11-12

Family

ID=12874778

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2051009A Pending JPH03252758A (ja) 1990-03-01 1990-03-01 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH03252758A (ja)

Similar Documents

Publication Publication Date Title
WO2005089215B1 (en) Phonetic and stroke input methods of chinese characters and phrases
JP2633824B2 (ja) 仮名漢字変換装置
JPH0778183A (ja) デ−タベ−ス検索システム
JPH03252758A (ja) かな漢字変換装置
JPS60129874A (ja) 日本語文字入力装置
JP2766084B2 (ja) 仮名漢字変換方法
JPS59140546A (ja) 予測変換方法
JPH04290158A (ja) 文書作成装置
JPH1011433A (ja) 仮名漢字変換方式における同音異義語選択方法及びその装置
JPH0954781A (ja) 文書検索システム
JPH01185766A (ja) かな漢字変換装置
JPH05120331A (ja) 同音異義語認識装置
JPH01237877A (ja) 漢字変換方式
JPH0668160A (ja) 情報検索方式
JP2002099558A (ja) 情報検索システム、情報検索方法、及び、記録媒体
JPS62287338A (ja) 検索装置
JPS6175467A (ja) 仮名漢字変換方式
JPH09282316A (ja) 漢字仮名変換装置
JPS62287337A (ja) 検索装置
JPH05151199A (ja) 文書作成装置
JPH08147282A (ja) 仮名漢字変換装置および仮名漢字変換方法
JPS60140460A (ja) カナ漢字変換装置における短縮変換方式
JPH02115974A (ja) 言語検索装置
JPS63116269A (ja) 日本語処理の仮名漢字変換装置
JPH06309302A (ja) 漢字変換装置