JPH0773175A - データ処理方法及び装置 - Google Patents

データ処理方法及び装置

Info

Publication number
JPH0773175A
JPH0773175A JP5159541A JP15954193A JPH0773175A JP H0773175 A JPH0773175 A JP H0773175A JP 5159541 A JP5159541 A JP 5159541A JP 15954193 A JP15954193 A JP 15954193A JP H0773175 A JPH0773175 A JP H0773175A
Authority
JP
Japan
Prior art keywords
notation
reading
identification information
kana
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5159541A
Other languages
English (en)
Inventor
Tomonori Kudou
朋紀 工藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5159541A priority Critical patent/JPH0773175A/ja
Publication of JPH0773175A publication Critical patent/JPH0773175A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】同義の単語については読みが異なっても同一の
単語であると認識することを可能とし、仮名漢字変換処
理における変換効率及び操作性を向上する。 【構成】変換辞書4のデータ構成では、「読み」と「表
記」が別々の領域に格納されており、各読みに対しては
表記の格納されている位置を示す「表記識別値」が格納
されている。「読み」と「表記」は1対1には応してお
らず、複数の読みに対して1つの表記を指し示す同一の
表記識別値が格納されている場合がある。仮名漢字変換
処理を実行し表記を選択すると、学習情報として「表記
識別値」が記憶される。従って、仮名漢字変換における
第一候補の決定に際してはこの表記識別値が参照され
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデータ処理方法及び装置
に関し、特に仮名漢字変換処理を行うためのデータ処理
方法及び装置に関する。
【0002】
【従来の技術】従来の仮名漢字変換処理について説明す
る。
【0003】図12は従来の仮名漢字変換辞書のデータ
構成を説明する図である。従来の仮名漢字変換辞書は
「読み」に対応して「表記」が格納されている。
【0004】読みを入力すると、入力された読み文字列
により仮名漢字変換辞書を検索して変換候補を抽出す
る。そして、変換候補の中より、使用単語記憶領域の記
憶状況や、自立語のもつ使用頻度などを参照して、第一
候補となる変換候補を自動的に決定していく。この処理
を同音語選択処理と称する。ここで、使用単語記憶領域
とはオペレータにより第一候補として指定された変換候
補を記憶する領域である。
【0005】例えば、「いっぽん」という読みを入力し
た場合、変換候補として「一ぽん」、「一本」、「壱ぽ
ん」、「壱本」を作成し、更に同音語選択処理により、
変換候補の中から「一ぽん」が第一候補として自動的に
決定される。装置により決定された同音語が希望する同
音語ではなかった場合、図13に示すような同音語候補
の一覧を画面に出力し、オペレータにより同音語候補の
中より希望する同音語候補を選択し、決定する。この処
理を第一候補決定処理と称する。本例では、第一候補と
して「一本」を選択している。このようにして変換結果
として「一本」を確定出力するとともに、使用単語記憶
領域に読み「ぽん」に対応させて表記「本」を記憶す
る。即ち、選択された同音語は、読みと表記の組み合わ
せ(読みと表記は1対1に対応する)から一意に決まる
値を使用単語記憶領域に格納し、次の変換では使用単語
記憶領域に格納された表記を第一候補として出力するよ
うにしていた。
【0006】
【発明が解決しようとする課題】前述した従来の仮名漢
字変換処理方法では、本来単語としては同一の意味を有
する単語(同義の単語)であり、かつ表記も同じ単語
(同表記の単語)であっても、入力される読みが異なれ
ば辞書の単語としては異なった単語として認識される。
このため、第一候補決定処理においては、同義かつ同表
記の単語であっても、使用単語記憶領域にはそれぞれ別
の単語として読みと表記のペアで単語を記憶しなければ
ならない。従って、同音語選択処理で使用単語記憶領域
に記憶した単語と異なった読みが入力された場合、同義
かつ同表記の単語が使用単語記憶領域に記憶されていて
も、第一候補決定処理においては使用単語記憶領域に格
納された単語が存在しないと判断される。
【0007】例えば、図14に示すように、読み「にほ
ん」が入力された場合、「ほん」という読みとこれに対
応する表記は使用単語記憶領域に記憶されておらず、前
述の第一候補決定処理と同様に「二ほん」が第一候補に
なる。即ち、使用単語記憶領域には、読み「ぽん」とそ
の表記「本」が記憶されているのみで、読み「ほん」及
びこれに対する表記は記憶されていない。そして、図1
5に示す如く「二ほん」を第一候補として出力する。こ
のように、変換候補中に使用単語記憶領域に記憶した単
語が存在しないことになり、選択した同音語「本」を記
憶することによる変換率向上の学習効果はなく、仮名漢
字変換における操作性の低下の原因となっている。
【0008】本発明は上記の問題点に鑑みてなされたも
のであり、同表記かつ同義の単語については読みが異な
っても同一の単語であると認識することを可能とし、仮
名漢字変換処理における変換効率及び操作性を向上する
データ処理方法及び装置を提供することを目的とする。
【0009】
【問題を解決するための手段】上記の目的を達成するた
めの本発明によるデータ処理装置は以下の構成を備えて
いる。即ち、入力された読みについて仮名漢字変換を実
行するデータ処理装置であって、読みと対応して表記を
記憶するとともに、少なくとも同じ意味を有する表記に
ついては共通の識別情報を対応づけて記憶する辞書と、
仮名漢字変換処理の実行において選択された表記を前記
識別情報にて記憶する記憶手段と、仮名漢字変換処理に
おいて入力された読みに対する表記が複数存在する場
合、前記記憶手段により記憶された識別情報を参照して
前記辞書より表記の第一候補を決定する決定手段と、を
備える。
【0010】又、上記の目的を達成する本発明のデータ
処理方法は以下の工程を備えている。即ち、読みと対応
して表記を記憶するとともに、少なくとも同じ意味を有
する表記については共通の識別情報を対応づけて記憶す
る辞書を備え、入力された読みについて仮名漢字変換を
実行するデータ処理方法であって、仮名漢字変換処理の
実行において選択された表記を該表記と対応づけられた
前記識別情報にて記憶する記憶工程と、仮名漢字変換処
理において入力された読みに対する表記が複数存在する
場合、前記記憶手段により記憶された識別情報を参照し
て前記辞書より表記の第一候補を決定する決定工程と、
を備える。
【0011】
【作用】上記の構成により、仮名漢字変換処理の実行に
より選択された表記について、その表記を識別する情
報、即ち識別情報が記憶される。仮名漢字変換用の辞書
には「読み」、「表記」の他に表記を識別するための
「識別情報」が格納されており、仮名漢字変換処理の実
行時に複数の変換候補が存在する場合は、過去の仮名漢
字変換処理において選択され、記憶された表記の識別情
報を参照して第一変換候補が決定される。
【0012】
【実施例】次に添付の図面を参照して本発明の好適な実
施例について説明する。
【0013】<実施例1>図1は、本実施例の情報処理
装置の概略の構成を表わしたブロック図である。同図に
おいて、1はCPUであり、ROM2及びRAM3に格
納された制御プログラムを実行することにより、本情報
処理装置における各種の制御を実行する。2はROMで
あり、CPU1が実行する基本的な制御プログラムや各
種データが格納されている。3はRAMであり、外部記
憶装置7よりロードされた各種の制御プログラムが格納
される。又、CPU1が制御を実行するに際して必要な
データエリア等を提供する。更に、RAM3上には、後
述する使用単語記憶領域3aを有する。4は仮名漢字変
換処理において参照される変換辞書である。
【0014】5はキーボードであり、本情報処理装置へ
の各種データ入力を行う。6はディスプレイであり、各
種の表示を行う。7は外部記憶装置であり、各種制御プ
ログラムや、作成データ等を格納する。8はシステムバ
スであり、上述の各部のを相互に接続する。
【0015】キーボード5から入力された読み文字列は
CPU1によって仮名漢字変換処理され、その処理結果
はRAM3に記憶されると共に、ディスプレイ6によっ
て表示出力される。
【0016】図2は実施例1の変換辞書4のデータ構成
を表す図である。同図に示されるように、読みと表記が
別々の領域に格納されており、各読みに対しては表記の
格納されている位置を示す「表記識別値」が格納されて
いる。表記は読みと一意には応しておらず、複数の読み
に対して同じ表記を指し示す同一の表記識別値が格納さ
れている場合がある。
【0017】以上のような構成を備える本実施例1の情
報処理装置の仮名漢字変換処理の動作手順について説明
する。図3は本実施例1の仮名漢字変換処理を表わすフ
ローチャートである。
【0018】ステップS1においてキーボード5から読
み文字列が入力されるとステップS2へ進み、入力され
た読みに対して変換候補を作成する。ステップS3で
は、ステップS2で作成された変換候補が複数の場合、
変換候補の中から第一候補の決定処理を行なう。ステッ
プS4ではステップS3で第一候補に決定された文節を
ディスプレイ6に対して出力する。ステップS5では、
第一候補となった同音語がオペレータの希望する同音語
かどうかを判断し、希望する同音語であったならばステ
ップS7へ進む。一方、希望する同音語でない場合はス
テップS6へ進む。尚、オペレータが希望する単語か否
かは、オペレータからの入力操作(例えばその第一候補
を採用するか否かの入力)により判断される。
【0019】ステップS6では、ディスプレイ6上に同
音語の一覧表示を行ない、オペレータは表示された同音
語候補の中から希望する同音語の選択を行なう(同音語
選択処理)。ステップS7では、同音語選択処理で選択
された同音語を、次の変換から第一候補として出力する
ため、RAM3上に確保されている使用単語記憶領域3
aに記憶する。尚、ここで使用単語記憶領域3aに記憶
されるデータは表記識別値である。
【0020】以上のような処理手順による本仮名漢字変
換処理の動作を具体例を挙げて説明する。
【0021】次に、図4から図8を参照して、本実施例
1の情報処理装置における仮名漢字変換処理について具
体例を挙げて説明する。
【0022】図4のように、入力文字列「いっぽん」を
読み文字列としてキーボード5より入力する(ステップ
S1)。すると、変換辞書4により変換候補として、
「一ぽん」、「一本」、「壱ぽん」、「壱本」が作成さ
れる(ステップS2)。使用単語記憶領域3aには何も
記憶されていないので、自立語の情報等により第一候補
として「一ぽん」が決定される(ステップS3)。
【0023】次に図5に示す如く第一候補として「一ぽ
ん」をディスプレイ6に出力する(ステップS4)。こ
こで、出力された第一候補が希望する同音語ではなかっ
た場合、図6に示すように、同音語の一覧を行ない希望
する同音語の選択を行なう(ステップS6)。ここで、
希望する同音語を「一本」として選択すると、選択され
た同音語「一本」の表記識別値(7「本」)を使用単語
記憶領域3aに格納する(ステップS7)。
【0024】次に同様な読み「にほん」を入力した(ス
テップS1)場合、図7のように変換辞書3aより変換
候補「二ほん」、「二本」、「弐ほん」、「弐本」を作
成する(ステップS2)。使用単語記憶領域3aには、
表記識別値(7「本」)が格納されているので、「本」
が使用されている候補が優先され、更に自立語の情報等
により「二本」が第一候補に決定される。(ステップS
3)。そして、図8のように第一候補の「二本」が出力
される(ステップS4)。
【0025】更に他の例を挙げると、読み文字列として
「わたくしりつ」と入力して仮名漢字変換処理の実行を
指示すると、図2に示した変換辞書4より「私立」とい
う表記が得られて、第一候補としてディスプレイ6に表
示される。ここで、この「私立」を選択すると、使用単
語記憶領域3aに表記識別値「4」が記憶される。次
に、異なる読み文字列として「しりつ」が入力される
と、変換候補として「私立」及び「市立」が得られる。
ここで使用単語記憶領域3aに記憶されている表記識別
値「4」と一致する表記「私立」が選択され、第一候補
としてディスプレイ6に表示される。
【0026】このように、本実施例1の情報処理装置に
よれば、表記識別値により学習するので、ある読みに対
して仮名漢字変換処理を実行することにより、異なる読
みを有する同義で同表記の単語に対しても学習効果が得
られようになる。
【0027】尚、本実施例1の変換辞書4のデータ構成
では、図2の如く「読み」と「表記識別値」を対応させ
て格納している領域と、「表記識別値」と「表記」を対
応させて格納している領域とが存在するがこれに限られ
ない。例えば、図9の如く、各表記に識別値を付随させ
てもよい。
【0028】又、上記実施例1では各単語に表記識別値
を持たせているが、助数詞(1本,2本の本等)等の特
定単語のみに表記識別値を持たせて、上述の処理を適用
するようにしても良い。この場合、表記識別値を有して
いない単語については、従来通りの方法で学習情報を蓄
積するようにしても良い。
【0029】<実施例2>次に実施例2について説明す
る。実施例2における変換辞書4のデータ構成を図10
に示す。図10に示される変換辞書4のデータ構成で
は、表記が異なっても同じ意味を有する単語に対して同
じ表記識別値を付与した例を表している。例えば、表記
が「一」、「壱」又は「1」であり、読みが「いち」又
は「いっ」の単語は、数値「1」を表す数詞であるとし
て同じ表記識別値「0」を付与する。このようにして表
記を管理することにより、従来4つの単語として識別し
ていた単語を1つの単語として識別できる。更に、漢数
字の大字にはaを、通常の漢数字にはbを、算用数字に
はcを書き分けの識別情報として付属させる。従って、
「壱」に対しては0/aが、「一」に対しては0/b
が、「1」に対しては0/cが表記識別値及び書き分け
の識別情報として記憶される。
【0030】図11は、実施例2における仮名漢字変換
処理を説明するためのフローチャートである。同図は、
前述の図3のステップS3における第一候補決定処理の
部分を表す図である。
【0031】ステップS21において、ステップS2で
作成された変換候補が数詞を含むか否かを判断する。数
詞を含まない場合はステップS23へ進み、数詞を含む
場合はステップS22へ進む。ステップS22では、表
記識別値及び書き分けの識別情報により数詞を表す表記
が選択される。ステップS23では、数詞以外の表記に
ついて、使用単語記憶領域3aに格納された表記識別値
を参照して第一候補を決定していく。
【0032】又、図3のステップS7における単語学習
処理では、数詞に対しては使用単語記憶領域3aに表記
識別値及び書き分けの識別情報を記憶する。
【0033】以上の様な処理を実行する実施例2の仮名
漢字変換処理を用いると、例えば「にほん」という読み
の入力に対して「弐本」という表記を選択すると、使用
単語記憶領域3aには表記識別値「5」と書き分けの識
別情報「a」が記憶される。このため、書き分けの識別
情報「a」により漢数字の大字が選択されるようにな
り、例えば「いっぽん」という読みを入力すると、「壱
本」が第一候補として選択される。
【0034】このように実施例2の仮名漢字変換処理に
おいては、同義で表記の異なる単語についても学習効果
を得ることが可能となり、変換効率及び操作性が向上す
るという効果がある。
【0035】尚、本発明は、複数の機器から構成される
システムに適用しても1つの機器から成る装置に適用し
ても良い。また、本発明は、システム或は装置にプログ
ラムを供給することによって達成される場合にも適用で
きることはいうまでもない。
【0036】
【発明の効果】以上説明したように本発明のデータ処理
方法及び装置によれば、同義の単語については読みが異
なっても同一の単語であると認識することが可能とな
り、仮名漢字変換処理における変換効率及び操作性が向
上する。
【0037】
【図面の簡単な説明】
【図1】本実施例の情報処理装置の概略の構成を表わし
たブロック図である。
【図2】実施例1の変換辞書のデータ構成を表す図であ
る。
【図3】実施例1の仮名漢字変換処理を表わすフローチ
ャートである。
【図4】実施例1の情報処理装置における仮名漢字変換
処理の具体例を表す図である。
【図5】実施例1の情報処理装置における仮名漢字変換
処理の具体例を表す図である。
【図6】実施例1の情報処理装置における仮名漢字変換
処理の具体例を表す図である。
【図7】実施例1の情報処理装置における仮名漢字変換
処理の具体例を表す図である。
【図8】実施例1の情報処理装置における仮名漢字変換
処理の具体例を表す図である。
【図9】変換辞書の他のデータ構成例を表す図である。
【図10】実施例2の変換辞書のデータ構成例を表す図
である。
【図11】実施例2における仮名漢字変換処理を説明す
るためのフローチャートである。
【図12】従来の仮名漢字変換辞書のデータ構成を説明
する図である。
【図13】従来の使用単語記憶領域への格納内容を説明
する図である。
【図14】従来の仮名漢字変換処理における第一候補決
定処理を説明する図である。
【図15】従来の仮名漢字変換処理における第一候補の
出力処理を説明する図である。
【符号の説明】
1 CPU 2 ROM 3 RAM 3a 使用単語記憶領域 4 変換辞書 5 キーボード 6 ディスプレイ 7 外部記憶装置 8 システムバス

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力された読みについて仮名漢字変換を
    実行するデータ処理装置であって、 読みと対応して表記を記憶するとともに、少なくとも同
    じ意味を有する表記については共通の識別情報を対応づ
    けて記憶する辞書と、 仮名漢字変換処理の実行において選択された表記を前記
    識別情報にて記憶する記憶手段と、 仮名漢字変換処理において入力された読みに対する表記
    が複数存在する場合、前記記憶手段により記憶された識
    別情報を参照して前記辞書より表記の第一候補を決定す
    る決定手段と、 を備えることを特徴とするデータ処理装置。
  2. 【請求項2】 前記辞書は、読みと対応して表記を記憶
    するとともに、少なくとも同じ意味及び表記を有する表
    記については共通の識別情報を対応づけて記憶すること
    を特徴とする請求項1に記載のデータ処理装置。
  3. 【請求項3】 前記辞書は、読みと対応して表記を記憶
    するとともに、少なくとも同じ意味を有する表記につい
    ては共通の識別情報を対応づけ、更にその書き分けに対
    応した識別情報を記憶することを特徴とする請求項1に
    記載のデータ処理装置。
  4. 【請求項4】 前記書き分けに対応した識別情報が、数
    詞における漢数字、漢数字の大字、及び算用数字である
    ことを特徴とする請求項3に記載のデータ処理装置。
  5. 【請求項5】 読みと対応して表記を記憶するととも
    に、少なくとも同じ意味を有する表記については共通の
    識別情報を対応づけて記憶する辞書を備え、入力された
    読みについて仮名漢字変換を実行するデータ処理方法で
    あって、 仮名漢字変換処理の実行において選択された表記を該表
    記と対応づけられた前記識別情報にて記憶する記憶工程
    と、 仮名漢字変換処理において入力された読みに対する表記
    が複数存在する場合、前記記憶手段により記憶された識
    別情報を参照して前記辞書より表記の第一候補を決定す
    る決定工程と、 を備えることを特徴とするデータ処理方法。
  6. 【請求項6】 前記辞書は、読みと対応して表記を記憶
    するとともに、少なくとも同じ意味及び表記を有する表
    記については共通の識別情報を対応づけて記憶すること
    を特徴とする請求項5に記載のデータ処理方法。
  7. 【請求項7】 前記辞書は、読みと対応して表記を記憶
    するとともに、少なくとも同じ意味を有する表記につい
    ては共通の識別情報を対応づけ、更にその書き分けに対
    応した識別情報を記憶することを特徴とする請求項5に
    記載のデータ処理方法。
  8. 【請求項8】 前記書き分けに対応した識別情報が、数
    詞における漢数字、漢数字の大字、及び算用数字である
    ことを特徴とする請求項7に記載のデータ処理方法。
JP5159541A 1993-06-29 1993-06-29 データ処理方法及び装置 Withdrawn JPH0773175A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5159541A JPH0773175A (ja) 1993-06-29 1993-06-29 データ処理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5159541A JPH0773175A (ja) 1993-06-29 1993-06-29 データ処理方法及び装置

Publications (1)

Publication Number Publication Date
JPH0773175A true JPH0773175A (ja) 1995-03-17

Family

ID=15696016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5159541A Withdrawn JPH0773175A (ja) 1993-06-29 1993-06-29 データ処理方法及び装置

Country Status (1)

Country Link
JP (1) JPH0773175A (ja)

Similar Documents

Publication Publication Date Title
JPH0773175A (ja) データ処理方法及び装置
CN111857362A (zh) 文字输入方法及文字输入装置
JP3272536B2 (ja) 仮名漢字変換方法
JP3847801B2 (ja) 文字処理装置及びその処理方法
JPH07129573A (ja) 文書処理方法及び装置
JP3340124B2 (ja) かな漢字変換装置
JPH1011433A (ja) 仮名漢字変換方式における同音異義語選択方法及びその装置
JPH0115105B2 (ja)
JPS61177568A (ja) 文字処理装置
JPS62260266A (ja) カナ漢字変換方式
JPH08194701A (ja) 文字処理装置
JPS6154560A (ja) かな漢字変換方式
JPH01237877A (ja) 漢字変換方式
JPH10232865A (ja) スペルチェック装置
JPH0267676A (ja) 漢数字変換処理装置
JPH0981555A (ja) 文書処理装置及びその方法
JPH03212762A (ja) かな漢字変換装置
JPS63308664A (ja) 文字処理装置
JPS62198952A (ja) 文字処理装置
JPS5868145A (ja) 日本語入力装置
JPH0962666A (ja) 文書処理方法及びその装置
JPS60140460A (ja) カナ漢字変換装置における短縮変換方式
JPH06195325A (ja) 日本語処理装置
JPH0520324A (ja) 文書処理装置
JPS60205687A (ja) 文字読取装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000905