JPH07287709A - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JPH07287709A
JPH07287709A JP6080263A JP8026394A JPH07287709A JP H07287709 A JPH07287709 A JP H07287709A JP 6080263 A JP6080263 A JP 6080263A JP 8026394 A JP8026394 A JP 8026394A JP H07287709 A JPH07287709 A JP H07287709A
Authority
JP
Japan
Prior art keywords
notation
reading
name
kana
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6080263A
Other languages
English (en)
Other versions
JP3272536B2 (ja
Inventor
Akira Hamada
明 濱田
Yoshikazu Tanaka
美和 田中
Yoshiyuki Koyama
至幸 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP08026394A priority Critical patent/JP3272536B2/ja
Publication of JPH07287709A publication Critical patent/JPH07287709A/ja
Application granted granted Critical
Publication of JP3272536B2 publication Critical patent/JP3272536B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 格納容量を削減できる仮名漢字変換装置を提
供する。 【構成】 仮名漢字変換装置は名前の読みを入力するキ
ーボード3と、読みに対応した表記を記憶する辞書4と
名前にふさわしい文字の組合わせを記憶する組合わせテ
ーブル5とを含む。辞書4は、読みに対応した表記を漢
字単位で格納する。入力された読みに対応してその表記
が辞書4および組合わせテーブル5を参照して、検索さ
れ、組合わせテーブル5に存在する場合のみに検索した
表記がCRT2に出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、日本語ワードプロセ
ッサや電子手帳などに用いられる仮名漢字変換装置に関
し、特に記憶容量の削減が可能な仮名漢字変換装置に関
するものである。
【0002】
【従来の技術】この発明に興味のある名前用の仮名漢字
変換装置がたとえば、特開平2−159667号公報に
開示されている。図8は同公報に開示された仮名漢字変
換装置の辞書テーブルおよび辞書領域のメモリ構成を示
す図である。図8を参照して、辞書領域のアドレスan
から同音読みサイズ、読みデータ、次に、たとえば
「ひ」の読みに対応する文字データ「ひ」、「ヒ」、
「日」が姓名判断に用いる画数とともに記憶されてい
る。ここで同音読みサイズは、同音の文字の個数を意味
する。また、熟語単位の読みに対しては熟語を構成する
文字数も記憶されている。辞書テーブルは、50音順に
辞書領域の読みの先頭文字とこの文字を有する領域の先
頭アドレスを対応付けて記憶する。たとえば「ひ」を先
頭とする読みの領域はアドレスanから始まるので、辞
書テーブルには「ひ」とアドレス「an」が記憶されて
いる。以上のように、従来においては名前の仮名漢字変
換についても、一般の単語と同様に、単語単位で読み見
出しと表記を対応させた辞書を用いて変換が行なわれて
いた。
【0003】図9は従来の名前用仮名漢字変換装置のシ
ステムブロック図である。図9を参照して、従来の名前
用仮名漢字変換システムにおいては、入力文字列200
が変換手段203によって表記204に変換されるにあ
たって、単語単位の名前の辞書205を用いていた。
【0004】
【発明が解決しようとする課題】従来の名前用仮名漢字
変換装置は上記のように構成されていた。辞書205は
単語単位でその読みと表記とを対応させて記憶していた
ため、大きな辞書容量が必要であった。これについて以
下に説明する。
【0005】図10は単語単位で記憶した場合の記憶内
容の一例を示す図である。この場合図示のように名前を
記憶すると、読みが最大4文字、表記が2文字で1件当
り6文字必要となり、これが12件あるため6×12=
72文字分の容量が必要となる。したがって、従来は図
10に示すように表記が同一であるにもかかわらず、異
なる読みごとに格納する必要があり、名前の読み、表記
の組合わせが大量になるため、辞書容量もそれに伴って
膨大なものが必要であった。また、単語単位の場合はそ
の表記に着目していないため、同じ表記を用いるにもか
かわらずその一方が辞書に登録され、他方が登録されな
いという場合があった。たとえば、「秀長」が登録され
ているにもかかわらず「長秀」が登録されていないとい
うような収録漏れも生じやすかった。
【0006】この発明は上記のような問題点を解消する
ためになされたもので、以下のような目的を有する。
【0007】この発明の目的の1つは、格納容量を削減
できる仮名漢字変換装置を提供することである。
【0008】この発明の他の目的は適切な命名が可能な
仮名漢字変換装置を提供することである。
【0009】この発明のさらに他の目的は名前用辞書に
登録漏れが生じない仮名漢字変換装置を提供することで
ある。
【0010】この発明のさらに他の目的は名前の選択が
容易にできる仮名漢字変換装置を提供することである。
【0011】
【課題を解決するための手段】この発明に係る仮名漢字
変換装置は、名前の読みを入力する手段と、読みに対応
した表記を記憶する第1記憶手段とを含み、第1記憶手
段は読みに対応した表記を表記可能な文字の最小単位で
格納し、装置はさらに、名前にふさわしい表記の組合わ
せを記憶する第2記憶手段と、入力された読みの表記が
第2記憶手段に存在するか否かを判断する手段とを含
み、判断手段が第2記憶手段に表記が存在すると判断し
たときのみその表記を出力する出力手段とを含む。
【0012】さらに、仮名漢字変換装置においては、第
2記憶手段は表記の組合わせを漢字表記ごとに分類して
記憶することもできる。
【0013】また、仮名漢字変換装置においては、第2
記憶手段は表記の組合わせを所定の対応関係を表示する
記号で記憶することもできる。
【0014】
【作用】仮名漢字変換装置においては、第1記憶手段は
読みと表記の対応を表記可能な文字の最小単位で格納
し、入力された読みに対応する表記が名前にふさわしい
と判断されたときのみ入力された読みに対応する表記が
出力される。
【0015】さらに、第2記憶手段は名前にふさわしい
表記の組合わせを漢字表記ごとに分類して記憶するた
め、表記される文字ごとに適切な組合わせデータのみが
格納される。
【0016】また、第2記憶手段は名前にふさわしい表
記の組合わせを所定の対応関係を表示する記号で記憶す
るため、さらに格納容量が削減できるとともに所定の対
応関係を適切に選択することにより登録もれを防ぐこと
ができる。
【0017】
【実施例】以下この発明の実施例を図面を参照して説明
する。
【0018】図1はこの発明に係る仮名漢字変換装置の
システムブロック図である。図1を参照して、この発明
に係る仮名漢字変換装置においては、入力文字列100
を変換手段103によって表記104に変換するのに、
表記可能な文字の最小単位、たとえば名前の要素となる
漢字を単位とした文字要素単位辞書101を用いて変換
する。好ましくは、変換手段103は読みに対して名前
にふさわしい漢字等の組合わせを記憶した組合せデータ
102も用いて変換を行なう。
【0019】図2は図1に示したシステムブロックを具
体化したこの発明に係る仮名漢字変換装置の主要部のブ
ロック図である。図2を参照して、この発明に係る仮名
漢字変換装置は、装置全体を制御する制御部1を含み、
制御部1は仮名漢字変換用のテーブルプログラムなどを
含む。制御部1にはCRTまはたLCDからなる表示部
2が接続され、仮名漢字変換の変換候補の確認などに用
いられる。制御部1にはキーボードなどからなる入力部
3が接続され、この入力部3を用いて仮名文字の入力、
仮名漢字変換の指示、次候補要求の指示などを行なう。
制御部1にはさらに、名前の要素単位を格納する辞書4
や、上記した組合わせ規則を記憶した組合せテーブル5
や、各種バッファ6,7,8,9が接続されている。バ
ッファ6は入力された文字列を整えるバッファであり、
バッファ7は検索中に表記に対する読みの割振りを管理
するバッファであり、バッファ8は対象文字位置を格納
するバッファであり、バッファ9は変換結果を蓄積する
バッファである。各々のバッファの動作については後で
詳細に説明する。
【0020】図3は図2に示した辞書4および組合わせ
テーブル5の内容を説明するための図である。(A)は
辞書4の内容を示し、(B)はテーブル5の内容を示
す。図3(A)を参照して、辞書4は名前の要素の読み
と表記の組合わせで構成されている。(B)を参照し
て、組合わせテーブル5は名前をコード順にソートした
もので構成されている。このように名前として有効な表
記が集められ、これに基づいて入力した文字列が名前と
して有効かどうかが判断される。
【0021】(A)を参照して、名前の要素となる漢字
を単位として読みと表記が対応して辞書に登録されてい
るため、従来のように要素を組合わせて登録している単
語辞書の場合に比べて読み、表記ともに容量を節約でき
る。この内容を以下に説明する。
【0022】図4はこの発明に係る辞書において読みと
表記を対応させた場合の辞書4および組合わせテーブル
5の格納状態を示す図であり、従来の図10に対応す
る。図4を参照して、本願発明によれば、要素の読みの
最大が3文字、要素の表記は1文字、名前としての表記
が最大2文字となる。したがって、要素辞書は1件当り
4文字分必要となり、名前表記は1件当り2文字分とな
る。この例では要素が7件、表記が6件あるため、(3
+1)×7=28、2×6=12であるから28+12
=40文字分の容量だけでよい。
【0023】これに対し同様のことを従来の単語単位の
辞書で行なう場合は前の図10の(B)で示したように
72文字分の記憶容量が必要になる。このように本願発
明によれば格納用の記憶領域を大幅に削減できる。
【0024】またこの例においては、たとえば「楸」の
ような特殊な文字が入力された場合に、その使用例が
「楸邨」くらいしかないため、それを用いた場合に使用
する名前を限定することができる。
【0025】次に辞書4および組合わせテーブル5の他
の実施例について説明する。図5は辞書4および組合わ
せテーブル5の他の実施例を説明するための図である。
(A)は辞書4の内容を示し、(B)は組合わせテーブ
ル5の内容を示す。この実施例においては、図3に示し
た実施例と異なり、辞書4の中に読みと表記の組合わせ
の分類を示す数字が記入されている。ここで“0”は単
独で名前になるものを示し、“1”は音読み2音節を主
に示したものを表わし、“2”は訓読み2音節を主にし
たものとなっており、“3”は表記2文字の名前の2文
字目の要素を示し、“4”は表記3文字で末尾がグルー
プ“5”の名前の2文字目の要素を表わし、“5”は
“郎”と“朗”に対応している。
【0026】このようにこの実施例においては、名前の
要素となる漢字の登録項目を分類し、分類同士が組合わ
せられている。
【0027】図5(B)を参照して、この場合の組合わ
せテーブル5は図5(A)で説明した分類の組合わせを
記憶している。すなわち、図5(B)を参照して、0は
先に説明したようにその漢字単独で名前となるものを表
わし、“1−3”は音読み2音節でかつ表記2文字の名
前の2文字目の要素を表わす。
【0028】このように組合わせテーブル5を構成する
ことにより、従来のようにたとえば「秀長」は登録して
いるのに、「長秀」は収録していないというような問題
が解消される。すなわち、「秀」および「長」をともに
分類“2”(訓読み2音節を主にしたもの)とし、組合
わせテーブル5において“2−2”の組合わせを可能に
しておけば両方の名前がカバーされる。つまり、一方の
名前に注目して登録しても、同じ要素からなる他の名前
も登録されることになる。以上のように、この発明の他
の実施例においては、登録漏れが防がれるとともに、組
合わせデータを所定の対応関係を表わす記号で記憶する
ため、さらに容量の削減が可能になる。
【0029】次にこの発明に係る仮名漢字変換装置の具
体的な動作について図6および図7を参照して説明す
る。図6は入力バッファ6に「まゆみ」という文字列が
入った場合の検索中のバッファ7、対象文字位置格納バ
ッファ8の変化とその際に生成された表記の対応を示す
図であり、図7はその場合の処理を示すフローチャート
である。
【0030】図6および図7を参照して、まずステップ
S200(以下ステップを略す)においてバッファ6に
変換すべき文字列が書込まれ、バッファ7の内容がすべ
て0にクリアされ、バッファ7の何番目の要素に注目し
ているのかを示すバッファ8の値が1にセットされる。
この状態が図6の1行目に対応する。
【0031】S201において読み「ま」の検索が行な
われそれが成功すると(S202でYES)、その表記
がチェックされる(S205)。ここではこの1字だけ
では名前になり得ないので(S206でNO)、対象表
記が進められ、バッファ8の値が+1される(S20
8)。
【0032】この状態で図6の2行目に進む。プログラ
ムはS201へ進んで2文字目を検索する。バッファ7
は名前の表記の各文字はそれぞれバッファ6の何文字目
に対応するかを表わしているため、ここでバッファ6の
文字列と辞書4の読みがマッチすればマッチした文字数
が書込まれる。「ゆ」の検索に成功したため(S202
でYES)、表記組合わせのチェックを行なう(S20
5)。ここでは図6第2行目の(D)に示すように表記
組合わせの候補が存在するため(S206でYES)、
その表記候補を変換結果蓄積バッファ9にセットし(S
207)、対象表記を進める(S208)。ここで先と
同様にバッファ8を+1し、図6の第3行目に進む。
【0033】以上と同様にして次は「み」の検索を行な
う(S201)。これも成功するためその表記組合わせ
をチェックし表記候補をセットする(S202でYE
S,S205−S207)。このようにして図6(D)
の第3行目に示す表記候補がバッファ9にセットされ
る。以上のように、表記候補のみが変換結果蓄積バッフ
ァ9に格納されるため、名前にふさわしい文字列を後で
まとめてチェックできるとともに、バッファの容量を削
減可能である。
【0034】次に第4行目について説明する。S201
でより長い読みを検索しようとしてもバッファ6の4文
字目が存在しないため検索を失敗する(S202でN
O)。ここで対象第1字目でないため(S203でN
O)、マッチ字数をクリアし、対象表記を戻す(S20
4)。ここでバッファ8の値を−1する。バッファ8の
値が「2」の状態でプログラムは再度S201へ進み
「ゆみ」の検索を行なう。これが成功し、その表記組合
わせがチェックされて表記候補として図6(D)の4行
目に示すように表記候補としてセットされる(S202
でYES,S205−S207)。
【0035】次に第5行目について説明する。S208
で対象表記を進めるためバッファ8の値は+1されて
「3」となる。この状態でより長い読みを検索してもバ
ッファ6の4文字目がないため検索を失敗し、対象が1
字目でないため(S203でNO)、プログラムはS2
04へ進む。ここでバッファ8の値が−1されて「2」
となり、S201へ進む。しかしながら、「ゆみ」より
長い読みがないため検索に失敗しバッファ8の値がさら
に−1されて「1」となる(S202−S204)。次
にS201で「まゆ」の検索に成功するためその表記組
合わせをチェックする(S202でYES,S20
5)。しかしながらこの表記は名前として登録されてい
ないため失敗し対象表記を進める(S206でNO,S
208)。ここではバッファ8の値が+1されるためそ
の値は「2」となる。この状態で第6行目に進む。
【0036】この状態で次に進むと「み」の検索に成功
し、表記組合わせチェックを行なうとその組合わせが存
在するため表記候補としてバッファ9にセットされる
(S202でYES,S205−S207)。この状態
でS208でバッファ8の値は1プラスされて「3」に
なる。この状態でS201へ戻る。
【0037】次に第7行目について説明する。S201
ではバッファ6の4文字目がないため検索に失敗し、対
象が1字目でないためマッチ数をクリアして対象表記を
戻しバッファの値を−1して「2」とする。「み」より
長い読み検索を失敗する。
【0038】この状態でS201へ戻って「まゆ」より
長い読みの検索を行なうがそれも失敗しこれを1字目ま
で繰り返してプログラムは終了する(S203でYE
S)。
【0039】なお、上記のように図6の(D)欄は図7
におけるS205−207の内容を示している。
【0040】以上のような処理によって入力された読み
仮名から名前の要素を組合わせて名前として妥当な表記
を得ることができる。
【0041】上記実施例においては、辞書4は名前の要
素を読みから検索するようにしているが、表記が名前の
要素になり得るかどうかを判定するテーブルなどを追加
して読みと表記が混在した入力文字列から名前の表記に
変換できるようにしてもよい。そうすれば、読みだけで
なく漢字表記の混じった入力からも適切な名前を選択で
きる。これについて以下に説明する。漢字と読み仮名の
交じった仮名列から仮名漢字変換を行なう場合にたとえ
ば次のような場合が考えられる。
【0042】「英二ろう」→「栄二郎」,「英二朗」 このような場合に図3および図5に示した辞書4は読み
仮名から文字を検索するようになっているため、上記の
例の“英”、“二”のような表記漢字での入力には対応
できない。そこで、このような漢字が名前の要素になる
かどうかを判定するテーブルを追加することが考えられ
る。こうすることにより、漢字表記で入力した場合にお
いても対応が可能である。この場合、図5の例では組合
わせテーブル5によってグループの組合わせで判定する
ため、“英”がグループ1と2に、“二”がグループ3
と4になり得ることがわかるようなテーブルにする必要
がある。
【0043】図3の例では、“英”や“二”が名前に使
われる漢字かどうかを判別する組合わせテーブルを設け
ておけばよいことになる。しかしながら、組合わせテー
ブル5で名前としてまともな表記になっているかどうか
をチェックするため、漢字単位で名前の要素になるかど
うか判別するテーブルは省略して全漢字を名前の要素の
候補とみなすこともできる。
【0044】図3では組合わせテーブル5として名前の
表記を集めているが、名前の読み(「えいいち」、「え
いぞう」など)を集めてもよい。この場合、漢字交じり
の入力に対応するために、漢字を読み仮名に変換するテ
ーブルを追加してもよい。
【0045】上記実施例では辞書4を検索してから組合
わせテーブル5で名前として妥当かどうか調べるという
手順を示した。しかしながら、図5の場合には、既に検
索した要素の分類から組合わせテーブル5の組合わせを
調べて、残りの要素の分類を限定して辞書4の検索を継
続してもよい。そうすればたとえば、図5に示した組合
わせテーブル5の場合であれば、先頭の要素が分類
“1”であれば、次の要素として分類“3”、“4”の
ものだけを検索すればよいことになる。その結果、少な
い記憶容量でかつす早やく名前としてふさわしい表記を
得ることができる。
【0046】
【発明の効果】以上のようにこの発明によれば、読みと
表記の対応を表記可能な文字の最小単位で格納するとと
もに、入力された読みが名前にふさわしいと判断された
ときのみ読みに対応する表記が出力されるため、格納容
量を削減できる仮名漢字変換装置が提供できる。
【図面の簡単な説明】
【図1】この発明に係る仮名漢字変換装置のシステムブ
ロック図である。
【図2】この発明に係る仮名漢字変換装置の要部を示す
ブロック図である。
【図3】この発明の一実施例による辞書、組合わせテー
ブルの内容を示す図である。
【図4】文字単位で記憶した場合の必要なメモリ容量を
説明するための図である。
【図5】この発明の他の実施例に係る辞書およびテーブ
ルの内容を示す図である。
【図6】処理に応じた各バッファの内容を示す図であ
る。
【図7】この発明の動作を示すフローチャートである
【図8】従来例の仮名漢字変換装置の要部を説明するた
めの図である。
【図9】従来の仮名漢字変換装置のシステムブロック図
である。
【図10】従来の仮名漢字変換装置におけるメモリの使
用状態を説明するための図である。
【符号の説明】
1 制御部 2 CRT 3 キーボード 4 辞書 5 組合わせテーブル 6,7,8,9 バッファ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 名前の読みを入力する手段と、 前記読みに対応した表記を記憶する第1記憶手段とを含
    み、 前記第1記憶手段は前記読みに対応した表記を、表記可
    能な文字の最小単位で格納し、 前記名前にふさわしい前記表記の組合わせを記憶する第
    2記憶手段と、 前記入力された読みの表記が前記第2記憶手段に存在す
    るか否かを判断する手段とを含み、 前記判断手段が前記第2記憶手段に表記が存在すると判
    断したときのみその表記を出力する、仮名漢字変換装
    置。
JP08026394A 1994-04-19 1994-04-19 仮名漢字変換方法 Expired - Fee Related JP3272536B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08026394A JP3272536B2 (ja) 1994-04-19 1994-04-19 仮名漢字変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08026394A JP3272536B2 (ja) 1994-04-19 1994-04-19 仮名漢字変換方法

Publications (2)

Publication Number Publication Date
JPH07287709A true JPH07287709A (ja) 1995-10-31
JP3272536B2 JP3272536B2 (ja) 2002-04-08

Family

ID=13713432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08026394A Expired - Fee Related JP3272536B2 (ja) 1994-04-19 1994-04-19 仮名漢字変換方法

Country Status (1)

Country Link
JP (1) JP3272536B2 (ja)

Also Published As

Publication number Publication date
JP3272536B2 (ja) 2002-04-08

Similar Documents

Publication Publication Date Title
JPH07287709A (ja) 仮名漢字変換装置
JPH05113964A (ja) 電子辞書
JPS646499B2 (ja)
JPS6211385B2 (ja)
JP2628775B2 (ja) 辞書作成装置
JPH04290158A (ja) 文書作成装置
JPS60122463A (ja) 文字処理装置
JP3021224B2 (ja) 辞書検索装置
JP2744241B2 (ja) 文字処理装置
JPS6162970A (ja) 仮名漢字変換装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPS5924382A (ja) 電子式翻訳機の語形変換方式
JPH0746353B2 (ja) 日本語文章入力装置
JPH05189414A (ja) 文書作成装置及び方式
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPH0991304A (ja) 情報検索方法、情報検索システム及び情報検索用記憶媒体
JPS62260266A (ja) カナ漢字変換方式
JPH05120283A (ja) 漢字読み仮名変換装置
JPH06223055A (ja) 文章入力装置
JPH05135009A (ja) 情報処理装置
JPH10232865A (ja) スペルチェック装置
JPH08185400A (ja) 文字変換装置
JPH07319908A (ja) 文書検索方法及び文書検索装置
JPS619755A (ja) かな漢字変換方式
JPH04120656A (ja) 文書処理装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080125

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090125

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100125

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110125

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120125

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees