JP3272536B2 - 仮名漢字変換方法 - Google Patents
仮名漢字変換方法Info
- Publication number
- JP3272536B2 JP3272536B2 JP08026394A JP8026394A JP3272536B2 JP 3272536 B2 JP3272536 B2 JP 3272536B2 JP 08026394 A JP08026394 A JP 08026394A JP 8026394 A JP8026394 A JP 8026394A JP 3272536 B2 JP3272536 B2 JP 3272536B2
- Authority
- JP
- Japan
- Prior art keywords
- name
- kanji
- kana
- notation
- combination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
ッサや電子手帳などに用いられる仮名漢字変換方法に関
し、特に記憶容量の削減が可能な仮名漢字変換方法に関
するものである。
変換装置がたとえば、特開平2−159667号公報に
開示されている。図8は同公報に開示された仮名漢字変
換装置の辞書テーブルおよび辞書領域のメモリ構成を示
す図である。図8を参照して、辞書領域のアドレスan
から同音読みサイズ、読みデータ、次に、たとえば
「ひ」の読みに対応する文字データ「ひ」、「ヒ」、
「日」が姓名判断に用いる画数とともに記憶されてい
る。ここで同音読みサイズは、同音の文字の個数を意味
する。また、熟語単位の読みに対しては熟語を構成する
文字数も記憶されている。辞書テーブルは、50音順に
辞書領域の読みの先頭文字とこの文字を有する領域の先
頭アドレスを対応付けて記憶する。たとえば「ひ」を先
頭とする読みの領域はアドレスanから始まるので、辞
書テーブルには「ひ」とアドレス「an」が記憶されて
いる。以上のように、従来においては名前の仮名漢字変
換についても、一般の単語と同様に、単語単位で読み見
出しと表記を対応させた辞書を用いて変換が行なわれて
いた。
ステムブロック図である。図9を参照して、従来の名前
用仮名漢字変換システムにおいては、入力文字列200
が変換手段203によって表記204に変換されるにあ
たって、単語単位の名前の辞書205を用いていた。
変換装置は上記のように構成されていた。辞書205は
単語単位でその読みと表記とを対応させて記憶していた
ため、大きな辞書容量が必要であった。これについて以
下に説明する。
容の一例を示す図である。この場合図示のように名前を
記憶すると、読みが最大4文字、表記が2文字で1件当
り6文字必要となり、これが12件あるため6×12=
72文字分の容量が必要となる。したがって、従来は図
10に示すように表記が同一であるにもかかわらず、異
なる読みごとに格納する必要があり、名前の読み、表記
の組合わせが大量になるため、辞書容量もそれに伴って
膨大なものが必要であった。また、単語単位の場合はそ
の表記に着目していないため、同じ表記を用いるにもか
かわらずその一方が辞書に登録され、他方が登録されな
いという場合があった。たとえば、「秀長」が登録され
ているにもかかわらず「長秀」が登録されていないとい
うような収録漏れも生じやすかった。
ためになされたもので、以下のような目的を有する。
できる仮名漢字変換方法を提供することである。
仮名漢字変換方法を提供することである。
登録漏れが生じない仮名漢字変換方法を提供することで
ある。
容易にできる仮名漢字変換方法を提供することである。
変換方法は、名前の読みを入力する入力手段と、読みに
対応した表記を表記可能な文字の最小単位で記憶すると
ともに、名前を構成する漢字を同一読みで、かつ表記の
組合せの分類が一致する単位で記憶した第1記憶手段と
を含み、分類は音読み2音節を用いているか、訓読み2
音節を用いているかを少なくとも考慮して定められ、名
前にふさわしい表記の組合せを当該分類の組合せにより
記憶した第2記憶手段とを備えた仮名漢字変換装置の仮
名漢字変換方法であって、入力手段から入力された名前
の各読みに一致する漢字を第1記憶手段から検索するス
テップと、検索された各漢字が有する分類を用いて、検
索された各漢字の組合せが第2記憶手段に記憶された中
に存在するか否かを判断するステップと、判断ステップ
によって、第2記憶手段に記憶された組合せに一致する
分類の漢字を組合せて出力するステップからなる。
記憶手段は表記の組合わせを所定の対応関係を表示する
記号で記憶することもできる。
位で記憶するとともに、名前を構成する漢字を同一読み
で、かつ表記の組合せの分類が一致する単位で記憶した
第1記憶手段から検索し、検索された各漢字が有する分
類を用いて、各漢字の組合せが名前にふさわしい表記の
組合せを分類の組合せにより記憶した第2記憶手段に記
憶された中に存在するか否かを判断し、存在するときは
第2記憶手段に記憶された組合せに一致する分類の漢字
を組合せて出力する。この分類は音読み2音節を用いて
いるか、訓読み2音節を用いているかを少なくとも考慮
して定められている。
表記の組合わせを漢字表記ごとに分類して記憶するた
め、表記される文字ごとに適切な組合わせデータのみが
格納される。
記の組合わせを所定の対応関係を表示する記号で記憶す
るため、さらに格納容量が削減できるとともに所定の対
応関係を適切に選択することにより登録もれを防ぐこと
ができる。
する。
システムブロック図である。図1を参照して、この発明
に係る仮名漢字変換装置においては、入力文字列100
を変換手段103によって表記104に変換するのに、
表記可能な文字の最小単位、たとえば名前の要素となる
漢字を単位とした文字要素単位辞書101を用いて変換
する。好ましくは、変換手段103は読みに対して名前
にふさわしい漢字等の組合わせを記憶した組合せデータ
102も用いて変換を行なう。
体化したこの発明に係る仮名漢字変換装置の主要部のブ
ロック図である。図2を参照して、この発明に係る仮名
漢字変換装置は、装置全体を制御する制御部1を含み、
制御部1は仮名漢字変換用のテーブルプログラムなどを
含む。制御部1にはCRTまはたLCDからなる表示部
2が接続され、仮名漢字変換の変換候補の確認などに用
いられる。制御部1にはキーボードなどからなる入力部
3が接続され、この入力部3を用いて仮名文字の入力、
仮名漢字変換の指示、次候補要求の指示などを行なう。
制御部1にはさらに、名前の要素単位を格納する辞書4
や、上記した組合わせ規則を記憶した組合せテーブル5
や、各種バッファ6,7,8,9が接続されている。バ
ッファ6は入力された文字列を整えるバッファであり、
バッファ7は検索中に表記に対する読みの割振りを管理
するバッファであり、バッファ8は対象文字位置を格納
するバッファであり、バッファ9は変換結果を蓄積する
バッファである。各々のバッファの動作については後で
詳細に説明する。
テーブル5の内容を説明するための図である。(A)は
辞書4の内容を示し、(B)はテーブル5の内容を示
す。図3(A)を参照して、辞書4は名前の要素の読み
と表記の組合わせで構成されている。(B)を参照し
て、組合わせテーブル5は名前をコード順にソートした
もので構成されている。このように名前として有効な表
記が集められ、これに基づいて入力した文字列が名前と
して有効かどうかが判断される。
を単位として読みと表記が対応して辞書に登録されてい
るため、従来のように要素を組合わせて登録している単
語辞書の場合に比べて読み、表記ともに容量を節約でき
る。この内容を以下に説明する。
表記を対応させた場合の辞書4および組合わせテーブル
5の格納状態を示す図であり、従来の図10に対応す
る。図4を参照して、本願発明によれば、要素の読みの
最大が3文字、要素の表記は1文字、名前としての表記
が最大2文字となる。したがって、要素辞書は1件当り
4文字分必要となり、名前表記は1件当り2文字分とな
る。この例では要素が7件、表記が6件あるため、(3
+1)×7=28、2×6=12であるから28+12
=40文字分の容量だけでよい。
辞書で行なう場合は前の図10の(B)で示したように
72文字分の記憶容量が必要になる。このように本願発
明によれば格納用の記憶領域を大幅に削減できる。
ような特殊な文字が入力された場合に、その使用例が
「楸邨」くらいしかないため、それを用いた場合に使用
する名前を限定することができる。
の実施例について説明する。図5は辞書4および組合わ
せテーブル5の他の実施例を説明するための図である。
(A)は辞書4の内容を示し、(B)は組合わせテーブ
ル5の内容を示す。この実施例においては、図3に示し
た実施例と異なり、辞書4の中に読みと表記の組合わせ
の分類を示す数字が記入されている。ここで“0”は単
独で名前になるものを示し、“1”は音読み2音節を主
に示したものを表わし、“2”は訓読み2音節を主にし
たものとなっており、“3”は表記2文字の名前の2文
字目の要素を示し、“4”は表記3文字で末尾がグルー
プ“5”の名前の2文字目の要素を表わし、“5”は
“郎”と“朗”に対応している。
要素となる漢字の登録項目を分類し、分類同士が組合わ
せられている。
せテーブル5は図5(A)で説明した分類の組合わせを
記憶している。すなわち、図5(B)を参照して、0は
先に説明したようにその漢字単独で名前となるものを表
わし、“1−3”は音読み2音節でかつ表記2文字の名
前の2文字目の要素を表わす。
ことにより、従来のようにたとえば「秀長」は登録して
いるのに、「長秀」は収録していないというような問題
が解消される。すなわち、「秀」および「長」をともに
分類“2”(訓読み2音節を主にしたもの)とし、組合
わせテーブル5において“2−2”の組合わせを可能に
しておけば両方の名前がカバーされる。つまり、一方の
名前に注目して登録しても、同じ要素からなる他の名前
も登録されることになる。以上のように、この発明の他
の実施例においては、登録漏れが防がれるとともに、組
合わせデータを所定の対応関係を表わす記号で記憶する
ため、さらに容量の削減が可能になる。
体的な動作について図6および図7を参照して説明す
る。図6は入力バッファ6に「まゆみ」という文字列が
入った場合の検索中のバッファ7、対象文字位置格納バ
ッファ8の変化とその際に生成された表記の対応を示す
図であり、図7はその場合の処理を示すフローチャート
である。
S200(以下ステップを略す)においてバッファ6に
変換すべき文字列が書込まれ、バッファ7の内容がすべ
て0にクリアされ、バッファ7の何番目の要素に注目し
ているのかを示すバッファ8の値が1にセットされる。
この状態が図6の1行目に対応する。
われそれが成功すると(S202でYES)、その表記
がチェックされる(S205)。ここではこの1字だけ
では名前になり得ないので(S206でNO)、対象表
記が進められ、バッファ8の値が+1される(S20
8)。
ムはS201へ進んで2文字目を検索する。バッファ7
は名前の表記の各文字はそれぞれバッファ6の何文字目
に対応するかを表わしているため、ここでバッファ6の
文字列と辞書4の読みがマッチすればマッチした文字数
が書込まれる。「ゆ」の検索に成功したため(S202
でYES)、表記組合わせのチェックを行なう(S20
5)。ここでは図6第2行目の(D)に示すように表記
組合わせの候補が存在するため(S206でYES)、
その表記候補を変換結果蓄積バッファ9にセットし(S
207)、対象表記を進める(S208)。ここで先と
同様にバッファ8を+1し、図6の第3行目に進む。
う(S201)。これも成功するためその表記組合わせ
をチェックし表記候補をセットする(S202でYE
S,S205−S207)。このようにして図6(D)
の第3行目に示す表記候補がバッファ9にセットされ
る。以上のように、表記候補のみが変換結果蓄積バッフ
ァ9に格納されるため、名前にふさわしい文字列を後で
まとめてチェックできるとともに、バッファの容量を削
減可能である。
でより長い読みを検索しようとしてもバッファ6の4文
字目が存在しないため検索を失敗する(S202でN
O)。ここで対象第1字目でないため(S203でN
O)、マッチ字数をクリアし、対象表記を戻す(S20
4)。ここでバッファ8の値を−1する。バッファ8の
値が「2」の状態でプログラムは再度S201へ進み
「ゆみ」の検索を行なう。これが成功し、その表記組合
わせがチェックされて表記候補として図6(D)の4行
目に示すように表記候補としてセットされる(S202
でYES,S205−S207)。
で対象表記を進めるためバッファ8の値は+1されて
「3」となる。この状態でより長い読みを検索してもバ
ッファ6の4文字目がないため検索を失敗し、対象が1
字目でないため(S203でNO)、プログラムはS2
04へ進む。ここでバッファ8の値が−1されて「2」
となり、S201へ進む。しかしながら、「ゆみ」より
長い読みがないため検索に失敗しバッファ8の値がさら
に−1されて「1」となる(S202−S204)。次
にS201で「まゆ」の検索に成功するためその表記組
合わせをチェックする(S202でYES,S20
5)。しかしながらこの表記は名前として登録されてい
ないため失敗し対象表記を進める(S206でNO,S
208)。ここではバッファ8の値が+1されるためそ
の値は「2」となる。この状態で第6行目に進む。
し、表記組合わせチェックを行なうとその組合わせが存
在するため表記候補としてバッファ9にセットされる
(S202でYES,S205−S207)。この状態
でS208でバッファ8の値は1プラスされて「3」に
なる。この状態でS201へ戻る。
ではバッファ6の4文字目がないため検索に失敗し、対
象が1字目でないためマッチ数をクリアして対象表記を
戻しバッファの値を−1して「2」とする。「み」より
長い読み検索を失敗する。
長い読みの検索を行なうがそれも失敗しこれを1字目ま
で繰り返してプログラムは終了する(S203でYE
S)。
におけるS205−207の内容を示している。
仮名から名前の要素を組合わせて名前として妥当な表記
を得ることができる。
素を読みから検索するようにしているが、表記が名前の
要素になり得るかどうかを判定するテーブルなどを追加
して読みと表記が混在した入力文字列から名前の表記に
変換できるようにしてもよい。そうすれば、読みだけで
なく漢字表記の混じった入力からも適切な名前を選択で
きる。これについて以下に説明する。漢字と読み仮名の
交じった仮名列から仮名漢字変換を行なう場合にたとえ
ば次のような場合が考えられる。
仮名から文字を検索するようになっているため、上記の
例の“英”、“二”のような表記漢字での入力には対応
できない。そこで、このような漢字が名前の要素になる
かどうかを判定するテーブルを追加することが考えられ
る。こうすることにより、漢字表記で入力した場合にお
いても対応が可能である。この場合、図5の例では組合
わせテーブル5によってグループの組合わせで判定する
ため、“英”がグループ1と2に、“二”がグループ3
と4になり得ることがわかるようなテーブルにする必要
がある。
われる漢字かどうかを判別する組合わせテーブルを設け
ておけばよいことになる。しかしながら、組合わせテー
ブル5で名前としてまともな表記になっているかどうか
をチェックするため、漢字単位で名前の要素になるかど
うか判別するテーブルは省略して全漢字を名前の要素の
候補とみなすこともできる。
表記を集めているが、名前の読み(「えいいち」、「え
いぞう」など)を集めてもよい。この場合、漢字交じり
の入力に対応するために、漢字を読み仮名に変換するテ
ーブルを追加してもよい。
わせテーブル5で名前として妥当かどうか調べるという
手順を示した。しかしながら、図5の場合には、既に検
索した要素の分類から組合わせテーブル5の組合わせを
調べて、残りの要素の分類を限定して辞書4の検索を継
続してもよい。そうすればたとえば、図5に示した組合
わせテーブル5の場合であれば、先頭の要素が分類
“1”であれば、次の要素として分類“3”、“4”の
ものだけを検索すればよいことになる。その結果、少な
い記憶容量でかつす早やく名前としてふさわしい表記を
得ることができる。
構成する漢字を同一読みで、かつ表記の組合せの分類が
一致する単位で記憶し、名前にふさわしい表記の組合せ
を表記可能な文字の最小単位で格納するとともに、入力
された読みが名前にふさわしいと判断されたときのみ読
みに対応する表記が出力されるため、格納容量を削減で
きる仮名漢字変換装置の仮名漢字変換方法が提供でき
る。
ロック図である。
ブロック図である。
ブルの内容を示す図である。
説明するための図である。
ルの内容を示す図である。
る。
めの図である。
である。
用状態を説明するための図である。
Claims (1)
- 【請求項1】 名前の読みを入力する入力手段と、読み
に対応した表記を表記可能な文字の最小単位で記憶する
とともに、名前を構成する漢字を同一読みで、かつ表記
の組合せの分類が一致する単位で記憶した第1記憶手段
とを含み、前記分類は音読み2音節を用いているか、訓
読み2音節を用いているかを少なくとも考慮して定めら
れ、名前にふさわしい表記の組合せを当該分類の組合せ
により記憶した第2記憶手段とを備えた仮名漢字変換装
置の仮名漢字変換方法であって、 前記入力手段から入力された名前の各読みに一致する漢
字を前記第1記憶手段から検索するステップと、 前記検索された各漢字が有する前記分類を用いて、検索
された各漢字の組合せが前記第2記憶手段に記憶された
中に存在するか否かを判断するステップと、 前記判断ステップによって、前記第2記憶手段に記憶さ
れた組合せに一致する分類の漢字を組合せて出力するス
テップからなる、仮名漢字変換方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08026394A JP3272536B2 (ja) | 1994-04-19 | 1994-04-19 | 仮名漢字変換方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08026394A JP3272536B2 (ja) | 1994-04-19 | 1994-04-19 | 仮名漢字変換方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07287709A JPH07287709A (ja) | 1995-10-31 |
JP3272536B2 true JP3272536B2 (ja) | 2002-04-08 |
Family
ID=13713432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08026394A Expired - Fee Related JP3272536B2 (ja) | 1994-04-19 | 1994-04-19 | 仮名漢字変換方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3272536B2 (ja) |
-
1994
- 1994-04-19 JP JP08026394A patent/JP3272536B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH07287709A (ja) | 1995-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH08314910A (ja) | 異種コード文字列転記装置および電子辞書 | |
JP3272536B2 (ja) | 仮名漢字変換方法 | |
JP3548372B2 (ja) | 文字認識装置 | |
JPH0962700A (ja) | 辞書構築方法及び装置 | |
JP2975529B2 (ja) | 電子化辞書検索装置 | |
JP3184662B2 (ja) | 文書作成装置及び漢字混じりかな漢字変換方法 | |
JP3021224B2 (ja) | 辞書検索装置 | |
JP3273778B2 (ja) | 仮名漢字変換装置及び仮名漢字変換方法 | |
JP2628775B2 (ja) | 辞書作成装置 | |
JPS619755A (ja) | かな漢字変換方式 | |
JPS6162970A (ja) | 仮名漢字変換装置 | |
JPH05282293A (ja) | 文書作成装置 | |
JPH04290158A (ja) | 文書作成装置 | |
JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
JP2839515B2 (ja) | 文字読取システム | |
JPH05189414A (ja) | 文書作成装置及び方式 | |
JP2744241B2 (ja) | 文字処理装置 | |
JP4111941B2 (ja) | 字句をデータに変換する装置、方法及びプログラム | |
JPS5924382A (ja) | 電子式翻訳機の語形変換方式 | |
JPH07129565A (ja) | 情報処理装置 | |
JPH05135112A (ja) | 情報処理装置 | |
JPH06266765A (ja) | 文章検索装置 | |
JPH0773175A (ja) | データ処理方法及び装置 | |
JPH08185400A (ja) | 文字変換装置 | |
JPS60140460A (ja) | カナ漢字変換装置における短縮変換方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020108 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080125 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090125 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100125 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110125 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120125 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |