JP3272536B2

JP3272536B2 - 仮名漢字変換方法

Info

Publication number: JP3272536B2
Application number: JP08026394A
Authority: JP
Inventors: 明濱田; 美和田中; 至幸小山
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1994-04-19
Filing date: 1994-04-19
Publication date: 2002-04-08
Anticipated expiration: 2017-04-08
Also published as: JPH07287709A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、日本語ワードプロセ
ッサや電子手帳などに用いられる仮名漢字変換方法に関
し、特に記憶容量の削減が可能な仮名漢字変換方法に関
するものである。

【０００２】

【従来の技術】この発明に興味のある名前用の仮名漢字
変換装置がたとえば、特開平２−１５９６６７号公報に
開示されている。図８は同公報に開示された仮名漢字変
換装置の辞書テーブルおよび辞書領域のメモリ構成を示
す図である。図８を参照して、辞書領域のアドレスａｎ
から同音読みサイズ、読みデータ、次に、たとえば
「ひ」の読みに対応する文字データ「ひ」、「ヒ」、
「日」が姓名判断に用いる画数とともに記憶されてい
る。ここで同音読みサイズは、同音の文字の個数を意味
する。また、熟語単位の読みに対しては熟語を構成する
文字数も記憶されている。辞書テーブルは、５０音順に
辞書領域の読みの先頭文字とこの文字を有する領域の先
頭アドレスを対応付けて記憶する。たとえば「ひ」を先
頭とする読みの領域はアドレスａｎから始まるので、辞
書テーブルには「ひ」とアドレス「ａｎ」が記憶されて
いる。以上のように、従来においては名前の仮名漢字変
換についても、一般の単語と同様に、単語単位で読み見
出しと表記を対応させた辞書を用いて変換が行なわれて
いた。

【０００３】図９は従来の名前用仮名漢字変換装置のシ
ステムブロック図である。図９を参照して、従来の名前
用仮名漢字変換システムにおいては、入力文字列２００
が変換手段２０３によって表記２０４に変換されるにあ
たって、単語単位の名前の辞書２０５を用いていた。

【０００４】

【発明が解決しようとする課題】従来の名前用仮名漢字
変換装置は上記のように構成されていた。辞書２０５は
単語単位でその読みと表記とを対応させて記憶していた
ため、大きな辞書容量が必要であった。これについて以
下に説明する。

【０００５】図１０は単語単位で記憶した場合の記憶内
容の一例を示す図である。この場合図示のように名前を
記憶すると、読みが最大４文字、表記が２文字で１件当
り６文字必要となり、これが１２件あるため６×１２＝
７２文字分の容量が必要となる。したがって、従来は図
１０に示すように表記が同一であるにもかかわらず、異
なる読みごとに格納する必要があり、名前の読み、表記
の組合わせが大量になるため、辞書容量もそれに伴って
膨大なものが必要であった。また、単語単位の場合はそ
の表記に着目していないため、同じ表記を用いるにもか
かわらずその一方が辞書に登録され、他方が登録されな
いという場合があった。たとえば、「秀長」が登録され
ているにもかかわらず「長秀」が登録されていないとい
うような収録漏れも生じやすかった。

【０００６】この発明は上記のような問題点を解消する
ためになされたもので、以下のような目的を有する。

【０００７】この発明の目的の１つは、格納容量を削減
できる仮名漢字変換方法を提供することである。

【０００８】この発明の他の目的は適切な命名が可能な
仮名漢字変換方法を提供することである。

【０００９】この発明のさらに他の目的は名前用辞書に
登録漏れが生じない仮名漢字変換方法を提供することで
ある。

【００１０】この発明のさらに他の目的は名前の選択が
容易にできる仮名漢字変換方法を提供することである。

【００１１】

【課題を解決するための手段】この発明に係る仮名漢字
変換方法は、名前の読みを入力する入力手段と、読みに
対応した表記を表記可能な文字の最小単位で記憶すると
ともに、名前を構成する漢字を同一読みで、かつ表記の
組合せの分類が一致する単位で記憶した第１記憶手段と
を含み、分類は音読み２音節を用いているか、訓読み２
音節を用いているかを少なくとも考慮して定められ、名
前にふさわしい表記の組合せを当該分類の組合せにより
記憶した第２記憶手段とを備えた仮名漢字変換装置の仮
名漢字変換方法であって、入力手段から入力された名前
の各読みに一致する漢字を第１記憶手段から検索するス
テップと、検索された各漢字が有する分類を用いて、検
索された各漢字の組合せが第２記憶手段に記憶された中
に存在するか否かを判断するステップと、判断ステップ
によって、第２記憶手段に記憶された組合せに一致する
分類の漢字を組合せて出力するステップからなる。

【００１２】

【００１３】また、仮名漢字変換装置においては、第２
記憶手段は表記の組合わせを所定の対応関係を表示する
記号で記憶することもできる。

【００１４】

【作用】読みに対応した表記を表記可能な文字の最小単
位で記憶するとともに、名前を構成する漢字を同一読み
で、かつ表記の組合せの分類が一致する単位で記憶した
第１記憶手段から検索し、検索された各漢字が有する分
類を用いて、各漢字の組合せが名前にふさわしい表記の
組合せを分類の組合せにより記憶した第２記憶手段に記
憶された中に存在するか否かを判断し、存在するときは
第２記憶手段に記憶された組合せに一致する分類の漢字
を組合せて出力する。この分類は音読み２音節を用いて
いるか、訓読み２音節を用いているかを少なくとも考慮
して定められている。

【００１５】さらに、第２記憶手段は名前にふさわしい
表記の組合わせを漢字表記ごとに分類して記憶するた
め、表記される文字ごとに適切な組合わせデータのみが
格納される。

【００１６】また、第２記憶手段は名前にふさわしい表
記の組合わせを所定の対応関係を表示する記号で記憶す
るため、さらに格納容量が削減できるとともに所定の対
応関係を適切に選択することにより登録もれを防ぐこと
ができる。

【００１７】

【実施例】以下この発明の実施例を図面を参照して説明
する。

【００１８】図１はこの発明に係る仮名漢字変換装置の
システムブロック図である。図１を参照して、この発明
に係る仮名漢字変換装置においては、入力文字列１００
を変換手段１０３によって表記１０４に変換するのに、
表記可能な文字の最小単位、たとえば名前の要素となる
漢字を単位とした文字要素単位辞書１０１を用いて変換
する。好ましくは、変換手段１０３は読みに対して名前
にふさわしい漢字等の組合わせを記憶した組合せデータ
１０２も用いて変換を行なう。

【００１９】図２は図１に示したシステムブロックを具
体化したこの発明に係る仮名漢字変換装置の主要部のブ
ロック図である。図２を参照して、この発明に係る仮名
漢字変換装置は、装置全体を制御する制御部１を含み、
制御部１は仮名漢字変換用のテーブルプログラムなどを
含む。制御部１にはＣＲＴまはたＬＣＤからなる表示部
２が接続され、仮名漢字変換の変換候補の確認などに用
いられる。制御部１にはキーボードなどからなる入力部
３が接続され、この入力部３を用いて仮名文字の入力、
仮名漢字変換の指示、次候補要求の指示などを行なう。
制御部１にはさらに、名前の要素単位を格納する辞書４
や、上記した組合わせ規則を記憶した組合せテーブル５
や、各種バッファ６，７，８，９が接続されている。バ
ッファ６は入力された文字列を整えるバッファであり、
バッファ７は検索中に表記に対する読みの割振りを管理
するバッファであり、バッファ８は対象文字位置を格納
するバッファであり、バッファ９は変換結果を蓄積する
バッファである。各々のバッファの動作については後で
詳細に説明する。

【００２０】図３は図２に示した辞書４および組合わせ
テーブル５の内容を説明するための図である。（Ａ）は
辞書４の内容を示し、（Ｂ）はテーブル５の内容を示
す。図３（Ａ）を参照して、辞書４は名前の要素の読み
と表記の組合わせで構成されている。（Ｂ）を参照し
て、組合わせテーブル５は名前をコード順にソートした
もので構成されている。このように名前として有効な表
記が集められ、これに基づいて入力した文字列が名前と
して有効かどうかが判断される。

【００２１】（Ａ）を参照して、名前の要素となる漢字
を単位として読みと表記が対応して辞書に登録されてい
るため、従来のように要素を組合わせて登録している単
語辞書の場合に比べて読み、表記ともに容量を節約でき
る。この内容を以下に説明する。

【００２２】図４はこの発明に係る辞書において読みと
表記を対応させた場合の辞書４および組合わせテーブル
５の格納状態を示す図であり、従来の図１０に対応す
る。図４を参照して、本願発明によれば、要素の読みの
最大が３文字、要素の表記は１文字、名前としての表記
が最大２文字となる。したがって、要素辞書は１件当り
４文字分必要となり、名前表記は１件当り２文字分とな
る。この例では要素が７件、表記が６件あるため、（３
＋１）×７＝２８、２×６＝１２であるから２８＋１２
＝４０文字分の容量だけでよい。

【００２３】これに対し同様のことを従来の単語単位の
辞書で行なう場合は前の図１０の（Ｂ）で示したように
７２文字分の記憶容量が必要になる。このように本願発
明によれば格納用の記憶領域を大幅に削減できる。

【００２４】またこの例においては、たとえば「楸」の
ような特殊な文字が入力された場合に、その使用例が
「楸邨」くらいしかないため、それを用いた場合に使用
する名前を限定することができる。

【００２５】次に辞書４および組合わせテーブル５の他
の実施例について説明する。図５は辞書４および組合わ
せテーブル５の他の実施例を説明するための図である。
（Ａ）は辞書４の内容を示し、（Ｂ）は組合わせテーブ
ル５の内容を示す。この実施例においては、図３に示し
た実施例と異なり、辞書４の中に読みと表記の組合わせ
の分類を示す数字が記入されている。ここで“０”は単
独で名前になるものを示し、“１”は音読み２音節を主
に示したものを表わし、“２”は訓読み２音節を主にし
たものとなっており、“３”は表記２文字の名前の２文
字目の要素を示し、“４”は表記３文字で末尾がグルー
プ“５”の名前の２文字目の要素を表わし、“５”は
“郎”と“朗”に対応している。

【００２６】このようにこの実施例においては、名前の
要素となる漢字の登録項目を分類し、分類同士が組合わ
せられている。

【００２７】図５（Ｂ）を参照して、この場合の組合わ
せテーブル５は図５（Ａ）で説明した分類の組合わせを
記憶している。すなわち、図５（Ｂ）を参照して、０は
先に説明したようにその漢字単独で名前となるものを表
わし、“１−３”は音読み２音節でかつ表記２文字の名
前の２文字目の要素を表わす。

【００２８】このように組合わせテーブル５を構成する
ことにより、従来のようにたとえば「秀長」は登録して
いるのに、「長秀」は収録していないというような問題
が解消される。すなわち、「秀」および「長」をともに
分類“２”（訓読み２音節を主にしたもの）とし、組合
わせテーブル５において“２−２”の組合わせを可能に
しておけば両方の名前がカバーされる。つまり、一方の
名前に注目して登録しても、同じ要素からなる他の名前
も登録されることになる。以上のように、この発明の他
の実施例においては、登録漏れが防がれるとともに、組
合わせデータを所定の対応関係を表わす記号で記憶する
ため、さらに容量の削減が可能になる。

【００２９】次にこの発明に係る仮名漢字変換装置の具
体的な動作について図６および図７を参照して説明す
る。図６は入力バッファ６に「まゆみ」という文字列が
入った場合の検索中のバッファ７、対象文字位置格納バ
ッファ８の変化とその際に生成された表記の対応を示す
図であり、図７はその場合の処理を示すフローチャート
である。

【００３０】図６および図７を参照して、まずステップ
Ｓ２００（以下ステップを略す）においてバッファ６に
変換すべき文字列が書込まれ、バッファ７の内容がすべ
て０にクリアされ、バッファ７の何番目の要素に注目し
ているのかを示すバッファ８の値が１にセットされる。
この状態が図６の１行目に対応する。

【００３１】Ｓ２０１において読み「ま」の検索が行な
われそれが成功すると（Ｓ２０２でＹＥＳ）、その表記
がチェックされる（Ｓ２０５）。ここではこの１字だけ
では名前になり得ないので（Ｓ２０６でＮＯ）、対象表
記が進められ、バッファ８の値が＋１される（Ｓ２０
８）。

【００３２】この状態で図６の２行目に進む。プログラ
ムはＳ２０１へ進んで２文字目を検索する。バッファ７
は名前の表記の各文字はそれぞれバッファ６の何文字目
に対応するかを表わしているため、ここでバッファ６の
文字列と辞書４の読みがマッチすればマッチした文字数
が書込まれる。「ゆ」の検索に成功したため（Ｓ２０２
でＹＥＳ）、表記組合わせのチェックを行なう（Ｓ２０
５）。ここでは図６第２行目の（Ｄ）に示すように表記
組合わせの候補が存在するため（Ｓ２０６でＹＥＳ）、
その表記候補を変換結果蓄積バッファ９にセットし（Ｓ
２０７）、対象表記を進める（Ｓ２０８）。ここで先と
同様にバッファ８を＋１し、図６の第３行目に進む。

【００３３】以上と同様にして次は「み」の検索を行な
う（Ｓ２０１）。これも成功するためその表記組合わせ
をチェックし表記候補をセットする（Ｓ２０２でＹＥ
Ｓ，Ｓ２０５−Ｓ２０７）。このようにして図６（Ｄ）
の第３行目に示す表記候補がバッファ９にセットされ
る。以上のように、表記候補のみが変換結果蓄積バッフ
ァ９に格納されるため、名前にふさわしい文字列を後で
まとめてチェックできるとともに、バッファの容量を削
減可能である。

【００３４】次に第４行目について説明する。Ｓ２０１
でより長い読みを検索しようとしてもバッファ６の４文
字目が存在しないため検索を失敗する（Ｓ２０２でＮ
Ｏ）。ここで対象第１字目でないため（Ｓ２０３でＮ
Ｏ）、マッチ字数をクリアし、対象表記を戻す（Ｓ２０
４）。ここでバッファ８の値を−１する。バッファ８の
値が「２」の状態でプログラムは再度Ｓ２０１へ進み
「ゆみ」の検索を行なう。これが成功し、その表記組合
わせがチェックされて表記候補として図６（Ｄ）の４行
目に示すように表記候補としてセットされる（Ｓ２０２
でＹＥＳ，Ｓ２０５−Ｓ２０７）。

【００３５】次に第５行目について説明する。Ｓ２０８
で対象表記を進めるためバッファ８の値は＋１されて
「３」となる。この状態でより長い読みを検索してもバ
ッファ６の４文字目がないため検索を失敗し、対象が１
字目でないため（Ｓ２０３でＮＯ）、プログラムはＳ２
０４へ進む。ここでバッファ８の値が−１されて「２」
となり、Ｓ２０１へ進む。しかしながら、「ゆみ」より
長い読みがないため検索に失敗しバッファ８の値がさら
に−１されて「１」となる（Ｓ２０２−Ｓ２０４）。次
にＳ２０１で「まゆ」の検索に成功するためその表記組
合わせをチェックする（Ｓ２０２でＹＥＳ，Ｓ２０
５）。しかしながらこの表記は名前として登録されてい
ないため失敗し対象表記を進める（Ｓ２０６でＮＯ，Ｓ
２０８）。ここではバッファ８の値が＋１されるためそ
の値は「２」となる。この状態で第６行目に進む。

【００３６】この状態で次に進むと「み」の検索に成功
し、表記組合わせチェックを行なうとその組合わせが存
在するため表記候補としてバッファ９にセットされる
（Ｓ２０２でＹＥＳ，Ｓ２０５−Ｓ２０７）。この状態
でＳ２０８でバッファ８の値は１プラスされて「３」に
なる。この状態でＳ２０１へ戻る。

【００３７】次に第７行目について説明する。Ｓ２０１
ではバッファ６の４文字目がないため検索に失敗し、対
象が１字目でないためマッチ数をクリアして対象表記を
戻しバッファの値を−１して「２」とする。「み」より
長い読み検索を失敗する。

【００３８】この状態でＳ２０１へ戻って「まゆ」より
長い読みの検索を行なうがそれも失敗しこれを１字目ま
で繰り返してプログラムは終了する（Ｓ２０３でＹＥ
Ｓ）。

【００３９】なお、上記のように図６の（Ｄ）欄は図７
におけるＳ２０５−２０７の内容を示している。

【００４０】以上のような処理によって入力された読み
仮名から名前の要素を組合わせて名前として妥当な表記
を得ることができる。

【００４１】上記実施例においては、辞書４は名前の要
素を読みから検索するようにしているが、表記が名前の
要素になり得るかどうかを判定するテーブルなどを追加
して読みと表記が混在した入力文字列から名前の表記に
変換できるようにしてもよい。そうすれば、読みだけで
なく漢字表記の混じった入力からも適切な名前を選択で
きる。これについて以下に説明する。漢字と読み仮名の
交じった仮名列から仮名漢字変換を行なう場合にたとえ
ば次のような場合が考えられる。

【００４２】「英二ろう」→「栄二郎」，「英二朗」このような場合に図３および図５に示した辞書４は読み
仮名から文字を検索するようになっているため、上記の
例の“英”、“二”のような表記漢字での入力には対応
できない。そこで、このような漢字が名前の要素になる
かどうかを判定するテーブルを追加することが考えられ
る。こうすることにより、漢字表記で入力した場合にお
いても対応が可能である。この場合、図５の例では組合
わせテーブル５によってグループの組合わせで判定する
ため、“英”がグループ１と２に、“二”がグループ３
と４になり得ることがわかるようなテーブルにする必要
がある。

【００４３】図３の例では、“英”や“二”が名前に使
われる漢字かどうかを判別する組合わせテーブルを設け
ておけばよいことになる。しかしながら、組合わせテー
ブル５で名前としてまともな表記になっているかどうか
をチェックするため、漢字単位で名前の要素になるかど
うか判別するテーブルは省略して全漢字を名前の要素の
候補とみなすこともできる。

【００４４】図３では組合わせテーブル５として名前の
表記を集めているが、名前の読み（「えいいち」、「え
いぞう」など）を集めてもよい。この場合、漢字交じり
の入力に対応するために、漢字を読み仮名に変換するテ
ーブルを追加してもよい。

【００４５】上記実施例では辞書４を検索してから組合
わせテーブル５で名前として妥当かどうか調べるという
手順を示した。しかしながら、図５の場合には、既に検
索した要素の分類から組合わせテーブル５の組合わせを
調べて、残りの要素の分類を限定して辞書４の検索を継
続してもよい。そうすればたとえば、図５に示した組合
わせテーブル５の場合であれば、先頭の要素が分類
“１”であれば、次の要素として分類“３”、“４”の
ものだけを検索すればよいことになる。その結果、少な
い記憶容量でかつす早やく名前としてふさわしい表記を
得ることができる。

【００４６】

【発明の効果】以上のようにこの発明によれば、名前を
構成する漢字を同一読みで、かつ表記の組合せの分類が
一致する単位で記憶し、名前にふさわしい表記の組合せ
を表記可能な文字の最小単位で格納するとともに、入力
された読みが名前にふさわしいと判断されたときのみ読
みに対応する表記が出力されるため、格納容量を削減で
きる仮名漢字変換装置の仮名漢字変換方法が提供でき
る。

【図面の簡単な説明】

【図１】この発明に係る仮名漢字変換装置のシステムブ
ロック図である。

【図２】この発明に係る仮名漢字変換装置の要部を示す
ブロック図である。

【図３】この発明の一実施例による辞書、組合わせテー
ブルの内容を示す図である。

【図４】文字単位で記憶した場合の必要なメモリ容量を
説明するための図である。

【図５】この発明の他の実施例に係る辞書およびテーブ
ルの内容を示す図である。

【図６】処理に応じた各バッファの内容を示す図であ
る。

【図７】この発明の動作を示すフローチャートである

【図８】従来例の仮名漢字変換装置の要部を説明するた
めの図である。

【図９】従来の仮名漢字変換装置のシステムブロック図
である。

【図１０】従来の仮名漢字変換装置におけるメモリの使
用状態を説明するための図である。

【符号の説明】

１制御部２ＣＲＴ３キーボード４辞書５組合わせテーブル６，７，８，９バッファ

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平１−204173（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 17/21 - 17/26

Claims

(57)【特許請求の範囲】

【請求項１】名前の読みを入力する入力手段と、読み
に対応した表記を表記可能な文字の最小単位で記憶する
とともに、名前を構成する漢字を同一読みで、かつ表記
の組合せの分類が一致する単位で記憶した第１記憶手段
とを含み、前記分類は音読み２音節を用いているか、訓
読み２音節を用いているかを少なくとも考慮して定めら
れ、名前にふさわしい表記の組合せを当該分類の組合せ
により記憶した第２記憶手段とを備えた仮名漢字変換装
置の仮名漢字変換方法であって、前記入力手段から入力された名前の各読みに一致する漢
字を前記第１記憶手段から検索するステップと、前記検索された各漢字が有する前記分類を用いて、検索
された各漢字の組合せが前記第２記憶手段に記憶された
中に存在するか否かを判断するステップと、前記判断ステップによって、前記第２記憶手段に記憶さ
れた組合せに一致する分類の漢字を組合せて出力するス
テップからなる、仮名漢字変換方法。