JP4251000B2 - かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム - Google Patents
かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム Download PDFInfo
- Publication number
- JP4251000B2 JP4251000B2 JP2003110837A JP2003110837A JP4251000B2 JP 4251000 B2 JP4251000 B2 JP 4251000B2 JP 2003110837 A JP2003110837 A JP 2003110837A JP 2003110837 A JP2003110837 A JP 2003110837A JP 4251000 B2 JP4251000 B2 JP 4251000B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- kana
- kanji conversion
- character
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
本発明は、操作キーやタッチパッド等の入力手段を用いて入力された読み文字列についてかな漢字変換を行うかな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムに関する。
【0002】
【従来の技術】
従来の日本語かな漢字変換システムの一手法として、特開平11−39300号公報にて開示されたように先頭の一文字あるいは先頭から数文字の読み文字列を入力することで予測辞書検索を行い、入力しようとする文字の全読みを入力することなく文字入力を行う手法がある。
【0003】
また、従来の日本語かな漢字変換システムにおいては、読み文字を入力すると、文字列を予測し、不完全な読み文字列でもかな漢字変換して利用者へ提示する単語予測変換の手法が知られている。さらに、一つの単語が入力された際に、次に入力するであろう文字列を予測する手法として 特開平9−274613号公報にて開示されたように前文節として入力された自立語との接続規則表を基に付属語を次に入力されるであろう文字列として提示する次文字列予測手法がある。
【0004】
【特許文献1】
特開平11−39300号
【特許文献2】
特開平9−274613号
【0005】
【発明が解決しようとする課題】
しかし、前記特許文献1に記載の従来の予測変換システムにおいてはかな漢字変換用辞書とユーザ学習辞書の他に予測用辞書を持たせているため、予測変換システムを備えていない通常のかな漢字変換システムに比べて多くの辞書記憶領域を必要とするという問題があった。
【0006】
また、前記特許文献2に記載の従来の文字列予測手法では文章を組み立てることまでは行うことが出来ないという問題があった。
【0007】
また、前述した日本語かな漢字変換システムにおける予測変換機能は、目的とする文字列の全読みを入力することなく、かな漢字混じり文字列を構成する手法であり、このため、入力した読み文字列は、選択した予測変換候補文字列の正確な読みである可能性が非常に低い。たとえば住所入力欄において変換文字列およびその読み文字列を入力する場合、利用者の便宜を図り、かな漢字変換システムを利用して入力された読み文字列と変換された文字列を2つの欄に記入する際、予測変換を利用した入力システムでは読み文字列が不完全であるため、読みの欄は再入力を強いられ、結局は全読み文字列を入力することになってしまうという問題があった。
【0008】
本発明は、前記実情に鑑みてなされたものであり、特別に予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができるかな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムの提供を目的とする。
【0009】
また、本発明は、前記実情に鑑みてなされたものであり、特別に次文節予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができるかな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムの提供を目的とする。
【0010】
また、本発明は、前記実情に鑑みてなされたものであり、日本語かな漢字変換システムにおいて予測変換を利用している場合であっても変換文字列の正しい読み文字列を取得することができる日本語かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムの提供を目的とする。
【0011】
【課題を解決するための手段】
本発明に係るかな漢字変換装置は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書と、前記入力された読み文字列を前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索する文字列予測手段と、前記文字列予測手段により抽出された少なくとも一つの予測文字列候補を表示する表示手段とを備え、前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させ、前記文字列予測手段は、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する。
【0012】
本発明に係るかな漢字変換方法は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書とを、文字列予測手段が、前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索することで前記入力された読み文字列の変換文字列を予測する文字列予測工程と、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示処理手段が表示部に表示する表示工程とを備え、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させ、前記文字列予測工程では、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する。
【0013】
本発明に係るかな漢字変換プログラムは、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置によって実行されるかな漢字変換をコンピュータに実行させるためのかな漢字変換プログラムにおいて、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書とを、コンピュータの文字列予測機能部が、前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索することで前記入力された読み文字列の変換文字列を予測する文字列予測工程と、コンピュータが、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程とを備え、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させ、前記文字列予測工程では、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する。
【0014】
本発明によれば、ユーザ学習辞書があたかもかな漢字変換用辞書のキャッシュのように働き、使えば使うほどかな漢字変換用辞書を検索する頻度が下がることとなる。また、個人が使う単語数は多くはないため、ある程度手順に示した作業を続けることでほぼユーザ学習辞書の検索だけで文字入力が可能となる。つまり全辞書検索する度合いが減り、検索時間が短縮される。
【0015】
本発明に係るかな漢字変換装置は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書と、入力された読み文字列を前記かな漢字変換用辞書とユーザ学習辞書を検索することで文字列予測する文字列予測手段と、前記文字列予測手段により抽出された少なくとも一つの予測文字列候補を表示する表示手段とを備え、前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させる。
【0016】
また、本発明に係るかな漢字変換方法は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書とを検索することで前記入力された読み文字列の変換文字列候補を予測する文字列予測工程と、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程とを備える。
【0017】
また、本発明に係るかな漢字変換プログラムは、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置に実行されるかな漢字変換プログラムにおいて、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書とを検索することで前記入力された読み文字列の変換文字列候補を予測する文字列予測工程と、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程とを備える。
【0018】
本発明によれば、前文節があれば読み文字列を入力することなく、利用者に提示する次文節の文字列から選択処理を繰り返すことで日本語文章を組み立てることが出来るようになる。
【0019】
本発明に係るかな漢字変換装置は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、入力された読み文字列が不完全であっても変換文字列を予測する文字列予測手段と、入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書と、前記文字列予測手段によって予測された変換文字列から読み文字列を復元する読み文字列復元手段とを備える。
【0020】
また、本発明に係るかな漢字変換方法は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、入力された読み文字列が不完全であっても変換文字列を予測する文字列予測工程と、入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書を用い、前記文字列予測工程によって予測された変換文字列の読み文字列を復元する読み文字列復元工程とを備える。
【0021】
また、本発明に係るかな漢字変換プログラムは、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置に実行されるかな漢字変換プログラムにおいて、入力された読み文字列が不完全であっても変換文字列を予測する文字列予測工程と、入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書を用い、前記文字列予測工程によって予測された変換文字列の読み文字列を復元する読み文字列復元工程とを備える。
【0022】
【発明の実施の形態】
以下、本発明のいくつかの実施の形態について図面を参照しながら説明する。第1の実施の形態は、キーボードやリモコンなどの入力装置から入力されたかな文字を漢字かな混じり文字列へ変換するかな漢字変換装置である。
【0023】
かな漢字変換装置は、OS(オペレーティングシステム)やアプリケーションへの日本語を入力するためのかな漢字変換ソフトを実行する装置である。かな漢字変換ソフトは、日本語入力システム、日本語プロセッサともいう。このかな漢字変換装置をアプリケーションの一つである日本語文章作成装置(日本語ワードプロセッサ:Word Processor)に内蔵することにより文書の作成、編集等が可能となる。
【0024】
このようなかな漢字変換装置及び/又は日本語ワードプロセッサは、最近、携帯電話、携帯情報端末(PDA)、携帯型パーソナルコンピュータ、ビデオカメラ、デジタルスチルカメラ或いはテレビジョン受像機等、いわゆる民生用電子機器(consumer electronics:CE)にアプリケーションとして備えられるようになった。これらのCE機器は、インターネット等のネットワークと接続され、ネットワークを通して文字情報を通信する機能を備えるようになったり、或いは住所登録や、メモ書き、さらにはタイトル、曲名、演奏者、出演者等の記録や検索をする機能を備えるようになったためである。
【0025】
これらのCE機器は、携帯型であったり、あるいは筐体本体の小型化のために、キー操作部が縮小されたり、ジョグダイヤル等の代用の入力装置を用いている。また、リモートコントローラ上に配設されたキーを入力装置としている。そこで、これらのCE機器に備えられるかな漢字変換装置及び/又は日本語ワードプロセッサは、縮小されたキー操作部や、ジョグダイヤル、リモートコントローラ上のキー等の入力装置によっても使用者の負担を軽減しながら読み文字列をかな漢字混じり文字列に変換する機能が期待される。
【0026】
図1は、第1の実施の形態のかな漢字変換装置10の機能ブロック図である。文字入力部11で構成された読みがなをかな漢字変換処理部12でかな漢字変換用辞書14およびユーザ学習辞書15の情報を用いてかな漢字変換処理をし、表示部13に候補を少なくとも一つ表示する。
【0027】
文字入力部11は例えばキーボード、タッチパネル、ジョグダイヤル等の入力デバイスにより構成され、ひらがな等の読み文字列を構成する処理を行うことができる装置である。
【0028】
かな漢字変換用辞書14は、入力された読み文字列をかな漢字変換するための情報を記録している。情報としては、単語と読みがなとの対応関係を記録している。この実施の形態では、かな漢字変換用辞書14は、一つであるが、複数であっても構わない。
【0029】
ユーザ学習辞書15は、かな漢字変換装置にてかな漢字変換用辞書14を用いてのユーザの入力・変換により学習された内容を記憶したり、ユーザが単語登録した単語を書き込む辞書である。この実施の形態では、かな漢字変換用辞書14に含まれる文字列の利用頻度情報も記録する。
【0030】
図2には、ユーザ学習辞書15の具体例(A)と、かな漢字変換用辞書14の具体例(B)を示す。ユーザ学習辞書15には、読み文字21とそれに対応する語句22が記述されている。また、ユーザ学習辞書15には、さらに、利用頻度情報23が記録されている。利用頻度情報23は、前述したように図2の(B)に示したかな漢字変換用辞書14に示す語句32の利用頻度を示す情報である。例えば、利用頻度情報23は、新しく使用したものほど番号を小さくなるようにしている。利用頻度情報23が「1」であるのは1回前に使用したことを示す。また、利用頻度情報23が「2」であるのは2回前に使用したことを示す。なお、利用頻度情報23は、対応する語句22(かな漢字変換用辞書の語句32に連動している)が使用される毎に更新される。この利用頻度情報は、過去に使用されたものの履歴情報としても記述することができる。また、これら利用頻度情報又は履歴情報は、かな漢字変換用辞書の語句が使用された回数を反映した値でもよい。例えば、「1」は一番多く使用され、「2」は二番目に使用されている、というようにである。また、回数をそのまま利用頻度情報としてもよい。
【0031】
かな漢字変換処理部12は、かな漢字変換用辞書14とユーザ学習辞書15を検索することで文字入力部11によって入力された読み文字列に対応する文字列候補を予測して抽出する。表示部13は例えば液晶表示装置よりなり、かな漢字変換処理部12によって文字列予測された少なくとも一つの予測文字列候補を表示する。
【0032】
例えば、文字入力部11より “お”が入力された場合、まずユーザ学習辞書15から、読み文字列が“お”で始まる候補を検索する。この結果、“音”と “音楽” が一致するので、表示部13にこれらの“音”、“音楽”という2つの候補が予測された文字列として表示されることになる。“音”の利用頻度情報23は「3」であり、3回前に使用したことを示し、“音楽”の利用頻度情報23は「4」であり、4回前に使用したことを示す。これらの“音”、“音楽”という2つの候補は、例えば予め利用頻度情報が「5」以下の語句を候補とするというような表示設定にしたがって表示される。もちろん、表示される順番は利用頻度情報の値に応じるようにする。
【0033】
利用頻度情報の表示設定は、CE機器の表示部の大きさなどに応じて変えることができる。例えば、図3に示すように、ユーザ学習辞書15には、“は”で始まる読み文字21に対応する利用頻度情報23が「1」乃至「5」までの語句22が記述されているとする。しかし、CE機器の表示部が3行までしかとれないものであるときには、予め利用頻度情報23が「3」以下を表示する設定とする。
ところで、候補の抽出には、必ず読み文字列がすべて一致している必要はなく、読み文字列の先頭が一致したものを候補として出力する。
【0034】
また、利用者は表示された候補が入力しようとしている候補である場合は、候補選択をすればよく、すべての読み文字列を入力することなく文字変換を行うことができる。
【0035】
入力しようとしている文字が表示されていないときには続けて、読み文字列を入力する。よみ文字列が組み立て直されるたびにユーザ学習辞書を検索するが、この処理において候補を抽出できなかった場合にはかな漢字変換用辞書14を検索する。
【0036】
例えば、かな漢字変換用辞書14には、前記図2の(B)のように記述されているとする。今、目的とする文字列が “音響”だったとき、“おんき”と入力された段階で、候補として “音響”が抽出され、表示部13に表示されることになる。
【0037】
そして、候補から利用者が“音響”を選択したとき、この文字列の情報をユーザ学習辞書15に登録する。この登録処理により、次回 “おんきょう”が入力されたときは読み文字列として “お”が入力されただけで、“音響”が候補として表示部13に表示されるため、ユーザは文字入力部13を用いて候補選択をするだけで“音響”という文字列を入力することができる。
【0038】
また、かな漢字変換用辞書検索を行うときにもすべての読み文字列が一致している文字列を抽出するのではなく、辞書に登録されている先頭の読み文字列と一致している文字列を候補として抽出する。
【0039】
そして、表示部13に表示された予測文字列候補の中から、文字入力部11に含まれる操作部や他の操作部を使用者が操作することによって所望の文字列が選択される。そして、所望の文字列の選択が繰り返されることにより日本語の文章が作成される。
【0040】
図4は、かな漢字変換装置10が表示部15に予測文字列候補を表示するまでの処理手順の第1具体例を示すフローチャートである。文字入力部11により読み文字列が入力される(ステップS1)と、かな漢字変換処理部12はユーザ学習辞書15を検索し、候補があるか否かを検出する(ステップS2)。よみ文字列が組み立て直されるたびにユーザ学習辞書15を検索する。ここでは、前記利用頻度情報23に応じた候補を検出することになる。候補があれば、ステップS4に進み、文字列候補を表示部13に表示する。もし、ステップS2にて候補がないと判定すれば、ステップS3に進んで、かな漢字変換用辞書14を検索する。候補があれば、文字列候補を表示部13に表示するが、候補がなければステップS1に戻って読み文字列の入力を待つ(促す)。
【0041】
ステップS3にてかな漢字変換用辞書検索を行うときにもすべての読み文字列が一致している文字列を抽出するのではなく、辞書に登録されている先頭の読み文字列と一致している文字列を候補として抽出する。
【0042】
次に、かな漢字変換装置10が表示部15に予測文字列候補を表示するまでの処理手順の第2具体例を図5のフローチャートを用いて説明する。
【0043】
文字入力部11からよみ文字列が入力されると(ステップS11)、ステップS12にて入力読み文字で始まる文字列で過去に利用された文字列をユーザ学習辞書15から通常検索する。ここで、候補が得られた場合はステップS16により表示部13に予測文字候補を表示する。
【0044】
ステップS12のユーザ学習辞書の通常検索にて候補が得られなかったときはステップS13にて、よみ文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加する曖昧検索を行う(ユーザ学習辞書曖昧検索)ことでユーザ学習辞書に記憶されている、文字列の読みに一致する文字列を抽出する。この処理により候補が得られた場合はステップS16により表示部13に予測文字候補を表示する。
【0045】
ステップS13のユーザ学習辞書曖昧検索にて候補が得られなかったときは、ステップS14にてかな漢字変換用辞書14の通常検索が行われる。このステップS14で、予測変換候補を抽出することができた(候補あり)ときにはステップS16により、表示部13に予測変換候補を表示する。
【0046】
ステップS14のかな漢字変換用辞書の通常検索にて候補が得られなかったときは、ステップS15にてかな漢字変換用辞書14を用いて曖昧検索が行われ、予測変換候補を抽出することができたときにはステップS16により、表示部13に予測変換候補を表示する。
【0047】
ステップS13、ステップS15にて行う曖昧検索は、例えば入力された読み文字列の一部の文字を他の文字へ置換することで一致する候補を抽出する処理である。置換する文字数は一文字以上で、読み文字列長を越えないものとする。この一致とは辞書に登録されている読み文字列の先頭の入力文字数分一致する候補を一致したと見なして良い。また、最初の一文字目が入力ミスをすることは少ないと捉えて、入力読み文字列の二文字目移行に対して、置き換えた読み文字列に一致すると判断してもかまわない。
【0048】
他の文字列に置き換える場合の方法として、例えば 「か」行の入力文字列は「か」行すべての読みがなである 「か、き、く、け、こ」 と一致したと判断してもよい。また、「ば」 等の濁音文字、「ぱ」等の半濁音文字を対応する静音文字である 「は」 と一致したと判断してもかまわない。同様に「ゃ」等の拗音や促音「っ」を小書きしない文字「や」や「つ」に一致させることに限定してもよい。この場合、CE機器のように入力キーが少ない機器では1つのキーに複数の読み文字列を割り当てることができ、入力キーの節約をすることができるという利点がある。
【0049】
また、曖昧検索として入力された読み文字列が入力が間違っている場合を救済するために、入力読み文字列に一文字追加することで一致する候補や一文字欠落させることで一致する候補を一致したとして判断することも許す。ここで入力文字列長により欠落させる数、追加する数を変化させることも可能とする。
【0050】
ここで、ステップS13やステップS15の辞書の曖昧検索処理は特に行わなくてもかまわない。また、ステップS13、ステップS14、ステップS15、ステップS16の処理を組み合わせて処理を行い、総合的に抽出された予測変換文字列をステップS16により表示部13に表示してもかまわない。
【0051】
また前記の手順により抽出される文字列候補数を押さえるために、辞書に登録された文字列の読み文字列長と入力よみ文字列長が同数または同数+Nと制限することで候補数の表示量を制限する機能を付加しても良い。これも、CE機器の表示部13の大きさに制限がある場合に有効である。
【0052】
例えば、図6に表示したユーザ学習辞書15の具体例を用いると、ステップS13のユーザ学習辞書通常検索において、(「たん」=2)+1と制限した場合には、表示部13には文字列長+1=3の“短歌”、“端部”、“箪笥”、“単位”、“短気”が利用頻度情報23の順番に候補として抽出される。表示部13には、これら5つの候補が表示されることになる。また、利用頻度情報23に3以下という条件を設定していれば、図中破線より上の3つの候補が表示される。
【0053】
なお、前記同数+Nにおいて、Nは1でなくてもよいのはもちろんであり、表示部の大きさの都合により、N=0,2,3・・・でもかまわない。
【0054】
ステップS16により予測変換候補が表示されたあとは、文字入力部11からの制御により予測変換候補を選択することができる。ここで、選択した文字列は、ユーザ学習辞書15に登録される。もちろん、既にユーザ学習辞書に登録されている文字列(語句)であれば前記利用頻度情報23が更新される。
【0055】
すなわち、図7に示すように、ステップS21にて予測変換候補から文字列が選択されると、ステップS22でユーザ学習辞書へ利用された文字列として記憶する。そして、ステップS22で記憶された文字列は図5のステップS12、13の処理において利用することができる。
【0056】
このように、図1に機能的な構成を示した第1の実施の形態のかな漢字変換装置10では、特別な予測変換用辞書は用いず、ユーザ学習辞書15を利用して、予測文字列の候補を抽出することができる。
【0057】
また、図4又は図5に示した具体例の処理手順を繰り返すことにより、ユーザ学習辞書をあたかもかな漢字変換用辞書のキャッシュのように働かせ、かな漢字変換用辞書を検索する頻度を下げることができる。
【0058】
個人が使う単語数は多くはないため、ある程度手順に示した作業を続けることでほぼユーザ学習辞書の検索だけで文字入力が可能となる。つまり全辞書検索する度合いが減り、検索時間が短縮されることになる。
【0059】
そして、従来技術では予測変換辞書を通常のかな漢字変換用字書とユーザ学習辞書と予測変換用字書は別に持っていたが、この第1の実施の形態により特別に予測変換辞書を持つ必要がなくなり、辞書記憶領域の節約になる。
【0060】
ここからは、本発明の第2の実施の形態について説明する。この第2の実施の形態も、図1に機能ブロックを示したようなかな漢字変換装置40である。文字入力部11で構成された読みがなをかな漢字変換処理部12でかな漢字変換用辞書14およびユーザ学習辞書15の情報を用いてかな漢字変換処理をし、表示部13に候補を表示する。
【0061】
かな漢字変換処理部12は1つ前に入力された文節の情報を記憶しておく記憶エリア(前文節記憶エリア)を有する。
【0062】
ユーザ学習辞書15内にはたとえば図8のように、以前連文節変換処理が行われた際に文節の切れ目や、接続関係を記憶する場所である文節間学習情報テーブルを有する。第一文節情報には変換文字列(かなを、今日は、品川区、ソニー、東京都)が記録されてなくても良い。この場合には変換次文字列を記録する場所の節約になるという利点がある。
【0063】
図9には、このかな漢字変換装置40の全体的な処理手順を示す。ステップS31にて文字入力部11から入力されるキーを読み込み読み文字列を生成する。また、以下の説明手順により表示部13に候補文字列が表示されている場合はステップS31において候補選択キーが入力される。
【0064】
ステップS32ではステップS31において読み文字列が生成された場合は(NO:候補選択キーが操作されない場合)には、ステップS34に進み、予測変換処理を行う。一方、表示部13に候補が表示されている場合でかつ候補選択キーがステップS31にて操作された場合にはステップS33にて候補選択処理を行う。この図9の処理手順は、ステップS33又はステップS34の各処理後またステップS31からの処理を繰り返すことになる。
【0065】
図10には、図9のステップS34における予測変換処理の詳細を示す。前記ステップS31にて読み文字列生成のためのキーが入力され(キー入力は、読み文字列作成のためのキー入力操作と、表示された候補文字列を選択するためのキー入力操作の2種類がある。)、読み文字列が生成される。
【0066】
ステップS42でかな漢字変換処理部12は、前文節が登録されていない状態であるかの判断を行う。ここで、前文節がある場合(登録されている、又は記憶されている)は、ステップS43にてユーザ学習辞書15内にある文節間学習情報テーブル(接続関係を記憶する場所)を参照し、次文節の候補を抽出する。
【0067】
たとえば文節間学習情報テーブルとして過去に学習されたデータより、図8のように学習されている場合、前文節として「品川区」が設定されていると、ステップS43では「北品川」が次文節として抽出される。ここで入力されている読み文字列が「きたしながわ」の先頭から数文字の場合にはステップS43の処理にて抽出される。
【0068】
また前文節がある場合にはステップS44において前文節の品詞情報に接続可能な付属語や接尾語や活用語尾の各テーブルを引き、接続可能な語を抽出する。
【0069】
一方、前文節がない場合又はステップS44の次に、ステップS45において一般的な単語予測処理又は前記第1の実施の形態で行った単語抽出を行う。
【0070】
ステップS46においてステップS43、ステップS44、ステップS45により抽出された文字列の有無を判断する。文字列がある場合にはその文字列を予測文字列として、ステップS47で表示部13へ表示する。
【0071】
次に、図11には図9のステップS33にて行われる候補選択処理の詳細を示す。この候補選択処理は、予測変換処理にて予測された候補が表示部13に表示されたのを受けて、図9のステップS32にて候補選択キーが操作されるか否かが判断された後に行われる。よって、図10のステップS47(予測変換処理の一部)により表示部13に予測変換文字列が表示されている候補群から、ステップS51により候補選択処理が行われる。
【0072】
そして、ステップS52により表示部13に表示されている候補文字列が選択決定した場合に、ステップS53でかな漢字変換処理部12に記憶されている前文節の有無が判断される。もし前文節が記憶されている場合にはステップS54で前記図8のような形式でユーザ学習辞書15に二文節間情報が記録される。
【0073】
単語予測処理として前記第1の実施の形態を利用する場合には、前記図7の処理手順により選択された単語の単語辞書学習を行う。
【0074】
次にステップS55にて選択された文字列を前文節としてかな漢字変換処理部12に記録する。ステップS56では図10の手順により決定された文節に接続する文字列を第一文節として次文節の抽出作業を行う。この作業により文字列が抽出された際にはステップS57において次文節の候補として表示部13に表示を行う。
【0075】
ステップS53からステップS55の文節間学習と前文節情報の記録作業および単語辞書学習の順番を変えてもかまわない。また、ステップS44で抽出された文字列が選択決定された際には、ステップS53とステップS54を行わず、ステップS55の処理として前文節に文字列の追加を行うことで1つの文節に合成して自立語として取り扱うことができるため、文字列合成処理をするだけでもかまわない。
【0076】
したがって、この第2の実施の形態のかな漢字変換装置40では、前文節があれば読み文字列を入力することなく、利用者に提示する次文節の文字列から選択処理を繰り返すことで日本語文章を組み立てることが出来るようになる。
【0077】
また、従来技術では次文節予測変換を行うために通常のかな漢字変換用字書とユーザ学習辞書と次文節情報辞書は別に持っていたが、この第2の実施の形態では、特別に次文節予測変換辞書を持つ必要がなくなり、辞書記憶領域の節約になる。
【0078】
ここからは、本発明の第3の実施の形態について説明する。この第3の実施の形態も、図1に機能ブロックを示したようなかな漢字変換装置50である。文字入力部11で構成された読みがなをかな漢字変換処理部12でかな漢字変換用辞書14およびユーザ学習辞書15の情報を用いてかな漢字変換処理をし、表示部13に候補を表示する。
【0079】
かな漢字変換処理部12には図12に示す変換候補52とそのタグ(ID)51と変換候補の読み文字列52を保持しておく記憶エリアを有する。読み文字列を保持する場所はかな漢字変換用辞書等の漢字文字列情報が記憶されている装置や位置を指し示す目印(ポインター)でもよい。
【0080】
この場合、読み文字列の全情報を保持しておく必要がないため読みデータを保持しておくメモリ資源の節約になる。また読み文字列を指し示す目印を前述のタグに含めてしまってもかまわない。
【0081】
氏名の入力欄およびその読みがなを入力するシステムを例に処理手順を説明する。想定するシステムは図13の61のように氏名の読み文字列を入力する欄62と、氏名を入力する欄63と、予測変換文字列候補を表示するエリア64を有する。
【0082】
文字入力部11により文字が入力された場合、図14のステップS61(予測変換候補抽出処理)でかな漢字変換処理部12において予測変換候補の抽出処理が行われる。
【0083】
文字入力部13から「わ」を入力した際に得られた候補例が図12に示すようなものであった場合、予測変換候補には候補文字列52とそれに対応したタグ51を付加しておく。タグ51は候補文字列52が特定できる形態であれば構造は問わない。
【0084】
予測変換候補52およびそのタグ51の対をテーブルとしてかな漢字変換処理部12の記憶エリアに保存しておく。また候補文字列抽出時に変換候補文字列と同時にかな漢字変換用辞書14より読み文字列情報53を抽出しておきテーブル(かな漢字変換処理部12内)に記録しておく。
【0085】
入力された文字列「わ」は読み文字列表示エリア62に、得られた候補文字列は表示エリア64に表示される。
【0086】
そして、図14のステップS62の候補手順(候補選択)により候補エリア64に表示されている候補のうち目的とする文字列「若松」を選択する。選択処理が行われると氏名表示エリア66には選択した候補文字列が表示される。
【0087】
ステップS63で、読み文字列が必要の有無が判断される。この手順において読み文字列が特に必要としていないアプリケーションであれば処理が終了する。
【0088】
例として仮定しているアプリケーションでは読み文字列を必要とするため、ステップS64で、選択された文字列のタグをかな漢字変換処理部12に送る。かな漢字変換処理部12ではステップS61で保持したデータテーブルと照合することで、元の読み文字列を抽出する。
【0089】
そして、ステップS65にて、抽出された読み文字列53を読み入力部68に表示する。
【0090】
このように、この第3の実施の形態のかな漢字変換装置50によれば、日本語かな漢字変換システムにおいて予測変換を利用している場合であっても変換文字列の正しい読み文字列を取得することができるようになる。
【0091】
なお、第1,第2,第3の実施の形態の、かな漢字変換装置10,40,50は、例えば内部バスを介してCPUにROM、RAM、HDD、文字入力部、表示部、通信インターフェースを接続した構成とされる。この構成は、CE機器にあってコンピュータシステムをなす。このコンピュータシステムが、例えばROM、或いはHDDに格納された、本発明の各かな漢字変換プログラムをRAMをワークエリアとして逐次実行することによってかな漢字変換装置の機能を持つことになる。各かな漢字変換プログラムは、本発明の各かな漢字変換方法に基づいて各手順を構成している。
【0092】
【発明の効果】
本発明によれば、かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムにあって、特別に予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができる。
【0093】
また、本発明によれば、かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムにあって、特別に次文節予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができる。
【0094】
また、本発明によれば、かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムにあって、日本語かな漢字変換システムにおいて予測変換を利用している場合であっても変換文字列の正しい読み文字列を取得することができる。
【図面の簡単な説明】
【図1】第1〜第3の実施の形態のかな漢字変換装置10、40、50の機能ブロック図である。
【図2】ユーザ学習辞書15の具体例(A)と、かな漢字変換用辞書14の具体例(B)を示す図である。
【図3】ユーザ学習辞書15の他の具体例を示す図である。
【図4】かな漢字変換装置10が表示部15に予測文字列候補を表示するまでの処理手順の第1具体例を示すフローチャートである。
【図5】かな漢字変換装置10が表示部15に予測文字列候補を表示するまでの処理手順の第2具体例を示すフローチャートである。
【図6】ユーザ学習辞書のさらに他の具体例を示す図である。
【図7】予測変換候補を選択することで、選択した文字列をユーザ学習辞書に登録する処理手順を示すフローチャートである。
【図8】文節間学習情報テーブルの具体例を示す図である。
【図9】第2の実施の形態のかな漢字変換装置の全体的な処理手順を示すフローチャートである。
【図10】前記図9のステップS34における予測変換処理の詳細を示すフローチャートである。
【図11】図9のステップS33にて行われる候補選択処理の詳細を示すフローチャートである。
【図12】第3の実施の形態のかな漢字変換装置で用いる、変換候補52とそのタグ(ID)51と変換候補の読み文字列52を保持しておく記憶エリアを示す図である。
【図13】氏名の入力欄およびその読みがなを入力するシステムを想定したときの処理手順を説明するための図である。
【図14】第3の実施の形態のかな漢字変換装置の全体的な処理手順を説明するためのフローチャートである。
【符号の説明】
10,40,50 かな漢字変換装置、11 文字入力部、12 かな漢字変換処理部、13 表示部、14 かな漢字変換用辞書、15 ユーザ学習辞書
Claims (9)
- 入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、
前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書と、
前記入力された読み文字列を前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索する文字列予測手段と、
前記文字列予測手段により抽出された少なくとも一つの予測文字列候補を表示する表示手段とを備え、
前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させ、
前記文字列予測手段は、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する
かな漢字変換装置。 - 前記文字列予測手段は、前記ユーザ学習辞書及び/又はかな漢字変換用辞書に登録された文字列の読み文字列長を、前記入力読み文字列長と同数または前記入力読み文字列長と同数+Nに制限して予測文字列候補を抽出する請求項1記載のかな漢字変換装置。
- 前記文字列予測手段は、前記表示手段における表示可能文字列数に基づいて設定された表示個数に応じて前記予測文字列候補を抽出する請求項1記載のかな漢字変換装置。
- 前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させることで所望の文書を作成する日本語文書作成装置に適用される請求項1記載のかな漢字変換装置。
- 入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書とを、文字列予測手段が、前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索することで前記入力された読み文字列の変換文字列を予測する文字列予測工程と、
前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示処理手段が表示部に表示する表示工程とを備え、
前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させ、
前記文字列予測工程では、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する
かな漢字変換方法。 - 前記文字列予測工程では、前記文字列予測手段が、前記ユーザ学習辞書及び/又はかな漢字変換用辞書に登録された文字列の読み文字列長を、前記入力読み文字列長と同数または前記入力読み文字列長と同数+Nに制限して予測文字列候補を抽出する請求項5記載のかな漢字変換方法。
- 前記文字列予測工程では、前記文字列予測手段が、前記表示工程における表示可能文字列数に基づいて設定された表示個数に応じて前記予測文字列候補を抽出する請求項5記載のかな漢字変換方法。
- 前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させることで所望の文書を作成する日本語文書作成装置に適用される請求項5記載のかな漢字変換方法。
- 入力された読み文字列についてかな漢字変換を行うかな漢字変換装置によって実行されるかな漢字変換をコンピュータに実行させるためのかな漢字変換プログラムにおいて、
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書とを、コンピュータの文字列予測機能部が、前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索することで前記入力された読み文字列の変換文字列を予測する文字列予測工程と、
コンピュータが、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程とを備え、
前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させ、
前記文字列予測工程では、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する
かな漢字変換プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003110837A JP4251000B2 (ja) | 2003-04-15 | 2003-04-15 | かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003110837A JP4251000B2 (ja) | 2003-04-15 | 2003-04-15 | かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008194073A Division JP2008287736A (ja) | 2008-07-28 | 2008-07-28 | かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004318441A JP2004318441A (ja) | 2004-11-11 |
JP4251000B2 true JP4251000B2 (ja) | 2009-04-08 |
Family
ID=33471580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003110837A Expired - Fee Related JP4251000B2 (ja) | 2003-04-15 | 2003-04-15 | かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4251000B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4771731B2 (ja) * | 2005-04-15 | 2011-09-14 | ソニー・エリクソン・モバイルコミュニケーションズ株式会社 | 文字入力装置、携帯端末装置及び文字入力処理プログラム |
JP2007164278A (ja) * | 2005-12-09 | 2007-06-28 | Nec Corp | 日本語処理装置、日本語処理方法及び日本語処理用プログラム |
JP2007299217A (ja) * | 2006-04-28 | 2007-11-15 | Toshiba Corp | 映像記録装置 |
JP5045181B2 (ja) * | 2007-03-27 | 2012-10-10 | 富士通モバイルコミュニケーションズ株式会社 | 文字入力装置および文字入力プログラム |
JP2009048348A (ja) * | 2007-08-17 | 2009-03-05 | Sony Corp | 情報処理装置、文字情報の候補の検索方法および文字情報の候補の検索プログラム |
JP5540756B2 (ja) * | 2010-02-16 | 2014-07-02 | 富士通モバイルコミュニケーションズ株式会社 | 携帯端末 |
-
2003
- 2003-04-15 JP JP2003110837A patent/JP4251000B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004318441A (ja) | 2004-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5372148B2 (ja) | モバイルデバイス上で日本語テキストを処理する方法およびシステム | |
JP5309480B2 (ja) | 文字列入力装置、文字列入力方法およびプログラム | |
JP2010257392A (ja) | 文字入力装置、文字入力方法、コンピュータ読取可能なプログラムおよび記録媒体 | |
JP4251000B2 (ja) | かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム | |
JPH08314910A (ja) | 異種コード文字列転記装置および電子辞書 | |
JP2012098891A (ja) | 情報処理システムおよび情報処理方法 | |
JP3290451B2 (ja) | 電子辞書 | |
JP2009140152A (ja) | 文字入力装置、文字・文字種の選択方法 | |
TW200947241A (en) | Database indexing algorithm and method and system for database searching using the same | |
JP5024335B2 (ja) | 情報表示制御装置および情報表示制御プログラム | |
JP4341514B2 (ja) | 辞書情報表示制御装置および辞書情報表示制御プログラム | |
JP4492499B2 (ja) | 情報表示制御装置および情報表示制御プログラム | |
JP2008287736A (ja) | かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム | |
JP5442212B2 (ja) | 電子機器 | |
JP4449539B2 (ja) | 情報表示制御装置及び情報表示制御プログラム | |
KR100320045B1 (ko) | 한글 인명의 초성자음을 검색어로 하는 한글 데이터베이스를 운 | |
KR20020059555A (ko) | 자연어 질의 응답 검색 엔진 및 검색 방법 | |
JP7200474B2 (ja) | 変換補助装置、変換補助システム、変換補助方法及びコンピュータプログラム | |
US20070033173A1 (en) | Method and apparatus for data search with error tolerance | |
JP2024017326A (ja) | 検索装置、検索方法およびプログラム | |
JP2002049616A (ja) | かな漢字変換装置及びかな漢字変換方法 | |
JP5523280B2 (ja) | 入力支援装置 | |
JP2675298B2 (ja) | 情報処理装置 | |
JP4051369B2 (ja) | 字句をデータに変換する装置、方法及びプログラム | |
JP2008293254A (ja) | データベースふりがな検索システムにおける文字入力方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060414 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080527 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080728 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080916 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081117 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20081202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081224 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090106 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120130 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130130 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |