JP2004318441A - System, method, and processor for kana-kanji conversion - Google Patents
System, method, and processor for kana-kanji conversion Download PDFInfo
- Publication number
- JP2004318441A JP2004318441A JP2003110837A JP2003110837A JP2004318441A JP 2004318441 A JP2004318441 A JP 2004318441A JP 2003110837 A JP2003110837 A JP 2003110837A JP 2003110837 A JP2003110837 A JP 2003110837A JP 2004318441 A JP2004318441 A JP 2004318441A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- kana
- kanji conversion
- dictionary
- kanji
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、操作キーやタッチパッド等の入力手段を用いて入力された読み文字列についてかな漢字変換を行うかな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムに関する。
【0002】
【従来の技術】
従来の日本語かな漢字変換システムの一手法として、特開平11−39300号公報にて開示されたように先頭の一文字あるいは先頭から数文字の読み文字列を入力することで予測辞書検索を行い、入力しようとする文字の全読みを入力することなく文字入力を行う手法がある。
【0003】
また、従来の日本語かな漢字変換システムにおいては、読み文字を入力すると、文字列を予測し、不完全な読み文字列でもかな漢字変換して利用者へ提示する単語予測変換の手法が知られている。さらに、一つの単語が入力された際に、次に入力するであろう文字列を予測する手法として 特開平9−274613号公報にて開示されたように前文節として入力された自立語との接続規則表を基に付属語を次に入力されるであろう文字列として提示する次文字列予測手法がある。
【0004】
【特許文献1】
特開平11−39300号
【特許文献2】
特開平9−274613号
【0005】
【発明が解決しようとする課題】
しかし、前記特許文献1に記載の従来の予測変換システムにおいてはかな漢字変換用辞書とユーザ学習辞書の他に予測用辞書を持たせているため、予測変換システムを備えていない通常のかな漢字変換システムに比べて多くの辞書記憶領域を必要とするという問題があった。
【0006】
また、前記特許文献2に記載の従来の文字列予測手法では文章を組み立てることまでは行うことが出来ないという問題があった。
【0007】
また、前述した日本語かな漢字変換システムにおける予測変換機能は、目的とする文字列の全読みを入力することなく、かな漢字混じり文字列を構成する手法であり、このため、入力した読み文字列は、選択した予測変換候補文字列の正確な読みである可能性が非常に低い。たとえば住所入力欄において変換文字列およびその読み文字列を入力する場合、利用者の便宜を図り、かな漢字変換システムを利用して入力された読み文字列と変換された文字列を2つの欄に記入する際、予測変換を利用した入力システムでは読み文字列が不完全であるため、読みの欄は再入力を強いられ、結局は全読み文字列を入力することになってしまうという問題があった。
【0008】
本発明は、前記実情に鑑みてなされたものであり、特別に予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができるかな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムの提供を目的とする。
【0009】
また、本発明は、前記実情に鑑みてなされたものであり、特別に次文節予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができるかな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムの提供を目的とする。
【0010】
また、本発明は、前記実情に鑑みてなされたものであり、日本語かな漢字変換システムにおいて予測変換を利用している場合であっても変換文字列の正しい読み文字列を取得することができる日本語かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムの提供を目的とする。
【0011】
【課題を解決するための手段】
本発明に係るかな漢字変換装置は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を記録するためのユーザ学習辞書と、前記入力された読み文字列を前記かな漢字変換用字書と前記ユーザ学習辞書を検索することで文字列予測する文字列予測手段と、前記文字列予測手段により抽出された少なくとも一つの予測文字列候補を表示する表示手段とを備え、前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させる。
【0012】
本発明に係るかな漢字変換方法は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を記録するためのユーザ学習辞書とを検索することで前記入力された読み文字列の変換文字列を予測する文字列予測工程と、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程とを備える。
【0013】
本発明に係るかな漢字変換プログラムは、前記課題を解決するめに、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置によって実行されるかな漢字変換プログラムにおいて、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を記録するためのユーザ学習辞書とを検索することで前記入力された文字列を予測する文字列予測工程と、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程とを備える。
【0014】
本発明によれば、ユーザ学習辞書があたかもかな漢字変換用辞書のキャッシュのように働き、使えば使うほどかな漢字変換用辞書を検索する頻度が下がることとなる。また、個人が使う単語数は多くはないため、ある程度手順に示した作業を続けることでほぼユーザ学習辞書の検索だけで文字入力が可能となる。つまり全辞書検索する度合いが減り、検索時間が短縮される。
【0015】
本発明に係るかな漢字変換装置は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書と、入力された読み文字列を前記かな漢字変換用辞書とユーザ学習辞書を検索することで文字列予測する文字列予測手段と、前記文字列予測手段により抽出された少なくとも一つの予測文字列候補を表示する表示手段とを備え、前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させる。
【0016】
また、本発明に係るかな漢字変換方法は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書とを検索することで前記入力された読み文字列の変換文字列候補を予測する文字列予測工程と、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程とを備える。
【0017】
また、本発明に係るかな漢字変換プログラムは、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置に実行されるかな漢字変換プログラムにおいて、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書とを検索することで前記入力された読み文字列の変換文字列候補を予測する文字列予測工程と、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程とを備える。
【0018】
本発明によれば、前文節があれば読み文字列を入力することなく、利用者に提示する次文節の文字列から選択処理を繰り返すことで日本語文章を組み立てることが出来るようになる。
【0019】
本発明に係るかな漢字変換装置は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、入力された読み文字列が不完全であっても変換文字列を予測する文字列予測手段と、入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書と、前記文字列予測手段によって予測された変換文字列から読み文字列を復元する読み文字列復元手段とを備える。
【0020】
また、本発明に係るかな漢字変換方法は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、入力された読み文字列が不完全であっても変換文字列を予測する文字列予測工程と、入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書を用い、前記文字列予測工程によって予測された変換文字列の読み文字列を復元する読み文字列復元工程とを備える。
【0021】
また、本発明に係るかな漢字変換プログラムは、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置に実行されるかな漢字変換プログラムにおいて、入力された読み文字列が不完全であっても変換文字列を予測する文字列予測工程と、入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書を用い、前記文字列予測工程によって予測された変換文字列の読み文字列を復元する読み文字列復元工程とを備える。
【0022】
【発明の実施の形態】
以下、本発明のいくつかの実施の形態について図面を参照しながら説明する。第1の実施の形態は、キーボードやリモコンなどの入力装置から入力されたかな文字を漢字かな混じり文字列へ変換するかな漢字変換装置である。
【0023】
かな漢字変換装置は、OS(オペレーティングシステム)やアプリケーションへの日本語を入力するためのかな漢字変換ソフトを実行する装置である。かな漢字変換ソフトは、日本語入力システム、日本語プロセッサともいう。このかな漢字変換装置をアプリケーションの一つである日本語文章作成装置(日本語ワードプロセッサ:Word Processor)に内蔵することにより文書の作成、編集等が可能となる。
【0024】
このようなかな漢字変換装置及び/又は日本語ワードプロセッサは、最近、携帯電話、携帯情報端末(PDA)、携帯型パーソナルコンピュータ、ビデオカメラ、デジタルスチルカメラ或いはテレビジョン受像機等、いわゆる民生用電子機器(consumer electronics:CE)にアプリケーションとして備えられるようになった。これらのCE機器は、インターネット等のネットワークと接続され、ネットワークを通して文字情報を通信する機能を備えるようになったり、或いは住所登録や、メモ書き、さらにはタイトル、曲名、演奏者、出演者等の記録や検索をする機能を備えるようになったためである。
【0025】
これらのCE機器は、携帯型であったり、あるいは筐体本体の小型化のために、キー操作部が縮小されたり、ジョグダイヤル等の代用の入力装置を用いている。また、リモートコントローラ上に配設されたキーを入力装置としている。そこで、これらのCE機器に備えられるかな漢字変換装置及び/又は日本語ワードプロセッサは、縮小されたキー操作部や、ジョグダイヤル、リモートコントローラ上のキー等の入力装置によっても使用者の負担を軽減しながら読み文字列をかな漢字混じり文字列に変換する機能が期待される。
【0026】
図1は、第1の実施の形態のかな漢字変換装置10の機能ブロック図である。文字入力部11で構成された読みがなをかな漢字変換処理部12でかな漢字変換用辞書14およびユーザ学習辞書15の情報を用いてかな漢字変換処理をし、表示部13に候補を少なくとも一つ表示する。
【0027】
文字入力部11は例えばキーボード、タッチパネル、ジョグダイヤル等の入力デバイスにより構成され、ひらがな等の読み文字列を構成する処理を行うことができる装置である。
【0028】
かな漢字変換用辞書14は、入力された読み文字列をかな漢字変換するための情報を記録している。情報としては、単語と読みがなとの対応関係を記録している。この実施の形態では、かな漢字変換用辞書14は、一つであるが、複数であっても構わない。
【0029】
ユーザ学習辞書15は、かな漢字変換装置にてかな漢字変換用辞書14を用いてのユーザの入力・変換により学習された内容を記憶したり、ユーザが単語登録した単語を書き込む辞書である。この実施の形態では、かな漢字変換用辞書14に含まれる文字列の利用頻度情報も記録する。
【0030】
図2には、ユーザ学習辞書15の具体例(A)と、かな漢字変換用辞書14の具体例(B)を示す。ユーザ学習辞書15には、読み文字21とそれに対応する語句22が記述されている。また、ユーザ学習辞書15には、さらに、利用頻度情報23が記録されている。利用頻度情報23は、前述したように図2の(B)に示したかな漢字変換用辞書14に示す語句32の利用頻度を示す情報である。例えば、利用頻度情報23は、新しく使用したものほど番号を小さくなるようにしている。利用頻度情報23が「1」であるのは1回前に使用したことを示す。また、利用頻度情報23が「2」であるのは2回前に使用したことを示す。なお、利用頻度情報23は、対応する語句22(かな漢字変換用辞書の語句32に連動している)が使用される毎に更新される。この利用頻度情報は、過去に使用されたものの履歴情報としても記述することができる。また、これら利用頻度情報又は履歴情報は、かな漢字変換用辞書の語句が使用された回数を反映した値でもよい。例えば、「1」は一番多く使用され、「2」は二番目に使用されている、というようにである。また、回数をそのまま利用頻度情報としてもよい。
【0031】
かな漢字変換処理部12は、かな漢字変換用辞書14とユーザ学習辞書15を検索することで文字入力部11によって入力された読み文字列に対応する文字列候補を予測して抽出する。表示部13は例えば液晶表示装置よりなり、かな漢字変換処理部12によって文字列予測された少なくとも一つの予測文字列候補を表示する。
【0032】
例えば、文字入力部11より “お”が入力された場合、まずユーザ学習辞書15から、読み文字列が“お”で始まる候補を検索する。この結果、“音”と “音楽” が一致するので、表示部13にこれらの“音”、“音楽”という2つの候補が予測された文字列として表示されることになる。“音”の利用頻度情報23は「3」であり、3回前に使用したことを示し、“音楽”の利用頻度情報23は「4」であり、4回前に使用したことを示す。これらの“音”、“音楽”という2つの候補は、例えば予め利用頻度情報が「5」以下の語句を候補とするというような表示設定にしたがって表示される。もちろん、表示される順番は利用頻度情報の値に応じるようにする。
【0033】
利用頻度情報の表示設定は、CE機器の表示部の大きさなどに応じて変えることができる。例えば、図3に示すように、ユーザ学習辞書15には、“は”で始まる読み文字21に対応する利用頻度情報23が「1」乃至「5」までの語句22が記述されているとする。しかし、CE機器の表示部が3行までしかとれないものであるときには、予め利用頻度情報23が「3」以下を表示する設定とする。
ところで、候補の抽出には、必ず読み文字列がすべて一致している必要はなく、読み文字列の先頭が一致したものを候補として出力する。
【0034】
また、利用者は表示された候補が入力しようとしている候補である場合は、候補選択をすればよく、すべての読み文字列を入力することなく文字変換を行うことができる。
【0035】
入力しようとしている文字が表示されていないときには続けて、読み文字列を入力する。よみ文字列が組み立て直されるたびにユーザ学習辞書を検索するが、この処理において候補を抽出できなかった場合にはかな漢字変換用辞書14を検索する。
【0036】
例えば、かな漢字変換用辞書14には、前記図2の(B)のように記述されているとする。今、目的とする文字列が “音響”だったとき、“おんき”と入力された段階で、候補として “音響”が抽出され、表示部13に表示されることになる。
【0037】
そして、候補から利用者が“音響”を選択したとき、この文字列の情報をユーザ学習辞書15に登録する。この登録処理により、次回 “おんきょう”が入力されたときは読み文字列として “お”が入力されただけで、“音響”が候補として表示部13に表示されるため、ユーザは文字入力部13を用いて候補選択をするだけで“音響”という文字列を入力することができる。
【0038】
また、かな漢字変換用辞書検索を行うときにもすべての読み文字列が一致している文字列を抽出するのではなく、辞書に登録されている先頭の読み文字列と一致している文字列を候補として抽出する。
【0039】
そして、表示部13に表示された予測文字列候補の中から、文字入力部11に含まれる操作部や他の操作部を使用者が操作することによって所望の文字列が選択される。そして、所望の文字列の選択が繰り返されることにより日本語の文章が作成される。
【0040】
図4は、かな漢字変換装置10が表示部15に予測文字列候補を表示するまでの処理手順の第1具体例を示すフローチャートである。文字入力部11により読み文字列が入力される(ステップS1)と、かな漢字変換処理部12はユーザ学習辞書15を検索し、候補があるか否かを検出する(ステップS2)。よみ文字列が組み立て直されるたびにユーザ学習辞書15を検索する。ここでは、前記利用頻度情報23に応じた候補を検出することになる。候補があれば、ステップS4に進み、文字列候補を表示部13に表示する。もし、ステップS2にて候補がないと判定すれば、ステップS3に進んで、かな漢字変換用辞書14を検索する。候補があれば、文字列候補を表示部13に表示するが、候補がなければステップS1に戻って読み文字列の入力を待つ(促す)。
【0041】
ステップS3にてかな漢字変換用辞書検索を行うときにもすべての読み文字列が一致している文字列を抽出するのではなく、辞書に登録されている先頭の読み文字列と一致している文字列を候補として抽出する。
【0042】
次に、かな漢字変換装置10が表示部15に予測文字列候補を表示するまでの処理手順の第2具体例を図5のフローチャートを用いて説明する。
【0043】
文字入力部11からよみ文字列が入力されると(ステップS11)、ステップS12にて入力読み文字で始まる文字列で過去に利用された文字列をユーザ学習辞書15から通常検索する。ここで、候補が得られた場合はステップS16により表示部13に予測文字候補を表示する。
【0044】
ステップS12のユーザ学習辞書の通常検索にて候補が得られなかったときはステップS13にて、よみ文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加する曖昧検索を行う(ユーザ学習辞書曖昧検索)ことでユーザ学習辞書に記憶されている、文字列の読みに一致する文字列を抽出する。この処理により候補が得られた場合はステップS16により表示部13に予測文字候補を表示する。
【0045】
ステップS13のユーザ学習辞書曖昧検索にて候補が得られなかったときは、ステップS14にてかな漢字変換用辞書14の通常検索が行われる。このステップS14で、予測変換候補を抽出することができた(候補あり)ときにはステップS16により、表示部13に予測変換候補を表示する。
【0046】
ステップS14のかな漢字変換用辞書の通常検索にて候補が得られなかったときは、ステップS15にてかな漢字変換用辞書14を用いて曖昧検索が行われ、予測変換候補を抽出することができたときにはステップS16により、表示部13に予測変換候補を表示する。
【0047】
ステップS13、ステップS15にて行う曖昧検索は、例えば入力された読み文字列の一部の文字を他の文字へ置換することで一致する候補を抽出する処理である。置換する文字数は一文字以上で、読み文字列長を越えないものとする。この一致とは辞書に登録されている読み文字列の先頭の入力文字数分一致する候補を一致したと見なして良い。また、最初の一文字目が入力ミスをすることは少ないと捉えて、入力読み文字列の二文字目移行に対して、置き換えた読み文字列に一致すると判断してもかまわない。
【0048】
他の文字列に置き換える場合の方法として、例えば 「か」行の入力文字列は「か」行すべての読みがなである 「か、き、く、け、こ」 と一致したと判断してもよい。また、「ば」 等の濁音文字、「ぱ」等の半濁音文字を対応する静音文字である 「は」 と一致したと判断してもかまわない。同様に「ゃ」等の拗音や促音「っ」を小書きしない文字「や」や「つ」に一致させることに限定してもよい。この場合、CE機器のように入力キーが少ない機器では1つのキーに複数の読み文字列を割り当てることができ、入力キーの節約をすることができるという利点がある。
【0049】
また、曖昧検索として入力された読み文字列が入力が間違っている場合を救済するために、入力読み文字列に一文字追加することで一致する候補や一文字欠落させることで一致する候補を一致したとして判断することも許す。ここで入力文字列長により欠落させる数、追加する数を変化させることも可能とする。
【0050】
ここで、ステップS13やステップS15の辞書の曖昧検索処理は特に行わなくてもかまわない。また、ステップS13、ステップS14、ステップS15、ステップS16の処理を組み合わせて処理を行い、総合的に抽出された予測変換文字列をステップS16により表示部13に表示してもかまわない。
【0051】
また前記の手順により抽出される文字列候補数を押さえるために、辞書に登録された文字列の読み文字列長と入力よみ文字列長が同数または同数+Nと制限することで候補数の表示量を制限する機能を付加しても良い。これも、CE機器の表示部13の大きさに制限がある場合に有効である。
【0052】
例えば、図6に表示したユーザ学習辞書15の具体例を用いると、ステップS13のユーザ学習辞書通常検索において、(「たん」=2)+1と制限した場合には、表示部13には文字列長+1=3の“短歌”、“端部”、“箪笥”、“単位”、“短気”が利用頻度情報23の順番に候補として抽出される。表示部13には、これら5つの候補が表示されることになる。また、利用頻度情報23に3以下という条件を設定していれば、図中破線より上の3つの候補が表示される。
【0053】
なお、前記同数+Nにおいて、Nは1でなくてもよいのはもちろんであり、表示部の大きさの都合により、N=0,2,3・・・でもかまわない。
【0054】
ステップS16により予測変換候補が表示されたあとは、文字入力部11からの制御により予測変換候補を選択することができる。ここで、選択した文字列は、ユーザ学習辞書15に登録される。もちろん、既にユーザ学習辞書に登録されている文字列(語句)であれば前記利用頻度情報23が更新される。
【0055】
すなわち、図7に示すように、ステップS21にて予測変換候補から文字列が選択されると、ステップS22でユーザ学習辞書へ利用された文字列として記憶する。そして、ステップS22で記憶された文字列は図5のステップS12、13の処理において利用することができる。
【0056】
このように、図1に機能的な構成を示した第1の実施の形態のかな漢字変換装置10では、特別な予測変換用辞書は用いず、ユーザ学習辞書15を利用して、予測文字列の候補を抽出することができる。
【0057】
また、図4又は図5に示した具体例の処理手順を繰り返すことにより、ユーザ学習辞書をあたかもかな漢字変換用辞書のキャッシュのように働かせ、かな漢字変換用辞書を検索する頻度を下げることができる。
【0058】
個人が使う単語数は多くはないため、ある程度手順に示した作業を続けることでほぼユーザ学習辞書の検索だけで文字入力が可能となる。つまり全辞書検索する度合いが減り、検索時間が短縮されることになる。
【0059】
そして、従来技術では予測変換辞書を通常のかな漢字変換用字書とユーザ学習辞書と予測変換用字書は別に持っていたが、この第1の実施の形態により特別に予測変換辞書を持つ必要がなくなり、辞書記憶領域の節約になる。
【0060】
ここからは、本発明の第2の実施の形態について説明する。この第2の実施の形態も、図1に機能ブロックを示したようなかな漢字変換装置40である。文字入力部11で構成された読みがなをかな漢字変換処理部12でかな漢字変換用辞書14およびユーザ学習辞書15の情報を用いてかな漢字変換処理をし、表示部13に候補を表示する。
【0061】
かな漢字変換処理部12は1つ前に入力された文節の情報を記憶しておく記憶エリア(前文節記憶エリア)を有する。
【0062】
ユーザ学習辞書15内にはたとえば図8のように、以前連文節変換処理が行われた際に文節の切れ目や、接続関係を記憶する場所である文節間学習情報テーブルを有する。第一文節情報には変換文字列(かなを、今日は、品川区、ソニー、東京都)が記録されてなくても良い。この場合には変換次文字列を記録する場所の節約になるという利点がある。
【0063】
図9には、このかな漢字変換装置40の全体的な処理手順を示す。ステップS31にて文字入力部11から入力されるキーを読み込み読み文字列を生成する。また、以下の説明手順により表示部13に候補文字列が表示されている場合はステップS31において候補選択キーが入力される。
【0064】
ステップS32ではステップS31において読み文字列が生成された場合は(NO:候補選択キーが操作されない場合)には、ステップS34に進み、予測変換処理を行う。一方、表示部13に候補が表示されている場合でかつ候補選択キーがステップS31にて操作された場合にはステップS33にて候補選択処理を行う。この図9の処理手順は、ステップS33又はステップS34の各処理後またステップS31からの処理を繰り返すことになる。
【0065】
図10には、図9のステップS34における予測変換処理の詳細を示す。前記ステップS31にて読み文字列生成のためのキーが入力され(キー入力は、読み文字列作成のためのキー入力操作と、表示された候補文字列を選択するためのキー入力操作の2種類がある。)、読み文字列が生成される。
【0066】
ステップS42でかな漢字変換処理部12は、前文節が登録されていない状態であるかの判断を行う。ここで、前文節がある場合(登録されている、又は記憶されている)は、ステップS43にてユーザ学習辞書15内にある文節間学習情報テーブル(接続関係を記憶する場所)を参照し、次文節の候補を抽出する。
【0067】
たとえば文節間学習情報テーブルとして過去に学習されたデータより、図8のように学習されている場合、前文節として「品川区」が設定されていると、ステップS43では「北品川」が次文節として抽出される。ここで入力されている読み文字列が「きたしながわ」の先頭から数文字の場合にはステップS43の処理にて抽出される。
【0068】
また前文節がある場合にはステップS44において前文節の品詞情報に接続可能な付属語や接尾語や活用語尾の各テーブルを引き、接続可能な語を抽出する。
【0069】
一方、前文節がない場合又はステップS44の次に、ステップS45において一般的な単語予測処理又は前記第1の実施の形態で行った単語抽出を行う。
【0070】
ステップS46においてステップS43、ステップS44、ステップS45により抽出された文字列の有無を判断する。文字列がある場合にはその文字列を予測文字列として、ステップS47で表示部13へ表示する。
【0071】
次に、図11には図9のステップS33にて行われる候補選択処理の詳細を示す。この候補選択処理は、予測変換処理にて予測された候補が表示部13に表示されたのを受けて、図9のステップS32にて候補選択キーが操作されるか否かが判断された後に行われる。よって、図10のステップS47(予測変換処理の一部)により表示部13に予測変換文字列が表示されている候補群から、ステップS51により候補選択処理が行われる。
【0072】
そして、ステップS52により表示部13に表示されている候補文字列が選択決定した場合に、ステップS53でかな漢字変換処理部12に記憶されている前文節の有無が判断される。もし前文節が記憶されている場合にはステップS54で前記図8のような形式でユーザ学習辞書15に二文節間情報が記録される。
【0073】
単語予測処理として前記第1の実施の形態を利用する場合には、前記図7の処理手順により選択された単語の単語辞書学習を行う。
【0074】
次にステップS55にて選択された文字列を前文節としてかな漢字変換処理部12に記録する。ステップS56では図10の手順により決定された文節に接続する文字列を第一文節として次文節の抽出作業を行う。この作業により文字列が抽出された際にはステップS57において次文節の候補として表示部13に表示を行う。
【0075】
ステップS53からステップS55の文節間学習と前文節情報の記録作業および単語辞書学習の順番を変えてもかまわない。また、ステップS44で抽出された文字列が選択決定された際には、ステップS53とステップS54を行わず、ステップS55の処理として前文節に文字列の追加を行うことで1つの文節に合成して自立語として取り扱うことができるため、文字列合成処理をするだけでもかまわない。
【0076】
したがって、この第2の実施の形態のかな漢字変換装置40では、前文節があれば読み文字列を入力することなく、利用者に提示する次文節の文字列から選択処理を繰り返すことで日本語文章を組み立てることが出来るようになる。
【0077】
また、従来技術では次文節予測変換を行うために通常のかな漢字変換用字書とユーザ学習辞書と次文節情報辞書は別に持っていたが、この第2の実施の形態では、特別に次文節予測変換辞書を持つ必要がなくなり、辞書記憶領域の節約になる。
【0078】
ここからは、本発明の第3の実施の形態について説明する。この第3の実施の形態も、図1に機能ブロックを示したようなかな漢字変換装置50である。文字入力部11で構成された読みがなをかな漢字変換処理部12でかな漢字変換用辞書14およびユーザ学習辞書15の情報を用いてかな漢字変換処理をし、表示部13に候補を表示する。
【0079】
かな漢字変換処理部12には図12に示す変換候補52とそのタグ(ID)51と変換候補の読み文字列52を保持しておく記憶エリアを有する。読み文字列を保持する場所はかな漢字変換用辞書等の漢字文字列情報が記憶されている装置や位置を指し示す目印(ポインター)でもよい。
【0080】
この場合、読み文字列の全情報を保持しておく必要がないため読みデータを保持しておくメモリ資源の節約になる。また読み文字列を指し示す目印を前述のタグに含めてしまってもかまわない。
【0081】
氏名の入力欄およびその読みがなを入力するシステムを例に処理手順を説明する。想定するシステムは図13の61のように氏名の読み文字列を入力する欄62と、氏名を入力する欄63と、予測変換文字列候補を表示するエリア64を有する。
【0082】
文字入力部11により文字が入力された場合、図14のステップS61(予測変換候補抽出処理)でかな漢字変換処理部12において予測変換候補の抽出処理が行われる。
【0083】
文字入力部13から「わ」を入力した際に得られた候補例が図12に示すようなものであった場合、予測変換候補には候補文字列52とそれに対応したタグ51を付加しておく。タグ51は候補文字列52が特定できる形態であれば構造は問わない。
【0084】
予測変換候補52およびそのタグ51の対をテーブルとしてかな漢字変換処理部12の記憶エリアに保存しておく。また候補文字列抽出時に変換候補文字列と同時にかな漢字変換用辞書14より読み文字列情報53を抽出しておきテーブル(かな漢字変換処理部12内)に記録しておく。
【0085】
入力された文字列「わ」は読み文字列表示エリア62に、得られた候補文字列は表示エリア64に表示される。
【0086】
そして、図14のステップS62の候補手順(候補選択)により候補エリア64に表示されている候補のうち目的とする文字列「若松」を選択する。選択処理が行われると氏名表示エリア66には選択した候補文字列が表示される。
【0087】
ステップS63で、読み文字列が必要の有無が判断される。この手順において読み文字列が特に必要としていないアプリケーションであれば処理が終了する。
【0088】
例として仮定しているアプリケーションでは読み文字列を必要とするため、ステップS64で、選択された文字列のタグをかな漢字変換処理部12に送る。かな漢字変換処理部12ではステップS61で保持したデータテーブルと照合することで、元の読み文字列を抽出する。
【0089】
そして、ステップS65にて、抽出された読み文字列53を読み入力部68に表示する。
【0090】
このように、この第3の実施の形態のかな漢字変換装置50によれば、日本語かな漢字変換システムにおいて予測変換を利用している場合であっても変換文字列の正しい読み文字列を取得することができるようになる。
【0091】
なお、第1,第2,第3の実施の形態の、かな漢字変換装置10,40,50は、例えば内部バスを介してCPUにROM、RAM、HDD、文字入力部、表示部、通信インターフェースを接続した構成とされる。この構成は、CE機器にあってコンピュータシステムをなす。このコンピュータシステムが、例えばROM、或いはHDDに格納された、本発明の各かな漢字変換プログラムをRAMをワークエリアとして逐次実行することによってかな漢字変換装置の機能を持つことになる。各かな漢字変換プログラムは、本発明の各かな漢字変換方法に基づいて各手順を構成している。
【0092】
【発明の効果】
本発明によれば、かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムにあって、特別に予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができる。
【0093】
また、本発明によれば、かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムにあって、特別に次文節予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができる。
【0094】
また、本発明によれば、かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムにあって、日本語かな漢字変換システムにおいて予測変換を利用している場合であっても変換文字列の正しい読み文字列を取得することができる。
【図面の簡単な説明】
【図1】第1〜第3の実施の形態のかな漢字変換装置10、40、50の機能ブロック図である。
【図2】ユーザ学習辞書15の具体例(A)と、かな漢字変換用辞書14の具体例(B)を示す図である。
【図3】ユーザ学習辞書15の他の具体例を示す図である。
【図4】かな漢字変換装置10が表示部15に予測文字列候補を表示するまでの処理手順の第1具体例を示すフローチャートである。
【図5】かな漢字変換装置10が表示部15に予測文字列候補を表示するまでの処理手順の第2具体例を示すフローチャートである。
【図6】ユーザ学習辞書のさらに他の具体例を示す図である。
【図7】予測変換候補を選択することで、選択した文字列をユーザ学習辞書に登録する処理手順を示すフローチャートである。
【図8】文節間学習情報テーブルの具体例を示す図である。
【図9】第2の実施の形態のかな漢字変換装置の全体的な処理手順を示すフローチャートである。
【図10】前記図9のステップS34における予測変換処理の詳細を示すフローチャートである。
【図11】図9のステップS33にて行われる候補選択処理の詳細を示すフローチャートである。
【図12】第3の実施の形態のかな漢字変換装置で用いる、変換候補52とそのタグ(ID)51と変換候補の読み文字列52を保持しておく記憶エリアを示す図である。
【図13】氏名の入力欄およびその読みがなを入力するシステムを想定したときの処理手順を説明するための図である。
【図14】第3の実施の形態のかな漢字変換装置の全体的な処理手順を説明するためのフローチャートである。
【符号の説明】
10,40,50 かな漢字変換装置、11 文字入力部、12 かな漢字変換処理部、13 表示部、14 かな漢字変換用辞書、15 ユーザ学習辞書[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a kana-kanji conversion device, a kana-kanji conversion method, and a kana-kanji conversion program for performing kana-kanji conversion on a character string read using input means such as operation keys and a touch pad.
[0002]
[Prior art]
As one method of a conventional Japanese kana-kanji conversion system, a predictive dictionary search is performed by inputting a leading character or a reading character string of several characters from the beginning as disclosed in Japanese Patent Application Laid-Open No. 11-39300. There is a method of inputting characters without inputting the entire reading of the character to be tried.
[0003]
Also, in a conventional Japanese kana-kanji conversion system, a word prediction conversion method is known in which when a reading character is input, a character string is predicted, and an incomplete reading character string is converted to kana-kanji and presented to a user. . Furthermore, as a method of predicting a character string that will be input next when one word is input, a method is disclosed in which a self-sustained word input as a previous phrase is disclosed as disclosed in Japanese Patent Application Laid-Open No. 9-274613. There is a next character string prediction method that presents an attached word as a character string to be input next based on the connection rule table.
[0004]
[Patent Document 1]
JP-A-11-39300
[Patent Document 2]
JP-A-9-274613
[0005]
[Problems to be solved by the invention]
However, since the conventional predictive conversion system described in
[0006]
Further, there is a problem that the conventional character string prediction method described in
[0007]
The predictive conversion function in the Japanese Kana-Kanji conversion system described above is a method of constructing a character string mixed with Kana-Kanji characters without inputting the entire reading of the target character string. It is very unlikely that the selected predictive conversion candidate character string is correctly read. For example, when inputting a converted character string and its reading character string in an address input field, for convenience of the user, use a kana-kanji conversion system to enter the reading character string and the converted character string in two fields. When reading, in the input system using predictive conversion, the reading character string is incomplete, so that the reading column is forced to be re-input, and there is a problem that the entire reading character string is eventually input. .
[0008]
The present invention has been made in view of the above-described circumstances, and provides a kana-kanji conversion apparatus, a kana-kanji conversion method, and a kana-kanji conversion program that do not require a special predictive conversion dictionary and can save a dictionary storage area. Aim.
[0009]
Further, the present invention has been made in view of the above-mentioned circumstances, and it is not necessary to particularly have a next phrase predictive conversion dictionary, and a kana-kanji conversion apparatus, a kana-kanji conversion method, and a kana-kanji conversion method capable of saving a dictionary storage area. To provide the program.
[0010]
In addition, the present invention has been made in view of the above-mentioned circumstances, and it is possible to obtain a correctly read character string of a converted character string even when predictive conversion is used in a Japanese kana-kanji conversion system. It is an object of the present invention to provide a kana-kanji conversion device, a kana-kanji conversion method, and a kana-kanji conversion program.
[0011]
[Means for Solving the Problems]
The kana-kanji conversion device according to the present invention, in order to solve the above-mentioned problem, in a kana-kanji conversion device that performs kana-kanji conversion on an input reading character string, information for converting an input reading character string into kana-kanji characters is recorded. A kana-kanji conversion dictionary, a user learning dictionary for recording usage frequency information of character strings included in the kana-kanji conversion dictionary, and a kana-kanji conversion character book and the user learning dictionary for the input read character strings. Character string prediction means for predicting a character string by searching, and display means for displaying at least one predicted character string candidate extracted by the character string prediction means, wherein the predicted character string displayed by the display means A desired character string is selected from the candidates.
[0012]
According to a kana-kanji conversion method according to the present invention, in order to solve the above problem, in a kana-kanji conversion method for performing a kana-kanji conversion on an input reading character string, information for converting an input reading character string to a kana-kanji conversion is recorded. A conversion character string of the input reading character string is predicted by searching a kana-kanji conversion dictionary and a user learning dictionary for recording usage frequency information of character strings included in the kana-kanji conversion dictionary. A character string prediction step, a display step of displaying at least one predicted character string candidate extracted in the character string prediction step on a display unit, and a desired character string from the predicted character string candidate displayed in the display step. And a selecting step for selecting.
[0013]
In order to solve the above problem, a kana-kanji conversion program according to the present invention converts a kana-kanji conversion of an input reading character string in a kana-kanji conversion program executed by a kana-kanji conversion device that performs kana-kanji conversion on an input reading character string. A character for predicting the input character string by searching a kana-kanji conversion dictionary in which information of the kana-kanji conversion is recorded and a user learning dictionary for recording usage frequency information of the character string included in the kana-kanji conversion dictionary A column prediction step, a display step of displaying at least one predicted character string candidate extracted in the character string prediction step on a display unit, and selecting a desired character string from the predicted character string candidates displayed in the display step And a selecting step of causing the selection step.
[0014]
According to the present invention, the user learning dictionary acts as a cache of a kana-kanji conversion dictionary, and the more frequently the user learning dictionary is used, the lower the frequency of searching for the kana-kanji conversion dictionary becomes. Further, since the number of words used by individuals is not large, characters can be input almost only by searching the user learning dictionary by continuing the work described in the procedure to some extent. That is, the degree of performing a full dictionary search is reduced, and the search time is reduced.
[0015]
The kana-kanji conversion device according to the present invention, in order to solve the above-mentioned problem, in a kana-kanji conversion device that performs kana-kanji conversion on an input reading character string, information for converting an input reading character string into kana-kanji characters is recorded. A Kana-Kanji conversion dictionary, a user learning dictionary for recording inter-character string connection information included in the Kana-Kanji conversion dictionary, and a Kana-Kanji conversion dictionary and a user learning dictionary are searched for input reading character strings. A character string predicting unit for predicting a character string; and a display unit for displaying at least one predicted character string candidate extracted by the character string predicting unit, wherein a desired character string is selected from the predicted character string candidates displayed by the display unit. Lets you select a character string.
[0016]
In addition, the kana-kanji conversion method according to the present invention is directed to a kana-kanji conversion method for performing a kana-kanji conversion on an input reading character string. By searching a kana-kanji conversion dictionary in which is recorded and a user learning dictionary for recording inter-character string connection information included in the kana-kanji conversion dictionary, the conversion character string candidate of the input read character string is searched. A character string prediction step of predicting, a display step of displaying at least one predicted character string candidate extracted in the character string prediction step on a display unit, and a desired character from the predicted character string candidate displayed by the display step And selecting a column.
[0017]
According to another aspect of the present invention, there is provided a kana-kanji conversion program executed by a kana-kanji conversion device that performs a kana-kanji conversion on an input reading character string. A kana-kanji conversion dictionary in which information for conversion is recorded, and a user learning dictionary for recording inter-string connection information included in the kana-kanji conversion dictionary are searched to obtain the input read character string. A character string prediction step of predicting a converted character string candidate, a display step of displaying at least one predicted character string candidate extracted in the character string prediction step on a display unit, and the prediction character string displayed by the display step Selecting a desired character string from the candidates.
[0018]
According to the present invention, a Japanese sentence can be assembled by repeating the selection process from the character string of the next sentence presented to the user without inputting the reading character string if there is a preceding sentence.
[0019]
A kana-kanji conversion device according to the present invention, in order to solve the above-mentioned problem, in a kana-kanji conversion device that performs kana-kanji conversion on an input reading character string, the conversion character string is input even if the input reading character string is incomplete. A character string predicting means for predicting, a kana-kanji conversion dictionary in which information for converting an input read character string to kana-kanji is recorded, and a read character string restored from the converted character string predicted by the character string predicting means Reading character string restoring means.
[0020]
In addition, the kana-kanji conversion method according to the present invention, in order to solve the above-described problem, in the kana-kanji conversion method for performing the kana-kanji conversion on the input reading character string, the input kana-kanji conversion method is performed even if the input reading character string is incomplete. A character string prediction step of predicting a converted character string, and a kana-kanji conversion dictionary in which information for converting the input read character string to kana-kanji is recorded, and a conversion character string predicted by the character string prediction step A reading character string restoring step of restoring a reading character string.
[0021]
Further, in order to solve the above-mentioned problem, the kana-kanji conversion program according to the present invention, in the kana-kanji conversion program executed by the kana-kanji conversion device for performing the kana-kanji conversion on the input reading character string, the input reading character string is not correct. A character string prediction step of predicting a converted character string even if it is complete, and a kana-kanji conversion dictionary in which information for converting an input reading character string to a kana-kanji character is recorded. A read character string restoring step of restoring the read character string of the converted character string.
[0022]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, some embodiments of the present invention will be described with reference to the drawings. The first embodiment is a kana-kanji conversion device that converts a kana character input from an input device such as a keyboard or a remote controller into a character string mixed with kanji and kana.
[0023]
The kana-kanji conversion device is a device that executes kana-kanji conversion software for inputting Japanese into an OS (operating system) or an application. Kana-Kanji conversion software is also called a Japanese input system or Japanese processor. By incorporating this kana-kanji conversion device into a Japanese sentence creation device (Japanese word processor: Word Processor), which is one of the applications, it is possible to create and edit documents.
[0024]
Such kana-kanji conversion devices and / or Japanese word processors have recently been used in so-called consumer electronic devices (such as mobile phones, personal digital assistants (PDAs), portable personal computers, video cameras, digital still cameras, and television receivers). Consumer electronics (CE) is now available as an application. These CE devices are connected to a network such as the Internet, and have a function of transmitting character information through the network. Alternatively, they can register addresses, write memos, and further record titles, song titles, performers, performers, and the like. This is because it has a function of recording and searching.
[0025]
These CE devices are portable or use a substitute input device such as a jog dial for reducing the size of a key operation unit in order to reduce the size of the housing body. In addition, a key provided on the remote controller is used as an input device. Therefore, the kana-kanji conversion device and / or the Japanese word processor provided in these CE devices are capable of reading while reducing the burden on the user by using input devices such as a reduced key operation unit, a jog dial, and keys on a remote controller. A function to convert a character string into a character string mixed with kana-kanji is expected.
[0026]
FIG. 1 is a functional block diagram of a kana-kanji conversion device 10 according to the first embodiment. The kana-kanji
[0027]
The
[0028]
The kana-
[0029]
The
[0030]
FIG. 2 shows a specific example (A) of the
[0031]
The kana-kanji
[0032]
For example, when “O” is input from the
[0033]
The display setting of the usage frequency information can be changed according to the size of the display unit of the CE device. For example, as shown in FIG. 3, it is assumed that the
By the way, in extracting a candidate, it is not always necessary that all the read character strings match, and a candidate whose read character string matches the beginning is output as a candidate.
[0034]
In addition, when the displayed candidate is the candidate to be input, the user only has to select the candidate, and the character conversion can be performed without inputting all the reading character strings.
[0035]
When the character to be entered is not displayed, enter the reading character string continuously. The user learning dictionary is searched each time the reading character string is reassembled. If no candidate is extracted in this process, the kana-
[0036]
For example, it is assumed that the kana-
[0037]
Then, when the user selects “sound” from the candidates, the information of this character string is registered in the
[0038]
Also, when performing a Kana-Kanji conversion dictionary search, instead of extracting a character string that matches all the reading character strings, a character string that matches the first reading character string registered in the dictionary is searched. Extract as candidates.
[0039]
Then, a desired character string is selected from the predicted character string candidates displayed on the
[0040]
FIG. 4 is a flowchart illustrating a first specific example of a processing procedure until the kana-kanji conversion device 10 displays a predicted character string candidate on the
[0041]
When performing a Kana-Kanji conversion dictionary search in step S3, a character string that matches the first reading character string registered in the dictionary is used instead of extracting a character string that matches all reading character strings. Extract a column as a candidate.
[0042]
Next, a second specific example of a processing procedure until the kana-kanji conversion device 10 displays a predicted character string candidate on the
[0043]
When a reading character string is input from the character input unit 11 (step S11), a character string that starts with the input reading character and is used in the past is normally searched from the
[0044]
If no candidate is obtained in the normal search of the user learning dictionary in step S12, an ambiguous search is performed in step S13 in which one character of the reading character string is replaced with another character, one character is deleted, or one character is added. A character string that matches the reading of the character string stored in the user learning dictionary is extracted by the (user learning dictionary ambiguous search). If a candidate is obtained by this process, a predicted character candidate is displayed on the
[0045]
If no candidate is obtained in the user learning dictionary ambiguous search in step S13, a normal search of the kana-
[0046]
If no candidate is obtained in the normal search of the kana-kanji conversion dictionary in step S14, an ambiguous search is performed using the kana-
[0047]
The fuzzy search performed in steps S13 and S15 is a process of extracting a matching candidate by, for example, replacing some characters of the input reading character string with other characters. The number of characters to be replaced shall be at least one character and shall not exceed the length of the read character string. This match may be regarded as a match for candidates that match the number of input characters at the head of the read character string registered in the dictionary. Further, it may be considered that the first first character rarely makes an input error, and it may be determined that the second character of the input read character string matches the replaced read character string.
[0048]
As a method of replacing with another character string, for example, it is determined that the input character string of the “ka” line matches the reading of the “ka” line “ka, ki, ku, ke, ko” Is also good. Also, it may be determined that a voiced character such as “ba” and a semi-voiced character such as “ぱ” match the corresponding silent character “ha”. Similarly, it may be limited to matching a repetitive sound such as “ゃ” or a prompting sound “tsu” with non-small characters “ya” or “tsu”. In this case, in a device such as a CE device having a small number of input keys, a plurality of read character strings can be assigned to one key, and there is an advantage that input keys can be saved.
[0049]
In addition, in order to rescue the case where the reading character string entered as an ambiguous search is incorrectly entered, a candidate that matches by adding one character to the input reading character string or a candidate that matches by deleting one character is matched. Allow judgment. Here, the number to be deleted and the number to be added can be changed according to the input character string length.
[0050]
Here, the dictionary fuzzy search processing in step S13 or step S15 may not be particularly performed. The processing may be performed by combining the processing of steps S13, S14, S15, and S16, and the prediction conversion character string comprehensively extracted may be displayed on the
[0051]
In order to reduce the number of character string candidates extracted by the above procedure, the display amount of the number of candidates is limited by limiting the read character string length of the character strings registered in the dictionary and the input read character string length to the same number or the same number + N. May be added. This is also effective when the size of the
[0052]
For example, using the specific example of the
[0053]
In addition, in the same number + N, it is needless to say that N does not have to be 1, and N = 0, 2, 3,... Depending on the size of the display unit.
[0054]
After the prediction conversion candidates are displayed in step S16, the prediction conversion candidates can be selected under the control of the
[0055]
That is, as shown in FIG. 7, when a character string is selected from the predictive conversion candidates in step S21, the character string is stored in the user learning dictionary in step S22. The character string stored in step S22 can be used in the processing in steps S12 and S13 in FIG.
[0056]
As described above, in the kana-kanji conversion device 10 of the first embodiment, the functional configuration of which is shown in FIG. 1, a
[0057]
Further, by repeating the processing procedure of the specific example shown in FIG. 4 or FIG. 5, the user learning dictionary can behave like a cache of a kana-kanji conversion dictionary, and the frequency of searching for the kana-kanji conversion dictionary can be reduced.
[0058]
Since the number of words used by individuals is not large, characters can be input by almost only searching the user learning dictionary by continuing the work described in the procedure to some extent. That is, the degree of performing a full dictionary search is reduced, and the search time is reduced.
[0059]
In the prior art, the predictive conversion dictionary has a separate kana-kanji conversion script, a user learning dictionary, and a predictive conversion script, but according to the first embodiment, it is necessary to have a special predictive conversion dictionary. And saves dictionary storage space.
[0060]
Hereinafter, a second embodiment of the present invention will be described. This second embodiment is also a kana-kanji conversion device 40 whose functional blocks are shown in FIG. The kana-kanji
[0061]
The kana-kanji
[0062]
For example, as shown in FIG. 8, the
[0063]
FIG. 9 shows an overall processing procedure of the kana-kanji conversion device 40. In step S31, a key input from the
[0064]
In step S32, when the read character string is generated in step S31 (NO: when the candidate selection key is not operated), the process proceeds to step S34 to perform predictive conversion processing. On the other hand, when a candidate is displayed on the
[0065]
FIG. 10 shows details of the prediction conversion process in step S34 of FIG. In step S31, a key for generating a reading character string is input (the key input includes two types of a key input operation for creating a reading character string and a key input operation for selecting a displayed candidate character string) ), A reading character string is generated.
[0066]
In step S42, the kana-kanji
[0067]
For example, if data is learned from the data learned in the past as the inter-segment learning information table as shown in FIG. 8, if "Shinagawa-ku" is set as the previous sentence, "Kita Shinagawa" is replaced by the next sentence in step S43. Is extracted as If the input character string is a few characters from the beginning of "Kitashinagawa", it is extracted in the process of step S43.
[0068]
If there is a preceding phrase, in step S44, each table of attached words, suffixes, and inflected endings that can be connected to the part-of-speech information of the previous phrase is drawn to extract connectable words.
[0069]
On the other hand, if there is no preceding clause or after step S44, general word prediction processing or word extraction performed in the first embodiment is performed in step S45.
[0070]
In step S46, it is determined whether or not there is a character string extracted in steps S43, S44, and S45. If there is a character string, the character string is displayed on the
[0071]
Next, FIG. 11 shows details of the candidate selection processing performed in step S33 of FIG. This candidate selection process is performed after the candidate predicted in the prediction conversion process is displayed on the
[0072]
When the candidate character string displayed on the
[0073]
When the first embodiment is used as the word prediction process, the word dictionary learning of the word selected by the processing procedure of FIG. 7 is performed.
[0074]
Next, the character string selected in step S55 is recorded in the kana-kanji
[0075]
The order of the inter-phrase learning, the recording of the previous phrase information, and the word dictionary learning from step S53 to step S55 may be changed. Further, when the character string extracted in step S44 is selected and determined, steps S53 and S54 are not performed, and the character string is added to the previous phrase as the processing of step S55 to synthesize the character string into one phrase. Because it can be treated as an independent word, it is sufficient to only perform character string synthesis processing.
[0076]
Therefore, the kana-kanji conversion device 40 according to the second embodiment repeats the selection process from the character string of the next phrase presented to the user without inputting the reading character string if there is a previous phrase, so that the Japanese sentence can be obtained. Can be assembled.
[0077]
Further, in the prior art, a normal kana-kanji conversion script, a user learning dictionary, and a next phrase information dictionary are separately provided for performing the next phrase prediction conversion. However, in the second embodiment, the next phrase prediction There is no need to have a conversion dictionary, which saves dictionary storage space.
[0078]
Hereinafter, a third embodiment of the present invention will be described. This third embodiment is also a kana-kanji conversion device 50 whose functional blocks are shown in FIG. The kana-kanji
[0079]
The kana-kanji
[0080]
In this case, it is not necessary to hold all information of the read character string, so that memory resources for holding the read data can be saved. Also, a mark indicating the character string to be read may be included in the above-described tag.
[0081]
The processing procedure will be described with an example of a system for inputting a name input field and its reading. The assumed system has a
[0082]
When a character is input by the
[0083]
If the candidate example obtained when "wa" is input from the
[0084]
The pair of the
[0085]
The input character string "wa" is displayed in the reading character
[0086]
Then, the target character string “Wakamatsu” is selected from the candidates displayed in the
[0087]
In step S63, it is determined whether a reading character string is necessary. If the application does not require a read character string in this procedure, the process ends.
[0088]
Since the application assumed as an example requires a reading character string, the tag of the selected character string is sent to the kana-kanji
[0089]
Then, in step S65, the extracted read
[0090]
As described above, according to the kana-kanji conversion device 50 of the third embodiment, even when predictive conversion is used in the Japanese kana-kanji conversion system, it is possible to obtain a correct reading character string of the converted character string. Will be able to
[0091]
The kana-kanji conversion devices 10, 40, and 50 of the first, second, and third embodiments have, for example, a ROM, a RAM, a HDD, a character input unit, a display unit, and a communication interface in a CPU via an internal bus. It is configured to be connected. This configuration constitutes a computer system in the CE device. This computer system has the function of a kana-kanji conversion device by sequentially executing each kana-kanji conversion program of the present invention stored in, for example, a ROM or an HDD using a RAM as a work area. Each kana-kanji conversion program constitutes each procedure based on each kana-kanji conversion method of the present invention.
[0092]
【The invention's effect】
According to the present invention, in the kana-kanji conversion device, the kana-kanji conversion method, and the kana-kanji conversion program, it is not necessary to have a special predictive conversion dictionary, and the dictionary storage area can be saved.
[0093]
Further, according to the present invention, in the kana-kanji conversion apparatus, the kana-kanji conversion method, and the kana-kanji conversion program, it is not necessary to have a special next phrase predictive conversion dictionary, and the dictionary storage area can be saved.
[0094]
Further, according to the present invention, there is provided a kana-kanji conversion device, a kana-kanji conversion method, and a kana-kanji conversion program, and a correct reading character string of a converted character string even when predictive conversion is used in a Japanese kana-kanji conversion system. Can be obtained.
[Brief description of the drawings]
FIG. 1 is a functional block diagram of kana-kanji conversion apparatuses 10, 40, and 50 according to first to third embodiments.
FIG. 2 is a diagram showing a specific example (A) of a
FIG. 3 is a diagram showing another specific example of the
FIG. 4 is a flowchart showing a first specific example of a processing procedure until the kana-kanji conversion device 10 displays a predicted character string candidate on the
5 is a flowchart showing a second specific example of a processing procedure until the kana-kanji conversion device 10 displays a predicted character string candidate on the
FIG. 6 is a diagram showing still another specific example of the user learning dictionary.
FIG. 7 is a flowchart illustrating a procedure of registering a selected character string in a user learning dictionary by selecting a predictive conversion candidate.
FIG. 8 is a diagram showing a specific example of an inter-phrase learning information table.
FIG. 9 is a flowchart illustrating an overall processing procedure of the kana-kanji conversion device according to the second embodiment;
FIG. 10 is a flowchart showing details of a predictive conversion process in step S34 of FIG. 9;
FIG. 11 is a flowchart illustrating details of a candidate selection process performed in step S33 of FIG. 9;
FIG. 12 is a diagram illustrating a storage area for holding a
FIG. 13 is a diagram for explaining a processing procedure when a system for inputting a name input field and its pronunciation is assumed;
FIG. 14 is a flowchart illustrating an overall processing procedure of the kana-kanji conversion device according to the third embodiment.
[Explanation of symbols]
10, 40, 50 kana-kanji conversion device, 11 character input unit, 12 kana-kanji conversion processing unit, 13 display unit, 14 kana-kanji conversion dictionary, 15 user learning dictionary
Claims (32)
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、
前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を記録するためのユーザ学習辞書と、
前記入力された読み文字列を前記かな漢字変換用辞書と前記ユーザ学習辞書を検索することで文字列予測する文字列予測手段と、
前記文字列予測手段により抽出された少なくとも一つの予測文字列候補を表示する表示手段とを備え、
前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させることを特徴とするかな漢字変換装置。In a kana-kanji conversion device that performs kana-kanji conversion on an input reading character string,
A kana-kanji conversion dictionary in which information for converting the input reading character string to kana-kanji,
A user learning dictionary for recording usage frequency information of character strings included in the kana-kanji conversion dictionary,
Character string prediction means for predicting a character string by searching the input reading character string for the kana-kanji conversion dictionary and the user learning dictionary,
Display means for displaying at least one predicted character string candidate extracted by the character string prediction means,
A kana-kanji conversion device, wherein a desired character string is selected from the predicted character string candidates displayed by the display means.
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を記録するためのユーザ学習辞書とを検索することで前記入力された読み文字列の変換文字列を予測する文字列予測工程と、
前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、
前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程と
を備えることを特徴とするかな漢字変換方法。In a kana-kanji conversion method for performing a kana-kanji conversion on an input reading character string,
Searching a Kana-Kanji conversion dictionary in which information for converting an input reading character string is recorded, and a user learning dictionary for recording usage frequency information of a character string included in the Kana-Kanji conversion dictionary A character string prediction step of predicting a converted character string of the input read character string at
A display step of displaying at least one predicted character string candidate extracted in the character string prediction step on a display unit;
A selecting step of selecting a desired character string from the predicted character string candidates displayed in the displaying step.
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を記録するためのユーザ学習辞書とを検索することで前記入力された文字列を予測する文字列予測工程と、
前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、
前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程と
を備えることを特徴とするかな漢字変換プログラム。In a kana-kanji conversion program executed by a kana-kanji conversion device that performs a kana-kanji conversion on an input reading character string,
Searching a Kana-Kanji conversion dictionary in which information for converting an input reading character string is recorded, and a user learning dictionary for recording usage frequency information of a character string included in the Kana-Kanji conversion dictionary A character string prediction step of predicting the input character string at
A display step of displaying at least one predicted character string candidate extracted in the character string prediction step on a display unit;
A selecting step of selecting a desired character string from the predicted character string candidates displayed in the displaying step.
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、
前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書と、
入力された読み文字列を前記かな漢字変換用辞書とユーザ学習辞書を検索することで文字列予測する文字列予測手段と、
前記文字列予測手段により抽出された少なくとも一つの予測文字列候補を表示する表示手段とを備え、
前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させることを特徴とするかな漢字変換装置。In a kana-kanji conversion device that performs kana-kanji conversion on an input reading character string,
A kana-kanji conversion dictionary in which information for converting the input reading character string to kana-kanji,
A user learning dictionary for recording connection information between character strings included in the kana-kanji conversion dictionary,
Character string prediction means for predicting a character string by searching the input reading character string for the kana-kanji conversion dictionary and the user learning dictionary;
Display means for displaying at least one predicted character string candidate extracted by the character string prediction means,
A kana-kanji conversion device, wherein a desired character string is selected from the predicted character string candidates displayed by the display means.
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書とを検索することで前記入力された読み文字列の変換文字列候補を予測する文字列予測工程と、
前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、
前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程と
を備えることを特徴とするかな漢字変換方法。In a kana-kanji conversion method for performing a kana-kanji conversion on an input reading character string,
By searching for a kana-kanji conversion dictionary in which information for converting an input reading character string is recorded, and a user learning dictionary for recording inter-string connection information included in the kana-kanji conversion dictionary, A character string prediction step of predicting a conversion character string candidate of the input read character string,
A display step of displaying at least one predicted character string candidate extracted in the character string prediction step on a display unit;
A selecting step of selecting a desired character string from the predicted character string candidates displayed in the displaying step.
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書とを検索することで前記入力された読み文字列の変換文字列候補を予測する文字列予測工程と、
前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、
前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程と
を備えることを特徴とするかな漢字変換プログラム。In a Kana-Kanji conversion program executed by a Kana-Kanji conversion device that performs a Kana-Kanji conversion on an input reading character string,
By searching for a kana-kanji conversion dictionary in which information for converting an input reading character string is recorded, and a user learning dictionary for recording inter-string connection information included in the kana-kanji conversion dictionary, A character string prediction step of predicting a conversion character string candidate of the input read character string,
A display step of displaying at least one predicted character string candidate extracted in the character string prediction step on a display unit;
A selecting step of selecting a desired character string from the predicted character string candidates displayed in the displaying step.
入力された読み文字列が不完全であっても変換文字列を予測する文字列予測手段と、
入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書と、
前記文字列予測手段によって予測された変換文字列から読み文字列を復元する読み文字列復元手段と
を備えることを特徴とするかな漢字変換装置。In a kana-kanji conversion device that performs kana-kanji conversion on an input reading character string,
Character string predicting means for predicting the converted character string even if the input reading character string is incomplete;
A kana-kanji conversion dictionary in which information for converting the input reading character string to kana-kanji is recorded,
A kana-kanji conversion device, comprising: a read character string restoring means for restoring a read character string from the converted character string predicted by the character string predicting means.
入力された読み文字列が不完全であっても変換文字列を予測する文字列予測工程と、
入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書を用い、前記文字列予測工程によって予測された変換文字列の読み文字列を復元する読み文字列復元工程と
を備えることを特徴とするかな漢字変換方法。In a kana-kanji conversion method for performing a kana-kanji conversion on an input reading character string,
A character string prediction step of predicting a converted character string even if the input read character string is incomplete;
A reading character string restoring step of restoring a reading character string of the converted character string predicted by the character string prediction step, using a kana-kanji conversion dictionary in which information for converting the input reading character string to kana-kanji is recorded; A kana-kanji conversion method comprising:
入力された読み文字列が不完全であっても変換文字列を予測する文字列予測工程と、
入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書を用い、前記文字列予測工程によって予測された変換文字列の読み文字列を復元する読み文字列復元工程と
を備えることを特徴とするかな漢字変換プログラム。In a Kana-Kanji conversion program executed by a Kana-Kanji conversion device that performs a Kana-Kanji conversion on an input reading character string,
A character string prediction step of predicting a converted character string even if the input read character string is incomplete;
A reading character string restoring step of restoring a reading character string of the converted character string predicted by the character string prediction step, using a kana-kanji conversion dictionary in which information for converting the input reading character string to kana-kanji is recorded; A kana-kanji conversion program characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003110837A JP4251000B2 (en) | 2003-04-15 | 2003-04-15 | Kana-kanji conversion device, kana-kanji conversion method, and kana-kanji conversion program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003110837A JP4251000B2 (en) | 2003-04-15 | 2003-04-15 | Kana-kanji conversion device, kana-kanji conversion method, and kana-kanji conversion program |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008194073A Division JP2008287736A (en) | 2008-07-28 | 2008-07-28 | Kana-kanji conversion device, kana-kanji conversion method, and kana-kanji conversion program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004318441A true JP2004318441A (en) | 2004-11-11 |
JP4251000B2 JP4251000B2 (en) | 2009-04-08 |
Family
ID=33471580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003110837A Expired - Fee Related JP4251000B2 (en) | 2003-04-15 | 2003-04-15 | Kana-kanji conversion device, kana-kanji conversion method, and kana-kanji conversion program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4251000B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006301693A (en) * | 2005-04-15 | 2006-11-02 | Sony Ericsson Mobilecommunications Japan Inc | Character input device, portable terminal equipment and character input processing program |
JP2007164278A (en) * | 2005-12-09 | 2007-06-28 | Nec Corp | Japanese processor, japanese processing method, and program for japanese processing |
JP2007299217A (en) * | 2006-04-28 | 2007-11-15 | Toshiba Corp | Image recording device |
JP2008242817A (en) * | 2007-03-27 | 2008-10-09 | Toshiba Corp | Character input device and character input program |
JP2009048348A (en) * | 2007-08-17 | 2009-03-05 | Sony Corp | Information processing apparatus, method for searching through candidate for character information, and program for searching through candidate for character information |
JP2011170452A (en) * | 2010-02-16 | 2011-09-01 | Fujitsu Toshiba Mobile Communications Ltd | Portable terminal |
-
2003
- 2003-04-15 JP JP2003110837A patent/JP4251000B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006301693A (en) * | 2005-04-15 | 2006-11-02 | Sony Ericsson Mobilecommunications Japan Inc | Character input device, portable terminal equipment and character input processing program |
JP2007164278A (en) * | 2005-12-09 | 2007-06-28 | Nec Corp | Japanese processor, japanese processing method, and program for japanese processing |
JP2007299217A (en) * | 2006-04-28 | 2007-11-15 | Toshiba Corp | Image recording device |
JP2008242817A (en) * | 2007-03-27 | 2008-10-09 | Toshiba Corp | Character input device and character input program |
JP2009048348A (en) * | 2007-08-17 | 2009-03-05 | Sony Corp | Information processing apparatus, method for searching through candidate for character information, and program for searching through candidate for character information |
JP2011170452A (en) * | 2010-02-16 | 2011-09-01 | Fujitsu Toshiba Mobile Communications Ltd | Portable terminal |
Also Published As
Publication number | Publication date |
---|---|
JP4251000B2 (en) | 2009-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20080158201A1 (en) | Character input device | |
KR101030831B1 (en) | Method and apparatus for providing foreign language text display when encoding is not available | |
KR100947401B1 (en) | Entering text into an electronic communications device | |
JP2005157471A (en) | Method and device for inputting character | |
JP2010257392A (en) | Device and method for inputting character, computer readable program, and recording medium | |
JP4251000B2 (en) | Kana-kanji conversion device, kana-kanji conversion method, and kana-kanji conversion program | |
JPWO2008018287A1 (en) | Search device and search database generation device | |
JP3290451B2 (en) | Electronic dictionary | |
JP2009140152A (en) | Character input device and character-character type selection method | |
JP5024335B2 (en) | Information display control device and information display control program | |
JP5442212B2 (en) | Electronics | |
JP4492499B2 (en) | Information display control device and information display control program | |
JP2004072274A (en) | Sound processing system and control method therefor | |
JP2008287736A (en) | Kana-kanji conversion device, kana-kanji conversion method, and kana-kanji conversion program | |
JP4404436B2 (en) | Character input device | |
JP2580138B2 (en) | Kana-Kanji conversion attribute change processor | |
JP2007164278A (en) | Japanese processor, japanese processing method, and program for japanese processing | |
JP2007171275A (en) | Language processor and language processing method | |
JP2001067375A (en) | Name retrieval device, keyboard and recording medium recording name retrieval program | |
JPH10198664A (en) | Japanese language input system and medium for recorded with japanese language input program | |
JP2006172029A (en) | Method for presenting retrieval result | |
JPH0380363A (en) | Document processor | |
JP2675298B2 (en) | Information processing device | |
JP2002049616A (en) | Device and method for kana-kanji conversion | |
JP2005267468A (en) | Information search apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060414 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080527 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080728 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080916 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081117 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20081202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081224 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090106 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120130 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130130 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |