JP4251000B2

JP4251000B2 - かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム

Info

Publication number: JP4251000B2
Application number: JP2003110837A
Authority: JP
Inventors: 真若松
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2003-04-15
Filing date: 2003-04-15
Publication date: 2009-04-08
Anticipated expiration: 2023-04-15
Also published as: JP2004318441A

Description

【０００１】
【発明の属する技術分野】
本発明は、操作キーやタッチパッド等の入力手段を用いて入力された読み文字列についてかな漢字変換を行うかな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムに関する。
【０００２】
【従来の技術】
従来の日本語かな漢字変換システムの一手法として、特開平１１−３９３００号公報にて開示されたように先頭の一文字あるいは先頭から数文字の読み文字列を入力することで予測辞書検索を行い、入力しようとする文字の全読みを入力することなく文字入力を行う手法がある。
【０００３】
また、従来の日本語かな漢字変換システムにおいては、読み文字を入力すると、文字列を予測し、不完全な読み文字列でもかな漢字変換して利用者へ提示する単語予測変換の手法が知られている。さらに、一つの単語が入力された際に、次に入力するであろう文字列を予測する手法として特開平９−２７４６１３号公報にて開示されたように前文節として入力された自立語との接続規則表を基に付属語を次に入力されるであろう文字列として提示する次文字列予測手法がある。
【０００４】
【特許文献１】
特開平１１−３９３００号
【特許文献２】
特開平９−２７４６１３号
【０００５】
【発明が解決しようとする課題】
しかし、前記特許文献１に記載の従来の予測変換システムにおいてはかな漢字変換用辞書とユーザ学習辞書の他に予測用辞書を持たせているため、予測変換システムを備えていない通常のかな漢字変換システムに比べて多くの辞書記憶領域を必要とするという問題があった。
【０００６】
また、前記特許文献２に記載の従来の文字列予測手法では文章を組み立てることまでは行うことが出来ないという問題があった。
【０００７】
また、前述した日本語かな漢字変換システムにおける予測変換機能は、目的とする文字列の全読みを入力することなく、かな漢字混じり文字列を構成する手法であり、このため、入力した読み文字列は、選択した予測変換候補文字列の正確な読みである可能性が非常に低い。たとえば住所入力欄において変換文字列およびその読み文字列を入力する場合、利用者の便宜を図り、かな漢字変換システムを利用して入力された読み文字列と変換された文字列を2つの欄に記入する際、予測変換を利用した入力システムでは読み文字列が不完全であるため、読みの欄は再入力を強いられ、結局は全読み文字列を入力することになってしまうという問題があった。
【０００８】
本発明は、前記実情に鑑みてなされたものであり、特別に予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができるかな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムの提供を目的とする。
【０００９】
また、本発明は、前記実情に鑑みてなされたものであり、特別に次文節予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができるかな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムの提供を目的とする。
【００１０】
また、本発明は、前記実情に鑑みてなされたものであり、日本語かな漢字変換システムにおいて予測変換を利用している場合であっても変換文字列の正しい読み文字列を取得することができる日本語かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムの提供を目的とする。
【００１１】
【課題を解決するための手段】
本発明に係るかな漢字変換装置は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書と、前記入力された読み文字列を前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索する文字列予測手段と、前記文字列予測手段により抽出された少なくとも一つの予測文字列候補を表示する表示手段とを備え、前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させ、前記文字列予測手段は、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する。
【００１２】
本発明に係るかな漢字変換方法は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書とを、文字列予測手段が、前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索することで前記入力された読み文字列の変換文字列を予測する文字列予測工程と、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示処理手段が表示部に表示する表示工程とを備え、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させ、前記文字列予測工程では、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する。
【００１３】
本発明に係るかな漢字変換プログラムは、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置によって実行されるかな漢字変換をコンピュータに実行させるためのかな漢字変換プログラムにおいて、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書とを、コンピュータの文字列予測機能部が、前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索することで前記入力された読み文字列の変換文字列を予測する文字列予測工程と、コンピュータが、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程とを備え、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させ、前記文字列予測工程では、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する。
【００１４】
本発明によれば、ユーザ学習辞書があたかもかな漢字変換用辞書のキャッシュのように働き、使えば使うほどかな漢字変換用辞書を検索する頻度が下がることとなる。また、個人が使う単語数は多くはないため、ある程度手順に示した作業を続けることでほぼユーザ学習辞書の検索だけで文字入力が可能となる。つまり全辞書検索する度合いが減り、検索時間が短縮される。
【００１５】
本発明に係るかな漢字変換装置は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書と、入力された読み文字列を前記かな漢字変換用辞書とユーザ学習辞書を検索することで文字列予測する文字列予測手段と、前記文字列予測手段により抽出された少なくとも一つの予測文字列候補を表示する表示手段とを備え、前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させる。
【００１６】
また、本発明に係るかな漢字変換方法は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書とを検索することで前記入力された読み文字列の変換文字列候補を予測する文字列予測工程と、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程とを備える。
【００１７】
また、本発明に係るかな漢字変換プログラムは、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置に実行されるかな漢字変換プログラムにおいて、入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列間接続情報を記録するためのユーザ学習辞書とを検索することで前記入力された読み文字列の変換文字列候補を予測する文字列予測工程と、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程と、前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させる選択工程とを備える。
【００１８】
本発明によれば、前文節があれば読み文字列を入力することなく、利用者に提示する次文節の文字列から選択処理を繰り返すことで日本語文章を組み立てることが出来るようになる。
【００１９】
本発明に係るかな漢字変換装置は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、入力された読み文字列が不完全であっても変換文字列を予測する文字列予測手段と、入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書と、前記文字列予測手段によって予測された変換文字列から読み文字列を復元する読み文字列復元手段とを備える。
【００２０】
また、本発明に係るかな漢字変換方法は、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、入力された読み文字列が不完全であっても変換文字列を予測する文字列予測工程と、入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書を用い、前記文字列予測工程によって予測された変換文字列の読み文字列を復元する読み文字列復元工程とを備える。
【００２１】
また、本発明に係るかな漢字変換プログラムは、前記課題を解決するために、入力された読み文字列についてかな漢字変換を行うかな漢字変換装置に実行されるかな漢字変換プログラムにおいて、入力された読み文字列が不完全であっても変換文字列を予測する文字列予測工程と、入力された読み文字列をかな漢字に変換するための情報が記録されたかな漢字変換用辞書を用い、前記文字列予測工程によって予測された変換文字列の読み文字列を復元する読み文字列復元工程とを備える。
【００２２】
【発明の実施の形態】
以下、本発明のいくつかの実施の形態について図面を参照しながら説明する。第１の実施の形態は、キーボードやリモコンなどの入力装置から入力されたかな文字を漢字かな混じり文字列へ変換するかな漢字変換装置である。
【００２３】
かな漢字変換装置は、ＯＳ（オペレーティングシステム）やアプリケーションへの日本語を入力するためのかな漢字変換ソフトを実行する装置である。かな漢字変換ソフトは、日本語入力システム、日本語プロセッサともいう。このかな漢字変換装置をアプリケーションの一つである日本語文章作成装置（日本語ワードプロセッサ：Word Processor）に内蔵することにより文書の作成、編集等が可能となる。
【００２４】
このようなかな漢字変換装置及び／又は日本語ワードプロセッサは、最近、携帯電話、携帯情報端末（ＰＤＡ）、携帯型パーソナルコンピュータ、ビデオカメラ、デジタルスチルカメラ或いはテレビジョン受像機等、いわゆる民生用電子機器（consumer electronics：ＣＥ）にアプリケーションとして備えられるようになった。これらのＣＥ機器は、インターネット等のネットワークと接続され、ネットワークを通して文字情報を通信する機能を備えるようになったり、或いは住所登録や、メモ書き、さらにはタイトル、曲名、演奏者、出演者等の記録や検索をする機能を備えるようになったためである。
【００２５】
これらのＣＥ機器は、携帯型であったり、あるいは筐体本体の小型化のために、キー操作部が縮小されたり、ジョグダイヤル等の代用の入力装置を用いている。また、リモートコントローラ上に配設されたキーを入力装置としている。そこで、これらのＣＥ機器に備えられるかな漢字変換装置及び／又は日本語ワードプロセッサは、縮小されたキー操作部や、ジョグダイヤル、リモートコントローラ上のキー等の入力装置によっても使用者の負担を軽減しながら読み文字列をかな漢字混じり文字列に変換する機能が期待される。
【００２６】
図１は、第１の実施の形態のかな漢字変換装置１０の機能ブロック図である。文字入力部１１で構成された読みがなをかな漢字変換処理部１２でかな漢字変換用辞書１４およびユーザ学習辞書１５の情報を用いてかな漢字変換処理をし、表示部１３に候補を少なくとも一つ表示する。
【００２７】
文字入力部１１は例えばキーボード、タッチパネル、ジョグダイヤル等の入力デバイスにより構成され、ひらがな等の読み文字列を構成する処理を行うことができる装置である。
【００２８】
かな漢字変換用辞書１４は、入力された読み文字列をかな漢字変換するための情報を記録している。情報としては、単語と読みがなとの対応関係を記録している。この実施の形態では、かな漢字変換用辞書１４は、一つであるが、複数であっても構わない。
【００２９】
ユーザ学習辞書１５は、かな漢字変換装置にてかな漢字変換用辞書１４を用いてのユーザの入力・変換により学習された内容を記憶したり、ユーザが単語登録した単語を書き込む辞書である。この実施の形態では、かな漢字変換用辞書１４に含まれる文字列の利用頻度情報も記録する。
【００３０】
図２には、ユーザ学習辞書１５の具体例（Ａ）と、かな漢字変換用辞書１４の具体例（Ｂ）を示す。ユーザ学習辞書１５には、読み文字２１とそれに対応する語句２２が記述されている。また、ユーザ学習辞書１５には、さらに、利用頻度情報２３が記録されている。利用頻度情報２３は、前述したように図２の（Ｂ）に示したかな漢字変換用辞書１４に示す語句３２の利用頻度を示す情報である。例えば、利用頻度情報２３は、新しく使用したものほど番号を小さくなるようにしている。利用頻度情報２３が「１」であるのは１回前に使用したことを示す。また、利用頻度情報２３が「２」であるのは２回前に使用したことを示す。なお、利用頻度情報２３は、対応する語句２２（かな漢字変換用辞書の語句３２に連動している）が使用される毎に更新される。この利用頻度情報は、過去に使用されたものの履歴情報としても記述することができる。また、これら利用頻度情報又は履歴情報は、かな漢字変換用辞書の語句が使用された回数を反映した値でもよい。例えば、「１」は一番多く使用され、「２」は二番目に使用されている、というようにである。また、回数をそのまま利用頻度情報としてもよい。
【００３１】
かな漢字変換処理部１２は、かな漢字変換用辞書１４とユーザ学習辞書１５を検索することで文字入力部１１によって入力された読み文字列に対応する文字列候補を予測して抽出する。表示部１３は例えば液晶表示装置よりなり、かな漢字変換処理部１２によって文字列予測された少なくとも一つの予測文字列候補を表示する。
【００３２】
例えば、文字入力部１１より “お”が入力された場合、まずユーザ学習辞書１５から、読み文字列が“お”で始まる候補を検索する。この結果、“音”と “音楽” が一致するので、表示部１３にこれらの“音”、“音楽”という２つの候補が予測された文字列として表示されることになる。“音”の利用頻度情報２３は「３」であり、３回前に使用したことを示し、“音楽”の利用頻度情報２３は「４」であり、４回前に使用したことを示す。これらの“音”、“音楽”という２つの候補は、例えば予め利用頻度情報が「５」以下の語句を候補とするというような表示設定にしたがって表示される。もちろん、表示される順番は利用頻度情報の値に応じるようにする。
【００３３】
利用頻度情報の表示設定は、ＣＥ機器の表示部の大きさなどに応じて変えることができる。例えば、図３に示すように、ユーザ学習辞書１５には、“は”で始まる読み文字２１に対応する利用頻度情報２３が「１」乃至「５」までの語句２２が記述されているとする。しかし、ＣＥ機器の表示部が３行までしかとれないものであるときには、予め利用頻度情報２３が「３」以下を表示する設定とする。
ところで、候補の抽出には、必ず読み文字列がすべて一致している必要はなく、読み文字列の先頭が一致したものを候補として出力する。
【００３４】
また、利用者は表示された候補が入力しようとしている候補である場合は、候補選択をすればよく、すべての読み文字列を入力することなく文字変換を行うことができる。
【００３５】
入力しようとしている文字が表示されていないときには続けて、読み文字列を入力する。よみ文字列が組み立て直されるたびにユーザ学習辞書を検索するが、この処理において候補を抽出できなかった場合にはかな漢字変換用辞書１４を検索する。
【００３６】
例えば、かな漢字変換用辞書１４には、前記図２の（Ｂ）のように記述されているとする。今、目的とする文字列が “音響”だったとき、“おんき”と入力された段階で、候補として “音響”が抽出され、表示部１３に表示されることになる。
【００３７】
そして、候補から利用者が“音響”を選択したとき、この文字列の情報をユーザ学習辞書１５に登録する。この登録処理により、次回 “おんきょう”が入力されたときは読み文字列として “お”が入力されただけで、“音響”が候補として表示部１３に表示されるため、ユーザは文字入力部１３を用いて候補選択をするだけで“音響”という文字列を入力することができる。
【００３８】
また、かな漢字変換用辞書検索を行うときにもすべての読み文字列が一致している文字列を抽出するのではなく、辞書に登録されている先頭の読み文字列と一致している文字列を候補として抽出する。
【００３９】
そして、表示部１３に表示された予測文字列候補の中から、文字入力部１１に含まれる操作部や他の操作部を使用者が操作することによって所望の文字列が選択される。そして、所望の文字列の選択が繰り返されることにより日本語の文章が作成される。
【００４０】
図４は、かな漢字変換装置１０が表示部１５に予測文字列候補を表示するまでの処理手順の第１具体例を示すフローチャートである。文字入力部１１により読み文字列が入力される（ステップＳ１）と、かな漢字変換処理部１２はユーザ学習辞書１５を検索し、候補があるか否かを検出する（ステップＳ２）。よみ文字列が組み立て直されるたびにユーザ学習辞書１５を検索する。ここでは、前記利用頻度情報２３に応じた候補を検出することになる。候補があれば、ステップＳ４に進み、文字列候補を表示部１３に表示する。もし、ステップＳ２にて候補がないと判定すれば、ステップＳ３に進んで、かな漢字変換用辞書１４を検索する。候補があれば、文字列候補を表示部１３に表示するが、候補がなければステップＳ１に戻って読み文字列の入力を待つ（促す）。
【００４１】
ステップＳ３にてかな漢字変換用辞書検索を行うときにもすべての読み文字列が一致している文字列を抽出するのではなく、辞書に登録されている先頭の読み文字列と一致している文字列を候補として抽出する。
【００４２】
次に、かな漢字変換装置１０が表示部１５に予測文字列候補を表示するまでの処理手順の第２具体例を図５のフローチャートを用いて説明する。
【００４３】
文字入力部１１からよみ文字列が入力されると（ステップＳ１１）、ステップＳ１２にて入力読み文字で始まる文字列で過去に利用された文字列をユーザ学習辞書１５から通常検索する。ここで、候補が得られた場合はステップＳ１６により表示部１３に予測文字候補を表示する。
【００４４】
ステップＳ１２のユーザ学習辞書の通常検索にて候補が得られなかったときはステップＳ１３にて、よみ文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加する曖昧検索を行う（ユーザ学習辞書曖昧検索）ことでユーザ学習辞書に記憶されている、文字列の読みに一致する文字列を抽出する。この処理により候補が得られた場合はステップＳ１６により表示部１３に予測文字候補を表示する。
【００４５】
ステップＳ１３のユーザ学習辞書曖昧検索にて候補が得られなかったときは、ステップＳ１４にてかな漢字変換用辞書１４の通常検索が行われる。このステップＳ１４で、予測変換候補を抽出することができた（候補あり）ときにはステップＳ１６により、表示部１３に予測変換候補を表示する。
【００４６】
ステップＳ１４のかな漢字変換用辞書の通常検索にて候補が得られなかったときは、ステップＳ１５にてかな漢字変換用辞書１４を用いて曖昧検索が行われ、予測変換候補を抽出することができたときにはステップＳ１６により、表示部１３に予測変換候補を表示する。
【００４７】
ステップＳ１３、ステップＳ１５にて行う曖昧検索は、例えば入力された読み文字列の一部の文字を他の文字へ置換することで一致する候補を抽出する処理である。置換する文字数は一文字以上で、読み文字列長を越えないものとする。この一致とは辞書に登録されている読み文字列の先頭の入力文字数分一致する候補を一致したと見なして良い。また、最初の一文字目が入力ミスをすることは少ないと捉えて、入力読み文字列の二文字目移行に対して、置き換えた読み文字列に一致すると判断してもかまわない。
【００４８】
他の文字列に置き換える場合の方法として、例えば「か」行の入力文字列は「か」行すべての読みがなである「か、き、く、け、こ」と一致したと判断してもよい。また、「ば」等の濁音文字、「ぱ」等の半濁音文字を対応する静音文字である「は」と一致したと判断してもかまわない。同様に「ゃ」等の拗音や促音「っ」を小書きしない文字「や」や「つ」に一致させることに限定してもよい。この場合、ＣＥ機器のように入力キーが少ない機器では１つのキーに複数の読み文字列を割り当てることができ、入力キーの節約をすることができるという利点がある。
【００４９】
また、曖昧検索として入力された読み文字列が入力が間違っている場合を救済するために、入力読み文字列に一文字追加することで一致する候補や一文字欠落させることで一致する候補を一致したとして判断することも許す。ここで入力文字列長により欠落させる数、追加する数を変化させることも可能とする。
【００５０】
ここで、ステップＳ１３やステップＳ１５の辞書の曖昧検索処理は特に行わなくてもかまわない。また、ステップＳ１３、ステップＳ１４、ステップＳ１５、ステップＳ１６の処理を組み合わせて処理を行い、総合的に抽出された予測変換文字列をステップＳ１６により表示部１３に表示してもかまわない。
【００５１】
また前記の手順により抽出される文字列候補数を押さえるために、辞書に登録された文字列の読み文字列長と入力よみ文字列長が同数または同数＋Ｎと制限することで候補数の表示量を制限する機能を付加しても良い。これも、ＣＥ機器の表示部１３の大きさに制限がある場合に有効である。
【００５２】
例えば、図６に表示したユーザ学習辞書１５の具体例を用いると、ステップＳ１３のユーザ学習辞書通常検索において、（「たん」＝２）＋１と制限した場合には、表示部１３には文字列長＋１＝３の“短歌”、“端部”、“箪笥”、“単位”、“短気”が利用頻度情報２３の順番に候補として抽出される。表示部１３には、これら５つの候補が表示されることになる。また、利用頻度情報２３に３以下という条件を設定していれば、図中破線より上の３つの候補が表示される。
【００５３】
なお、前記同数＋Ｎにおいて、Ｎは１でなくてもよいのはもちろんであり、表示部の大きさの都合により、Ｎ＝０，２，３・・・でもかまわない。
【００５４】
ステップＳ１６により予測変換候補が表示されたあとは、文字入力部１１からの制御により予測変換候補を選択することができる。ここで、選択した文字列は、ユーザ学習辞書１５に登録される。もちろん、既にユーザ学習辞書に登録されている文字列（語句）であれば前記利用頻度情報２３が更新される。
【００５５】
すなわち、図７に示すように、ステップＳ２１にて予測変換候補から文字列が選択されると、ステップＳ２２でユーザ学習辞書へ利用された文字列として記憶する。そして、ステップＳ２２で記憶された文字列は図５のステップＳ１２、１３の処理において利用することができる。
【００５６】
このように、図１に機能的な構成を示した第１の実施の形態のかな漢字変換装置１０では、特別な予測変換用辞書は用いず、ユーザ学習辞書１５を利用して、予測文字列の候補を抽出することができる。
【００５７】
また、図４又は図５に示した具体例の処理手順を繰り返すことにより、ユーザ学習辞書をあたかもかな漢字変換用辞書のキャッシュのように働かせ、かな漢字変換用辞書を検索する頻度を下げることができる。
【００５８】
個人が使う単語数は多くはないため、ある程度手順に示した作業を続けることでほぼユーザ学習辞書の検索だけで文字入力が可能となる。つまり全辞書検索する度合いが減り、検索時間が短縮されることになる。
【００５９】
そして、従来技術では予測変換辞書を通常のかな漢字変換用字書とユーザ学習辞書と予測変換用字書は別に持っていたが、この第１の実施の形態により特別に予測変換辞書を持つ必要がなくなり、辞書記憶領域の節約になる。
【００６０】
ここからは、本発明の第２の実施の形態について説明する。この第２の実施の形態も、図１に機能ブロックを示したようなかな漢字変換装置４０である。文字入力部１１で構成された読みがなをかな漢字変換処理部１２でかな漢字変換用辞書１４およびユーザ学習辞書１５の情報を用いてかな漢字変換処理をし、表示部１３に候補を表示する。
【００６１】
かな漢字変換処理部１２は１つ前に入力された文節の情報を記憶しておく記憶エリア（前文節記憶エリア）を有する。
【００６２】
ユーザ学習辞書１５内にはたとえば図８のように、以前連文節変換処理が行われた際に文節の切れ目や、接続関係を記憶する場所である文節間学習情報テーブルを有する。第一文節情報には変換文字列（かなを、今日は、品川区、ソニー、東京都）が記録されてなくても良い。この場合には変換次文字列を記録する場所の節約になるという利点がある。
【００６３】
図９には、このかな漢字変換装置４０の全体的な処理手順を示す。ステップＳ３１にて文字入力部１１から入力されるキーを読み込み読み文字列を生成する。また、以下の説明手順により表示部１３に候補文字列が表示されている場合はステップＳ３１において候補選択キーが入力される。
【００６４】
ステップＳ３２ではステップＳ３１において読み文字列が生成された場合は（ＮＯ：候補選択キーが操作されない場合）には、ステップＳ３４に進み、予測変換処理を行う。一方、表示部１３に候補が表示されている場合でかつ候補選択キーがステップＳ３１にて操作された場合にはステップＳ３３にて候補選択処理を行う。この図９の処理手順は、ステップＳ３３又はステップＳ３４の各処理後またステップＳ３１からの処理を繰り返すことになる。
【００６５】
図１０には、図９のステップＳ３４における予測変換処理の詳細を示す。前記ステップＳ３１にて読み文字列生成のためのキーが入力され（キー入力は、読み文字列作成のためのキー入力操作と、表示された候補文字列を選択するためのキー入力操作の２種類がある。）、読み文字列が生成される。
【００６６】
ステップＳ４２でかな漢字変換処理部１２は、前文節が登録されていない状態であるかの判断を行う。ここで、前文節がある場合（登録されている、又は記憶されている）は、ステップＳ４３にてユーザ学習辞書１５内にある文節間学習情報テーブル（接続関係を記憶する場所）を参照し、次文節の候補を抽出する。
【００６７】
たとえば文節間学習情報テーブルとして過去に学習されたデータより、図８のように学習されている場合、前文節として「品川区」が設定されていると、ステップＳ４３では「北品川」が次文節として抽出される。ここで入力されている読み文字列が「きたしながわ」の先頭から数文字の場合にはステップＳ４３の処理にて抽出される。
【００６８】
また前文節がある場合にはステップＳ４４において前文節の品詞情報に接続可能な付属語や接尾語や活用語尾の各テーブルを引き、接続可能な語を抽出する。
【００６９】
一方、前文節がない場合又はステップＳ４４の次に、ステップＳ４５において一般的な単語予測処理又は前記第１の実施の形態で行った単語抽出を行う。
【００７０】
ステップＳ４６においてステップＳ４３、ステップＳ４４、ステップＳ４５により抽出された文字列の有無を判断する。文字列がある場合にはその文字列を予測文字列として、ステップＳ４７で表示部１３へ表示する。
【００７１】
次に、図１１には図９のステップＳ３３にて行われる候補選択処理の詳細を示す。この候補選択処理は、予測変換処理にて予測された候補が表示部１３に表示されたのを受けて、図９のステップＳ３２にて候補選択キーが操作されるか否かが判断された後に行われる。よって、図１０のステップＳ４７（予測変換処理の一部）により表示部１３に予測変換文字列が表示されている候補群から、ステップＳ５１により候補選択処理が行われる。
【００７２】
そして、ステップＳ５２により表示部１３に表示されている候補文字列が選択決定した場合に、ステップＳ５３でかな漢字変換処理部１２に記憶されている前文節の有無が判断される。もし前文節が記憶されている場合にはステップＳ５４で前記図８のような形式でユーザ学習辞書１５に二文節間情報が記録される。
【００７３】
単語予測処理として前記第１の実施の形態を利用する場合には、前記図７の処理手順により選択された単語の単語辞書学習を行う。
【００７４】
次にステップＳ５５にて選択された文字列を前文節としてかな漢字変換処理部１２に記録する。ステップＳ５６では図１０の手順により決定された文節に接続する文字列を第一文節として次文節の抽出作業を行う。この作業により文字列が抽出された際にはステップＳ５７において次文節の候補として表示部１３に表示を行う。
【００７５】
ステップＳ５３からステップＳ５５の文節間学習と前文節情報の記録作業および単語辞書学習の順番を変えてもかまわない。また、ステップＳ４４で抽出された文字列が選択決定された際には、ステップＳ５３とステップＳ５４を行わず、ステップＳ５５の処理として前文節に文字列の追加を行うことで１つの文節に合成して自立語として取り扱うことができるため、文字列合成処理をするだけでもかまわない。
【００７６】
したがって、この第２の実施の形態のかな漢字変換装置４０では、前文節があれば読み文字列を入力することなく、利用者に提示する次文節の文字列から選択処理を繰り返すことで日本語文章を組み立てることが出来るようになる。
【００７７】
また、従来技術では次文節予測変換を行うために通常のかな漢字変換用字書とユーザ学習辞書と次文節情報辞書は別に持っていたが、この第２の実施の形態では、特別に次文節予測変換辞書を持つ必要がなくなり、辞書記憶領域の節約になる。
【００７８】
ここからは、本発明の第３の実施の形態について説明する。この第３の実施の形態も、図１に機能ブロックを示したようなかな漢字変換装置５０である。文字入力部１１で構成された読みがなをかな漢字変換処理部１２でかな漢字変換用辞書１４およびユーザ学習辞書１５の情報を用いてかな漢字変換処理をし、表示部１３に候補を表示する。
【００７９】
かな漢字変換処理部１２には図１２に示す変換候補５２とそのタグ（ＩＤ）５１と変換候補の読み文字列５２を保持しておく記憶エリアを有する。読み文字列を保持する場所はかな漢字変換用辞書等の漢字文字列情報が記憶されている装置や位置を指し示す目印（ポインター）でもよい。
【００８０】
この場合、読み文字列の全情報を保持しておく必要がないため読みデータを保持しておくメモリ資源の節約になる。また読み文字列を指し示す目印を前述のタグに含めてしまってもかまわない。
【００８１】
氏名の入力欄およびその読みがなを入力するシステムを例に処理手順を説明する。想定するシステムは図１３の６１のように氏名の読み文字列を入力する欄６２と、氏名を入力する欄６３と、予測変換文字列候補を表示するエリア６４を有する。
【００８２】
文字入力部１１により文字が入力された場合、図１４のステップＳ６１（予測変換候補抽出処理）でかな漢字変換処理部１２において予測変換候補の抽出処理が行われる。
【００８３】
文字入力部１３から「わ」を入力した際に得られた候補例が図１２に示すようなものであった場合、予測変換候補には候補文字列５２とそれに対応したタグ５１を付加しておく。タグ５１は候補文字列５２が特定できる形態であれば構造は問わない。
【００８４】
予測変換候補５２およびそのタグ５１の対をテーブルとしてかな漢字変換処理部１２の記憶エリアに保存しておく。また候補文字列抽出時に変換候補文字列と同時にかな漢字変換用辞書１４より読み文字列情報５３を抽出しておきテーブル（かな漢字変換処理部１２内）に記録しておく。
【００８５】
入力された文字列「わ」は読み文字列表示エリア６２に、得られた候補文字列は表示エリア６４に表示される。
【００８６】
そして、図１４のステップＳ６２の候補手順（候補選択）により候補エリア６４に表示されている候補のうち目的とする文字列「若松」を選択する。選択処理が行われると氏名表示エリア６６には選択した候補文字列が表示される。
【００８７】
ステップＳ６３で、読み文字列が必要の有無が判断される。この手順において読み文字列が特に必要としていないアプリケーションであれば処理が終了する。
【００８８】
例として仮定しているアプリケーションでは読み文字列を必要とするため、ステップＳ６４で、選択された文字列のタグをかな漢字変換処理部１２に送る。かな漢字変換処理部１２ではステップＳ６１で保持したデータテーブルと照合することで、元の読み文字列を抽出する。
【００８９】
そして、ステップＳ６５にて、抽出された読み文字列５３を読み入力部６８に表示する。
【００９０】
このように、この第３の実施の形態のかな漢字変換装置５０によれば、日本語かな漢字変換システムにおいて予測変換を利用している場合であっても変換文字列の正しい読み文字列を取得することができるようになる。
【００９１】
なお、第１，第２，第３の実施の形態の、かな漢字変換装置１０，４０，５０は、例えば内部バスを介してＣＰＵにＲＯＭ、ＲＡＭ、ＨＤＤ、文字入力部、表示部、通信インターフェースを接続した構成とされる。この構成は、ＣＥ機器にあってコンピュータシステムをなす。このコンピュータシステムが、例えばＲＯＭ、或いはＨＤＤに格納された、本発明の各かな漢字変換プログラムをＲＡＭをワークエリアとして逐次実行することによってかな漢字変換装置の機能を持つことになる。各かな漢字変換プログラムは、本発明の各かな漢字変換方法に基づいて各手順を構成している。
【００９２】
【発明の効果】
本発明によれば、かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムにあって、特別に予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができる。
【００９３】
また、本発明によれば、かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムにあって、特別に次文節予測変換辞書を持つ必要がなくなり、辞書記憶領域を節約することができる。
【００９４】
また、本発明によれば、かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラムにあって、日本語かな漢字変換システムにおいて予測変換を利用している場合であっても変換文字列の正しい読み文字列を取得することができる。
【図面の簡単な説明】
【図１】第１〜第３の実施の形態のかな漢字変換装置１０、４０、５０の機能ブロック図である。
【図２】ユーザ学習辞書１５の具体例（Ａ）と、かな漢字変換用辞書１４の具体例（Ｂ）を示す図である。
【図３】ユーザ学習辞書１５の他の具体例を示す図である。
【図４】かな漢字変換装置１０が表示部１５に予測文字列候補を表示するまでの処理手順の第１具体例を示すフローチャートである。
【図５】かな漢字変換装置１０が表示部１５に予測文字列候補を表示するまでの処理手順の第２具体例を示すフローチャートである。
【図６】ユーザ学習辞書のさらに他の具体例を示す図である。
【図７】予測変換候補を選択することで、選択した文字列をユーザ学習辞書に登録する処理手順を示すフローチャートである。
【図８】文節間学習情報テーブルの具体例を示す図である。
【図９】第２の実施の形態のかな漢字変換装置の全体的な処理手順を示すフローチャートである。
【図１０】前記図９のステップＳ３４における予測変換処理の詳細を示すフローチャートである。
【図１１】図９のステップＳ３３にて行われる候補選択処理の詳細を示すフローチャートである。
【図１２】第３の実施の形態のかな漢字変換装置で用いる、変換候補５２とそのタグ（ＩＤ）５１と変換候補の読み文字列５２を保持しておく記憶エリアを示す図である。
【図１３】氏名の入力欄およびその読みがなを入力するシステムを想定したときの処理手順を説明するための図である。
【図１４】第３の実施の形態のかな漢字変換装置の全体的な処理手順を説明するためのフローチャートである。
【符号の説明】
１０，４０，５０かな漢字変換装置、１１文字入力部、１２かな漢字変換処理部、１３表示部、１４かな漢字変換用辞書、１５ユーザ学習辞書

Claims

入力された読み文字列についてかな漢字変換を行うかな漢字変換装置において、
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、
前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書と、
前記入力された読み文字列を前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索する文字列予測手段と、
前記文字列予測手段により抽出された少なくとも一つの予測文字列候補を表示する表示手段とを備え、
前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させ、
前記文字列予測手段は、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する
かな漢字変換装置。
前記文字列予測手段は、前記ユーザ学習辞書及び／又はかな漢字変換用辞書に登録された文字列の読み文字列長を、前記入力読み文字列長と同数または前記入力読み文字列長と同数＋Ｎに制限して予測文字列候補を抽出する請求項１記載のかな漢字変換装置。
前記文字列予測手段は、前記表示手段における表示可能文字列数に基づいて設定された表示個数に応じて前記予測文字列候補を抽出する請求項１記載のかな漢字変換装置。
前記表示手段によって表示された前記予測文字列候補から所望の文字列を選択させることで所望の文書を作成する日本語文書作成装置に適用される請求項１記載のかな漢字変換装置。
入力された読み文字列についてかな漢字変換を行うためのかな漢字変換方法において、
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書とを、文字列予測手段が、前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索することで前記入力された読み文字列の変換文字列を予測する文字列予測工程と、
前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示処理手段が表示部に表示する表示工程とを備え、
前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させ、
前記文字列予測工程では、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する
かな漢字変換方法。
前記文字列予測工程では、前記文字列予測手段が、前記ユーザ学習辞書及び／又はかな漢字変換用辞書に登録された文字列の読み文字列長を、前記入力読み文字列長と同数または前記入力読み文字列長と同数＋Ｎに制限して予測文字列候補を抽出する請求項５記載のかな漢字変換方法。
前記文字列予測工程では、前記文字列予測手段が、前記表示工程における表示可能文字列数に基づいて設定された表示個数に応じて前記予測文字列候補を抽出する請求項５記載のかな漢字変換方法。
前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させることで所望の文書を作成する日本語文書作成装置に適用される請求項５記載のかな漢字変換方法。
入力された読み文字列についてかな漢字変換を行うかな漢字変換装置によって実行されるかな漢字変換をコンピュータに実行させるためのかな漢字変換プログラムにおいて、
入力された読み文字列をかな漢字変換するための情報が記録されたかな漢字変換用辞書と、前記かな漢字変換用辞書に含まれる文字列の利用頻度情報を当該文字列をかな漢字変換するための情報と共に記録するためのユーザ学習辞書とを、コンピュータの文字列予測機能部が、前記ユーザ学習辞書を検索した後、前記かな漢字変換用辞書を検索することで前記入力された読み文字列の変換文字列を予測する文字列予測工程と、
コンピュータが、前記文字列予測工程により抽出された少なくとも一つの予測文字列候補を表示部に表示する表示工程とを備え、
前記表示工程によって表示された前記予測文字列候補から所望の文字列を選択させ、
前記文字列予測工程では、前記ユーザ学習辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記ユーザ学習辞書を検索し、この検索を行っても予測文字列候補がないと判定されたとき、前記かな漢字変換用辞書を検索し、前記かな漢字変換用辞書を検索して予測文字列候補がないと判定されたとき、さらに前記読み文字列の一文字を他の文字に置換したり、一文字欠落させたり、一文字追加してから前記かな漢字変換用辞書を検索する
かな漢字変換プログラム。