JP4847210B2

JP4847210B2 - 入力変換学習プログラム、入力変換学習方法及び入力変換学習装置

Info

Publication number: JP4847210B2
Application number: JP2006138080A
Authority: JP
Inventors: 宏之町屋
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2006-05-17
Filing date: 2006-05-17
Publication date: 2011-12-28
Anticipated expiration: 2026-05-17
Also published as: JP2007310589A

Description

本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に関する。

コンピュータシステムにおける入力方法において、漢字仮名混じりの日本語の文章を入力するために、先ず仮名で入力した文字列を順次必要に応じて漢字に変換していくことが一般的である。かかる変換方法では、仮名による文字列に対し複数の変換候補を変換候補リストに列挙して選択させることが行われている。

このような変換をより効率的に行うために、変換のために直近において選択された変換候補を変換候補リストの最優先に配置するという学習機能を持たせることが多い。また、さらに効率的な変換を行うために、例えば、特許文献１には、言語モデルとして読み込まれたユーザファイルに含まれる文章を形態素解析した結果から、ある形態素とこれに連接する形態素との連接組み合わせでの出現確率を算出しておき、該連接組み合わせの仮名入力の変換の際に、該出現確率が最も高い連接組み合わせを変換候補として選択する仮名入力変換方法が開示されている。

特開２００４−１１８４６１号公報

しかしながら、上記特許文献１に代表される従来技術では、連接組み合わせの出現確率は、言語モデルとして読み込まれたユーザファイルに含まれる文章に当該連接組み合わせが存在する場合にのみ算出可能であることから、出現確率が最も高い連接組み合わせを変換候補として選択するためには、より多くのユーザファイルを読み込んでより多くの連接組み合わせの出現確率を算出しておかなければならない。

また、ユーザファイルの読み込みはマニュアルで行わなければならないことから、能動的な手続きが煩雑であるのみならず、読み込むユーザファイルの選択が適切でない場合には、必要とする連接組み合わせの学習がなされていないこととなり、効率的な仮名入力変換の用をなさなくなってしまいかねなかった。

本発明は、上記問題点（課題）を解消するためになされたものであって、文字列操作に応じて自動的に言語モデルを取り込んで該言語モデルに含まれる文章の語彙を順序付けし、この順序付けに従った変換候補のリスト表示から変換候補を選択可能とすることによって、自動的かつ容易で効率的な仮名入力変換を行うことが可能な入力変換学習プログラム、入力変換学習方法及び入力変換学習装置を提供することを目的とする。

上述した問題を解決し、目的を達成するため、本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラムであって、前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知手順と、前記文字列処理検知手順により検知された文字列を語彙に分解する文字列分解処理手順と、前記文字列分解処理手順により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手順と、前記語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順とをコンピュータに実行させることを特徴とする。

また、本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習方法であって、前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知工程と、前記文字列処理検知工程により検知された文字列を語彙に分解する文字列分解処理工程と、前記文字列分解処理工程により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理工程と、前記語彙重み付け処理工程により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理工程とを含んだことを特徴とする。

また、本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習装置であって、前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理手段と、前記文字列処理手段により検知された文字列を語彙に分解する文字列分解処理手段と、前記文字列分解処理手段により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手段と、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に記憶する変換学習記憶手段と、前記変換学習記憶手段に、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に登録する語彙登録処理手段とを備えたことを特徴とする。

本発明によれば、文字列分解処理手順により得られた語彙毎に文字列処理に応じた重み付けを行う語彙重み付け処理手順と、語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順を含んだので、読み仮名に対する語彙を文字列処理に応じた重み付けで評価して順序付けすることができるという効果を奏する。

以下に添付図面を参照して、本発明の入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係る好適な実施例を詳細に説明する。なお、以下の実施例では、本発明を、コンピュータシステムに予め実装されている日本語入力変換プログラムとは別にさらに実装することによって、該日本語入力変換プログラムの入力変換学習機能を補完する機能を有する入力変換学習プログラム、入力変換学習方法及び入力変換学習装置について説明することとする。また、コンピュータシステムに限らず、携帯電話機における入力変換システムへも適用可能である。

先ず、本実施例の入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステム構成を説明しつつ、本実施例の特徴を説明することとする。図１は、本実施例の入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステム構成の概念を示す図である。

同図に示すように、本実施例のシステムは、自動学習システム１００と、Ｗｅｂブラウザ２００ａ、電子メールアプリケーション（いわゆるMailer）２００ｂ及びエディタ２００ｃなどの他システム２００と、日本語入力変換プログラムで実現される言語入力システム３００とを含んで構成されるものである。自動学習システム１００、他システム２００及び言語入力システム３００は、一のコンピュータシステムに同時に実装されるアプリケーションソフトウェア群である。

自動学習システム１００は、入力変換の自動学習処理の実行態様としてのプロセスに相当する自動学習アプリケーション１００ａと、自動学習アプリケーション１００ａによる入力変換学習処理結果を学習記憶するための言語辞書ＤＢ（Data Base）１０５ｃとを有する。

言語入力システム３００は、日本語の仮名漢字入力変換処理の実行態様としてのプロセスに相当する言語入力アプリケーション３００ａと、言語入力アプリケーション３００ａによる仮名漢字入力変換を行うために仮名と漢字（又は変換文字）とを対応付けて記憶している変換辞書ＤＢ３０５ｃとを有する。

ここで、従来のシステムでは、言語入力システム３００の言語入力アプリケーション３００ａが、入力された仮名に対応して一度選択され変換された漢字（又は変換文字）を、変換辞書ＤＢを３０５ｃ参照して再度読み出して変換候補として表示する際に、該表示を優先的に行うことによって、当該仮名に対応して該漢字（又は変換文字）が優先的に選択され変換処理されうるという変換辞書ＤＢ３０５ｃの学習機能を有することによって、効率的な仮名漢字入力変換を行うこととしていた。

しかし、かかる学習機能では、入力された仮名が一度変換文字に変換されないと機能しないために、初めて入力する仮名に対して適切な変換文字を変換選択候補として提示することができず、効率的な仮名漢字変換を実現することができなかった。

特に、コンピュータシステムにおける文字列操作は、仮名の入力及び該仮名の変換文字への変換のみではなく、表示、選択、コピー、ペーストなど多岐に亘り、このような入力変換とは異なる文字列操作が行われた文字列又は語彙が入力変換の対象となる場合も多い。

本発明は、かかる問題点に着目してなされたものであって、入力変換とは異なる文字列操作をも変換学習の対象とし、以って、初めて入力された仮名に対しても適切な変換文字を変換候補として提示可能とし、効率的な仮名漢字変換を実現することを目的とする。

具体的には、自動学習アプリケーション１００ａは、他システム２００において表示、選択、コピー、ペースト又は変換された文字列から語彙を抽出し、表示、選択、コピー、ペースト又は変換それぞれに応じてポイントを付与する重み付けを行ってから言語辞書ＤＢ１０５ｃへ格納する。

そして、言語入力アプリケーション３００ａは、入力された仮名を変換文字へ変換する際に、変換辞書ＤＢ３０５ｃから変換候補を取得するのみならず、自動学習アプリケーション１００ａの言語辞書ＤＢ１０５ｃからも、入力された仮名に対応する変換候補を取得し、変換辞書ＤＢ３０５ｃの変換候補の表示順を前述の重み付けに従って修正する。

自動学習システム１００を導入すると、表示、範囲選択、コピー、ペースト、変換などの各種の文字列操作が行われる毎にリアルタイムで変換候補の表示順が変更されることとなる。よって、必要とされる変換候補を常に最新の状態で変換候補リストの上位に表示させることが可能となり、入力変換処理の効率性を高めかつ維持することが可能となる。

なお、実施例では、この変換候補の表示順の修正は、変換辞書ＤＢ３０５ｃから取得した所定順序で順序付けられた変換候補全てに優先させ、言語辞書ＤＢ１０５ｃから取得した所定順序で順序付けられた変換候補を表示するとするが、これに限らず、言語辞書ＤＢ１０５ｃに記憶される語彙の重み付けに従って変換辞書ＤＢ３０５ｃに記憶される変換文字の表示順序を変更することとしてもよい。

次に、図１に示した入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステムで処理される自動学習機能の処理例を説明する。図２は、図１に示した入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステムで処理される自動学習機能の処理例を示す図である。

同図に示すように、例えば、表示、選択、コピー、ペースト及び変換の各事象の事象毎の重み付けとしてのポイントを次のように定義する。即ち、表示：１（点）、範囲選択：３（点）、コピー：５（点）、ペースト：７（点）、変換：９（点）とする（図２（１））。

このように重み付けのポイントが定義されている状況で、図示するようなメールを長岡さんが受け取って表示する（図２（２））。続いて、本実施例の自動学習システム１００による自動学習機能が、形態素解析を行って、図示するメールの文章内から語彙を抽出し、各語彙に対してポイントを付与する。なお、自動学習機能は、仮名に逆変換可能な語彙を抽出してポイントを付与するが、本例示においては、説明を簡明にするために、特に抽出語彙を氏名のみに着目して説明することとする。すると、抽出語彙及び各語彙に付与されたポイントは、図２（３）の図表に示すように、全ての語彙は“表示”の事象が行われたことにより１（点）となる。

この後、長岡さんが次の操作を行ったとする。即ち、「弘之」の語彙をコピー及びペーストし、「弘幸」の語彙のコピーを行った。この場合に、“コピー”という操作としての事象に対しては５（点）が与えられるものであり、“ペースト”という事象に対しては７（点）が与えられることから、「弘之」のポイントは、“表示”の１（点）に加えて“コピー”の５（点）及び“ペースト”の７（点）が付与されるために１＋５＋７＝１３（点）となる。また、「弘幸」のポイントは、“表示”の１（点）に加えて“コピー”の５（点）が付与されるために１＋５＝６（点）となる。このように、事象が発生し検知される毎に、ポイント合計値に各事象に対応するポイント（点数）が加算されることとなる。

この後、長岡さんが「ひろゆき」という語彙を言語入力アプリケーション３００ａを使用して変換する場合に、ポイントが最も高い「弘之」が最優先に、次にポイントが高い「弘幸」が優先されて、変換候補の優先候補として表示されることとなる。

次に、図１に示した自動学習システムの構成について説明する。図３は、図１に示した自動学習システムの構成を示す機能ブロック図である。自動学習システム１００はコンピュータシステムに自動学習アプリケーション１００ａ及び言語辞書１０５ｃを実装して実現される入力変換学習装置である。同図に示すように、自動学習システム１００は、事象検知判定処理部１０１と、対象文字列読み込み処理部１０２と、形態素解析処理部１０３と、形態素ポイント処理部１０４と、記憶部１０５と、変換処理検知部１０６と、変換候補追加優先表示処理部１０７とを有する。

事象検知判定処理部１０１は、他システム２００において文字列の処理が行われたことを検知し、該処理が事象ＤＢ１０５ａに登録されている表示、選択、コピー、ペースト又は変換の何れかの処理であるか否かを判定する。事象検知判定処理部１０１は、検知した文字列の処理が事象ＤＢ１０５ａの事象テーブルに登録されている表示、選択、コピー、ペースト又は変換の何れかの処理であると判定したならば、検知文字列を対象文字列読み込み処理部１０２へ受け渡すこととなる。

対象文字列読み込み処理部１０２は、表示、選択、コピー、ペースト又は変換された文字列を形態素解析の処理対象文字列として読み込み、形態素解析処理部１０３へ受け渡す。形態素解析処理部１０３は、処理対象文字列を形態素解析し、解析した結果を形態素解析結果データＤＢ１０５ｂの形態素解析結果データテーブルに記憶する。

形態素解析処理部１０３が形態素解析結果を形態素解析結果データテーブルに記憶したならば、形態素ポイント処理部１０４は、図示しない読み仮名を登録した辞書を参照して各形態素に読み仮名を付する。さらに、事象検知判定処理部１０１が検知した事象に応じたポイントを各形態素に付与して該ポイントのポイント合計値を算出する。各形態素の品詞は形態素解析により判明している。よって、“読み”に対応する“品詞”、“語句”、“ポイント合計値”を、言語辞書ＤＢ１０５ｃの言語辞書テーブルに記憶していくこととなる。このとき、同音語を区別するために、“読み”に対応する“品詞”、“語句”、“ポイント合計値”のレコードに“枝番”を付して、一の“読み”に対応する複数の“語句”を識別可能とする。

変換処理検知部１０６は、言語入力システム３００において入力変換処理の指示が行われたことを検知し、入力変換処理の指示を検知したことを変換候補追加優先表示処理部１０７へ通知する。変換処理検知部１０６から入力変換処理の指示の検知を通知された変換候補追加優先表示処理部１０７は、入力変換処理の対象となる仮名で表される“読み”に対応する全てのレコードの情報を言語辞書ＤＢ１０５ｃから読み出して、ポイント合計値の高い順序で言語入力システム３００に受け渡す。言語辞書ＤＢ１０５ｃから読み出されて受け渡された情報は、言語入力システム３００における入力変換候補の一覧表示において変換候補として優先的に追加表示されることとなる。

次に、図３に示した形態素解析結果データＤＢ１０５ｂに格納される形態素解析結果データテーブルについて説明する。図４は、形態素解析結果データテーブルのテーブルイメージを示す図である。同図に示すように、形態素解析結果データテーブルは、“語句”と“品詞”のカラムを有する。“語句”は、形態素解析によって品詞に分解されかつ原型変換されたものが格納されている。“品詞”は、形態素解析によって判明した品詞である。なお、形態素解析結果データテーブルは一時記憶のためのテーブルであるので、形態素解析結果の語彙が言語辞書ＤＢ１０５ｃへ格納された後には、該形態素解析結果は消去されることとなる。

図４を具体的に見ると、「先生は学校へ車で行った」という文字列（文章）を品詞分解すると「先生△は△学校△へ△車△で△行っ△た」（“△”は形態素の区切りを表す）となり、さらにこれを原型変換すると「先生△は△学校△へ△車△で△行く△た」となる。この“先生”、“は”、“学校”、“へ”、“車”、“で”、“行く”、“た”の各語彙の品詞を判定し該品詞判定結果とともに各語彙を形態素解析結果データテーブルに記憶することとなる。

次に、図３に示した言語辞書ＤＢ１０５ｃに格納される言語辞書テーブルについて説明する。図５は、言語辞書テーブルのテーブルイメージを示す図である。同図に示すように、言語辞書テーブルは“読み”と、“枝番”と、“品詞”と、“語句”と、“ポイント合計値”とのカラムを有する。“読み”は、各“語句”に対応する読みを示す読み仮名である。枝番は、一の“読み”に対して複数の“語句”が対応する場合のために、当該“読み”に対応する各“語彙”を識別するための識別子である、“品詞”は、形態素解析によって判明した当該“語句”の品詞名である。“ポイント合計値”は、当該“語句”に対してなされた文字列操作である事象の種別に応じて付与されたポイントの合計値である。このポイントは、常に加算されていくものであり、減算されることは一切ない。

次に、図３に示した事象ＤＢ１０５ａに格納される事象テーブルについて説明する。図６は、事象テーブルのテーブルイメージを示す図である。同図に示すように、事象テーブルは、“事象”と、“ポイント”とのカラムを有する。“事象”は、処理対象文字列に対してなされた処理の種別を示す。具体的には、「表示」は文字列の表示を示し、「範囲選択」は文字列の反転表示による選択を示す。また、「コピー」は文字列のコピーを示し、「ペースト」はコピーした文字列の貼り付けを示す。また、「変換」は入力文字列の仮名漢字変換を示す。

なお、図６に示す事象テーブルのイメージ図では、表示：１（点）、範囲選択：３（点）、コピー：５（点）、ペースト：７（点）、変換：９（点）と、各事象に対してポイントが割り振られているが、当該事象テーブルに登録してポイント加算対象の事象として認識する事象の種別及び各事象に割り当てられるポイント数は、一例を示すに過ぎず、自動学習システム１００、他システム２００及び言語入力システム３００の利用態様に応じて適宜変更可能な事項である。

次に、図１に示した自動学習システム１００において実行される言語辞書テーブル登録処理手順について説明する。図７は、言語辞書テーブル登録処理手順を示すフローチャートである。以下の処理は、事象検知判定処理部１０１、対象文字列読み込み処理部１０２、形態素解析処理部１０３又は形態素ポイント処理部１０４により実行される処理である。同図に示すように、先ず、他システムにおける文字列に対する事象の発生を検知したか否かを判定する（ステップＳ１０１）。他システムにおける文字列に対する事象の発生を検知したと判定された場合に（ステップＳ１０１肯定）、ステップＳ１０２へ処理を移し、判定されなかった場合に（ステップＳ１０１否定）、ステップＳ１０１を繰り返す。

次に、発生した事象が事象テーブルに存在するか否かを判定し（ステップＳ１０２）、存在すると判定されるならば（ステップＳ１０２肯定）、ステップＳ１０３へ処理を移し、存在すると判定されないならば（ステップＳ１０２否定）、ステップＳ１０１へ処理を移す。

ステップＳ１０３では、処理対象文字列を形態素解析し、結果を形態素解析結果データテーブルに格納する。続いて、対象となるすべての文字列について形態素解析されたか否かを判定し（ステップＳ１０４）、全ての文字列について形態素解析されたと判定された場合に（ステップＳ１０４肯定）、ステップＳ１０５へ処理を移し、全ての文字列について形態素解析されたと判定されなかった場合に（ステップＳ１０４否定）、ステップＳ１０３へ処理を移す。

ステップＳ１０５では、形態素解析結果データの語句と品詞を元に言語辞書テーブルを検索する。続いて、検索対象が言語辞書テーブルに存在するか否かを判定し（ステップＳ１０６）、存在すると判定される場合に（ステップＳ１０６肯定）、検索されたレコードのポイント合計値に事象テーブルのポイントを加算し（ステップＳ１０７）、存在すると判定されなかった場合に（ステップＳ１０６否定）、読みに対する語句のレコードを新規追加し、ポイント合計値に事象テーブルのポイントを加算する（ステップＳ１０８）。ステップＳ１０７又はステップＳ１０８が終了した場合には、ステップＳ１０９へ処理を移す。

ステップＳ１０９では、対象となる全ての形態素解析結果データについて言語辞書テーブルが検索されたか否かを判定し、全ての形態素解析結果データについて言語辞書テーブルが検索されたと判定される場合に（ステップＳ１０９肯定）、言語辞書テーブル登録処理を終了し、全ての形態素解析結果データについて言語辞書テーブルが検索されたと判定されなかった場合に（ステップＳ１０９否定）、ステップＳ１０５へ処理を移す。

次に、図１に示した自動学習システム１００において実行される言語辞書テーブル読み出し処理手順について説明する。図８は、言語辞書テーブル読み出し処理手順を示すフローチャートである。以下の処理は、変換処理検知部１０６又は変換候補追加優先表示処理部１０７により実行される処理である。同図に示すように、先ず、言語入力システムにおける変換処理の指示を検知したか否かを判定する（ステップＳ２０１）。変換処理の指示を検知したと判定される場合に（ステップＳ２０２）、入力された「読み」に対応する変換候補を、ポイントが高い順序で言語辞書ＤＢ１０５ｃから読み出し、言語入力システムへ受け渡す。入力された「読み」に対応する変換候補をポイントが高い順序で受け渡された言語入力システム３００は、変換辞書３０５ｃから読み出して表示する変換候補に追加しかつ該変換候補に優先させて、言語辞書ＤＢ１０５ｃからの変換候補をポイントの高い順序で追加表示することとなる。

次に、図１に示した言語入力システムが自動学習システムと連携した場合に、該言語入力システムにおける変換候補の表示例について説明する。図９は、言語入力システムにおける変換候補の表示例を示す図である。同図では、“きしゃ”という文字列を変換する場合を例示している。

言語辞書ＤＢ１０５ｃの言語辞書テーブルには、この“きしゃ”の“読み”に対応する“語句”として“貴社”、“汽車”、“記者”、“帰社”の各語句が記憶されており、それぞれのポイントが“８”、“７”、“５”、“１”となっている。このポイントが高い順序で言語辞書テーブルから言語入力システム３００へ受け渡され、言語入力システム３００の変換候補の表示リストの先頭から該順序で表示されることとなる。即ち、変換候補の表示リストの１番目から４番目は、言語辞書テーブルから読み出されて表示されたものである。

一方で、言語入力システム３００の変換候補の表示リストの５番目以降は、変換辞書ＤＢ３０５ｃの変換辞書テーブルから読み出される本来の変換候補である。このように、変換辞書ＤＢ３０５ｃの変換辞書テーブルから読み出される変換候補に優先させて語辞書ＤＢ１０５ｃの言語辞書テーブルに記憶されている変換候補を表示させると、最近において文字列操作が行われたことによって選択される可能性がより高い変換候補を変換候補の表示リストの上位に優先的に表示させることとなり、仮名漢字変換の効率性をより高めることができる。

なお、上記実施例で説明した各処理は、あらかじめ用意されたプログラムをパーソナルコンピュータ、サーバ又はワークステーションなどのコンピュータシステムで実行することによって実現することができる。

上記実施例によれば、アプリケーションは、仮名漢字入力変換の対象であるアプリケーションのみならず、コンピュータシステムにおいて実行される他のアプリケーションをも含むので、多様なアプリケーションで行われる文字列操作を語彙の重み付けの契機とすることができ、使用頻度を性格に反映したより正確な語彙の重み付けを行うことが可能となる場合がある。

また、上記実施例によれば、入力変換処理検知手順により入力変換処理が検知されると、該入力変換処理に際して入力された変換対象の仮名文字列に一致するよみ仮名に対応する語彙を変換学習データベースから読み出し、重み付けの順位が高い順序で変換候補として表示可能に仮名漢字変換システムに受け渡す変換候補受け渡し手順を含んだので、文字列処理に応じた重み付けで評価して順序付けられた語彙を、変換候補のリストの上位に重み付けの順位が高い語彙を表示させて変換効率の向上を図ることができる場合がある。

以上、本発明の実施例を説明したが、本発明は、これに限られるものではなく、特許請求の範囲に記載した技術的思想の範囲内で、更に種々の異なる実施例で実施されてもよいものである。また、実施例に記載した効果は、これに限定されるものではない。

上記実施例では、形態素解析の結果である語彙を、言語辞書ＤＢ１０５ｃの言語辞書テーブルへ登録する語句の単位としている。しかし、これに限らず、語彙と語彙とが結合した複合語も語句として登録するようにしてもよい。このようにすることによって、変換処理の利便性、効率性がより高まることがある。また、語彙の抽出方法は、形態素解析に限られるものではない。

上記実施例では、コンピュータシステムが本来有する言語入力システムに追加して機能させることにより、変換以外の文字列操作を入力変換候補の学習結果に反映させることとしている。そのために、変換以外の文字列操作が行われた語句を、言語辞書テーブルへ次々と新規に登録していくという方式を取っている。しかし、これに限らず、言語入力システム３００の変換辞書３０５ｃの変換辞書テーブルの仕様を変更し、直接この変換辞書テーブルに文字列操作に応じたポイントを記録していくこととし、変換候補の表示時に、該ポイントの高い順に表示を行うこととしてもよい。このようにすると、言語辞書ＤＢ１０５ｃの言語辞書テーブルを用意する必要が省け、コンピュータ資源の節約を図ることができることがある。若しくは、言語入力システム３００が変換辞書として、言語辞書ＤＢ１０５ｃの言語辞書テーブルを参照することとしてもよい。

また、上記実施例で示した自動学習システム１００の機能及び処理を言語入力システム３００が包含するような態様の実施例であってもよい。または、言語入力システム３００の機能及び処理を自動学習システム１００が包含するような態様の実施例であってもよい。これらによれば、入力変換に係るシステムが自動学習システム１００又は言語入力システム３００に一本化されるので、システム構成がシンプルとなり、メンテナンスの容易性が向上することがある。

上記実施例によれば、Ｗｅｂブラウザ２００ａ、電子メールアプリケーション２００ｂ、エディタ２００ｃ（ワード・プロセッサなども同様）などの他システム２００においてなされた表示、範囲選択、コピー、ペースト、変換などの文字列操作に応じて操作対象の語彙に重み付けを行って言語辞書ＤＢ１０５の言語辞書テーブルに登録する。言語入力システム３００における入力変換に際して、言語辞書ＤＢ１０５の言語辞書テーブルの登録内容を読み出し、入力変換候補の候補リストの上位に表示させることによって、ある入力仮名を文字列操作がより頻繁に行われた語彙へと効率的に変換することが可能となる場合がある。

なお、“読み”に対応する“語句”は、漢字に限られるものではなく、平仮名や片仮名、英数字、各種記号や標印などであってもよい。

（付記１）変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラムであって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知手順と、
前記文字列処理検知手順により検知された文字列を語彙に分解する文字列分解処理手順と、
前記文字列分解処理手順により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手順と、
前記語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順と
をコンピュータに実行させることを特徴とする入力変換学習プログラム。

（付記２）前記アプリケーションは、前記仮名漢字入力変換の対象であるアプリケーションのみならず、前記コンピュータシステムにおいて実行される他のアプリケーションをも含んだことを特徴とする付記１に記載の入力変換学習プログラム。

（付記３）前記文字列処理は、文字列の表示、範囲選択、コピー、ペースト若しくは仮名漢字入力変換を含んだことを特徴とする付記１又は２に記載の入力変換学習プログラム。

（付記４）前記コンピュータにおける入力変換システムが入力変換処理を行ったことを検知する入力変換処理検知手順と、
前記入力変換処理検知手順により入力変換処理が検知されると、該入力変換処理に際して入力された変換対象の仮名文字列に一致する前記読み仮名に対応する語彙を変換学習データベースから読み出し、前記重み付けの順位が高い順序で前記変換候補として表示可能に前記仮名漢字変換システムに受け渡す変換候補受け渡し手順と
をコンピュータに実行させることを特徴とする付記１〜３の何れか一つに記載の入力変換学習プログラム。

（付記５）変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習方法であって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知工程と、
前記文字列処理検知工程により検知された文字列を語彙に分解する文字列分解処理工程と、
前記文字列分解処理工程により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理工程と、
前記語彙重み付け処理工程により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理工程と
を含んだことを特徴とする入力変換学習方法。

（付記６）変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習装置であって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理手段と、
前記文字列処理手段により検知された文字列を語彙に分解する文字列分解処理手段と、
前記文字列分解処理手段により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手段と、
前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に記憶する変換学習記憶手段と、
前記変換学習記憶手段に、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に登録する語彙登録処理手段と
を備えたことを特徴とする入力変換学習装置。

本発明は、文字列操作に応じて自動的に言語モデルを取り込んで該言語モデルに含まれる文章の語彙を順序付けし、この順序付けに従った変換候補のリスト表示から変換候補を選択可能とすることによって、自動的かつ容易で効率的な仮名入力変換を行いたい場合に有用である。

システム構成の概念を示す図である。自動学習機能の処理例を示す図である。自動学習システムの構成を示す機能ブロック図である。形態素解析結果データテーブルのテーブルイメージを示す図である。言語辞書テーブルのテーブルイメージを示す図である。事象テーブルのテーブルイメージを示す図である。言語辞書テーブル登録処理手順を示すフローチャートである。言語辞書テーブル読み出し処理手順を示すフローチャートである。言語入力システムにおける変換候補の表示例を示す図である。

符号の説明

１００自動学習システム
１０１事象検知判定処理部
１０２対象文字列読み込み処理部
１０３形態素解析処理部
１０４形態素ポイント処理部
１０５記憶部
１０５ａ事象ＤＢ
１０５ｂ形態素解析結果データＤＢ
１０５ｃ言語辞書ＤＢ
１０６変換処理検知部
１０７変換候補追加優先表示処理部
２００ａＷｅｂブラウザ
２００ｂ電子メールアプリケーション
２００ｃエディタ
３００言語入力システム
３００ａ言語入力アプリケーション
３０５ｃ変換辞書ＤＢ

Claims

変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラムであって、
前記アプリケーションで取り扱われる文字列に対する、ユーザによる文字列操作を検知する文字列操作検知手順と、
前記文字列操作検知手順により検知された文字列を語彙に分解する文字列分解処理手順と、
前記文字列分解処理手順により分解された前記語彙の各々について、前記文字列操作検知手順により検知された前記文字列操作の種別に応じて、重み付けを行う語彙重み付け処理手順と、
前記語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順と
をコンピュータに実行させるための入力変換学習プログラム。
変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習方法であって、
前記アプリケーションで取り扱われる文字列に対する、ユーザによる文字列操作を検知する文字列操作検知工程と、
前記文字列操作検知工程により検知された文字列を語彙に分解する文字列分解処理工程と、
前記文字列分解処理工程により分解された前記語彙の各々について、前記文字列操作検知工程により検知された前記文字列操作の種別に応じて、重み付けを行う語彙重み付け処理工程と、
前記語彙重み付け処理工程により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理工程と
を含んだことを特徴とする入力変換学習方法。
変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習装置であって、
前記アプリケーションで取り扱われる文字列に対する、ユーザによる文字列操作を検知する文字列操作検知手段と、
前記文字列操作検知手段により検知された文字列を語彙に分解する文字列分解処理手段と、
前記文字列分解処理手段により分解された前記語彙の各々について、前記文字列操作検知手段により検知された前記文字列操作の種別に応じて、重み付けを行う語彙重み付け処理手段と、
前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に記憶する変換学習記憶手段と、
前記変換学習記憶手段に、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に登録する語彙登録処理手段と
を備えたことを特徴とする入力変換学習装置。