JP4847210B2 - 入力変換学習プログラム、入力変換学習方法及び入力変換学習装置 - Google Patents

入力変換学習プログラム、入力変換学習方法及び入力変換学習装置 Download PDF

Info

Publication number
JP4847210B2
JP4847210B2 JP2006138080A JP2006138080A JP4847210B2 JP 4847210 B2 JP4847210 B2 JP 4847210B2 JP 2006138080 A JP2006138080 A JP 2006138080A JP 2006138080 A JP2006138080 A JP 2006138080A JP 4847210 B2 JP4847210 B2 JP 4847210B2
Authority
JP
Japan
Prior art keywords
conversion
character string
vocabulary
input
weighting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006138080A
Other languages
English (en)
Other versions
JP2007310589A (ja
Inventor
宏之 町屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006138080A priority Critical patent/JP4847210B2/ja
Publication of JP2007310589A publication Critical patent/JP2007310589A/ja
Application granted granted Critical
Publication of JP4847210B2 publication Critical patent/JP4847210B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に関する。
コンピュータシステムにおける入力方法において、漢字仮名混じりの日本語の文章を入力するために、先ず仮名で入力した文字列を順次必要に応じて漢字に変換していくことが一般的である。かかる変換方法では、仮名による文字列に対し複数の変換候補を変換候補リストに列挙して選択させることが行われている。
このような変換をより効率的に行うために、変換のために直近において選択された変換候補を変換候補リストの最優先に配置するという学習機能を持たせることが多い。また、さらに効率的な変換を行うために、例えば、特許文献1には、言語モデルとして読み込まれたユーザファイルに含まれる文章を形態素解析した結果から、ある形態素とこれに連接する形態素との連接組み合わせでの出現確率を算出しておき、該連接組み合わせの仮名入力の変換の際に、該出現確率が最も高い連接組み合わせを変換候補として選択する仮名入力変換方法が開示されている。
特開2004−118461号公報
しかしながら、上記特許文献1に代表される従来技術では、連接組み合わせの出現確率は、言語モデルとして読み込まれたユーザファイルに含まれる文章に当該連接組み合わせが存在する場合にのみ算出可能であることから、出現確率が最も高い連接組み合わせを変換候補として選択するためには、より多くのユーザファイルを読み込んでより多くの連接組み合わせの出現確率を算出しておかなければならない。
また、ユーザファイルの読み込みはマニュアルで行わなければならないことから、能動的な手続きが煩雑であるのみならず、読み込むユーザファイルの選択が適切でない場合には、必要とする連接組み合わせの学習がなされていないこととなり、効率的な仮名入力変換の用をなさなくなってしまいかねなかった。
本発明は、上記問題点(課題)を解消するためになされたものであって、文字列操作に応じて自動的に言語モデルを取り込んで該言語モデルに含まれる文章の語彙を順序付けし、この順序付けに従った変換候補のリスト表示から変換候補を選択可能とすることによって、自動的かつ容易で効率的な仮名入力変換を行うことが可能な入力変換学習プログラム、入力変換学習方法及び入力変換学習装置を提供することを目的とする。
上述した問題を解決し、目的を達成するため、本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラムであって、前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知手順と、前記文字列処理検知手順により検知された文字列を語彙に分解する文字列分解処理手順と、前記文字列分解処理手順により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手順と、前記語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順とをコンピュータに実行させることを特徴とする。
また、本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習方法であって、前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知工程と、前記文字列処理検知工程により検知された文字列を語彙に分解する文字列分解処理工程と、前記文字列分解処理工程により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理工程と、前記語彙重み付け処理工程により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理工程とを含んだことを特徴とする。
また、本発明は、変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習装置であって、前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理手段と、前記文字列処理手段により検知された文字列を語彙に分解する文字列分解処理手段と、前記文字列分解処理手段により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手段と、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に記憶する変換学習記憶手段と、前記変換学習記憶手段に、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に登録する語彙登録処理手段とを備えたことを特徴とする。
本発明によれば、文字列分解処理手順により得られた語彙毎に文字列処理に応じた重み付けを行う語彙重み付け処理手順と、語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順を含んだので、読み仮名に対する語彙を文字列処理に応じた重み付けで評価して順序付けすることができるという効果を奏する。
以下に添付図面を参照して、本発明の入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係る好適な実施例を詳細に説明する。なお、以下の実施例では、本発明を、コンピュータシステムに予め実装されている日本語入力変換プログラムとは別にさらに実装することによって、該日本語入力変換プログラムの入力変換学習機能を補完する機能を有する入力変換学習プログラム、入力変換学習方法及び入力変換学習装置について説明することとする。また、コンピュータシステムに限らず、携帯電話機における入力変換システムへも適用可能である。
先ず、本実施例の入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステム構成を説明しつつ、本実施例の特徴を説明することとする。図1は、本実施例の入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステム構成の概念を示す図である。
同図に示すように、本実施例のシステムは、自動学習システム100と、Webブラウザ200a、電子メールアプリケーション(いわゆるMailer)200b及びエディタ200cなどの他システム200と、日本語入力変換プログラムで実現される言語入力システム300とを含んで構成されるものである。自動学習システム100、他システム200及び言語入力システム300は、一のコンピュータシステムに同時に実装されるアプリケーションソフトウェア群である。
自動学習システム100は、入力変換の自動学習処理の実行態様としてのプロセスに相当する自動学習アプリケーション100aと、自動学習アプリケーション100aによる入力変換学習処理結果を学習記憶するための言語辞書DB(Data Base)105cとを有する。
言語入力システム300は、日本語の仮名漢字入力変換処理の実行態様としてのプロセスに相当する言語入力アプリケーション300aと、言語入力アプリケーション300aによる仮名漢字入力変換を行うために仮名と漢字(又は変換文字)とを対応付けて記憶している変換辞書DB305cとを有する。
ここで、従来のシステムでは、言語入力システム300の言語入力アプリケーション300aが、入力された仮名に対応して一度選択され変換された漢字(又は変換文字)を、変換辞書DBを305c参照して再度読み出して変換候補として表示する際に、該表示を優先的に行うことによって、当該仮名に対応して該漢字(又は変換文字)が優先的に選択され変換処理されうるという変換辞書DB305cの学習機能を有することによって、効率的な仮名漢字入力変換を行うこととしていた。
しかし、かかる学習機能では、入力された仮名が一度変換文字に変換されないと機能しないために、初めて入力する仮名に対して適切な変換文字を変換選択候補として提示することができず、効率的な仮名漢字変換を実現することができなかった。
特に、コンピュータシステムにおける文字列操作は、仮名の入力及び該仮名の変換文字への変換のみではなく、表示、選択、コピー、ペーストなど多岐に亘り、このような入力変換とは異なる文字列操作が行われた文字列又は語彙が入力変換の対象となる場合も多い。
本発明は、かかる問題点に着目してなされたものであって、入力変換とは異なる文字列操作をも変換学習の対象とし、以って、初めて入力された仮名に対しても適切な変換文字を変換候補として提示可能とし、効率的な仮名漢字変換を実現することを目的とする。
具体的には、自動学習アプリケーション100aは、他システム200において表示、選択、コピー、ペースト又は変換された文字列から語彙を抽出し、表示、選択、コピー、ペースト又は変換それぞれに応じてポイントを付与する重み付けを行ってから言語辞書DB105cへ格納する。
そして、言語入力アプリケーション300aは、入力された仮名を変換文字へ変換する際に、変換辞書DB305cから変換候補を取得するのみならず、自動学習アプリケーション100aの言語辞書DB105cからも、入力された仮名に対応する変換候補を取得し、変換辞書DB305cの変換候補の表示順を前述の重み付けに従って修正する。
自動学習システム100を導入すると、表示、範囲選択、コピー、ペースト、変換などの各種の文字列操作が行われる毎にリアルタイムで変換候補の表示順が変更されることとなる。よって、必要とされる変換候補を常に最新の状態で変換候補リストの上位に表示させることが可能となり、入力変換処理の効率性を高めかつ維持することが可能となる。
なお、実施例では、この変換候補の表示順の修正は、変換辞書DB305cから取得した所定順序で順序付けられた変換候補全てに優先させ、言語辞書DB105cから取得した所定順序で順序付けられた変換候補を表示するとするが、これに限らず、言語辞書DB105cに記憶される語彙の重み付けに従って変換辞書DB305cに記憶される変換文字の表示順序を変更することとしてもよい。
次に、図1に示した入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステムで処理される自動学習機能の処理例を説明する。図2は、図1に示した入力変換学習プログラム、入力変換学習方法及び入力変換学習装置に係るシステムで処理される自動学習機能の処理例を示す図である。
同図に示すように、例えば、表示、選択、コピー、ペースト及び変換の各事象の事象毎の重み付けとしてのポイントを次のように定義する。即ち、表示:1(点)、範囲選択:3(点)、コピー:5(点)、ペースト:7(点)、変換:9(点)とする(図2(1))。
このように重み付けのポイントが定義されている状況で、図示するようなメールを長岡さんが受け取って表示する(図2(2))。続いて、本実施例の自動学習システム100による自動学習機能が、形態素解析を行って、図示するメールの文章内から語彙を抽出し、各語彙に対してポイントを付与する。なお、自動学習機能は、仮名に逆変換可能な語彙を抽出してポイントを付与するが、本例示においては、説明を簡明にするために、特に抽出語彙を氏名のみに着目して説明することとする。すると、抽出語彙及び各語彙に付与されたポイントは、図2(3)の図表に示すように、全ての語彙は“表示”の事象が行われたことにより1(点)となる。
この後、長岡さんが次の操作を行ったとする。即ち、「弘之」の語彙をコピー及びペーストし、「弘幸」の語彙のコピーを行った。この場合に、“コピー”という操作としての事象に対しては5(点)が与えられるものであり、“ペースト”という事象に対しては7(点)が与えられることから、「弘之」のポイントは、“表示”の1(点)に加えて“コピー”の5(点)及び“ペースト”の7(点)が付与されるために1+5+7=13(点)となる。また、「弘幸」のポイントは、“表示”の1(点)に加えて“コピー”の5(点)が付与されるために1+5=6(点)となる。このように、事象が発生し検知される毎に、ポイント合計値に各事象に対応するポイント(点数)が加算されることとなる。
この後、長岡さんが「ひろゆき」という語彙を言語入力アプリケーション300aを使用して変換する場合に、ポイントが最も高い「弘之」が最優先に、次にポイントが高い「弘幸」が優先されて、変換候補の優先候補として表示されることとなる。
次に、図1に示した自動学習システムの構成について説明する。図3は、図1に示した自動学習システムの構成を示す機能ブロック図である。自動学習システム100はコンピュータシステムに自動学習アプリケーション100a及び言語辞書105cを実装して実現される入力変換学習装置である。同図に示すように、自動学習システム100は、事象検知判定処理部101と、対象文字列読み込み処理部102と、形態素解析処理部103と、形態素ポイント処理部104と、記憶部105と、変換処理検知部106と、変換候補追加優先表示処理部107とを有する。
事象検知判定処理部101は、他システム200において文字列の処理が行われたことを検知し、該処理が事象DB105aに登録されている表示、選択、コピー、ペースト又は変換の何れかの処理であるか否かを判定する。事象検知判定処理部101は、検知した文字列の処理が事象DB105aの事象テーブルに登録されている表示、選択、コピー、ペースト又は変換の何れかの処理であると判定したならば、検知文字列を対象文字列読み込み処理部102へ受け渡すこととなる。
対象文字列読み込み処理部102は、表示、選択、コピー、ペースト又は変換された文字列を形態素解析の処理対象文字列として読み込み、形態素解析処理部103へ受け渡す。形態素解析処理部103は、処理対象文字列を形態素解析し、解析した結果を形態素解析結果データDB105bの形態素解析結果データテーブルに記憶する。
形態素解析処理部103が形態素解析結果を形態素解析結果データテーブルに記憶したならば、形態素ポイント処理部104は、図示しない読み仮名を登録した辞書を参照して各形態素に読み仮名を付する。さらに、事象検知判定処理部101が検知した事象に応じたポイントを各形態素に付与して該ポイントのポイント合計値を算出する。各形態素の品詞は形態素解析により判明している。よって、“読み”に対応する“品詞”、“語句”、“ポイント合計値”を、言語辞書DB105cの言語辞書テーブルに記憶していくこととなる。このとき、同音語を区別するために、“読み”に対応する“品詞”、“語句”、“ポイント合計値”のレコードに“枝番”を付して、一の“読み”に対応する複数の“語句”を識別可能とする。
変換処理検知部106は、言語入力システム300において入力変換処理の指示が行われたことを検知し、入力変換処理の指示を検知したことを変換候補追加優先表示処理部107へ通知する。変換処理検知部106から入力変換処理の指示の検知を通知された変換候補追加優先表示処理部107は、入力変換処理の対象となる仮名で表される“読み”に対応する全てのレコードの情報を言語辞書DB105cから読み出して、ポイント合計値の高い順序で言語入力システム300に受け渡す。言語辞書DB105cから読み出されて受け渡された情報は、言語入力システム300における入力変換候補の一覧表示において変換候補として優先的に追加表示されることとなる。
次に、図3に示した形態素解析結果データDB105bに格納される形態素解析結果データテーブルについて説明する。図4は、形態素解析結果データテーブルのテーブルイメージを示す図である。同図に示すように、形態素解析結果データテーブルは、“語句”と“品詞”のカラムを有する。“語句”は、形態素解析によって品詞に分解されかつ原型変換されたものが格納されている。“品詞”は、形態素解析によって判明した品詞である。なお、形態素解析結果データテーブルは一時記憶のためのテーブルであるので、形態素解析結果の語彙が言語辞書DB105cへ格納された後には、該形態素解析結果は消去されることとなる。
図4を具体的に見ると、「先生は学校へ車で行った」という文字列(文章)を品詞分解すると「先生△は△学校△へ△車△で△行っ△た」(“△”は形態素の区切りを表す)となり、さらにこれを原型変換すると「先生△は△学校△へ△車△で△行く△た」となる。この“先生”、“は”、“学校”、“へ”、“車”、“で”、“行く”、“た”の各語彙の品詞を判定し該品詞判定結果とともに各語彙を形態素解析結果データテーブルに記憶することとなる。
次に、図3に示した言語辞書DB105cに格納される言語辞書テーブルについて説明する。図5は、言語辞書テーブルのテーブルイメージを示す図である。同図に示すように、言語辞書テーブルは“読み”と、“枝番”と、“品詞”と、“語句”と、“ポイント合計値”とのカラムを有する。“読み”は、各“語句”に対応する読みを示す読み仮名である。枝番は、一の“読み”に対して複数の“語句”が対応する場合のために、当該“読み”に対応する各“語彙”を識別するための識別子である、“品詞”は、形態素解析によって判明した当該“語句”の品詞名である。“ポイント合計値”は、当該“語句”に対してなされた文字列操作である事象の種別に応じて付与されたポイントの合計値である。このポイントは、常に加算されていくものであり、減算されることは一切ない。
次に、図3に示した事象DB105aに格納される事象テーブルについて説明する。図6は、事象テーブルのテーブルイメージを示す図である。同図に示すように、事象テーブルは、“事象”と、“ポイント”とのカラムを有する。“事象”は、処理対象文字列に対してなされた処理の種別を示す。具体的には、「表示」は文字列の表示を示し、「範囲選択」は文字列の反転表示による選択を示す。また、「コピー」は文字列のコピーを示し、「ペースト」はコピーした文字列の貼り付けを示す。また、「変換」は入力文字列の仮名漢字変換を示す。
なお、図6に示す事象テーブルのイメージ図では、表示:1(点)、範囲選択:3(点)、コピー:5(点)、ペースト:7(点)、変換:9(点)と、各事象に対してポイントが割り振られているが、当該事象テーブルに登録してポイント加算対象の事象として認識する事象の種別及び各事象に割り当てられるポイント数は、一例を示すに過ぎず、自動学習システム100、他システム200及び言語入力システム300の利用態様に応じて適宜変更可能な事項である。
次に、図1に示した自動学習システム100において実行される言語辞書テーブル登録処理手順について説明する。図7は、言語辞書テーブル登録処理手順を示すフローチャートである。以下の処理は、事象検知判定処理部101、対象文字列読み込み処理部102、形態素解析処理部103又は形態素ポイント処理部104により実行される処理である。同図に示すように、先ず、他システムにおける文字列に対する事象の発生を検知したか否かを判定する(ステップS101)。他システムにおける文字列に対する事象の発生を検知したと判定された場合に(ステップS101肯定)、ステップS102へ処理を移し、判定されなかった場合に(ステップS101否定)、ステップS101を繰り返す。
次に、発生した事象が事象テーブルに存在するか否かを判定し(ステップS102)、存在すると判定されるならば(ステップS102肯定)、ステップS103へ処理を移し、存在すると判定されないならば(ステップS102否定)、ステップS101へ処理を移す。
ステップS103では、処理対象文字列を形態素解析し、結果を形態素解析結果データテーブルに格納する。続いて、対象となるすべての文字列について形態素解析されたか否かを判定し(ステップS104)、全ての文字列について形態素解析されたと判定された場合に(ステップS104肯定)、ステップS105へ処理を移し、全ての文字列について形態素解析されたと判定されなかった場合に(ステップS104否定)、ステップS103へ処理を移す。
ステップS105では、形態素解析結果データの語句と品詞を元に言語辞書テーブルを検索する。続いて、検索対象が言語辞書テーブルに存在するか否かを判定し(ステップS106)、存在すると判定される場合に(ステップS106肯定)、検索されたレコードのポイント合計値に事象テーブルのポイントを加算し(ステップS107)、存在すると判定されなかった場合に(ステップS106否定)、読みに対する語句のレコードを新規追加し、ポイント合計値に事象テーブルのポイントを加算する(ステップS108)。ステップS107又はステップS108が終了した場合には、ステップS109へ処理を移す。
ステップS109では、対象となる全ての形態素解析結果データについて言語辞書テーブルが検索されたか否かを判定し、全ての形態素解析結果データについて言語辞書テーブルが検索されたと判定される場合に(ステップS109肯定)、言語辞書テーブル登録処理を終了し、全ての形態素解析結果データについて言語辞書テーブルが検索されたと判定されなかった場合に(ステップS109否定)、ステップS105へ処理を移す。
次に、図1に示した自動学習システム100において実行される言語辞書テーブル読み出し処理手順について説明する。図8は、言語辞書テーブル読み出し処理手順を示すフローチャートである。以下の処理は、変換処理検知部106又は変換候補追加優先表示処理部107により実行される処理である。同図に示すように、先ず、言語入力システムにおける変換処理の指示を検知したか否かを判定する(ステップS201)。変換処理の指示を検知したと判定される場合に(ステップS202)、入力された「読み」に対応する変換候補を、ポイントが高い順序で言語辞書DB105cから読み出し、言語入力システムへ受け渡す。入力された「読み」に対応する変換候補をポイントが高い順序で受け渡された言語入力システム300は、変換辞書305cから読み出して表示する変換候補に追加しかつ該変換候補に優先させて、言語辞書DB105cからの変換候補をポイントの高い順序で追加表示することとなる。
次に、図1に示した言語入力システムが自動学習システムと連携した場合に、該言語入力システムにおける変換候補の表示例について説明する。図9は、言語入力システムにおける変換候補の表示例を示す図である。同図では、“きしゃ”という文字列を変換する場合を例示している。
言語辞書DB105cの言語辞書テーブルには、この“きしゃ”の“読み”に対応する“語句”として“貴社”、“汽車”、“記者”、“帰社”の各語句が記憶されており、それぞれのポイントが“8”、“7”、“5”、“1”となっている。このポイントが高い順序で言語辞書テーブルから言語入力システム300へ受け渡され、言語入力システム300の変換候補の表示リストの先頭から該順序で表示されることとなる。即ち、変換候補の表示リストの1番目から4番目は、言語辞書テーブルから読み出されて表示されたものである。
一方で、言語入力システム300の変換候補の表示リストの5番目以降は、変換辞書DB305cの変換辞書テーブルから読み出される本来の変換候補である。このように、変換辞書DB305cの変換辞書テーブルから読み出される変換候補に優先させて語辞書DB105cの言語辞書テーブルに記憶されている変換候補を表示させると、最近において文字列操作が行われたことによって選択される可能性がより高い変換候補を変換候補の表示リストの上位に優先的に表示させることとなり、仮名漢字変換の効率性をより高めることができる。
なお、上記実施例で説明した各処理は、あらかじめ用意されたプログラムをパーソナルコンピュータ、サーバ又はワークステーションなどのコンピュータシステムで実行することによって実現することができる。
上記実施例によれば、アプリケーションは、仮名漢字入力変換の対象であるアプリケーションのみならず、コンピュータシステムにおいて実行される他のアプリケーションをも含むので、多様なアプリケーションで行われる文字列操作を語彙の重み付けの契機とすることができ、使用頻度を性格に反映したより正確な語彙の重み付けを行うことが可能となる場合がある。
また、上記実施例によれば、入力変換処理検知手順により入力変換処理が検知されると、該入力変換処理に際して入力された変換対象の仮名文字列に一致するよみ仮名に対応する語彙を変換学習データベースから読み出し、重み付けの順位が高い順序で変換候補として表示可能に仮名漢字変換システムに受け渡す変換候補受け渡し手順を含んだので、文字列処理に応じた重み付けで評価して順序付けられた語彙を、変換候補のリストの上位に重み付けの順位が高い語彙を表示させて変換効率の向上を図ることができる場合がある。
以上、本発明の実施例を説明したが、本発明は、これに限られるものではなく、特許請求の範囲に記載した技術的思想の範囲内で、更に種々の異なる実施例で実施されてもよいものである。また、実施例に記載した効果は、これに限定されるものではない。
上記実施例では、形態素解析の結果である語彙を、言語辞書DB105cの言語辞書テーブルへ登録する語句の単位としている。しかし、これに限らず、語彙と語彙とが結合した複合語も語句として登録するようにしてもよい。このようにすることによって、変換処理の利便性、効率性がより高まることがある。また、語彙の抽出方法は、形態素解析に限られるものではない。
上記実施例では、コンピュータシステムが本来有する言語入力システムに追加して機能させることにより、変換以外の文字列操作を入力変換候補の学習結果に反映させることとしている。そのために、変換以外の文字列操作が行われた語句を、言語辞書テーブルへ次々と新規に登録していくという方式を取っている。しかし、これに限らず、言語入力システム300の変換辞書305cの変換辞書テーブルの仕様を変更し、直接この変換辞書テーブルに文字列操作に応じたポイントを記録していくこととし、変換候補の表示時に、該ポイントの高い順に表示を行うこととしてもよい。このようにすると、言語辞書DB105cの言語辞書テーブルを用意する必要が省け、コンピュータ資源の節約を図ることができることがある。若しくは、言語入力システム300が変換辞書として、言語辞書DB105cの言語辞書テーブルを参照することとしてもよい。
また、上記実施例で示した自動学習システム100の機能及び処理を言語入力システム300が包含するような態様の実施例であってもよい。または、言語入力システム300の機能及び処理を自動学習システム100が包含するような態様の実施例であってもよい。これらによれば、入力変換に係るシステムが自動学習システム100又は言語入力システム300に一本化されるので、システム構成がシンプルとなり、メンテナンスの容易性が向上することがある。
上記実施例によれば、Webブラウザ200a、電子メールアプリケーション200b、エディタ200c(ワード・プロセッサなども同様)などの他システム200においてなされた表示、範囲選択、コピー、ペースト、変換などの文字列操作に応じて操作対象の語彙に重み付けを行って言語辞書DB105の言語辞書テーブルに登録する。言語入力システム300における入力変換に際して、言語辞書DB105の言語辞書テーブルの登録内容を読み出し、入力変換候補の候補リストの上位に表示させることによって、ある入力仮名を文字列操作がより頻繁に行われた語彙へと効率的に変換することが可能となる場合がある。
なお、“読み”に対応する“語句”は、漢字に限られるものではなく、平仮名や片仮名、英数字、各種記号や標印などであってもよい。
(付記1)変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラムであって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知手順と、
前記文字列処理検知手順により検知された文字列を語彙に分解する文字列分解処理手順と、
前記文字列分解処理手順により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手順と、
前記語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順と
をコンピュータに実行させることを特徴とする入力変換学習プログラム。
(付記2)前記アプリケーションは、前記仮名漢字入力変換の対象であるアプリケーションのみならず、前記コンピュータシステムにおいて実行される他のアプリケーションをも含んだことを特徴とする付記1に記載の入力変換学習プログラム。
(付記3)前記文字列処理は、文字列の表示、範囲選択、コピー、ペースト若しくは仮名漢字入力変換を含んだことを特徴とする付記1又は2に記載の入力変換学習プログラム。
(付記4)前記コンピュータにおける入力変換システムが入力変換処理を行ったことを検知する入力変換処理検知手順と、
前記入力変換処理検知手順により入力変換処理が検知されると、該入力変換処理に際して入力された変換対象の仮名文字列に一致する前記読み仮名に対応する語彙を変換学習データベースから読み出し、前記重み付けの順位が高い順序で前記変換候補として表示可能に前記仮名漢字変換システムに受け渡す変換候補受け渡し手順と
をコンピュータに実行させることを特徴とする付記1〜3の何れか一つに記載の入力変換学習プログラム。
(付記5)変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習方法であって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理検知工程と、
前記文字列処理検知工程により検知された文字列を語彙に分解する文字列分解処理工程と、
前記文字列分解処理工程により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理工程と、
前記語彙重み付け処理工程により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理工程と
を含んだことを特徴とする入力変換学習方法。
(付記6)変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習装置であって、
前記アプリケーションで取り扱われる文字列に対する文字列処理を検知する文字列処理手段と、
前記文字列処理手段により検知された文字列を語彙に分解する文字列分解処理手段と、
前記文字列分解処理手段により得られた語彙毎に前記文字列処理に応じた重み付けを行う語彙重み付け処理手段と、
前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に記憶する変換学習記憶手段と、
前記変換学習記憶手段に、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に登録する語彙登録処理手段と
を備えたことを特徴とする入力変換学習装置。
本発明は、文字列操作に応じて自動的に言語モデルを取り込んで該言語モデルに含まれる文章の語彙を順序付けし、この順序付けに従った変換候補のリスト表示から変換候補を選択可能とすることによって、自動的かつ容易で効率的な仮名入力変換を行いたい場合に有用である。
システム構成の概念を示す図である。 自動学習機能の処理例を示す図である。 自動学習システムの構成を示す機能ブロック図である。 形態素解析結果データテーブルのテーブルイメージを示す図である。 言語辞書テーブルのテーブルイメージを示す図である。 事象テーブルのテーブルイメージを示す図である。 言語辞書テーブル登録処理手順を示すフローチャートである。 言語辞書テーブル読み出し処理手順を示すフローチャートである。 言語入力システムにおける変換候補の表示例を示す図である。
符号の説明
100 自動学習システム
101 事象検知判定処理部
102 対象文字列読み込み処理部
103 形態素解析処理部
104 形態素ポイント処理部
105 記憶部
105a 事象DB
105b 形態素解析結果データDB
105c 言語辞書DB
106 変換処理検知部
107 変換候補追加優先表示処理部
200a Webブラウザ
200b 電子メールアプリケーション
200c エディタ
300 言語入力システム
300a 言語入力アプリケーション
305c 変換辞書DB

Claims (3)

  1. 変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理をコンピュータに実行させるための入力変換学習プログラムであって、
    前記アプリケーションで取り扱われる文字列に対する、ユーザによる文字列操作を検知する文字列操作検知手順と、
    前記文字列操作検知手順により検知された文字列を語彙に分解する文字列分解処理手順と、
    前記文字列分解処理手順により分解された前記語彙の各々について、前記文字列操作検知手順により検知された前記文字列操作の種別に応じて、重み付けを行う語彙重み付け処理手順と、
    前記語彙重み付け処理手順により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理手順と
    をコンピュータに実行させるための入力変換学習プログラム。
  2. 変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習方法であって、
    前記アプリケーションで取り扱われる文字列に対する、ユーザによる文字列操作を検知する文字列操作検知工程と、
    前記文字列操作検知工程により検知された文字列を語彙に分解する文字列分解処理工程と、
    前記文字列分解処理工程により分解された前記語彙の各々について、前記文字列操作検知工程により検知された前記文字列操作の種別に応じて、重み付けを行う語彙重み付け処理工程と、
    前記語彙重み付け処理工程により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に変換学習データベースに登録する語彙登録処理工程と
    を含んだことを特徴とする入力変換学習方法。
  3. 変換候補のリストから一の変換候補を選択させることにより、アプリケーションにおいて入力された仮名文字列を漢字文字列に変換する仮名漢字変換システムにおける仮名漢字入力変換の変換候補の学習処理を行う入力変換学習装置であって、
    前記アプリケーションで取り扱われる文字列に対する、ユーザによる文字列操作を検知する文字列操作検知手段と、
    前記文字列操作検知手段により検知された文字列を語彙に分解する文字列分解処理手段と、
    前記文字列分解処理手段により分解された前記語彙の各々について、前記文字列操作検知手段により検知された前記文字列操作の種別に応じて、重み付けを行う語彙重み付け処理手段と、
    前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に記憶する変換学習記憶手段と、
    前記変換学習記憶手段に、前記語彙重み付け処理手段により重み付けされた語彙を前記重み付け及び該語彙の読み仮名と共に登録する語彙登録処理手段と
    を備えたことを特徴とする入力変換学習装置。
JP2006138080A 2006-05-17 2006-05-17 入力変換学習プログラム、入力変換学習方法及び入力変換学習装置 Expired - Fee Related JP4847210B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006138080A JP4847210B2 (ja) 2006-05-17 2006-05-17 入力変換学習プログラム、入力変換学習方法及び入力変換学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006138080A JP4847210B2 (ja) 2006-05-17 2006-05-17 入力変換学習プログラム、入力変換学習方法及び入力変換学習装置

Publications (2)

Publication Number Publication Date
JP2007310589A JP2007310589A (ja) 2007-11-29
JP4847210B2 true JP4847210B2 (ja) 2011-12-28

Family

ID=38843395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006138080A Expired - Fee Related JP4847210B2 (ja) 2006-05-17 2006-05-17 入力変換学習プログラム、入力変換学習方法及び入力変換学習装置

Country Status (1)

Country Link
JP (1) JP4847210B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5648491B2 (ja) * 2011-01-19 2015-01-07 富士通株式会社 入力支援プログラム、情報処理装置、及び情報処理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4221132B2 (ja) * 2000-01-28 2009-02-12 シャープ株式会社 情報処理装置及び方法並びにこれに利用される記憶媒体
JP2004118461A (ja) * 2002-09-25 2004-04-15 Microsoft Corp 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP2007310589A (ja) 2007-11-29

Similar Documents

Publication Publication Date Title
US7912700B2 (en) Context based word prediction
US7788590B2 (en) Lightweight reference user interface
JP4202041B2 (ja) 入力モードバイアスを適用するための方法およびシステム
US7992085B2 (en) Lightweight reference user interface
US7254784B2 (en) User-driven menu generation system with multiple submenus
US9471566B1 (en) Method and apparatus for converting phonetic language input to written language output
US8031943B2 (en) Automatic natural language translation of embedded text regions in images during information transfer
US7802305B1 (en) Methods and apparatus for automated redaction of content in a document
US7493559B1 (en) System and method for direct multi-modal annotation of objects
US7836401B2 (en) User operable help information system
US20070156618A1 (en) Embedded rule engine for rendering text and other applications
US8924852B2 (en) Apparatus, method, and program for supporting processing of character string in document
US9196251B2 (en) Contextual conversion platform for generating prioritized replacement text for spoken content output
JP2010257392A (ja) 文字入力装置、文字入力方法、コンピュータ読取可能なプログラムおよび記録媒体
JP2007334429A (ja) キーワード生成方法、文書検索方法、話題範囲推定方法、話題境界推定方法、及びこれらの装置とそのプログラム、その記録媒体
JP2010134922A (ja) 類似語決定方法およびシステム
US6976214B1 (en) Method, system, and program for enhancing text composition in a text editor program
JPH08314910A (ja) 異種コード文字列転記装置および電子辞書
JP4847210B2 (ja) 入力変換学習プログラム、入力変換学習方法及び入力変換学習装置
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
WO2007088902A1 (ja) 文字処理装置、方法、プログラムおよび記録媒体
JP2001101162A (ja) 文書処理装置、及び文書処理プログラムが記憶された記憶媒体
CN106250354A (zh) 处理文书的信息处理装置、信息处理方法以及程序
JP5123350B2 (ja) テストケース作成システム、方法およびプログラム
US20050102278A1 (en) Expanded search keywords

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111013

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees