JP2007164278A - 日本語処理装置、日本語処理方法及び日本語処理用プログラム - Google Patents

日本語処理装置、日本語処理方法及び日本語処理用プログラム Download PDF

Info

Publication number
JP2007164278A
JP2007164278A JP2005356653A JP2005356653A JP2007164278A JP 2007164278 A JP2007164278 A JP 2007164278A JP 2005356653 A JP2005356653 A JP 2005356653A JP 2005356653 A JP2005356653 A JP 2005356653A JP 2007164278 A JP2007164278 A JP 2007164278A
Authority
JP
Japan
Prior art keywords
connection prediction
phrase
information
sentence
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005356653A
Other languages
English (en)
Inventor
Hiroaki Kiso
宏顕 木曽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005356653A priority Critical patent/JP2007164278A/ja
Publication of JP2007164278A publication Critical patent/JP2007164278A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】文字入力のための予測表示を使いやすくし文章入力を簡易にした携帯機器に搭載可能な日本語処理装置及び方法を提供する。
【解決手段】文字列を入力する入力装置1と、文字列を表示する出力装置2と、文節と該文節に共起する文節の共起情報が使用頻度とともに記録されたつながり予測辞書61と、入力された文章の一文を単位として当該一文を構成する文節に区切る文節区切り部41と、区切られた文節に基づいてつながり予測辞書61を更新するつながり予測情報反映部42と、前記入力装置1から入力した文節に基づいてつながり予測辞書61を参照して当該文節に応じた共起情報を出力するつながり予測エンジン62と、前記入力装置1から入力した文字列を前記出力装置2に表示するとともに、前記つながり予測エンジン62から出力された共起情報を入力補助のために表示、制御する制御部3と、を有する。
【選択図】図1

Description

本発明は日本語処理に関し、特に携帯機器等に適用可能な日本語処理装置、日本語処理方法及び日本語処理用プログラムに関する。
従来の日本語処理技術においては、文字列入力時に隣接する文節のみを予測候補として出し、更に次々とデータが更新されていき、使用したいデータが早々に削除される表示動作が行われることから、文字の予測表示による入力操作が使い難いという点で問題があった。
本発明の目的は、以上の問題点を解決するものであり、文字入力のための予測表示を使いやすくし文章入力を簡易にした日本語処理装置、日本語処理方法及び日本語処理用プログラムを提供することにある。
本発明の他の目的は、ユーザの使用頻度に基づいてつながり予測データを表示することを可能とした日本語処理装置、日本語処理方法及び日本語処理用プログラムを提供することにある。
本発明の他の目的は、コンパクト版の形態素解析(Morphological Analysis)処理が適用可能で携帯機器等に搭載可能な日本語処理装置、日本語処理方法及び日本語処理用プログラムを提供することにある。
本発明は、日本語入力の際に使用されるつながり予測候補(ある単語又は文節(分節という)を入力したあとで、その文節に関係する文節として予測されるデータ)を、ユーザの過去の一文単位の入力履歴を踏まえ、その頻度を元に表示させる構成を提供する。これにより、ユーザの使用頻度の高いつながり予測候補を表示し、選択して使用することを可能とし、使いやすい文章入力が可能である。
本発明の日本語処理は、文節と該文節に共起する文節の共起情報が使用頻度とともに記録されたつながり予測辞書を参照して、入力した文節に対し、前記使用頻度に基づいてつながり予測候補を入力補助のために表示する日本語処理方法において、前記つながり予測辞書の前記共起情報及び使用頻度は、作成された文章の一文を単位として当該一文を構成する文節に基づいて追加、更新する。これにより、ユーザの一文単位の文節の使用頻度に基づいてつながり予測データが蓄積され、これによりつながり予測候補が表示される。
また、表示されたつながり予測候補から選択された1乃至複数のつながり予測候補を含む文章の作成を行う。更に前記つながり予測辞書は、共起する元の文節の表記及びよみからなる基底情報と、共起される文節の表記、よみ、頻度情報及び頻度更新日からなる前記共起情報とが記録されることを特徴とする。これにより、ハードウェアリソースに制限を持つ携帯電話機など携帯機器においても、実現させることが容易であり、同じハードウェアリソース条件であれば、携帯機器での実現を対象としない方式に比べ、本発明による方式は処理速度の向上が見込まれる。前記つながり予測辞書は、作成された文書の一文が電子メールの場合に、前記基底情報として電子メールの送付先を含むメール情報が記録されることを特徴とする。これにより、電子メールの宛先別のつながり予測データが蓄積可能でよりきめの細かい入力補助が可能となる。
本発明の日本語処理装置は、文字列を入力する入力装置と、文字列を表示する出力装置と、文節と該文節に共起する文節の共起情報が使用頻度とともに記録されたつながり予測辞書と、入力された文章の一文を単位として当該一文を構成する文節に区切る文節区切り部と、区切られた文節に基づいてつながり予測辞書を更新するつながり予測情報反映部と、前記入力装置から入力した文節に基づいてつながり予測辞書を参照して当該文節に応じた共起情報を出力するつながり予測エンジンと、前記入力装置から入力した文字列を前記出力装置に表示するとともに、前記つながり予測エンジンから出力された共起情報を入力補助のために表示、制御する制御部と、を有し、前記制御部は、表示されたつながり予測候補から選択された1乃至複数のつながり予測候補を含む文章の作成を制御し、前記つながり予測辞書には、前記共起情報として共起する元の文節の表記及びよみからなる基底情報と、共起される文節の表記、よみ、頻度情報及び頻度更新日が記録され、また、前記基底情報として電子メールの送付先を含むメール情報が記録されることを特徴とする。
本発明の日本語処理用の処理プログラムは、つながり予測辞書を参照して入力装置から入力された文節に共起する共起情報をつながり予測候補として出力装置に入力補助のために表示する日本語処理用の処理プログラムであって、コンピュータに、文節と該文節に共起する文節の共起情報が使用頻度とともに記録されるつながり予測辞書を作成された文章の一文を単位とする当該一文を構成する文節に基づいて追加、更新する処理と、入力装置から入力された文節に対し、つながり予測辞書を参照し、前記共起情報の使用頻度に基づいてつながり予測候補を出力装置に表示する処理と、表示されたつながり予測候補から選択された1乃至複数のつながり予測候補を含む文章の作成する処理と、共起する元の文節の表記及びよみからなる基底情報と、共起される文節の表記、よみ、頻度情報及び頻度更新日からなる前記共起情報とを前記つながり予測辞書に記録する処理と、作成された文書の一文が電子メールの場合に、前記つながり予測辞書に前記基底情報として電子メールの送付先を含むメール情報を記録する処理と、を実行することを特徴とする。
本発明によれば、入力した文節に対する複数の共起情報が表示され、その中から1乃至複数の文節を選択して作成文章に取り込んで使用することができるから、隣接する文節のみを予測候補として出し、更に次々とデータが更新され早々に削除されてしまう先行技術と比較して文書作成が容易であり便利である。特に、共起情報のつながり予測データがユーザの使用頻度とともに保存され、ユーザの使用頻度を踏まえた予測データがつながり予測候補として削除されずに表示されるから、強い共起関係の文節の利用が容易である。
本発明によれば、基底情報単位で複数の共起情報を表示するつながり予測辞書を使用し、一文単位の文節区切りにより得られた基底情報と共起情報とによりつながり予測辞書を更新する処理と、つながり予測エンジンの入力文字を基底情報とした共起情報の参照処理により文字入力を行うものであるから、形態素解析処理もコンパクト版のもので良く、携帯電話機等のハードウェアリソースに制限のある携帯機器への搭載が容易である。
このことは、ハードウェアリソースのネックとなる可能性のある文節区切り部の実現に好適であり、また、本格的な形態素解析処理手段を適用した場合との比較では、同じハードウェアリソース条件であれば、本発明の方式はより処理速度の向上が見込まれる。
(実施の形態1)
図1は本発明の日本語処理装置の一実施の形態を示す図である。本実施の形態は、キーボード等の入力装置1、LCDディスプレイ装置等の出力装置2、入力装置1からの入力情報の制御及び出力装置2への出力情報の制御を行う制御部3、つながり予測情報を抽出するつながり予測情報抽出処理装置4、つながり予測情報を抽出する対象であるユーザ作成文書を保存するユーザ作成文章部5、日本語入力によりつながり予測データ処理を行うつながり予測装置6とを備える。また、つながり予測情報抽出処理装置4は、文節区切り部41と、つながり予測情報反映部42とを備え、つながり予測装置6は、つながり予測辞書61と、つながり予測エンジン62とを備える。各部の機能は以下のとおりである。
入力装置1はユーザの操作により文字列の入力が可能であり制御部3の制御により文章の作成等に使用され、出力装置2は入力装置1から入力された文字列の表示に加え、該文字列の文節と共起関係にあるつながり予測候補を入力補助機能として表示画面に部分表示する等の機能を有する。ユーザ作成文章部5は、作成された送信メールなどの入力が完了した文章を制御部3の制御により保存する機能、保存した文章の制御部3への読み出し機能を有する。
文節区切り部41は、制御部3によりユーザ作成文章部5から読み出された入力が完了した文章の各一文の単位で文字列に対して文節区切りを行い、つながり予測情報反映部42に出力する機能を有し、つながり予測情報反映部42は、文節区切り部41で対象とした各一文に対して、その文を構成する文節を共起関係としてとらえ、共起する元データである基底となる特定の文節の情報(基底情報)と当該基底情報により共起される文節の情報(共起情報)とを対応付けてつながり予測辞書61に保存する機能、その際、つながり予測辞書61に既にある文節の頻度情報を踏まえて、その頻度を更新する機能、更新日を書き換える機能を有する。
つながり予測辞書61は、つながり予測候補となる共起情報が更新可能な辞書機能を有し、つながり予測エンジン62は、制御部3からの基底情報としての入力文字に対し、つながり予測辞書61を参照してつながり関係の深い共起情報をつながり予測候補として制御部3に出力するという、つながり予測データの処理機能を有する。
制御部3は、ユーザが入力装置1の操作により文字入力した際、つながり予測装置6から当該入力文字に応じたつながり予測候補の文字データを出力装置2の表示画面に部分表示等により表示し、当該表示に係るつながり予測候補の文字データの1乃至複数をユーザが適宜選択し、確定し、また助詞その他の品詞等を追加することにより所望の文字列を生成するユーザの文字の入力補助の動作を制御する機能と、生成した文字列をユーザ作成文章部5へ保存する機能と、ユーザ作成文章部5に保存された文字列を、例えば一文単位で、つながり予測情報抽出処理装置4に出力する機能を有する。また、制御部3はつながり予測候補の文字データの1乃至複数が適宜選択可能に制御するため、つながり予測候補の文字データを出力装置2の表示画面に所定期間表示するように構成するか、ユーザの入力装置1からの表示の停止操作を待って表示を停止するように構成することが可能である。
以上の構成によりユーザが入力装置1、出力装置2及び制御部3を使用した、つながり予測エンジン62による文字入力において、つながり予測エンジン62がつながり予測辞書61に保存された共起情報を参照することで、ユーザの使用頻度の高いつながり予測候補を出力装置2の表示画面に表示する文字入力の補助機能が実現される。
(動作)
次に、本実施の形態の動作について詳細に説明する。
図2はつながり予測辞書の内容を示す図であり、図3は本実施の形態の動作フローチャートを示す図である。以下、図1〜3を参照して説明する。
つながり予測辞書61は、図2に示すように基底情報と共起情報の関連情報が記録される辞書であり、基底情報の「表記」及び「よみ」単位に、共起情報の「表記」、「よみ」、「頻度情報」及び「頻度更新日」を対応させてつながり予測データとして記録される。また、共起情報は基底情報単位に複数格納可能であり、複数の共起情報が頻度情報により頻度の高い順に並べられ、つながり予測情報反映部42により頻度情報が更新されると、その順番も並び変わる。
図3に示す動作フローチャートにおいて、まず、文節区切り部41は、ユーザが作成した文章をユーザ作成文章部5から読み込み、文節区切りを実施する(図3のステップA1)。文節区切り部41で対象とした文章の各一文に対して、その文を構成する文節を共起関係としてとらえ、つながり予測辞書61における各文節の情報として反映するため、当該一文を基底情報と共起情報とからなる更新情報を作成する(図3のステップA2)。
つながり予測情報反映部42は、文節区切り部41で作成した更新情報によりつながり予測辞書61の共起情報を更新する。共起情報の更新は、つながり予測辞書61に既存の基底情報として、更新情報の基底情報と同じ「表記」及び「よみ」の基底情報が存在するか否かを調べ、同一「表記」及び「よみ」の基底情報が存在する場合に、当該基底情報に対応する共起情報に更新情報の共起情報があるか否かを調べ、存在する共起情報の頻度情報を増加させ、存在しない共起情報は最低の頻度情報として書き加え、頻度更新日を当該処理日に書き換え又は当該処理日を追加することにより更新する。また、つながり予測辞書61に更新情報の基底情報と同一「表記」及び「よみ」の基底情報がない場合には、当該基底情報の「表記」及び「よみ」及びその共起情報を最低の頻度情報として書き加え、当該処理日を追加することにより更新する。更に、以上の動作で既存の共起情報より頻度情報の頻度の高いデータが新しく生じた場合、例えば頻度の高いつながり予測データの記録が維持され、元々の頻度の低いつながり予測データは削除される。以前の頻度更新日等と次の更新日(処理日)の差が基準値以上の差であった場合、頻度情報の頻度を減らす処理も合わせて行うと好適である(図3のステップA3)。
この後、ユーザが入力装置1、出力装置2及び制御部3を使用して、つながり予測エンジン62により文章入力を実行した場合、つながり予測辞書61からのつながり予測候補が出力装置2に表示される(図3のステップ4)。つまり、特定の「表記」及び「よみ」の基底情報の入力時に、つながり予測辞書61で保有している共起情報のうち、頻度がある基準値以上のつながり予測データが予測候補として表示される。基準値以下のつながり予測データは、次の更新に備えて保管されているデータである。
ユーザがつながり予測候補の表示を利用して一文の文書作成を完了すると、作成された文章は制御部3により、一旦ユーザ作成文章部5に保存される(図3のステップA5)。この文章が次のユーザの文書作成に反映されるように制御部3により直ちに読み出され、文節区切り部41に出力されるように制御されうる。
次に、本実施の形態の動作を図2に示す具体例で詳細に説明する。
例えば、ユーザ作成文章部5から読み出した一文が「太郎が朝食を急いで食べた。」という文章構成を有する場合を考える。まず、文節区切り部41にてこの文に対して、文節区切り(「太郎が/朝食を/急いで/食べた。」)を実施する。これにより、この一文を構成する文節は「太郎が」「朝食を」「急いで」「食べた」であり、これらが共起するという情報が得られる。共起情報で助詞は省略して扱うと、「太郎」に対して、「朝食」「急いで」「食べた」が共起するという情報がつながり予測辞書61に付与される。「太郎」に対する共起情報を「表記:頻度」で表記すると、仮に更新前の状態が「行く:3」「明日:2」「急いで:1」「朝食:1」であったとすると、今回の更新で「行く:3」「明日:2」「急いで:2」「朝食:2」「食べた:1」となる。頻度「2」以上をつながり予測候補として表示する閾値とすると、更新前では「行く」「明日」しか予測されないものに対して、更新後、「行く」「明日」「急いで」「朝食」という予測候補が表記されることとなる(図3のステップA3、図2)。ここで、「朝食」は「朝食:1」となるはずであるが、「朝食」は基底情報の「太郎」に隣接する文節であり、隣接する文節は強い共起関係にあると考えられるため、このような文節は必ずつながり予測候補として扱われるように、その頻度「1」に更に「閾値-1」を加えた値(「朝食:2」)を用いて更新している。この後、つながり予測装置6を使用して、日本語入力する際、「太郎(が)」と入力した後、「行く」「明日」「急いで」「朝食」というつながり予測候補が表示されることになる(図3のステップA4)。
(実施の形態2)
次に、本発明の他の実施の形態2について図面を参照して詳細に説明する。
図4は本発明の日本語入力装置の他の実施の形態を示す図である。本実施の形態は、図1に示す実施の形態において、つながり予測情報反映部42、つながり予測辞書61及びつながり予測エンジン62の代わりに、名詞データの後接助詞(後ろに接続する助詞)の情報の処理を追加したつながり予測情報反映部(2)43、この後接助詞を扱うための追加フィールドを設けたつながり予測辞書(2)63及び前記追加フィールドを扱うことが可能なつながり予測エンジン(2)64とを有する点で異なる。
図5は本実施の形態のつながり予測辞書(2)の内容を示す図である。本実施の形態のつながり予測辞書(2)63は基底情報及び共起情報の各欄に「後続助詞」を追加して、名詞等の「表記」と「後続助詞」の組み合わせ単位で基底情報及び共起情報を保存する点が図1に示す実施の形態と異なる。ユーザ作成文章部5から読み出した一文の文節区切りにより生成した基底情報と共起情報によりつながり予測辞書(2)の内容が更新される様子を示している。
図6は本実施の形態2の動作フローチャートを示す図である。以下、本実施の形態2の動作を図4、5、6を参照して詳細に説明する。
図6に示すステップA1は文節区切りに後続助詞を含める処理を行い、図6のステップB1では、名詞で追加されたフィールド毎の基底情報の共起情報を作成し、図6のステップB2では、つながり予測辞書(2)63に追加フィールドを含めた基底情報と共起情報による更新が行われる。図6のステップA4ではつながり予測エンジン(2)64による後続助詞を含めた基底情報に対応する共起情報のつながり予測候補が表示され、図6のステップA5でつながり予測候補を利用した作成文書がユーザ作成文章部5に保存される動作は実施の形態1と同様である。
次に、実施の形態2の動作を図5に示す具体例で詳細に説明する。
実施の形態1と同様にユーザ作成文章部5からの文章が「太郎が朝食を急いで食べた。」という一文で構成されている場合を考える。この一文を構成する文節は「太郎が」「朝食を」「急いで」「食べた」であり、これら文節が共起するという情報が得られる。今回は助詞も含めて扱うため、「太郎が」と共起する情報として、「朝食を」「急いで」「食べた」がつながり予測辞書(2)63に付与される。仮に、先の例と同様に「太郎に」の共起情報を「表記:頻度」で表記することとし、更新前の状態が「行く:3」「明日:2」「急いで:1」「朝食:1」であったとすると、今回の更新で「行く:3」「明日:2」「急いで:2」「朝食:2」「食べた:1」となる。頻度「2」以上をつながり予測候補として表示する閾値とすると、更新前では「行く」「明日」しか予測(表示)されないのに対して、更新後、「行く」「明日」「急いで」「朝食を」という予測候補が表示されることとなる(図6のステップB2、図5)。以下の動作は実施の形態1と同様である。
(実施の形態3)
本発明のさらに他の実施の形態3について図面を参照して詳細に説明する。
図7は本発明の日本語入力装置の他の実施の形態3を示す図である。実施の形態3では、図4で示した実施の形態2において、つながり予測情報反映部(2)43、つながり予測(2)63及びつながり予測エンジン(2)64の代わりに、ユーザ作成文章部5からメール情報として電子メール送付先(送付先アドレス)、新規/返信等を抽出することが可能である、つながり予測情報反映部(3)44、メール情報を含めて保管することが可能である、つながり予測辞書(3)65、つながり予測エンジン(3)66を備えている。
つながり予測情報反映部(3)44は、ユーザ作成文章部5から電子メール情報(メール送付先、新規/返信)をも抽出し、つながり予測辞書(3)65のつながり予測データに反映させることにより、ユーザの入力装置1、出力装置2及び制御部3を使用した文字入力において、電子メールの送信先毎に使用頻度の高いつながり予測データが表示することを可能とするつながり予測エンジン(3)66により、電子メールの送信先毎に当該電子メールと共起関係にあり使用頻度が高い基底情報の表示を可能とし、よりきめの細かい共起情報の表示ができるように構成したものである。
図8はつながり予測辞書(3)の内容を示す図である。後接助詞を含む基底情報及び共起情報に加えてメール情報の欄を設け、該メール情報欄にはメール送付先と新規か返信かを区別する新規/返信の欄を追加した点が図5に示す実施の形態と異なる。
図9は実施の形態3の動作フローチャートを示す図である。図9に示す動作フローチャートにおいて、文節区切り部41は、ユーザが作成した文章をユーザ作成文章部5から読み込み、文節区切りを実施する(図9のステップA1)。つながり予測情報反映部(3)44は、前記文章が電子メールの文章か否かを判断し(図9のステップC1)、電子メールの場合には、その送付先アドレスと該電子メールが新規か返信か等のメール情報を取得し(図9のステップC2)、文節区切り部41からの文節区切り情報と、電子メールの場合のメール情報から基底情報及び共起情報を作成し(図9のステップC3)、つながり予測辞書(3)65における各文節の情報として反映する(図9のステップC4)。以下の処理は実施の形態1と同様であり、ユーザの入力装置1、出力装置2及び制御部3を使用した文字入力において、つながり予測辞書(3)65を参照するつながり予測エンジン(3)66により、ユーザの作成文書が電子メールの場合には、当該電子メールのメール送付先別に、更に新規メールか返信メールかに応じてそれぞれの文章を構成する文節により、使用頻度の高い文節がつながり予測候補として出力装置2の表示画面上に表示されることになり、電子メールでの文字入力の使い勝手のよい日本語処理が実現される。
(実施の形態4)
次に、本発明の日本語処理装置及び日本語処理方法についてコンピュータを制御するプログラムにより実現する実施の形態4について説明する。
図10は、実施の形態4の携帯機器等の構成を示す図である。入力装置1、出力装置2、制御装置(CPU)7、記憶装置9から構成される。記憶装置8には本発明の日本語処理等の処理プログラム81、ユーザ作成文書82及びつながり予測辞書83が格納されており、処理プログラム81は、記憶装置8から制御装置(CPU)7に読み込まれ、制御装置(CPU)7の動作を制御する。
本実施の形態4はユーザからの入力装置1の操作によりメニュー機能から電子メール文等の文章作成機能を選択し、入力装置1及びLCD表示等の出力装置2による文章作成が可能である。制御装置(CPU)7はこのための動作を処理プログラム81により制御され、制御装置7は入力された文字列から文節を区切る文節区切り機能71、区切られた文節等に基づいてつながり予測辞書83に記録された文節とその文節に共起する共起情報を使用頻度とともに追加、更新するつながり予測反映機能72、入力装置1から入力された文字列及びつながり予測辞書83を参照して読み出したつながり予測データをつながり予測候補として出力装置に表示する表示制御機能73、表示上のつながり予測候補の選択に選択及び入力された文字列により文章を作成する文章作成機能74及びつながり予測辞書83を参照して所定閾値以上の使用頻度のつながり予測データの出力を実現する。
これら処理プログラムによる機能は、それぞれ以上の実施の形態の図1、4、7に示す文節区切り部、つながり予測反映部、つながり予測辞書、つながり予測エンジン及び制御部の機能と同様であり、図3、6、9に示す動作フローチャートの手順を実行することが可能である。
以上の実施の形態においては、入力装置1から入力された基底情報の文節又はメール情報は正規の「よみ」による入力例、例えば、「たろう→太郎」の変換入力を前提として説明したが、本発明においては、この基底情報については従来の入力補助と同様の前後か関係のみの文節から構築されたデータからの予測データによる入力、例えば「た→太郎」の予測変換による入力とすることが可能であることは言うまでもない。
本発明の日本語処理装置の一実施の形態を示す図である。 つながり予測辞書の内容を示す図である。 本実施の形態の動作フローチャートを示す図である。 本発明の日本語入力装置の他の実施の形態2を示す図である。 実施の形態2のつながり予測辞書(2)の内容を示す図である。 実施の形態2の動作フローチャートを示す図である。 本発明の日本語入力装置の他の実施の形態3を示す図である。 実施の形態3つながり予測辞書(3)の内容を示す図である。 実施の形態3の動作フローチャートを示す図である。 本発明の日本語入力装置の他の実施の形態4を示す図である。
符号の説明
1 入力装置
2 出力装置
3 制御部
4 つながり予測情報抽出処理装置
5 ユーザ作成文書部
6 つながり予測装置
7 制御装置(CPU)
8 記憶装置
81 処理プログラム
41 文節区切り部
42 つながり予測情報反映部
61 つながり予測辞書
62 つながり予測エンジン

Claims (12)

  1. 文字列を入力する入力装置と、文字列を表示する出力装置と、文節と該文節に共起する文節の共起情報が使用頻度とともに記録されたつながり予測辞書と、入力された文章の一文を単位として当該一文を構成する文節に区切る文節区切り部と、区切られた文節に基づいてつながり予測辞書を更新するつながり予測情報反映部と、前記入力装置から入力した文節に基づいてつながり予測辞書を参照して当該文節に応じた共起情報を出力するつながり予測エンジンと、前記入力装置から入力した文字列を前記出力装置に表示するとともに、前記つながり予測エンジンから出力された共起情報を入力補助のために表示、制御する制御部と、を有することを特徴とする日本語処理装置。
  2. 前記制御部は、表示されたつながり予測候補から選択された1乃至複数のつながり予測候補を含む文章の作成を制御することを特徴とする請求項1記載の日本語処理装置。
  3. 前記つながり予測辞書には、前記共起情報として共起する元の文節の表記及びよみからなる基底情報と、共起される文節の表記、よみ、頻度情報及び頻度更新日が記録されることを特徴とする請求項1又は2記載の日本語処理装置。
  4. 前記つながり予測辞書には、前記基底情報として電子メールの送付先を含むメール情報が記録されることを特徴とする請求項3記載の日本語処理装置。
  5. 文節と該文節に共起する文節の共起情報が使用頻度とともに記録されたつながり予測辞書を参照して、入力した文節に対し、前記使用頻度に基づいてつながり予測候補を入力補助のために表示する日本語処理方法において、
    前記つながり予測辞書の前記共起情報及び使用頻度は、作成された文章の一文を単位として当該一文を構成する文節に基づいて追加、更新することを特徴とする日本語処理方法。
  6. 表示されたつながり予測候補から選択された1乃至複数のつながり予測候補を含む文章の作成を行うことを特徴とする請求項5記載の日本語処理方法。
  7. 前記つながり予測辞書は、共起する元の文節の表記及びよみからなる基底情報と、共起される文節の表記、よみ、頻度情報及び頻度更新日からなる前記共起情報とが記録されることを特徴とする請求項5又は6記載の日本語処理方法。
  8. 前記つながり予測辞書は、作成された文書の一文が電子メールの場合に、前記基底情報として電子メールの送付先を含むメール情報が記録されることを特徴とする請求項7記載の日本語処理方法。
  9. つながり予測辞書を参照して入力装置から入力された文節に共起する共起情報をつながり予測候補として出力装置に入力補助のために表示する日本語処理用の処理プログラムであって、コンピュータに、
    文節と該文節に共起する文節の共起情報が使用頻度とともに記録されるつながり予測辞書を作成された文章の一文を単位とする当該一文を構成する文節に基づいて追加、更新する処理と、入力装置から入力された文節に対し、つながり予測辞書を参照し、前記共起情報の使用頻度に基づいてつながり予測候補を出力装置に表示する処理と、を実行させることを特徴とする日本語処理用プログラム。
  10. 前記コンピュータに、表示されたつながり予測候補から選択された1乃至複数のつながり予測候補を含む文章を作成する処理を実行させることを特徴とする請求項9記載の日本語処理用プログラム。
  11. 前記コンピュータに、共起する元の文節の表記及びよみからなる基底情報と、共起される文節の表記、よみ、頻度情報及び頻度更新日からなる前記共起情報とを前記つながり予測辞書に記録する処理を実行させることを特徴とする請求項9又は10記載の日本語処理用プログラム。
  12. 前記コンピュータに、作成された文書の一文が電子メールの場合に、前記つながり予測辞書に前記基底情報として電子メールの送付先を含むメール情報を記録する処理を実行することを特徴とする請求項11記載の日本語処理用プログラム。
JP2005356653A 2005-12-09 2005-12-09 日本語処理装置、日本語処理方法及び日本語処理用プログラム Pending JP2007164278A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005356653A JP2007164278A (ja) 2005-12-09 2005-12-09 日本語処理装置、日本語処理方法及び日本語処理用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005356653A JP2007164278A (ja) 2005-12-09 2005-12-09 日本語処理装置、日本語処理方法及び日本語処理用プログラム

Publications (1)

Publication Number Publication Date
JP2007164278A true JP2007164278A (ja) 2007-06-28

Family

ID=38247127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005356653A Pending JP2007164278A (ja) 2005-12-09 2005-12-09 日本語処理装置、日本語処理方法及び日本語処理用プログラム

Country Status (1)

Country Link
JP (1) JP2007164278A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009048374A (ja) * 2007-08-17 2009-03-05 Nec Corp 文字入力装置および情報処理機器における文字入力方法
JP2013092914A (ja) * 2011-10-26 2013-05-16 Fujitsu Ltd 入力支援プログラム、入力支援装置、及び入力支援方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0652151A (ja) * 1992-07-31 1994-02-25 Toshiba Corp 共起学習装置及びこれを用いたかな漢字変換装置
JPH09259123A (ja) * 1996-03-26 1997-10-03 Mitsubishi Electric Corp 文字入力装置及び文字入力方法
JP2003108547A (ja) * 2001-09-28 2003-04-11 Mitsubishi Electric Corp 仮名漢字変換装置及び方法
JP2004318441A (ja) * 2003-04-15 2004-11-11 Sony Corp かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム
JP2005234742A (ja) * 2004-02-18 2005-09-02 Toshiba Corp 文章作成装置および入力単語予測方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0652151A (ja) * 1992-07-31 1994-02-25 Toshiba Corp 共起学習装置及びこれを用いたかな漢字変換装置
JPH09259123A (ja) * 1996-03-26 1997-10-03 Mitsubishi Electric Corp 文字入力装置及び文字入力方法
JP2003108547A (ja) * 2001-09-28 2003-04-11 Mitsubishi Electric Corp 仮名漢字変換装置及び方法
JP2004318441A (ja) * 2003-04-15 2004-11-11 Sony Corp かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム
JP2005234742A (ja) * 2004-02-18 2005-09-02 Toshiba Corp 文章作成装置および入力単語予測方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009048374A (ja) * 2007-08-17 2009-03-05 Nec Corp 文字入力装置および情報処理機器における文字入力方法
JP2013092914A (ja) * 2011-10-26 2013-05-16 Fujitsu Ltd 入力支援プログラム、入力支援装置、及び入力支援方法

Similar Documents

Publication Publication Date Title
US8726148B1 (en) Method and apparatus for processing text and character data
KR100893447B1 (ko) 사용자 단어 및 사용자 동작의 컨텍스트 예측 장치 및 방법
JP5802292B2 (ja) 共有された言語モデル
JP3983265B1 (ja) 辞書作成支援システム、方法及びプログラム
KR20080104259A (ko) 컴퓨팅 장치 및 그 동작 방법
JP2007265458A (ja) 複数の圧縮オプションを生成する方法およびコンピュータ
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
KR101030831B1 (ko) 더블―바이트 폰트의 음성 표현을 디스플레이하는 방법 및시스템
JP2010520532A (ja) 画数の入力
JPH10326275A (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP2007164278A (ja) 日本語処理装置、日本語処理方法及び日本語処理用プログラム
JP2008217052A (ja) 情報表示装置及び情報表示プログラム
JPH07334499A (ja) 文字列入力装置
JP7247593B2 (ja) 生成装置、ソフトウェアロボットシステム、生成方法及び生成プログラム
JP6221275B2 (ja) 文字入力用のプログラムおよび文字入力装置
JP2004318441A (ja) かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム
JP5442212B2 (ja) 電子機器
JP2002207557A (ja) 日本語入力システム、日本語入力方法、および、記録媒体
JP2831837B2 (ja) 文書検索装置
JP2004118461A (ja) 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体
JP4404436B2 (ja) 文字入力装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP2004264960A (ja) 用例ベースの文変換装置、およびコンピュータプログラム
JPH05290030A (ja) 文書処理装置
JP2000067045A (ja) テキスト変換装置およびテキスト変換プログラムを格納したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081112

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20090702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110329

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110705

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110802

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111101