JP2007164278A - 日本語処理装置、日本語処理方法及び日本語処理用プログラム - Google Patents
日本語処理装置、日本語処理方法及び日本語処理用プログラム Download PDFInfo
- Publication number
- JP2007164278A JP2007164278A JP2005356653A JP2005356653A JP2007164278A JP 2007164278 A JP2007164278 A JP 2007164278A JP 2005356653 A JP2005356653 A JP 2005356653A JP 2005356653 A JP2005356653 A JP 2005356653A JP 2007164278 A JP2007164278 A JP 2007164278A
- Authority
- JP
- Japan
- Prior art keywords
- connection prediction
- phrase
- information
- sentence
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】文字列を入力する入力装置1と、文字列を表示する出力装置2と、文節と該文節に共起する文節の共起情報が使用頻度とともに記録されたつながり予測辞書61と、入力された文章の一文を単位として当該一文を構成する文節に区切る文節区切り部41と、区切られた文節に基づいてつながり予測辞書61を更新するつながり予測情報反映部42と、前記入力装置1から入力した文節に基づいてつながり予測辞書61を参照して当該文節に応じた共起情報を出力するつながり予測エンジン62と、前記入力装置1から入力した文字列を前記出力装置2に表示するとともに、前記つながり予測エンジン62から出力された共起情報を入力補助のために表示、制御する制御部3と、を有する。
【選択図】図1
Description
図1は本発明の日本語処理装置の一実施の形態を示す図である。本実施の形態は、キーボード等の入力装置1、LCDディスプレイ装置等の出力装置2、入力装置1からの入力情報の制御及び出力装置2への出力情報の制御を行う制御部3、つながり予測情報を抽出するつながり予測情報抽出処理装置4、つながり予測情報を抽出する対象であるユーザ作成文書を保存するユーザ作成文章部5、日本語入力によりつながり予測データ処理を行うつながり予測装置6とを備える。また、つながり予測情報抽出処理装置4は、文節区切り部41と、つながり予測情報反映部42とを備え、つながり予測装置6は、つながり予測辞書61と、つながり予測エンジン62とを備える。各部の機能は以下のとおりである。
次に、本実施の形態の動作について詳細に説明する。
図2はつながり予測辞書の内容を示す図であり、図3は本実施の形態の動作フローチャートを示す図である。以下、図1〜3を参照して説明する。
例えば、ユーザ作成文章部5から読み出した一文が「太郎が朝食を急いで食べた。」という文章構成を有する場合を考える。まず、文節区切り部41にてこの文に対して、文節区切り(「太郎が/朝食を/急いで/食べた。」)を実施する。これにより、この一文を構成する文節は「太郎が」「朝食を」「急いで」「食べた」であり、これらが共起するという情報が得られる。共起情報で助詞は省略して扱うと、「太郎」に対して、「朝食」「急いで」「食べた」が共起するという情報がつながり予測辞書61に付与される。「太郎」に対する共起情報を「表記:頻度」で表記すると、仮に更新前の状態が「行く:3」「明日:2」「急いで:1」「朝食:1」であったとすると、今回の更新で「行く:3」「明日:2」「急いで:2」「朝食:2」「食べた:1」となる。頻度「2」以上をつながり予測候補として表示する閾値とすると、更新前では「行く」「明日」しか予測されないものに対して、更新後、「行く」「明日」「急いで」「朝食」という予測候補が表記されることとなる(図3のステップA3、図2)。ここで、「朝食」は「朝食:1」となるはずであるが、「朝食」は基底情報の「太郎」に隣接する文節であり、隣接する文節は強い共起関係にあると考えられるため、このような文節は必ずつながり予測候補として扱われるように、その頻度「1」に更に「閾値-1」を加えた値(「朝食:2」)を用いて更新している。この後、つながり予測装置6を使用して、日本語入力する際、「太郎(が)」と入力した後、「行く」「明日」「急いで」「朝食」というつながり予測候補が表示されることになる(図3のステップA4)。
次に、本発明の他の実施の形態2について図面を参照して詳細に説明する。
図4は本発明の日本語入力装置の他の実施の形態を示す図である。本実施の形態は、図1に示す実施の形態において、つながり予測情報反映部42、つながり予測辞書61及びつながり予測エンジン62の代わりに、名詞データの後接助詞(後ろに接続する助詞)の情報の処理を追加したつながり予測情報反映部(2)43、この後接助詞を扱うための追加フィールドを設けたつながり予測辞書(2)63及び前記追加フィールドを扱うことが可能なつながり予測エンジン(2)64とを有する点で異なる。
図6に示すステップA1は文節区切りに後続助詞を含める処理を行い、図6のステップB1では、名詞で追加されたフィールド毎の基底情報の共起情報を作成し、図6のステップB2では、つながり予測辞書(2)63に追加フィールドを含めた基底情報と共起情報による更新が行われる。図6のステップA4ではつながり予測エンジン(2)64による後続助詞を含めた基底情報に対応する共起情報のつながり予測候補が表示され、図6のステップA5でつながり予測候補を利用した作成文書がユーザ作成文章部5に保存される動作は実施の形態1と同様である。
実施の形態1と同様にユーザ作成文章部5からの文章が「太郎が朝食を急いで食べた。」という一文で構成されている場合を考える。この一文を構成する文節は「太郎が」「朝食を」「急いで」「食べた」であり、これら文節が共起するという情報が得られる。今回は助詞も含めて扱うため、「太郎が」と共起する情報として、「朝食を」「急いで」「食べた」がつながり予測辞書(2)63に付与される。仮に、先の例と同様に「太郎に」の共起情報を「表記:頻度」で表記することとし、更新前の状態が「行く:3」「明日:2」「急いで:1」「朝食:1」であったとすると、今回の更新で「行く:3」「明日:2」「急いで:2」「朝食:2」「食べた:1」となる。頻度「2」以上をつながり予測候補として表示する閾値とすると、更新前では「行く」「明日」しか予測(表示)されないのに対して、更新後、「行く」「明日」「急いで」「朝食を」という予測候補が表示されることとなる(図6のステップB2、図5)。以下の動作は実施の形態1と同様である。
本発明のさらに他の実施の形態3について図面を参照して詳細に説明する。
図7は本発明の日本語入力装置の他の実施の形態3を示す図である。実施の形態3では、図4で示した実施の形態2において、つながり予測情報反映部(2)43、つながり予測(2)63及びつながり予測エンジン(2)64の代わりに、ユーザ作成文章部5からメール情報として電子メール送付先(送付先アドレス)、新規/返信等を抽出することが可能である、つながり予測情報反映部(3)44、メール情報を含めて保管することが可能である、つながり予測辞書(3)65、つながり予測エンジン(3)66を備えている。
次に、本発明の日本語処理装置及び日本語処理方法についてコンピュータを制御するプログラムにより実現する実施の形態4について説明する。
図10は、実施の形態4の携帯機器等の構成を示す図である。入力装置1、出力装置2、制御装置(CPU)7、記憶装置9から構成される。記憶装置8には本発明の日本語処理等の処理プログラム81、ユーザ作成文書82及びつながり予測辞書83が格納されており、処理プログラム81は、記憶装置8から制御装置(CPU)7に読み込まれ、制御装置(CPU)7の動作を制御する。
2 出力装置
3 制御部
4 つながり予測情報抽出処理装置
5 ユーザ作成文書部
6 つながり予測装置
7 制御装置(CPU)
8 記憶装置
81 処理プログラム
41 文節区切り部
42 つながり予測情報反映部
61 つながり予測辞書
62 つながり予測エンジン
Claims (12)
- 文字列を入力する入力装置と、文字列を表示する出力装置と、文節と該文節に共起する文節の共起情報が使用頻度とともに記録されたつながり予測辞書と、入力された文章の一文を単位として当該一文を構成する文節に区切る文節区切り部と、区切られた文節に基づいてつながり予測辞書を更新するつながり予測情報反映部と、前記入力装置から入力した文節に基づいてつながり予測辞書を参照して当該文節に応じた共起情報を出力するつながり予測エンジンと、前記入力装置から入力した文字列を前記出力装置に表示するとともに、前記つながり予測エンジンから出力された共起情報を入力補助のために表示、制御する制御部と、を有することを特徴とする日本語処理装置。
- 前記制御部は、表示されたつながり予測候補から選択された1乃至複数のつながり予測候補を含む文章の作成を制御することを特徴とする請求項1記載の日本語処理装置。
- 前記つながり予測辞書には、前記共起情報として共起する元の文節の表記及びよみからなる基底情報と、共起される文節の表記、よみ、頻度情報及び頻度更新日が記録されることを特徴とする請求項1又は2記載の日本語処理装置。
- 前記つながり予測辞書には、前記基底情報として電子メールの送付先を含むメール情報が記録されることを特徴とする請求項3記載の日本語処理装置。
- 文節と該文節に共起する文節の共起情報が使用頻度とともに記録されたつながり予測辞書を参照して、入力した文節に対し、前記使用頻度に基づいてつながり予測候補を入力補助のために表示する日本語処理方法において、
前記つながり予測辞書の前記共起情報及び使用頻度は、作成された文章の一文を単位として当該一文を構成する文節に基づいて追加、更新することを特徴とする日本語処理方法。 - 表示されたつながり予測候補から選択された1乃至複数のつながり予測候補を含む文章の作成を行うことを特徴とする請求項5記載の日本語処理方法。
- 前記つながり予測辞書は、共起する元の文節の表記及びよみからなる基底情報と、共起される文節の表記、よみ、頻度情報及び頻度更新日からなる前記共起情報とが記録されることを特徴とする請求項5又は6記載の日本語処理方法。
- 前記つながり予測辞書は、作成された文書の一文が電子メールの場合に、前記基底情報として電子メールの送付先を含むメール情報が記録されることを特徴とする請求項7記載の日本語処理方法。
- つながり予測辞書を参照して入力装置から入力された文節に共起する共起情報をつながり予測候補として出力装置に入力補助のために表示する日本語処理用の処理プログラムであって、コンピュータに、
文節と該文節に共起する文節の共起情報が使用頻度とともに記録されるつながり予測辞書を作成された文章の一文を単位とする当該一文を構成する文節に基づいて追加、更新する処理と、入力装置から入力された文節に対し、つながり予測辞書を参照し、前記共起情報の使用頻度に基づいてつながり予測候補を出力装置に表示する処理と、を実行させることを特徴とする日本語処理用プログラム。 - 前記コンピュータに、表示されたつながり予測候補から選択された1乃至複数のつながり予測候補を含む文章を作成する処理を実行させることを特徴とする請求項9記載の日本語処理用プログラム。
- 前記コンピュータに、共起する元の文節の表記及びよみからなる基底情報と、共起される文節の表記、よみ、頻度情報及び頻度更新日からなる前記共起情報とを前記つながり予測辞書に記録する処理を実行させることを特徴とする請求項9又は10記載の日本語処理用プログラム。
- 前記コンピュータに、作成された文書の一文が電子メールの場合に、前記つながり予測辞書に前記基底情報として電子メールの送付先を含むメール情報を記録する処理を実行することを特徴とする請求項11記載の日本語処理用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005356653A JP2007164278A (ja) | 2005-12-09 | 2005-12-09 | 日本語処理装置、日本語処理方法及び日本語処理用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005356653A JP2007164278A (ja) | 2005-12-09 | 2005-12-09 | 日本語処理装置、日本語処理方法及び日本語処理用プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007164278A true JP2007164278A (ja) | 2007-06-28 |
Family
ID=38247127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005356653A Pending JP2007164278A (ja) | 2005-12-09 | 2005-12-09 | 日本語処理装置、日本語処理方法及び日本語処理用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007164278A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009048374A (ja) * | 2007-08-17 | 2009-03-05 | Nec Corp | 文字入力装置および情報処理機器における文字入力方法 |
JP2013092914A (ja) * | 2011-10-26 | 2013-05-16 | Fujitsu Ltd | 入力支援プログラム、入力支援装置、及び入力支援方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0652151A (ja) * | 1992-07-31 | 1994-02-25 | Toshiba Corp | 共起学習装置及びこれを用いたかな漢字変換装置 |
JPH09259123A (ja) * | 1996-03-26 | 1997-10-03 | Mitsubishi Electric Corp | 文字入力装置及び文字入力方法 |
JP2003108547A (ja) * | 2001-09-28 | 2003-04-11 | Mitsubishi Electric Corp | 仮名漢字変換装置及び方法 |
JP2004318441A (ja) * | 2003-04-15 | 2004-11-11 | Sony Corp | かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム |
JP2005234742A (ja) * | 2004-02-18 | 2005-09-02 | Toshiba Corp | 文章作成装置および入力単語予測方法 |
-
2005
- 2005-12-09 JP JP2005356653A patent/JP2007164278A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0652151A (ja) * | 1992-07-31 | 1994-02-25 | Toshiba Corp | 共起学習装置及びこれを用いたかな漢字変換装置 |
JPH09259123A (ja) * | 1996-03-26 | 1997-10-03 | Mitsubishi Electric Corp | 文字入力装置及び文字入力方法 |
JP2003108547A (ja) * | 2001-09-28 | 2003-04-11 | Mitsubishi Electric Corp | 仮名漢字変換装置及び方法 |
JP2004318441A (ja) * | 2003-04-15 | 2004-11-11 | Sony Corp | かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム |
JP2005234742A (ja) * | 2004-02-18 | 2005-09-02 | Toshiba Corp | 文章作成装置および入力単語予測方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009048374A (ja) * | 2007-08-17 | 2009-03-05 | Nec Corp | 文字入力装置および情報処理機器における文字入力方法 |
JP2013092914A (ja) * | 2011-10-26 | 2013-05-16 | Fujitsu Ltd | 入力支援プログラム、入力支援装置、及び入力支援方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8726148B1 (en) | Method and apparatus for processing text and character data | |
KR100893447B1 (ko) | 사용자 단어 및 사용자 동작의 컨텍스트 예측 장치 및 방법 | |
JP5802292B2 (ja) | 共有された言語モデル | |
JP3983265B1 (ja) | 辞書作成支援システム、方法及びプログラム | |
KR20080104259A (ko) | 컴퓨팅 장치 및 그 동작 방법 | |
JP2007265458A (ja) | 複数の圧縮オプションを生成する方法およびコンピュータ | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
KR101030831B1 (ko) | 더블―바이트 폰트의 음성 표현을 디스플레이하는 방법 및시스템 | |
JP2010520532A (ja) | 画数の入力 | |
JPH10326275A (ja) | 形態素解析方法および装置、並びに日本語形態素解析方法および装置 | |
JP2007164278A (ja) | 日本語処理装置、日本語処理方法及び日本語処理用プログラム | |
JP2008217052A (ja) | 情報表示装置及び情報表示プログラム | |
JPH07334499A (ja) | 文字列入力装置 | |
JP7247593B2 (ja) | 生成装置、ソフトウェアロボットシステム、生成方法及び生成プログラム | |
JP6221275B2 (ja) | 文字入力用のプログラムおよび文字入力装置 | |
JP2004318441A (ja) | かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム | |
JP5442212B2 (ja) | 電子機器 | |
JP2002207557A (ja) | 日本語入力システム、日本語入力方法、および、記録媒体 | |
JP2831837B2 (ja) | 文書検索装置 | |
JP2004118461A (ja) | 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体 | |
JP4404436B2 (ja) | 文字入力装置 | |
JPH10198664A (ja) | 日本語入力システム及び日本語入力プログラムを記録した媒体 | |
JP2004264960A (ja) | 用例ベースの文変換装置、およびコンピュータプログラム | |
JPH05290030A (ja) | 文書処理装置 | |
JP2000067045A (ja) | テキスト変換装置およびテキスト変換プログラムを格納したコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081112 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20090702 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110329 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110614 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110705 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110802 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111101 |