JP2000048018A - 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体 - Google Patents
入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体Info
- Publication number
- JP2000048018A JP2000048018A JP10211117A JP21111798A JP2000048018A JP 2000048018 A JP2000048018 A JP 2000048018A JP 10211117 A JP10211117 A JP 10211117A JP 21111798 A JP21111798 A JP 21111798A JP 2000048018 A JP2000048018 A JP 2000048018A
- Authority
- JP
- Japan
- Prior art keywords
- word
- input
- independent
- character string
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
提示する。 【解決手段】入力部101より入力された文字列を予測
制御部107に渡し、予測自立語辞書検索部108を起
動して、入力文字列に続く自立語の検索を行う。次に、
予測付属語辞書検索部110を起動して、自立語に接続
される付属語の検索を行う。この検索により得た自立語
および付属語を当該入力文字列の予測候補とし、こけを
出力部103を通じて表示する。これにより、ユーザは
文字列を入力した際に、付属語を含めた形で予測候補を
得ることができ、付属語などの語尾表現を自ら追加入力
する手間がなくなる。
Description
ュータやワードプロセッサ等で日本語文章を作成するた
めに使用される日本語入力システムにおいて、ユーザが
入力した文字列を元に、それに続いてユーザが入力しよ
うとする文字列を予測する入力予測装置に係り、特に付
属語を含めた形で入力予測を行うことのできる入力予測
装置と、この装置に用いられる入力予測方法及び入力予
測プログラムを記録した記録媒体に関する。
計算機を用いたコミュニケーションが一般化しつつあ
る。それに伴い、デスクトップ計算機を用いたビジネス
文書の作成、論文の執筆といった、文書作成の従来から
の主な用途に加えて、携帯情報機器を利用した電子メー
ルの利用、メモの作成といった、より個人的な場面でも
計算機で日本語文章を入力する機会が増大している。こ
のような状況の中で、キーボード操作に熟練していない
人でも、少ないキータッチで情報を正確に入力するため
の技術が求められている。
子装置は小型化し、携帯機器の普及も著しい。携帯機器
においては、入力操作部のサイズが小さいことから、文
書の入力作業の負担はさらに大きく、ユーザの入力に関
わる負担を軽減することが望まれる。
して、入力したい文字列の一部を入力し、予め優先順位
と共に登録しておいた文字列テーブルや、頻度と共に記
憶してある過去の入力文字列の中から、優先順位や頻度
の高い順に予測文字列を提示するという方法が提案され
ている(特開昭60−105029号公報、特開昭61
−74062号公報、特開昭61−156468号公
報、特開平2−131623号公報)。
の単語や慣用表現、過去に入力された単語等を検索して
予測候補として提示するものであり、予測候補における
付属語や活用語尾の扱いについては考慮されていない。
は、用言の活用形を出力しないように制限する、活用形
に応じて句読点等の特定文字列を自動的に付加するとい
う方法が提案されている。
力されないため、語彙によってはユーザには意味が分か
り難いし、また、ユーザは提示された予測候補の選択に
引き続いて、必ず語尾表現を自ら追加入力しなくてはな
らない。
の入力予測では、付属語などの語尾表現を含めた形で予
測候補を提示することはできなかった。このため、入力
文字列に続く文字列が予測候補として提示されたとして
も、その予測候補の後ろに付く語尾表現をユーザ自ら追
加入力する必要があった。
ので、付属語などの語尾表現を含めた形で予測候補を提
示することにより、文書入力の効率を向上させ、入力操
作の負担を一層軽減することのできる入力予測装置、入
力予測方法及び入力予測プログラムを記録した記録媒体
を提供することを目的とする。
は、文字列を入力する入力手段と、自立語に関する情報
を記憶した自立語辞書と、この自立語辞書とは個別ある
いは一体に設けられ、付属語に関する情報を記憶した付
属語辞書と、上記入力手段によって入力された文字列に
続く自立語を上記自立語辞書から検索する自立語検索手
段と、この自立語検索手段によって得られた自立語に接
続される付属語を上記付属語辞書から検索する付属語検
索手段と、上記自立語検索手段によって得られた自立語
および上記付属語検索手段によって得られた付属語を当
該入力文字列に対する予測候補として提示する候補提示
手段とを具備したことを特徴とする(請求項1)。
びこの自立語辞書とは個別あるいは一体に設けられた付
属語辞書を用い、入力文字列に続く自立語と、その自立
語に接続される付属語を検索し、これを当該入力文字列
に対する予測候補として提示する。これにより、ユーザ
は文字列を入力した際に、付属語を含めた形で予測候補
を得ることができ、付属語などの語尾表現を自ら追加入
力する手間がなくなる。
入力する入力手段と、ユーザが過去に入力した文字列の
中で使われた自立語およびその自立語に対応する付属語
に関する情報を記憶したユーザ表現記憶手段と、上記入
力手段によって入力された文字列に続く自立語とその自
立語に接続される付属語を上記ユーザ表現記憶手段から
検索するユーザ表現検索手段と、このユーザ表現検索手
段によって得られた自立語および付属語を当該入力文字
列に対する予測候補として提示する候補提示手段とを具
備したことを特徴とする(請求項2)。
入力した文字列の中で使われた自立語およびその自立語
に対応する付属語に関する情報を記憶したユーザ表現記
憶手段を用い、入力文字列に続く自立語と、その自立語
に接続される付属語を検索し、これを当該入力文字列に
対する予測候補として提示する。これにより、ユーザは
文字列を入力した際に、付属語を含めた形で予測候補を
得ることができ、付属語などの語尾表現を自ら追加入力
する手間がなくなる。
おき、自立語に接続される付属語の候補をその頻度順に
提示したり(請求項3)、自立語と共に提示すべき付属
語の数を設定しておき、この設定された数だけ、自立語
に接続される付属語の候補を提示することで(請求項
4)、必要な付属語のみ優先的に提示することが可能と
なる。
実施形態を説明する。図1は本発明の一実施形態に係る
入力予測装置の構成を示すブロック図である。なお、本
実施形態における入力予測装置は、例えば磁気ディスク
等の記録媒体に記録されたプログラムを読み込み、この
プログラムによって動作が制御されるコンピュータによ
って実現される。
01は、例えばキーボード、マウス、ペン入力装置、音
声入力装置などからなり、文字列の入力や、カーソルの
移動、文字列の挿入・削除などの編集指示、次候補表
示、候補選択などのコマンド入力を取り込む。
だ情報を解析して、各処理部へ必要な情報を送る。各処
理部での処理結果は再び制御部102に返され、必要な
情報は出力部103を介して出力され、例えばディスプ
レイに表示される。
の情報のうち、読み文字列は制御部102を介して予測
制御部107に送られる。予測制御部107では、取り
込んだ情報を解析して各処理部へ必要な情報を送る。各
処理部での処理結果は再び予測制御部107に返され、
予測された読み文字列や漢字かな表記文字列、付属語文
字列など、必要な情報は制御部102に返される。
示された場合には、入力された読み文字列をかな漢字変
換部104に送る。かな漢字変換部104では、かな漢
字変換辞書検索部105によりかな漢字変換辞書106
を参照しながら、制御部102より送られてくる読み文
字列を漢字かな混じり文字列に変換し、その変換結果を
制御部102に返す。なお、かな漢字変換の方法は広く
公知であるので、ここでは説明を省略する。変換結果
は、制御部102を介して出力部103から出力され
る。
ら受け取った読み文字列と、かな漢字変換部104から
返される変換結果をユーザ表現記憶部114に送り、読
み文字列と変換結果とを対にして記憶する。なお、ユー
ザ表現を記憶する具体的な方法については、当社先願特
許である特願平10−36989号公報に詳しく述べて
あるので、ここでは言及しない。
保持するための記憶領域であり、例えばRAMなどから
なる。このメモリ115には、変換対象読み文字列バッ
ファ115a、予測対象読み文字列バッファ115b、
予測検索結果第1バッファ115c、予測検索結果第2
バッファ115d、予測候補バッファ115eなどが設
けられている。
かな漢字変換対象として入力された読み文字列を格納す
る。予測対象読み文字列バッファ115bは、予測対象
として入力された読み文字列を格納する。
測自立語辞書検索部108によって得られた予測自立語
辞書109の検索結果とユーザ表現検索部113によっ
て得られたユーザ表現記憶部114の検索結果とをマー
ジした状態で格納する(図10)。予測検索結果第2バ
ッファ115dは、自立語の検索結果に関連付けて予測
付属語辞書検索部110によって得られた予測付属語辞
書111の検索結果を格納する(図11参照)。予測候
補バッファ115eは、予測候補として最終的に得られ
た自立語と付属語の文字列を格納する(図12参照)。
辞書111、ユーザ表現記憶部114などのデータ構成
については、後に図2乃至図6を参照して詳しく説明す
る。次に、予測制御部107に関わる処理について説明
する。
て読み文字列を受け取る。受け取った読み文字列は、ま
ず、予測自立語辞書検索部108に送られる。予測自立
語辞書検索部108は、予測自立語辞書109を参照し
ながら、読み文字列と辞書見出しの読みが完全一致ある
いは前方一致する自立語を検索し、その検索結果を予測
制御部107に返す。予測制御部107は、受け取った
検索結果に対して自立語候補の絞り込みを行う。なお、
自立語候補を絞り込む具体的な方法については、当社先
願特許である特願平10−38990号,特願平10−
169861号公報等に詳しく述べてあるので、ここで
は言及しない。
を介して受け取った読み文字列をユーザ表現検索部11
3にも送る。ユーザ表現検索部113では、ユーザ表現
記憶部114に記憶される情報を参照して、読み文字列
と見出しの読みが完全一致あるいは前方一致するユーザ
表現を検索し、その検索結果を予測制御部107に返
す。
辞書検索部108とユーザ表現検索部113からの検索
結果をマージしてソートし、リストの上位N個(Nは任
意の値)の情報を予測付属語辞書検索部110に送る。
予測付属語辞書検索部110は、予測付属語辞書111
を参照しながら、自立語に後続する付属語を検索し、そ
の検索結果を予測制御部107に返す。予測制御部10
7は受け取った検索結果を頻度順に並べ替える。
設定部112を起動する。提示付属語数設定部112で
は、予測制御部107を介して予測付属語辞書検索部1
10の検索結果を受け取り、提示する付属語数を設定
し、その値を予測制御部107に返す。予測制御部10
7は、提示付属語数設定部112で設定された値Fに従
って、付属語検索結果の上位F個を順に取り出し、付属
語付きの予測候補をセットする。この予測候補は制御部
102に返され、出力部103に出力される。
処理の詳細についてフローチャートを用いて説明する。 (a)制御部102の処理動作 まず、制御部102の処理動作について説明する。
処理動作を示すフローチャートである。ステップS70
1において、制御部102は、メモリ115に設けられ
た変換対象読み文字列バッファ115aと予測対象読み
文字列バッファ115bを初期化した後、以下のような
処理を実行する。
入力を待ち、入力があったらステップS703に進む。
ステップS703で、その入力情報が読み文字かどうか
を判定し、読み文字である場合はステップS707に進
み、そうでない場合はステップS704に進む。なお、
入力情報が読み文字であるかどうかの判定は、予め読み
文字に関する情報が登録されたテーブルを参照する等の
処理で行うことが可能である。ここでは、句読点は読み
文字ではないとする。また、入力が所謂ローマ字入力で
ある場合には、読み1文字にあたる入力があるまで、こ
こでバッファリングを行うものとする。
バッファ115aに、入力された読み1文字を追加す
る。続いて、ステップS708で、予測対象読み文字列
バッファ115bに、入力された読み1文字を追加し、
ステップS709に進む。ステップS709では、予測
対象読み文字列バッファ115bの情報を予測制御部1
07に送り、入力予測処理をスタートさせる。予測制御
部107の処理については後に詳述する。
2に返すので、ステップS710でその結果を受け取
り、表示処理を行い、ステップS702に戻る。表示処
理については後に詳述する。
ー、例えば変換キーであるかどうかを判定し、そうであ
る場合はステップS711に進み、そうでない場合はス
テップS705に進む。ステップS711で、変換対象
読み文字列バッファ115aの情報をかな漢字変換部1
04に送り、かな漢字変換処理をスタートさせる。
102に返すので、ステップS712でその結果を受け
取り、表示処理を行う。かな漢字変換部104の動作と
それに係る表示処理については、広く公知であるので、
ここでは言及しない。
S713では、変換対象読み文字列バッファ115aの
情報と、かな漢字変換部104から受け取った変換結果
とを、ユーザ表現記憶部114に送り、ステップS71
8に進む。ユーザ表現記憶部114の処理動作について
は、当社先願特許である特願平10−36989号公報
に詳しく述べてあるので、ここでは言及しない。
どうかを判定する。句読点である場合にはステップS7
14に進み、そうでない場合にはステップS706に進
む。ステップS706では、別途定義されている処理を
行う。
バッファ115aの情報をかな漢字変換部104に送
り、かな漢字変換処理をスタートさせ、ステップS71
5でかな漢字変換部104から変換結果を受け取り、表
示処理を行う。
S716では、変換対象読み文字列バッファ115aの
情報と、かな漢字変換部104から受け取った変換結果
とを、ユーザ表現記憶部114に送る。ステップS71
7で、予測対象読み文字列バッファ115bの情報をク
リアし、さらに、ステップS718で変換対象読み文字
列バッファ115aの情報をクリアし、ステップS70
2に戻る。
入力された読み文字列の情報をかな漢字変換部104、
ユーザ表現記憶部114、予測制御部107へと受け渡
し、結果を受け取って次の処埋へと進む。
図8は同実施形態における予測制御部107の処理動作
を示すフローチャートである。まず、ステップS801
で、予測制御部107は、メモリ115に設けられた予
測検索結果第1バッファ115c、予測検索結果第2バ
ッファ115d、予測候補バッファ115eを初期化し
た後、以下のような処理を実行する。
02から予測対象読み文字列バッファ115bの情報を
受け取り、予測自立語辞書検索部108に送る。予測自
立語辞書検索部108は、予測自立語辞書109を参照
して検索結果を返すので、ステップS803で、予測自
立語辞書検索部108から検索結果のリストを受け取
る。
辞書109の構成について説明する。図2に予測自立語
辞書109に格納される情報の例を示す。予測自立語辞
書109は、自立語に関する情報を記憶した予測辞書で
あって、「読み」、「漢字かな表記」、「品詞」、「頻
度」からなっている。なお、自立語とは、名詞、動詞、
形容詞、形容動詞、副詞、連体詞、接続詞、感動詞のよ
うに、一単語で一文節を形作ることができる語である。
この例では、「アプリケーション」、「出来」、「出来
上が」、「デスク」、「伴」、「入力」、「文字列」と
いった自立語に関する読みと漢字かな表記(見出し)、
頻度が登録されている。
19に進む。ステップS819では、予測対象読み文字
列バッファ115bの情報をユーザ表現検索部113に
送る。ユーザ表現検索部113は、ユーザ表現記憶部1
14に記憶される情報を参照して検索結果を返すので、
ステップS820で、ユーザ表現検索部113から検索
結果のリストを受け取る。ユーザ表現記憶部114に記
憶される情報については後述する。
自立語辞書検索結果リストとユーザ表現検索結果リス
ト)の検索件数の合計を変数Rにセットする。ステップ
S805で、受け取った2つのリストをマージして頻度
順にソートし、上位N個を予測検索結果第1バッファ1
15cにセットする。Nは予めシステムが設定しておく
か、あるいは、ユーザが明示的に指定してもよい。
バッファ115bに「で」が格納されたとする。説明を
簡略化するために、ユーザ表現記憶部114には予測対
象読み文字列にマッチする表現が記憶されていなかった
とし、予測自立語辞書109からのみ検索結果があった
とする。
cに格納される情報の例を示す。予測検索結果第1バッ
ファ115cは、予測自立語辞書検索部108によって
得られた予測自立語辞書109の検索結果とユーザ表現
検索部113によって得られたユーザ表現記憶部114
の検索結果とをマージして記憶するものであり、「番
号」、「予測対象読み文字列」、「予測結果読み」、
「予測結果漢字かな表記」、「品詞」、「頻度または出
現回数」、「辞書種類」からなっており、頻度順にソー
トされている。この例では、2つのリストの検索件数の
合計は3件であるので、R=3となる。
自立語辞書109の種類を示すものであって、ここでは
システムによって提供された辞書「SYSTEM」であ
ることが示されている。
06に進む。ステップS806で、カレントの検索結果
を示す変数iの値を1とする。ステップS807で、変
数iがN以下であるかどうかを判定する。変数iがN以
下である場合はステップS808に進み、そうでない場
合はステップS817に進む。ステップS808では、
変数iがR以下であるかどうかを判定し、変数iがR以
下である場合はステップS809に進み、そうでない場
合はステップS817に進む。
ので、i≦N、i≦Rが共に成立し、ステップS809
に進む。ステップS809では、予測検索結果第1バッ
ファ115cのi番目の情報を予測付属語辞書検索部1
10に送る。ステップS810で、予測付属語辞書検索
部110から検索結果のリストを受け取る。
いる予測付属語辞書111の構成について説明する。図
3に予測付属語辞書111に格納される情報の例を示
す。予測付属語辞書111は、語尾変化の情報として活
用形および付属語に関する情報を記憶した予測辞書であ
って、「品詞」、「活用形と付属語」、「頻度」からな
っている。付属語とは、助詞や助動詞のように、単独で
は文節になりえず、常に自立語に付属して用いられる語
である。
11に進む。ステップS811で、予測付属語辞書検索
部110から受け取った検索結果のリストを付属語頻度
順にソートし、予測検索結果第2バッファ115dにセ
ットする。
dに格納される情報の例を示す。予測検索結果第2バッ
ファ115dは、自立語の検索結果に関連付けて予測付
属語辞書検索部110によって得られた予測付属語辞書
111の検索結果を記憶するものであり、「番号」、
「読み」、「漢字かな表記」、「自立語品詞」、「自立
語頻度または出現回数」、「活用形と付属語」、「付属
語頻度または出現回数」、「辞書種類」からなってお
り、頻度順にソートされている。
す予測検索結果第1バッファ115cの1番目の情報が
予測付属語辞書検索部110に送られ、予測検索結果第
2バッファ115dの内容は図11(a)のようにな
る。
列「で」に対する1番目の予測検索結果として、読み
「でき」、漢字かな表記「出来」、品詞「カ行上1段動
詞」、頻度あるいは出現回数「5」といった自立語に関
する情報が予測付属語辞書検索部110に送られる。こ
れにより、図3に示す予測付属語辞書111から当該自
立語に対応する付属語(活用形も含む)に関する情報が
抽出されて、図11(a)に示すように、自立語と付属
語の情報が予測検索結果第2バッファ115dに格納さ
れることになる。
第2バッファ115dの情報を提示付属語数設定部11
2に送り、提示付属語数設定部112を起動する。ステ
ップS813で、提示付属語数設定部112から結果を
受け取り、F[i]にセットする。提示付属語数設定部
112の処理動作については、後に詳述する。
ッファ115dの上位F[i]個の情報を予測候補バッ
ファ115eにセットする。ステップS815で予測検
索結果第2バッファ115dをクリアし、ステップS8
16で変数iを1インクリメントし、ステップS807
に戻り、処理を続ける。
[1]=3が設定されたとすると、図11(a)に示す
予測検索結果第2バッファ115dの情報のうち、上位
3個が予測候補バッファ115eにセットされる。その
結果、予測候補バッファ115eの内容は、図12
(a)のようになる。その後、予測検索結果第2バッフ
ァ115dをクリアし、変数iを1インクリメントし、
i=2として、ステップS807に戻る。
いて、N=5、R=3、i=2であるので、i≦N、i
≦Rが共に成立し、再びステップS809に進む。上記
同様に、ステップS809で、図10に示す予測検索結
果第1バッファ115cの2番目の情報が予測付属語辞
書検索部110に送られ、ステップS810で検索結果
を受け取り、ステップS811に進む。その結果、予測
検索結果第2バッファ115dの内容は図11(b)の
ようになる。
112を起動し、ステップS813で、F[2]=2が
得られたとする。ステップS814で、図11(b)に
示す予測検索結果第2バッファ115dの情報のうち、
上位2個が予測候補バッファ115eにセットされる。
その結果、予測候補バッファ115eの内容は、図12
(b)のようになる。
ッファ115dをクリアし、ステップS816で、変数
iを1インクリメントし、i=3として、ステップS8
07に戻る。
いて、N=5、R=3、i=3であるので、i≦N、i
≦Rが共に成立し、再びステップS809に進む。上記
同様に、ステップS809で図10に示す予測検索結果
第1バッファ115cの3番目の情報が予測付属語辞書
検索部110に送られ、ステップS810で検索結果を
受け取り、ステップS811に進む。その結果、予測検
索結果第2バッファ115dの内容は図11(c)のよ
うになる。
112を起動し、ステップS813で、F[3]=1が
得られたとする。ステップS814で、図11(c)に
示す予測検索結果第2バッファ115dの情報のうち、
上位1個が予測候補バッファ115eにセットされる。
その結果、予測候補候バッファ115eの内容は、図1
2(c)のようになる。
ッファ115dをクリアし、ステップS816で、変数
iを1インクリメントし、変数i=4として、ステップ
S807に戻る。
ので、i≦Nは成立するが、i≦Rは成立しないので、
ステップS817に進む。ステップS817では、予測
検索結果第1バッファ115cをクリアし、ステップS
818に進む。ステップS818で、予測候補バッファ
115eの情報を制御部102に送り、ここでの処理を
終了する。ここでは、図12(c)の状態の予測候補バ
ッファ115eの内容が制御部102に送られる。
み文字列に対応する自立語の候補をユーザ表現を用いて
絞り込んだ後、その自立語に付属語を付加したものを予
測候補として生成し、その中で頻度の高い予測候補を制
御部102に送る処理を行う。以上が、予測制御部10
7の処理の流れである。
作 次に、提示付属語数設定部112の処理動作について説
明する。図9は提示付属語数設定部112の処理動作を
説明する。まず、ステップS901において、提示付属
語数設定部112は、予測制御部107を介して予測検
索結果第2バッファ115dの情報を受け取った後、以
下のような処理を実行する。
を変数Rにセットする。ステップS903で、R=0で
あるかどうかを判定する。R=0である場合にはステッ
プS904に進み、そうでない場合にはステップS90
6に進む。ステップS904では、F=0とし、ステッ
プS905に進む。
かを判定する。R=1である場合にはステップS907
に進み、そうでない場合にはステップS908に進む。
ステップS907では、F=1とし、ステップS905
に進む。
ップS909で、i番目の検索結果の付属語頻度をH
[i]にセットし、ステップS910で、i+1番目の
検索結果の付属語頻度をH[i+1]にセットする。ス
テップS911で、D[i]=H[i]−H[i+1]
とし、ステップS912で、D[i]≦αであるかどう
かを判定する。αは予め設定しておく閾値である。
14に進み、そうでない場合はステップS913に進
む。ステップS913では、F=iとし、ステップS9
05に進む。ステップS914では、R≧i+1である
かどうかを判定し、そうである場合はステップS915
に進み、そうでない場合はステップS913に進む。
リメントし、ステップS909に戻り、処理を続ける。
ステップS905で、Fの値を予測制御部107に送
り、処理を終了する。
第2バッファ115dの情報を例にとって具体的に説明
する。まず、ステップS901で、図11(a)の情報
を受け取り、ステップS902で、検索件数R=6がセ
ットされる。この場合、R=0でも、R=1でもないの
で、ステップS908に進む。
1とし、ステップS909で、1番目の検索結果の付属
語頻度である8をH[1]にセットする。また、ステッ
プS910で、2番目の検索結果の付属語頻度である7
をH[2]にセットする。そして、ステップS911
で、1番目と2番目の付属語頻度の差D[1]を求め
る。
αが成立し、ステップS914に進む。
るので、ステップS914で、R≧i+1が成立し、ス
テップS915に進み、iを1インクリメントして、i
=2とする。ステップS909に戻り、2番目の検索結
果の付属語頻度である7をH[2]にセットする。ステ
ップS910で、3番目の検索結果の付属語頻度である
7をH[3]にセットする。ステップS911で、2番
目と3番目の付属語頻度の差D[2]を求める。
≦αが成立し、ステップS914に進む。
るので、ステップS914で、R≧i+1が成立し、ス
テップS915に進み、iを1インクリメントして、i
=3とする。ステップS909に戻り、3番目の検索結
果の付属語頻度である7をH[3]にセットする。ステ
ップS910で、4番目の検索結果の付属語頻度である
5をH[4]にセットする。ステップS911で、3番
目と4番目の付属語頻度の差D[3]を求める。
≦αは成立せず、ステップS913に進み、F=3と
し、その結果を予測制御部107に返す。
15dに格納された各検索結果の付属語頻度を順に比較
していき、その比較結果に基づいて提示すべき候補の数
を設定する処理を行う。以上が、提示付属語数設定部1
12の処理の流れである。
すように、予測自立語辞書109と予測付属語辞書11
1が個別に設けられている場合を想定して説明したが、
自立語と付属語が一体になっている予測辞書を用いても
よい。
予測自立語辞書検索部108と予測付属語辞書検索部1
10は、図17に示すように予測辞書検索部1701に
置き換わる。また、予測自立語辞書109と予測付属語
辞書111は、図17に示すように自立語・付属語一体
型の予測辞書1702に置き換わる。
02に格納される情報の例を示す。この自立語・付属語
一体型予測辞書1702は、自立語と付属語に関する情
報を記憶した予測辞書であって、「読み」、「漢字かな
表記」、「品詞」、「頻度」、「頻度付きの活用形と付
属語」の情報からなっている。この例では、「頻度付き
の活用形と付属語」の情報は各見出し3つまでとなって
いるが、この個数は任意に設定してよい。
辞書は、付属語情報を自立語の品詞単位で持ちたい場合
に有利であり、品詞単位で持つと情報量を少なくできる
という利点がある。一方、図4に示すような一体型の予
測辞書は、付属語情報を見出し単位で管理できるため、
各見出しに即したより細かい制御が行えるといった利点
がある。
いて説明する。図5にユーザ表現記憶部114に記憶さ
れる情報の例を示す。ユーザ表現記憶部114は、ユー
ザが過去に入力した文字列の中で使われた自立語および
その自立語に対応する付属語に関する情報を記憶したも
のであって、この例では、自立語情報部分114aと付
属語情報部分114bとに分かれている。
示すように、自立語に関する「読み」、「漢字かな表
記」、「品詞」、「出現回数」の情報からなっている。
付属語情報部分114bは、図5(b)に示すように、
付属語(活用形を含む)に関する「品詞」、「活用形と
付属語」、「出現回数」の情報からなっている。
4に記憶される自立語の語尾についても、予測付属語辞
書111を参照して語尾を付与するものとして説明した
が、ユーザ表現記憶部114に記憶される自立語に関し
ては予測付属語辞書111に替わって、図5(b)に示
すユーザ表現の付属語情報部分114bを参照してもよ
い。また、予測自立語辞書109の検索結果に対して
も、予測付属語辞書111は使用せずに、図5(b)に
示すユーザ表現の付属語情報部分114bを参照しても
よい。
として、図6(a)に示すように、自立語と付属語の情
報を一体にして記憶してもよい。この例は、「読み」、
「漢字かな表記」、「品詞」、「出現回数」、「最新出
現日付」、「出現回数付きの活用形と付属語」の情報か
らなっている。「出現回数付きの活用形と付属語の情
報」は各見出し2つまでとなっているが、この個数は任
意に設定してよい。
と付属語の情報については、頻度を記憶せずに、直前に
出現した活用形と付属語の情報のみを記憶してもよい。
図6(a)の構成では、各付属語毎に頻度を更新する必
要があるが、図6(b)の構成では、最新の付属語を登
録している。ここでは、各見出しの中の最新の1つを記
憶しているが、この個数は任意に設定してよく、例えば
最新2つの情報を記憶してもよい。
114を用いた場合、図13に示すように、予測候補バ
ッファ115eには、「読み」、「漢字かな表記」、
「自立語品詞」、「頻度/出現回数」、「活用形と付属
語」、「辞書種類」といった情報が格納される。
する予測辞書、すなわち、予測自立語辞書109、予測
付属語辞書111を用いた例を説明したが、図18に示
すように、それらは使用せずに、ユーザ表現記憶部11
4に記憶される情報だけを利用して予測を行うように構
成してもよい。この場合、各バッファに格納される「辞
書種類」はユーザ辞書であることを示す「USER」と
なる。
現記憶部114に活用形と付属語の情報に関して頻度を
記憶せずに、直前に出現した活用形と付属語の情報のみ
を記憶しておくようにすれば、図18における提示付属
語数設定部112を用いずに構成することもできる。
の予測候補バッファ115eの内容を表示する場合につ
いて説明する。
でかな漢字変換が確定されており、それに続く「で」を
入力した状態である。下線は、候補未確定の状態を示し
ている。また、「で」の後ろの四角は、その位置にカー
ソルがあることを示している。ここで、ユーザが「で」
を入力すると、入力予測が働き、予測候補ウインドウ1
401が表示される。
いる。そして、この「出来」に後続する語尾の情報がそ
の右側の語尾ウインドウ1402に表示されており、1
番目の語尾「ます」が反転している。この状態で確定キ
ーを押すと、「書類は明日までに出来ます」が選択さ
れ、図15(a)に示すように、予測候補ウインドウ1
401は消える。
ウインドウ1402で次候補キーを1回押すと、図14
(b)に示すように、2番目の語尾「た」が選択され、
反転表示される。
候補ウインドウ1401で次候補キーを1回押すと、2
番目の予測候補「出来上が」が選択され、反転表示され
る。これに伴い、「出来上が」に後続する語尾の情報が
その右側の語尾ウインドウ1402に表示され、1番目
の語尾「り」が反転する。この状態で確定キーを押す
と、「書類は明日までに出来上がり」が選択され、図1
5(b)に示すように、予測候補ウインドウ1401は
消える。
5eの内容を表示する場合について説明する。図16
(a)は、「書類は昨日」までかな漢字変換が確定され
ており、それに続く「で」を入力した状態である。下線
は、候補未確定の状態を示している。また、「で」の後
ろの四角は、その位置にカーソルがあることを示してい
る。ここで、ユーザが「で」を入力すると、入力予測が
働き、予測候補ウインドウ1601が表示される。
反転している。この場合、はじめから語尾表現を含めた
形で予測候補が提示される。なお、図中の「・」は自立
語語幹部分と、付属語部分とを区別している。
日出来ました」が選択され、図16(c)に示すよう
に、予測候補ウインドウ1601は消える。また、図1
6(a)の状態において、予測候補ウインドウ1601
内で次候補キーを1回押すと、2番目の予測候補「出来
上が・った」が選択され、反転表示される。
の予測候補が語尾表現を含めた形でユーザに提示され
る。したがって、ユーザ自ら語尾を追加入力するといっ
た操作が不要となり、入力負担が軽減される。
ず、要旨を変更しない範囲で適宜変更して実施可能であ
る。また、上述した実施形態において記載した手法は、
コンピュータに実行させることのできるプログラムとし
て、例えば磁気ディスク(フロッピーディスク、ハード
ディスク等)、光ディスク(CD−ROM、DVD
等)、半導体メモリなどの記録媒体に書き込んで各種装
置に適用したり、通信媒体により伝送して各種装置に適
用することも可能である。本装置を実現するコンピュー
タは、記録媒体に記録されたプログラムを読み込み、こ
のプログラムによって動作が制御されることにより、上
述した処理を実行する。
ーザが入力した文字列に続く文字列を予測する際に、付
属語などの語尾表現を含めた形で予測候補を提示するこ
とができる。これにより、文書入力の効率が向上し、入
力操作の負担を一層軽減して簡易に日本語入力を行うこ
とができるようになる。
構成を示すブロック図。
る情報の例を示す図。
る情報の例を示す図。
属語辞書とを一体にした予測辞書に格納される情報の例
を示す図。
れる情報の例を示す図。
れる情報の別の例を示す図。
ローチャート。
すフローチャート。
動作を示すフローチャート。
ァに格納される情報の例を示す図。
ァに格納される情報の例を示す図。
される情報の例を示す図。
される情報の別の例を示す図。
を示す図。
を示す図。
概略構成を示すブロック図。
概略構成を示すブロック図。
9)
構成を示すブロック図。
る情報の例を示す図。
る情報の例を示す図。
属語辞書とを一体にした予測辞書に格納される情報の例
を示す図。
れる情報の例を示す図。
れる情報の別の例を示す図。
ローチャート。
すフローチャート。
動作を示すフローチャート。
ァに格納される情報の例を示す図。
ァに格納される情報の例を示す図。
される情報の例を示す図。
される情報の別の例を示す図。
を示す図。
を示す図。
を示す図。
概略構成を示すブロック図。
概略構成を示すブロック図。
Claims (8)
- 【請求項1】文字列を入力する入力手段と、 自立語に関する情報を記憶した自立語辞書と、 この自立語辞書とは個別あるいは一体に設けられ、付属
語に関する情報を記憶した付属語辞書と、 上記入力手段によって入力された文字列に続く自立語を
上記自立語辞書から検索する自立語検索手段と、 この自立語検索手段によって得られた自立語に接続され
る付属語を上記付属語辞書から検索する付属語検索手段
と、 上記自立語検索手段によって得られた自立語および上記
付属語検索手段によって得られた付属語を当該入力文字
列に対する予測候補として提示する候補提示手段とを具
備したことを特徴とする入力予測装置。 - 【請求項2】文字列を入力する入力手段と、 ユーザが過去に入力した文字列の中で使われた自立語お
よびその自立語に対応する付属語に関する情報を記憶し
たユーザ表現記憶手段と、 上記入力手段によって入力された文字列に続く自立語と
その自立語に接続される付属語を上記ユーザ表現記憶手
段から検索するユーザ表現検索手段と、 このユーザ表現検索手段によって得られた自立語および
付属語を当該入力文字列に対する予測候補として提示す
る候補提示手段とを具備したことを特徴とする入力予測
装置。 - 【請求項3】付属語に関する頻度情報を管理する頻度管
理手段を有し、 上記候補提示手段は、この頻度管理手段に管理された付
属語の頻度情報に基づいて、自立語に接続される付属語
の候補をその頻度順に提示することを特徴とする請求項
1または請求項2に記載の入力予測装置。 - 【請求項4】自立語と共に提示すべき付属語の数を設定
する提示付属語数設定手段を有し、 上記候補提示手段は、この提示付属語数設定手段によっ
て設定された数だけ、自立語に接続される付属語の候補
を提示することを特徴とする請求項1または請求項2に
記載の入力予測装置。 - 【請求項5】自立語に関する情報を記憶した自立語辞書
を参照して入力文字列に続く自立語を検索し、 上記自立語辞書とは個別あるいは一体に設けられ、付属
語に関する情報を記憶した付属語辞書を参照して上記自
立語に接続される付属語を検索し、 上記自立語および上記付属語を当該入力文字列に対する
予測候補として提示することを特徴とする入力予測方
法。 - 【請求項6】ユーザが過去に入力した文字列の中で使わ
れた自立語およびその自立語に対応する付属語に関する
情報をユーザ表現記憶部に記憶しておき、 入力文字列に続く自立語とその自立語に接続される付属
語を上記ユーザ表現記憶部から検索し、 この自立語および付属語を当該入力文字列に対する予測
候補として提示することを特徴とする入力予測方法。 - 【請求項7】入力された文字列を元に、それに続く文字
列を予測するための入力予測プログラムを記録した記録
媒体であって、 自立語に関する情報を記憶した自立語辞書を参照して入
力文字列に続く自立語を検索する手順と、 上記自立語辞書とは個別あるいは一体に設けられ、付属
語に関する情報を記憶した付属語辞書を参照して上記自
立語に接続される付属語を検索する手順と、 上記自立語および上記付属語を当該入力文字列に対する
予測候補として提示する手順とをコンピュータに実行さ
せるプログラムを記録したコンピュータ読取り可能な記
録媒体。 - 【請求項8】入力された文字列を元に、それに続く文字
列を予測するための入力予測プログラムを記録した記録
媒体であって、 ユーザが過去に入力した文字列の中で使われた自立語お
よびその自立語に対応する付属語に関する情報をユーザ
表現記憶部に記憶する手順と、 入力文字列に続く自立語とその自立語に接続される付属
語を上記ユーザ表現記憶部から検索する手順と、 この自立語および付属語を当該入力文字列に対する予測
候補として提示する手順とをコンピュータに実行させる
プログラムを記録したコンピュータ読取り可能な記録媒
体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10211117A JP2000048018A (ja) | 1998-07-27 | 1998-07-27 | 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10211117A JP2000048018A (ja) | 1998-07-27 | 1998-07-27 | 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000048018A true JP2000048018A (ja) | 2000-02-18 |
Family
ID=16600694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10211117A Pending JP2000048018A (ja) | 1998-07-27 | 1998-07-27 | 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000048018A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7788327B2 (en) | 2002-11-28 | 2010-08-31 | Panasonic Corporation | Device, program and method for assisting in preparing email |
JP2011192002A (ja) * | 2010-03-15 | 2011-09-29 | Omron Corp | 文字入力用のプログラムおよび通信端末装置 |
JP2013125399A (ja) * | 2011-12-14 | 2013-06-24 | Omron Corp | 文字入力用のプログラムおよび情報処理装置 |
-
1998
- 1998-07-27 JP JP10211117A patent/JP2000048018A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7788327B2 (en) | 2002-11-28 | 2010-08-31 | Panasonic Corporation | Device, program and method for assisting in preparing email |
JP2011192002A (ja) * | 2010-03-15 | 2011-09-29 | Omron Corp | 文字入力用のプログラムおよび通信端末装置 |
JP2013125399A (ja) * | 2011-12-14 | 2013-06-24 | Omron Corp | 文字入力用のプログラムおよび情報処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11416679B2 (en) | System and method for inputting text into electronic devices | |
US10402493B2 (en) | System and method for inputting text into electronic devices | |
JP6033326B2 (ja) | コンテンツベースの自動的な入力プロトコルの選択 | |
WO2012095696A2 (en) | Text segmentation with multiple granularity levels | |
JP2003248676A (ja) | 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法 | |
JPH1153384A (ja) | キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体 | |
WO2010010918A1 (ja) | 情報処理装置および情報処理方法 | |
JP3992348B2 (ja) | 形態素解析方法および装置、並びに日本語形態素解析方法および装置 | |
JP2008059392A (ja) | 辞書検索装置および辞書検索処理プログラム | |
JP2000048018A (ja) | 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体 | |
Sproat et al. | Applications of lexicographic semirings to problems in speech and language processing | |
JP2012164172A (ja) | テキスト入力装置、それを含む翻訳装置、テキスト入力方法及びコンピュータプログラム | |
JP5511161B2 (ja) | 情報処理装置および情報処理方法 | |
JP2003178087A (ja) | 外国語電子辞書検索装置および方法 | |
JP2000276466A (ja) | 文字列予測装置、文字列予測方法および文字列予測プログラムを記憶した記憶媒体 | |
JP2000057133A (ja) | 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体 | |
JP2009048374A (ja) | 文字入力装置および情報処理機器における文字入力方法 | |
JP2000010973A (ja) | 文字入力システム、文字入力方法及びコンピュータ読み取り可能な記録媒体 | |
JP2000048019A (ja) | 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体 | |
JP2010033156A (ja) | 情報処理装置および情報処理方法 | |
JP2010033418A (ja) | 携帯型翻訳装置およびそれを用いた翻訳文の出力方法 | |
JP2003016055A (ja) | 文作成装置及び文作成方法 | |
JP2000330984A (ja) | 文書処理装置及び方法 | |
JP2000235571A (ja) | 用例辞書作成装置 | |
JPS6389976A (ja) | 言語解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040525 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060411 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060801 |