JP4266667B2 - 文字列予測装置及び方法 - Google Patents

文字列予測装置及び方法 Download PDF

Info

Publication number
JP4266667B2
JP4266667B2 JP2003046387A JP2003046387A JP4266667B2 JP 4266667 B2 JP4266667 B2 JP 4266667B2 JP 2003046387 A JP2003046387 A JP 2003046387A JP 2003046387 A JP2003046387 A JP 2003046387A JP 4266667 B2 JP4266667 B2 JP 4266667B2
Authority
JP
Japan
Prior art keywords
character
search
prediction
recognition
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003046387A
Other languages
English (en)
Other versions
JP2004258800A (ja
Inventor
尚美 岩山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003046387A priority Critical patent/JP4266667B2/ja
Publication of JP2004258800A publication Critical patent/JP2004258800A/ja
Application granted granted Critical
Publication of JP4266667B2 publication Critical patent/JP4266667B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、入力された手書き文字パターンが中途であっても認識文字列を予測することができる文字列予測装置及び方法に関する。特に、手書き文字の筆記に、文字枠等の一文字ごとの入力領域を使わず、自由な位置に手書き入力された文字パターンを認識し文字列に変換する場合であっても認識文字列を予測することができる文字列予測装置及び方法に関する。
【0002】
【従来の技術】
手書き文字認識装置には、大別して、一文字ごとの文字入力領域のある枠あり手書き文字認識装置と一文字ごとの文字入力領域のない枠なし手書き文字列認識装置がある。従来の多くのオンライン手書き文字認識装置は、文字と文字の区切りの判定が不要な一文字ごとの文字入力領域を利用していた。一文字ごとの文字入力領域がない場合には、手書き文字を認識する前に、入力された手書き文字列を文字単位に分ける処理が必要となるが、文字単位に分類する処理を正確かつ高速に行うことは、実際上困難であったからである。
【0003】
例えば(特許文献1)においては、一文字ごとの文字入力領域を設け、文字列として入力が完了していない状態において、最終的な認識結果を予測することができる枠あり手書き文字認識装置が開示されている。
【0004】
しかし、一文字ごとの文字入力領域があると、一文字ごとに区切って文字入力領域内に文字を書く必要があり、自然な手書き文字の入力感を損なうことになる。そこで、近年では、普通に紙の上に手書き文字列を書く場合のように、画面上でも一文字ごとの文字入力領域を使わず、自然な形で自由に手書き文字列を書くことができる枠なし手書き文字列認識の技術の開発が進んでいる。
【0005】
一方、タブレット等から入力された筆跡パターンを認識し文字列に変換する技術においては、入力されたパターン認識結果に基づいて予測辞書を検索し、入力される文字列を予測して表示する技術が開発されている。
【0006】
例えば(特許文献2)においては、入力されたパターンに対して、個別のパターンを認識した後、認識した結果の候補文字を組み合わせて生成される文字列に基づいて単語辞書を検索し、文字列予測を行う方法が開示されている。
【0007】
【特許文献1】
特開平9−305716号公報
【0008】
【特許文献2】
特開平10−91728号公報
【0009】
【発明が解決しようとする課題】
しかし、上述したような方法は、入力されたパターン列に基づいて文字列予測を行って提示するものであり、すべての文字パターンを入力しなくても、提示された予測候補文字列を選択することで所望の文字列を入力することができ、入力効率を向上させるものである。
【0010】
すなわち(特許文献2)においては、入力されたパターンについてパターン認識を行い、候補文字群を生成させており、生成された候補文字群を組み合わせてできる複数の検索文字列と単語辞書を照合して、各検索文字列を先頭に有する単語を予測候補として検索するものである。
【0011】
しかし、かかる方法では、先頭数文字を完全に記入した時点でのみ適切な予測候補を出力することが可能であり、ある文字の一部を記入した時点においては、文字として未完成である部分筆記パターンに対する候補文字群が検索されることになるので、適切な予測候補を出力することができないという問題点があった。
【0012】
例えば、ユーザが入力しようとしている手書き文字列が「予測する」であり、「予」と「測」の「さんずいへん」までを記入した時点を考えると、「予」に対する候補文字群に「予」が含まれていても、「測」の「さんずいへん」に対する候補文字群には「測」は含まれていないことから、候補文字群を組み合わせてできる検索文字列には「予測」が含まれることがない。したがって、「予測する」という単語が予測文字列として出力されることはない。
【0013】
また、枠あり認識の場合には、最後に入力された文字枠におけるパターンは、文字パターンの記入途中である可能性があることから検索対象とせず、最後に入力された文字枠のひとつ前に記入された文字枠までを検索対象とする方法が用いられる。しかし、文字枠入力という筆記の制約のない枠なし文字列認識においては、文字の区切りが一意に決定することができないことから、どこまでを検索対象とすれば確実であるかが判定できず、適切な予測候補を出力することができないおそれがあるという問題点もあった。
【0014】
本発明は、上記状況に鑑みてなされたものであり、枠なし文字列認識において、ある文字の一部を記入した時点においても適切な予測候補を出力することができる文字列予測装置及び方法を提供することを目的とする。
【0015】
【課題を解決するための手段】
上記目的を達成するために本発明にかかる文字列予測装置は、文字列認識の対象となる手書き文字パターンを入力するパターン入力部と、入力された手書き文字パターンについて、一つの文字であると推定される文字領域候補を切り出し、接続可能な一連の文字領域候補群を一又は複数個出力する文字切り出し部と、文字切り出し部において出力されたすべての文字領域候補に含まれる手書き文字パターンに対して個別文字認識用辞書を用いて文字認識をそれぞれ行い、認識評価値を算出して、認識評価値と対応付けた認識候補文字を一又は複数出力する個別文字認識部と、文字切り出し部において切り出された一又は複数の文字領域候補群と、各文字領域候補群に対応して個別文字認識部から出力された一又は複数の認識候補文字に基づいて、文脈辞書を用いて最適な文字列を選択する文脈処理部と、文字切り出し部において出力された一連の文字領域候補群に対して予測辞書を検索するための検索文字列を生成する範囲を決定する検索対象範囲決定部と、検索対象範囲決定部で決定された範囲の文字領域候補群と、それに対応して個別文字認識部から出力された認識候補文字を組み合わせて検索文字列を生成する検索文字列生成部と、検索文字列生成部により生成された検索文字列をキー情報として予測辞書を検索する予測辞書検索部と、予測辞書検索部において検索された予測結果と文脈処理部による文脈処理の結果を表示する結果表示部と、結果表示部に表示されている予測結果の中から、ユーザにより選択指示された予測結果を結果表示部に反映させる予測候補選択部とを備えることを特徴とする。
【0016】
かかる構成により、枠なし文字列認識において、文字切り出し部において出力された一連の文字領域候補群に対して予測辞書を検索するための検索文字列を生成する範囲をユーザの手書き文字パターン入力状況に応じて決定し、決定された範囲で生成される検索文字列により予測辞書を検索することによって、ある文字の一部を記入した時点でも適切な予測候補を出力することが可能となる。
【0017】
また、本発明にかかる文字列予測装置は、検索対象範囲決定部において、文字切り出し部において出力された一連の文字領域候補群における末尾に位置する文字領域候補を除いた範囲を検索対象範囲として決定することが好ましい。末尾に位置する文字領域候補は、筆跡として完了している保証がないからである。
【0018】
また、本発明にかかる文字列予測装置は、検索対象範囲決定部において、文字切り出し部において出力された文字領域候補群の領域数が1である場合は文字領域候補を検索対象範囲とし、一連の文字領域候補群の領域数が複数である場合は一連の文字領域候補群における末尾に位置する文字領域候補を除いた範囲を検索対象範囲として決定することが好ましい。検索文字列が生成できない可能性を未然に排除することができるからである。
【0019】
また、本発明にかかる文字列予測装置は、検索対象範囲決定部において、ユーザが手書き文字パターンを入力し終わった時点からの経過時間があらかじめ設定された時間に達した場合には、文字切り出し部が出力した一連の文字領域候補群全体を検索対象範囲として決定することが好ましい。
【0020】
また、本発明にかかる文字列予測装置は、文字切り出し部から前回出力された文字領域候補群と検索対象範囲決定部により前回決定された検索対象範囲とを検索対象情報として保存しておく検索対象情報保存部と、文字切り出し部から出力された文字領域候補群と検索対象範囲決定部により決定された検索対象範囲と、検索対象情報との比較結果に応じて検索文字列の生成を行うか否かの判定を行う予測呼び出し判定部と、検索対象情報として、文字切り出し部により出力された最新の文字領域候補群と検索対象範囲決定部により決定された最新の検索対象範囲を格納する検索対象情報更新部をさらに含むことが好ましい。
【0021】
また、本発明は、上記のような文字列予測装置の機能をコンピュータの処理ステップとして実行するソフトウェアを特徴とするものであり、具体的には、文字列認識の対象となる手書き文字パターンを入力するパターン入力工程と、入力された手書き文字パターンについて、一つの文字であると推定される文字領域候補を切り出し、接続可能な一連の文字領域候補群を一又は複数個出力する文字切り出し工程と、文字切り出し工程において出力されたすべての文字領域候補に含まれる手書き文字パターンに対して個別文字認識用辞書を用いて文字認識をそれぞれ行い、認識評価値を算出して、認識評価値と対応付けた認識候補文字を一又は複数出力する個別文字認識工程と、文字切り出し工程において切り出された一又は複数の文字領域候補群と、各文字領域候補群に対応して個別文字認識工程において出力された一又は複数の認識候補文字に基づいて、文脈辞書を用いて最適な文字列を選択する文脈処理工程と、文字切り出し工程において出力された一連の文字領域候補群に対して予測辞書を検索するための検索文字列を生成する範囲を決定する検索対象範囲決定工程と、検索対象範囲決定工程において決定された範囲の文字領域候補群と、それに対応して個別文字認識工程において出力された認識候補文字を組み合わせて検索文字列を生成する検索文字列生成工程と、検索文字列生成工程において生成された検索文字列をキー情報として予測辞書を検索する予測辞書検索工程と、予測辞書検索工程において検索された予測結果と文脈処理工程における文脈処理の結果を表示する結果表示工程と、結果表示工程において表示される予測結果の中から、ユーザにより選択指示された予測結果を反映させる予測候補選択工程とを備える文字列予測方法並びにそのような工程を具現化するコンピュータ実行可能なプログラムであることを特徴とする。
【0022】
かかる構成により、コンピュータ上へ当該プログラムをロードさせ実行することで、枠なし文字列認識において、文字切り出し部において出力された一連の文字領域候補群に対して予測辞書を検索するための検索文字列を生成する範囲をユーザの手書き文字パターン入力状況に応じて決定し、決定された範囲で生成される検索文字列により予測辞書を検索することによって、ある文字の一部を記入した時点でも適切な予測候補を出力することができる文字列予測装置を実現することが可能となる。
【0023】
【発明の実施の形態】
以下、本発明の実施の形態にかかる文字列予測装置について図面を参照しながら説明する。図1は、本発明の実施の形態にかかる文字列予測装置の構成図である。
【0024】
図1において、パターン入力部10からは、手書き文字パターンが入力される。入力方法としては、ペン型タブレット等に代表される画面入力媒体により直接入力されるものが考えられる。以下の説明では、図2に示すように、入力文字枠が存在しない手書き文字入力領域を用いる場合に、「予測」という手書き文字が入力された場合について説明する。
【0025】
入力された手書き文字パターンは、文字切り出し部20に送られる。文字切り出し部20では、入力された手書き文字パターンについて、一文字であると推定される文字領域候補に切り出し、接続可能な一連の文字領域候補群を一又は複数出力する。一文字領域候補の推定は、各ストロークのX軸方向の重心が一定範囲内のものを一文字領域として切り出す等の方法によって行われる。
【0026】
図3に、図2に示す手書き文字パターン列「予測」が入力された場合における文字切り出し部20での文字切り出し結果の一例を示す。図3において、四角で囲まれた領域が文字領域候補であり、矢印は文字領域候補間での接続が可能であることを示している。各文字領域候補の左上に表示されているアルファベットは、各文字領域候補のIDを示している。図3においては、接続可能な一連の文字領域候補群を文字領域候補ID列として示すと、cg、abdf、aef、及びahの4個が出力されている。
【0027】
次に、個別文字認識部30では、文字切り出し部20で切り出された文字領域候補の各手書き文字パターンに対して、個別文字認識用辞書40と照合することによって、認識候補文字と、各々の文字についての認識評価値を出力する。認識候補文字の抽出には、一般的に用いられるOCR認識エンジンやオンライン認識エンジン等、どのような認識エンジンを用いても良い。認識評価値の算定においても、各手書き文字パターンと個別文字認識用辞書40に記憶されている標準パターンとの間で距離計算を行ったり、特徴点に基づいて算出する等、種々の方法が考えられる。
【0028】
図4に、図3に示した文字切り出し結果に対する個別文字認識結果の一例を示す。図4において、各認識候補文字の横に表示されている数字が、それぞれの認識候補文字に関する認識評価値を示している。認識評価値の値が大きいほど、認識文字である可能性が高いことを示している。また、認識候補文字群の左上に表示されているアルファベットは、各文字領域候補IDを示している。
【0029】
文字切り出し部20での文字切り出し結果、及び個別文字認識部30での個別文字認識結果は、文脈処理部50に送られる。文脈処理部50においては、文脈辞書60を参照して文脈処理を行う。
【0030】
文脈処理としては、一連の文字領域候補群と各文字領域候補群に対応して個別文字認識部30において出力された一又は複数の認識候補文字の中から、文脈辞書60を参照して最適な文字列を選択する処理を行う。文脈辞書60として、単語を格納した単語辞書を用いることで、単語辞書との照合により最適な文字列を選択する方法でも良いし、2文字間あるいは3文字間のつながりやすさの統計情報を格納した辞書を文脈辞書として用いることで、文字間のつながりやすさを評価した結果により最適な文字列を選択する方法でも良い。文脈処理の結果は、結果表示部110において、入力した手書き文字パターンを認識した結果として表示される。
【0031】
文字切り出し部20での文字切り出し結果、及び個別文字認識部30での個別文字認識結果は、文脈処理部50に送られると同時に、検索対象範囲決定部70にも送られる。検索対象範囲決定部70では、文字切り出し部20から出力された一連の文字領域候補群に対して予測辞書100を検索するための検索文字列を生成する範囲を決定する。検索対象範囲決定部70における処理の詳細については後述する。
【0032】
検索文字列生成部80では、検索対象範囲決定部70で決定された範囲の文字領域候補群の認識候補文字を組み合わせて検索文字列を生成する。ここでは、検索対象範囲決定部70において、検索対象範囲として、文字切り出し部20において出力された一連の文字領域候補群をそのまま用いると決定されているものとする。
【0033】
この場合、図4における文字切り出し結果に対する個別文字認識結果に基づいて生成される検索文字列の一例を図5に示す。図5には、それぞれ接続可能な一連の文字領域候補群ごとの検索文字列を示している。すなわち、図5(a)は、接続可能な一連の文字領域候補群のうち、文字領域候補ID列cgに対応する検索文字列の一例を示している。以下、図5(b)、図5(c)、図5(d)についても、それぞれ文字領域候補ID列abdf、aef、ahに対応する検索文字列の一例を示している。
【0034】
なお、検索文字列生成の際には、認識候補文字の組み合わせからなる文字列すべてを検索文字列として生成しても良いし、個別文字評価値が一定以上の認識候補文字の組み合わせからなる文字列を検索文字列として生成しても良い。その他、文字切り出しの尤度等がある条件を満たす場合の文字列を検索文字列として生成する等、文字切り出しの尤もらしさや個別文字認識の尤もらしさに基づいて検索文字列を生成することも考えられる。
【0035】
そして、予測辞書検索部90では、予測辞書100から順次文字列を読み出して、検索文字列生成部80で生成された検索文字列との照合を行う。予測候補として出力する予測辞書100の検索においては、検索文字列と予測辞書100から読み出した文字列を前方一致照合する方法でも良いし、検索文字列と予測辞書100から読み出した文字列と完全一致照合する方法でも良い。完全一致照合する方法の場合は、予測辞書100には、文字列とそれに後続する文字列を一対のデータとして記憶しておき、完全一致した文字列に後続する文字列を検索することができる。
【0036】
図6に、予測辞書100に記憶されている文字列の例示図を示す。図6に示すように、いくつかの単語が予測辞書100に格納されており、予測辞書検索部90は、検索文字列生成部80で生成された検索文字列がこれらの単語と前方一致照合したものを予測候補として検索する。図4に示す文字切り出し結果及び個別文字認識結果に対して検索された予測候補の一例を図7に示す。図7において、「する」及び「結果」のように記号‘「’と‘」’で囲まれている部分は、手書き文字パターンとして入力されていない予測部分であることを示している。
【0037】
なお、複数の予測候補が検索された場合の表示順序は、特に限定されているものではなく、頻度が高い順、より最近使用された順、個別文字の認識評価値が高い順、これらの条件の組み合わせ等により決定することができる。
【0038】
次に、結果表示部110では、文脈処理部50において処理された認識結果文字列と、予測辞書検索部90において検索された予測候補を表示する。図8に、認識結果文字列と予測候補を画面上に表示した画面構成の一例を示す。
【0039】
図8に示すように、手書き文字パターンを入力していくと、文脈処理部50において処理された認識結果文字列が、画面上方の下線部において表示され、同時に予測辞書検索部90において検索された予測候補が複数、画面下方に表示される。
【0040】
そして、結果表示部110に表示された複数の予測候補の中から、ユーザが出力したい文字列、この例では「予測する」を選択すると、予測候補選択部120は、予測候補を選択した場合の処理を行う。例えば、選択された予測候補を現在の入力位置である下線部で示された位置に文字列として入力する。図9は、図8で示された予測候補から「予測する」が選択された場合の表示例を示している。
【0041】
次に、検索対象範囲決定部70の機能について説明する。ここでは、図10に示すような手書き文字パターンが入力された場合を想定して説明する。図10に示す手書き文字パターンは、ユーザが「予測」という文字列を入力することを意図して、二文字目の「測」の一部分を書いた状態を示している。
【0042】
図10の状態に対して、文字切り出し部20における文字切り出し結果、及び個別文字認識部30における個別文字認識結果の一例を図11に示す。図4と同様に、各認識候補文字の横に表示されている数字が、それぞれの認識候補文字に関する認識評価値を示している。また、認識候補文字群の左上に表示されているアルファベットは、各文字領域候補IDを示している。そして、図11に示す文字切り出し結果及び個別文字認識結果に対して検索文字列を生成すると、図12に示すような検索文字列が生成される。
【0043】
図12においても、図5と同様、それぞれ接続可能な一連の文字領域候補群ごとの検索文字列を示している。すなわち、図12(a)は、接続可能な一連の文字領域候補群のうち、文字領域候補ID列cdに対応する検索文字列の一例を示している。以下、図12(b)、図12(c)についても、それぞれ文字領域候補ID列abd、aeに対応する検索文字列の一例を示している。
【0044】
図12に示すような検索文字列に基づいて予測辞書100を検索しても、予測辞書100に登録されている「予測する」や「予測結果」の単語を検索することはできない。このように、ある文字の一部を記入した時点では、入力された手書き文字パターンに対する文字切り出し結果及び個別文字認識結果に基づいて検索文字列を生成しても、適切な予測候補を出力することはできない。
【0045】
そこで、検索対象範囲決定部70においては、適切な予測候補を出力することができるように文字切り出し部20から出力された一連の文字領域候補群から検索文字列を生成する範囲を決定する。本実施の形態においては、検索文字列を生成する範囲として、一連の文字領域候補群における末尾に位置する文字領域候補を除いた範囲としている。
【0046】
これは、ある文字の記入が完了していない時点では、最後に入力された筆跡(ストロークデータ)を含む文字領域候補の文字を、記入が完了していない文字とみなすことができるからである。図11に示すような文字切り出し結果及び個別文字認識結果に対しては、文字領域候補IDがc、d、及びeである領域が最後に入力された筆跡を含んでおり、かかる範囲を除外することによって不適切な検索文字列を生成することを防ぐことができる。
【0047】
図11の例では、末尾に位置する文字領域候補を除いた文字領域候補群を文字領域候補IDで表すと、それぞれc、ab、aとなる。したがって、末尾に位置する文字領域候補を除いた範囲に対して生成される検索文字列は、3つの文字領域候補IDに対応して、それぞれ図13(a)、図13(b)、図13(c)のようになる。
【0048】
図13に示すような検索文字列に基づいて予測辞書100を検索すると、図13(c)に示す検索文字列「予」をキー情報として、予測辞書100に登録されている「予測する」や「予測結果」の単語を検索することができるようになる。
【0049】
また、上述した検索対象範囲の決定方法では、文字切り出し部20において出力された文字領域候補群の領域数が1の場合には用いることができないことから、例えば文字切り出し部20において出力された文字領域候補群の領域数が1である場合には文字領域候補そのままを検索対象範囲とし、一連の文字領域候補群の領域数が2以上の複数である場合には、一連の文字領域候補群における末尾に位置する文字領域候補を除いたものを検索対象範囲として決定することがより望ましい。
【0050】
例えば、図14に示す手書き文字パターンが入力された場合を考える。図14における手書き文字パターンは、ユーザが「予」という文字の記入が完了した時点における手書き文字パターンを示している。
【0051】
図14に示す手書き文字パターンに対する文字切り出し結果及び個別文字認識結果の一例を示したものが図15である。検索文字列を生成する範囲として、一連の文字領域候補群における末尾に位置する文字領域候補を除いたものとすると、図15における文字切り出し結果及び個別文字認識結果に対して検索文字列が生成されることはない。したがって、予測候補として何も出力することができない。
【0052】
そこで、検索対象範囲として、文字切り出し部20において出力された文字領域候補群の領域数が1である場合には、文字領域候補そのままを検索対象範囲とし、一連の文字領域候補群の領域数が2以上の複数である場合には、一連の文字領域候補群における末尾に位置する文字領域候補を除いたものを検索対象範囲とする。このようにすることで、図15に示す文字切り出し結果及び個別文字認識結果に対して生成される検索文字列は、「予」と「テ」になり、検索結果として予測辞書100に登録されている「予測する」と「予測結果」が出力されるようになる。
【0053】
その他に、検索対象範囲決定部70では、検索対象範囲として、ユーザが手書き文字パターンの入力を終了した時点からの経過時間が、あらかじめ設定された時間に達した場合に、文字切り出し部20が出力した一連の文字領域候補群そのままを検索対象範囲として決定することも考えられる。
【0054】
例えば、図2に示す手書き文字パターン列「予測」を入力し、予測候補が提示されることを期待して次の手書き文字パターンを入力するのを待っている場合を考える。検索文字列を生成する範囲としては、文字切り出し部20において出力された文字領域候補群の領域数が1である場合には、文字領域候補群そのままを検索対象範囲とし、一連の文字領域候補群の領域数が2以上の複数である場合には、一連の文字領域候補群における末尾に位置する文字領域候補を除いたものを検索対象範囲としている。
【0055】
図3における文字切り出し結果及び個別文字認識結果は、文字領域候補群の領域数が2以上であることから、末尾に位置する文字領域候補を除いたものが検索対象範囲となる。すなわち、図3の例においては、末尾に位置する文字領域候補を除いた文字領域候補群は、文字領域候補IDで表すと、それぞれc、abd、ae、aとなる。したがって、末尾に位置する文字領域候補を除いた範囲に対して生成される検索文字列は図16に示すようになる。図16(a)は、接続可能な一連の文字領域候補群のうち、文字領域候補ID列cに対応する検索文字列の一例を示している。以下、図16(b)、図16(c)、図16(d)についても、それぞれ文字領域候補ID列abd、ae、aに対応する検索文字列の一例を示している。
【0056】
図16に示すような検索文字列に基づいて予測辞書100を検索すると、予測辞書100に登録されている「予測する」や「予測結果」の他に、「予定表」のような単語も検索されることになる。このように、ユーザが入力した手書き文字パターン「測」に対して、個別文字認識結果は「測」の候補文字に高い認識評価値を出力し、「定」は候補文字として出力されていないにもかかわらず、予測結果として「予定表」が出力されることにより、不要な予測候補がユーザに提示されてしまうことになる。
【0057】
そこで、ユーザが手書き文字パターンの入力を終了した時点からの経過時間があらかじめ設定された時間に達している場合には、文字切り出し部20が出力した一連の文字領域候補群そのままを検索対象範囲とする。このようにすることで、図3における文字切り出し結果及び個別文字認識結果に対して生成される検索文字列は図5に示すのと同様になり、予測辞書100を検索することによって、「予測する」と「予測結果」は検索されるが、「予定表」は検索されないよう制御することができる。
【0058】
また、以前に行われた手書き文字パターン認識に関する情報を保存しておき、それを活用することによって演算処理負荷を軽減することも考えられる。図17は、図1に示す構成に、予測呼び出し判定部71と、検索対象情報更新部72と、検索対象情報保存73を加えた構成となっている。なお本実施の形態においては、検索対象情報とは、文字切り出し部20から出力された文字領域候補群及びその検索対象範囲を意味している。
【0059】
図17において、予測呼び出し判定部71は、文字切り出し部20から出力された文字領域候補群及びその検索対象範囲を、検索対象情報保存73の保存されている文字切り出し部20から前回出力された文字領域候補群及び前回の検索対象範囲と比較する。
【0060】
すなわち、2つの検索対象情報が同じである場合には、予測呼び出し判定部71は、検索文字列生成部80における検索文字列の生成処理以降の処理を呼び出さず、異なる場合にのみ呼び出すことになる。
【0061】
検索対象情報更新部72は、文字切り出し部20から出力された最新の文字領域候補群と検索対象範囲決定部70で決定された検索対象範囲を検索対象情報保存部73に格納する。
【0062】
本実施の形態にかかる文字列予測装置は、手書き文字パターンの筆記途中であっても適切な予測候補を提示することによって、任意のタイミングでユーザが予測候補を選択できる点に特徴を有する。したがって、手書き文字パターンの筆記途中においても予測辞書100の検索処理を呼び出す必要がある。
【0063】
しかし、ユーザが一画入力を追加するごとに予測辞書100の検索処理を呼び出すことになると、PDA等の小型の機器では計算機資源に物理的な限界があることから、処理負荷が過大になってしまうという問題が生じる。
【0064】
一方、手書き文字パターンの筆記途中においても適切な予測候補が提示されるように、検索対象範囲を限定する方法が用いられているので、文字切り出し部20から出力される文字領域候補群の検索対象範囲が変わらない間は、予測辞書100に対する検索結果は変わらない。
【0065】
したがって、検索対象情報保存部73に保存されている前回の検索対象情報との比較を行い、この内容が変わらない間は予測辞書100に対する検索処理を行わないようにすることで、手書き文字パターンの筆記途中であっても適切な予測候補を提示するための処理負荷を軽減することが可能となる。
【0066】
例えば、図18及び図20に示す手書き文字パターンが入力された場合を考える。図18及び図20に示す手書き文字パターンに対する文字切り出し結果及び個別文字認識結果の一例を示したものが、それぞれ図19及び図21である。
【0067】
検索文字列を生成する範囲として、一連の文字領域候補群における末尾に位置する文字領域候補を除いた範囲を採用した場合、図19及び図21の例では、ともに末尾に位置する文字領域候補を除いた文字領域候補群のIDはaとなる。したがって、末尾に位置する文字領域候補を除いた範囲に対して生成される検索文字列は、ともに図22に示すようになる。
【0068】
つまり、図18に示す手書き文字パターンが入力された時点と、図20に示す手書き文字パターンが入力された時点では、予測辞書100の検索結果は変わらない。したがって、文字領域候補群と検索対象範囲が変わらない間は、予測辞書100の検索処理を行わないことによって、処理負荷を軽減することが可能となる。
【0069】
次に、本発明の実施の形態にかかる文字列予測装置を実現するプログラムの処理の流れについて説明する。図23は、本発明の実施の形態にかかる文字列予測装置を実現するプログラムの処理の流れ図である。
【0070】
図23において、ユーザによって手書き文字パターンが入力されると(ステップS2301)、入力された手書き文字パターンについて文字切り出し処理を行う(ステップS2302)。
【0071】
切り出された各文字領域候補に対する手書き文字パターンについて個別文字認識処理を行う(ステップS2303)。これまでに入力された手書き文字パターン列に対する文字切り出し結果及び個別文字認識結果に基づいて、文脈処理を行う(ステップS2304)。文脈処理の結果を結果表示部に表示する(ステップS2305)。
【0072】
文字切り出し結果に対する検索対象範囲を決定する(ステップS2306)。検索対象範囲に対しての認識候補文字を組み合わせた検索文字列を生成する(ステップS2307)。ステップS2307で生成された検索文字列により予測辞書の検索を行う(ステップS2308)。予測辞書の検索結果を結果表示部に表示する(ステップS2309)。
【0073】
引き続き、新規の手書き文字パターンの入力があるか否か確認し(ステップS2310)、新規の手書き文字パターンの入力がある場合には(ステップS2310:Yes)、ステップS2302から同様の処理を繰り返し実行する。新規の手書き文字パターンの入力がない場合には(ステップS2310:No)、処理を終了する。
【0074】
以上のように本実施の形態によれば、枠なし文字列認識において、入力された手書き文字パターンに対する一連の文字領域候補群に対して予測辞書を検索するための検索文字列を生成する範囲を、ユーザの手書き文字パターン入力状況に応じて決定し、決定された範囲で生成される検索文字列により予測辞書を検索することによって、手書き文字パターンの一部を記入した時点であっても適切な予測候補を出力することが可能となる。
【0075】
なお、本発明の実施の形態にかかる文字列予測装置を実現するプログラムは、図24に示すように、CD−ROM242−2やフレキシブルディスク242−2等の可搬型記録媒体242だけでなく、通信回線の先に備えられた他の記憶装置241や、コンピュータ243のハードディスクやRAM等の記録媒体244のいずれに記憶されるものであっても良く、プログラム実行時には、プログラムはローディングされ、主メモリ上で実行される。
【0076】
また、本発明の実施の形態にかかる文字列予測装置により生成された個別文字認識用辞書、文脈辞書、予測辞書等についても、図24に示すように、CD−ROM242−1やフレキシブルディスク242−2等の可搬型記録媒体242だけでなく、通信回線の先に備えられた他の記憶装置241や、コンピュータ243のハードディスクやRAM等の記録媒体244のいずれに記憶されるものであっても良く、例えば本発明にかかる文字列予測装置を利用する際にコンピュータ243により読み取られる。
【0077】
【発明の効果】
以上のように本発明にかかる文字列予測装置によれば、枠なし文字列認識において、文字切り出し部において出力された一連の文字領域候補群に対して予測辞書を検索するための検索文字列を生成する範囲をユーザの手書きパターン入力状況に応じて決定し、決定された範囲で生成される検索文字列により予測辞書を検索することによって、ある文字の一部を記入した時点でも適切な予測候補を出力することが可能となる。
【図面の簡単な説明】
【図1】 本発明の実施の形態にかかる文字列予測装置の構成図
【図2】 本発明の実施の形態にかかる文字列予測装置において入力される手書き文字パターンの例示図
【図3】 本発明の実施の形態にかかる文字列予測装置における文字切り出し結果の例示図
【図4】 本発明の実施の形態にかかる文字列予測装置における文字切り出し結果に対する個別文字認識結果の例示図
【図5】 本発明の実施の形態にかかる文字列予測装置における生成された検索文字列の例示図
【図6】 本発明の実施の形態にかかる文字列予測装置における予測辞書の例示図
【図7】 本発明の実施の形態にかかる文字列予測装置における検索された予測候補の例示図
【図8】 本発明の実施の形態にかかる文字列予測装置における結果表示画面の例示図
【図9】 本発明の実施の形態にかかる文字列予測装置における予測候補選択後の画面表示の例示図
【図10】 本発明の実施の形態にかかる文字列予測装置において入力される他の手書き文字パターンの例示図
【図11】 本発明の実施の形態にかかる文字列予測装置における文字切り出し結果に対する個別文字認識結果の例示図
【図12】 本発明の実施の形態にかかる文字列予測装置における生成された検索文字列の例示図
【図13】 本発明の実施の形態にかかる文字列予測装置における生成された検索文字列の例示図
【図14】 本発明の実施の形態にかかる文字列予測装置において入力される他の手書き文字パターンの例示図
【図15】 本発明の実施の形態にかかる文字列予測装置における文字切り出し結果に対する個別文字認識結果の例示図
【図16】 本発明の実施の形態にかかる文字列予測装置における生成された検索文字列の例示図
【図17】 本発明の実施の形態にかかる文字列予測装置の他の構成図
【図18】 本発明の実施の形態にかかる文字列予測装置において入力される他の手書き文字パターンの例示図
【図19】 本発明の実施の形態にかかる文字列予測装置における文字切り出し結果に対する個別文字認識結果の例示図
【図20】 本発明の実施の形態にかかる文字列予測装置において入力される他の手書き文字パターンの例示図
【図21】 本発明の実施の形態にかかる文字列予測装置における文字切り出し結果に対する個別文字認識結果の例示図
【図22】 本発明の実施の形態にかかる文字列予測装置における生成された検索文字列の例示図
【図23】 本発明の実施の形態にかかる文字列予測装置における処理の流れ図
【図24】 コンピュータ環境の例示図
【符号の説明】
10 パターン入力部
20 文字切り出し部
30 個別文字認識部
40 個別文字認識用辞書
50 文脈処理部
60 文脈辞書
70 検索対象範囲決定部
71 予測呼び出し判定部
72 検索対象情報更新部
73 検索対象情報保存部
80 検索文字生成部
90 予測辞書検索部
100 予測辞書
110 結果表示部
120 予測候補選択部
241 回線先の記憶装置
242 CD−ROMやフレキシブルディスク等の可搬型記録媒体
242−1 CD−ROM
242−2 フレキシブルディスク
243 コンピュータ
244 コンピュータ上のRAM/ハードディスク等の記録媒体

Claims (9)

  1. 文字列認識の対象となる手書き文字パターンを入力するパターン入力部と、
    入力された前記手書き文字パターンについて、一つの文字であると推定される文字領域候補を切り出し、接続可能な一連の文字領域候補群を一又は複数個出力する文字切り出し部と、
    前記文字切り出し部において出力されたすべての前記文字領域候補に含まれる前記手書き文字パターンに対して個別文字認識用辞書を用いて文字認識をそれぞれ行い、認識評価値を算出して、前記認識評価値と対応付けた認識候補文字を一又は複数出力する個別文字認識部と
    前記文字切り出し部において出力された一連の前記文字領域候補群に対して予測辞書を検索するための検索文字列を生成する範囲を決定する検索対象範囲決定部と、
    前記検索対象範囲決定部で決定された範囲の前記文字領域候補群と、それに対応して前記個別文字認識部から出力された前記認識候補文字を組み合わせて検索文字列を生成する検索文字列生成部と、
    前記検索文字列生成部により生成された前記検索文字列をキー情報として前記予測辞書を検索する予測辞書検索部と、
    前記予測辞書検索部において検索された予測結果を表示する結果表示部と、
    前記結果表示部に表示されている前記予測結果の中から、ユーザにより選択指示された前記予測結果を結果表示部に反映させる予測候補選択部とを備え
    前記検索対象範囲決定部において、
    前記文字切り出し部において出力された前記文字領域候補群の領域数が1である場合は前記文字領域候補を検索対象範囲とし、一連の前記文字領域候補群の領域数が複数である場合は一連の前記文字領域候補群における末尾に位置する前記文字領域候補を除いた範囲を検索対象範囲として決定することを特徴とする文字列予測装置。
  2. 前記検索対象範囲決定部において、
    前記文字切り出し部において出力された一連の前記文字領域候補群における末尾に位置する前記文字領域候補を除いた範囲を検索対象範囲として決定する請求項1に記載の文字列予測装置。
  3. 前記検索対象範囲決定部において、
    ユーザが前記手書き文字パターンを入力し終わった時点からの経過時間があらかじめ設定された時間に達した場合には、前記文字切り出し部が出力した一連の前記文字領域候補群全体を検索対象範囲として決定する請求項1又は2に記載の文字列予測装置。
  4. 前記文字切り出し部において切り出された一又は複数の前記文字領域候補群と、前記各文字領域候補群に対応して前記個別文字認識部から出力された一又は複数の前記認識候補文字に基づいて、文脈辞書を用いて最適な文字列を選択する文脈処理部をさらに備え、
    結果表示部は、前記予測辞書検索部において検索された予測結果と前記文脈処理部による文脈処理の結果を表示する、請求項1〜3のいずれか1項に記載の文字列予測装置。
  5. 前記文字切り出し部から前回出力された前記文字領域候補群と前記検索対象範囲決定部により前回決定された検索対象範囲とを検索対象情報として保存しておく検索対象情報保存部と、
    前記文字切り出し部から出力された前記文字領域候補群と前記検索対象範囲決定部により決定された前記検索対象範囲と、前記検索対象情報との比較結果に応じて前記検索文字列の生成を行うか否かの判定を行う予測呼び出し判定部と、
    前記検索対象情報として、前記文字切り出し部により出力された最新の前記文字領域候補群と前記検索対象範囲決定部により決定された最新の前記検索対象範囲を格納する検索対象情報更新部をさらに含む請求項1に記載の文字列予測装置。
  6. 文字列認識の対象となる手書き文字パターンを入力するパターン入力工程と、
    入力された前記手書き文字パターンについて、一つの文字であると推定される文字領域候補を切り出し、接続可能な一連の文字領域候補群を一又は複数個出力する文字切り出し工程と、
    前記文字切り出し工程において出力されたすべての前記文字領域候補に含まれる前記手書き文字パターンに対して個別文字認識用辞書を用いて文字認識をそれぞれ行い、認識評価値を算出して、前記認識評価値と対応付けた認識候補文字を一又は複数出力する個別文字認識工程と
    前記文字切り出し工程において出力された一連の前記文字領域候補群に対して予測辞書を検索するための検索文字列を生成する範囲を決定する検索対象範囲決定工程と、
    前記検索対象範囲決定工程において決定された範囲の前記文字領域候補群と、それに対応して前記個別文字認識工程において出力された前記認識候補文字を組み合わせて検索文字列を生成する検索文字列生成工程と、
    前記検索文字列生成工程において生成された前記検索文字列をキー情報として前記予測辞書を検索する予測辞書検索工程と、
    前記予測辞書検索工程において検索された予測結果を表示する結果表示工程と、
    前記結果表示工程において表示される前記予測結果の中から、ユーザにより選択指示された前記予測結果を反映させる予測候補選択工程とを備え
    前記検索対象範囲決定工程において、
    前記文字切り出し工程において出力された前記文字領域候補群の領域数が1である場合は前記文字領域候補を検索対象範囲とし、一連の前記文字領域候補群の領域数が複数である場合は一連の前記文字領域候補群における末尾に位置する前記文字領域候補を除いた範囲を検索対象範囲として決定することを特徴とする文字列予測方法。
  7. 前記文字切り出し工程において切り出された一又は複数の前記文字領域候補群と、前記各文字領域候補群に対応して前記個別文字認識工程において出力された一又は複数の前記認識候補文字に基づいて、文脈辞書を用いて最適な文字列を選択する文脈処理工程をさらに備え、
    結果表示工程では、前記予測辞書検索工程において検索された予測結果と前記文脈処理工程における文脈処理の結果が表示される、請求項6に記載の文字列予測方法。
  8. 文字列認識の対象となる手書き文字パターンを入力するパターン入力ステップと、
    入力された前記手書き文字パターンについて、一つの文字であると推定される文字領域候補を切り出し、接続可能な一連の文字領域候補群を一又は複数個出力する文字切り出しステップと、
    前記文字切り出しステップにおいて出力されたすべての前記文字領域候補に含まれる前記手書き文字パターンに対して個別文字認識用辞書を用いて文字認識をそれぞれ行い、認識評価値を算出して、前記認識評価値と対応付けた認識候補文字を一又は複数出力する個別文字認識ステップと
    前記文字切り出しステップにおいて出力された一連の前記文字領域候補群に対して予測辞書を検索するための検索文字列を生成する範囲を決定する検索対象範囲決定ステップと、
    前記検索対象範囲決定ステップにおいて決定された範囲の前記文字領域候補群と、それに対応して前記個別文字認識ステップにおいて出力された前記認識候補文字を組み合わせて検索文字列を生成する検索文字列生成ステップと、
    前記検索文字列生成ステップにおいて生成された前記検索文字列をキー情報として前記予測辞書を検索する予測辞書検索ステップと、
    前記予測辞書検索ステップにおいて検索された予測結果を表示する結果表示ステップと、
    前記結果表示ステップにおいて表示される前記予測結果の中から、ユーザにより選択指示された前記予測結果を反映させる予測候補選択ステップとをコンピュータに実行させ、
    前記検索対象範囲決定ステップにおいて、
    前記文字切り出ステップにおいて出力された前記文字領域候補群の領域数が1である場合は前記文字領域候補を検索対象範囲とし、一連の前記文字領域候補群の領域数が複数である場合は一連の前記文字領域候補群における末尾に位置する前記文字領域候補を除いた範囲を検索対象範囲として決定することを特徴とする文字列予測方法を具現化するコンピュータ実行可能なプログラム。
  9. 前記文字切り出しステップにおいて切り出された一又は複数の前記文字領域候補群と、前記各文字領域候補群に対応して前記個別文字認識ステップにおいて出力された一又は複数の前記認識候補文字に基づいて、文脈辞書を用いて最適な文字列を選択する文脈処理ステップをさらにコンピュータに実行させ、
    結果表示ステップでは、前記予測辞書検索ステップにおいて検索された予測結果と前記文脈処理ステップにおける文脈処理の結果が表示される、請求項8に記載のコンピュータ実行可能なプログラム。
JP2003046387A 2003-02-24 2003-02-24 文字列予測装置及び方法 Expired - Fee Related JP4266667B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003046387A JP4266667B2 (ja) 2003-02-24 2003-02-24 文字列予測装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003046387A JP4266667B2 (ja) 2003-02-24 2003-02-24 文字列予測装置及び方法

Publications (2)

Publication Number Publication Date
JP2004258800A JP2004258800A (ja) 2004-09-16
JP4266667B2 true JP4266667B2 (ja) 2009-05-20

Family

ID=33112946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003046387A Expired - Fee Related JP4266667B2 (ja) 2003-02-24 2003-02-24 文字列予測装置及び方法

Country Status (1)

Country Link
JP (1) JP4266667B2 (ja)

Also Published As

Publication number Publication date
JP2004258800A (ja) 2004-09-16

Similar Documents

Publication Publication Date Title
US9449076B2 (en) Phrase generation using part(s) of a suggested phrase
KR101126406B1 (ko) 유사어 결정 방법 및 시스템
JPH08305730A (ja) 機械読み取り可能形式の文書からプロセッサに対してキーフレーズを選択する自動的方法
CN103970815B (zh) 语音输入和输出数据库搜索方法和设备
JPWO2008090606A1 (ja) 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法
KR101793578B1 (ko) 효율적으로 질의를 처리하는 방법 및 장치
JP2006251935A (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP4266667B2 (ja) 文字列予測装置及び方法
JP2007188410A (ja) 電子辞書装置、電子辞書検索方法、及び電子辞書プログラム
JP2003242446A (ja) 文字列予測装置及び方法並びに当該方法を具現化するコンピュータ実行可能なプログラム
JP6737117B2 (ja) 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置
CN115917527A (zh) 文档检索装置、文档检索系统、文档检索程序、以及文档检索方法
KR101452638B1 (ko) 유사 문자열 검색 방법 및 장치
JP4985096B2 (ja) 文書解析システム、および文書解析方法、並びにコンピュータ・プログラム
JP4247026B2 (ja) キーワード頻度算出方法及びそれを実行するプログラム
KR102479023B1 (ko) 외국어 학습 서비스 제공 장치, 방법 및 프로그램
JP2001243245A (ja) 類似文検索方法、装置、および類似文検索プログラムを記録した記録媒体
JP4075460B2 (ja) 画像データ検索方法およびデータ入力方法
JP5434402B2 (ja) 複合名詞抽出装置
JP2000331027A (ja) 類似文書検索装置と類似文書検索方法
JP2000057133A (ja) 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
JP2006163830A (ja) 文字認識装置、文字認識方法、および文字認識プログラム
JP2002183130A (ja) 漢字入力方式,方法,およびプログラム記録媒体
JP5768561B2 (ja) 入力支援プログラム、入力支援装置、及び入力支援方法
CN116679902A (zh) 音乐处理方法、计算设备及可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050510

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090203

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090217

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140227

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees