JP4698308B2 - 文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体 - Google Patents

文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体 Download PDF

Info

Publication number
JP4698308B2
JP4698308B2 JP2005197829A JP2005197829A JP4698308B2 JP 4698308 B2 JP4698308 B2 JP 4698308B2 JP 2005197829 A JP2005197829 A JP 2005197829A JP 2005197829 A JP2005197829 A JP 2005197829A JP 4698308 B2 JP4698308 B2 JP 4698308B2
Authority
JP
Japan
Prior art keywords
character
candidate
input
segment
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005197829A
Other languages
English (en)
Other versions
JP2007018178A (ja
Inventor
斉志 広瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2005197829A priority Critical patent/JP4698308B2/ja
Publication of JP2007018178A publication Critical patent/JP2007018178A/ja
Application granted granted Critical
Publication of JP4698308B2 publication Critical patent/JP4698308B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は文字を含む情報から変換処理によって所望の文字あるいは文字列を入力する文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体、特にOCRやオンライン手書き文字認識において、表示結果が間違っているとき、所望の文字あるいは文字列に修正するための文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体に関する。
スキャナ等から入力された画像の文字情報を認識するOCR(Optical Character Reader)、および表示部に文字入力枠がない表示一体型タブレットに手書き入力された文字情報を認識するオンライン手書き文字認識での誤認識の原因に、文字の切り出しの問題がある。
切り出し誤りは、文字の構造(例えば、漢字に偏や旁などの部首で構成されているものが多い)や形状(平仮名の「い」や「り」など)により、文字内の空間で文字を複数のパーツに分離した場合に各パーツが文字として成立することや、入力文字が近接している場合に文字内の空間が文字間の空間より大きくなるため複数のパーツに分離、他の文字列をあるいは他の文字のパーツと結合したりすることが原因と考えられる。
このような切り出し誤りを解消するために、文字間の空間を十分に空けることが考えられるが、印刷物を認識するOCRでは、文字間の空間は印刷物に依存するため、入力時に使用者が文字間の空間を変更することはできない。また、オンライン手書き文字認識では、入力時の筆記制限として十分な空間を空けて筆記することを使用者に要求することが考えられる。しかし、文字間の空間を意識して筆記することから通常の筆記より不自然な動作となり、使用者のストレスが大きく非常に使いづらいシステムとなってしまう。従来は、この問題に対して、例えば、以下の特許文献1(特開2001−14424号公報)で提案されているように、複数の切り出し候補を含む認識結果を表示することで、使用者に正解の候補を選択して修正できるようにしている。
また、文字内の空間で分離する可能性の高い文字列を入力すると、空間で分離されるパーツの組合わせにより、切り出し候補が増えるため、一度に表示する候補が多くなり、正解を探す手間が大きくなる。この問題に対して、例えば、以下の特許文献2(特開2001−273289号公報)で提案されているように、代表候補を選択すると関連する文字列を階層表示し、正解の候補を選択、修正できるようにしている。
特開2001−14424号公報 特開2001−273289号公報
しかしながら、切り出し誤りのパターンは、必ず空間毎に切り出されるのではなく、例えば、「あいう」という文字列の入力の切り出しパターンは、図28のように文字内の空間で分離したパーツが前後の文字と結合することもあるため、切り出し誤りのパターンは複雑になるだけでなく、切り出し候補の数も増大する。このような場合、特開2001−14424号公報では、切り出し候補に対応する文字列を表示しているが、使用者が表示された文字列から正解の文字列を探すが、多くの文字列は誤りの切り出しパターンに対応するため、多くの切り出し誤りのパターンが発生すると表示される候補文字列が多くなり、情報を使用者が正解の文字列を探す手間が大きくなる。さらに、それらの候補を表示できる大きな表示画面が必要となる。
小さな表示画面で多くの情報を表示するには特開2001−273289号公報で提案されているように階層表示することが考えられるが、OCRやオンライン手書き文字認識のように、切り出し誤りを含む結果を出力する場合は、特開2001−273289号公報のような文字コードのみの表示では、正解の切り出パターンと似た切り出し誤りパターンの候補文字列も使用者が確認する必要が生じ、結果的に正解の文字列を入力するまでに時間がかかる。
本発明はこのような問題に鑑みてなされたものであって、OCRやオンライン手書き文字認識において、表示結果が間違っているときに、簡単な操作で所望の文字あるいは文字列に修正することのできる文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体を提供することを目的とする。
そこで、本発明のある局面に従うと、上記課題を解決し、上記目的を達成するために、文字入力装置は、文字情報を入力する文字情報入力手段と、該入力された文字情報に関連する候補文字を候補選択画面に複数表示する候補文字表示手段とを備え、候補文字表示手段は、候補文字を抽出する処理の途中で生成されるセグメント情報にて各候補文字をグループ化して、各グループの代表候補を候補選択画面にリスト表示する。
なお、上記文字情報入力手段は、文字を含む静止画を入力するスキャナ、デジタルカメラ等の画像入力装置、または動画を入力するビデオカメラ等の画像入力装置である画像入力手段であって、文字入力装置は、入力された情報から文字セグメントを切り出す文字切り出し手段と、切り出された文字セグメントを認識する認識手段と、各文字セグメントの認識結果と文字セグメントのパターンとを記憶する認識結果記憶手段とを持ち、入力された文字の候補を表示する際には、候補抽出前のセグメントパターンを各セグメントパターンから導かれる各候補の代表パターンとして候補選択画面の代表候補とすることが好ましい。
または、上記文字情報入力手段は、ペン型の入力デバイスを備えた手書文字入力手段であって、文字入力装置は、入力された情報から文字セグメントを切り出す文字切り出し手段と、切り出された文字セグメントを認識する認識手段と、各文字セグメントの認識結果と文字セグメントのパターンを記憶する認識結果記憶手段とを持ち、入力された文字の候補を表示する際には、候補抽出前のセグメントパターンを各セグメントパターンからに導かれる各候補の代表パターンとして候補選択画面の代表候補とすることが好ましい。
または、上記文字情報入力手段は、キーコード入力手段であって、文字入力装置は、入力された文字情報から少なくとも1以上の文字の分かち情報を求め、分かち情報パターンを生成する分かち情報生成手段と、分かち情報生成手段で生成された少なくとも1以上の分かち情報パターンを記憶する分かち情報記憶手段とを持ち、入力された文字の候補を表示する際には、各分かち情報パターンを代表パターンとして代表候補選択画面の代表候補とすることが好ましい。
さらに、上記文字入力装置は、分かち情報を基に仮名漢字変換する仮名漢字変換手段と、各分かち情報の仮名漢字変換結果と分かち情報のパターンとを記憶する仮名漢字変換結果記憶手段とを持ち、入力された文字の候補を表示する際には、仮名漢字変換前の分かち情報のパターンを各分かち情報パターンから導かれる各候補の代表パターンとして代表候補選択画面の代表候補とすることがより好ましい。
なお、候補文字表示手段は、候補選択画面において代表候補から下位の候補をリスト表示する際には、候補文字を抽出する処理の途中で生成されるセグメント情報と候補文字および候補文字列とを混在させて表示することが好ましい。
さらに、上記文字情報入力手段は、無線あるいは有線による通信手段を含み、該通信手段において文字を含む情報を入力することが好ましい。
さらに、候補文字表示手段は、セグメント情報を表示する際に、各セグメント情報を異なった表示形態で表示することがより好ましい。
本発明の他の局面に従うと、文字入力プログラムは、文字入力装置における文字入力をコンピュータに実行させるプログラムであって、文字情報を入力する文字情報入力ステップと、入力された文字情報に関連する候補文字を候補選択画面に複数表示する候補文字表示ステップとを実行させ、候補文字表示ステップにおいては、候補文字を抽出する処理の途中で生成されるセグメント情報にて各候補文字をグループ化して、各グループの代表候補を候補選択画面にリスト表示する。
本発明のさらに他の局面に従うと、記録媒体はコンピュータ読取可能な記録媒体であって、上記文字入力プログラムを記録する。
以上の構成により、本発明にかかる文字入力装置は、セグメント情報にて候補文字および候補文字列をグループ化して、各グループの代表候補を候補選択画面にリスト表示するため、候補選択画面にリスト表示されたセグメント情報を確認して正解の候補文字あるいは候補文字列を選択・修正できるので、使用者が直観的に正解文字あるいは文字列を探す事ができるため、誤識結果の修正にかかる時間が少なくなり、文字の入力および修正での使用者の負担を軽減できる。また、候補表示に大きな画面を必要としない。
本発明の実施例を示し、動作説明を行う。なお、以下で説明する実施の形態は本発明を実施するための一例であって、本発明を実現する上で制限されるものではない。
図1は本発明の実施の形態における文字入力装置の構成の具体例を示す図である。図1を参照して、本実施の形態にかかる文字入力装置として、入力結果・修正後の表示および修正対象文字列の指示に表示一体型タブレット1が共用されており、文字切り出し部4は座標情報から文字を切り出し、文字認識部3に座標情報に基づいて文字認識を行う文字認識処理の機能を備えた文字入力枠を必要としない枠なしオンライン手書文字認識装置、および、画像入力にスキャナ等の画像入力装置6を備え、文字切り出し部4は画像情報から文字を切り出し、文字認識部3に画像情報に基づいた文字認識を行う文字認識処理の機能を備えたOCRについて説明を行う。
実際には、これらの装置は実質的にはコンピュータによって実現され、認識結果記憶部5はメモリ、ハードディスクなどの記憶装置によって実現され、制御部2、文字切り出し部4、文字認識部3はコンピュータの中央演算装置(CPU:Central Processing Unit)およびCPUにより実行されるソフトウェアにより実現される。このソフトウェアも、記憶装置に格納され、メモリに読み出されてCPUにより実行される。
オンライン手書文字認識装置、およびOCR等の文字入力から結果表示までの流れは、以下の各実施例の中で説明を行い、ここでは表示装置の結果表示の修正について図29を用いて説明を行う。
使用者は、筆記した文字列に対して、表示一体型タブレット1の表示装置に表示された認識結果が誤認識していることを確認すると、表示一体型タブレット1のペンを用いて、修正対象文字列を指示する。その時、表示一体型タブレット1は座標情報を検出した座標情報を制御部2に転送する。制御部2は転送された筆記情報を用いて、ペンで指示された位置の文字列の有無を判定する(S200)。
制御部2は、文字列が存在していると判定すると指示された文字列(修正対象文字列)を特定する(S201)。一方、文字列が存在していないと判定すると文字列修正処理を終了する(S210)。
制御部2は使用者からの認識候補の表示指示の有無を判定し(S202)、認識候補の表示指示があったと判定すると、認識結果記憶部5から修正対象文字列の文字セグメント情報と認識結果と座標情報とを読み込み、修正対象文字列のセグメントパターンを除く各セグメントパターンを代表候補としたグループ化を行う(S203)。さらに制御部2は、修正対象文字列の候補文字列と、認識候補の各グループの代表候補と、各グループの代表候補に対応した候補文字列の表示ボタンとを表示一体型タブレット1の所定の位置に候補選択画面としてリスト表示する(S204)。
次に、使用者は候補選択画面のリスト表示中から所望の認識候補の代表候補を表示一体型タブレット1のペンで指示する。制御部2は指示された位置から候補文字列が指示されたか否かを判定し、候補文字列が指示されたと判断すると(S205)、対応する候補文字列を修正対象文字列に変えて表示し、候補選択画面を消去して文字修正が終了する(S206、S207、S210)。一方、制御部2は、指示された位置から代表候補に対応する候補文字列表示ボタンを指示判断すると、対応する候補文字あるいは候補文字列を表示する(S208)。使用者が、表示された代表候補に対応する候補文字または候補文字列から所望の文字もしくは文字列を指示すると、制御部2は指示された位置から候補文字列を検出し(S209)、対応する候補文字列を修正対象文字に変えて表示し、候補選択画面を消去して文字修正が終了する(S206、S207、S210)。
[第1の実施の形態]
図2は文字入力枠がないオンライン手書文字認識装置で、使用者が「潮の」を表示一体型タブレット1に筆記し、「シ朝の」と誤認識(図2(1))した場合に使用者が修正を行う様子を示す図である。
枠なしオンライン手書文字認識装置における文字入力に対する文字認識、結果表示までの流れは以下の通りである。
使用者が表示一体型タブレット1に文字を筆記すると、表示一体型タブレット1は座標情報(xy座標、ペンon/off、時間等の情報)を検出し、制御部2に転送する。制御部2は、検出した座標情報を内部バッファに保持し、筆記が完結されたか否かを判定する。制御部2が完結していると判断すると、内部バッファに保持している座標情報を文字切り出し部4に転送する。文字切り出し部4は、転送された座標情報を内部バッファに蓄積し、文字セグメントの切り出しを行い、制御部2に文字セグメント情報(例えば、文字セグメントを構成するストローク番号の最小と最大の番号、外接矩形座標等)を転送し、文字切り出し完了を通知する。例えば、「潮の」を筆記すると図7のように4個の文字セグメントに切り出し、文字セグメントの情報(Q(1)〜Q(4))を制御部2に転送する。制御部2は、各文字セグメントの情報と内部バッファに保持している座標情報とを文字認識部3に転送し、文字認識の開始を指示する。文字認識部3は、各文字セグメントの情報および連続する文字セグメントの組合せによって求まる新たな文字セグメントを文字として認識し、各文字セグメントの情報と各文字セグメントの認識結果および座標情報とを認識結果記憶部5に転送し、同時に制御部2に認識が終わったことを知らせる。例えば、図7の文字セグメントに対して、文字認識部3が認識処理を行うと、図8から図10の認識結果が得られ、文字セグメント情報(図7)、認識結果(図8、図9、図10)、および座標情報(図11)を認識結果記憶部5に転送して、認識処理が完了する。制御部2は認識が終わったことを確認すると対応する筆記情報を消去し、代わりに認識結果の文字コードを表示一体型タブレット1の表示装置に表示する。そして認識処理を終了する。
以上が繰返されることによって文字の入力が行われる。
次に、認識結果の修正について説明する。使用者は、「潮の」の入力に対して、表示一体型タブレット1の表示装置に表示された認識結果(図2(1))が誤認識していることを確認し、認識結果を修正するために「シ朝」(図2(2))を指示すると、表示一体型タブレット1は検出した座標情報を制御部2に転送する。制御部2は、座標情報と、内部バッファに保持している表示装置に表示している文字列の各文字の位置情報とを比較し、「シ朝の」の1文字目から2文字目の「シ朝」が指示されていると判断する。一般的に、表示された文字列の表示位置は、表示を制御する処理部で検出可能な機能が備わっている。例えば、本実施例では、制御部2の内部バッファに表示装置に表示している文字列の各文字について表示位置を保持している。
制御部2は認識結果記憶部5に記憶されている認識結果バッファインデックス(図10)を基に候補順位1位の「シ朝の」(SP1)以外の認識候補「潮の」(SP2)、「シ卓月の」(SP3)の文字セグメント情報の組合わせをセグメントパターンとし、グループ化を行う。実際には、「シ朝の」の1文字目から2文字目を指示されているので、この範囲に対応する「潮」のセグメントパターン、「シ卓月」のセグメントパターンを各候補順位の代表パターンとしてグループ化する(図18)。制御部2は、「シ朝」の候補文字列を生成し、生成された候補文字列と各グループの代表候補としてのセグメントパターンと各代表候補に対応した候補文字列表示ボタンとを表示する(図2(4))。図2では、各グループの代表候補としてのセグメントパターンとして、文字セグメントの軌跡の縮小パターンを表示している。候補文字列に正解の「潮」がないので、使用者が「潮」の正しいセグメントパターンに対応する候補文字列表示ボタンを指示する(図2(5))と、表示一体型タブレット1は検出した座標情報を制御部2に転送し、制御部2は座標情報から「潮」に対応する候補文字列表示ボタンを指示されたと判断し、「潮」の候補文字を生成して表示一体型タブレット1の表示装置に表示する(図2(6))。使用者が、正解の文字「潮」を指示すると、制御部2は指示された位置から候補文字が指示されたと判断し、対応する候補文字「潮」を修正対象文字列「シ朝」に変えて表示し、候補選択画面を消去して文字修正が終了する。
この形態の他の実施例として、図3のような表示を行うことが考えられる。図3は、同様に文字入力枠が無いオンライン手書文字認識装置で、使用者が「潮の」を表示一体型タブレット1に筆記し、誤認識結果の修正を行う様子を示す図であるが、修正文字選択のために指示した範囲を1文字として修正する機能を持たせた例である。この場合、先に述べた形態からグループ化の処理のみ変更することで実現できる。この形態では、グループ化の処理は、ユーザが指示した1文字目から2文字目までの範囲が1文字の認識候補を抽出し、グループ化結果の1番目とし、これ以外の認識候補を2番目以降の順位(図19)とするように実現すればよい。
また、他の実施例として、図20のような表示を行うことが考えられる。図20は、同様に文字入力枠が無いオンライン手書文字認識装置で、使用者が「潮の」を表示一体型タブレット1に筆記し、誤認識結果の修正を行う様子を示す図であるが、候補選択画面のリスト表示がセグメントパターンのみ出力する場合の例である。この場合、グループ化の処理後、制御部2が候補選択画面のリスト表示を行う際の処理のみ変更することで実現できる。候補選択画面のリスト表示の際は、1番目の認識候補の候補文字列を生成せずに、2番目以降の認識候補の表示と同様にセグメントパターンを表示するように実現すればよい。
また、この形態の他の実施例として、無線あるいは有線による通信装置を備え、制御部2に通信装置を通じて座標情報を獲得できる機能を備えることで実現できる。この場合、座標情報の獲得手段のみ変更することで、先の実施例と同様な誤認識の修正が可能となる。
[第2の実施の形態]
図4はOCRで、使用者が「潮の」の誤認識「シ朝の」を修正するときの様子を表した図である。
OCRでの画像入力に対する文字認識、結果表示までの流れは以下の通りである。
使用者が、画像入力装置6、例えばスキャナで認識させたい原稿の画像を読み取らせると、画像入力装置6は読み取った画像情報を制御部2に転送する。制御部2は転送された画像情報を保持し、文字切り出し部4に画像情報を転送する。文字切り出し部4は転送された画像情報を内部バッファに蓄積し、例えば、図22に示すように行方向(X軸)に黒画素のヒストグラムを求め、閾値Hth以上の領域を行領域として行の切り出しを行う。次に切り出された行に対して、図23に示すようにY軸方向に黒画素のヒストグラムを求め、閾値PNth以上の領域を文字領域として切り出し、制御部2に切り出し情報(例えば、文字領域の最大、最小のXY座標)を転送し、文字切り出し完了を通知する。例えば、「潮の」に対しては、図12のように3個の文字セグメントに切り出し、文字セグメントの情報(Q(1)〜Q(3))を制御部2に転送する。制御部2は、各文字セグメントの情報と内部バッファに保持している画像情報とを文字認識部3に転送し、文字認識の開始を指示する。文字認識部3は、各文字セグメントの情報および連続する文字セグメントの組合せによって求まる新たな文字セグメントを文字として認識し、各文字セグメントの認識結果を認識結果記憶部5に転送し、同時に制御部2に認識が終わったことを知らせる。例えば、図12の文字セグメントに対して、文字認識部3が認識処理を行うと、図13から図15の認識結果が得られ、各文字セグメントの認識結果(図13、図14、図15)、および画像情報を認識結果記憶部5に転送して、認識処理が完了する。制御部2は認識が終わったことを確認すると認識結果の文字コードを表示一体型タブレット1の表示装置に表示する。そして認識処理を終了する。
次に、認識結果の修正について説明する。認識結果を修正するために「シ朝」(図4(2))を指示すると、表示一体型タブレット1は検出した座標情報を制御部2に転送する。制御部2は、座標情報と内部バッファに保持している表示装置に表示している文字列の各文字の位置情報とを比較し、「シ朝の」の1文字目から2文字目の「シ朝」が指示されていると判断する。一般的に、表示された文字列の表示位置は、表示を制御する処理部で検出可能な機能が備わっている。例えば、本実施例では、制御部2の内部バッファに表示装置に表示している文字列の各文字について表示位置を保持している。制御部2は認識結果記憶部5に記憶されている認識結果バッファインデックス(図15)を基に候補順位1位の「シ朝の」(SP1)以外の認識候補「潮の」(SP2)に対して、「シ朝の」の1文字目から2文字目に対応する「潮」の文字セグメント情報をセグメントパターンとし、それを代表パターンとしてグループ化する(図21)。制御部2は、「シ朝」の候補文字列を生成し、生成された候補文字列と「潮」の代表候補である文字セグメントと各代表候補に対応した候補文字列表示ボタンとを表示する(図4(4))。図4では、各グループの代表候補としてのセグメントパターンとして、文字セグメントの縮小パターンを表示している。候補文字列に正解の「潮」がないので、使用者が「潮」の正しいセグメントパターンに対応する候補文字列表示ボタンを指示する(図4(5))と、表示一体型タブレット1は検出した座標情報を制御部2に転送し、制御部2は座標情報から「潮」に対応する候補文字列表示ボタンを指示されたと判断し、「潮」の候補文字を生成して表示一体型タブレット1の表示装置に表示する(図4(6))。使用者が、正解の文字「潮」を指示すると、制御部2は指示された位置から候補文字が指示されたと判断し、対応する候補文字「潮」を修正対象文字列「シ朝」に変えて表示し、候補選択画面を消去して文字修正が終了する。
なお、図17は複数のグループ化した結果が得られた場合の修正の様子を表している。
前記実施例では、図12のように3個の文字セグメント(「潮」は2個)に切り出された場合を説明したが、スキャナで読み込ませる原稿の状態(印刷ムラ、多様なフォント毎の文字内の空白サイズの違い等)によっては、さらに文字セグメントの数が増加することがある。例えば、図12の画像の濃度が低いとき、その画像を文字切り出し部4で処理すると、「朝」(Cj+1)は画素のヒストグラムが低い箇所(閾値PNthに近い箇所のPN1、PN2、PN3)で文字セグメントとして切り出されることがある(図30)。このような場合も前記実施例と同様に表示することができる。
この形態の他の実施例は、スキャナ等の画像入力装置6の代わりに、無線あるいは有線による通信装置を備え、制御部2に通信装置を通じて画像情報を獲得できる機能を備えることで実現できる。この場合、画像情報の獲得手段のみ変更することで、先の実施例と同様な誤認識の修正が可能となる。
第1の実施の形態および第2の実施の形態では、文字セグメントとは入力文字列方向に対して直行する方向の空間で分離される単位あるいはその組合わせである。
[第3の実施の形態]
図27および図5は、使用者が「手書き文字入力」を入力するためキーコード入力手段により入力された仮名文字列「てがきもじにゅうりょく」を仮名漢字変換し、誤変換「手書も字入力」を修正するときの様子を表した図である。
使用者が、キーコード入力手段、例えばキーボードから「てがきもじにゅうりょく」(図24)を入力し、仮名漢字変換キーを押すと制御部2は分かち情報を求め、分かち情報毎に仮名漢字変換を行い、分かち情報と変換結果とを関連付けた分かち変換候補(図25)を求める。
ここで、分かちとは、所望条件の単位に分割された仮名文字列のことを表し、分かち情報とは、入力文字列に対する分かちの位置としている。例えば、図24の入力文字列に対する分かち「てがき」の分かち情報は0と2(0番目から2番目)となる。そして、分かち情報と変換結果とを関連付けた分かち変換候補(図25)を求める。例えば、図25に示す分かち変換候補WP1は、分かち情報(0、2)と変換結果(候補数(=5)、変換候補(手書/手書き.../テガキ))とで構成されている。
なお、上記説明では、分かち情報は入力文字列に対する分かちの始端および終端の位置としていたが、始端および文字数(「てがき」は、始端位置0および文字数3)、始端および次の分かちの始端(「てがき」は、始端位置0および次の分かちの始端位置3)としてもよい。
制御部2は分かち変換候補(図25)の組合せを基に分かち情報パターンである入力仮名文字列の仮名漢字変換候補(図26)を生成し、処理結果を認識結果記憶部5に転送し、認識結果記憶部5は転送された処理結果を記憶する。
使用者が、誤変換を修正するために「手書も字入力」を選択すると(図27)、表示一体型タブレット1は検出した座標情報を制御部2に転送する。制御部2は、座標情報と内部バッファに保持している表示装置に表示している文字列の各文字の位置情報とを比較し、「手書も字入力」が指示されていると判断する。制御部2は認識結果記憶部5に記憶されている認識結果バッファインデックス(図16)を基に候補順位1位の「手書も字認識」(SP1)以外の変換候補「手書き文字認識」(SP2)の分かち情報パターンをセグメントパターンとし、そのセグメントパターンを代表としたグループ化を行う。従って制御部2は、「てがき/も/じ/にゅうりょく」の候補文字列を生成し、生成された候補文字列と各グループの代表候補としてのセグメントパターンと各代表候補に対応した候補文字列表示ボタンとを表示する(図5(1))。候補文字列に正解の「手書き文字入力」がないので、使用者が「てがきもじにゅうりょく」の正しいセグメントパターン「てがき/もじ/にゅうりょく」に対応する候補文字列表示ボタンを指示すると、表示一体型タブレット1は検出した座標情報を制御部2に転送し、制御部2は座標情報から「てがき/もじ/にゅうりょく」に対応する候補文字列表示ボタンを指示されたと判断し、「てがき/もじ/にゅうりょく」の候補文字を生成して表示一体型タブレット1の表示装置に表示する(図5(2))。使用者が、正解文字列「手書き文字入力」を指示すると、制御部2は指示された位置から候補文字が指示されたと判断し、対応する候補文字「手書き文字入力」を修正対象文字列「手書も字入力」に変えて表示し、候補選択画面を消去して文字修正が終了する。
この形態の他の実施例として、図6のように候補選択画面のリスト表示がセグメントパターンのみの出力である場合が考えられる。この場合、グループ化の処理後、制御部2が候補選択画面のリスト表示を行う際の処理のみ変更することで実現できる。候補選択画面のリスト表示の際は、1番目の認識候補の候補文字列を生成せずに、2番目以降の認識候補の表示と同様にセグメントパターンを表示するように実現すればよい。
なお、本実施例でのセグメント情報の表示は、候補選択画面のリスト表示に限定されず、セグメント情報ごとに異なる表示形態での表示であってもよい。
本実施の形態では、修正対象文字の指定に表示一体型タブレット1とペンを用いたが、マウスやタッチパッド等のポインティングデバイスやキーボードなどの装置を使用しても良い。
また、第2の実施の形態においてスキャナ等の画像入力装置や通信装置を用いて獲得した画像情報を入力情報としていたが、FD(Flexible Disk)やHDD(Hard Disc Drive)などの磁気記録方式やCD−ROM(Compact Disc−Read Only Memory)/RW(Read Write)やDVD−ROM(Digital Video Disc‐Read Only Memory)/RWなどの光記録方式等の記録装置に記録された画像情報を入力情報としても良い。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明の各実施の形態に適用される文字入力装置の構成図である。 本発明の第1の実施の形態による図1の表示一体型タブレット上の認識結果修正に伴う表示の様子を説明する図である。 本発明の第1の実施の形態による他の実施の形態における図1の表示一体型タブレット上の認識結果修正に伴う表示の様子を説明する図である。 本発明の第2の実施の形態による図1の表示一体型タブレット上の認識結果修正に伴う表示の様子を説明する図である。 本発明の第3の実施の形態による図1の表示一体型タブレット上の認識結果修正において図27の修正対象文字列選択後の表示の様子を説明する図である。 本発明の第3の実施の形態による他の実施の形態における図1の表示一体型タブレット上の認識結果修正において図27の修正対象文字列選択後の表示の様子を説明する図である。 本発明の第1の実施の形態による座標情報を文字セグメントに切り出した結果を説明する図である。 本発明の第1の実施の形態での文字認識結果バッファの様子を説明する図である。 本発明の第1の実施の形態での認識結果バッファの様子を説明する図である。 本発明の第1の実施の形態での認識結果バッファインデックスの様子を説明する図である。 図1の表示一体型タブレット1から入力された筆記情報を説明する図である。 本発明の第2の実施の形態による画像情報を文字セグメントに切り出した結果を説明する図である。 本発明の第2の実施の形態での文字認識結果バッファの様子を説明する図である。 本発明の第2の実施の形態での認識結果バッファの様子を説明する図である。 本発明の第2の実施の形態での認識結果バッファインデックスの様子を説明する図である。 本発明の第3の実施の形態での仮名漢字変換結果バッファインデックスの様子を説明する図である。 本発明の第2の実施の形態による他の実施の形態における図1の表示一体型タブレット上の認識結果修正に伴う表示の様子を説明する図である。 本発明の第1の実施の形態での代表候補のグループ化結果を説明する図である。 本発明の第1の実施の形態による他の実施の形態における代表候補のグループ化結果を説明する図である。 本発明の第1の実施の形態による他の実施の形態における図1の表示一体型タブレット上の認識結果修正に伴う表示の様子を説明する図である。 本発明の第2の実施の形態での代表候補のグループ化結果を説明する図である。 本発明の第2の実施の形態での文字切り出し部における行領域の切り出しを説明する図である。 本発明の第2の実施の形態での文字切り出し部における文字領域の切り出しを説明する図である。 本発明の第3の実施の形態でのキー入力バッファの様子を説明する図である。 本発明の第3の実施の形態での分かち変換候補の様子を説明する図である。 本発明の第3の実施の形態での分かち候補の様子を説明する図である。 本発明の第3の実施の形態による図1の表示一体型タブレット上の認識結果修正に伴う表示の様子を説明する図である。 (a)〜(f)は図1装置において表示一体型タブレットを用いて「あいう」を入力した場合の入力パターンと切り出しパターン例を示す図である。 本発明の候補文字列修正の処理フローである。 本発明の第2の実施の形態での濃度レベルが低い入力画像の場合の文字切り出し部における文字領域の切り出しを説明する図である。
符号の説明
1. 表示一体型タブレット、
2. 制御部、
3. 文字認識部、
4. 文字切り出し部、
5. 認識結果記憶部、
6. 画像入力装置、
7. ネットワーク回線、
8. 通信装置。

Claims (7)

  1. 文字情報として、文字を含む画像である、静止画または動画の入力を受付ける文字情報入力手段と、
    入力された前記画像から文字セグメントを切り出す文字切り出し手段と、
    切り出された前記文字セグメントを認識する認識手段と、
    前記文字セグメントの認識結果を、当該文字セグメントが画像から切り出された位置と関連付けて記憶する認識結果記憶手段と、
    入力された前記文字情報に関連する候補文字を候補選択画面に複数表示する候補文字表示手段とを備え、
    前記候補文字表示手段は、
    前記画像からの文字セグメントの切り出し位置の異なる、文字セグメントの切り出し方ごとに、当該切り出し位置にて切り出された各文字セグメントの前記認識結果の組み合わせで得られる文字列群をグループ化する処理と、
    各グループごとに、当該グループの前記文字セグメントの切り出し方を表わした選択肢を前記候補選択画面にリスト表示する処理と、
    前記リスト表示の中から選択を受付けると、前記選択された選択肢で表わされた前記グループの前記文字列群のそれぞれを、前記入力された前記文字情報に関連する前記候補文字として前記候補選択画面に表示する処理とを実行する、文字入力装置。
  2. 前記文字情報入力手段は、ペン型の入力デバイスを備えた手書文字入力手段である、請求項1に記載の文字入力装置。
  3. 前記候補文字表示手段は、前記候補選択画面において、前記グループごとの当該グループの前記文字セグメントの切り出し方を表わした選択肢として、前記画像から当該切り出し方で切り出された前記文字セグメントの画像をリスト表示する、請求項1または2に記載の文字入力装置。
  4. 前記候補文字表示手段は、前記リスト表示の中から選択を受付けると、前記候補選択画面において、前記リスト表示された前記文字セグメントの画像と共に前記選択された選択肢で表わされた前記グループの前記文字列群のそれぞれを表示する、請求項に記載の文字入力装置。
  5. 前記文字情報入力手段は、無線あるいは有線による通信手段を含み、前記通信手段において文字を含む情報である前記文字情報を入力する、請求項1〜4のいずれかに記載の文字入力装置。
  6. 文字入力装置における文字入力をコンピュータに実行させるプログラムであって、
    文字情報として、文字を含む画像である、静止画または動画の入力を受付ける文字情報入力ステップと、
    入力された前記画像から文字セグメントを切り出して切り出された前記文字セグメントを認識するステップと、
    前記文字セグメントの認識結果を、当該文字セグメントが画像から切り出された位置と関連付けて記憶するステップと、
    入力された前記文字情報に関連する候補文字を候補選択画面に複数表示する候補文字表示ステップとを実行させ、
    前記候補文字表示ステップは
    前記画像からの文字セグメントの切り出し位置の異なる、文字セグメントの切り出し方ごとに、当該切り出し位置にて切り出された各文字セグメントの前記認識結果の組み合わせで得られる文字列群をグループ化するステップと、
    各グループごとに、当該グループの前記文字セグメントの切り出し方を表わした選択肢を前記候補選択画面にリスト表示するステップと、
    前記リスト表示の中から選択を受付けると、前記選択された選択肢で表わされた前記グループの前記文字列群のそれぞれを、前記入力された前記文字情報に関連する前記候補文字として前記候補選択画面に表示するステップとを含む、文字入力プログラム。
  7. 文字入力装置における文字入力をコンピュータに実行させるプログラムを記録する記録媒体であって、
    文字情報として、文字を含む画像である、静止画または動画の入力を受付ける文字情報入力ステップと、
    入力された前記画像から文字セグメントを切り出して切り出された前記文字セグメントを認識するステップと、
    前記文字セグメントの認識結果を、当該文字セグメントが画像から切り出された位置と関連付けて記憶するステップと、
    入力された前記文字情報に関連する候補文字を候補選択画面に複数表示する候補文字表示ステップとを実行させ、
    前記候補文字表示ステップは
    前記画像からの文字セグメントの切り出し位置の異なる、文字セグメントの切り出し方ごとに、当該切り出し位置にて切り出された各文字セグメントの前記認識結果の組み合わせで得られる文字列群をグループ化するステップと、
    各グループごとに、当該グループの前記文字セグメントの切り出し方を表わした選択肢を前記候補選択画面にリスト表示するステップと、
    前記リスト表示の中から選択を受付けると、前記選択された選択肢で表わされた前記グループの前記文字列群のそれぞれを、前記入力された前記文字情報に関連する前記候補文字として前記候補選択画面に表示するステップとを含む、コンピュータ読取可能な記録媒体。
JP2005197829A 2005-07-06 2005-07-06 文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体 Expired - Fee Related JP4698308B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005197829A JP4698308B2 (ja) 2005-07-06 2005-07-06 文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005197829A JP4698308B2 (ja) 2005-07-06 2005-07-06 文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体

Publications (2)

Publication Number Publication Date
JP2007018178A JP2007018178A (ja) 2007-01-25
JP4698308B2 true JP4698308B2 (ja) 2011-06-08

Family

ID=37755310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005197829A Expired - Fee Related JP4698308B2 (ja) 2005-07-06 2005-07-06 文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体

Country Status (1)

Country Link
JP (1) JP4698308B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5182902B2 (ja) * 2011-03-31 2013-04-17 京セラコミュニケーションシステム株式会社 文書イメージ出力装置
JP7090894B2 (ja) * 2018-07-26 2022-06-27 武蔵エンジニアリング株式会社 文字列表示装置および文字列表示方法
JP2022148901A (ja) * 2021-03-24 2022-10-06 カシオ計算機株式会社 文字認識装置、文字認識方法およびプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03226858A (ja) * 1990-01-31 1991-10-07 Ricoh Co Ltd かな漢字変換修正方式
JPH06337959A (ja) * 1993-05-27 1994-12-06 Canon Inc 文字認識装置
JPH07192080A (ja) * 1993-12-27 1995-07-28 Sharp Corp 手書文字認識装置
JPH07306917A (ja) * 1994-05-11 1995-11-21 Mitsubishi Electric Corp 文字認識装置
JP2001243422A (ja) * 2000-02-28 2001-09-07 Mitsubishi Electric Corp 文字認識装置及び文字認識方法
JP2003308480A (ja) * 2002-04-16 2003-10-31 Fujitsu Ltd オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03226858A (ja) * 1990-01-31 1991-10-07 Ricoh Co Ltd かな漢字変換修正方式
JPH06337959A (ja) * 1993-05-27 1994-12-06 Canon Inc 文字認識装置
JPH07192080A (ja) * 1993-12-27 1995-07-28 Sharp Corp 手書文字認識装置
JPH07306917A (ja) * 1994-05-11 1995-11-21 Mitsubishi Electric Corp 文字認識装置
JP2001243422A (ja) * 2000-02-28 2001-09-07 Mitsubishi Electric Corp 文字認識装置及び文字認識方法
JP2003308480A (ja) * 2002-04-16 2003-10-31 Fujitsu Ltd オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム

Also Published As

Publication number Publication date
JP2007018178A (ja) 2007-01-25

Similar Documents

Publication Publication Date Title
US7167165B2 (en) Temporary lines for writing
US7302099B2 (en) Stroke segmentation for template-based cursive handwriting recognition
CN1205528C (zh) 计算机系统中提供提示的方法
US8913832B2 (en) Method and device for interacting with a map
US8391609B2 (en) Method of massive parallel pattern matching against a progressively-exhaustive knowledge base of patterns
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
US20020064308A1 (en) System and methods for spacing, storing and recognizing electronic representations of handwriting printing and drawings
US20030099398A1 (en) Character recognition apparatus and character recognition method
TWI464678B (zh) 用於手寫輸入亞洲語言的方法及系統
JP4549400B2 (ja) 文書認識プログラム、文書認識装置、および文書認識方法
US20050175242A1 (en) Online handwritten character input device and method
US7406662B2 (en) Data input panel character conversion
US7370288B1 (en) Method and system for selecting objects on a display device
JP4698308B2 (ja) 文字入力装置、文字入力プログラム、および文字入力プログラムを記録する記録媒体
JP2740335B2 (ja) 自動セル属性判定機能を有する表読取装置
JP2005190199A (ja) 手書き文字入力表示装置及び手書き文字入力表示方法ならびにそのプログラム
US8643651B2 (en) Type-setting method for a text image file
JP4287250B2 (ja) ジェスチャー処理装置およびジェスチャー処理方法
JP4633773B2 (ja) 文書画像処理装置および方法
JP4589370B2 (ja) 文書画像処理装置および方法
JP2024021728A (ja) 文字認識モデルの学習方法、文字認識方法、文字認識モデル学習装置、学習モデル、文字認識装置
JP2986255B2 (ja) 文字認識装置
JPH11282965A (ja) 文字認識装置及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH06187486A (ja) 手書き文字入力装置
JPH07192081A (ja) 手書き文字入力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110125

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110301

LAPS Cancellation because of no payment of annual fees