JPH096894A - 文字認識装置及び方法 - Google Patents

文字認識装置及び方法

Info

Publication number
JPH096894A
JPH096894A JP7151494A JP15149495A JPH096894A JP H096894 A JPH096894 A JP H096894A JP 7151494 A JP7151494 A JP 7151494A JP 15149495 A JP15149495 A JP 15149495A JP H096894 A JPH096894 A JP H096894A
Authority
JP
Japan
Prior art keywords
character
recognition
input
image
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7151494A
Other languages
English (en)
Inventor
Hiroaki Ikeda
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7151494A priority Critical patent/JPH096894A/ja
Priority to DE69608035T priority patent/DE69608035T2/de
Priority to US08/666,680 priority patent/US6456739B1/en
Priority to EP96304527A priority patent/EP0750270B1/en
Publication of JPH096894A publication Critical patent/JPH096894A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 対応する認識結果が存在しない文字画像で
も、文字登録を極めて容易にする。 【構成】 スキャナ108から入力した文書画像はRA
M103に取り込まれ、CPU101が認識辞書を使用
して文字認識処理を行う。認識処理が完了すると、認識
結果のテキストを表示する。そして、操作者が所望とす
る文字をポインティングデバイス107で指定すると、
その文字の認識の元になった文字イメージが切り出し枠
と共に表示される。そして、操作者は、その切り出し枠
の位置或いは大きさを調整し、登録対象の文字を特定す
るための情報を入力し、登録指示を与える。この結果、
調整された切り出し枠内のイメージの特徴情報が抽出さ
れ、登録対象の文字を特定する情報に対応付けられて、
認識辞書に登録される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置及び方法、
詳しくは文字登録機能を有する文字認識装置及び方法に
関するものである。
【0002】
【従来の技術】文字認識装置は一般的に、文字画像の標
準的な特徴を格納した認識辞書を有する。そして、入力
した画像から文字部分を切り出す文字切り出し手段、切
り出した文字画像から特徴を抽出し、認識辞書の各文字
の標準特徴との類似度を演算し、最も類似度の大きい文
字を認識結果とする識別演算手段、認識を表示する認識
結果表示手段を具備している。
【0003】この様な文字認識装置の認識精度を向上す
るための方法として、文字登録が知られている。文字登
録とは、文字画像と文字コードを指定し、その文字画像
の特徴を認識辞書に登録し更新するものであり、一旦登
録してしまえば前回認識できなかった文字でも認識され
るようになる。
【0004】ところで、これまでの文字認識装置では、
文字登録を行う際には、認識結果の中から登録する文字
を選択することで、それに対応する文字画像が文字登録
の対象となるように構成されている。
【0005】一例を図8を用いて説明する。まず認識結
果を表示するテキストウインドウ上で、例えば認識を誤
った文字など、文字登録したい文字801を選択する
(図8(A)参照)。次にメニュー802等で文字登録
を開始すると、同図(B)の如く、選択された文字に対
応する文字画像803が表示され、その文字画像が何の
文字であるかを文字入力部804に指定する。内容に問
題がなければ登録確認ボタン805を押すことで、認識
辞書に文字が登録される。
【0006】以上の機能を有することにより、操作者に
とっては文字コードを知る必要ないので、簡単な操作で
もって文字登録できるという効果が得られる。
【0007】
【発明が解決しようとしている課題】しかしながら、上
記従来例では、文字画像に対応する認識結果が存在する
場合のみ文字登録が可能となるため、文字認識処理で文
字切り出しが失敗した場合や、認識処理範囲外の文字画
像を登録できない欠点があった。
【0008】
【課題を解決するための手段】及び
【作用】本発明はかかる問題点に鑑みなされたものであ
り、対応する認識結果が存在しない文字画像でも、文字
登録を極めて容易にする文字認識装置及び方法を提供し
ようとするものである。
【0009】この課題を達成するため、たとえば本発明
の文字認識装置は以下の構成を備える。すなわち、与え
られた文書画像中の文字を認識する文字認識装置であっ
て、認識結果の文字列を表示する認識結果表示手段と、
表示された認識結果の所望とする文字を指定する指定手
段と、該指定手段で指定された文字の認識元になった文
字イメージの近傍の領域と、文字認識したときの切り出
し枠を表示するイメージ表示手段と、前記切り出し枠の
大きさ/位置を調整する調整手段と、登録対象の文字を
特定する情報を入力する入力手段と、前記調整手段で調
整された切り出し枠内のイメージの特徴情報を抽出し
て、前記入力手段で入力された情報と対応付けて、文字
認識用辞書に登録する登録手段とを備える。
【0010】また、本発明の好適な実施態様に従えば、
前記調整手段は、所定のポインティングデバイスでもっ
て、切り出し枠の大きさや位置を調整することが望まし
い。これによって、簡単な操作でもって切り出し枠の大
きさ/位置を調整することが可能になる。
【0011】また、この場合には、切り出し枠を表示す
るときに、当該切り出し枠のサイズ変更或いは位置変更
のためのハンドルを備えることが望ましい。これによっ
て、位置と大きさという2つの異なる調整操作を視覚的
に確認して行うことが可能になる。
【0012】また、前記入力手段で入力する文字を特定
する情報の初期値は、前記指定手段で指定された文字を
特定する情報であることが望ましい。この結果、所望と
する文字を登録することが可能になる。
【0013】また、前記入力手段で入力する文字を特定
する情報は、文字コードを含むことが望ましい。これに
よって、認識結果の中に該当する文字がない場合であっ
ても、文字コードを知っていればそのコードを入力する
だけで、文字登録が行なえる。
【0014】
【実施例】以下、添付図面に従って本発明に係る実施例
を詳細に説明する。
【0015】図1に、実施例の文字認識装置のブロック
構成図を示す。図中、101はROM102に格納され
ている制御プログラムに従って本装置全体の制御を行う
CPU、102はCPU101が実行する後述する各フ
ローチャートに示す処理等の本装置の制御プログラム
や、認識辞書のデータなどを格納しているROM、10
3はCPU101のワークエリアや文書画像などを記憶
するRAMである、104は磁気ディスク等の外部記憶
装置、105はディスプレイ、106はキーボード、1
07はマウス等のポインティングデバイス、108は画
像を読み取るためのイメージスキャナである。尚、外部
記憶装置104には、メインとなる文字認識辞書とは分
離されたユーザが自由に登録或いは削除が行なえるユー
ザ認識辞書が格納されている。以下に説明する文字登録
は、このユーザ辞書に対する登録処理である。
【0016】上記構成の実施例の文字認識装置におい
て、文字認識結果を表示するまでの概略を図2のフロー
チャートを用いて説明する。
【0017】まず、ステップS201でイメージスキャ
ナ108を用いて文書画像を入力し、RAM103に格
納する。入力画像はステップS202でディスプレイ1
05に表示する。
【0018】次に、ステップS203において入力され
た文書画像から、1文字毎に文字画像ブロックの抽出を
行う。抽出された文字画像ブロックの位置や大きさ等の
情報は、ステップS204でRAM103に記憶する。
なお、入力画像内の認識範囲は本装置が予め定めたもの
でも、オペレータが指定してものでも良い。
【0019】文字画像ブロックが抽出されたら、ステッ
プS205で1文字毎の特徴量の抽出を行ない、認識辞
書を用いて識別演算を行う。ステップS206では、そ
の結果(文字コード群)をRAM103に記憶すると共
に、ステップS207で認識結果をディスプレイ105
に表示する。
【0020】文字登録は、このような文字認識処理が終
了した後に行われるが、その概略を、図3のフローチャ
ートおよび図4のディスプレイ105の状態を用いて説
明する。
【0021】まず、ステップS301では、認識結果を
表示するテキストウインドウ上で、文字登録させたい、
あるいは適当な文字401を指定する(図4(A)参
照)。ステップS302では、ステップS204および
ステップS206で記憶された情報を参照して、指定し
た文字に対応する文書画像の位置近傍の画像をイメージ
ウインドウ上に表示させると共に、対応する文字切り枠
402を表示する(図4(A)参照)。
【0022】ここで、もし、表示された文字切り出し枠
402が指定したテキストウインドウの文字に対応しな
いと判断した場合には、その枠402の大きさや位置を
変更できる。大きさ及び変更する場合には、表示された
切り出し枠402内に、マウス107に連動するカーソ
ルを移動し、マウス107に設けられたボタンを1回押
下するか(クリックと呼ばれる)、押下したままマウス
107の移動操作を行う(ドラッグと呼ばれる)。
【0023】クリック操作を行うと、ステップS306
の判断が“yes”になり、ステップS305に進む。
また、ドラッグ操作を行うと、文字切り出し枠を移動さ
せ(ステップS304)、ステップS305に進む。
【0024】いずれの場合にも、ステップS305に進
むことになるが、ここで、切り出し枠の大きさを変更す
るためのハンドル404を有する文字切り出し枠を表示
する。
【0025】ハンドル404は、全部で8つあり、その
いずれかをマウス107でドラッグ操作することで、文
字切り出しの大きさを変えることが可能になる。たとえ
ば、8つのハンドルのうち、切り出し枠402の四隅の
4つのハンドルは、切り出し枠402の形状を保ったま
ま、切り出し枠の大きさを変えるために使用し(図4
(D)参照)、切り出し枠の4辺の中央にあるハンドル
は縦、もしくは横方向の大きさを変えるためのものであ
る。いずれもドラッグ操作で行う。
【0026】また、切り出し枠402のハンドル以外
(たとえば切り出し枠内部等)を指定してドラッグ操作
を行うと、切り出し枠そのものを移動させることが可能
である(図4(C)参照)。
【0027】以上の切り出し枠402の移動、もしくは
大きさの変更処理は、ステップS308またはステップ
S310の判定処理で判定され、ステップS309或い
はステップS311で行われる。
【0028】図4(A)の場合には、本来、文字“が”
として認識されるべきところ、“力”と“ヾ”の2つに
分離されてしまった状態を示しているから、操作者は、
切り出し枠402を横方向に大きくし、切り出しサイズ
を主として訂正することになる。
【0029】さて、以上の作業中、操作者が図4に示す
画面の上部に表示された“文字登録”をクリックする
と、処理はステップS312からステップS313に進
み、表示画面には、図4(B)に示すように、その時点
での切り出し枠内のイメージと、テキストウインドウで
指定された文字を含むポップアップウインドウを表示す
る。
【0030】本実施例の状態では、本来認識結果は
“が”になっているところ、認識結果の文字は“力”に
なっているから、これをキーボード等で“が”に変更す
る(ステップS313)。この結果が図4(B)であ
る。尚、文字が漢字の場合には、かな漢字変換等を利用
して、文字を入力する。
【0031】そして、ポップアップウインドウ中の“確
認”をクリックすると、ポップアップウインドウに表示
された切り出した文字イメージ405と、テキスト文字
“が”406の文字コードとが対応つけられ、文字イメ
ージ405の特徴量が抽出され、認識辞書に文字“が”
として登録される。
【0032】以上説明したように、従来の認識結果に対
応する文字画像を文字登録する場合の作業をそのまま使
用しつつ、認識結果の文字に対する画像の文字切り枠を
移動、あるいは大きさの変更することで、登録する画像
を指定できるので、文字切り出しが失敗した場合や、入
力画像内で、文字認識をしていない文字画像でも文字登
録が可能となる効果がある。
【0033】なお、上記実施例では、本発明を実施する
ための最低限の構成要件で説明を行っているが、例えば
汎用コンピュータに、本発明を実施する処理を行うプロ
グラムや認識辞書等のデータをフロッピーディスク等に
記憶しておき、外部から提供する、あるいは、予め外部
記憶装置104に記憶しておき、RAM103に格納す
るように構成されていてもよいし、記憶装置はRAM1
03に限定されるものでもない。
【0034】また、文字切り枠内の画像を文字登録時に
405に表示しているが、表示しなくてもよいし、図3
では本発明に係る処理だけを示しているので、本発明係
らない処理が生じた場合、ただちに文字登録の処理が中
止されるように構成されていてもよい。さらに、ステッ
プS303とステップS306とステップS307、ス
テップS308とステップS310とステップS312
はどの順番で判断されても問題ない。
【0035】また、全く認識不能であった場合に、テキ
ストウインドウに特定の記号を表示する場合であって
も、その近傍の文字を指定するだけで、認識できなかっ
た文書画像中の該当する文字近傍の文字イメージに対し
て切り出し枠が表示されるので、目的の文字イメージ
(認識不能であった文字イメージ)位置を容易に探し出
すことが可能になる。
【0036】<第2の実施例>第2の実施例を以下に説
明する。尚、装置構成は第1の実施例と同様であるもの
とし、その説明は省略する。
【0037】図5に第2の実施例における文字登録の処
理手順のフローチャートを示す(対応するプログラムが
ROM102に格納されることになる)。
【0038】まず、ステップS501では、認識結果を
表示するテキストウインドウ上で文字を指定する。ステ
ップS502では、ステップS204およびステップS
206(図2参照)で記憶された情報より、指定した文
字に対応する文字切り枠を、入力画像を表示するイメー
ジウインドウ上に表示する。この時、第1の実施例で説
明したようなハンドルを文字切り枠上に表示してもよ
い。
【0039】次にステップS503で、本装置への操作
を検知する。
【0040】先ず、文字切り枠内でドラッグを検出する
と、ステップS504に進んで、文字切り枠を移動す
る。また、文字切り枠の枠線をドラッグするとステップ
S505に進み、文字切り枠の大きさを変更する。
【0041】図6に示すように、文字切り枠の移動時は
マウスのカーソルが符号601、文字切り枠の大きさの
変更の時は上下方向なら符号602、左右方向なら符号
603、左上右下なら符号604に示すカーソルのよう
に形を変更すると分かりやすい。
【0042】文字登録が操作された場合は、ステップS
501で指定した文字を登録文字の初期値としてステッ
プS506で設定し、ステップS507でその文字画像
が何の文字であるかを指定し、ステップS508で文字
登録が終了し、認識辞書が更新される。図7のように、
ステップS507での文字の指定を文字コードの指定に
してもよく、ボタン701で切り替え可能にしてもよ
い。
【0043】尚、実施例では認識対象の文書画像をスキ
ャナ108から読み取るものとして説明したが、文書画
像はたとえばフロッピーディスク等の記憶媒体に記憶さ
せ、そこからイメージを読み込んでも、回線を介して受
信した画像であっても良い。従って、本発明は上記実施
例に限定されるものではない。
【0044】また、本発明は、複数の機器から構成され
るシステムに適用しても、1つの機器から成る装置に適
用しても良い。また、本発明はシステム或は装置にプロ
グラムを供給することによって達成される場合にも適用
できる。従って、上記機能をはたすプログラムを内蔵し
た記憶媒体でもって、装置内にプログラムを取り込み処
理するようにしても良いのは勿論である。
【0045】
【発明の効果】以上説明したように本発明によれば、対
応する認識結果が存在しない文字画像でも、文字登録が
極めて容易になる。
【0046】
【図面の簡単な説明】
【図1】第1の実施例に係る文字認識装置のブロック図
である。
【図2】第1の実施例に係る文字認識装置が行う文字認
識処理のフローチャートである。
【図3】第1の実施例に係る文字認識装置が行う文字登
録のフローチャートである。
【図4】第1の実施例に係る文字登録時のディスプレイ
上の表示を説明する図である。
【図5】第2の実施例に係る文字認識装置が行う文字登
録のフローチャートである。
【図6】第2の実施例に係る文字切り枠の変更時のマウ
スのポインタの表示を説明する図である。
【図7】第2の実施例に係る文字登録時のディスプレイ
上の表示を説明する図である。
【図8】従来例における文字登録時のディスプレイ上の
表示例を示す図である。
【符号の説明】
101 CPU 102 ROM 103 RAM 104 外部記憶装置 105 ディスプレイ 106 キーボード 107 ポインティングデバイス 108 イメージスキャナ

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 与えられた文書画像中の文字を認識する
    文字認識装置であって、 認識結果の文字列を表示する認識結果表示手段と、 表示された認識結果の所望とする文字を指定する指定手
    段と、 該指定手段で指定された文字の認識元になった文字イメ
    ージの近傍の領域と、文字認識したときの切り出し枠を
    表示するイメージ表示手段と、 前記切り出し枠の大きさ/位置を調整する調整手段と、 登録対象の文字を特定する情報を入力する入力手段と、 前記調整手段で調整された切り出し枠内のイメージの特
    徴情報を抽出して、前記入力手段で入力された情報と対
    応付けて、文字認識用辞書に登録する登録手段とを備え
    ることを特徴とする文字認識装置。
  2. 【請求項2】 前記調整手段は、所定のポインティング
    デバイスでもって、切り出し枠の大きさや位置を調整す
    ることを特徴とする請求項第1項に記載の文字認識装
    置。
  3. 【請求項3】 更に、切り出し枠を表示するとき、当該
    切り出し枠のサイズ変更或いは位置変更のためのハンド
    ルを備えることを特徴とする請求項第2項に記載の文字
    認識装置。
  4. 【請求項4】 前記入力手段で入力する文字を特定する
    情報の初期値は、前記指定手段で指定された文字を特定
    する情報であることを特徴とする請求項第1項に記載の
    文字認識装置。
  5. 【請求項5】 前記入力手段で入力する文字を特定する
    情報は、文字コードを含むことを特徴とする請求項第1
    項に記載の文字認識装置。
  6. 【請求項6】 与えられた文書画像中の文字を認識する
    文字認識方法であって、 認識結果の文字列を表示する認識結果表示工程と、 表示された認識結果の所望とする文字を指定する指定工
    程と、 該指定工程で指定された文字の認識元になった文字イメ
    ージの近傍の領域と、文字認識したときの切り出し枠を
    表示するイメージ表示工程と、 前記切り出し枠の大きさ/位置を調整する調整工程と、 登録対象の文字を特定する情報を入力する入力工程と、 前記調整工程で調整された切り出し枠内のイメージの特
    徴情報を抽出して、前記入力工程で入力された情報と対
    応付けて、文字認識用辞書に登録する登録工程とを備え
    ることを特徴とする文字認識方法。
  7. 【請求項7】 前記調整工程は、所定のポインティング
    デバイスでもって、切り出し枠の大きさ/位置を調整す
    ることを特徴とする請求項第6項に記載の文字認識方
    法。
  8. 【請求項8】 更に、切り出し枠を表示するとき、当該
    切り出し枠のサイズ変更或いは位置変更のためのハンド
    ルを備えることを特徴とする請求項第7項に記載の文字
    認識方法。
  9. 【請求項9】 前記入力工程で入力する文字を特定する
    情報の初期値は、前記指定工程で指定された文字を特定
    する情報であることを特徴とする請求項第6項に記載の
    文字認識方法。
  10. 【請求項10】 前記入力工程で入力する文字を特定す
    る情報は、文字コードを含むことを特徴とする請求項第
    6項に記載の文字認識方法。
JP7151494A 1995-06-19 1995-06-19 文字認識装置及び方法 Pending JPH096894A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP7151494A JPH096894A (ja) 1995-06-19 1995-06-19 文字認識装置及び方法
DE69608035T DE69608035T2 (de) 1995-06-19 1996-06-18 Gerät und Verfahren zur Zeichenerkennung
US08/666,680 US6456739B1 (en) 1995-06-19 1996-06-18 Apparatus for recognizing characters and a method therefor
EP96304527A EP0750270B1 (en) 1995-06-19 1996-06-18 An apparatus for recognising characters and a method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7151494A JPH096894A (ja) 1995-06-19 1995-06-19 文字認識装置及び方法

Publications (1)

Publication Number Publication Date
JPH096894A true JPH096894A (ja) 1997-01-10

Family

ID=15519732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7151494A Pending JPH096894A (ja) 1995-06-19 1995-06-19 文字認識装置及び方法

Country Status (1)

Country Link
JP (1) JPH096894A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123520A (ja) * 2010-12-07 2012-06-28 Hitachi Omron Terminal Solutions Corp 帳票認識処理装置
JP2013077302A (ja) * 2011-09-29 2013-04-25 Samsung Electronics Co Ltd 携帯端末機のユーザインターフェース提供方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012123520A (ja) * 2010-12-07 2012-06-28 Hitachi Omron Terminal Solutions Corp 帳票認識処理装置
JP2013077302A (ja) * 2011-09-29 2013-04-25 Samsung Electronics Co Ltd 携帯端末機のユーザインターフェース提供方法および装置

Similar Documents

Publication Publication Date Title
JP4970714B2 (ja) 指定されたドキュメント・エリアからのメタデータの抽出
EP1349053B1 (en) Method and system for overloading loop selection
US11113464B2 (en) Synchronizing data-entry fields with corresponding image regions
JP2007503032A (ja) ドキュメントスキャナ
KR100615058B1 (ko) 휴대 정보 단말 장치의 문자인식에 있어서의 처리 대상 선택 방법 및 휴대 정보 단말 장치
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
JPH096894A (ja) 文字認識装置及び方法
EP0519713B1 (en) Character input method and apparatus
US6456739B1 (en) Apparatus for recognizing characters and a method therefor
JPH06215089A (ja) カラー画像ファイル管理装置
JPH0728801A (ja) イメージデータ処理方法及びその装置
JPH08202856A (ja) 画像処理方法
JPH103516A (ja) 情報処理方法及び装置
JPH07287634A (ja) 文書作成装置及びその図形作成方法
JP3761923B2 (ja) 画像処理装置及び方法
JPH1055431A (ja) 画像処理装置
JPH0573725A (ja) 手書き文字・図形認識装置
JPH096899A (ja) 画像処理装置及び方法
JPH096974A (ja) 画像処理方法及び装置
JP2958784B2 (ja) 画像処理装置
JPH06325205A (ja) 文字認識装置およびその認識実行領域指定方法
JPH0816571A (ja) 漢字入力装置
JPH05128300A (ja) 文字認識方法及びその装置
JPH096904A (ja) 画像処理方法及び装置
JPH096900A (ja) 画像処理装置及び方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050927

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060116