JPH0973515A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0973515A
JPH0973515A JP7228266A JP22826695A JPH0973515A JP H0973515 A JPH0973515 A JP H0973515A JP 7228266 A JP7228266 A JP 7228266A JP 22826695 A JP22826695 A JP 22826695A JP H0973515 A JPH0973515 A JP H0973515A
Authority
JP
Japan
Prior art keywords
character
recognition
unit
document image
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7228266A
Other languages
English (en)
Inventor
Kenichirou Kiko
健一郎 木子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP7228266A priority Critical patent/JPH0973515A/ja
Publication of JPH0973515A publication Critical patent/JPH0973515A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字認識処理における頻繁な視線の移動や、
それに伴う操作の煩雑性を解消した文字認識装置を提供
する。 【解決手段】 文書画像入力部1によって文書画像を読
み取り、表示部11に表示する。操作部10で文書画像
上の認識領域が指定されると、その認識領域の画像が文
字認識部4に送られる。文字認識部4では文字認識処理
を行なって、各文字の位置と大きさ、及び複数の候補文
字とその確信度を認識結果記憶部6に格納する。文字フ
ォント計算部7は、画面上の対応する文字に最も近い大
きさの文字フォントを決定し、表示位置を計算して、認
識結果を画面の文書画像上に重ねて表示する。重ねて表
示された認識結果に対して、操作部10から指示する
と、認識結果の候補文字が表示されるので、正解文字を
選択すれば、認識結果を修正することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、紙等の媒体上に記
録された画像から文字を認識し、その結果を表示・出力
する文字認識装置に関するものである。
【0002】
【従来の技術】文字認識の結果には、一般に誤認識が含
まれるため、確認・修正の作業が必要になる。従来の文
字認識装置、例えば、特開昭63−5488号公報、特
開昭63−98788号公報などでは、オペレータが直
接紙上の文字と認識結果とを見比べる労力を軽減するた
め、確認作業時に、認識対象となった文字画像と認識候
補とを隣接して表示するようにしていた。
【0003】このようなユーザインタフェースでは、原
画像と認識結果を見比べるために視線を頻繁に移動する
必要があることから、操作が煩雑となり、誤認した文字
を見落とす可能性があった。そこで、例えば、特開昭6
2−113285号公報などにように認識結果上に、必
要に応じて原画像を表示する方法が提案されている。
【0004】この方法により、原画像と認識結果とを見
比べる煩雑さはある程度解消されるものの、修正を行な
うためには文章の文脈をある程度考慮しなくてはなら
ず、もとの文書画像上での位置を知ることが必要とな
る。しかし、認識結果の原画像上での位置を、認識結果
のみから把握することは困難である。そこで、例えば、
特開平2−89190号公報や特開平3−88086号
公報などに記載されているように、認識結果と原画像に
加えて、簡単なレイアウト画像をも表示することによ
り、もとの文書画像上での位置も表わすようなユーザイ
ンタフェースが提案されている。
【0005】このように、従来の技術においては認識結
果の修正に必要な情報である、認識結果、認識した文字
の原画像、文書画像のレイアウト情報などをそれぞれ別
々のウィンドウに表示していた。しかし、このような形
態では、作業のために多くのウィンドウが存在し、その
間を行き来しながら作業を進めなければならないため、
たとえ相互のウィンドウの表示位置を近づけて配置した
としても、修正を行なう際のオペレータの視線の移動が
避けられず、また操作も煩雑にならざるを得なかった。
【0006】
【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、文字認識処理における頻繁
な視線の移動や、それに伴う操作の煩雑性を解消した文
字認識装置を提供することを目的とするものである。
【0007】
【課題を解決するための手段】請求項1に記載の発明
は、文字認識装置において、紙面に記録された文書画像
を読み取る文書画像入力部と、読み取った文書画像を表
示する表示部と、前記文書画像から文字を認識する文字
認識部と、該文字認識部で用いられる文字認識辞書と、
少なくとも認識した文字画像の位置と候補文字を記憶す
る認識結果記憶部を有し、前記表示部は、前記認識結果
記憶部に記憶されている候補文字の1つを画面の文書画
像の対応する文字に重ねて表示することを特徴とするも
のである。
【0008】請求項2に記載の発明は、文字認識装置に
おいて、紙面に記録された文書画像を読み取る文書画像
入力部と、読み取った文書画像を表示する表示部と、前
記文書画像から文字を認識する文字認識部と、該文字認
識部で用いられる文字認識辞書と、少なくとも認識され
た各文字画像の位置・大きさ及び候補文字を記憶する認
識結果記憶部と、前記候補文字を表示するための文字フ
ォントを決定する文字フォント計算部と、文字フォント
が格納されている文字フォント格納部を有し、前記表示
部は前記候補文字の1つと前記文字画像の大きさから前
記フォント計算部で決定した文字フォントを前記文字フ
ォント格納部から取り出し前記文字画像の位置に前記文
書画像に重ねて表示することを特徴とするものである。
【0009】請求項3に記載の発明は、請求項1または
2に記載の文字認識装置において、さらに、前記表示部
は、文書画像上に重ねて表示された認識結果に対して指
示を受けたとき、指示された文字に対応する前記候補文
字を一覧表示するとともに、その1つが選択されたとき
該選択された候補文字に基づき表示を修正することを特
徴とするものである。
【0010】
【発明の実施の形態】図1は、本発明の文字認識装置の
実施の一形態を示す構成図である。図中、1は文書画像
入力部、2は文書画像格納部、3は認識対象領域記憶
部、4は文字認識部、5は文字認識用辞書、6は認識結
果記憶部、7は文字フォント計算部、8は文字フォント
格納部、9は文書編集部、10は操作部、11は表示
部、12は制御部である。
【0011】文書画像入力部1は、紙面上に書かれた文
書画像を読み取る。文書画像入力部1は、一般的なイメ
ージスキャナ等の画像入力装置によって実現可能であ
る。文書画像格納部2は、画像読み取り部1によって読
み込まれた文書画像を格納する。認識対象領域記憶部3
は、操作部10によって指定された認識対象領域を記憶
する。
【0012】文字認識部4は、認識対象領域記憶部3が
記憶している認識対象領域の文書画像を文書画像格納部
2から読み出し、読み出した認識対象領域の文字画像に
対して文字認識を行なう。文字認識用辞書5は、文字認
識部4が文字認識を行なう際に用いられる。認識結果記
憶部6は、文字認識部4において認識した各文字の位置
・大きさ及び認識結果の候補文字とその確信度を記憶す
る。
【0013】文字フォント計算部7は、認識結果を文書
画像上に表示する際に、認識結果記憶部6に記憶されて
いる文字の大きさをもとに、表示に用いる文字フォント
の大きさを計算する。文字フォント格納部8には、表示
するための文字フォントが格納されている。
【0014】文書編集部9は、文字認識部4から出力さ
れた認識結果をもとに、文書の編集やファイルへの出力
などを行なう。
【0015】操作部10は、画像の文書画像格納部2か
らの読み出しや認識領域の指定、認識結果の修正及び編
集の指示などのオペレータからの入力を受け付ける。操
作部10は、キーボードとマウスなどのポインティング
デバイスなどにより構成することができる。表示部11
は、文書画像入力部1で取り込んだ文書画像の表示と、
認識対象領域および認識結果の表示などを行なう。表示
部11は、CRTや液晶ディスプレイなどによって実現
可能である。制御部12は、各処理の制御を行なう。
【0016】図2は、本発明の文字認識装置の実施の一
態様における全体の動作の一例を示すフローチャートで
ある。まず、S21において、オペレータが操作部10
から指示することにより、認識対象とする文書を文書画
像入力部1から読み込ませる。読み取られた文書画像
は、S22において、表示部11に表示される。必要な
場合には、オペレータの指示により表示された画像を文
書画像格納部2に記憶させることができる。また、既に
文書画像格納部2に記憶されている文書を読み出して、
表示部11に表示させることもできる。
【0017】S23において、認識対象領域の指定を行
なう。例えば、オペレータが矩形によって認識対象とす
る領域を指定するとすれば、矩形の2点をオペレータが
指定すればよい。指定された領域は、認識対象領域とし
て認識対象領域記憶部3に記憶される。
【0018】認識対象領域が確定すると、S24におい
て、文字認識部4による文字認識処理が行なわれる。文
字認識部4では、認識対象領域中の各文字に対応する領
域を画像から抽出し、各文字を順に認識し、認識結果と
して複数の候補文字コードとそれぞれの確信度を認識結
果記憶部6に格納する。
【0019】認識処理の開始は、一つの領域の指定後、
すぐに開始するほか、領域を指定した後、オペレータが
メニュー等から明示的に認識処理の実行を指示するよう
に構成してもよい。この方法は、複数の領域を指定した
後に、まとめて認識処理を実行させる場合に用いること
ができる。この場合は、指定された領域が順番に処理さ
れる。
【0020】文字認識処理によって認識結果の文字コー
ドが得られると、文字フォント計算部7は、認識結果記
憶部6に記憶されている認識対象文字の大きさ等に基づ
き、画面上の文字画像と最も近い大きさのフォントを決
定する。そして、決定した大きさの文字フォントを文字
フォント格納部8から読み出し、対応する文字画像の位
置に重ねて表示する。
【0021】S25において、認識領域が指定した領域
でよいことを確認し、S26へ進む。指定した領域が正
しくなかった場合には、S23へ戻り、認識領域の指定
からやり直す。
【0022】S26において、認識結果の修正を行なう
ことができる。文字認識処理が終了した状態では、例え
ば、各文字に対応する認識結果の第1候補文字が、対応
する画面の文字画像上に重ねて表示されている。もとの
画像は認識結果の下にあるためオペレータには見えな
い。この状態で、認識結果の修正が行なわれる。修正対
象となる認識結果の文字を操作部10より指示すると、
修正対象の文字の近傍に候補文字が表示される。その候
補文字の中から正しいものを選択することによって、選
択された候補文字が表示される。このような修正処理を
繰り返し行なうことができる。
【0023】認識結果の修正の終了後、S27におい
て、転記キーが押下されたか否かを判定し、さらに、S
28において、認識結果をファイルへ出力するか否かを
判定する。転記およびファイルへの出力が指示されない
場合には、S23へ戻り、認識領域の指定および認識処
理をやり直す。S28でファイルへの出力が指示された
場合には、S29において、オペレータからのファイル
名を受け、S30において、認識結果をファイルに出力
して終了する。また、S27において、転記キーが押下
されたことを検出した場合には、S31において、認識
結果を文書編集部9に転記する。文書編集部9では、認
識結果を編集中の文書に挿入するなど、文書の編集に用
いることができる。
【0024】この例では、ファイルへの出力と文書編集
部9への転記の2つの出力形態を示したが、どちらか一
方で構成してもよいし、通信回線を通じて他の処理装置
に転送するなど、他の出力形態を有していてもよい。
【0025】図3は、本発明の文字認識装置の実施の一
態様の動作の一例における具体例の説明図である。図2
に示したフローチャートに沿って、具体例を説明する。
初めに、S21において、オペレータは操作部10から
指示することにより、認識対象とする文書を文書画像入
力部から読み込ませる。読み取られた文書画像は、S2
2において、図3(A)に示すように、表示部11に表
示される。ここで、矢印はマウスカーソルである。ま
た、図示の都合上、各行を線によって示している。
【0026】次に、S23において、オペレータは矩形
によって認識対象とする領域の指定を行なう。図3では
認識対象領域は矩形とし、操作部10のマウスを用いて
指定する例を示している。図3(A)に示す位置でマウ
スによって開始点を指示し、図3(B)に示す位置でマ
ウスによって終了点を指示する。例えば、開始点でマウ
スのボタンを押したまま終了点までマウスを移動させ、
ボタンを離すことによって終了点を指示したり、あるい
は、開始点と終了点でマウスのボタンをクリックする、
さらには開始点と終了点でマウスの異なるボタンをクリ
ックする等、種々の指示の方法を用いることができる。
【0027】また、図3では、認識対象領域を矩形枠で
示し、認識対象領域内の表示を変化させている。図示の
都合上、各行を示す線を太くして示しているが、例え
ば、反転表示したり、色や輝度を変えるなど、種々の表
示方法を用いることができる。もちろん、表示を変化さ
せなくてもよいし、あるいは矩形枠はなくてもよい。
【0028】認識対象領域が確定すると、S24におい
て、文字認識処理が開始される。ここでは、認識対象領
域内の文字が認識され、順次表示されていく。図3
(C)では、認識対象領域の途中まで、認識処理が進ん
だ状態を示している。図3(C)では、認識処理の終了
した部分を点線によって示している。認識結果は画像に
重ねて表示されるので、表示の変化によってオペレータ
は処理の進捗状況を把握することができる。また、認識
結果を表示する際には、文字画像の大きさに合った文字
フォントによって表示を行なうことができる。さらに、
認識処理によって得られた文字の確信度に応じて、表示
を変化させることも可能である。例えば、確信度の低い
文字に対して色づけを行なうことによって、オペレータ
に注意を喚起することができる。
【0029】文字認識処理が終了した状態では、各文字
に対応する認識結果の第1候補文字が、対応する画面の
文字画像上に重ねて表示されている。もとの画像は認識
結果の下にあるためオペレータには見えない。この状態
で、S26において、認識結果の修正が行なわれる。修
正すべき文字がなければ、修正する必要はない。また、
認識対象領域が違っている場合には、認識対象領域の指
定からやり直すこともできる。
【0030】図3(D)に示すように、修正対象となる
認識結果の文字上に、操作部10の例えば、マウスによ
ってマウスカーソルを移動し、クリックする。この指示
により制御部12は、もとの文字画像を拡大して表示す
るとともに、認識結果記憶部6に格納されている複数の
候補文字を、文字画像に隣接して表示する。図3(D)
では、認識対象領域の最上行の中程の文字にマウスカー
ソルを合わせて、マウスをクリックした場合を示してお
り、下方へ伸びる矩形によって示している部分に、候補
文字が一覧表示されている。この候補文字の一覧表示か
ら、オペレータが正解の候補文字をクリックすると、制
御部12は、第1候補文字と指定された候補文字と入れ
替え、指定された文字を表示する。
【0031】修正すべき文字に対して、同様の修正処理
を行なった後、例えば、図3(E)に示すように、オペ
レータが操作部10のキーボードの転記ボタンを押す
と、転記モードになる。すなわちS27からS31へ進
み、文書編集部9が表示部11に表示しているウィンド
ウに、操作部10のマウスによってマウスカーソルを移
動させてクリックすると、図3(F)に太線で示すよう
に、認識結果が転記される。例えば、ICCCM(In
ternational Client Commun
ication Convention Manua
l)に示されている様な規定により、クリップボード等
を介して、認識結果を転記することができる。このとき
転記される認識結果は、第1候補文字からなる文字列で
ある。
【0032】図3では、文書編集部9への転記の例を示
したが、例えば、表示部11の文書画像を表示するウィ
ンドウのプルダウンメニューでファイル出力を指定する
ことにより、認識結果をファイルに出力することもでき
る。ファイル出力が指定されると、制御部12はファイ
ル名を入力するウィンドウを表示部11に表示する。こ
こで、操作部10のキーボードを用いてファイル名を入
力することにより、指定したファイルに認識結果が出力
される。プルダウンメニューのほか、操作部10のキー
ボードからのキー入力によってファイル出力を指定する
ように構成してもよい。逆に転記の場合も、プルダウン
メニューによって行なうようにしてもよい。また、転記
や出力をせずに、認識処理をやり直すことも可能であ
る。
【0033】以上のように、オペレータは入力された文
書画像上で、領域の指定から認識結果の修正までの全て
の作業を行なうことができる。更に、転記キーなどによ
り文書画像から所望の文字列を得て、文書編集部の電子
的な文書環境へと認識結果を移し、編集することができ
る。なお、上述の具体例ではポインティグデバイスとし
てマウスを用いたが、タッチペンを用いるなど、他の入
力形態で実現することもできる。
【0034】上述の動作の一例において、認識対象領域
の指定と、文字認識・修正の動作をさらに詳細に説明す
る。図4は、認識対象領域の指定処理の一例を示すフロ
ーチャート、図5は、文字認識・修正処理の一例を示す
フローチャート、図6は、認識対象領域の指定および文
字修正処理の具体例の説明図である。
【0035】まず、認識対象領域の指定の処理について
説明する。ここでは、認識対象領域は矩形とし、その指
定は、操作部10のマウスを用い、開始点でマウスの左
ボタンを押下し、そのままマウスを移動させ、終了点で
マウスの左ボタンをはなすことによって行なう場合を例
にして説明する。
【0036】いま、図6(A)に一部示すように、文書
画像が表示されている。オペレータは、操作部10のマ
ウスを用いて、開始点にマウスカーソルを合わせ、マウ
スの左ボタンを押下する。制御部12は、S41におい
て、マウスの左ボタンが押されたか否かを監視してい
る。操作部10のマウスボタンが押下されたことによっ
て、開始点が指定されたことを検出し、S42におい
て、マウスの左ボタンの押下によって出力される位置情
報をもとに、文書画像上の対応する位置を検出して記憶
する。ここでは、図6(A)に矢印で示す位置におい
て、マウスの左ボタンが押下されたものとする。
【0037】次にオペレータは、左ボタンを押したま
ま、所望の矩形領域の終点にマウスカーソルを移動させ
る。S43でマウスカーソルが移動されたか否かを監視
しており、オペレータが左ボタンを離さずに移動させて
いる間は、文書画像上に開始点と現在のカーソルの位置
とを対角線上の2点とする矩形が、図6(B)に示すよ
うに制御部12によって文書画像上に常に表示される。
具体的には、S44において、マウスカーソル移動前の
矩形を消去し、S45において、開始点とマウスカーソ
ルの位置とを対角線上の頂点とする矩形を描画する。こ
のような処理によって、表示される矩形は、カーソルの
移動と連動して書き換えられる。
【0038】S46において、マウスの左ボタンが離さ
れたか否かを監視している。図6(C)に示す位置にマ
ウスカーソルを移動させた状態でオペレータが左ボタン
を離すと、制御部12はこれを検知し、S47において
終了点を決定し、認識対象領域を確定する。そして、S
48において、決定された認識対象領域の位置を認識対
象領域記憶部3に記憶する。画面上では、マウスの移動
とともに更新されていた矩形が固定され、決定された認
識対象領域を示す矩形として文書画像上に表示されてい
る。
【0039】なお、上述の認識対象領域の指定における
マウスのボタンの操作は、左ボタンによって行なう例を
示したが、上述のように、他の指示方法を用いることも
可能である。また、決定された認識対象領域は、例え
ば、反転表示や色、輝度を変えるなどの種々の表示形態
によって他の部分と異ならせることも可能である。図6
(C)では、認識対象領域にハッチングを施して示して
いる。
【0040】認識対象領域が確定すると、直ちに文字認
識処理が開始される。図5のS51において、認識対象
領域の画像が切り出されて、文字認識部4へと送られ
る。文字認識部4では、認識対象領域中の各文字に対応
する領域を画像から抽出するが、この際に、S52にお
いて縦書き・横書きの判別を行なう。この縦書き・横書
きの判別は、例えば、特公平5−78068に記載され
ているような方法など、種々の方法を用いることができ
る。そして、判別した文字列の方向に従って、S53で
各文字に対応する領域を抽出する。例えば、各文字に外
接する矩形領域を抽出するなど、公知の方法を用いれば
よい。さらに、S54において、各行ごとの文字の大き
さを計算して、認識結果記憶部6に記憶させる。
【0041】ここで、S55のように、抽出した各文字
ごとの矩形領域を表示させることが可能である。表示方
法は、矩形の表示や、色、輝度の変更など、種々の方法
を用いることができる。これにより、オペレータは文字
の切り出し時のエラーを知ることができ、以後の修正処
理に反映させることができる。
【0042】S56〜S63において、各文字ごとの認
識および表示の処理を行なう。S56において、文字認
識部4は、文字認識用辞書5を用いて1文字の認識を行
なう。認識方法は、公知の認識方法を用いる。このと
き、候補文字の文字コードとともにその候補文字の確信
度を認識結果記憶部6に格納する。複数の候補文字が得
られる場合には、それらをすべて格納する。
【0043】文字認識処理によって認識結果の文字コー
ドが得られると、文字フォント計算部7は、S57にお
いて、認識結果記憶部6に記憶されている認識対象文字
の大きさと、文書画像の解像度及び表示されている文書
の画面上での縮小率をもとに、画面上の文字画像と最も
近い大きさの文字フォントを決定する。
【0044】具体的には、文書画像の解像度をDs(d
ot per inch)、認識対象文字が属している
行の平均的な文字の高さをTh(ピクセル)、表示部1
1に表示されている文書画像の画面上での縮小率をRと
すると、文字フォントのポイント数P(Point)は
以下の式によって求まる。 P=Th/Ds×R×72 (Point)
【0045】次に、S58において、画面上で文字フォ
ントを表示する位置を計算する。原画像上での文字矩形
の右上の座標を(Xs,Ys)とすると、画面上でのフ
ォントを表示する右上の座標(Xd,Yd)は、 Xd=Xs×R Yd=Ys×R によって求まる。
【0046】次に、文字フォント計算部7は、S59に
おいて、文字フォント格納部8からS57で決定された
大きさの文字フォントを読み出す。そして、S61にお
いて、S58で求めた対応する文字画像の位置に重ねて
表示する。この時、S60で文字認識結果の確信度があ
る閾値T以下と判定された場合には、S62において、
通常とは異なる表示方法、例えば、異なった色づけをす
るなどにより、文字フォントを表示する。
【0047】これで1文字分の認識および表示処理が終
了する。S63で未処理の文字矩形が残っていると判定
される場合には、S56へ戻り、次の文字についての処
理を行なう。このようにして順に1文字ずつ認識され、
順次表示される。図6(D)には、認識処理中の表示状
態を示している。先頭の「認」から2行目の「が」まで
が認識され、それぞれ第1候補の文字に対応する文字フ
ォントが、文字画像に重ねて表示される。図6(D)で
は、図示の都合上、ハッチングを取り去ることによっ
て、認識された部分を表わしている。また、2行目の先
頭の認識結果の文字「丈」は、確信度がある閾値T以下
であったため、異なる表示方法によって表示されてい
る。ここでは、異なるハッチングによって示している。
【0048】ここでは、順次、認識された文字を表示す
る例を示したが、例えば、文書画像が表示されているウ
ィンドウのプルダウンメニュー等での指定により、1つ
の領域の全ての文字の認識が終了した後に、一括して認
識結果を表示するように構成してもよい。
【0049】文字認識処理が終了すると、次に必要に応
じて修正処理を行なう。画面には、各文字に対応する認
識結果の第1候補文字が、対応する画面の文字画像上に
重ねて表示されている。もとの画像は認識結果の下にあ
るためオペレータには見えない。この状態で、オペレー
タは修正対象となる認識結果の文字上に、操作部10の
マウスによってマウスカーソルを移動し、クリックす
る。図6(D)に示すように、2行目の先頭の文字
「文」が誤認識され、「丈」が表示されている。そこ
で、この文字「丈」にマウスカーソルを合わせて、マウ
スのボタンをクリックする。すると、図6(E)に示す
ように、制御部12はもとの文字画像「文」を拡大して
表示するとともに、さらに認識結果記憶部6に格納され
ている複数の候補文字を、文字画像に隣接して表示す
る。図6(E)では、拡大した文字画像の下に、候補文
字を一覧表示している。ここで、オペレータが正解の候
補文字として、2番目の文字「文」にマウスカーソルを
合わせてマウスのボタンをクリックする。すると、制御
部12は、第1候補文字と指定された候補文字とを入れ
替える。すなわち、指定された文字が表示されることに
なる。このとき、認識結果の表示と同様に、文字フォン
トの大きさを決定し、対応する文字フォントを文字フォ
ント格納部8から読み出して表示すればよい。また、正
解の候補文字の指定とともに、拡大されたもとの文字画
像と、候補文字の一覧は消去され、図6(F)に示すよ
うな修正後の認識結果が表示される。
【0050】文字の大きさだけでなく、例えば、明朝
体、ゴシック体といった文字種なども認識結果として出
力できる場合には、これらの情報を用いて文字フォント
を決定し、表示させることも可能である。
【0051】このようにして、文字認識および認識結果
の修正が終了した後、例えば、文書編集部9によって編
集している文書中に転記したり、ファイル等へ出力する
ことができる。
【0052】
【発明の効果】以上の説明から明らかなように、本発明
によれば、画像入力された文書画像が表示部に表示さ
れ、認識結果が対応する文字に重ねて表示されるため、
オペレータは認識結果のもとの文書上での位置を容易に
知ることができる。これにより、オペレータの視線の移
動が少なくなり、操作が簡潔で分かりやすいものとな
る。
【0053】また、請求項2に記載の発明のように、文
字画像の大きさに合わせて文字フォントを読み出し、表
示するので、文書画像に即した認識結果の表示を行なう
ことができる。これにより、文書画像に近い形で認識結
果を参照することができるので、認識結果の視認性を向
上させることができる。
【0054】さらに、請求項3に記載の発明のように、
文書画像上に重ねて表示された認識結果に対して指示が
なされたとき、その位置で修正を行なうことができ、認
識対象領域の指定から認識結果の修正までの全ての作業
が1つのウィンドウ内で行なうことができる。これによ
り、さらにオペレータの視線の移動を少なくすることが
でき、修正の操作も簡潔で分かりやすいものとすること
ができる。
【0055】さらに、文書画像上に認識結果を表示する
際に、認識の確信度が一定値以下の場合には、通常の認
識結果と異なった方法で表示することにより、誤認の可
能性のある文字を、オペレータが容易に知ることができ
る。また、転記指示、及び転記先指示の入力により、認
識結果を編集中の文書へ転記することができるため、フ
ァイル等に一旦出力することなく、指定した領域の認識
結果を編集することが可能であるなど、種々の効果があ
る。
【図面の簡単な説明】
【図1】 本発明の文字認識装置の実施の一形態を示す
構成図である。
【図2】 本発明の文字認識装置の実施の一態様におけ
る全体の動作の一例を示すフローチャートである。
【図3】 本発明の文字認識装置の実施の一態様の動作
の一例における具体例の説明図である。
【図4】 認識対象領域の指定処理の一例を示すフロー
チャートである。
【図5】 文字認識・修正処理の一例を示すフローチャ
ートである。
【図6】 認識対象領域の指定および文字修正処理の具
体例の説明図である。
【符号の説明】
1…文書画像入力部、2…文書画像格納部、3…認識対
象領域記憶部、4…文字認識部、5…文字認識用辞書、
6…認識結果記憶部、7…文字フォント計算部、8…文
字フォント格納部、9…文書編集部、10…操作部、1
1…表示部、12…制御部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 紙面に記録された文書画像を読み取る文
    書画像入力部と、読み取った文書画像を表示する表示部
    と、前記文書画像から文字を認識する文字認識部と、該
    文字認識部で用いられる文字認識辞書と、少なくとも認
    識した文字画像の位置と候補文字を記憶する認識結果記
    憶部を有し、前記表示部は、前記認識結果記憶部に記憶
    されている候補文字の1つを画面の文書画像の対応する
    文字に重ねて表示することを特徴とする文字認識装置。
  2. 【請求項2】 紙面に記録された文書画像を読み取る文
    書画像入力部と、読み取った文書画像を表示する表示部
    と、前記文書画像から文字を認識する文字認識部と、該
    文字認識部で用いられる文字認識辞書と、少なくとも認
    識された各文字画像の位置・大きさ及び候補文字を記憶
    する認識結果記憶部と、前記候補文字を表示するための
    文字フォントを決定する文字フォント計算部と、文字フ
    ォントが格納されている文字フォント格納部を有し、前
    記表示部は前記候補文字の1つと前記文字画像の大きさ
    から前記フォント計算部で決定した文字フォントを前記
    文字フォント格納部から取り出し前記文字画像の位置に
    前記文書画像に重ねて表示することを特徴とする文字認
    識装置。
  3. 【請求項3】 さらに、前記表示部は、文書画像上に重
    ねて表示された認識結果に対して指示を受けたとき、指
    示された文字に対応する前記候補文字を一覧表示すると
    ともに、その1つが選択されたとき該選択された候補文
    字に基づき表示を修正することを特徴とする請求項1ま
    たは2に記載の文字認識装置。
JP7228266A 1995-09-05 1995-09-05 文字認識装置 Pending JPH0973515A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7228266A JPH0973515A (ja) 1995-09-05 1995-09-05 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7228266A JPH0973515A (ja) 1995-09-05 1995-09-05 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0973515A true JPH0973515A (ja) 1997-03-18

Family

ID=16873786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7228266A Pending JPH0973515A (ja) 1995-09-05 1995-09-05 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0973515A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034284A (ja) * 2009-07-31 2011-02-17 Casio Computer Co Ltd 文字読取装置、その制御方法及びプログラム
JP2013130997A (ja) * 2011-12-21 2013-07-04 Kyocera Document Solutions Inc 画像形成装置
JP2014078203A (ja) * 2012-10-12 2014-05-01 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034284A (ja) * 2009-07-31 2011-02-17 Casio Computer Co Ltd 文字読取装置、その制御方法及びプログラム
JP2013130997A (ja) * 2011-12-21 2013-07-04 Kyocera Document Solutions Inc 画像形成装置
JP2014078203A (ja) * 2012-10-12 2014-05-01 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Similar Documents

Publication Publication Date Title
JP4050055B2 (ja) 手書き文字一括変換装置、手書き文字一括変換方法およびプログラム
JP2001101164A (ja) 文書画像処理装置及び文書画像処理方法
JP3029824B1 (ja) 手書き文字処理装置、手書き文字処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0973515A (ja) 文字認識装置
US6456739B1 (en) Apparatus for recognizing characters and a method therefor
JP2584782B2 (ja) 画像処理方式
JP4441966B2 (ja) 手書き文字入力装置及びそれを実現するためのプログラムを記録した記録媒体
JPH0728801A (ja) イメージデータ処理方法及びその装置
JPH06131111A (ja) 文字認識装置及び文字認識方法
JP3015066B2 (ja) 文書処理装置
JP2808553B2 (ja) 画像処理装置
JPH103516A (ja) 情報処理方法及び装置
JP3074795B2 (ja) マルチウィンドウにおける文字入力方式
JP2657091B2 (ja) 文書作成装置
JPS6152778A (ja) 画像編集装置
JPH0236482A (ja) 情報記録装置
JP3000625B2 (ja) 外字編集装置
JP3213047B2 (ja) 認識対象領域設定方式
JP3763864B2 (ja) ポインティングデバイスによるカーソルの移動方法
JPH0470958A (ja) 文書処理装置
JPH096763A (ja) 文書作成装置
JPH08137987A (ja) 光学式文字読取装置
JPH07121654A (ja) 文字認識表示装置
JP2839886B2 (ja) 文書処理方法
JPH0236481A (ja) データ表示装置