JP2002230480A - 文字認識装置および文字認識結果修正方法 - Google Patents

文字認識装置および文字認識結果修正方法

Info

Publication number
JP2002230480A
JP2002230480A JP2001022164A JP2001022164A JP2002230480A JP 2002230480 A JP2002230480 A JP 2002230480A JP 2001022164 A JP2001022164 A JP 2001022164A JP 2001022164 A JP2001022164 A JP 2001022164A JP 2002230480 A JP2002230480 A JP 2002230480A
Authority
JP
Japan
Prior art keywords
image
character
character string
correction
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001022164A
Other languages
English (en)
Inventor
Katsumi Kato
克己 加藤
Yoshiaki Kurosawa
由明 黒沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001022164A priority Critical patent/JP2002230480A/ja
Publication of JP2002230480A publication Critical patent/JP2002230480A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】本発明は、入力画像中から抽出された文字列画
像と当該画像に対応する文字認識結果を表示した画像と
を文字を単位に対応付けて隣接配置した訂正用画面を生
成することによって、認識結果と認識対象とを文字単位
で容易に認識でき、これにより容易かつ迅速に文字認識
結果の修正作業を行うことができる文字認識装置および
文字認識結果修正方法を提供することを課題とする。 【解決手段】文字認識結果/画像合成部105は、文字
列抽出部102より得られる入力画像のイメージと、文
字認識部103より得られる文字認識結果に従う文字認
識結果のイメージとを文字を単位に対応付けて隣接配置
した訂正用画面を生成し、修正用画像として修正用画像
表示部106上に操作可能に表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識結果の修
正機能を備えた文字認識装置および文字認識結果修正方
法に関する。
【0002】
【従来の技術】文字認識結果の修正のための修正画面を
作成する技術として、特開平2000−105796号
公報(文字読み取りシステムおよび同システムにおける
読み取り結果訂正処理方法)が存在する。
【0003】この技術は、エラー発生した文字位置が属
するフィールドを検出し、そのフィールドのイメージを
帳票全体のイメージ情報から切り出して、訂正すべきフ
ィールドの文字読み取り結果とそのフィールドのイメー
ジから構成されるエラー訂正用画面を作成している。し
かしながら、この技術は、原画像と認識結果を文字を単
位に揃える技術を何ら有しておらず、従って認識対象文
字の不鮮明、汚れ(ノイズ)等により、文字の切り出し
位置を誤って認識処理した場合等に於いて、原画像と認
識結果の適正な対応がとれなくなってしまうという問題
があった。
【0004】また、この種の訂正画面を作成する他の類
似技術として、特開平4−34651号公報、特開平4
−34671号公報、特開平6−60136号公報等に
示される技術が存在するが、これらのいずれの技術に於
いても、オペレータが目視により文字認識結果を修正す
る際に、上記同様の問題が生じ、訂正作業の際の画面が
見づらく、操作が面倒で複雑であるという問題があっ
た。
【0005】
【発明が解決しようとする課題】上述したように、文字
認識結果の修正のための修正画面の作成する従来の技術
に於いては、原画像と認識結果を文字を単位に揃える技
術を何ら有していないことから、認識対象文字の不鮮
明、汚れ(ノイズ)等により、文字の切り出し位置を誤
って認識処理した場合等に於いて、原画像と認識結果の
対応がとれなくなってしまうという問題があった。
【0006】本発明は上記実情に鑑みなされたもので、
文字認識結果の修正にかかる時間と労力を大幅に軽減し
て、容易かつ迅速に文字認識結果の修正作業を行うこと
のできる文字認識装置および文字認識結果修正方法を提
供することを目的とする。
【0007】
【課題を解決するための手段】本発明は、入力画像中か
ら抽出された文字列画像と当該画像に対応する文字認識
結果を表示した画像とを文字を単位に隣接して配置した
訂正用画面を生成することを特徴とする。これにより、
認識結果と認識対象とを文字単位で容易に認識でき、こ
れにより容易かつ迅速に文字認識結果の修正作業を行う
ことができる。
【0008】即ち本発明に係る文字認識装置は、入力さ
れた画像中から認識すべき文字列画像を抽出する文字列
抽出手段と、上記文字列抽出手段で抽出された文字列画
像から当該文字列の各文字を認識する文字認識手段と、
上記文字認識手段より得られた文字の認識結果を表示す
る画像と上記文字列抽出手段により抽出された文字列画
像とを文字を単位に対応付けて合成する画像合成手段と
を有して、上記入力された画像から抽出された文字列画
像と当該画像に対応する文字認識結果を表示する画像と
を文字を単位に対応付けて隣接配置した修正用画像を作
成し出力することを特徴とする。
【0009】また本発明に係る文字認識装置は、入力さ
れた画像中から認識すべき文字列画像を抽出する文字列
抽出手段と、上記文字列抽出手段で抽出された文字列画
像から当該文字列の各文字を認識する文字認識手段と、
上記文字列画像の表示順を決定する表示順序決定手段
と、上記文字認識手段より得られた文字の認識結果を表
示する画像と上記文字列抽出手段により抽出された文字
列画像とを文字を単位に対応付けて合成する画像合成手
段と、上記入力された画像から抽出された文字列画像と
当該画像に対応する文字認識結果を表示する画像とを文
字を単位に対応付けて隣接配置した文字列単位の合成画
像を上記表示順序決定手段で決定した表示順序に従って
配置した合成画像を生成し出力する修正用画像の出力手
段とを具備してなることを特徴とする。
【0010】また本発明は上記文字認識装置に於いて、
原画像である文字列画像中の文字位置に合わせて認識結
果の画像を表示する表示形態にて修正用画像を表示する
手段、若しくは認識結果の画像の表示位置及びサイズに
合わせて文字列画像を分割表示する表示形態にて修正用
画像を表示する手段、若しくは原画像である文字列画像
中の文字位置に合わせて認識結果の画像を表示する表示
形態と認識結果の画像の表示位置及びサイズに合わせて
文字列画像を分割表示する表示形態のいずれかを任意に
選択して表示する手段を有してなることを特徴とする。
【0011】また本発明は上記文字認識装置に於いて、
上記入力画像中から抽出された文字列画像を修正用画像
のサイズ内に収まるように分割し、当該分割された各文
字列画像について、その文字認識結果の表示画像を隣接
配置して修正用画像を作成する処理手段、上記入力画像
中に異なるサイズの文字列画像が存在する際に、当該文
字列画像を、最も多い文字サイズ、若しくは操作指定に
従うサイズに統一して修正用画像を生成する処理手段、
上記文字認識結果の画像を表示する表示位置及びサイズ
に合わせて文字列画像を配置し、更に文字列画像の原画
像を並べて配置して上記各画像を同一画面上に同時に表
示する表示制御手段、上記文字認識結果の画像を表示す
る表示位置及びサイズに合わせて文字列画像を分割配置
し表示している際に、上記文字列画像の原画像を別のウ
ィンドウ上に同時に表示する表示制御手段、原画像であ
る文字列画像中の文字位置に合わせて認識結果の画像を
表示する表示形態と、認識結果の画像の表示位置及びサ
イズに合わせて文字列画像を分割表示する表示形態とを
切り替えて表示する表示制御手段の少なくともいずれか
若しくは全ての手段をを有してなることを特徴とする。
【0012】また本発明は、文字認識結果の修正方法に
於いて、入力された画像中から認識すべき文字列画像を
抽出し、当該抽出された文字列画像から当該文字列の各
文字を認識して、上記抽出された文字列画像と上記認識
結果を表示する画像とを文字を単位に対応付けて隣接配
置した修正用画像を作成し表示して、当該修正用画像を
用い認識結果の文字修正を行うことを特徴とする。
【0013】また上記文字認識結果の修正方法に於い
て、修正用画像として、原画像である文字列画像中の文
字位置に合わせて認識結果の画像を表示する表示形態
と、認識結果の画像の表示位置及びサイズに合わせて原
画像である文字列画像を分割表示する表示形態とを任意
に選択して作成し表示できることを特徴とする。
【0014】また本発明は、修正用画像を作成する機能
を実現させるためのプログラムであって、文字認識対象
となる入力画像より抽出した文字列画像と、当該文字列
の文字認識された結果を表示する画像とを、文字を単位
に対応付けて隣接配置した修正用画像を作成する機能を
実現させたプログラムを特徴とする。
【0015】また本発明は、修正用画像を作成する機能
を実現させるためのプログラムであって、文字認識対象
となる入力画像より抽出した文字列画像と、当該文字列
の文字認識された結果を表示する画像とを、文字を単位
に対応付けて隣接配置した修正用画像を作成する機能
と、上記作成した修正用画像を操作内容が反映される表
示画面上に表示する機能とを実現させたプログラムを特
徴とする。
【0016】上記したように、入力画像中から抽出され
た文字列画像と当該画像に対応する文字認識結果を表示
した画像とを文字を単位に隣接して配置した訂正用画面
を生成し、この訂正用画面を用いて認識結果の修正を行
うことにより、認識結果と認識対象とを文字単位で容易
に認識でき、これにより容易かつ迅速に文字認識結果の
修正作業を行うことができる。
【0017】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。
【0018】図1は本発明の実施形態に於ける文字認識
装置のシステム構成例を示すブロック図である。
【0019】本発明の実施形態に於ける文字認識装置
は、図1に示すように、文書画像100を読み取る画像
入力部101と、この画像入力部101で入力された画
像中から認識すべき文字列画像を抽出する文字列抽出部
102と、この文字列抽出部102で抽出された文字列
画像から文字を認識する文字認識部103と、上記文字
列画像の表示順を決定する表示順序決定部104と、上
記文字認識部103より得られた文字認識結果につい
て、その結果を表示する画像と上記文字列画像とを文字
を単位に対応付けて合成し修正用画像を生成する文字認
識結果/画像合成部105と、この文字認識結果/画像
合成部105で生成された修正用画像を表示するための
修正用画像表示部106と、この修正用画像表示部10
6に表示された修正用画像上で認識結果の確認及び修正
作業を行う修正作業操作部107と、上記修正用画像ま
たは当該修正用画像をもとに修正した修正済みの文書画
像109等を印刷し出力する修正結果出力部108とを
有して構成される。
【0020】上記図1に於いて、上記文字認識結果/画
像合成部105は、上記文字認識部103より得られた
文字認識結果を表示する画像と上記文字列画像とを文字
を単位に対応付けて合成し修正用画像を生成する。この
修正用画像は修正用画像表示部106に表示され、この
表示された修正用画像上でオペレータが修正作業操作部
107を操作して認識結果の確認並びに修正作業を行
う。この際、文字認識結果/画像合成部105は、入力
画像中から抽出された文字列画像と、当該画像に対応す
る文字認識結果を表示した画像とを、文字を単位に対応
付けて隣接配置し、更に、これらの組を上記表示順序決
定部104で決定された表示順序に従い複数並べて配置
することによって合成画像を生成する。また、上記修正
用画像の作成時に於いては、入力画像中から抽出された
文字列画像を必要に応じて修正用画像のサイズ内に収ま
るように分割し、そのそれぞれの分割された文字列画像
について、その文字認識結果の表示画像を文字を単位に
対応付けて隣接配置することによって修正用画像が作成
される。また、修正用画像表示部106に表示された修
正用画像、オペレータの操作により修正が加えられた修
正用画像等は、オペレータの確認並びに修正作業のため
に校正用画像として任意に印刷出力される。
【0021】ここで、本発明の実施形態に於ける動作の
具体例について図2乃至図10を参照して説明する。
【0022】図2は上記実施形態に於ける装置の処理手
順を示すフローチャートである。図3乃至図10はそれ
ぞれ上記実施形態に於ける動作説明図であり、このう
ち、図3は上記画像入力部101より入力される文書画
像100の例を示す図、図4は図3に示す文書画像から
文字列抽出部102により文字列を検出した例を示す
図、図5は文字列抽出部102、文字認識部103、表
示順序決定部104の処理結果をもとに文字認識結果/
画像合成部105で処理された文字認識結果と文字列画
像の合成イメージ例を示す図、図6は上記文字認識結果
/画像合成部105で作成され、修正用画像表示部10
6に表示されたた修正用画像の表示例を示す図、図7乃
至図10はそれぞれ修正用画像に於ける表示並びに修正
対象例を示す図である。
【0023】画像入力部101から入力された例えば図
3に示す文書画像100は、文字列抽出部102により
レイアウト解析され、さらに文字を単位に所定のサイズ
毎に文字列抽出される(図2ステップ1,2)。この際
の文字列の抽出例を図4に示している。この文字列抽出
部102で抽出された文字列画像は文字認識部103に
より文字認識される(図2ステップ3)。更に表示順序
決定部104に於いて、上記文字認識部103で文字認
識された結果や予め与えられた情報等により、認識修正
に供する修正用画像内に於ける文字列の表示順序が決定
される(図2ステップ4)。
【0024】この際の表示順序は、例えば、画像中の上
から順に行を取り出してもよいし、左から順であっても
よいし、また、予め与えられたフォーマットと抽出され
た文字列の配置との対応付けを行なって、そのフォーマ
ット情報に附属する表示順に従ってもよいし、また、文
書画像理解の研究分野で良く知られているレイアウト解
析の技術により得られる文字列の読み取り順に従っても
よい。
【0025】この表示順序決定部104より得られる表
示順の情報と、文字認識部103より得られる文字認識
結果及び入力画像は、文字認識結果/画像合成部105
に入力され、文字認識結果として得られる文字コードか
ら作成した文字イメージと入力画像の一部が合成され
て、図5及び図6に示すような修正用画像が作成される
(図2ステップ5)。この修正用画像は修正用画像表示
部106上に表示される。この修正用画像表示部106
上に表示された修正用画像について、オペレータが修正
作業操作部107を操作して、文字認識結果が修正さ
れ、その修正結果が修正結果出力部108を介して出力
される(図2ステップ6,7)。
【0026】ここでは、1枚のドキュメントを順々に処
理してゆくフローを説明したが、複数枚のドキュメント
を一括して処理するようにしてもよい。即ち、複数のド
キュメントを一括してスキャンして複数のドキュメント
の画像を蓄積し、これに対して一括して文字認識を行な
うようにし、また、校正用シートの印刷も一括して行な
うようにする。校正の手順に於いても同様に、一括して
校正済みのシートをスキャナで取り込み、修正も一括し
て行なうようにできる。複数のドキュメントを一括して
処理する場合には、複数のドキュメントから文字認識結
果と文字画像を集めてきて1枚の校正用シートを作成す
ることもできる。また、修正作業の際も複数の校正用シ
ートから修正用のデータを作成して、これらを一括して
画面に表示して修正することもできる。
【0027】次に、図4乃至図10に示す認識画像と入
力イメージ画像の表示形態の特徴について説明する。
【0028】図4は上記図3に示す文書画像から所定の
サイズをもって文字を単位に文字列を検出した例を示し
ている。図中、L1,L2,…L5はそれぞれ文字行を
表す矩形であり、C1,C2,…は文字行に含まれた切
り出し対象となる文字である。
【0029】文字認識部103は、この検出された文字
行L1,L2,…のイメージから、更に1文字1文字を
切り出し(図4のC1,C2,…参照)、文字認識を行
なうことにより、文字認識結果を得る。この文字認識処
理の結果は文字認識結果/画像合成部105に送られ
る。
【0030】文字認識結果/画像合成部105は文字認
識部103より送られた文字認識結果として得られた文
字コードから、該当する文字フォントイメージを用い
て、文字認識結果イメージを作成する。一方、入力され
た画像から検出された文字行は、その行のイメージとし
て取り出され、上記の文字認識結果イメージと組み合わ
されて合成される。このイメージ例を図5に示してい
る。図5に於いて、51,52,…55は入力画像の文
字行イメージであり、61,62,…65は文字認識結
果イメージである。ここでは入力画像の文字行イメージ
51,52,…55と、文字認識結果イメージ61,6
2,…65とが、上下に文字単位で対応をとって隣合わ
せで表示するように出力される。
【0031】この文字認識結果/画像合成部105で合
成し作成された図5に示すイメージは、修正用画像とし
て修正用画像表示部106にて表示される。この際の表
示例を図6に示している。尚、ここでは一部に、認識対
象文字の汚れ(ノイズ)等により、文字の切り出し位置
を誤って認識処理した文字が含まれている。
【0032】この際の修正用画像に於ける文字配置は、
入力画像の文字行イメージ中に於ける各文字位置やサイ
ズは文字認識時の文字切り出し時に分かっているので、
その位置情報に基づいて文字認識結果イメージ中の文字
フォントイメージは、対応する入力画像の文字行イメー
ジ中の対応する文字のサイズや文字位置に対応させて配
置するように制御される。この対応付けは、ユーザが目
視検査する時に見易くするためである。
【0033】例えば、入力イメージ中の文字イメージの
方が、文字認識結果を表示する文字フォントイメージよ
りも小さい場合には、入力イメージ中の文字や部分文字
列を切り出して、これらを、表示される文字フォントイ
メージの配置に合わせてそれぞれを離して配置するよう
に構成してもよい。
【0034】入力画像中に異なるサイズの文字列画像が
存在する場合に於いては、文字列画像を最も多い文字サ
イズ、またはユーザが指定するサイズに統一して修正用
画像を生成することにより、見易い画面を作成すること
ができる。
【0035】また、認識の確信度、類似度の低いもの
(相違度であれば大きいもの)や、大小文字の可能性の
高いもの(すなわち、文字の大きさが他よりも大きかっ
たり、小さかったりするもの)や、前後との関係が不自
然なもの、熟語や人名として不適当な漢字が連続する部
分などを検出して、文字イメージの配置及び又は大きさ
を変えるようにしてもよい。
【0036】このように組み合わされた各行に対応する
イメージは、文字を単位に上下(縦)方向に並べられ、
全体の校正用イメージとして合成される。第6図はその
例を示している。
【0037】ここでの、入力画像の文字行イメージと文
字認識結果イメージの配置制御に於いて、文字認識結果
イメージのフォントの大きさを入力画像中の文字の表示
時の大きさとは、視認する時に明確に分かる程度に大き
さを異ならせてもよい。また、同様に、画像の文字行イ
メージと文字認識結果イメージの表示色を変えたり、背
景色を変えたり、濃度を変えて、視認性を良くするよう
にしてもよい。
【0038】入力画像の文字行イメージや文字認識結果
イメージが、校正用シートの印刷紙面、または表示画面
等に比べて大きい場合は、行を文字の切れ目で分割し
て、それぞれを1つの行として校正用イメージの中に組
み込むようにしてもよい。
【0039】次に、文書画像中から抽出した文字列の原
画像と、認識結果として得られた文字情報とを組み合わ
せて修正用イメージを生成する手法について述べる。
【0040】原画像中の文字イメージに合わせて、認識
結果から生成した文字イメージを並べて表示する場合、
原画像で用いられた文字フォントが、等幅フォントでな
い場合、文字幅の小さい画像は大きい画像の1/4以下
になることもあり、原画像に対応する位置に認識結果の
文字イメージを表示すると重なってしまい、認識結果が
オペレータに判別不能になってしまう。
【0041】また、文字認識の過程で原画像の文字の切
り出し位置を誤判定した場合、一つの文字が複数に分割
されることもあり、その場合も、同様に判別不能になっ
てしまう。
【0042】この例を図7に示している。図7に於い
て、71は原画像をそのまま表示した部分、72は認識
結果から生成した文字イメージ、73は文字切り出しを
失敗した誤判定部分であり、1文字が3文字として認識
されてしまったため、認識結果が読み取り難くなってい
る。
【0043】その対策として、文字幅に応じて生成する
文字イメージを縮小表示する方法も考えられるが、原画
像に極端に細い文字が存在する場合、切り出し位置の誤
判定が生じた場合には、小さ過ぎて見難くなってしま
う。
【0044】そこで、本発明では、原画像中の各文字画
像のサイズと、認識結果から生成する文字イメージのサ
イズを比較し、より大きい方を採用して、両者の表示位
置を決定することとする。これにより、原画像の文字サ
イズが不揃いであったり、文字の切り出し誤判定が生じ
た場合でも、原画像の文字画像と認識結果と見易く表示
することができる。この例を図8に示す。
【0045】しかしながら、文字認識に於いて、文字の
切り出しに失敗し、1文字を複数文字として判定してし
まった場合、上記した手法に於いては、図8に示すよう
に、原画像の文字がバラバラに分割されて表示されてし
まうため、オペレータが誤字として修正しようとして
も、原画像の正解が分からなくなってしまう虞がある。
尚、図8に於いて、81は原画像を認識結果の文字イメ
ージに合わせて表示した部分、82は認識結果から生成
した文字イメージ、83は文字切り出しを失敗した誤判
定部分であり、1文字「図」が3つ(3文字)に分断さ
れたために誤認識した状態を示す。
【0046】そこで本発明では、必要に応じて原画像の
表示を工夫して確認できるようにしている。その実現例
を図9、及び図10を参照して説明する。
【0047】図9は、文字認識結果の画像を表示する表
示位置及びサイズに合わせて文字列画像を配置し、更に
文字列画像の原画像をそのまま並べて配置して上記各画
像を同一画面上に同時に表示する例を示している。図9
に於いて、91は原画像をそのまま表示した部分、92
は認識結果表示に合わせて分割された原画像、93は認
識結果から生成した文字イメージ、94は文字切り出し
を失敗した誤判定部分である。
【0048】ここで、上記した原画像92と文字イメー
ジ93のみの表示であれば、上記図8に示した表示状態
と同様であり、文字切り出しの失敗部分(誤判定部分)
94の正しい文字をオペレータが判断することは難し
い。しかし、原画像を分割しない状態の画像91を同時
に表示することによって、誤判定部分の正解文字が
「図」であることをオペレータに示すことができる。
【0049】このような原画像表示を常時、画面上に表
示すると、一画面に表示可能な内容が減り、作業効率が
悪くなる。従って、常時表示する必要はなく、文字の切
り出しに失敗した部分と思われる箇所をオペレータが発
見したときに、必要に応じて行なわれる操作入力に応じ
て表示するようにしてもよい。その例の一部を図10
(a),(b)に示している。
【0050】図10(a)は、対応する行の画像全体
を、図10(b)は、切り出しミスとしてオペレータが
指定した範囲に対応した部分のみの画像を別ウィンドウ
にして表示した例である。図10(a)は、対応する行
全体の原画像を別ウィンドウ201に表示した例であ
り、図10(b)は、選択範囲202に対応した部分の
原画像のみを別ウィンドウ203に表示した例である。
この例では、分割表示した原画像202を選択範囲とし
て指定しているが、認識結果イメージ204に対して範
囲指定可能にしてもよい。
【0051】これらの表示機能により、認識結果を確認
し易く、なおかつ必要に応じて原画像表示を行なうこと
により、正しい文字をオペレータが容易に確認すること
ができる。
【0052】尚、上記した実施形態では、認識対象を文
字に限って説明したが、本発明は文字以外にも、図形、
画像など他の対象にも適用でき、認識対象を文字に限定
することなく種々のものに適用できる。また、装置の構
成、表示の形態等も上記した実施形態に限定されるもの
ではなく、本発明の要旨を逸脱しない範囲で種々変形し
て適用可能である。
【0053】
【発明の効果】以上詳記したように本発明によれば、文
字認識結果の修正にかかる時間と労力を大幅に軽減し
て、容易かつ迅速に文字認識結果の修正作業を行うこと
ができる。
【図面の簡単な説明】
【図1】本発明の実施形態に於ける文字認識装置のシス
テム構成例を示すブロック図。
【図2】上記実施形態に於ける装置の処理手順を示すフ
ローチャート。
【図3】上記実施形態に於いて画像入力部より入力され
る文書画像の例を示す図。
【図4】上記実施形態に於いて上記図3に示す文書画像
から文字列抽出部により文字列を検出した例を示す図。
【図5】上記実施形態に於いて文字認識結果/画像合成
部で処理された文字認識結果と文字列画像の合成イメー
ジ例を示す図。
【図6】上記実施形態に於いて修正用画像表示部に表示
された修正用画像の表示例を示す図。
【図7】上記実施形態の修正用画像に於ける表示並びに
修正対象例を示す図。
【図8】上記実施形態の修正用画像に於ける表示並びに
修正対象例を示す図。
【図9】上記実施形態の修正用画像に於ける表示並びに
修正対象例を示す図。
【図10】上記実施形態の修正用画像に於ける表示並び
に修正対象例を示す図。
【符号の説明】
100…文書画像 101…画像入力部 102…文字列抽出部 103…文字認識部 104…表示順序決定部 105…文字認識結果/画像合成部 106…修正用画像表示部 107…修正作業操作部 108…修正結果表示出力部 109…修正済みの文書画像(印刷出力画像)

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 入力された画像中から認識すべき文字列
    画像を抽出する文字列抽出手段と、 前記文字列抽出手段で抽出された文字列画像から当該文
    字列の各文字を認識する文字認識手段と、 前記文字認識手段より得られた文字の認識結果を表示す
    る画像と前記文字列抽出手段により抽出された文字列画
    像とを文字を単位に対応付けて合成する画像合成手段と
    を有して、 前記入力された画像から抽出された文字列画像と当該画
    像に対応する文字認識結果を表示する画像とを文字を単
    位に対応付けて隣接配置した修正用画像を作成し出力す
    ることを特徴とする文字認識装置。
  2. 【請求項2】 入力された画像中から認識すべき文字列
    画像を抽出する文字列抽出手段と、 前記文字列抽出手段で抽出された文字列画像から当該文
    字列の各文字を認識する文字認識手段と、 前記文字列画像の表示順を決定する表示順序決定手段
    と、 前記文字認識手段より得られた文字の認識結果を表示す
    る画像と前記文字列抽出手段により抽出された文字列画
    像とを文字を単位に対応付けて合成する画像合成手段
    と、 前記入力された画像から抽出された文字列画像と当該画
    像に対応する文字認識結果を表示する画像とを文字を単
    位に対応付けて隣接配置した文字列単位の合成画像を前
    記表示順序決定手段で決定した表示順序に従って配置し
    た合成画像を生成し出力する修正用画像の出力手段とを
    具備してなることを特徴とする文字認識装置。
  3. 【請求項3】 前記入力画像中から抽出された文字列画
    像を修正用画像のサイズ内に収まるように分割し、当該
    分割された各文字列画像について、その文字認識結果の
    表示画像を隣接配置して修正用画像を作成する処理手段
    を有してなる請求項1または2記載の文字認識装置。
  4. 【請求項4】 前記入力画像中に異なるサイズの文字列
    画像が存在する際に、当該文字列画像を、最も多い文字
    サイズ、若しくは操作指定に従うサイズに統一して修正
    用画像を生成する処理手段を有してなる請求項1または
    2記載の文字認識装置。
  5. 【請求項5】 前記修正用画像を表示画面上に操作可能
    に表示する表示手段及び操作手段と、前記原画像である
    文字列画像中の文字位置に合わせて認識結果の画像を表
    示する表示制御手段を有してなる請求項3記載の文字認
    識装置。
  6. 【請求項6】 前記修正用画像を表示画面上に操作可能
    に表示する表示手段及び操作手段と、前記文字認識結果
    の画像の表示位置及びサイズに合わせて原画像である文
    字列画像を表示する表示制御手段を有してなる請求項3
    または4記載の文字認識装置。
  7. 【請求項7】 前記修正用画像を表示画面上に操作可能
    に表示する表示手段及び操作手段と、前記文字認識結果
    の画像を表示する表示位置及びサイズに合わせて文字列
    画像を分割配置し、更に文字列画像の原画像を並べて配
    置して前記各画像を同一画面上に同時に表示する表示制
    御手段を有してなる請求項3記載の文字認識装置。
  8. 【請求項8】 前記修正用画像を表示画面上に操作可能
    に表示する表示手段及び操作手段と、前記操作手段の操
    作指示に従い、前記文字認識結果の画像を表示する表示
    位置及びサイズに合わせて文字列画像を分割配置し表示
    している際に、前記文字列画像の原画像を別のウィンド
    ウ上に同時に表示する表示制御手段を有してなる請求項
    3記載の文字認識装置。
  9. 【請求項9】 前記修正用画像を表示画面上に操作可能
    に表示する表示手段及び操作手段と、前記操作手段の操
    作指示に従い、原画像である文字列画像中の文字位置に
    合わせて認識結果の画像を表示する表示形態と、認識結
    果の画像の表示位置及びサイズに合わせて文字列画像を
    分割表示する表示形態とを切り替えて表示する表示制御
    手段を有してなる請求項3記載の文字認識装置。
  10. 【請求項10】 前記操作手段により修正範囲を指定す
    る手段と、当該手段で修正範囲が指定されたとき、当該
    指定された修正範囲に従う原画像を前記別のウィンドウ
    上に表示する請求項8記載の文字認識装置。
  11. 【請求項11】 前記別のウィンドウ上に表示した原画
    像の文字数と、前記認識結果の文字数が合致しない際
    に、前記操作手段で指定した範囲の原画像の文字数に合
    わせて再度文字認識処理を行う処理手段を有してなる請
    求項10記載の文字認識装置。
  12. 【請求項12】 前記操作手段により、前記別のウィン
    ドウ上に表示した原画像の文字の切り出し位置を指定し
    た際に、再度文字認識処理を実行する処理手段を有して
    なる請求項10記載の文字認識装置。
  13. 【請求項13】 前記原画像中の実際の文字行方向に拘
    わらず、前記文字列画像を前記原画像中の最も多い行数
    の行方向、若しくは操作指示方向に従い配置して、当該
    配置に沿い前記文字認識結果の画像を対応させて表示さ
    せることを特徴とする請求項1または2記載の文字認識
    装置。
  14. 【請求項14】 入力された画像中から認識すべき文字
    列画像を抽出し、当該抽出された文字列画像から当該文
    字列の各文字を認識して、前記抽出された文字列画像と
    前記認識結果を表示する画像とを文字を単位に対応付け
    て隣接配置した修正用画像を作成し表示して、当該修正
    用画像を用い認識結果の文字修正を行うことを特徴とす
    る文字認識結果修正方法。
  15. 【請求項15】 前記修正用画像は、原画像である文字
    列画像中の文字位置に合わせて認識結果の画像を表示す
    る表示形態と、認識結果の画像の表示位置及びサイズに
    合わせて原画像である文字列画像を表示する表示形態と
    を任意に選択して作成し表示できる請求項14記載の文
    字認識結果修正方法。
  16. 【請求項16】 文字認識対象となる入力画像より抽出
    した文字列画像と、当該文字列の文字認識された結果を
    表示する画像とを、文字を単位に対応付けて隣接配置し
    た修正用画像を作成する機能を実現させるためのプログ
    ラム。
  17. 【請求項17】 文字認識対象となる入力画像より抽出
    した文字列画像と、当該文字列の文字認識された結果を
    表示する画像とを、文字を単位に対応付けて隣接配置し
    た修正用画像を作成する機能と、前記作成した修正用画
    像を操作内容が反映される表示画面上に表示する機能と
    を実現させるためのプログラム。
JP2001022164A 2001-01-30 2001-01-30 文字認識装置および文字認識結果修正方法 Pending JP2002230480A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001022164A JP2002230480A (ja) 2001-01-30 2001-01-30 文字認識装置および文字認識結果修正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001022164A JP2002230480A (ja) 2001-01-30 2001-01-30 文字認識装置および文字認識結果修正方法

Publications (1)

Publication Number Publication Date
JP2002230480A true JP2002230480A (ja) 2002-08-16

Family

ID=18887611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001022164A Pending JP2002230480A (ja) 2001-01-30 2001-01-30 文字認識装置および文字認識結果修正方法

Country Status (1)

Country Link
JP (1) JP2002230480A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198355A (ja) * 2009-02-25 2010-09-09 Canon Inc 画像処理装置及び画像処理方法
JP2011090578A (ja) * 2009-10-23 2011-05-06 Canon Inc 画像処理装置、画像処理方法及びプログラム
JP2014146091A (ja) * 2013-01-28 2014-08-14 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2017151786A (ja) * 2016-02-25 2017-08-31 富士ゼロックス株式会社 翻訳プログラム及び情報処理装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010198355A (ja) * 2009-02-25 2010-09-09 Canon Inc 画像処理装置及び画像処理方法
JP2011090578A (ja) * 2009-10-23 2011-05-06 Canon Inc 画像処理装置、画像処理方法及びプログラム
JP2014146091A (ja) * 2013-01-28 2014-08-14 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2017151786A (ja) * 2016-02-25 2017-08-31 富士ゼロックス株式会社 翻訳プログラム及び情報処理装置

Similar Documents

Publication Publication Date Title
US4914709A (en) Method for identifying unrecognizable characters in optical character recognition machines
US4974260A (en) Apparatus for identifying and correcting unrecognizable characters in optical character recognition machines
US20100329555A1 (en) Systems and methods for displaying scanned images with overlaid text
US20100172590A1 (en) Combined Image and Text Document
JP2005073015A (ja) 画像処理装置及び画像処理方法及びコンピュータプログラム
US20010055423A1 (en) Image processing device and program product
WO2001003416A1 (fr) Dispositif et procede d'elimination de bordure, et dispositif de creation
US7444036B2 (en) Device, method, and recording medium for processing a document having document data and a set of related data
KR20080055710A (ko) 정보 처리 장치 및 정보 처리 장치의 제어 방법
JP2002230480A (ja) 文字認識装置および文字認識結果修正方法
WO2002003240A1 (en) Proofreading system of chinese characters by means of one-to-one comparison
JP4682663B2 (ja) ドキュメント処理装置
JP2001052110A (ja) 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置
US20090097699A1 (en) Information processing apparatus and method, computer program and computer-readable recording medium
JP2020052480A (ja) 情報処理装置及びプログラム
JP2002133367A (ja) 文字認識装置
JP2007043449A (ja) 検版システムおよび検版方法
JP2856752B2 (ja) 文字認識結果修正方法
JP2003085477A (ja) 文字認識装置および文字認識結果の訂正方法
JP4194301B2 (ja) 文字認識システムおよび文字認識プログラム
JPH117493A (ja) 文字認識処理装置
EP0428713A1 (en) Method and apparatus for identifying unrecognizable characters in optical character recognition machines
JP3221969B2 (ja) 文字認識装置
JPH11224259A (ja) 画像処理装置、画像処理方法および記憶媒体
JPH07160814A (ja) 光学式文字認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080108