JPH0668299A - 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置 - Google Patents

読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置

Info

Publication number
JPH0668299A
JPH0668299A JP4242629A JP24262992A JPH0668299A JP H0668299 A JPH0668299 A JP H0668299A JP 4242629 A JP4242629 A JP 4242629A JP 24262992 A JP24262992 A JP 24262992A JP H0668299 A JPH0668299 A JP H0668299A
Authority
JP
Japan
Prior art keywords
character
data
image data
reading
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4242629A
Other languages
English (en)
Inventor
Hirotoshi Ise
広敏 伊勢
Masao Michino
正雄 道野
Masatoshi Kurata
正敏 倉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4242629A priority Critical patent/JPH0668299A/ja
Publication of JPH0668299A publication Critical patent/JPH0668299A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】帳票をOCRで読み取る際の帳票の見出し定義
作業に要する時間を短縮するとともに、読み取り結果修
正作業を簡単化することを目的とする。 【構成】帳票読み取り処理30−1で非ドロップアウト
画像とドロップアウト画像を同時に入力し、読み取りパ
ラメータ22−1を利用してドロップアウト画像から文
字が記入された文字領域画像を切り出し、文字認識して
文字データ(読み取り結果)22−3に変換する。ま
た、読み取りパラメータ22−1を利用して文字データ
を表示する位置を算出し、合成表示処理31−3により
非ドロップアウト画像データ上に文字データを重畳して
表示し、読み取り結果の修正処理31−4を行い修正後
文字データ30−2を出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、帳票画像の読み取り結
果表示方法、読み取り結果修正方法、およびデータ読み
取り装置に関する。
【0002】
【従来の技術】ワークステーションやパーソナルコンピ
ュータ等に接続されるOCR(光学文字読み取り装置)
は、帳票の可変項目フィールド(手書きなどで書込むフ
ィールド。以後、単に「フィールド」と呼ぶ。)に追記
された部分を文字認識するための装置である。
【0003】OCRを利用して帳票を読み取る場合、通
常、完全に正確な文字認識がなされた読み取り結果が得
られるとは限らず、読み取り不可能な文字などが発生す
る。したがって、正しい読み取り結果を得るためには、
読み取り結果を画面表示あるいはプリンタ出力し、確認
および修正する作業が必要である。
【0004】このような確認および修正のために読み取
り結果を表示する際には、読み取り結果が帳票画像のど
のフィールドに対応するものであるかを判別することが
できるように表示する必要がある。そのためには、フィ
ールドの画面表示位置、およびフィールドに対応した固
定項目フィールド(以後、「見出し」と呼ぶ)の画面表
示位置を定義する必要がある。すなわち、確認および修
正用の画面上のどこに見出しを表示し、どこにその見出
しに対応する読み取り結果を表示するか、それらの表示
位置などを定義する必要がある。
【0005】見出しを生成する方法としては、見出しを
キーボードから入力する方法がある(例えば、日立製作
所製のワークステーション2050(商品名)上で動作
する「フォーマットゼネレータ」(商品名)など)。こ
れは、OCRで読み取る帳票の原紙を計測、参照しなが
ら、キーボードからコードデータを入力して、見出しや
その見出しの位置、フィールドの位置などを入力し読み
取りパラメータを生成する方法である。
【0006】また、上記の様に定義した読み取りパラメ
ータにより読み取り結果修正画面を作成し、OCRで読
み取った結果を表示し修正する方法としては、「読み取
り制御ライブラリ」を利用した電子修正がある。
【0007】
【発明が解決しようとする課題】上述のフォーマットゼ
ネレータを利用して見出しを定義する場合、オペレータ
は、まず、フィールドを定義し、定義したフィールドに
識別子を付加し、付加された識別子に対応するように見
出しをキーボード入力していた。このため、損害保険帳
票などフィールド数が数百に及ぶ帳票を定義する場合に
は、見出しの定義のために半日程度の作業時間を要して
いた。また、読み取り結果修正時には、文字画像領域の
画像が正しく文字認識されているかを確認するために、
認識した文字データに対応した帳票画像上の文字画像領
域(参照フィールド)を読み込んでおき、表示する必要
がある。このため、フォーマットゼネレータを使用し
て、帳票画像のどの位置を参照フィールドにするかを定
義する作業が発生する。
【0008】また、読み取り制御ライブラリを利用し
て、読み取り結果を表示した場合には読み取りパラメー
タにより設計した電子修正画面上に、各フィールドの読
み取り結果などが表示される。電子修正画面は、実際の
帳票と比較して、フィールドの形状、大きさ、およびレ
イアウトが異なるため、読み取り対象の相対位置を把握
しにくいという問題がある。
【0009】本発明の目的は、上述の従来例における問
題点に鑑み、帳票の見出し定義作業に要する時間を短縮
するとともに、読み取り結果修正作業を簡単化すること
にある。
【0010】
【課題を解決するための手段】上記目的を達成するため
に、本発明に係る読み取り結果表示方法あるいはデータ
読み取り装置では、プレプリント部分を有し所定の文字
領域に文字が記入された帳票を読み取った画像データか
ら、前記文字領域の部分を切り出し、切り出した前記文
字領域の画像データを文字認識して文字データに変換
し、前記文字データを表示する位置を算出し、前記帳票
を読み取った画像データ上の前記算出位置に前記文字デ
ータを重畳して、前記画像データと文字データとを表示
するようにしている。
【0011】文字領域部分の切り出しは、前記帳票の読
み取り対象となる文字領域の位置を指定する読み取り情
報を利用して行なうようにするとよい。読み取り情報
(いわゆる読み取りパラメータ)は、あらかじめ用意し
ておく。文字領域の画像データから文字認識して得た文
字データは、対応する文字領域の表示位置の近傍に表示
されるように表示位置を定めるようにするとよい。
【0012】また、本発明に係る読み取り結果表示方法
は、プレプリント部分を有し所定の文字領域に文字が記
入された帳票を読み取った画像データから、前記文字領
域に関する位置情報を検出する文字領域検出ステップ
と、前記位置情報を用いて、前記画像データから前記文
字領域の部分を切り出す切り出しステップと、切り出し
た前記文字領域の画像データを文字認識して文字データ
に変換する変換ステップと、前記位置情報を用いて、前
記文字データを表示する位置を算出する算出ステップ
と、前記帳票を読み取った画像データ上の前記算出位置
に前記文字データを重畳して、前記画像データと文字デ
ータとを表示する表示ステップとを備えたことを特徴と
する。これにより、読み取り情報を用意しておかなくと
もよい。
【0013】さらに表示する際は、前記画像データ上
に、前記切り出しステップで切り出した前記文字領域部
分の画像データを貼付けて表示すれば、ガイド文字など
のノイズ無しに文字領域部分が表示される。
【0014】画像データは、前記帳票上に存在するすべ
ての文字および図形を非ドロップアウトで読み取る機
能、およびドロップアウトカラーで印刷されたプレプリ
ント部分をドロップアウトし前記帳票に記入された文字
のみを読み取る機能を有するスキャナを用いて得るよう
にすれば、文字領域の検出や切り出しは容易である。
【0015】画像データと文字データの表示は、前記帳
票を読み取った画像データ上に所定の表示領域(その下
側の画像データは見えなくなる)を設け、該表示領域の
上に前記文字データを表示するようにしてもよいし、前
記帳票を読み取った画像データ上に直接前記文字データ
を重畳し、その文字データの文字部分以外は前記画像デ
ータを透過表示する(文字の下側の画像データも見え
る)ようにしてもよい。文字データの表示位置を算出し
たときに、画像データとの重なり具合をチェックし、重
ならない場合は表示領域を設け、重なる場合は表示領域
を設けないようにしてもよい。
【0016】さらに、前記画像データから文字枠を抽出
し、抽出した文字枠の位置情報を利用して、予め定義さ
れた前記読み取り情報に含まれる文字枠の位置情報との
ずれを算出することにより、読み取った帳票の歪を補正
するようにしてもよい。これにより、帳票の印刷のずれ
やスキャナでの読み込み時のずれなどを補正できる。
【0017】文字データの表示は、画像データとは異な
る状態で行なうとよい。例えば、表示色や文字サイズを
変えたり、反転表示するなどである。また、前記文字領
域の画像データを文字認識した結果の類似度に応じて、
その文字データの表示状態を変更して表示するようにし
てもよい。
【0018】帳票上の所定の領域にインデクスを記載し
ておき、その領域を切り出して文字認識し、得られた文
字データをインデクスとして画像データをファイルに格
納するようにしてもよい。
【0019】また、上述したような読み取り結果表示方
法で読み取り結果を表示した後、該読み取り結果を修正
できるようにすれば便宜である。
【0020】
【作用】本発明によれば、読み込んだ帳票の画像を表示
し、それに重畳して文字データ(認識結果)を表示して
おり、その表示位置は自動的に算出される。したがっ
て、オペレータは、読み取りパラメータを定義する場合
に、見出しおよび参照フィールドに関するパラメータを
設定しなくてもよい。また、帳票読み取り時には、1回
の走査でドロップアウト画像および非ドロップアウト画
像を同時に取り込むことができるスキャナを用いれば、
両画像間に位置ずれは発生しない。読み取り結果は、原
帳票上に文字認識した文字データ(読み取り結果)を重
畳して表示しているため、読み取り対象と読み取り結果
の比較が容易になる。
【0021】
【実施例】以下、図面を参照して、本発明の実施例を詳
細に説明する。
【0022】(実施例1)図1は、本発明の一実施例に
係る読み取り結果表示修正方式を適用したシステムのブ
ロック構成図である。
【0023】図において、1はコードデータを入力する
キーボード、2はコードデータおよび画像データを表示
するディスプレイ、3はディスプレイ2に表示するデー
タを格納するビットマップメモリ、4はディスプレイ2
を制御するためのディスプレイコントローラである。5
は画像データと文字データを1回の走査で取り込むこと
ができるOCR付スキャナ、6はスキャナ5を制御する
ためのスキャナコントローラである。7は画像データや
文字データ等を格納するファイル、8はファイル7を制
御するファイルコントローラである。9はシステム全体
を制御するCPUである。
【0024】また、10はメモリであり、ROM10−
1とRAM10−2からなる。ROM10−1には、帳
票読み取りプログラム10−11、バッチ修正プログラ
ム10−12、および読み取りパラメータ定義プログラ
ム10−13が格納されている。RAM10−2には、
画像データ格納領域10−21、文字データ格納領域1
0−22、および読み取りパラメータ格納領域10−2
3が設けられている。
【0025】図2に、図1のOCR付スキャナ5の機能
を示す。この実施例で用いたOCR付スキャナ5は、読
み取り対象である帳票をドロップアウトせずに読み込む
スキャナ機能と、帳票のプレプリント部分をドロップア
ウトし追記された文字データの部分だけを読み込んで文
字認識するOCR機能とを有するスキャナである。この
スキャナによれば、1回の走査で画像データと文字デー
タとを取り込むことができるため、文字データと画像デ
ータとの間に位置ずれが発生しない。また、画像データ
を管理するインデクス情報として文字データを利用する
ことにより、文字データと画像データとを対応付けてフ
ァイルなどに格納することも可能となる。
【0026】図2において、帳票20−1を入力する
と、非ドロップアウト画像データ20−2とドロップア
ウト画像データ20−3とがスキャナ5に取り込まれ
る。非ドロップアウト画像データ20−2は、帳票20
−1に印刷された文字および図形と、その帳票に鉛筆等
で追記した文字および図形をすべて読み込んだものであ
る。一方、ドロップアウト画像データ20−3は、帳票
20−1にドロップアウトカラーで印刷された文字およ
び図形はドロップアウトし、鉛筆等で追記した文字およ
び図形のみを読み込んだものである。
【0027】なお、上述したように非ドロップアウト画
像データおよびドロップアウト画像データを1回の走査
で同時に取り込む方法としては、例えば、帳票のプレプ
リント部分を所定の色の印刷インクで印刷しておき、帳
票を読み取るときには、その印刷インクと同色のフィル
タをかけたセンサ、およびフィルタ無のセンサにより、
同時に帳票をスキャンすればよい。
【0028】非ドロップアウト画像データ20−2は、
画像データ22−2としてメモリ10あるいはファイル
7に格納される。また、ドロップアウト画像データ20
−3は、OCR機能21−2により、文字データ22−
3に変換される。22−1は、OCR機能を動作させる
ために必要な、読み取り位置や読み取り方法を指定する
読み取りパラメータを示す。
【0029】図3(a)に、読み取りパラメータとして
持つべき項目の一例を示す。図3(b)は、各項目が実
際の帳票上のどこを定義しているかを示す。図3(a)
において、1つのフィールドの関する読み取りパラメー
タは、フィルードID40−1、フィールド名称40−
2、フィールド種別40−3、行位置(CP)40−
4、フィールド開始位置(SP)40−5、フィールド
終了位置(EP)40−6、文字枠幅(FW)40−
7、文字枠高さ(FH)40−8、文字枠ピッチ(F
G)40−9、文字数(CN)40−10、および文字
種別40−11等で構成される。
【0030】フィールドID40−1は各フィールドを
識別するためのID(識別子)であり、フィールド名称
40−2は各フィールドの名称である。フィールド種別
40−3は、各フィールドの種別、すなわち参照フィー
ルド、文字フィールド、あるいはイメージフィールドな
どの区別を示す。
【0031】また、図3(b)に示すように、行位置
(CP)40−4は帳票左上を原点とした行の垂直位置
座標、フィールド開始位置(SP)40−5はフィール
ド開始位置の帳票左端からの座標、フィールド終了位置
(EP)40−6はフィールド終了位置の帳票左端から
の座標、文字枠幅(FW)40−7は1つの手書き文字
枠(手書きで1文字書き込む枠)の幅、文字枠高さ(F
H)40−8は1つの手書き文字枠の高さ、文字枠ピッ
チ(FG)40−9は手書き文字枠間のギャップ、文字
数(CN)40−10はフィールド内の文字数である。
【0032】文字種別40−11は、そのフィールドに
書込まれる文字の種別、すなわち漢字か数字かなどの区
別を示す。上記の読み取りパラメータのうち、40−4
〜40−10は表示位置算出に利用するパラメータであ
る。表示位置算出とは、読み取った画像データ上に文字
データ(所定のフィールドを文字認識した認識結果)を
重ねて表示する際に、その文字データの表示する位置を
算出する処理である。表示位置算出の処理については後
述する。
【0033】上述したような読み取りパラメータは、読
み取る帳票の種類ごとにファイル7に格納されている。
ある帳票を処理する際には、その帳票に対応する読み取
りパラメータファイルが読み取りパラメータ格納領域1
0−23に読出され、その読み取りパラメータにしたが
って読み取り処理が行なわれる。
【0034】図4に、本実施例の読み取り結果表示修正
方式におけるデータの流れを示す。図において、帳票読
み取り処理31−1では、読み取りパラメータ22−1
を利用して、OCR付スキャナ5で帳票30−1を読み
取る。これにより、画像データ22−2、および文字デ
ータ22−3が取り込まれる。文字表示位置算出処理3
1−2では、読み取りパラメータ22−1を利用して、
画像データ22−2上に文字データ22−3を重畳して
表示する際の文字データ22−3の表示位置を算出す
る。
【0035】合成表示処理31−3では、表示位置算出
処理31−2により算出した画像データ22−2上の位
置に、文字データ22−3を重畳して表示する。修正処
理31−4では、画像データを参照して、表示された文
字データを(ユーザが)修正し、修正後文字データ30
−2を出力する。
【0036】図5は、本実施例のシステムにおける読み
取り結果修正の処理フローチャートを示す。まず、ステ
ップ200で、ユーザは、帳票読み取り、バッチ読み取
り、またはバッチ修正のいずれかの機能を選択する。帳
票読み取り、またはバッチ読み取りが選択された場合に
はステップ202以降の処理を実行し、バッチ修正が選
択された場合にはステップ208でバッチ修正処理を実
行する。
【0037】ステップ202では、選択された処理がバ
ッチ読み取りかどうか判定し、バッチ読み取り処理であ
れば、ステップ204で読み取りデータファイルを作成
(アロケート)する。バッチ読み取り処理でないときは
ステップ206に進み、帳票読み取り処理を実行する。
ステップ206あるいはステップ208の後は、ステッ
プ210に進む。ステップ210では、ユーザからの処
理終了指示があるか否か判定する。処理の終了でなけれ
ばステップ200に戻り、処理終了の指示があれば処理
を終了する。
【0038】なお、上述した「帳票読み取り」とは、帳
票をスキャナ5で1枚読み取り、修正画面を表示して確
認・修正を行ない、その後その帳票を排出する、という
一連の処理を行なう機能である。帳票読み取りは、異な
る種類の帳票を1枚1枚処理していくときに用いる。こ
れに対し、「バッチ読み取り」は同種類の複数枚の帳票
をまとめて読み取り、読み取ったデータはすべて読み取
りデータファイルに格納する機能である。「バッチ修
正」は、読み取りデータファイルに格納された読み取り
データを1帳票単位で読出して表示し修正を行なう機能
である。
【0039】図6は、帳票読み取り処理(図5のステッ
プ206)の詳細なフローチャートを示す。帳票読み取
り処理では、まず、ステップ2060で読み取りパラメ
ータファイルを指定し、その読み取りパラメータファイ
ルから読み取りパラメータをを読出して読み取りパラメ
ータ格納領域10−23に格納する。読み取りパラメー
タファイルの指定は、ユーザが行なう。次に、ステップ
2062で表示位置テーブルを作成するか否か判別す
る。作成する場合は、ステップ2064に進み、読み取
りパラメータを用いて表示位置を算出し、表示位置テー
ブルを生成する。その後、ステップ2066に進む。ス
テップ2062で表示位置テーブルを作成しない場合
は、ステップ2066に進む。
【0040】ステップ2064の表示位置の算出とは、
読み取った画像データ上に文字データ(読み取りパラメ
ータで指定されたフィールドを文字認識した認識結果)
を重ねて表示する際に、その文字データの表示する位置
を算出する処理である。表示位置算出の処理について
は、図7等を参照して、後述する。
【0041】なお、ステップ2062の判別は、読み取
りパラメータが変更されたかどうかに基づいて行なう。
すなわち、パラメータ格納領域10−23に格納されて
いる読み取りパラメータが変更されていないなら、同種
類の帳票を処理するということであるから、前に用いた
表示位置データを用いればよく、ステップ2064の表
示位置算出は行なう必要がない。一方、パラメータ格納
領域10−23に格納されている読み取りパラメータが
変更されたなら、ステップ2064の表示位置算出を行
なって新たに表示位置を求める必要がある。
【0042】次に、ステップ2066では帳票を蓄積し
たホッパが空かどうかチェックする。空のときはステッ
プ2082に進み、空でないときはステップ2068に
進む。
【0043】ステップ2068では、OCR付スキャナ
5により、帳票を画像データおよび文字データとして読
み取る。読み取った帳票は、傾きや位置ずれなどを補正
する。補正方法としては、帳票画像の縁を検出し、傾き
や形状の歪を算出し、各座標における補正量を計算する
方法や、画像データ(非ドロップアウト画像)から文字
枠を検出し、検出した文字枠の位置と予め読み取りパラ
メータで定義された文字枠の位置とのずれを算出するこ
とにより、各文字枠ごとに補正量を計算する方法などを
用いる。
【0044】ステップ2068の後、ステップ2070
で1帳票分を読み取ったかどうか判別し、未だ1帳票分
の読み取りが終了していないときはステップ2068に
戻り、データ読み取りを続行する。1帳票分の読み取り
が終了したら、ステップ2072に進む。
【0045】ステップ2072では、バッチ読み取り処
理であるかどうか判別する。バッチ読み取り処理のとき
は、ステップ2080で読み取りデータを読み取りデー
タファイルに格納し、ステップ2078に進む。バッチ
読み取り処理でない場合には、ステップ2074でデー
タ表示処理を実行し、ステップ2076でデータ修正処
理を実行し、ステップ2078に進む。データ表示処理
では、読み取った帳票について画像データに文字データ
を重畳して表示する処理を行なう。データ表示処理につ
いては、図10を参照して後述する。データ修正処理で
は、表示した文字データを修正する処理を行なう。デー
タ修正処理については、図14を参照して後述する。
【0046】ステップ2078では帳票を排出し、再び
ステップ2066に戻る。なお、1帳票分のデータ読み
取りが終了した時点で帳票を排出し、排出後、データ表
示およびデータ修正を実行してもよい。ステップ206
6でホッパが空のときは、ステップ2082で読み取り
が終了したかどうか判別し、終了しているならリターン
する。読み取りが終了しない場合は、ホッパに帳票を蓄
積し、ステップ2066に戻って、処理を繰り返す。
【0047】次に、図7を参照して、表示位置算出処理
について詳しく説明する。図7は、表示位置算出処理
(図6のステップ2064)の詳細フローチャートであ
る。図において、ステップ2500〜2510は、読み
取り結果である文字データを表示する領域である結果表
示領域を生成する処理である。
【0048】まず、ステップ2500では、行位置(C
P)、文字枠高さ(FH)、読み取り結果表示に使用す
る文字サイズ(文字枠高さ)を利用して、読み取り結果
表示領域の垂直開始位置(図8(a)のx1S)を算出
する。算出式は表示領域垂直開始位置x1S=CP−F
H/2−文字サイズ−a1−a2である。ここで、図8
(a)に示すように、a1は読み取り対象領域41から
読み取り結果表示領域42までのオフセット値、a2は
読み取り結果表示領域42の高さのオフセット値(a2
=α+β)である。読み取り対象領域41がOCR機能
で文字認識する領域である。文字認識の結果の文字デー
タは、結果表示領域42上に設けられた文字枠43に表
示される。
【0049】次に、ステップ2502では、読み取り結
果表示領域42の垂直終了位置(図8(a)のx1E)
を算出する。算出式は 表示領域垂直終了位置x1E=CP−FH/2−a1 である。また、ステップ2504では、フィールド開始
位置(SP)を読み取り結果表示領域42の水平開始位
置とし、ステップ2506ではフィールド終了位置(E
P)を水平終了位置とする。
【0050】次に、ステップ2508では、算出した位
置に置かれる読み取り結果表示領域42が、他の読み取
り結果表示領域や読み取り対象領域などと重ならないか
否かをチェックする。重ならない場合には、ステップ2
510で読み取り結果表示領域を確定し、ステップ25
12に進む。重なる場合は、確定せずにステップ251
2に進む。
【0051】次に、ステップ2512〜2526では、
各文字データを表示する文字枠の位置を算出する処理を
行なう。まず、ステップ2512では、文字数カウンタ
iを1に初期化する。ステップ2514では、行位置
(CP)、文字枠高さ(FH)、読み取り結果表示に利
用する文字サイズを利用して、1つの文字枠の垂直位置
を算出する。算出式は、 垂直位置=CP−FH/2−文字サイズ/2−b である。ここで、図8(b)に示すように、bは読み取
り対象領域41から文字データを表示する文字枠43ま
でのオフセット値である。
【0052】次に、ステップ2516では、フィールド
水平開始位置(SP)、文字枠幅(FW)、文字枠ピッ
チ(FG)を利用して、1つの文字枠43の水平位置を
算出する。算出式は、 水平位置=SP+FW/2+(FW+FG)・(i−
1) である。図8(b)から、この水平位置は帳票(画像と
して表示された帳票)の左端から各文字データを表示す
る文字枠43の中心(水平方向の中心)までの距離であ
ることが分かる。
【0053】次に、ステップ2518では、算出した文
字データを表示する文字枠43の水平および垂直位置を
表示位置テーブルに格納する。
【0054】図9(a)に、表示位置テーブルの構成を
示す。表示位置テーブルは、フィールドに存在する文字
データごとに、表示する水平位置45−2、および垂直
位置45−3を管理するテーブルである。各フィールド
との対応付けはフィールドID45−1により行う。例
えば、図9(a)では、フィールドIDが「L」のフィ
ールドから読み取って文字認識した結果の文字データ
は、第1文字目の文字が垂直位置「30」かつ水平位置
「25」の位置に、第2文字目の文字が垂直位置「3
0」かつ水平位置「35」の位置に、…というように、
各文字データの表示位置が記憶される。
【0055】再び図7に戻って、ステップ2520で
は、文字数カウンタiを1だけ増加する。そして、ステ
ップ2522では、文字数カウンタiがフィールド内文
字数CNを超えたかどうかチェックする。超えた場合
は、フィールド内のすべての文字について表示する位置
が算出されたということであるから、ステップ2524
に進む。超えていない場合は、ステップ2516〜25
22の処理を繰り返す。
【0056】ステップ2524では、読み取りパラメー
タを次のフィールドのものに更新する。次に、ステップ
2526では、全フィールドに対して、表示位置算出処
理が終了したか否かチェックし、終了していない場合に
は、次のフィールドについて同様にステップ2500〜
2526の処理を繰返し、全フィールドについて終了し
た場合にはリターンする。
【0057】次に、データ表示処理(図6のステップ2
074)について詳しく説明する。図10は、データ表
示処理の詳細なフローチャートを示す。
【0058】データ表示処理では、まず、ステップ30
00で表示位置テーブル(図9(a))の有無をチェッ
クする。表示位置テーブルがある場合は、その表示位置
テーブルを用いればよいから、ステップ3006で表示
位置テーブルを参照して、ステップ3008に進む。表
示位置テーブルがない場合には、ステップ3002で読
み取りパラメータを参照し、ステップ2064で表示位
置を算出する。その後、ステップ3008に進む。上述
したように、表示位置の算出は、読み取りパラメータを
利用して、読み取り結果である文字データを画像データ
上に重畳表示する位置を算出する処理であり、その詳細
については図7を参照して説明した。
【0059】次に、ステップ3008では、表示位置テ
ーブルで規定される各表示位置に表示すべき文字データ
を1文字読み出す。なお、表示位置と文字データとは、
フィールドIDにより対応付けする。次に、ステップ3
010で、文字データにおける第1候補の類似度がしき
い値を超えているかどうか判別する。類似度とは、文字
認識の結果の信頼性を示す値、言い換えれば文字認識す
る対象である画像とそれを文字認識した結果の候補とが
どの程度類似しているかを示す値である。文字データ
は、文字枠ごとに図9(b)に示す構成を有し、文字枠
はフィールドIDごとに管理されている。文字データ4
6は、文字コード46−1と類似度46−2により構成
され、類似度が高い順に順序付けされている。例えば図
9(b)では、あるフィールドの1文字について、第1
候補が「フ」であってその類似度が「95」、第2候補
が「ウ」であってその類似度が「90」、…というよう
になっている。
【0060】図10に戻って、ステップ3010で類似
度がしきい値以上である場合には、ステップ3014に
進み、そうでない場合には、ステップ3012に進む。
【0061】ステップ3012では、文字データを画像
データ上に重畳表示する場合の表示モードを変更する。
表示モードの変更方法としては、文字データの表示色の
変更、反転表示、あるいは文字サイズの大きさの変更等
がある。
【0062】ステップ3014では、読み取り結果表示
領域が確定しているか否か判別する。確定しているとい
うことは、図7の表示位置算出処理のステップ250
8,2510で読み取り結果表示領域が確定していたと
いうことである。すなわち、読み取り結果表示領域は背
景となる画像データの見出しなどとは重ならないという
ことであるから、ステップ3016に進み、読み取り結
果表示領域に文字データを表示する。
【0063】ステップ3014で読み取り結果表示領域
が確定していないということは、図7のステップ250
8で読み取り結果表示領域が背景の画像の有意な表示と
重なっているということである。したがって、文字デー
タが画像データの有意部分に重畳しているということだ
から、ステップ3018では画像データを可視状態で表
示(透過表示)する。すなわち、ステップ3016のよ
うに読み取り結果表示領域を設けてその下側の画像デー
タを見えないようにするのでなく、読み取り結果表示領
域は設けずに、直接、その範囲の画像データに文字デー
タの文字部分のみを合成し、文字の下側の画像データは
透過表示されるようにする。なお、このとき画像データ
と文字データとは、色を違えるなど相異なる状態で表示
する。ステップ3016,3018の後、ステップ30
20に進む。
【0064】ステップ3020では、全文字データの表
示を終了したかどうかチェックする。終了していない場
合にはステップ3008に戻り、次の文字についてステ
ップ3008以降の処理を繰り返す。全文字データの表
示が終了した場合には、リターンする。
【0065】図11は、本実施例のシステムで処理する
OCR帳票48の一例を示す。図13は、図11の帳票
48を本実施例のシステムのスキャナ5で読み取り、図
10の手順にしたがって読み取り結果を表示した電子修
正画面を示す。なお、図12は従来の電子修正画面を示
す。
【0066】図12のような従来の電子修正画面におい
て、読み取り結果表示領域50−1,50−2、および
見出し文字領域50−3などのレイアウトは、ユーザが
設計してキーボード入力する必要があり大変に面倒であ
った。また、見出し文字領域50−3に表示する文字情
報(ガイダンス)もキーボード入力しなければならなか
った。
【0067】一方、図13の本実施例の読み取り結果表
示方式の電子修正画面では、読み取り結果表示領域52
−1,52−4(読み取って文字認識した結果の文字を
表示する領域)の背景に、読み取った画像データ(読み
取りの対象となった領域の画像)そのものを表示してい
る。読み取った画像データは、当然に、図11の読み取
り対象の帳票のイメージである。
【0068】図13では、読み取り結果表示領域52−
1,52−4は、画像データ上の読み取り対象領域52
−2,52−5や、見出し文字領域53−1,53−2
と重ならないように表示されている。読み取り結果表示
領域52−1,52−4の位置の算出は、上述の図7の
表示位置算出によって行なわれる。読み取り結果表示領
域52−1,52−4が他の領域と重なった場合でも、
他の領域と識別可能な状態で読み取り結果を表示するこ
とにより、画像データを利用した電子修正画面を作成で
きる。この実施例では、読み取り結果表示領域52−
1,52−4を設けずに、読み取り結果の文字のみを画
像データに貼付けて、文字以外の部分は透過表示するよ
うにしている。
【0069】このように読み取り対象である帳票の画像
と読み取り結果とを重畳して表示するので、どの文字が
誤認識されたかなどはすぐに確認できる。また、読み取
りパラメータを定義する際、図11のようなガイダンス
を手作業で入力する手間を省くことができる。
【0070】次に、データ修正処理(図6のステップ2
076)について詳しく説明する。図14は、データ修
正処理の詳細なフローチャートを示す。データ修正処理
が実施されるときには、その前にステップ2074でデ
ータ表示処理が実行されており、既に全文字データが画
像データ上に重畳して表示されている。
【0071】データ修正処理では、まず、ステップ31
00でカーソル移動方法を指定する。この指定はユーザ
が行なう。本実施例では、カーソル移動方法として「不
読文字修正」と「電子修正」との2種がある。「不読文
字修正」は、文字データの類似度がしきい値を超えてい
ない文字(不読文字)のみを修正する方法である。「不
読文字修正」のとき、カーソルは不読文字が検出された
位置にしか移動しない。「電子修正」は、表示されてい
る文字データすべてを修正対象とする方法である。「電
子修正」では、表示されているすべての文字にカーソル
をセットすることができる。カーソルの移動は、カーソ
ルキーやマウスなどにより行なう。
【0072】ステップ3102で「不読文字修正」が選
択された場合には、ステップ3114で不読文字を検出
し、ステップ3116で検出した不読文字の位置にカー
ソルを移動する。ステップ3102で「電子修正」が選
択された場合には、ステップ3104でカーソルキーあ
るいはマウス等でカーソルを移動することにより、修正
位置を指定する。ステップ3116,3104の後、ス
テップ3106に進む。
【0073】ステップ3106では、ユーザは候補文字
を表示するかどうか指定する。候補文字を表示しない場
合には、ステップ3110に進む。候補文字を表示する
場合は、ステップ3108で類似度順に候補文字を表示
し、ステップ3110に進む。
【0074】図15に、候補文字表示の画面イメージを
示す。図中でハッチング表示された文字データ56が修
正対象である。この文字データに対応する候補文字が候
補文字表示領域55に表示されている。ここでは、第1
候補55−1として「ワ」、第2候補55−2として
「フ」を表示している。候補文字表示領域55には、1
2個の候補文字が表示可能であるが、候補文字が12を
超える場合には、「前」、「次」を指定することによ
り、前候補あるいは次候補を参照することができる。
【0075】再び図14を参照して、ステップ3110
ではカーソルで指定された位置にある文字データを修正
する。修正方法は、候補文字に正解の文字がある場合に
は、候補文字から選択し、ない場合にはキーボードを利
用してキー入力する。ステップ3112では、全文字デ
ータの修正が終了したかどうか判別し、終了していない
場合には、ステップ3102以降の処理を繰返し、終了
した場合には、リターンする。
【0076】次に、バッチ修正処理(図5のステップ2
08)について詳しく説明する。図16は、バッチ修正
処理の詳細なフローチャートを示す。
【0077】まず、ステップ3200で、バッチ読み取
りにより帳票読み取りデータを格納した読み取りデータ
ファイルを指定する。ここで指定の対象となる読み取り
データファイルは、図5のステップ204で作成し図6
のステップ2080でデータ格納したファイルである。
ステップ3202では、読み取りデータファイル内に読
み取りデータがあるかどうかチェックする。読み取りデ
ータがある場合にはステップ3204以降の処理を実行
し、ない場合にはステップ3214以降の処理を行う。
【0078】ステップ3204では、1帳票分の読み取
りデータを読み込む。ステップ3206で1帳票分の読
み取りデータの読み込みが終了したかどうか判別し、終
了していればステップ3208に進む。終了していない
ときは、ステップ3204に戻って、読み取りデータの
読み込みを続行する。
【0079】ステップ3208では、読み取りデータが
エラーデータであるかどうかチェックする。ここで、エ
ラーデータとは、読み込んだ読み取りデータの文字デー
タの類似度がしきい値を超えていない文字(不読文字)
が1つでもあるとき、その読み取りデータをエラーデー
タとする。逆にいえば、エラーデータでない読み取りデ
ータとは、読み取りデータ中のすべての文字データの類
似度がしきい値を超えており、その読み取りデータは修
正が不要である可能性が高いと考えられるものである。
【0080】ステップ3208でエラーデータであると
きは、ステップ2074でデータ表示を行ない、ステッ
プ2076でデータ修正を行ない、ステップ3210に
進む。データ表示およびデータ修正の処理については、
図10および図14を参照して説明した。ステップ32
08でエラーデータでない場合には、その読み取りデー
タは修正が不要とし、ステップ3202に戻って次の読
み取りデータについて処理を続行する。
【0081】ステップ3210では、再修正作業が必要
かどうかユーザに指定させ、必要ならばステップ207
4に戻る。例えば、不読文字修正で修正を行なったが、
さらに不読文字以外に誤認識された文字があるときなど
は、再修正作業を行なうこととなる。再修正が必要でな
いなら、ステップ3212で修正した文字データ(修正
後データ)を出力し、ステップ3202に戻って、以降
の処理を繰り返す。
【0082】ステップ3202で読み取りデータがない
場合には、ステップ3214でバッチ修正処理を終了す
るかどうかをユーザに指定させる。バッチ処理を終了し
ない場合には、ステップ3200に戻り、次に修正する
読み取りデータファイルを指定させて、ステップ320
2以降の処理を実行する。処理終了が指定された場合に
は、バッチ処理を終了しリターンする。
【0083】なお、本実施例では、読み取り結果表示領
域を確定できない場合だけ、下側の画像データが見える
ように透過表示しているが、全文字データについて透過
表示するようにしてもよい。また、本実施例では、文字
データをすべて同じ文字サイズで表示するようにしてい
るが、修正対象領域を拡大表示するようにしてもよい。
図17は、修正対象領域58を拡大表示するようにした
電子修正画面の例である。図17では、図13の画面に
比べて、修正対象領域58になっている読み取り結果表
示領域が拡大して表示されている。修正対象領域は、例
えばカーソルの移動に応じて、カーソルが存在する読み
取り結果表示領域が修正対象領域となるようにする。こ
れにより、カーソルの移動位置に対応して拡大表示する
領域(修正対象領域)58も移動することとなる。ま
た、読み取り結果表示領域の大きさに対応して文字サイ
ズを変更することも可能である。
【0084】(実施例2)次に、本発明の第2の実施例
を説明する。上述した第1の実施例では、帳票の非ドロ
ップアウト画像の上に読み取り結果を重畳して表示して
いた。ところで、帳票の読み取り対象領域、すなわち手
書きなどで書き込む領域には、例えば0〜9の文字がド
ロップアウトカラーで印刷されているものがある。これ
は、いわゆるガイド文字というものであり、書き込み者
がこれをなぞることによりOCRで認識し易い文字を書
き込めるようにしたものである。このようなガイド文字
が印刷されている帳票に上記第1の実施例を適用した場
合、画像データの読み取り対象領域の部分にガイド文字
すべてが表示され非常に見にくい。そこで、第2の実施
例では、読み取り対象領域の部分は、ドロップアウト画
像データを用いるようにしている。
【0085】図18に、第2の実施例におけるOCR付
スキャナの機能を示す。この実施例で用いたOCR付ス
キャナは、読み取り対象である帳票をドロップアウトし
ないように読み込むスキャナ機能と、帳票のプレプリン
ト部分をドロップアウトし、追記された文字データの部
分だけを読み込みドロップアウト画像データおよび文字
認識した文字データを出力するOCR機能とを有するス
キャナである。このスキャナによれば、1回の走査で、
画像データ(帳票の全範囲の画像)、文字データ、およ
びドロップアウト画像データ(文字認識の対象である文
字部分のみの画像)を取り込むことができるため、文字
データ、画像データ、およびドロップアウト画像データ
との間に位置ずれが発生しない。
【0086】図18において、帳票60−1を入力する
と、非ドロップアウト画像データ60−2とドロップア
ウト画像データ60−3とがスキャナに取り込まれる。
非ドロップアウト画像データ60−2は、帳票60−1
に印刷された文字および図形と、その帳票に鉛筆等で追
記した文字および図形をすべて読み込んだものである。
一方、ドロップアウト画像データ60−3は、帳票60
−1にドロップアウトカラーで印刷された文字および図
形はドロップアウトし、鉛筆等で帳票に追記した文字お
よび図形のみを読み込んだ画像である。
【0087】非ドロップアウト画像データ60−2は、
画像データ62−2としてメモリあるいはファイルに格
納される。また、ドロップアウト画像データ60−3
は、OCR機能61−2により、文字データ62−3に
変換される。また、ドロップアウト画像データ60−3
は、そのままドロップアウト画像データ62−4として
メモリあるいはファイルに格納される。
【0088】OCR付きスキャナにおいて、OCR機能
を動作させるためには、図2に示した場合と同様、帳票
における読み取り位置や読み取り方法を指定するための
読み取りパラメータ62−1が必要である。
【0089】図19に、本実施例の読み取り結果表示修
正方式におけるデータの流れを示す。図において、帳票
読み取り処理71−1では、読み取りパラメータ62−
1を利用して、OCR付スキャナで帳票70−1を読み
取る。これにより、画像データ62−2、文字データ6
2−3、およびドロップアウト画像データ62−4が取
り込まれる。
【0090】文字表示位置算出処理71−2では、読み
取りパラメータ62−1を利用して、画像データ62−
2上に文字データ62−3を重畳して表示する際の文字
データ62−3の表示位置を算出する。表示位置の算出
方法は、図7に示した処理と同様である。読み取り領域
切り出し処理71−3では、読み取りパラメータ62−
1を利用して、ドロップアウト画像データ62−4から
読み取り対象領域を切り出す。
【0091】画像表示位置算出処理71−4は、切り出
した読み取り対象領域を画像データ62−2に重ねる位
置の算出を行う。合成表示処理71−5では、文字表示
位置算出処理71−2により算出した画像データ62−
2上の位置に、文字データ62−3を重畳して表示す
る。また、画像データ62−2上の対応する位置にドロ
ップアウト画像データ62−4を貼り込んで表示する。
修正処理71−6では、ディスプレイ上に表示された画
像データを参照して、文字データ62−3を(ユーザ
が)修正し、修正後文字データ70−2を出力する。
【0092】第2の実施例によれば、読み取り対象領域
についてはドロップアウト画像データを表示しガイド文
字などが表示されないようにしているので、その領域に
追記された書き込みが明確に表示され、ユーザが確認し
易くなる。
【0093】(実施例3)次に、本発明の第3の実施例
を説明する。上述した第1の実施例では、帳票の読み取
り対象領域の位置などを定義するための読み取りパラメ
ータはあらかじめ用意されているものとして説明した。
第3の実施例は、読み取りパラメータを用意せずに、読
み取りおよび修正できる方式である。
【0094】図20に、第3の実施例におけるスキャナ
の機能を示す。この実施例で用いたスキャナは、読み取
り対象である帳票をドロップアウトしないように読み込
むスキャナ機能と、帳票のプレプリント部分をドロップ
アウトし追記された文字データの部分だけを読み込んで
ドロップアウト画像データを出力するスキャナ機能とを
有する。このスキャナによれば、1回の走査で非ドロッ
プアウト画像データとドロップアウト画像データとを取
り込むことができるため、これらの画像データの間に位
置ずれが発生しない。
【0095】図20において、帳票80−1を入力する
と、非ドロップアウト画像データ80−2とドロップア
ウト画像データ80−3とがスキャナ5に取り込まれ
る。非ドロップアウト画像データ80−2は、帳票80
−1に印刷された文字および図形と、その帳票に鉛筆等
で追記した文字および図形をすべて読み込んだものであ
る。一方、ドロップアウト画像データ80−3は、帳票
80−1にドロップアウトカラーで印刷された文字およ
び図形はドロップアウトし、鉛筆等で追記した文字およ
び図形のみを読み込んだ画像である。
【0096】非ドロップアウト画像データ80−2は、
画像データ82−1としてメモリあるいはファイルに格
納される。また、ドロップアウト画像データ80−3
は、そのままドロップアウト画像データ82−2として
メモリあるいはファイルに格納される。ここでは、OC
R機能による文字認識は行わなず、ドロップアウト画像
データだけを入力しているため、図2に示した読み取り
パラメータは不要である。
【0097】図21に、本実施例の読み取り結果表示修
正方式におけるデータの流れを示す。図において、帳票
読み取り処理91−1では、スキャナで帳票90−1を
読み取り、画像データ82−1、およびドロップアウト
画像データ82−2を取り込む。文字領域切り出し処理
91−2では、ドロップアウト画像データ82−2から
鉛筆等で追記された文字および図形を検出し、文字領域
を切り出す。文字認識処理91−3では、切り出した文
字領域に存在する文字を認識し、文字データ90−2に
変換する。ここでは、スキャナが出力したドロップアウ
ト画像に対して、CPUが、文字領域切り出し処理91
−2および文字認識処理91−3を実行する。なお、文
字領域切り出し処理91−2はCPUで実行し、スキャ
ナのOCR機能を利用して、切り出した結果を文字認識
処理することも可能である。
【0098】文字表示位置算出処理91−4では、文字
領域切り出し処理91−2により得られた文字の位置お
よび大きさなどの情報を利用して、文字認識した結果得
られた文字データ90−2を画像データ82−1に重ね
る位置の算出を行う。合成表示処理91−5では、表示
位置算出処理91−4により算出した画像データ上の位
置に、文字データ90−2を重畳して表示する。修正処
理91−6では、ディスプレイ上に表示された画像デー
タを参照して、文字データ90−2を(ユーザが)修正
し、修正後文字データ90−3を出力する。
【0099】
【発明の効果】以上説明したように、本発明によれば、
読み込んだ帳票の画像を表示し、その上に読み取り結果
である文字データを重畳して表示しているので、読み取
り対象と読み取り結果の比較が容易となり、読み取り結
果表示修正作業が簡単になる。また、このような表示画
面は自動的にレイアウトされるので、オペレータは、読
み取りパラメータを定義する場合に、見出しおよび参照
フィールドに関するパラメータを設定しなくてもよく、
帳票の定義作業に要する時間は大幅に短縮される。ま
た、1回の走査でドロップアウト画像および非ドロップ
アウト画像を同時に取り込むことができるスキャナを用
いれば、両画像間に位置ずれは発生しない。
【図面の簡単な説明】
【図1】 本発明の一実施例に係る読み取り結果表示お
よび修正方式を適用したシステムのブロック構成図
【図2】 第1の実施例のOCR付スキャナの機能を示
す図
【図3】 読み取りパラメータの内容および意味を示す
【図4】 読み取り結果修正におけるデータの流れを示
す図
【図5】 読み取り結果修正のフローチャート
【図6】 帳票読み取り処理のフローチャート
【図7】 表示位置算出処理のフローチャート
【図8】 帳票上の各領域の表示位置を説明するための
【図9】 表示位置テーブルおよび文字データを示す図
【図10】 データ表示処理のフローチャート
【図11】 読み取る帳票の一例を示す図
【図12】 従来の電子修正画面を示す図
【図13】 第1の実施例の電子修正画面を示す図
【図14】 データ修正処理のフローチャート
【図15】 候補文字の表示画面例を示す図
【図16】 バッチ修正処理のフローチャート
【図17】 修正対象領域を拡大表示する画面例を示す
【図18】 第2の実施例のOCR付きスキャナの機能
を示す図
【図19】 第2の実施例の読み取り結果修正における
データの流れを示す図
【図20】 第3の実施例のスキャナの機能を示す図
【図21】 第3の実施例の読み取り結果修正における
データの流れを示す図
【符号の説明】
1 キーボード 2 ディスプレイ 3 ビットマップメモリ 4 ディスプレイコントローラ 5 OCR付きスキャナ 6 スキャナコントローラ 7 ファイル 8 ファイルコントローラ 9 CPU 10 メモリ

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】プレプリント部分を有し所定の文字領域に
    文字が記入された帳票を読み取った画像データから、前
    記文字領域の部分を切り出す切り出しステップと、 切り出した前記文字領域の画像データを文字認識して文
    字データに変換する変換ステップと、 前記文字データを表示する位置を算出する算出ステップ
    と、 前記帳票を読み取った画像データ上の前記算出位置に前
    記文字データを重畳して、前記画像データと文字データ
    とを表示する表示ステップとを備えたことを特徴とする
    読み取り結果表示方法。
  2. 【請求項2】前記切り出しステップは、前記帳票の読み
    取り対象となる文字領域の位置を指定する読み取り情報
    を利用して文字領域の部分の切り出しを実行する請求項
    1に記載の読み取り結果表示方法。
  3. 【請求項3】前記算出ステップは、前記読み取り情報を
    利用して前記文字データの表示位置を算出する請求項2
    に記載の読み取り結果表示方法。
  4. 【請求項4】プレプリント部分を有し所定の文字領域に
    文字が記入された帳票を読み取った画像データから、前
    記文字領域に関する位置情報を検出する文字領域検出ス
    テップと、 前記位置情報を用いて、前記画像データから前記文字領
    域の部分を切り出す切り出しステップと、 切り出した前記文字領域の画像データを文字認識して文
    字データに変換する変換ステップと、 前記位置情報を用いて、前記文字データを表示する位置
    を算出する算出ステップと、 前記帳票を読み取った画像データ上の前記算出位置に前
    記文字データを重畳して、前記画像データと文字データ
    とを表示する表示ステップとを備えたことを特徴とする
    読み取り結果表示方法。
  5. 【請求項5】さらに前記表示ステップは、前記画像デー
    タ上に、前記切り出しステップで切り出した前記文字領
    域部分の画像データを貼付けて表示する請求項1ないし
    4に記載の読み取り結果表示方法。
  6. 【請求項6】前記画像データは、前記帳票上に存在する
    すべての文字および図形を非ドロップアウトで読み取る
    機能、およびドロップアウトカラーで印刷されたプレプ
    リント部分をドロップアウトし前記帳票に記入された文
    字のみを読み取る機能を有するスキャナを用いて得たも
    のである請求項1ないし5に記載の読み取り結果表示方
    法。
  7. 【請求項7】前記表示ステップは、前記帳票を読み取っ
    た画像データ上に所定の表示領域を設け、該表示領域の
    上に前記文字データを表示する請求項1ないし6に記載
    の読み取り結果表示方法。
  8. 【請求項8】前記表示ステップは、前記帳票を読み取っ
    た画像データ上に直接前記文字データを重畳し、その文
    字データの文字部分以外は前記画像データを透過表示す
    る請求項1ないし6に記載の読み取り結果表示方法。
  9. 【請求項9】さらに、前記画像データから文字枠を抽出
    し、抽出した文字枠の位置情報を利用して、予め定義さ
    れた前記読み取り情報に含まれる文字枠の位置情報との
    ずれを算出することにより、読み取った帳票の歪を補正
    するステップを備えた請求項2ないし8の読み取り結果
    表示方法。
  10. 【請求項10】前記表示ステップは、前記画像データと
    は異なる状態で前記文字データを表示する請求項1ない
    し9に記載の読み取り結果表示方法。
  11. 【請求項11】前記変換ステップは、前記文字領域の画
    像データを文字認識した文字データの候補とその類似度
    を出力し、前記表示ステップは、前記類似度に応じてそ
    の文字データの表示状態を変更して表示する請求項10
    に記載の読み取り結果表示方法。
  12. 【請求項12】さらに、前記帳票上の所定の文字領域を
    前記切り出しステップで切り出し、切り出した文字領域
    の画像データを前記変換ステップで文字データに変換
    し、得られた文字データをインデクスとして、前記画像
    データをファイルに格納することを特徴とする請求項1
    ないし11に記載の読み取り結果表示方法。
  13. 【請求項13】請求項1ないし12に記載の読み取り結
    果表示方法で読み取り結果を表示した後、該読み取り結
    果を修正するステップを備えたことを特徴とする読み取
    り結果修正方法。
  14. 【請求項14】プレプリント部分を有し所定の文字領域
    に文字が記入された帳票を読み取った画像データから、
    前記文字領域の部分を切り出す切り出し手段と、 切り出した前記文字領域の画像データを文字認識して文
    字データに変換する変換手段と、 前記文字データを表示する位置を算出する算出手段と、 前記帳票を読み取った画像データ上の前記算出位置に前
    記文字データを重畳して、前記画像データと文字データ
    とを表示する表示手段とを備えたことを特徴とするデー
    タ読み取り装置。
  15. 【請求項15】さらに、前記表示手段で表示した前記文
    字データを修正する手段を備えた請求項14に記載のデ
    ータ読み取り装置。
JP4242629A 1992-08-19 1992-08-19 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置 Pending JPH0668299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4242629A JPH0668299A (ja) 1992-08-19 1992-08-19 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4242629A JPH0668299A (ja) 1992-08-19 1992-08-19 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置

Publications (1)

Publication Number Publication Date
JPH0668299A true JPH0668299A (ja) 1994-03-11

Family

ID=17091898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4242629A Pending JPH0668299A (ja) 1992-08-19 1992-08-19 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置

Country Status (1)

Country Link
JP (1) JPH0668299A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004107257A1 (ja) * 2003-05-30 2004-12-09 Fujitsu Limited 帳票処理プログラム、方法及び装置
JP2009069951A (ja) * 2007-09-11 2009-04-02 Hitachi Computer Peripherals Co Ltd 文字認識装置及び文字認識装置における文字認識方法
JP5661214B1 (ja) * 2014-09-02 2015-01-28 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP2020126326A (ja) * 2019-02-01 2020-08-20 株式会社プリマジェスト 帳票に含まれる文字列を認識するための装置、方法、及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004107257A1 (ja) * 2003-05-30 2004-12-09 Fujitsu Limited 帳票処理プログラム、方法及び装置
US7551778B2 (en) 2003-05-30 2009-06-23 Pfu Limited Business form processing program, method, and device
JP2009069951A (ja) * 2007-09-11 2009-04-02 Hitachi Computer Peripherals Co Ltd 文字認識装置及び文字認識装置における文字認識方法
JP5661214B1 (ja) * 2014-09-02 2015-01-28 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP2015185157A (ja) * 2014-09-02 2015-10-22 三菱電機インフォメーションシステムズ株式会社 文字データ修正方法、文字データ修正装置およびプログラム
JP2020126326A (ja) * 2019-02-01 2020-08-20 株式会社プリマジェスト 帳票に含まれる文字列を認識するための装置、方法、及びプログラム

Similar Documents

Publication Publication Date Title
US7926732B2 (en) OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
USRE36581E (en) Character reader and recognizer with a specialized editing function
US5513278A (en) Handwritten character size determination apparatus based on character entry area
JP3113827B2 (ja) 矩形オブジェクトの認識方法及び認識装置
JPH01297770A (ja) 画像ファイリング装置のタイトル情報入力用帳票作成方法及び画像ファイリング方法
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH0668299A (ja) 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置
JP7241506B2 (ja) 光学式文字認識結果の修正支援装置および修正支援用プログラム
JP3319203B2 (ja) 文書ファイリング方法及び装置
JP3732254B2 (ja) フォーマット情報生成方法及びフォーマット情報生成装置
US5471536A (en) Figure digitizing system
JP3153863B2 (ja) フィールドにデータ・オブジェクトをリンクさせる方法及びシステム
JP2790344B2 (ja) 画像生成装置
JPH0728801A (ja) イメージデータ処理方法及びその装置
JP3283894B2 (ja) 表示装置および入力装置
JPH07249098A (ja) 情報処理装置および情報処理方法
JPS61206087A (ja) 文書読取装置
JP3540192B2 (ja) 光学文字読取用紙認識結果の確認修正方法およびその装置
JP2002133367A (ja) 文字認識装置
JPH05303661A (ja) イメージデータ部分取得表示装置
JPH08202818A (ja) フォーマット情報処理装置
JPH0934989A (ja) Ocr用フォーマットパラメータ作成方法
JP3221969B2 (ja) 文字認識装置
JPH07192081A (ja) 手書き文字入力装置
JPH03214350A (ja) 部首検索方法