JP2001126025A - Ocr用フォーマットパラメータ作成方法 - Google Patents

Ocr用フォーマットパラメータ作成方法

Info

Publication number
JP2001126025A
JP2001126025A JP30419799A JP30419799A JP2001126025A JP 2001126025 A JP2001126025 A JP 2001126025A JP 30419799 A JP30419799 A JP 30419799A JP 30419799 A JP30419799 A JP 30419799A JP 2001126025 A JP2001126025 A JP 2001126025A
Authority
JP
Japan
Prior art keywords
image data
image
view
frame
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP30419799A
Other languages
English (en)
Inventor
Kenji Ogasawara
健二 小笠原
Yoshifumi Abe
佳史 阿部
Kumiko Abe
久美子 阿部
Kazuhiro Kushima
和弘 九嶋
Hideharu Hattori
英春 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP30419799A priority Critical patent/JP2001126025A/ja
Publication of JP2001126025A publication Critical patent/JP2001126025A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 データ入力業務にてOCRを活用する場合、
読取を行うためのフォーマットパラメータを作成する
が、その作成作業を初心者でも簡単に作成できるように
した方法の提供。 【解決手段】 スキャナ2から取込んだ画像を表示する
イメージビュー10と読取用のフィールドなどを登録、
表示するレイアウトビュー20の2つを表示し、ユーザ
がイメージビュー10上でフィールドの枠等を指定し、
枠の位置が指定できたらレイアウトビュー20にフィー
ルドの情報を登録することにより、フォーマットの作成
を行うもの。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票の所定の位置
に書き込まれた枠(フィールド)内の文字記号をスキャ
ナにより光学的に読み取る光学文字読取装置(OCR)
用フォーマットパラメータ作成方法に係り、特に予め読
取るフィールドの位置情報など登録するフォーマットパ
ラメータを簡単に精度よく作成することができるOCR
用フォーマットパラメータ作成方法に関する。
【0002】
【従来の技術】一般に光学的文字読取装置は、帳票に記
載された文字記号をスキャナによって光学的に読み取
り、この読み取った文字記号のイメージデータを文字等
のコードデータとして認識する様に構成されている。例
えば銀行業務に使用される光学的文字読取装置は、予め
入力すべき項目を所定の位置に枠(フィールド)として
印刷した帳票を使用し、この帳票の前記枠内に記載され
た文字・記号・数字等(以下、文字等と呼ぶ)をイメー
ジデータとして読み込み、このイメージデータを認識し
て文字コードデータに変換する処理が行われる。
【0003】このOCR業務で扱う帳票は、その種類に
よって文字の書かれている位置が異なるため予め文字の
書かれる位置、取得するイメージデータの位置などをフ
ォーマットパラメータとして作成しておく必要がある。
【0004】従来技術による前記OCR用フォーマット
パラメータの作成方法としては、ユーザが帳票上の記入
用の枠(フィールド)の位置を測定し、その値をデータ
入力することにより行われていた。
【0005】また前記OCR用フォーマットパラメータ
の作成方法として、未記入帳票のイメージをスキャナを
用いて入力し、装置に接続されたパーソナルコンピュー
タを用いて入力したイメージデータを見ながら前記パラ
メータの設定を行うものが提案されている。この従来技
術によるOCR用フォーマットパラメータの作成方法が
記載された文献としては、例えば特開平11−7347
2号公報が挙げられる。
【0006】
【発明が解決しようとする課題】前記ユーザにより枠位
置の値を手入力するフォーマットパラメータ作成方法
は、フィールドの位置を正確に測定できるため精度の良
いフォーマットパラメータを作成することができるもの
の、手作業で行うため時間がかかり作業の負担が大きい
と言う不具合があった。
【0007】また、帳票のイメージを入力してコンピュ
ータ上で帳票のイメージを見ながらパラメータを作成す
る方法は、ユーザが帳票のイメージを見ながら簡単にフ
ォーマットを作成することができるものの、このイメー
ジデータにはスキャナのレンズの歪みなどが含まれ、精
度のいいフォーマットパラメータが作成できないと言う
不具合があった。
【0008】更に当該パラメータ作成方法は、1つの画
面上に帳票のイメージデータを表示し、この一画面内
に、矩形情報として抽出したフィールドの矩形/文字枠
の矩形/フォーマットとして登録したフィールドの矩形
/文字枠の矩形/イメージを取得する領域を表す矩形等
の多数の矩形を色を変えて表示するため、色の種類が多
く、どの色がどの種類の矩形を表すのかユーザには不明
確となり操作が容易に行えないと言う不具合があった。
【0009】本発明の目的は、前記従来技術による不具
合を除去することであり、スキャナから取込んだイメー
ジデータにレンズ等に起因する歪みが含まれている場合
でも実際のフィールド位置に対応したパラメータを容易
に作成することができるOCR用フォーマットパラメー
タ作成方法を提供することである。更に本発明の他の目
的は、パラメータとして登録される前の情報と登録され
ている情報が明確に区別でき作業の状況をユーザーが把
握し易くしたOCR用フォーマットパラメータ作成方法
を提供することである。
【0010】
【課題を解決するための手段】前記目的を達成するため
に本発明は、帳票の所定の位置に書き込まれた枠内の文
字記号をスキャナにより光学的に読み取る光学文字読取
装置用のOCR用フォーマットパラメータ作成方法にお
いて、前記帳票の全面を光学的に走査したイメージデー
タをドット情報として表示するイメージビューと、前記
イメージデータを学習情報を使用して帳票上の実寸法に
対応したミリ単位のレイアウトデータに変換して表示す
るレイアウトビューとを設け、該レイアウトビュー上に
おける帳票上の枠の位置をフォーマットデータとするこ
とを第1の特徴とする。
【0011】また本発明は、前記特徴のOCR用フォー
マットパラメータ作成方法において、予め定められた位
置に複数のマークが記載された基準帳票をスキャナによ
り光学的に読み取り、この読み取ったイメージデータの
複数マークの位置と前記基準帳票記上の複数のマークの
予め定められた位置とを比較し、前記イメージデータを
帳票上の実寸法に対応させたミリ単位のレイアウトデー
タに変換する学習情報を作成することを第2の特徴と
し、更に前記何れかの特徴のフォーマットパラメータ作
成方法において、前記フォーマットデータを用いて前記
イメージビュー上に表示しているイメージデータから読
み取りを行い、該読読み取り結果と読み取りに使用した
領域のイメージデータを併記して表示することを第3の
特徴とする。
【0012】
【発明の実施の形態】以下、本発明によるOCR用フォ
ーマットパラメータ作成方法の一実施形態を図面を参照
して詳細に説明する。図1は、本実施形態によるOCR
用フォーマットパラメータ作成方法が適用される光学的
文字読取装置の構成を示す図、図2はその処理フローを
示す図、図3はスキャナから黒背景上の帳票を読み込ん
だイメージデータの一例を示す図、図4は本実施形態に
よるイメージビューとレイアウトビューの画面を説明す
るための図、図5は、フィールドのパラメータを定義す
るための画面の一例を示す図、図6は本実施形態による
歪み測定用の帳票の一例を示す図である。
【0013】図1に示す光学的文字読取装置は、所定の
位置に書き込み用の枠(フィールドが配置された帳票1
を光学的にスキャンして読み込むためのスキャナまたは
OCR2(以下、スキャナ2と呼ぶ)と、該スキャナ2
から読み込んだドット単位のイメージデータを格納する
イメージビューメモリ4と、該イメージデータを後述す
る手法によりレンズ歪み等を除いた帳票上の実寸法に対
応したミリ単位のレイアウトデータを格納するレイアウ
トビューメモリ5と、前記両メモリ4及び5からのイメ
ージデータから文字等を切り出して認識して文字コード
データに変換する認識部7と、前記イメージ及びレイア
ウトデータを表示するディスプレイ8と、前記イメージ
データ/後述のフォーマットパラメータ/認識した文字
コードその他を記憶する磁気ディスク装置6とから構成
される。前記認識部7は、前記認識処理に加え、本実施
形態においては、イメージデータを表示するイメージビ
ュー4及びフォーマットパラメータ情報を表示するレイ
アウトビュー5及びイメージデータ上の枠を抽出する処
理と、ドットの位置/長さ/幅データをミリの位置/長
さ/幅データに後述の学習情報を使用して変換する処理
も行うものである。また前記メモリ4及び5並びに認識
部7は通常のパーソナルコンピュータの本体により構成
しても良い。
【0014】この様に構成された光学的文字読取装置の
動作を次に図2を参照して説明する。まず、本装置は、
帳票1をスキャナ2を用いて光学的に読み取り(ステッ
プS1)、次いで読み取ったイメージデータを基に帳票
1のサイズの計算を行う(ステップS2)。この計算
は、図3に示す如く、帳票1のイメージの周りに黒背景
の領域がある場合は帳票1の四角隅の点を検出して帳票
のサイズを算出し、黒背景がない場合はイメージのサイ
ズから帳票のサイズを算出することにより行われる。
尚、このとき本装置は、フォーマットを作成する際にフ
ィールドの文字枠が表示されるようにパラメータの設
定、具体的には例えば帳票上に赤色の文字枠やフィール
ド枠がある場合、ドロップアウトカラーに赤以外の色を
設定し、前記文字枠や文字を含んだイメージデータの取
得を行う。また本装置は、文字認識を行うために使用す
るイメージデータを取得する際は、ドロップアウトカラ
ーに赤を指定し枠の情報が取得されないイメージデータ
から文字等の認識を行う。
【0015】次に本装置は、前記イメージデータから帳
票1の四角隅の点座標を基に帳票の傾きを検出し、その
傾きの補正(ステップS3)を行い、このイメージデー
タの背景に黒画像がある場合はそれを削除してイメージ
データ(元データと呼ぶ)をイメージビューメモリ4に
格納し、図4に示す如くイメージビュー10としてディ
スプレイ8の左側に表示する(ステップS4)。尚、前
記ステップS3において、黒背景がないイメージデータ
の場合は、ユーザが表示されたイメージを参照しながら
任意の角度の傾き補正を行っても良い。
【0016】次に本装置は、図5の様に表示しているイ
メージデータ10から矩形(認識を行う文字枠)を抽出
したい領域を、ユーザがマウス等のポインティングデバ
イスで指定した範囲内を指定してフィールド枠及び文字
枠の領域の抽出を行う(ステップS5)。図4の例で
は、符号10a〜10eで示したものがイメージビュー
10に表示された枠等である。ここでユーザーは、枠を
抽出するときに文字と枠の区別を行うため枠の最小高
さ、枠の最小幅を設定することができ、これにより本装
置は、設定された数値より小さい枠として検出されたも
のは文字として扱い、設定しない場合はデフォルトの値
で枠の抽出を行う。
【0017】次にユーザーは、イメージビュー10上に
おいて抽出された枠が読取を行うフィールドの枠として
正しく抽出されているか、枠の位置がずれていないか、
文字枠の大きさはイメージデータとあっているかを確認
した後、フォーマットパラメータとして登録を行い(ス
テップS7)、フォーマットとして登録する必要のない
枠は削除する。本ステップにおける枠が正しく抽出され
ているか否かの確認は、例えば枠内に縦線のノイズが入
り、枠が分断された2つの枠として誤認識されていない
か否か等を目視により確認するものであり、誤認識の場
合はユーザが修正を行う。
【0018】ここで本装置は、前記フォーマットを登録
する際、イメージビュー10に表示したドット/インチ
単位の元データを、レイアウトビュー20にミリ単位で
表示するためのデータに変換を行う。この変換は、イメ
ージビュー10上においてAドット/インチでイメージ
データを表示し、帳票1の左端からXドットの位置を、
レイアウトビュー20上での帳票の左端からの距離をミ
リで表したYミリに変換するため、次式(1)を用いて
元データの変換を行う。
【0019】 Y=X/(A/25.4)・・・(1)式 また、イメージビュー10で表示しているイメージデー
タは、レンズ等の歪みを含んでいるため歪み補正を行
う。このイメージデータに含まれる歪み量は、スキャナ
毎に異なるため、予めどの程度歪みを含んでいるかを測
定しておく必要があり、この測定は図6に示した基準と
なる基準帳票100を用いて行う。
【0020】図6はスキャナのレンズ他に含まれる歪み
を測定するために使用する帳票の一例であり、矩形の黒
マークが帳票100の左端から決められた位置にM1〜
M3まで配置したものであり、例えば帳票100の左端
からマークM1の左端までが100mm、該マークM1
左端から次のマークM2左端までが200mmである。
尚、本実施形態ではレンズ等による歪みが、レンズの横
方向走査により帳票横方向に発生し、帳票縦方向は帳票
送り精度の均一性により発生しないものとして説明する
が、縦方向についても補正を行っても良い。
【0021】本実施形態においては、この帳票100の
イメージデータをスキャナ等により何枚か読み込み、読
み込んだイメージデータ上でのマークM1〜M3の位置
を検出し、検出したマークの位置の平均を算出し、読み
込んだマーク位置と帳票上での実際の位置とを学習情報
として作成しておく。この作成された学習情報の一例を
表1に示す。表1の基準値は実際の帳票上での位置を表
し、学習値はイメージデータから算出したマークの位置
を表す。
【0022】
【表1】
【0023】本例の場合、この表1は、基準値100m
m−200mm−200mmに対し、読み込んだマーク
位置(学習値)が102mm−206mm−210mm
と、2mm、6mm、10mm歪んでいることを表して
おり、基準値より学習値のほうが大きいためイメージビ
ュー10上の距離は実際の距離より長く見えることが判
る。
【0024】この学習値を基に本実施形態によるフォー
マットパラメータ作成方法は、イメージ上での位置が1
50であった時の補正値Pを求める。補正値Pの位置
は、マークM1とM2の間に存在する仮想点である。補
正値Pは、マークM1から補正値Pまでの距離Qとマー
クM1までの基準値100の合計で計算される。Qの値
はM1からM2までの距離の比を利用し求める。式
(2)に距離Qを求める式を示す。
【0025】 Q=200*50/210 ・・・式(2) 本例の場合は、(2)式よりQ≒47.6となり、補正
値Pは距離Qに100を加えた147.6となる。この
補正値Qによる変換によりその枠はドット位置/枠高さ
/幅がミリ単位に変換される。
【0026】次に本装置は、前記補正処理を行い、フォ
ーマットパラメータとしてレイアウトビューに登録され
たフィールド情報で読取位置以外の付随するパラメータ
の変更処理を付属情報として設定し(ステップS8)、
この付属情報に従ってイメージビュー10に表示したイ
メージデータ(元データ)を実際の寸法に即した距離に
変換し、レイアウトビュー20に表示する。このレイア
ウトビュー20は、図4の如く、イメージビュー10に
表示され、ユーザによって選択された枠10a〜10e
の帳票上の位置を実際の寸法に即して変換したものであ
り、例えば枠20a〜20eとして表示する。尚、図4
のレイアウトビュー20中の枠10aは、枠20a内の
文字等を認識するのに用いた枠10aをユーザの確認を
容易にするために近傍に表示されるものである。
【0027】次いで本装置は、レイアウトビュー20に
表示されているフィールド(枠20a〜20e)のエリ
アをマウスなどのポインティングデバイスでダブルクリ
ックすることにより図5に示すようなプロパティページ
を表示し、パラメータの変更を行う。このパラメータ
は、レイアウトビュー20の枠20a〜20e内の文字
等を認識する際のパラメータであり、例えば、手書き又
は活字/文字数/アルファベット等の英数又は漢字等の
文字種等を設定するものである。
【0028】前述のフィールドに関する一通りの設定が
終了した後に本装置は、先に作成したフォーマット情報
を用いて枠内文字等の認識処理を行ってその結果を枠2
0aの如く表示すると共に、この枠20a内の認識結果
の近傍に枠10a内のイメージデータを表示し、ユーザ
による確認が行い(ステップS9)、必要で有れば修正
が行われる。
【0029】尚、該ステップS9における文字認識で使
用するイメージデータは、ドロップアウト処理などを行
い実際に読取業務を行うイメージデータとして取得した
ものを使用することが望ましいが、フォーマットを作成
する時に使用したイメージデータをそのまま使用しても
良い。
【0030】この様に本例では、フィールドの読取を行
うと認識結果をパラメターとして登録した矩形の枠20
a上に表示し、認識に使用したイメージデータをフィー
ルドの下に枠10aとして表示する。尚、イメージビュ
ー10においては、認識に使用したエリアがユーザーに
わかるように色のついた矩形で表示し、正常に認識され
れば作成したフィールドの設定が完了する。また前記ス
テップS9における認識処理が不読又は誤読となった場
合は、図2のステップS6に戻って、正常に認識できる
まで前述の処理が繰り返して行われる(ステップS1
0)。
【0031】前記実施形態においては、ステップS1に
おいて帳票のイメージデータを取得する際、同時に文字
認識を行うためのイメージデータを同時に取得してもよ
いが、後で認識に使用するイメージデータだけ認識を行
う前に取得してもよい。
【0032】この様に本実施形態によるOCR用フォー
マットパラメータ作成方法は、帳票の光学的に走査した
イメージデータをドット情報として表示するイメージビ
ュー10と、該イメージデータ10を学習情報を使用し
て帳票上の実寸法に対応したミリ単位のレイアウトデー
タに変換して表示するレイアウトビュー20とを設け、
該レイアウトビュー20上における帳票上の枠の位置の
フォーマットパラメータを決定し、このパラメータを用
いて文字認識を行うことにより、帳票上の実際の枠位置
に応じた文字認識を容易に行うことができる。
【0033】以上説明した様に本実施形態は、イメージ
データとイメージデータから抽出される矩形情報を表示
する機能を有するイメージビューと、フォーマットとし
て登録したフィールド情報等を帳票と同じようにレイア
ウトして表示するレイアウトビューの2つの画面から成
る事を特徴としている。
【0034】イメージビューでは接続されているスキャ
ナやOCR装置から帳票の画像を取込む、またはイメー
ジファイルを開き表示を行う。通常フォーマットを作成
する時は赤色や緑色の枠が表示されるようにスキャナや
OCRの設定を行いイメージの取得を行う。表示してい
るイメージで枠情報を抽出したい領域を指定し、認識部
にて枠抽出処理を行う。抽出された枠情報をイメージビ
ューに表示する。
【0035】イメージビューに表示された矩形情報の中
でフォーマットに登録したい矩形を選択し読取を行うフ
ィールドとして登録を行う。登録されたフィールドはド
ット上の位置、フィールドの高さ、幅をミリに変換する
処理と学習情報を使用してレンズの歪みを補正する処理
を行いレイアウトビューに表示する。表示されたフィー
ルドに付随する情報で変更が必要な場合はパラメータの
変更を行う。
【0036】一通りの設定が終了したら実際に読取を行
い作成したフォーマットで正常に認識が行われるかを確
認する。イメージビューではフォーマットを作成するた
めに赤色や緑色の枠が表示されるようにイメージを取得
しているが、認識を行う時はそれらの色を表示しないよ
うにドロップアウトしたイメージデータを使用する。イ
メージビューで認識用のイメージデータに切替える、ま
たは再度ドロップアウトした画像を取込む。枠の色が黒
でドロップアウトしない帳票の場合はイメージの切替え
る必要はない。
【0037】認識を行うフィールドを指定し実行する
と、認識結果と認識に使用したイメージデータをレイア
ウトビュー上に表示し、イメージビューでは使用された
イメージデータの領域の色を変えて表示する。ユーザー
は認識が正常に行われればそのフィールドのパラメータ
が正常に作成されたと判断し、次フィールドのパラメー
タの作成を行う。正常に認識されなかった場合、フィー
ルドの位置を調整する、またはパラメータの内容が認識
しようとしているイメージに適しているか見直しを行う
ものである。
【0038】前記実施形態によれば本発明は次の効果が
得られる。 (1)イメージビューとレイアウトビューを同時に表示
することによりパラメータとして登録される前の情報と
登録されている情報がはっきり区別され作業の状況をユ
ーザーが把握しやすい。 (2)スキャナやOCRから取込んだ画像に大きな歪み
が含まれている場合でもレイアウトビューには歪みのな
い帳票のレイアウトを表示するため実際の帳票を意識し
てフォーマットの作成ができる。
【0039】(3)イメージデータを拡大表示してフィ
ールドの位置の微妙な調整を行いつつ、レイアウトビュ
ー上でフォーマット全体を表示できるため1画面上でビ
ューの操作を頻繁に行うことなくパラメータの作成がで
きる。 (4)今までは一通りのフィールド定義を行った後に読
取機能を実行して確認を行っていたため、パラメータの
位置ずれ等にきづかず再度はじめから作り直す場合があ
ったが、フィールドを一個所作成した時点で読取確認が
簡単に行えるため作業の出戻りが発生しなくなる。パラ
メータを作り始めて速い段階でパラメータの誤りに気づ
き、作業の進捗状況が把握しやすい。
【0040】尚、本発明は次に述べる実施形態としても
表すことができる。 <実施形態1> OCRの入力業務にて読取る帳票のフ
ォーマット情報作成方法において、スキャナまたはOC
R装置から取込んだイメージデータやイメージファイル
のデータをドット情報として表示する処理を有するイメ
ージビューと、フォーマット情報として登録したフィー
ルドの情報等をイメージビューで表示しているイメージ
データと1対1に対応させ帳票と同じようにレイアウト
してミリの単位で表示するレイアウトビューから成るO
CR用フォーマットパラメータ作成方法。
【0041】<実施形態2> イメージビュー上で表示
している矩形、線、文字列のイメージ上のドットでの位
置と長さの情報をスキャナの学習情報を使用し、ミリの
位置、長さ情報に変換しレイアウトビューに表示する実
施形態1記載のOCR用フォーマットパラメータ作成方
法。
【0042】<実施形態3> 前記レイアウトビュ
ー上にフォーマットデータとして登録した内容で、前記
イメージビュー上に表示しているイメージデータを使用
し実際に読取を行い、読取結果と読取に使用した領域の
イメージデータを表示する実施形態1又は2記載のOC
R用フォーマットパラメータ作成方法。
【0043】
【発明の効果】以上述べた如く本装置は、帳票の光学的
に走査したイメージデータをドット情報として表示する
イメージビューと、該イメージデータを学習情報を使用
して帳票上の実寸法に対応したミリ単位のレイアウトデ
ータに変換して表示するレイアウトビューとを設け、該
レイアウトビュー上における帳票上の枠の位置を決定す
ることにより、スキャナから取込んだイメージデータに
レンズ等に起因する歪みが含まれている場合でも実際の
フィールド位置に対応したパラメータを容易に作成する
ことができる。更に本発明は、前記イメージデータを表
示するイメージビューと実際の値に変換したレイウトビ
ューとを並列に表示したことにより、パラメータとして
登録される前の情報と登録されている情報を明確に区別
することができ、ユーザーが作業の状況を容易に把握す
ることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態によるOCR用フォーマッ
トパラメータ作成方法が適用される光学的文字読取装置
の構成を示す図。
【図2】前記光学的文字読取装置によるOCR用フォー
マットパラメータ作成処理のフローを示す図。
【図3】スキャナから黒背景上の帳票を読み込んだイメ
ージデータを示す図。
【図4】本実施形態によるイメージビューとレイアウト
ビューの画面を説明するための図。
【図5】フィールドのパラメータを定義するための画面
の一例を示す図。
【図6】本実施形態による歪み測定用の帳票の一例を示
す図。
【符号の説明】
1:OCR入力用帳票、2:スキャナまたはOCRモジ
ュール、3:パーソナルコンピュータ、4:イメージビ
ュー、5:レイアウトビュー、6:ディスク装置、7:
認識部、8:ディスプレイ。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 阿部 久美子 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内 (72)発明者 九嶋 和弘 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内 (72)発明者 服部 英春 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内 Fターム(参考) 5B029 BB03 CC26 EE04 EE05

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 帳票の所定の位置に書き込まれた枠内の
    文字記号をスキャナにより光学的に読み取る光学文字読
    取装置用のOCR用フォーマットパラメータ作成方法で
    あって、 前記帳票の全面を光学的に走査したイメージデータをド
    ット情報として表示するイメージビューと、前記イメー
    ジデータを学習情報を使用して帳票上の実寸法に対応し
    たミリ単位のレイアウトデータに変換して表示するレイ
    アウトビューとを設け、該レイアウトビュー上における
    帳票上の枠の位置をフォーマットデータとすることを特
    徴とするOCR用フォーマットパラメータ作成方法。
  2. 【請求項2】 予め定められた位置に複数のマークが記
    載された基準帳票をスキャナにより光学的に読み取り、
    この読み取ったイメージデータの複数マークの位置と前
    記基準帳票記上の複数のマークの予め定められた位置と
    を比較し、前記イメージデータを帳票上の実寸法に対応
    させたミリ単位のレイアウトデータに変換する学習情報
    を作成することを特徴とする請求項1記載のOCR用フ
    ォーマットパラメータ作成方法。
  3. 【請求項3】 前記フォーマットデータを用いて前記イ
    メージビュー上に表示しているイメージデータから読み
    取りを行い、該読読み取り結果と読み取りに使用した領
    域のイメージデータを併記して表示することを特徴とす
    る請求項1又は2記載のOCR用フォーマットパラメー
    タ作成方法。
JP30419799A 1999-10-26 1999-10-26 Ocr用フォーマットパラメータ作成方法 Pending JP2001126025A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30419799A JP2001126025A (ja) 1999-10-26 1999-10-26 Ocr用フォーマットパラメータ作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30419799A JP2001126025A (ja) 1999-10-26 1999-10-26 Ocr用フォーマットパラメータ作成方法

Publications (1)

Publication Number Publication Date
JP2001126025A true JP2001126025A (ja) 2001-05-11

Family

ID=17930195

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30419799A Pending JP2001126025A (ja) 1999-10-26 1999-10-26 Ocr用フォーマットパラメータ作成方法

Country Status (1)

Country Link
JP (1) JP2001126025A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081938A (ja) * 2012-10-17 2014-05-08 Cognex Corp 光学式文字認識の為のセグメンテーションパラメータを選択及び表示するシステム及び方法
JP2018163421A (ja) * 2017-03-24 2018-10-18 紀州技研工業株式会社 印字文字の切り出し方法および印字検査装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081938A (ja) * 2012-10-17 2014-05-08 Cognex Corp 光学式文字認識の為のセグメンテーションパラメータを選択及び表示するシステム及び方法
JP2018163421A (ja) * 2017-03-24 2018-10-18 紀州技研工業株式会社 印字文字の切り出し方法および印字検査装置

Similar Documents

Publication Publication Date Title
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
US7142733B1 (en) Document processing method, recording medium recording document processing program and document processing device
JP2001126025A (ja) Ocr用フォーマットパラメータ作成方法
JP2004504650A (ja) フォーム認識及びデジタル化画像処理のための方法及びシステム
JP2006229685A (ja) 帳票歪み判定装置
JPH06131495A (ja) 画像情報抽出方式
JP2022090469A (ja) 書式定義装置、書式定義方法、及びプログラム
JP2003046746A (ja) 画像処理方法及び画像処理装置
JPH03263282A (ja) 文字読取装置の文字切出し方法
JPH08180133A (ja) 画像処理装置
JPH0388085A (ja) 光学的文字読取装置
JPH06111057A (ja) 光学的文字読取装置
JP2937607B2 (ja) レイアウト作成装置
JPH05174179A (ja) 文書画像処理装置
JP2923004B2 (ja) 画像生成装置
JPH03225477A (ja) 画像処理装置
JPH07160814A (ja) 光学式文字認識方法
JPH09185675A (ja) 様式解析方法
JP2001109826A (ja) 帳票処理装置及び帳票処理方法及びコンピュータ読み取り可能な記憶媒体
JP3381803B2 (ja) 傾き角検出装置
JP2958784B2 (ja) 画像処理装置
JPH06301817A (ja) 文字認識装置
JPH08202818A (ja) フォーマット情報処理装置
JPH0554178A (ja) 文字認識装置及び修正用帳票
JPH02268385A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050817

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050817

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050927