JP6562109B1 - 画像入力装置及び画像入力方法 - Google Patents

画像入力装置及び画像入力方法 Download PDF

Info

Publication number
JP6562109B1
JP6562109B1 JP2018060766A JP2018060766A JP6562109B1 JP 6562109 B1 JP6562109 B1 JP 6562109B1 JP 2018060766 A JP2018060766 A JP 2018060766A JP 2018060766 A JP2018060766 A JP 2018060766A JP 6562109 B1 JP6562109 B1 JP 6562109B1
Authority
JP
Japan
Prior art keywords
image
feature
document
unit
optical reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018060766A
Other languages
English (en)
Other versions
JP2019176274A (ja
Inventor
哲 ▲瀬▼川
哲 ▲瀬▼川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2018060766A priority Critical patent/JP6562109B1/ja
Application granted granted Critical
Publication of JP6562109B1 publication Critical patent/JP6562109B1/ja
Publication of JP2019176274A publication Critical patent/JP2019176274A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Studio Devices (AREA)

Abstract

【課題】格子点やベースラインに基づかない新たな方式により、原稿画像の補正パラメータを正しく認識して、原稿画像の補正を適正に行うことができる画像入力装置及び画像入力方法を提供する。【解決手段】光学読取面4上に所定の既知間隔の特徴画像Gを投影する投影部1と、光学読取面4を読み取る画像読取部2と、画像読取部2で読み取った特徴画像Gの位置に基づく補正パラメータPを算出し、該補正パラメータPに基づき原稿画像の歪みを補正する演算処理部3とを備える。【選択図】図1

Description

本発明は、銀行等の金融機関で使用可能な画像入力装置及び画像入力方法に関する。
テーブル上の原稿を間接的に読み取る装置として、特許文献1及び2に示される画像読取装置が知られている。
特許文献1に示される画像処理システムは、画像を投影する投影部と、投影部により格子点画像が投影された領域を撮影する撮影部と、を有し、撮影画像からパターン画像の対応点情報を取得する。
さらに、この画像処理システムでは、取得したパターン画像の対応点情報と、パターン画像の特徴点の位置情報とに基づき、投影対象のコンテンツ画像を補正する補正情報を算出し、この補正情報に基づき、投影対象のコンテンツ画像を補正する。
特許文献2に示される電子文書作成装置では、画像の歪みを補正することにより補正画像を得て、前記補正画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る処理がなされる。
さらに、この電子文書作成装置では、前記補正前の画像における各文字行のベースラインを求めた後、前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求めて、前記補正前の画像上における前記テキストデータの位置を、前記ベースラインからの相対位置で記述した電子文書を生成する。
特開2014−160998号公報 特開2009−200622号公報
ところで、特許文献1では投影した格子点画像に基づき、一方、特許文献2では各文字行から抽出したベースラインに基づき、スクリーン面又は入力画像の歪を修正する。
しかしながら、これら特許文献1,2に示される技術では、スクリーン面又は入力画像の歪が想定以上に大きい場合に、格子点が隣接する他の格子点と交差してしまう、又はベースラインが他のベースラインと交差してしまうこともあり、正確な歪量の検出ができないという問題があった。
この発明は、上述した事情に鑑みてなされたものであって、格子点やベースラインに基づかない特徴画像を読み取る方式により、原稿画像の補正パラメータを正しく認識して、原稿画像の補正を適正に行うことができる画像入力装置及び画像入力方法を提供する。
上記課題を解決するために、この発明は以下の手段を提案している。
本発明の第1形態に示される画像入力装置では、光学読取面上に所定の既知間隔の特徴画像を投影する投影部と、前記光学読取面を読み取る画像読取部と、前記画像読取部で読み取った特徴画像の位置に基づく補正パラメータを算出し、該補正パラメータに基づき画像の歪みを補正する演算処理部と、を備えることを特徴とする。
本発明の第2形態に示される画像入力方法では、光学読取面上に所定の既知間隔の特徴画像を投影する投影段階と、前記光学読取面を読み取る画像読取段階と、前記画像読取段階で読み取った特徴画像の位置に基づく補正パラメータを算出し、該補正パラメータに基づき画像の歪みを補正する補正段階と、からなることを特徴とする。
本発明では、補正パラメータを介した原稿画像の補正により、しわや湾曲の影響を排除した原稿画像を得ることができる。
本発明に係る画像入力装置を示す図であって、(a)は装置の概略構成図、(b)は原稿に既知間隔の特徴画像が投影された状態を示す図、(c)は基準特徴画像を示す図、(d)は補正パラメータで補正後の原稿画像を示す図である。 本発明の実施形態に係る画像入力装置を示す図である。 (a)はプロジェクタ部から原稿上に特徴画像を投影した図であり、(b)は特徴画像と比較される歪のない基準特徴画像を示す図である。 (a)は補正パラメータで補正前の原稿読取画像、(b)は補正パラメータで補正後の原稿読取画像を示す図である。 本実施形態に係る画像入力装置の動作内容を示すフローチャートである。
本発明に係る画像入力装置100の最小構成例について図1(a)〜(d)を参照して説明する。
本発明の画像入力装置100は、図1(a)に示されるように投影部1、画像読取部2及び演算処理部3を備える。
投影部1は、光学読取面4上の原稿Mに所定の既知間隔の特徴画像Gを投影するために設けられている。
画像読取部2は光学読取面4を読み取るためのイメージスキャナである。
演算処理部3は、画像読取部2で読み取った特徴画像Gから補正パラメータPを算出し、この補正パラメータPに基づき原稿画像の歪みを補正するために設けられる。
なお、特徴画像Gとしては、個々に異なる数字又は文字が既知間隔で配列されたものが使用される。
以上のように構成された画像入力装置100では、図1(b)に示されるように、投影部1により、光学読取面4上に載置された原稿Mに所定の既知間隔の特徴画像Gが投影される。その後、原稿M上に投影された特徴画像Gは、画像読取部2により読み取られた後、演算処理部3に供給される。
演算処理部3では、画像読取部2で読み取った特徴画像Gと、図1(c)に示される基準画像との比較に基づき補正パラメータPを算出した後、図1(d)に示されるように補正パラメータPに基づき原稿画像の歪みを補正する。なお、図1(b)は補正前の原稿画像、図1(d)は補正後の原稿画像を示している。
ここで、特徴画像Gとして、複数又は単数の列からなる既知間隔の文字列や記号列を光学読取面4に投影することで、原稿画像を補正するための補正パラメータPを正しく認識して、原稿画像の補正を適正に行うことができる。
すなわち、本発明では、光学読取面4上に載置された原稿Mにしわや浮きに伴う湾曲があったとしても、補正パラメータPを介した原稿画像の補正により、しわや湾曲の影響を排除した原稿画像を得ることができる。
なお、本発明では、光学読取面4上に載置した原稿Mに対して所定の既知間隔の特徴画像Gを投影したが、これに限定されず、光学読取面4上に投影した投影画像に対して、所定の既知間隔の特徴画像Gを投影しても良い。これにより、演算処理部3にて、光学読取面4上にある凹凸の影響を排除した投影画像を得ることができる。
また、本発明の画像入力装置100では、光学読取面4上に所定の既知間隔の特徴画像Gを投影する投影段階と、光学読取面4を読み取る画像読取段階と、画像読取段階で読み取った特徴画像Gの位置に基づく補正パラメータPを算出しこの補正パラメータPに基づき画像の歪みを補正する補正段階と、を有する画像入力方法が採用されている。
(実施形態)
図1の画像入力装置100をさらに具体化した実施形態について、図2〜図5を参照して説明する。
本実施形態に係わる画像入力装置101は、投影部となるプロジェクタ部11、画像読取部となるイメージセンサ部12及び演算処理部13を備える。
プロジェクタ部11は、テーブル14上に設置された光学読取面15上の原稿Mに所定の既知間隔の特徴画像G1を投影するために設けられている。
イメージセンサ部12は光学読取面15を読み取るためのイメージスキャナである。
これらプロジェクタ部11及びイメージセンサ部12はいずれもテーブル14上に設置された支持部材16に支持されている。
演算処理部13は、プロジェクタ部11から原稿M上に投影する特徴画像G1を生成する投影画像生成部13Aと、原稿Mで反射した特徴画像G1を読取りデータ処理する画像データ処理部13Bとを有する。
そして、この演算処理部13では、イメージセンサ部12で読み取った特徴画像G1の位置に基づく補正パラメータPを算出し、この補正パラメータPに基づき原稿画像の歪みを補正する処理を行う。
演算処理部13での具体的処理について、図3(a)及び(b)及び図4(a)及び(b)を参照して説明する。
プロジェクタ部11から原稿M上に投影する特徴画像G1として、例えば図3(a)に示されるような「01から99」までの異なる文字や記号を既知間隔に並べたものが使用される。
なお、この特徴画像G1は単数の列からなる文字列や記号列であっても良いし、複数の列からなる文字列や記号列であっても良い。また、演算処理部13には、プロジェクタ部11から原稿M上に投影後に、イメージセンサ部12で読み取った特徴画像G1と比較される、歪のない基準特徴画像G0(図3(b)参照)を別途記憶しておく。
画像入力装置101のイメージセンサ部12では、光学読取面15上に載置された原稿Mの印刷及び記入文字とともに、プロジェクタ部11から原稿M上に投影された特徴画像G1を読み取り、その画像データを演算処理部13に出力する。
演算処理部13では、イメージセンサ部12で読み取った特徴画像G1について、予め記憶しておいた歪のない基準特徴画像G0と比較することで、これら特徴画像G1と基準特徴画像G0との相違点となる特徴点の抽出を行なう。
演算処理部13で抽出される特徴点としては、特徴画像G1の個々の文字/数字に関する特徴量と特徴点座標(例えば、位置座標、文字/数字の傾き、大きさ、濃度勾配など)などがあり、これら特徴点を、補正パラメータPとして出力する。
また、これに限定されず、演算処理部13では、文字/数字の明るさや向き、スケールによらず濃度勾配とその正規化により極値を持つ点を特徴抽出とする方式(参考文献:K. Iwamoto, R. Mase, and T. Nomura: BRIGHT: A Scalable and Compact Binary Descriptor for Low-Latency and High Accuracy Object Identification, Proc. of ICIP2013, pp.2915-2919, 2013.)を用いて、補正パラメータPを得ることもできる。
そして、演算処理部13では、イメージセンサ部12で取得した、特徴画像G1の個々の文字/数字が位置する座標と同じ位置にある原稿M上の読取画像20(図4(a)参照)を、上述した補正パラメータPを用いて補正する(図4(b)参照)。なお、図4(a)は補正前の読取画像20、図4(b)は補正後の読取画像21をそれぞれ示している。
これにより、上記画像入力装置101では、光学読取面15上に載置された原稿Mにしわや浮きに伴う湾曲があったとしても、補正パラメータPを介した原稿Mの読取画像20の補正により、しわや湾曲の影響を排除した読取画像21(図4(b)参照)を得ることができる。
次に、図5を参照して、本実施形態に係る画像入力装置101の動作について説明する。
〔ステップS1〕
光学読取面15上に原稿Mが載置されたか否かを判断し、YESの場合に次のステップS2に進む。
〔ステップS2〕
プロジェクタ部11から、光学読取面15上に載置された原稿Mに特徴画像G1を投影する。
〔ステップS3〕
イメージセンサ部12に対して、原稿M上に記載された印刷及び記入文字を読み取らせるとともに、プロジェクタ部11から原稿M上に投影された特徴画像G1の反射画像を読み取らせる。
〔ステップS4〕
データ処理部13Bにおいて、イメージセンサ部12で読み取った特徴画像G1について、予め記憶しておいた歪のない基準特徴画像G0と比較することで、これら特徴画像G1と基準特徴画像G0との相違点となる特徴点の抽出を行なう。
〔ステップS5〕
ステップS4で抽出した特徴点に基づき補正パラメータPを演算する。
〔ステップS6〕
操作者から補正パラメータPに基づく原稿画像の補正指示があったか否かを判断し、NOの場合にステップS7に進み、YESの場合にステップS8に進む。
〔ステップS7〕
ステップS5で算出された補正パラメータPを操作者に出力した後、本フローチャートを終了する。
〔ステップS8〕
ステップS3に示すイメージセンサ部12で取得した原稿M上の読取画像20(図4(a)参照)について、ステップS5で演算した補正パラメータPに基づく補正をした後、本フローチャートを終了する。図4(b)は補正後の読取画像21を示している。
以上のように構成された画像入力装置101では、プロジェクタ部11により、光学読取面15上に載置された原稿Mに所定の既知間隔の特徴画像G1が投影される。その後、原稿M上に投影された特徴画像G1は、イメージセンサ部12により読み取られた後、演算処理部13に供給される。
演算処理部13では、イメージセンサ部12で読み取った特徴画像G1と、図1(c)に示される基準画像G0との比較に基づく補正パラメータPを算出した後、図1(d)に示されるように補正パラメータPに基づき原稿画像の歪みを補正する。なお、図1(b)は補正前の原稿画像、図1(d)は補正後の原稿画像を示している。
ここで、特徴画像G1として、複数又は単数の列からなる既知間隔の文字列や記号列を光学読取面15に投影することで、原稿画像の補正パラメータPを正しく認識して、原稿画像の補正を適正に行うことができる。
すなわち、本発明では、光学読取面15上に載置された原稿Mにしわや浮きに伴う湾曲があったとしても、補正パラメータPを介した原稿画像の補正により、しわや湾曲の影響を排除した原稿画像を得ることができる。
なお、上記実施形態では、プロジェクタ部11による画像投影とイメージセンサ部12による画像読取とを、原稿Mの原稿面全体に対して行ったが、これに限定されず、原稿M上の文字や図形の認識が必要な部分領域に限って実施しても良い。
また、上記実施形態では、プロジェクタ部11とイメージセンサ部12とを一体にしたものを使用したが、これらプロジェクタ部11とイメージセンサ部12とは別体に設けられていても良い。
また、上記実施形態では、光学読取面15上に載置した原稿Mに対して所定の既知間隔の特徴画像Gを投影したが、これに限定されず、光学読取面15上に投影した投影画像に対して、所定の既知間隔の特徴画像Gを投影しても良い。
これにより、演算処理部13にて、光学読取面15上にある凹凸の影響を排除した投影画像を得ることができる。
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
本発明は、銀行等の金融機関で使用可能な画像入力装置及び画像入力方法に関する。
1 投影部
2 画像読取部
3 演算処理部
4 光学読取面
11 プロジェクタ部
12 イメージセンサ部
13 演算処理部
15 光学読取面
20 読取画像
21 読取画像
100 画像入力装置
101 画像入力装置
G1 特徴画像
G0 基準特徴画像
M 原稿
P 補正パラメータ

Claims (5)

  1. 光学読取面上に所定の既知間隔の文字列または記号列を有する特徴画像を投影する投影部と、
    前記光学読取面を読み取る画像読取部と、
    前記画像読取部で読み取った特徴画像の位置に基づく補正パラメータを算出し、該補正パラメータに基づき原稿画像の歪みを補正する演算処理部と、を備え、
    前記投影部は、前記光学読取面に投影された原稿画像上に前記特徴画像を投影することを特徴とする画像入力装置。
  2. 前記投影部は、複数又は単数の列からなる文字列およびまたは記号列から構成される特徴画像を投影することを特徴とする請求項1に記載の画像入力装置。
  3. 前記投影部は、前記光学読取面に載置された原稿上に前記特徴画像を投影することを特徴とする請求項1又は2のいずれか1項に記載の画像入力装置。
  4. 前記演算処理部は、前記画像読取部で読み取った特徴画像と、予め記憶しておいた基準特徴画像とを比較することで、前記補正パラメータを算出することを特徴とする請求項1〜3のいずれか1項に記載の画像入力装置。
  5. 光学読取面上に所定の既知間隔の文字列または記号列を有する特徴画像を投影する投影段階と、
    前記光学読取面を読み取る画像読取段階と、
    前記画像読取段階で読み取った特徴画像の位置に基づく補正パラメータを算出し、該補正パラメータに基づき原稿画像の歪みを補正する補正段階と、からなり、
    前記投影段階は、前記光学読取面に投影された原稿画像上に前記特徴画像を投影することを特徴とする画像入力方法。
JP2018060766A 2018-03-27 2018-03-27 画像入力装置及び画像入力方法 Active JP6562109B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018060766A JP6562109B1 (ja) 2018-03-27 2018-03-27 画像入力装置及び画像入力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018060766A JP6562109B1 (ja) 2018-03-27 2018-03-27 画像入力装置及び画像入力方法

Publications (2)

Publication Number Publication Date
JP6562109B1 true JP6562109B1 (ja) 2019-08-21
JP2019176274A JP2019176274A (ja) 2019-10-10

Family

ID=67690470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018060766A Active JP6562109B1 (ja) 2018-03-27 2018-03-27 画像入力装置及び画像入力方法

Country Status (1)

Country Link
JP (1) JP6562109B1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09284489A (ja) * 1996-04-12 1997-10-31 Minolta Co Ltd 画像読取り装置
JP4066829B2 (ja) * 2003-02-12 2008-03-26 日本ビクター株式会社 画像撮像装置
JP4552484B2 (ja) * 2004-03-31 2010-09-29 ブラザー工業株式会社 画像入出力装置

Also Published As

Publication number Publication date
JP2019176274A (ja) 2019-10-10

Similar Documents

Publication Publication Date Title
JP2011227636A (ja) 文字列認識装置および文字列認識方法
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
WO2011129113A1 (ja) 帳票処理装置及び帳票処理方法及び記録媒体
JP6665595B2 (ja) 文字認識装置、方法およびプログラム
JP4594952B2 (ja) 文字認識装置及び文字認識方法
JP2006214816A (ja) 半導体検査装置
KR101016544B1 (ko) 단어 인식 방법 및 기록 매체
JP6562109B1 (ja) 画像入力装置及び画像入力方法
JP2012221372A (ja) 帳票、帳票処理装置、帳票処理方法及び記録媒体
JP2008282094A (ja) 文字認識処理装置
JP2007233890A (ja) 画像処理装置および画像処理プログラム
JP2017068679A (ja) 画像補正装置
JP4518212B2 (ja) 画像処理装置及びプログラム
WO2011129114A1 (ja) 帳票、帳票処理装置、帳票処理方法及び記録媒体
JP2007011529A (ja) Ocr処理における文字認識位置の決定方法
JP2009223612A (ja) 画像認識装置及びプログラム
JP6677209B2 (ja) 画像処理装置、処理方法、プログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2007323440A (ja) 画像処理方法、画像処理プログラム、画像処理プログラムが記録された記録媒体および画像処理装置
JP4696239B2 (ja) 文字列の傾斜補正方法及び装置
JPH0581471A (ja) 画像上の文字の配列方向判定方法
JP2007011528A (ja) Ocr処理における認識対象項目の位置探索方法
JP4517667B2 (ja) 文書画像照合装置、文書画像位置合わせ方法及びプログラム
JP3163235B2 (ja) 光学式文字読取装置
JP2024030011A (ja) 図面読み取り装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190625

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190708

R150 Certificate of patent or registration of utility model

Ref document number: 6562109

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150