JP2014048731A - 文字認識装置、プログラム、及び方法 - Google Patents
文字認識装置、プログラム、及び方法 Download PDFInfo
- Publication number
- JP2014048731A JP2014048731A JP2012188978A JP2012188978A JP2014048731A JP 2014048731 A JP2014048731 A JP 2014048731A JP 2012188978 A JP2012188978 A JP 2012188978A JP 2012188978 A JP2012188978 A JP 2012188978A JP 2014048731 A JP2014048731 A JP 2014048731A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character recognition
- area
- ruled line
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 81
- 238000012937 correction Methods 0.000 claims abstract description 77
- 238000012545 processing Methods 0.000 claims abstract description 57
- 238000005452 bending Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000010365 information processing Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 description 67
- 230000006870 function Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 23
- 239000000284 extract Substances 0.000 description 8
- 230000002411 adverse Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000630 rising effect Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000012804 iterative process Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000007667 floating Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 210000000744 eyelid Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Character Input (AREA)
- Image Processing (AREA)
Abstract
【解決手段】実施形態に係る文字認識装置は、帳票において文字認識を行う領域の位置情報を含む定義体を記憶する記憶部と、帳票の画像を取得する取得部と、定義体を帳票の画像に配置する配置部と、取得部が取得した画像に表されている帳票が折れ曲がっているか否かを判定する判定部と、帳票が折れ曲がっていると判定された場合に、取得部が取得した帳票の画像上で、画像に含まれている罫線の像における折れ曲がりの位置を特定する特定部と、文字認識を行う領域を、取得部が取得した帳票の画像上において特定部が特定した折れ曲がりの位置を中心として回転させて補正する補正部と、取得部が取得した画像における補正部による補正後の領域に対して文字認識処理を施す文字認識処理部と、を備える。
【選択図】図4B
Description
また、帳票をマットにセットし、上部からセンサ部でイメージを読み取る非接触スキャナ装置を用いた帳票画像の歪みを判別する技術が知られている。
また更に、OCR装置における文字切出しの前処理として、画像メモリ上の帳票画像の傾き角を高速に求めることが可能な方法を提供する技術が知られている。
図3Aから図3Cは、帳票1の一部分が浮きあがった状態で撮像された画像2に文字認識処理を実行する例を示す図である。図3Aは、帳票1の一部分が浮き上がった状態で撮像された画像2を例示する図である。例えば、スキャナなどを用いて撮像を行う際に帳票1が部分的に浮き上がってしまうことがある。特に、帳票1とカメラ等の撮像装置とが非接触な状態でスキャンを行う非接触型のスキャナを用いる場合には帳票1が部分的に浮き上がってしまうことが起こり易い。そして、帳票1の一部が浮き上がった状態で撮像が行われた場合、その浮き上がりに起因して撮像された画像2において帳票画像10の一部分が傾いてしまう(図3Aの点線枠5)。このような撮像された画像2中の帳票画像10の部分的な傾きは、その後の文字認識に悪影響を与える可能性がある。
(1)記憶装置1603に予めインストールされている。
(2)着脱可能記憶媒体1605により提供される。
(3)プログラムサーバなどのサーバ1609から提供される。
(1)記憶装置1603に記憶されている。
(2)着脱可能記憶媒体1605により提供される。
(3)スキャナ等の画像形成装置1701、並びにクライアントPC及びサーバコンピュータなどの情報処理装置1702からネットワーク1610を介して或いは入出力インタフェース1607を介して提供される。
2 画像
3 定義体
4 定義領域
10 帳票画像
100 文字認識装置
500 制御部
501 機能部
510 記憶部
511 取得部
512 配置部
513 判定部
514 特定部
515 算出部
516 補正部
517 文字認識処理部
1600 コンピュータ
1601 プロセッサ
1602 メモリ
1603 記憶装置
1604 読取装置
1605 着脱可能記憶媒体
1606 通信インタフェース
1607 入出力インタフェース
1608 バス
1609 サーバ
1610 ネットワーク
1700 システム構成
1701 画像形成装置
1702 情報処理装置
Claims (9)
- 帳票において文字認識を行う領域の位置情報を含む定義体を記憶する記憶部と、
前記帳票の画像を取得する取得部と、
前記定義体を前記帳票の画像に配置する配置部と、
前記取得部が取得した画像に表されている前記帳票が折れ曲がっているか否かを判定する判定部と、
前記帳票が折れ曲がっていると判定された場合に、前記取得部が取得した前記帳票の画像上で、該画像に含まれている罫線の像における折れ曲がりの位置を特定する特定部と、
前記文字認識を行う領域を、前記取得部が取得した帳票の画像上において前記特定部が特定した折れ曲がりの位置を中心として回転させて補正する補正部と、
前記取得部が取得した画像における前記補正部による補正後の領域に対して文字認識処理を施す文字認識処理部と、
を備えることを特徴とする文字認識装置。 - 前記画像における前記定義体の向きを基準としたときの、前記取得部が取得した前記帳票の画像に含まれている罫線の像の角度を算出する算出部、を更に含み、
補正部は、前記特定部が特定した折れ曲がりの位置を中心として、前記角度で前記文字認識を行う領域を回転させる、請求項1に記載の文字認識装置。 - 前記判定部は、前記取得部が取得した画像における前記帳票の画像の外周の形状に基づいて、該帳票の画像の2組の対向辺のうちの一方の組の対向辺の両方に折れ曲がりが存在するか否かを判定し、
前記特定部は、折れ曲がりが存在すると判定された対向辺の各々における該折れ曲がりの位置を結ぶ線分を特定し、前記取得部が取得した前記帳票の画像上で、該画像に含まれている罫線の像と前記線分との交点の位置を前記罫線の像における折れ曲がりの位置として特定する、請求項1又は2に記載の文字認識装置。 - 前記補正部は、
折れ曲がりが存在すると判定された対向辺が上辺及び下辺である場合に、前記文字認識を行う領域が、前記帳票の中心より上側にあるか下側にあるかを判定し、前記文字認識を行う領域が上側にある場合には、該前記文字認識を行う領域の直近上側の罫線の像の前記折れ曲がりの位置を中心として該前記文字認識を行う領域を回転させ、一方、前記文字認識を行う領域が下側にある場合には、該前記文字認識を行う領域の直近下側の罫線の像の前記折れ曲がりの位置を中心として該前記文字認識を行う領域を回転させ、
折れ曲がりが存在すると判定された対向辺が左辺及び右辺である場合に、前記文字認識を行う領域が、前記帳票の中心より左側にあるか右側にあるかを判定し、前記文字認識を行う領域が左側にある場合には、該前記文字認識を行う領域の直近左側の罫線の像の前記折れ曲がりの位置を中心として該前記文字認識を行う領域を回転させ、一方、前記文字認識を行う領域が右側にある場合には、該前記文字認識を行う領域の直近右側の罫線の像の前記折れ曲がりの位置を中心として該前記文字認識を行う領域を回転させる、
ことを特徴とする請求項3に記載の文字認識装置。 - 前記補正部は更に、
折れ曲がりが存在すると判定された対向辺が上辺及び下辺である場合に、回転後の前記文字認識を行う領域の縦方向の辺に最も近い前記帳票の画像の縦方向の罫線の像を特定し、該縦方向の罫線の像の方向と一致するように、前記文字認識を行う領域の縦方向の辺の向きを補正することを特徴とする、請求項4に記載の情報処理装置。 - 前記補正部は更に、
折れ曲がりが存在すると判定された対向辺が左辺及び右辺である場合に、回転後の前記文字認識を行う領域の横方向の辺に最も近い前記帳票の画像の横方向の罫線の像を特定し、該横方向の罫線の像の方向と一致するように、前記文字認識を行う領域の横方向の辺の向きを補正することを特徴とする、請求項4又は5に記載の情報処理装置。 - 前記判定部は、前記取得部が取得した画像における前記帳票の画像の外周の形状に基づいて、該帳票の画像の上辺又は下辺のいずれか一方並びに左辺又は右辺のいずれか一方に折れ曲がりが存在するか否かを判定し、
前記特定部は、上辺又は下辺のいずれか一方並びに左辺又は右辺のいずれか一方に折れ曲がりが存在すると判定された場合に、折れ曲がりが存在すると判定された辺の各々における該折れ曲がりの位置を結ぶ線分を特定し、前記文字認識を行う領域の隣にある前記帳票の画像の縦方向の罫線の像と、前記線分との第1の交点を特定し、且つ、前記文字認識を行う領域の隣にある前記帳票の画像の横方向の罫線の像と、前記線分との第2の交点を特定し、
前記算出部は、上辺又は下辺のいずれか一方並びに左辺又は右辺のいずれか一方に折れ曲がりが存在すると判定された場合に、前記画像における前記定義体の向きを基準としたときの、前記帳票の画像の前記縦方向の罫線の像が成す第1の角度と、前記画像における前記定義体の向きを基準としたときの、前記帳票の画像の前記横方向の罫線の像が成す第2の角度とを算出し、
前記補正部は、前記第1の角度よりも前記第2の角度が大きい場合に、前記第2の交点を中心として、前記文字認識を行う領域を前記第2の角度で回転して補正し、一方、前記第1の角度が前記第2の角度よりも大きい場合に、前記第1の交点を中心として、前記文字認識を行う領域を前記第1の角度で回転して補正することを特徴とする、請求項2に記載の情報処理装置。 - 帳票の画像を取得する取得ステップと、
前記帳票において文字認識を行う領域の位置情報を含む定義体に基づいて前記文字認識を行う領域を前記帳票の画像に配置する配置ステップと、
前記取得ステップで取得した画像に表されている前記帳票が折れ曲がっているか否かを判定する判定ステップと、
前記帳票が折れ曲がっていると判定された場合に、前記取得ステップで取得した前記帳票の画像上で、該画像に含まれている罫線の像における折れ曲がりの位置を特定する特定ステップと、
前記文字認識を行う領域を、前記取得ステップで取得した帳票の画像上において前記特定ステップで特定した折れ曲がりの位置を中心として回転させて補正する補正ステップと、
前記取得ステップで取得した画像における前記補正ステップによる補正後の領域に対して文字認識処理を施す文字認識処理ステップと、
を含む処理をコンピュータに実行させるためのプログラム。 - 帳票の画像を取得する取得ステップと、
前記帳票において文字認識を行う領域の位置情報を含む定義体に基づいて前記文字認識を行う領域を前記帳票の画像に配置する配置ステップと、
前記取得ステップで取得した画像に表されている前記帳票が折れ曲がっているか否かを判定する判定ステップと、
前記帳票が折れ曲がっていると判定された場合に、前記取得ステップで取得した前記帳票の画像上で、該画像に含まれている罫線の像における折れ曲がりの位置を特定する特定ステップと、
前記文字認識を行う領域を、前記取得ステップで取得した帳票の画像上において前記特定ステップで特定した折れ曲がりの位置を中心として回転させて補正する補正ステップと、
前記取得ステップで取得した画像における前記補正ステップによる補正後の領域に対して文字認識処理を施す文字認識処理ステップと、
を含む、コンピュータが実行する方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012188978A JP5744806B2 (ja) | 2012-08-29 | 2012-08-29 | 文字認識装置、プログラム、及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012188978A JP5744806B2 (ja) | 2012-08-29 | 2012-08-29 | 文字認識装置、プログラム、及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014048731A true JP2014048731A (ja) | 2014-03-17 |
JP5744806B2 JP5744806B2 (ja) | 2015-07-08 |
Family
ID=50608392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012188978A Active JP5744806B2 (ja) | 2012-08-29 | 2012-08-29 | 文字認識装置、プログラム、及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5744806B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488507A (zh) * | 2016-01-22 | 2016-04-13 | 吉林大学 | 圆柱表面文字识别系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05233874A (ja) * | 1992-02-18 | 1993-09-10 | Fujitsu Ltd | 光学的文字読み取り装置 |
JPH0991376A (ja) * | 1995-09-26 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | イメージデータ入力処理方法およびその装置 |
JP2007249580A (ja) * | 2006-03-15 | 2007-09-27 | Toshiba Corp | 画像処理装置、画像処理プログラムおよび画像処理方法 |
JP2010009283A (ja) * | 2008-06-26 | 2010-01-14 | Hitachi Omron Terminal Solutions Corp | 画像読取装置、画像読取方法および画像読取のためのコンピュータプログラム |
-
2012
- 2012-08-29 JP JP2012188978A patent/JP5744806B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05233874A (ja) * | 1992-02-18 | 1993-09-10 | Fujitsu Ltd | 光学的文字読み取り装置 |
JPH0991376A (ja) * | 1995-09-26 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | イメージデータ入力処理方法およびその装置 |
JP2007249580A (ja) * | 2006-03-15 | 2007-09-27 | Toshiba Corp | 画像処理装置、画像処理プログラムおよび画像処理方法 |
JP2010009283A (ja) * | 2008-06-26 | 2010-01-14 | Hitachi Omron Terminal Solutions Corp | 画像読取装置、画像読取方法および画像読取のためのコンピュータプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488507A (zh) * | 2016-01-22 | 2016-04-13 | 吉林大学 | 圆柱表面文字识别系统及方法 |
CN105488507B (zh) * | 2016-01-22 | 2019-03-12 | 吉林大学 | 圆柱表面文字识别系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5744806B2 (ja) | 2015-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5042562B2 (ja) | 画像処理装置、手書き情報認識方法、手書き情報認識プログラム | |
JP6200040B1 (ja) | 画像処理装置、画像処理方法、および、プログラム | |
JP3962891B2 (ja) | 文書画像処理装置、文書画像処理方法、及び記憶媒体 | |
JP2011130439A (ja) | 画像比較および文書認証のための画像位置合わせの方法 | |
JP4752694B2 (ja) | 画像抽出装置 | |
CN109845237A (zh) | 图像形成设备、图像形成设备的扫描图像校正方法以及非暂时性计算机可读记录介质 | |
RU2673015C1 (ru) | Способы и системы оптического распознавания символов серии изображений | |
JP6167528B2 (ja) | 画像コーナーを修正する方法及び装置並びに画像処理設備 | |
US10706581B2 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
JP2008234291A (ja) | 文字認識装置及び文字認識方法 | |
JP4544315B2 (ja) | 紙文書処理装置及びプログラム | |
JP5744806B2 (ja) | 文字認識装置、プログラム、及び方法 | |
JP4983464B2 (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
JP2007041709A (ja) | 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP2007011529A (ja) | Ocr処理における文字認識位置の決定方法 | |
US11657632B2 (en) | Image processing device, image reading device, image processing method, and non-transitory computer readable medium, using two pieces of image data | |
JP3604909B2 (ja) | 画像間位置合わせ方法 | |
JP2002077578A (ja) | 歪み補正装置およびその方法ならびに歪み補正プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4823049B2 (ja) | 文書画像検索装置及びプログラム | |
JP2006330873A (ja) | 指紋照合装置、方法およびプログラム | |
JP5944221B2 (ja) | 画像処理プログラムおよび画像処理装置、画像読取装置 | |
JP6815712B1 (ja) | 画像処理システム、画像処理方法、画像処理プログラム、画像処理サーバ、及び学習モデル | |
JPH11250179A (ja) | 文字認識装置および文字認識方法 | |
JP6922690B2 (ja) | 文字領域抽出プログラム、文字領域抽出装置及び文字領域抽出方法 | |
JP2009053827A (ja) | 帳票画像処理装置及び帳票画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140903 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150428 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150430 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5744806 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |