JP4867894B2 - 画像認識装置、画像認識方法及びプログラム - Google Patents
画像認識装置、画像認識方法及びプログラム Download PDFInfo
- Publication number
- JP4867894B2 JP4867894B2 JP2007287392A JP2007287392A JP4867894B2 JP 4867894 B2 JP4867894 B2 JP 4867894B2 JP 2007287392 A JP2007287392 A JP 2007287392A JP 2007287392 A JP2007287392 A JP 2007287392A JP 4867894 B2 JP4867894 B2 JP 4867894B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- noise
- ruled line
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
Description
まず、本発明の第1の実施形態に係る文字認識装置(画像認識装置)100について説明する。図8は、本実施形態に係る文字認識装置100を示すブロック図である。文字認識装置100は、表面又は裏面に印刷がされた帳票などの書類上の文字をコンピュータ上のデータとして扱うため、例えば、帳票101上の認識対象領域内に記載された文字に対して読取りを行い、文字認識を行なう。
次に、本発明の第1の実施形態に係る文字認識装置100の動作について説明する。
まず、本発明の第2の実施形態に係る文字認識装置200について説明する。文字認識装置200は、第1の実施形態と同様に、図8に示すように、例えば、画像入力部102と、レイアウト解析部110と、フォーマットデータベース(以下、データベースをDBと略す。)が記録された記録部120と、文字認識部140と、出力形成部150とを備える。なお、レイアウト解析部110には、CRT(cathode ray tube)などの表示装置、キーボード、マウスなどの入力装置130が接続可能となっている。これらの構成要素については、第1の実施形態と同一であるため、詳細な説明は省略する。
次に、本発明の第2の実施形態に係る文字認識装置200の動作について説明する。
102 画像入力部
110 レイアウト解析部
111 制御部
112 認識対象領域矩形座標設定部
113 フォーマットDB作成部
114 フォーマットDB解析部
115 認識対象領域作成部
116 罫線検出部
117 表裏面罫線一致判定部
118 罫線除去部
120 記録部
130 入力装置
140 文字認識部
150 出力形成部
216 ラベリング部
217 雑音判断部
218 雑音除去部
219 認識対象領域分割部
220 雑音閾値変更部
Claims (11)
- 読取り対象となる帳票の表面に対して裏面側の裏面画像に基づく情報が予め記録された記録部と、
前記帳票の表面を読取る画像入力部と、
前記画像入力部で読取られた表面画像に前記帳票の裏面の罫線の位置情報を反転させた情報と一致する罫線が検出された場合、前記表面画像から雑音画像を前記情報の少なくとも一部を用いて除去する雑音除去部と、
前記雑音画像が除去された表面画像から前記帳票の表面に記載された画像を認識する画像認識部と、
を備え、
前記裏面画像に基づく情報は罫線の位置情報であり、
前記記録部に複数の帳票に対応させて帳票ごとの表面と裏面の罫線の位置情報を記録し、
前記雑音除去部は、予め記録された裏面の罫線の位置と一致する罫線を除去し、
前記画像認識部は、前記雑音画像が除去された表面画像の罫線と予め記録された帳票ごとの表面の罫線とを比較してどの帳票かを特定する
ことを特徴とする、画像認識装置。 - 前記記録部に表面画像に基づく罫線の位置情報を記録し、
前記雑音除去部は、予め記録した裏面の罫線と表面の罫線の位置が重なる場合は、重なる部分の罫線を除去しない
ことを特徴とする、請求項1に記載の画像認識装置。 - 前記記録部に前記帳票の文字認識対象領域を記録し、
前記雑音除去部は前記文字認識対象領域内に対して裏面の罫線と一致する罫線を除去し、
前記画像認識部は文字認識対象領域内の文字を認識する
ことを特徴とする、請求項2に記載の画像認識装置。 - 読取り対象となる帳票の表面に対して裏面側の裏面画像に基づく情報が予め記録された記録部と、
前記帳票の表面を読取る画像入力部と、
前記画像入力部で読取られた表面画像の、前記帳票の裏面の文字の位置情報を反転させた領域について、前記表面画像から雑音画像を前記情報の少なくとも一部を用いて除去する雑音除去部と、
前記雑音画像が除去された表面画像から前記帳票の表面に記載された画像を認識する画像認識部と、
前記画像入力部で読取られた表面画像をラベリング処理して第1のラベルを生成するラベリング部と、
を備え、
前記雑音除去部が、ラベルのサイズが閾値を下回る場合に雑音と判断するための雑音閾値に基づいて前記第1のラベルを除去することによって前記雑音画像を除去する
ことを特徴とする、画像認識装置。 - 前記ラベリング部は、前記記録部に記録された裏面画像をラベリング処理し第2のラベルを生成し、
前記第2のラベルに基づいて前記雑音閾値を変更する雑音閾値変更部を備え、
前記雑音閾値変更部は、前記第2のラベルのサイズが前記雑音閾値より大きい場合に当該雑音閾値を大きく変更し、
前記雑音除去部は、前記変更された雑音閾値に基づいて前記雑音画像を除去する
ことを特徴とする、請求項4に記載の画像認識装置。 - 前記第2のラベルに基づいて、前記画像入力部で読取られた表面画像を複数の領域に分割する領域分割部を備え、
前記雑音閾値変更部は、前記複数の領域ごとに前記雑音閾値を変更する
ことを特徴とする、請求項5に記載の画像認識装置。 - 前記雑音除去部は、前記雑音画像を判別するための雑音閾値を用いて、前記画像入力部で読取られた表面画像の、前記帳票の裏面の文字の位置情報を反転させた領域について前記雑音画像を除去し、
前記画像認識装置は、前記雑音閾値を変更する雑音閾値変更部をさらに備える
ことを特徴とする、請求項4に記載の画像認識装置。 - 前記裏面画像に基づく情報は文字の情報である
ことを特徴とする、請求項1又は4に記載の画像認識装置。 - 読取り対象となる帳票の表面に対して裏面側の裏面画像を記録するステップと、
前記帳票の表面を読取るステップと、
前記読取られた表面画像に前記帳票の裏面の罫線の位置情報を反転させた情報と一致する罫線が検出された場合、前記表面画像から雑音画像を除去するステップと、
前記雑音画像が除去された表面画像から前記帳票の表面に記載された画像を認識するステップと、
を含み、
前記裏面画像に基づく情報は罫線の位置情報であり、
前記記録するステップでは複数の帳票に対応させて帳票ごとの表面と裏面の罫線の位置情報を記録し、
前記除去するステップでは予め記録された裏面の罫線の位置と一致する罫線を除去し、
前記認識するステップでは前記雑音画像が除去された表面画像の罫線と予め記録された帳票ごとの表面の罫線とを比較してどの帳票かを特定する
ことを特徴とする、画像認識方法。 - 読取り対象となる帳票の表面に対して裏面側の裏面画像を記録するステップと、
前記帳票の表面を読取るステップと、
前記読取られた表面画像の、前記帳票の裏面の文字の位置情報を反転させた領域について、前記表面画像から雑音画像を除去するステップと、
前記雑音画像が除去された表面画像から前記帳票の表面に記載された画像を認識するステップと、
前記画像入力部で読取られた表面画像をラベリング処理して第1のラベルを生成するステップと、
を含み、
前記除去するステップでは、ラベルのサイズが閾値を下回る場合に雑音と判断するための雑音閾値に基づいて前記第1のラベルを除去することによって前記雑音画像を除去する
ことを特徴とする、画像認識方法。 - 請求項9又は10に記載の画像認識方法をコンピュータに実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007287392A JP4867894B2 (ja) | 2007-11-05 | 2007-11-05 | 画像認識装置、画像認識方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007287392A JP4867894B2 (ja) | 2007-11-05 | 2007-11-05 | 画像認識装置、画像認識方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009116520A JP2009116520A (ja) | 2009-05-28 |
JP4867894B2 true JP4867894B2 (ja) | 2012-02-01 |
Family
ID=40783622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007287392A Active JP4867894B2 (ja) | 2007-11-05 | 2007-11-05 | 画像認識装置、画像認識方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4867894B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011090418A (ja) * | 2009-10-21 | 2011-05-06 | Toshiba Corp | 帳票読取装置およびプログラム |
JP2021047693A (ja) * | 2019-09-19 | 2021-03-25 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
CN111914835A (zh) * | 2020-07-04 | 2020-11-10 | 中信银行股份有限公司 | 票据要素提取方法、装置、电子设备及可读存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0666216A (ja) * | 1992-08-17 | 1994-03-08 | Yanmar Diesel Engine Co Ltd | 燃料オートリターン装置 |
JPH07105312A (ja) * | 1993-10-07 | 1995-04-21 | Fujitsu Ltd | 光学式文字読取装置における文字イメージのごみ除去方法及び装置 |
JP3359180B2 (ja) * | 1995-03-28 | 2002-12-24 | キヤノン株式会社 | 画像読取装置及び画像読取方法 |
JP2000059630A (ja) * | 1998-08-07 | 2000-02-25 | Ricoh Co Ltd | 画像記録方法及び画像記録プログラムを記録した媒体 |
JP3904840B2 (ja) * | 2000-08-15 | 2007-04-11 | 富士通株式会社 | 多値画像から罫線を抽出する罫線抽出装置 |
JP4265421B2 (ja) * | 2004-01-30 | 2009-05-20 | 富士ゼロックス株式会社 | 印刷画像検査方法 |
JP2006085463A (ja) * | 2004-09-16 | 2006-03-30 | Oki Electric Ind Co Ltd | 文字認識装置およびその認識方法 |
JP2006215964A (ja) * | 2005-02-07 | 2006-08-17 | Toshiba Corp | 文字認識装置 |
-
2007
- 2007-11-05 JP JP2007287392A patent/JP4867894B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009116520A (ja) | 2009-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7970213B1 (en) | Method and system for improving the recognition of text in an image | |
JP2951814B2 (ja) | 画像抽出方式 | |
US20070168382A1 (en) | Document analysis system for integration of paper records into a searchable electronic database | |
US20030198386A1 (en) | System and method for identifying and extracting character strings from captured image data | |
US8452133B2 (en) | Underline removal apparatus | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
CN101122953A (zh) | 一种图片文字分割的方法 | |
JPH08305796A (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
Kaundilya et al. | Automated text extraction from images using OCR system | |
US20060078204A1 (en) | Image processing apparatus and method generating binary image from a multilevel image | |
JP2008011484A (ja) | 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体 | |
KR101793184B1 (ko) | 촬영된 음악 악보 영상의 자동연주를 위한 가사 영역 추출장치 및 방법 | |
JP4867894B2 (ja) | 画像認識装置、画像認識方法及びプログラム | |
JPH09311905A (ja) | 行検出方法および文字認識装置 | |
JPH1031716A (ja) | 文字行抽出方法および装置 | |
JPH0950527A (ja) | 枠抽出装置及び矩形抽出装置 | |
Nguyen et al. | Enhanced character segmentation for format-free Japanese text recognition | |
JP4492258B2 (ja) | 文字・図形の認識方法および検査方法 | |
JP2001109887A (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
JP4078045B2 (ja) | 画像処理装置、方法、プログラム、及び記憶媒体 | |
Gayashan et al. | Old Sinhala newspaper article segmentation for content recognition using image processing | |
Chitrakala et al. | An efficient character segmentation based on VNP algorithm | |
JP4731748B2 (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
JP7532124B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP4882929B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110815 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111018 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111031 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4867894 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141125 Year of fee payment: 3 |