JP5424694B2 - 画像認識装置、及びプログラム - Google Patents
画像認識装置、及びプログラム Download PDFInfo
- Publication number
- JP5424694B2 JP5424694B2 JP2009096365A JP2009096365A JP5424694B2 JP 5424694 B2 JP5424694 B2 JP 5424694B2 JP 2009096365 A JP2009096365 A JP 2009096365A JP 2009096365 A JP2009096365 A JP 2009096365A JP 5424694 B2 JP5424694 B2 JP 5424694B2
- Authority
- JP
- Japan
- Prior art keywords
- boundary
- image
- boundary line
- edge
- foreground
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 49
- 238000000034 method Methods 0.000 claims description 48
- 238000012937 correction Methods 0.000 claims description 14
- 238000000926 separation method Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000010191 image analysis Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 description 22
- 238000012015 optical character recognition Methods 0.000 description 15
- 238000005070 sampling Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 239000003086 colorant Substances 0.000 description 6
- 238000003708 edge detection Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 239000000470 constituent Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Description
まず、本実施形態が適用されるハードウェア構成について説明する。図1は、本発明の実施形態による文字認識装置(OCR装置及び文書読取システム)の概略構成を示す図である。
図2は、4辺検出の概念を示す図である。また、図3は、4辺検出処理の概要を説明するためのフローチャートである。さらに、図4乃至8は、4辺検出処理と画像の例を示し、4辺検出処理の内容の理解を助ける図である。
当該ステップでは、入力された画像(例えば帳票画像)にLn×Lnの格子があてはめられ、その格子点の画素情報がサンプリング処理される。つまり、これは、入力画像に対して複数の格子点を定義し、この格子点近傍の画素の色(濃度)を推定する処理である。紙面だけでなく、黒の背景についてもサンプリングされる。
当該ステップでは、プレサンプリングで得られたLn×Ln箇所のサンプル点から、画像構成色のヒストグラムが生成される。
当該ステップで実行されるエッジ推定処理は2段階の処理で構成されている。
当該ステップでは、各辺について最大Ne箇所のエッジ検出が実行され、ここで得られたエッジ群について最小二乗法によって直線近似が実行される。つまり、これは、エッジ推定処理によって得られた境界点であろうと思われる点に対して直線近似する処理である。
当該ステップでは、近似境界線で区切られた2領域においてNe点のサンプリングが行われ、紙面領域内と紙面領域外の画像濃度の差分値によって境界線の妥当性が評価される。つまり、これは、求めた近似直線が境界線として尤もらしいか判断する処理である。
a)境界線に沿ったサンプリング位置について、境界線の内側と外側とで画素値の差分量を計算し、差分量が閾値Te1以下となる箇所の個数が、閾値Te2(個数)を下回ること。
又は
b)紙面領域外の画像濃度の分散が閾値Te3大きいと判断されたこと(紙面の外と判断された領域の色がどれだけばらついているかについて判断)。
当該ステップは第二パスの最初の処理であり、ここでは、画像濃度分布解析によって閾値が再度決定される。
当該ステップでは、S0303の処理における二分探索でエッジが検出される。なお、このとき使用される閾値は、S0306の処理で求めた閾値である。
当該ステップでは、S0307で求めたエッジ点から境界線が直線で近似される。境界線近似に関しては、S0304で実行された処理と同じ処理が実行される。
当該ステップでは、対向する2つの境界線の傾きを比較し、傾きの差が一定以上の場合にはS0310において境界線の補正処理が実行されることになる。すなわち、左と右、または上と下の2つ境界線の方向をベクトル(2次元ベクトル)L1,L2として表した場合、ベクトル間の角度の絶対コサイン値|<L1、L2>|/(|L1|×|L2|)が閾値Trより大きい場合は、両者は平行線にならないと判断される。
当該ステップでは、S0309の処理で平行線を構成しないと判断された2つの境界線については、各々の境界線において、垂直に隣接する境界線と交わる角度が求められる。当該角度に垂直から一定以上の誤差Taがある場合には、その境界線は間違っているとみなされ、対向する境界線から境界線の推定が行われる。このような処理を行うのは、図7にあるように、紙面上に背景色とほぼ同じ暗さの模様が載っていて、それが大きな面積を占めているケースにおいて、境界線検出の失敗を救済するためである。この場合、当初右端の境界線として推定されたのが直線(0701)である。しかし、左側、上側、下側の境界線は高い尤度を持つので、これら三辺は正確であるとみなし、あいまいな右側の辺を求めなおす。その処理は次の過程から成る。
ii)左辺と同じ傾きを持つ線分で、最も遠いサンプル点を通るものを右辺とする過程
そして、上記の処理により、新しい境界線0702が得られる。
以上説明したように、本発明の実施形態では、入力画像をサンプリングして得られた複数の格子点についてヒストグラムを作成し、その分布状態に基づいておおよそのエッジ存在領域を推定し、その領域に対して二分検索処理を行う。これにより、紙文書をカラーまたはグレー階調でスキャンした画像について、紙面のエッジに暗い色が載っていても、画像構成色の分布解析によって背景色と前景色の分離境界を推定して、これを分離することができる。
0101・・・画像撮像装置
0102・・・操作端末装置
0103・・・表示端末装置
0104・・・ソータ装置
0105・・・外部記憶装置
0106・・・メモリ
0107・・・中央演算装置
0108・・・内部バス
0109・・・通信装置
Claims (7)
- スキャンして得られ、背景と前景を有する画像データを認識する画像認識装置であって、
前記画像データから複数の格子点を抽出する格子点抽出処理部と、
前記抽出された複数の格子点を用いて画像濃度に関する第1のヒストグラムを生成し、当該第1のヒストグラムから前記背景と前記前景とを分離するための第1の分離閾値を算出し、前記複数の格子点について当該第1の分離閾値を適用し、前記背景と前記前景の境界近傍の格子点を抽出する画像解析部と、
前記境界近傍の前記前景側の格子点と前記背景側の格子点を用いてエッジ推定するエッジ推定処理部と、
前記エッジ推定処理部によって得られた複数のエッジ点を用いて直線近似処理を実行して境界線を取得する境界線取得部と、
を備えることを特徴とする画像認識装置。 - 前記エッジ推定処理部は、前記第1の分離閾値に最も近い前記前景及び背景に属する複数の格子点に対して二分探索処理を実行してエッジを検出することを特徴とする請求項1に記載の画像認識装置。
- さらに、前記前景領域内の画像濃度と前記背景領域内の画像濃度との差分値を用いて、前記境界線取得部によって取得された前記境界線が、前記前景と前記背景を区別する境界として妥当であるか評価する境界評価部を備えることを特徴とする請求項2に記載の画像認識装置。
- 前記境界評価部は、前記画像濃度の差分値が第1の閾値以下となる箇所の個数が所定値未満であるか否か (第1の条件)及び前記背景領域における画像濃度の分散が第2の閾値より大きいか否か(第2の条件)を判断し、前記第1又は第2の条件のいずれかを満足する場合には、前記取得された境界線は妥当であると判断することを特徴とする請求項3に記載の画像認識装置。
- 前記境界評価部は、前記第1及び第2の条件のいずれからも外れる場合には、前記取得された境界線は不適当であると判断し、
この場合、前記画像解析部は、前記取得された境界線の近傍の存在する所定数の画素サンプルを取得し、当該画素サンプルについての第2のヒストグラムを生成し、当該第2のヒストグラムから前記背景と前記前景を分離するための第2の分離閾値を算出し、
前記エッジ推定処理部は、前記第2の分離閾値を用いて前記二分探索処理を実行して複数のエッジ点(修正エッジ点)を検出し、
前記境界線取得部は、前記修正エッジ点を用いて直線近似処理を実行して修正境界線を取得することを特徴とする請求項4に記載の画像認識装置。 - さらに、前記境界線又は前記修正境界線が複数ある場合、対向する2つの境界線又は修正境界線の傾き差を算出し、この傾き差が所定値以上のときに、前記対抗する境界線又は修正境界線を補正する傾き補正部を備えることを特徴とする請求項5に記載の画像認識装置。
- コンピュータを請求項1に記載の画像認識装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009096365A JP5424694B2 (ja) | 2009-04-10 | 2009-04-10 | 画像認識装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009096365A JP5424694B2 (ja) | 2009-04-10 | 2009-04-10 | 画像認識装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010250387A JP2010250387A (ja) | 2010-11-04 |
JP5424694B2 true JP5424694B2 (ja) | 2014-02-26 |
Family
ID=43312674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009096365A Active JP5424694B2 (ja) | 2009-04-10 | 2009-04-10 | 画像認識装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5424694B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977973B (zh) * | 2016-10-25 | 2020-08-11 | 北京东软医疗设备有限公司 | 一种获取医疗诊断图像中限束器照射野边界的方法及装置 |
CN107067012B (zh) * | 2017-04-25 | 2018-03-16 | 中国科学院深海科学与工程研究所 | 基于图像处理的海底地貌单元边缘智能识别方法 |
JP7185477B2 (ja) | 2018-10-12 | 2022-12-07 | 株式会社Pfu | 画像処理装置、制御方法及び制御プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3134292B2 (ja) * | 1990-05-31 | 2001-02-13 | 富士ゼロックス株式会社 | 画像処理装置 |
JP4598426B2 (ja) * | 2004-03-30 | 2010-12-15 | 富士通株式会社 | 境界抽出方法、プログラムおよびこれを用いた装置 |
-
2009
- 2009-04-10 JP JP2009096365A patent/JP5424694B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010250387A (ja) | 2010-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8712188B2 (en) | System and method for document orientation detection | |
US8582888B2 (en) | Method and apparatus for recognizing boundary line in an image information | |
US8559748B2 (en) | Edge detection | |
US20070253040A1 (en) | Color scanning to enhance bitonal image | |
US7715628B2 (en) | Precise grayscale character segmentation apparatus and method | |
US8331670B2 (en) | Method of detection document alteration by comparing characters using shape features of characters | |
US20040170324A1 (en) | Boundary detection method between areas having different features in image data | |
CN103852034B (zh) | 一种电梯导轨垂直度检测方法 | |
JP3830998B2 (ja) | 罫線除去方法及びこれを用いた文字認識装置 | |
US20120082372A1 (en) | Automatic document image extraction and comparison | |
CN111626941A (zh) | 一种基于深度学习语义分割的文档矫正方法 | |
KR100923935B1 (ko) | Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템 | |
US7612918B2 (en) | Image processing apparatus | |
CN113888756A (zh) | 有效区域参数的确定方法、图像获取方法和测试系统 | |
JP5424694B2 (ja) | 画像認識装置、及びプログラム | |
US20050271260A1 (en) | Device, method and program for removing pores | |
JPH09311905A (ja) | 行検出方法および文字認識装置 | |
CN117218672A (zh) | 一种基于深度学习的病案文字识别方法及系统 | |
CN115063375B (zh) | 一种对排卵试纸检测结果进行自动分析的图像识别方法 | |
CN114140620A (zh) | 一种物体直线轮廓检测方法 | |
CN114446447A (zh) | 一种染色体核型图像数据的半自动标注方法 | |
US8355582B2 (en) | Image processing apparatus and image processing method | |
KR100713335B1 (ko) | 이미지 인식방법 | |
JP4741289B2 (ja) | 画像処理装置および画像処理方法 | |
JP2000357287A (ja) | ナンバープレート認識方法および認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130306 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130709 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20130815 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131126 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5424694 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |