JP4163211B2 - 画像処理方法及び画像処理装置 - Google Patents
画像処理方法及び画像処理装置 Download PDFInfo
- Publication number
- JP4163211B2 JP4163211B2 JP2005380121A JP2005380121A JP4163211B2 JP 4163211 B2 JP4163211 B2 JP 4163211B2 JP 2005380121 A JP2005380121 A JP 2005380121A JP 2005380121 A JP2005380121 A JP 2005380121A JP 4163211 B2 JP4163211 B2 JP 4163211B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- color
- image
- image data
- plane
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
(1)ドロップアウトカラー特性バンドの光源で帳票を読み取るOCR用イメージリーダを使用する。例えば、文字認識用の帳票イメージデータを取得するため、赤色光源(又は赤色フィルタ)を照射して、赤系の記入枠をドロップアウトして、帳票を読み取る。
(2)OCR文字認識向けイメージリーダに、フルカラーCCDセンサを搭載したカラーイメージリーダを使用する。このイメージリーダでは、一般のフルカラー読み取りやプレーン画像を読み取ることなどの多目的に利用できるメリットがある。この場合、OCRにて従来使用されている赤ドロップアウトカラーを読み取る場合には、低解像度であるRプレーンを使用する。(例えば、特許文献1参照)。
(1)OCR用イメージリーダを使用する方法では、OCRに用途が限られ、例えば、印影の抽出等他の用途に利用できない。
(2)カラーイメージリーダを使用する方法は、1画素をRGBで構成しているため、ドロップアウトカラー色を利用すると、解像度が低下し、文字認識のエラーレートが高くなる。特に、手書きの漢字を認識することが困難である。
図1は、本発明の一実施の形態の帳票認識装置のブロック図、図2は、図1のカラーイメージリーダの外観図、図3は、図1の画像処理機構のブロック図、図4乃至図7は、図3の各プレーンの生成処理の説明図、図8は、図1の画像処理フロー図である。
+(R×0.25)
R2=(Rb×0.50)+(R×0.50)
R3=(Rb×0.25)+(Rc×0.25)+(R×0.25)
+(Re×0.25)
R4=(Rd×0.50)+(R×0.50)
R5=(Re×0.50)+(R×0.50)
R6=(Rd×0.25)+(Rf×0.25)+(R×0.25)
+(Rg×0.25)
R7=(Rg×0.50)+(R×0.50)
R8=(R×0.25)+(Rg×0.25)+(Re×0.25)
+(Rh×0.25)
次に、図5は、Gプレーンの補完処理を示し、画素Gの周囲の4画素G1〜G4は、以下の式により作成する。
+(G×0.25)
G2=(Gb×0.25)+(Gd×0.25)+(Gf×0.25)
+(G×0.25)
G3=(Gc×0.25)+(G×0.25)+(Gg×0.25)
+(Ge×0.25)
G4=(G×0.25)+(Gf×0.25)+(Gh×0.25)
+(Gg×0.25)
更に、図6は、Bプレーンの補完処理を示し、画素Bの周囲の8画素B1〜B8は、以下の式により作成する。
+(B×0.25)
B2=(Bb×0.50)+(B×0.50)
B3=(Bb×0.25)+(Bc×0.25)+(B×0.25)
+(Be×0.25)
B4=(Bd×0.50)+(B×0.50)
B5=(Be×0.50)+(B×0.50)
B6=(Bd×0.25)+(B×0.25)+(Bf×0.25)
+(Bg×0.25)
B7=(Bg×0.50)+(B×0.50)
B8=(B×0.25)+(Be×0.25)+(Bg×0.25)
+(Bh×0.25)
次に、Yプレーン画像(240dpi)の生成を図7により、説明する。Y画像は、モノクロ画像と称されている。各RGB画像がそれぞれ固有のフィルタを経由して読まれた画像であるため、特定の色成分をドロップアウトしているのに対し、Y画像は、各色の成分をそのまま出力する輝度データである。このYプレーン画像は、RGBプレーン画像から生成できる。即ち、以下の比率計算式により、RGBからYを生成する。
上記式から、明らかなように、Gプレーン画像の比率が高いのは、Gプレーン内に色成分が多く含まれるためである。このように、各RGBを個々に分離し、結合することにより、モノクロ画像を生成できる。
(S100)上位アプリケーション31は、制御部30に読み取りを指示する。読み取り指示は、読み取り指示と、要求画像で構成されている。要求画像は、文字認識画像2値、印影画像2値のように指定される。勿論、この読み取り指示は、イメージリーダ1のベッド10に帳票を搭載した後である。
(S110)制御部30は、イメージリーダ1の読み取り回路12にカラーCCD11の読み取りを指示する。これにより、カラーCCD11は、読み取りを開始し、アンプ13、A/D変換器14を介しRGBデータを出力する。
(S120)このRGBデータは、画像メモリ22に格納される。これにより、読み取りは終了し、オペレータは、帳票を取り外すことができる。
(S130)この格納後、制御部30の指示により、画像処理部21は、上位の要求した画像を生成する前述の画像処理を行う。これにより、画像処理部21の図示しないメモリに各プレーン画像が格納される。
(S140)制御部30は、上位の要求画像をプレーンメモリから上位アプリケーション31に通知する。OCR画像は、OCRエンジン32で文字認識処理される。
[OCR画像生成]
以下、実施例として240dpi赤ドロップアウトカラー画像作成の例で説明する。
1)生起確率(i)= 濃度分布(i) ÷ 全体画素数
2)濃度平均(i)= 生起確率(i) × i
3)全体濃度平均= 濃度平均(0) + ......+濃度平均(255)
4)生起確率xi = 生起確率xi+生起確率(i)
5)濃度平均xi = 濃度平均xi+濃度平均(i)
6)分母 = 生起確率xi×(1.0−生起確率xi)
7)クラス間分散(i)= ((全体濃度平均×生起確率xi−濃度平均xi)
×(全体濃度平均×生起確率xi−濃度平均xi)) ÷
分母
尚、i:0〜255である。
更に、2値化されたRプレーン画像を元の大きさに戻す。即ち、4倍拡大処理62して、240dpi輝度信号とフィルタマスクするために元の大きさ240dpiの画像データ63に戻す。
黒領域の濃度平均:b#ave= 濃度分布0 〜 Otの濃度平均
白領域の濃度平均:w#ave= 濃度分布Ot 〜 255の濃度平均
かすれ範囲の下限bt= ((1.0-a)× ot)+(a×b#ave)
かすれ範囲の上限wt= ((1.0-b)× ot)+(b×w#ave)
上記の推定エリア(wt〜bt)の濃度値の注目画素に対して、Niblack2値化を行い、それ以外のb#aveのエリアの画素は黒,w#aveエリアの画素は白と判断することにより、大幅な高速処理が可能である。a,bの比率は大きくすれば局所2値化の部分が多くなるが、あまり大きくしてしまうと手書き文字を2値化する場合には無駄な処理になってしまう。今回の実施例では、カスレ範囲の係数をa=0.35,b=0.62(全体の5〜8%をNiblack処理:文字記入数により比率は変動する)にすることで、100パーセント処理を行った画像と同等レベルの結果が得られた。
上述の実施の態様の他に、本発明は、次のような変形が可能である。
(1)OCR帳票を、振込み依頼書を例に説明したが、預金引出し、新規預金等の他のOCR帳票に適用できる。更に、OCR帳票に限らず、他の画像処理用帳票に適用できる。
(2)カラー読み取り素子を、CCDで説明したが、CMOSセンサ等他の読み取り素子を利用できる。
(3)ドロップアウトカラーを赤色系で説明したが、他の色であっても良い。
2 処理装置
20 CPU
21 画像メモリ
22 画像処理機構
30 制御部
31 上位アプリケーション
4 帳票
11 カラーCCD
Claims (3)
- 帳票イメージをカラーセンサで読み取ったカラー画像データからOCR用画像データを生成する画像処理方法において、
前記カラー画像データから輝度データを生成するステップと、
前記カラー画像データから認識すべき文字以外の色をドロップアウトした色の画像データを抽出するステップと、
前記ドロップアウトした色の画像データで前記輝度データをフィルタリングして、前記OCR用画像データを作成するステップとを有し、
前記生成ステップは、
前記カラー画像データから2値化された輝度データを生成するステップであり、前記抽出ステップは、
前記カラー画像データから前記ドロップアウトした色の画像データを抽出し、補完処理して、前記色のプレーンデータを作成するステップと、
前記プレーンデータを2値化処理して、前記色の画像データを作成するステップとからなり、
前記色の画像データを作成するステップは、
前記プレーンデータのプレーンを縮小し、前記縮小されたプレーンデータの濃度平均に基づいて、2値化閾値を算出するステップと、
前記縮小されたプレーンデータを前記2値化閾値で2値化し、前記2値化されたプレーンデータのプレーンを拡大して、前記色の画像データを作成するステップとを有する
ことを特徴とする画像処理方法。 - 請求項1の画像処理方法において、
前記生成ステップは、
多値の前記カラー画像データから多値の輝度データを生成するステップと、
前記多値の輝度データに対し、設定された矩形フィルタ内の濃度分散値から2値化処理するステップとを有することを
特徴とする画像処理方法。 - 帳票イメージを読み取り、カラー画像データを生成するイメージリーダと、
前記カラー画像データから輝度データを生成し、且つ前記カラー画像データから認識すべき文字以外の色をドロップアウトした色の画像データを抽出し、前記ドロップアウトした色の画像データで前記輝度データをフィルタリングして、前記OCR用画像データを作成する画像処理ユニットとを有し、
前記画像処理ユニットは、
前記カラー画像データから2値化された輝度データを生成し、前記カラー画像データから前記ドロップアウトした色の画像データを抽出し、補完処理して、前記色のプレーンデータを作成し、前記プレーンデータを2値化処理して、前記色の画像データを作成し、
前記画像処理ユニットは、前記色の画像データを作成するため、
前記プレーンデータのプレーンを縮小し、前記縮小されたプレーンデータの濃度平均に基づいて、2値化閾値を算出し、前記縮小されたプレーンデータを前記2値化閾値で2値化し、前記2値化されたプレーンデータのプレーンを拡大して、前記色の画像データを作成する
ことを特徴とする画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005380121A JP4163211B2 (ja) | 2005-12-28 | 2005-12-28 | 画像処理方法及び画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005380121A JP4163211B2 (ja) | 2005-12-28 | 2005-12-28 | 画像処理方法及び画像処理装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000174170A Division JP3785306B2 (ja) | 2000-06-09 | 2000-06-09 | 画像処理方法及びその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006134355A JP2006134355A (ja) | 2006-05-25 |
JP4163211B2 true JP4163211B2 (ja) | 2008-10-08 |
Family
ID=36727777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005380121A Expired - Fee Related JP4163211B2 (ja) | 2005-12-28 | 2005-12-28 | 画像処理方法及び画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4163211B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7445364B2 (ja) * | 2019-07-04 | 2024-03-07 | 富士通フロンテック株式会社 | 画像処理プログラム、画像処理方法、及び画像処理装置 |
-
2005
- 2005-12-28 JP JP2005380121A patent/JP4163211B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006134355A (ja) | 2006-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10455117B2 (en) | Image processing apparatus, method, and storage medium | |
US8761511B2 (en) | Preprocessing of grayscale images for optical character recognition | |
CN101860653B (zh) | 图像处理装置、图像形成装置以及图像处理方法 | |
JP2007507802A (ja) | デジタル画像におけるテキスト状エッジの強調 | |
JP5701181B2 (ja) | 画像処理装置、画像処理方法及びコンピュータプログラム | |
JP2003228712A (ja) | イメージからテキスト状のピクセルを識別する方法 | |
CN105407251B (zh) | 图像处理装置及图像处理方法 | |
US5388167A (en) | Document image processing system and document image processing method | |
JP2003152995A (ja) | 画像処理装置 | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
CN108877030B (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
JP4441300B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 | |
CN110807747B (zh) | 一种基于前景蒙版的文档图像降噪方法 | |
JP4163211B2 (ja) | 画像処理方法及び画像処理装置 | |
US6983071B2 (en) | Character segmentation device, character segmentation method used thereby, and program therefor | |
US20120141022A1 (en) | Electronic document generation system, electronic document generation method, and program | |
JP3785306B2 (ja) | 画像処理方法及びその装置 | |
US6750986B1 (en) | Color image processing method with thin-line detection and enhancement | |
Murguia | Document segmentation using texture variance and low resolution images | |
JP4383429B2 (ja) | 帳票イメージ処理方法及びその装置 | |
JP3839221B2 (ja) | 帳票イメージ処理方法及びその装置 | |
JP4008715B2 (ja) | 帳票読取装置および帳票読取処理用プログラム | |
JP4228905B2 (ja) | 画像処理装置及びプログラム | |
JP3949954B2 (ja) | ドロップアウトカラー識別処理プログラム、方法、および装置 | |
JP3020293B2 (ja) | 属性判別方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080623 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080722 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080723 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110801 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130801 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |