JP3545227B2 - 画像処理方法及び装置、光学式文字読取装置 - Google Patents
画像処理方法及び装置、光学式文字読取装置 Download PDFInfo
- Publication number
- JP3545227B2 JP3545227B2 JP32212498A JP32212498A JP3545227B2 JP 3545227 B2 JP3545227 B2 JP 3545227B2 JP 32212498 A JP32212498 A JP 32212498A JP 32212498 A JP32212498 A JP 32212498A JP 3545227 B2 JP3545227 B2 JP 3545227B2
- Authority
- JP
- Japan
- Prior art keywords
- reference range
- pixels
- line
- value
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000003672 processing method Methods 0.000 title claims description 10
- 238000012015 optical character recognition Methods 0.000 title description 2
- 238000012545 processing Methods 0.000 claims description 78
- 238000000034 method Methods 0.000 claims description 27
- 238000007493 shaping process Methods 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000003287 optical effect Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
【発明の属する技術分野】
この発明は、例えば光学式文字読取(OCR:Optical Character Recognition)装置において、文字認識率を向上させるための画像処理技術に関する。
【0002】
【従来の技術】
画像に含まれている文字をコンピュータなどの情報機器上で処理できるようにするため、上記文字を認識して適切な文字コードに変換する光学式文字読取装置が多用されている。この種の光学式文字読取装置は、例えばイメージスキャナと画像処理装置とを含んで構成される。画像処理装置は、図8に示されるように、画像入力部11、文字切出部12、前処理部13、文字認識部14、及び結果出力部15を有する。
【0003】
画像入力部11はイメージスキャナによって取り込まれた画像データを入力する。入力された画像データは、文字切出部12に送られ、文字部分のみ(以下、「文字画像データ」)が切り出される。切出された文字画像データは、前処理部13のフィルタ処理部16において、文字パターンの整形処理がなされる。この整形処理は、具体的には、文字画像データを3×3、または4×4の固定された参照画素で区切り、これを予め用意されたマスクパターンで整形する処理(フィルタ処理)である。一般に、このような固定された参照画素は、参照範囲固定フィルタと呼ばれる。この参照範囲固定フィルタを用いたフィルタ処理により、パターン整形された文字画像データは、文字認識部14で文字認識がなされ、対応する文字コードに変換される。この文字コードは、結果出力部15によりディスプレイに表示され、あるいはプリンタにより印刷される。
【0004】
【発明が解決しようとする課題】
上述した画像処理装置において、文字認識部14による認識率は、入力される画像データの品質に大きく依存する。このため、ファクシミリ通信等で受信した画像をイメージスキャナで読み取り、これを画像データとして入力した場合は、文字の掠れなどによる文字パターン品質の劣化によって認識率が著しく低下する。特に、ファクシミリ通信によって受信した画像においては、受信するファクシミリ装置のセンサの感度不良によって黒画素の白画素化(縦方向に白い線が入る現象)が起こったり、ファクシミリ装置の2値化閾値が固定であることにより薄く書かれた文字が掠れる場合がある。これらの不具合は、認識率低下の主要因となっている。
【0005】
さらに、従来の画像処理装置では、参照範囲固定フィルタが3×3、または4×4という狭い画素範囲であり、且つ固定された範囲で文字パターンを整形している。そのため、文字の重要な構成要素である微小な黒点の塊を雑音として除去したり、黒点をつなげるのが望ましい箇所であっても黒点をつなげないという不適切な整形処理が生じ、結果として認識率が低下するという問題があった。このような問題を解決するために、参照範囲固定フィルタの画素を5×5以上とする方法が考えられる。しかし、参照範囲を拡張した場合、処理量がその2乗に比例して増加するため、マスクパターンの設計が複雑になるという新たな不具合があった。
【0006】
そこでこの発明は、パターン整形を適切に行うことができる画像処理方法及びこの方法の実施に適した文字認識装置を提供することを課題とする。
本発明の他の課題は、文字画像データの文字認識を行う際の認識率を向上させることができる光学式文字読取装置を提供することにある。
【0007】
【課題を解決するための手段】
上記課題を解決する本発明の画像処理方法は、複数の画素から成る画像データの整形を行う装置における画像処理方法であって、前記装置が、下記の処理ステップを少なくともこの順に実行することを特徴とする。
(1−1)前記画像データを所定の参照範囲毎に走査し、これらの参照範囲のうち、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っている参照範囲を特定するステップ、
(1−2)特定された前記参照範囲の外部画素を参照して当該参照範囲がラインパターンであるか否かを判定するステップ、
(1−3)ラインパターンであると判定された参照範囲内で前記ラインの両側に隣接する前記所望値以外の値を有する画素をつなげるように、前記ラインを構成する画素のうち少なくともn個の画素値を変換するステップ。
【0008】
本発明の他の画像処理方法は、前記装置が、下記の処理ステップを少なくともこの順に実行することを特徴とする。
(2−1)前記画像データを画素数i×kの参照範囲(iとkは1より大きい奇数)毎に走査し、各参照範囲において、当該参照範囲が、その中央に位置する画素の値のみが同一範囲内の他の画素と異なる独立パターンであるか否かを判定するステップ、
(2−2)前記独立パターンでないと判定された参照範囲のそれぞれに対し、同一範囲内のすべての画素の値に即して当該参照範囲の中央に位置する画素の値を設定するステップ。
【0009】
本発明の他の画像処理方法は、前記装置が、下記の処理ステップを少なくともこの順に実行することを特徴とする。
(3−1)前記画像データを所定数の画素で構成される第1参照範囲毎に走査し、これらの第1参照範囲のうち、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っている第1参照範囲を特定するステップ、
(3−2)特定された第1参照範囲の外部画素を参照して当該第1参照範囲がラインパターンであるか否かを判定するラインパターン判定ステップ、
(3−3)ラインパターンであると判定された第1参照範囲内で前記ラインの両側に隣接する前記所望値以外の値を有する画素をつなげるように、前記ラインを構成する画素のうち少なくともn個の画素値を変更するステップ、
(3−4)画素値が変更された後の画像データを、画素数i×kの第2参照範囲(iとkは1より大きい奇数)毎に走査し、各第2参照範囲において、当該第2参照範囲の中央に位置する画素の値のみがこの第2参照範囲内の他の画素と異なる独立パターンであるか否かを判定するステップ、
(3−5)独立パターンでないと判定された第2参照範囲のそれぞれに対し、同一範囲内のすべての画素の値に即して当該第2参照範囲の中央に位置する画素の値を設定するステップ。
【0010】
上記他の課題を解決する本発明の画像処理装置は、複数の画素から成る画像データを所定の参照範囲毎に走査し、これらの参照範囲のうち、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っている参照範囲を特定する参照範囲特定手段と、特定された前記参照範囲の外部画素を参照して当該参照範囲がラインパターンであるか否かを判定するラインパターン判定手段と、ラインパターンであると判定された参照範囲内で前記ラインの両側に隣接する前記所望値以外の値を有する画素をつなげるように、前記ラインを構成する画素のうち少なくともn個の画素値を変換する変換手段とを備えて構成される。
この画像処理装置によれば、まずラインパターンの可能性のある参照範囲が特定され、この後にラインパターンであるか否かが判定される。ラインパターンであると判定された参照範囲では、ライン両側の所望値以外の画素がこのラインを横切るようにつなげられる。
【0011】
前記参照範囲特定手段は、前記特定した参照範囲に代えて、当該参照範囲内の前記ラインの両側のそれぞれに前記所望値以外の値を有する画素が1つ以上隣接している拡張参照範囲を特定することができるものである。
【0012】
前記ラインパターン判定手段は、例えば、前記ラインを当該ラインの双方向に前記参照範囲外へ所定の画素数mだけ延長したとき、延長されたラインに位置するm×n×2個の画素のすべてが前記所望の値を有する画素である場合、当該参照範囲をラインパターンであると判定するように構成する。このようにすれば、ラインパターンの可能性のある参照範囲に対して、部分的に参照範囲が拡張され、より正確なラインパターンの判定が可能となる。
なお、前記ラインは、前記特定された参照範囲を縦方向、横方向、または斜め方向に横切るものである。
【0013】
本発明の他の画像処理装置は、複数の画素から成る画像データを、画素数i×kの参照範囲(iとkは1より大きい奇数)毎に走査し、各参照範囲において、当該参照範囲が、その中央に位置する画素の値のみが同一範囲内の他の画素の値と異なる独立パターンであるか否かを判定する独立パターン判定手段と、前記独立パターンでないと判定された参照範囲のそれぞれに対し、同一範囲内のすべての画素の値に即して当該参照範囲の中央に位置する画素の値を設定する設定手段とを備えて構成される。この画像処理装置によれば、まず、参照範囲毎に独立パターンであるか否かが判定され、この後、独立パターンでない参照範囲の中央に位置する画素に対し、この中央の画素以外の画素に即して、画素値の設定処理が行われる。
【0014】
前記設定手段は、例えば、前記独立パターン判定手段により独立パターンであると判定された参照範囲のそれぞれに対し、当該参照範囲を外部方向に所定の画素数だけ拡張した拡張参照範囲を特定し、この拡張参照範囲内の画素の値に即して当該参照範囲の中央に位置する画素の値を設定するように構成する。このようにすれば、独立パターンと判定された参照範囲が拡張され、中央の画素の値を適切に設定することができる。この場合、好ましくは、前記拡張参照範囲内の前記参照範囲を除く、拡張された範囲の画素の値に即して前記中央に位置する画素の値を設定する。
【0015】
前記設定手段は、また、前記独立パターン判定手段により独立パターンであると判定された参照範囲のそれぞれに対し、前記中央に位置する画素の値が前記参照範囲に隣接した外部画素すべての値と異なっている場合、前記中央に位置する画素の値を変更するように構成する。
【0016】
本発明の他の画像処理装置は、複数の画素から成る画像データを所定数の画素で構成される第1参照範囲毎に走査し、これらの第1参照範囲のうち、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っている第1参照範囲を特定する参照範囲特定手段と、特定された前記第1参照範囲の外部画素を参照して当該第1参照範囲がラインパターンであるか否かを判定するラインパターン判定手段と、ラインパターンであると判定された第1参照範囲内で前記ラインの両側に隣接する前記所望値以外の値を有する画素をつなげるように、前記ラインを構成する画素のうち少なくともn個の画素値を変更する変換手段と、この変換手段により画素値が変更された後の画像データを、画素数i×kの第2参照範囲(iとkは1より大きい奇数)毎に走査し、各第2参照範囲において、当該第2参照範囲の中央に位置する画素の値のみが同一範囲内の他の画素と異なる独立パターンであるか否かを判定する独立パターン判定手段と、前記独立パターンでないと判定された第2参照範囲のそれぞれに対し、同一範囲内のすべての画素の値に即して当該第2参照範囲の中央に位置する画素の値を設定する設定手段とを備えて構成される。
【0017】
本発明の光学式文字読取装置は、文字パターンを含む原画像を画像データとして取り込む画像データ取込手段と、取り込まれた画像データを入力して当該画像データに含まれる文字パターンの整形を行う上記のいずれかの画像処理装置と、この画像処理装置で整形された文字パターンの認識を行う文字認識手段とを備えて構成されるものである。
【0018】
【発明の実施の形態】
以下、本発明の画像処理装置の実施の形態を説明する。
この画像処理装置は、入力された画像データに含まれる文字パターンを適切に整形し、整形後の文字パターンの文字認識を行うもので、図1に示すように、画像入力部1、文字切出部2、前処理部3、文字認識部4、結果出力部5を含んで構成される。画像データは、イメージスキャナ等の画像取込手段で、所定の解像度で取り込まれた白画素(白点)及び黒画素(黒点)の組み合わせから成る二値画像データとする。
【0019】
画像入力部1は、画像データを本装置に入力するものであり、文字切出部2は、この入力された画像データのうち、文字パターンが記録されているデータ(文字画像データ)を切り出すものである。切り出し範囲の特定は、文字パターンの外接矩形を検出することにより自動で行ってもよく、本装置のオペレータがポインティングデバイスによって任意に選択した範囲を検出することにより行うようにしてもよい。
【0020】
前処理部3は、文字切出部2によって切り出された文字画像データ内の文字パターンを整形するもので、2ドット幅白ライン補完処理部31と、参照可変フィルタ処理部32とを有している。
【0021】
2ドット幅白ライン補完処理部31は、文字パターンの重要な構成要素である微小な黒点を雑音として除去することなく、文字線切れの接続を行うために設けられる。特に、従来のような3×3画素の固定的な参照範囲ではつなげることのできない2ドット幅の文字線切れを接続することができるようにする。そのための主な処理としては、4×4画素の参照範囲で文字画像データを走査し、2ドット幅の白ラインを有するラインパターンの可能性のある参照範囲を特定する。そして、この参照範囲に対して、周辺の画素状況に即してラインパターンであるか否かを判定する。さらに、判定された参照範囲に対して、ラインの両側にある黒点をつなげるように、2ドット幅白ラインの所定の画素を反転させる。
【0022】
なお、「ラインパターン」とは、センサ感度の不良などによって生じた不確実な画素値が並ぶラインを有するパターンを意味する。この実施形態では、例えばファクシミリ装置のセンサ感度の不良によって白点となった白ラインを対象とするが、このラインパターンは、必ずしも白ラインのみを意味しているのではなく、この発明が適用される装置によっては、ラインパターンが、他の情報(色)を示すラインである可能性もある。
【0023】
参照可変フィルタ処理部32は、処理量の増加を最小限に抑えながら文字画像データに含まれる雑音成分の除去及び平滑化を行う。そのための主な処理としては、例えば3×3画素の参照範囲で文字画像データを走査し、同一範囲内の中央の画素値をその周辺画素値に即して設定する。但し、参照範囲が、後述する所定の条件を満足する場合は、参照範囲を5×5画素に拡張し、この拡張された参照範囲(拡張参照範囲)内の画素状況に即して中央の画素値を設定する。
【0024】
文字認識部4は、前処理部3によって整形された文字パターンを認識し、対応する文字コードに変換する。結果出力部5は、変換された文字コードにしたがって、認識結果をディスプレイに表示したり、プリント出力する。
【0025】
次に、この実施形態の画像処理装置を用いた画像処理方法を説明する。
文字切出部2で切り出された文字画像データは、前処理部3の2ドット幅白ライン補完処理部31に送られる。2ドット幅白ライン補完処理部31では、図2に示す手順で補完処理を行う。
【0026】
まず、4×4画素から成る参照範囲毎に文字画像データを走査し、2ドット幅の白ラインを有するラインパターンの候補(白ライン候補)を特定する(ステップS1)。この白ライン候補は、例えば図3の例において、以下の3つの条件を満足する参照範囲が該当する。
(1)参照範囲R1のうち、画素A、B、C、Dのいずれかの画素が黒である。
(2)参照範囲R1のうち、画素a、b、c、dのいずれかの画素が黒である。
(3)参照範囲R1のうち、ハッチングされた画素がすべて白である。
【0027】
次に、抽出された各白ライン候補に対し、参照範囲に含まれている白ラインが、文字線切れを示す白ラインであるか否か、すなわち、ラインパターンであるか否かを判定する(ステップS2)。ここでは、白ラインのライン双方向それぞれに所定の画素数mだけ拡張した部分に位置する画素を調べる。図3の例の場合は、画素Xの画素値を調べ、すべての画素Xが白画素であれば白ライン候補に含まれている白ラインが、文字線切れを示す白ラインである、すなわち参照範囲がラインパターンであると判定する(ステップS2:YES)。
【0028】
参照範囲がラインパターンであると判定された場合は、この参照範囲に対して白黒反転処理を施す(ステップS3)。つまり、白ライン候補の白ラインが文字線切れを示すものであるため、この文字切れを修正する。この場合は、参照範囲内の白ラインのうち、少なくとも2つの画素が、白から黒に反転される。このとき、反転される画素は、画素A〜Dと画素a〜dの黒画素の組み合わせによって異なる。この一例を図4に示す。このような白黒反転処理の規則は、予め2ドット幅白ライン補完処理部31に記憶されている。
ステップS2の処理において、拡張された複数の画素のうち、黒画素が含まれている場合には、白ライン候補に含まれている白ラインが文字線切れを示す白ラインではない、すなわち参照範囲がラインパターンではないと判定する(ステップS3:NO)。この場合には、参照範囲内の画素に対して白黒反転の処理は行わない。
【0029】
以上のようにして横方向の処理が完了した後は、縦方向の白ラインについての処理を行う。この場合の処理は、横方向について行ったステップS1〜S3の処理と同様なので、ここでは説明を省略する。
【0030】
この2ドット幅白ライン補完処理部31による補完処理により、文字線切れの接続が実現される。特に、白ライン候補に対しては参照範囲外の画素も調べられた上でラインパターンの判定が行われるため、本来分離するべき画素を誤って接続する危険性が抑えられる。
【0031】
補完処理が施された文字画像データは、参照範囲可変フィルタ処理部32に送られる。参照範囲可変フィルタ処理部32では、図5に示す手順でフィルタ処理を行う。
まず、2ドット幅白ライン補完処理部31から送られた文字画像データを3×3画素毎に走査し、参照範囲を特定する(ステップS11)。そして、各参照範囲において、その中央に位置する画素(図6の画素e)のみが黒画素で、同一範囲の他の画素のすべて(図6の画素a、b、c、d、f、g、h、i)が白画素かどうかを判定する(ステップS12)。中央に位置する画素eが黒画素または白画素であり、他の画素a、b、c、d、f、g、h、iのいずれかが黒画素である場合は(ステップS12:NO)、下記(1)式による合計値sの計算を行う(ステップS13)。
s=a+b+c+d+4e+f+g+h+i・・・(1)
但し、a〜iの値は、白画素であれば“0”、黒画素であれば“1”として計算する。
【0032】
計算の結果、合計値sが“4”より大きい場合(ステップS14:YES)、画素eが黒を示すように画素値を設定する(ステップS15)。一方、合計値sが“4”以下であった場合は(ステップS14:NO)、画素eが白を示すように画素値を設定する(ステップS16)。
【0033】
また、ステップS12において、中央に位置する画素(図6の画素e)のみが黒画素で、他の画素のすべての画素(図6の画素a、b、c、d、f、g、h、i)が白画素であった場合は(ステップS12,YES)、3×3画素の参照範囲を5×5画素の参照範囲に拡張する(拡張参照範囲)。これにより、図6に示される、3×3画素の参照範囲に隣接した画素Xが、拡張参照範囲に含まれることになる。この拡張参照範囲のうち、拡張された部分に含まれる画素Xのすべてが白画素であった場合(ステップS17:YES)、画素eは、白を示すように画素値を変更する(ステップS16)。一方、拡張された部分の画素Xのうち、少なくとも1つの画素が黒画素である場合(ステップS17:NO)、画素eは、そのまま黒を示すように画素値を維持する(ステップS15)。
以上のようなフィルタ処理により、文字画像データの雑音が除去され、また、平滑化が行われる。
【0034】
このように、参照範囲可変フィルタ処理部32では、基本的には3×3画素の参照範囲でフィルタ処理を行い、雑音成分が存在する可能性のある参照範囲については、範囲を5×5画素に拡張して真に雑音成分であるか否かを判定し、これにより白黒反転処理を施しているので、処理量の増加を最小限に抑えながら適切な白黒反転処理を施すことができる。このようにしてフィルタ処理が施された文字画像データは、文字認識部4で文字認識処理が行われ、対応する文字コードに変換される。文字認識部4による文字認識処理の結果は、結果出力部5により、ディスプレイに表示されたり、プリンタから印刷される。
【0035】
本実施形態の画像処理装置を光学式文字読取装置に適用した場合は、イメージスキャナ等によって取り込まれ、文字切出部2で切り出された文字画像データが、前処理部3において、センサ感度不良などによる白ラインが補完され、雑音成分のフィルタ処理がなされる。補完に際しては、線切れの可能性のある白ライン候補に対しては参照範囲外の画素も調べた上で判定を行うため、本来分離するべき画素を誤って接続する危険性が抑えられる。また、フィルタ処理では、基本的には3×3画素を参照範囲とするが、雑音による黒点の可能性のある参照範囲については、参照範囲を5×5画素に拡張し、拡張された部分の画素を参照して白黒反転処理を行うようにしたので、処理量の増加を抑えながら適切なフィルタリングが可能になる。
【0036】
従来の前処理部13(フィルタ処理部16)と本実施形態による前処理部3によるパターン整形の結果を比較した例を図7に示す。図7(a)は、原パターンであり、この原パターンに対して従来の前処理部(3×3画素の固定型参照範囲)でパターン整形を行った結果が図7(b)である。一方、この実施形態の前処理部3による結果は、図7(c)に示されるようになり、文字切れの接続が従来に比べて良好に行われていることがわかる。
【0037】
このような適正なパターン整形の結果、文字認識部4における文字認識率が、従来よりも飛躍的に向上する。約2万パターンのファクシミリ入力文字に対して実験を行ったところ、従来の参照範囲(3×3画素)において認識できなかった文字パターンに対し、その約22%を正しく認識することができるようになった。
【0038】
なお、上述した2ドット幅白ライン補完処理部31による補完処理は、2ドット幅の白ラインを検出して文字切れを接続するものであるが、目的に応じてドット幅や対象色を適宜変更してもよい。また、必要に応じて基本の参照範囲を4×4画素以外の画素に設定してもよい。
【0039】
また、上述した参照範囲可変フィルタ処理部32によるフィルタ処理では、中央に位置する画素eの画素値を上記(1)式の計算式にしたがって設定しているが、このような計算式ではなく、3×3画素の組み合わせ(512通り)に対する画素eの設定情報を予め記憶しておき、この設定情報にしたがって画素値eの画素値を設定するように構成してもよい。
【0040】
また、本実施形態のフィルタ処理では、拡張参照範囲が5×5画素の例を示したが、これに限らず、5×5画素よりも多い画素数の組み合わせから成る拡張参照範囲を用いてもよい。
【0041】
なお、本発明の画像処理装置は、光学式文字読取装置以外の同種の文字認識系機器にも同様に適用が可能なものである。
【0042】
【発明の効果】
以上の説明から明らかなように、本発明によれば、パターンの整形を適切に行うことができるので、例えば文字パターンを含む画像データにおける文字認識率が、従来手法に比べて著しく向上するという、特有の効果がある。
【図面の簡単な説明】
【図1】この発明に係る画像処理装置を機能構成図。
【図2】2ドット幅白ライン補完処理部による全体的な処理手順を示す説明図。
【図3】2ドット幅白ライン補完処理部の補完処理の手順説明図。
【図4】2ドット幅白ライン補完処理部の補完処理の手順説明図。
【図5】参照範囲可変フィルタ処理部による処理手順を示す説明図。
【図6】参照範囲可変フィルタ処理部のフィルタ処理の手順説明図。
【図7】従来のパターン整形と本実施形態によるパターン整形との比較結果を示したもので、(a)は原パターン、(b)は従来の参照範囲固定フィルタ(3×3画素)でパターン整形を行った結果、(c)は本実施形態により拡張した参照範囲でパターン整形を行った結果である。
【図8】従来の画像処理装置の機能構成図。
【符号の説明】
1 画像入力部
2 文字切出部
3 前処理部
4 文字認識部
5 結果出力部
31 2ドット幅白ライン補完処理部
32 参照範囲可変フィルタ処理部
Claims (13)
- 複数の画素から成る画像データに含まれる文字画像データ内の文字パターンの整形を行う装置における画像処理方法であって、前記装置が、
前記文字画像データを所定の参照範囲毎に走査し、これらの参照範囲のうち、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っている参照範囲を特定するステップと、
特定された前記参照範囲の外部画素を参照して当該参照範囲がラインパターンであるか否かを判定するステップと、
ラインパターンであると判定された参照範囲内で前記ラインの両側に隣接する前記所望値以外の値を有する画素をつなげるように、前記ラインを構成する画素のうち少なくともn個の画素値を前記所望値以外の値に変換するステップとを少なくともこの順に実行することを特徴とする画像処理方法。 - 複数の画素から成る画像データに含まれる文字画像データ内の文字パターンの整形を行う装置における画像処理方法であって、前記装置が、
前記文字画像データを所定の参照範囲毎に走査し、これらの参照範囲のうち、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っている参照範囲を特定するステップと、
特定された前記参照範囲の外部画素を参照して当該参照範囲がラインパターンであるか否かを判定するステップと、
ラインパターンであると判定された参照範囲内で前記ラインの両側に隣接する前記所望値以外の値を有する画素をつなげるように、前記ラインを構成する画素のうち少なくともn個の画素値を前記所望値以外の値に変換するステップとを少なくともこの順に実行することで文字認識の前処理を行うことを特徴とする画像処理方法。 - 複数の画素から成る画像データに含まれる文字画像データ内の文字パターンの整形を行う装置における画像処理方法であって、前記装置が、
前記文字画像データを所定数の画素で構成される第1参照範囲毎に走査し、これらの第1参照範囲のうち、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っている第1参照範囲を特定するステップと、
特定された第1参照範囲の外部画素を参照して当該第1参照範囲がラインパターンであるか否かを判定するラインパターン判定ステップと、
ラインパターンであると判定された第1参照範囲内で前記ラインの両側に隣接する前記所望値以外の値を有する画素をつなげるように、前記ラインを構成する画素のうち少なくともn個の画素値を前記所望値以外の値に変換するステップと、
画素値が変更された後の画像データを、画素数i×kの第2参照範囲(iとkは1より大きい奇数)毎に走査し、各第2参照範囲において、当該第2参照範囲の中央に位置する画素の値のみがこの第2参照範囲内の他の画素と異なる独立パターンであるか否かを判定するステップと、
前記判定するステップで否と判定された第2参照範囲に対して、当該第2参照範囲内のすべての画素の値に即して当該第2参照範囲の中央に位置する画素の値を設定するステップとを少なくともこの順に実行することで文字認識の前処理を行うことを特徴とする画像処理方法。 - 複数の画素から成る画像データに含まれる文字画像データを所定の参照範囲毎に走査し、これらの参照範囲のうち、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っている参照範囲を特定する参照範囲特定手段と、
特定された前記参照範囲の外部画素を参照して当該参照範囲がラインパターンであるか否かを判定するラインパターン判定手段と、
ラインパターンであると判定された参照範囲内で前記ラインの両側に隣接する前記所望値以外の値を有する画素をつなげるように、前記ラインを構成する画素のうち少なくともn個の画素値を前記所望値以外の値に変換する変換手段と、
を備えることを特徴とする画像処理装置。 - 複数の画素から成る画像データに含まれる文字画像データを所定の参照範囲毎に走査し、これらの参照範囲のうち、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っている参照範囲を特定する参照範囲特定手段と、
特定された前記参照範囲の外部画素を参照して当該参照範囲がラインパターンであるか否かを判定するラインパターン判定手段と、
ラインパターンであると判定された参照範囲内で前記ラインの両側に隣接する前記所望値以外の値を有する画素をつなげるように、前記ラインを構成する画素のうち少なくともn個の画素値を前記所望値以外の値に変換する変換手段と、
を備えて前記文字画像データ内の文字パターンの整形を行って文字認識の前処理を行うことを特徴とする画像処理装置。 - 前記参照範囲特定手段は、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っており、当該ラインの両側に、前記所望値以外の値を有する画素が、それぞれ1つ以上隣接している参照範囲を特定することを特徴とする、請求項4又は5記載の画像処理装置。
- 前記ラインパターン判定手段は、前記ラインを当該ラインの双方向に前記参照範囲外へ所定の画素数mだけ延長したとき、延長されたラインに位置するm×n×2個の画素のすべてが前記所望の値を有する画素である場合、当該参照範囲をラインパターンであると判定することを特徴とする、請求項4〜6のいずれかに記載の画像処理装置。
- 前記ラインは、前記特定された参照範囲を縦方向、横方向、または斜め方向に横切るものであることを特徴とする、請求項4〜7のいずれか記載の画像処理装置。
- 複数の画素から成る画像データに含まれる文字画像データを所定数の画素で構成される第1参照範囲毎に走査し、これらの第1参照範囲のうち、所望の値を有する画素で構成され且つ所定の画素数n(nは2以上の実数)の幅を有するラインが横切っている第1参照範囲を特定する参照範囲特定手段と、
特定された前記第1参照範囲の外部画素を参照して当該第1参照範囲がラインパターンであるか否かを判定するラインパターン判定手段と、
ラインパターンであると判定された第1参照範囲内で前記ラインの両側に隣接する前記所望値以外の値を有する画素をつなげるように、前記ラインを構成する画素のうち少なくともn個の画素値を前記所望値以外の値に変換する変換手段と、
この変換手段により画素値が変更された後の画像データを、画素数i×kの第2参照範囲(iとkは1より大きい奇数)毎に走査し、各第2参照範囲において、当該第2参照範囲の中央に位置する画素の値のみが同一範囲内の他の画素と異なる独立パターンであるか否かを判定する独立パターン判定手段と、
前記判定するステップで否と判定された第2参照範囲に対して、当該第2参照範囲内のすべての画素の値に即して当該第2参照範囲の中央に位置する画素の値を設定する設定手段とを備えて前記文字画像データ内の文字パターンの整形を行って文字認識の前処理を行う画像処理装置。 - 前記設定手段は、前記独立パターン判定手段により独立パターンであると判定された参照範囲のそれぞれに対し、当該参照範囲を外部方向に所定の画素数だけ拡張した拡張参照範囲を特定し、この拡張参照範囲内の画素の値に即して当該参照範囲の中央に位置する画素の値を設定することを特徴とする、請求項9記載の画像処理装置。
- 前記設定手段は、前記拡張参照範囲内の前記参照範囲を除く、拡張された範囲の画素の値に即して前記中央に位置する画素の値を設定することを特徴とする、請求項10記載の画像処理装置。
- 前記設定手段は、前記独立パターン判定手段により独立パターンであると判定された参照範囲のそれぞれに対し、前記中央に位置する画素の値が前記参照範囲に隣接した外部画素すべての値と異なっている場合、前記中央に位置する画素の値を変更することを特徴とする、請求項11記載の画像処理装置。
- 文字パターンを含む原画像を画像データとして取り込む画像データ取込手段と、取り込まれた画像データを入力して当該画像データに含まれる文字パターンの整形を行う請求項4乃至12のいずれかの項記載の画像処理装置と、この画像処理装置で整形された文字パターンの認識を行う文字認識手段と を備えて成る光学式文字読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32212498A JP3545227B2 (ja) | 1998-11-12 | 1998-11-12 | 画像処理方法及び装置、光学式文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32212498A JP3545227B2 (ja) | 1998-11-12 | 1998-11-12 | 画像処理方法及び装置、光学式文字読取装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000148909A JP2000148909A (ja) | 2000-05-30 |
JP3545227B2 true JP3545227B2 (ja) | 2004-07-21 |
Family
ID=18140203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP32212498A Expired - Lifetime JP3545227B2 (ja) | 1998-11-12 | 1998-11-12 | 画像処理方法及び装置、光学式文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3545227B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4189654B2 (ja) * | 2003-04-18 | 2008-12-03 | セイコーエプソン株式会社 | 画像処理装置 |
KR100902491B1 (ko) | 2007-04-27 | 2009-06-10 | 금오공과대학교 산학협력단 | 숫자 영상 처리 시스템 및 그 방법 |
-
1998
- 1998-11-12 JP JP32212498A patent/JP3545227B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2000148909A (ja) | 2000-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6160913A (en) | Method and apparatus for digital halftone dots detection and removal in business documents | |
JP4327101B2 (ja) | コード認識方法及び装置 | |
JPH0898035A (ja) | 画像処理方法および画像処理装置 | |
US8611658B2 (en) | Image processing apparatus and image processing method | |
JP2002135592A (ja) | 画像処理装置及び記録媒体 | |
JP2000184202A (ja) | 走査により生成した画像上における垂直方向に並んだパタ―ンを除去するための画像処理システム | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
JPH09130614A (ja) | 画像処理装置 | |
KR100513784B1 (ko) | 영상 개선 방법 및 장치 | |
JP3545227B2 (ja) | 画像処理方法及び装置、光学式文字読取装置 | |
US6983071B2 (en) | Character segmentation device, character segmentation method used thereby, and program therefor | |
JP5975945B2 (ja) | 画像処理装置 | |
US6181437B1 (en) | Image processing apparatus capable of producing images without jaggies at edges | |
JP4227530B2 (ja) | 画像処理装置および画像処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム | |
US6661535B1 (en) | Moire fringe eliminating apparatus and a method for eliminating moire fringes | |
EP0715274B1 (en) | An optical character recognition apparatus and a method for selecting an operational mode thereof | |
JP2001283212A (ja) | ベクタ変換下地補間方法 | |
JP2002133424A (ja) | 文書の傾き角度及び境界の検出方法 | |
JP3336046B2 (ja) | 像域分離装置 | |
KR101786734B1 (ko) | 문자 세선화 장치 및 방법 | |
JPH10229497A (ja) | 画像処理方法、画像処理装置および記憶媒体 | |
JP2789647B2 (ja) | 線画像認識方法 | |
JP4248700B2 (ja) | 罫線識別方法、罫線識別装置および記録媒体 | |
JP2001307097A (ja) | パターン検出装置及び方法 | |
JP4218179B2 (ja) | パターン検出装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040407 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090416 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090416 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100416 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110416 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120416 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130416 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130416 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140416 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |