JP2008204203A - 文字列画像の画像処理方法,そのプログラム及びその装置 - Google Patents
文字列画像の画像処理方法,そのプログラム及びその装置 Download PDFInfo
- Publication number
- JP2008204203A JP2008204203A JP2007040052A JP2007040052A JP2008204203A JP 2008204203 A JP2008204203 A JP 2008204203A JP 2007040052 A JP2007040052 A JP 2007040052A JP 2007040052 A JP2007040052 A JP 2007040052A JP 2008204203 A JP2008204203 A JP 2008204203A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- column
- character string
- procedure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【解決手段】2値画像における連結画素のうち所定の文字画像の条件及び相対的な位置関係の条件を満たす文字候補画像を特定し(S3,S4),それを含む文字列包含推定領域の画像について,一列分の文字列の画像の列幅範囲を推定し(S7),その範囲の列領域画像の列直交方向の投影データの上限制限データの相互相関関数から,列領域画像相互の列方向位置ずれ量を求め(S11),そのずれ量を修正した画像全体における列直交方向の投影データの上限制限データに基づいて,各文字画像の存在領域の位置を特定する(S16)。
【選択図】図2
Description
ところで,製造や物流の現場では,被管理部材の移動や汚れ,他の部材との接触,不十分な照明など,印字や撮像の環境が良くないことに起因し,被管理部材の撮像画像における前記検出対象文字列の画像の品質が悪い場合がある。例えば,前記検出対象文字列の画像において,複数列の文字列相互間の位置ずれや,文字画像のにじみや一部欠損(文字画像の乱れ)などが生じる場合がある。
図12は,一部の文字画像について画像品質が劣悪な2値画像の一例である。図12に示す例は,2列分の文字列からなる検出対象文字列の画像のうち,一方の列の文字列画像の品質が汚れ等によって劣悪な状態となっている例である。
被管理部材を正しく管理するためには,撮像画像における前記検出対象文字列の画像の品質が悪い場合であっても,撮像画像における各文字画像(前記検出対象文字列を構成する各文字の画像)の存在領域を正しく特定した上で,その領域の画像(文字画像)についてパターン認識等による文字認識を行う必要がある。
これに対し,例えば,特許文献1には,文字列の画像について,所定条件を満たす連続画素である文字候補の画像を抽出し,その文字候補の画像から相互間の配置が所定条件を満たすものの外接矩形から文字の切り出し領域(文字領域)を決定する方法が示されている。
また,特許文献2には,文字列の画像について,文字列方向の投影データに基づいて文字列の列サイズ(文字高さ)を求め,さらに,文字列方向に直交する方向の投影データに基づいて行サイズ(文字幅)を求め,そのようにして求めた列サイズ及び行サイズに基づいて文字の切り出し位置を特定する方法が示されている。
また,前記検出対象文字列を構成する文字の一部について,汚れや照明不良,他の部材との接触等の問題により,文字画像と文字画像との間の隙間(無画像の領域)が明確でない場合がある。例えば,ある文字画像が隣接する他の文字画像と連結した状態(以下,連結状態という)となっていたり,或いは本来1つの連結画素であるはずの文字画像が複数の連結画素に断裂した状態(以下,断裂状態という)となっていたりする場合がその典型例である。
そのように前記検出対象文字列の画像の品質が悪い状況下においても,各文字画像の存在領域を極力正しく特定できることが望ましい。
しかしながら,特許文献1に示される技術は,前記検出対象文字列の画像全体において,各文字画像の外接矩形(連結画素の外接矩形)相互の位置関係がほぼ予め定められた位置関係からほぼずれがないことを前提としている。このため,複数列の前記検出対象文字列における一列分の文字列それぞれの画像相互の列方向の位置ずれが大きい場合,特許文献1に示される技術では,各文字画像の存在領域を正しく特定できないという問題点があった。
また,前記検出対象文字列を構成する文字の一部について,その文字画像が前記連結状態や前記断裂状態となっている場合,即ち,1つの連結画素と1つの文字画像とが1対1に対応していない場合,連結画素の外接矩形相互の位置関係が予め定められた位置関係を満たさず,特許文献1に示される技術では,やはり各文字画像の存在領域を正しく特定できないという問題点があった。
一方,特許文献2に示される技術は,前記検出対象文字列の画像における列方向の投影データに基づいて一列分の文字列それぞれの存在範囲を特定した上で,一列分の文字列の範囲の画像それぞれについて,列方向に直交する方向の投影データに基づいて,各文字画像の領域を特定するものである。このため,複数列の前記検出対象文字列における一列分の文字列それぞれの画像相互の列方向の位置ずれが比較的大きくても,特許文献2に示される技術によれば,一列分の文字列それぞれの存在領域を正しく特定できる。
しかしながら,前記検出対象文字列を構成する文字の一部について,文字画像と文字画像との間の隙間が明確でない場合,そのような文字画像を含む列については,特許文献2に示される技術により列方向に直交する投影データに基づいて文字領域の特定を行っても,各文字画像の存在領域を正しく特定できないという問題点があった。
従って,本発明は上記事情に鑑みてなされたものであり,その目的とするところは,複数列の文字列からなる検出対象文字列の画像について各文字画像の領域を特定する場合に,一列分の文字列それぞれの画像相互の列方向の位置ずれが大きい場合や,前記検出対象文字列を構成する文字の一部について,文字画像と文字画像との間の隙間が明確でない場合であっても,各文字画像の存在領域を極力正しく特定できる文字列画像の画像処理方法,そのプログラム及びその装置を提供することにある。
(1)前記読み出しデータに基づいて,前記2値画像における連結画素のうち予め定められた文字画像の条件を満たすものを特定する第1の文字候補特定手順。
(2)前記第1の文字候補特定手順により特定された前記連結画素のうちその相対的な位置関係が,前記文字配置条件における文字相互の相対的な位置関係を所定の誤差範囲内で満たすものを特定する第2の文字候補特定手順。
(3)前記第2の文字候補特定手順により特定された前記連結画素である文字候補画像それぞれの位置及び寸法と前記文字配置条件と予め定められた文字配置の変動範囲とに基づいて,前記2値画像において前記文字候補画像の全てを含む領域であって前記検出対象文字列の画像全体を含む領域を推定する文字列包含領域推定手順。
(4)前記2値画像における前記文字列包含領域推定手順により推定された領域である文字列包含推定領域の画像について予め定められた処理を行うことにより,前記検出対象文字列を構成する一列分の文字列の画像それぞれの列方向に直交する列直交方向における存在範囲を推定する列幅範囲推定手順。
(5)前記文字列包含領域の画像における前記列幅範囲推定手順により推定された範囲それぞれの画像である列領域画像について前記列直交方向の投影データ又はその投影データについて上限値を制限する補正処理を施したデータの分布を算出する第1の列直交方向投影データ算出手順。
(6)前記第1の列直交方向投影データ算出手順による算出データに基づいて,列方向のシフト量を変数とする相互相関関数を導出する相互相関関数導出手順。
(7)前記相互相関関数導出手順により得られた前記相互相関関数に基づいて,前記列領域画像相互の列方向の位置ずれ量である列相互ずれ量を導出する列相互ずれ量導出手順。
(8)複数の前記列領域画像それぞれを前記列相互ずれ量だけ位置修正した画像全体における前記列直交方向の投影データ又はその投影データについて上限値を制限する補正処理を施したデータの分布を算出する第2の列直交方向投影データ算出手順。
(9)前記第2の列直交方向投影データ算出手順による算出データに基づいて,前記列領域画像それぞれにおける前記検出対象文字列を構成する各文字の画像の存在領域の位置を特定する文字領域特定手順。
なお,前記予め定められた文字画像の条件は,例えば,連結画素の外接矩形の大きさ,連結画素の外接矩形の縦横比,連結画素の面積,連結画素とその外接矩形との面積比,及び連結画素の周囲長の2乗とその面積との比,のうちの少なくとも1つが予め定められた範囲内にあることである。
また,例えば前記プロセッサが,前記列相互ずれ量算出手順において,前記相互相関関数導出手順により得られた前記相互相関関数における最大の相関値に対応する列方向のシフト量に基づいて前記列相互ずれ量を導出することが考えられる。
(10)前記2値画像における前記文字列包含推定領域の画像について列方向の投影データの分布を算出する列方向投影データ算出手順。
(11)前記列方向投影データ算出手順による算出データに基づいて,前記検出対象文字列を構成する一列分の文字列の画像それぞれの前記列直交方向における存在範囲を推定する範囲推定手順。
この(10)及び(11)に示す手順による処理の一例は,特許文献1に示される文字列を切り出すステップにおける処理である。
その他,一列分の文字列の画像の前記列直交方向における位置ずれをほとんど考慮しなくてよい場合には,前記プロセッサが,前記文字列包含推定領域を既知の文字列の列数で等分割することによって一列分の文字列の画像それぞれの前記列直交方向における存在範囲を推定することも考えられる。
また,本発明において,前記プロセッサが,さらに次の(12)及び(13)に示す各手順を自動的に実行することが考えられる。
(12)前記相互相関関数導出手順により得られた前記相互相関関数における複数の相関値のピーク相互の間隔と前記文字配置条件における一列の文字数とに基づいて,前記列領域画像それぞれにおける前記検出対象文字列の画像が存在する範囲の列方向の長さを算出する列長さ算出手順。
(13)前記第2の列直交方向投影データ算出手順による算出データについて,列方向における複数の基準位置それぞれを基準として前記列長さ算出手順による算出結果である列長さの範囲内の値の積算値又は平均値を算出し,その算出値が最大となるときの前記基準位置と前記列長さとに基づいて,前記列領域画像における処理対象範囲を特定する列領域画像処理対象範囲特定手順。
なお,この場合,前記プロセッサは,前記文字領域特定手順において,前記列領域画像処理対象範囲特定手順により特定された前記処理対象範囲を対象に前記検出対象文字列を構成する各文字の画像の存在領域を特定する。
同様に,本発明は,以上に示した本発明に係る文字画像の画像処理方法における各手順を実行する手段を備えた文字画像の画像処理装置として具現されることも考えられる。なお,所定のプログラムを実行することにより,以上に示した本発明に係る文字画像の画像処理方法における各手順を実行するコンピュータ(情報処理装置)が,本発明に係る文字画像の画像処理装置の典型例である。
ここに,図1は本発明の実施形態に係る文字画像の画像処理装置Zの概略構成を表すブロック図,図2は画像処理装置Zによる文字画像切出し・文字認識処理の手順を表すフローチャート,図3は画像処理装置Zによる画像処理の対象となる2値画像の一例を表す図,図4は2値画像における文字画像の候補の一例を表す図,図5は検出対象文字列における文字配置条件を模式的に表した図,図6は2値画像における文字画像の候補相互の位置関係を表した図,図7は画像処理装置Zにより特定される文字列包含推定領域の画像の一例を表す図,図8は文字列包含推定領域の画像及びその画像における列方向の投影データ分布の一例を表す図,図9は文字列包含推定領域における列領域画像及びその画像における列直交方向の投影データ分布の一例を表す図,図10は列領域画像の列直交方向の投影データを補正したデータの相互相関関数の一例を表すグラフ,図11は列領域画像の列方向の位置ずれを修正した画像及びその画像全体の列直交方向の投影データの上限を補正したデータの分布の一例を表す図,図12は一部の文字画像について画像品質が劣悪な2値画像の一例を表す図である。
前記画像処理装置Zは,コンピュータであり,図1に示すように,CPU41,カメラインターフェース42,画像メモリ43,画像処理部44,表示部45,汎用メモリ46及び通信部47を備えている。
前記画像処理装置Zは,前記検出対象文字列の画像cが形成された被管理部材1をカメラ3(撮像手段)で撮像して得られた画像データに基づく2値画像のデータを前記画像メモリ43から読み出し,その読み出しデータ(2値画像のデータ)に基づいて,前記2値画像における前記検出対象文字列を構成する各文字の画像の存在領域を特定し,特定した各文字の画像の存在領域から文字画像を抽出するとともに,抽出した文字画像について文字認識処理を自動的に実行する装置である。
前記被管理部材1は,例えばスラブやビレットなどであり,その表面に前記検出対象文字列の画像cが印字されている。
前記検出対象文字列は,複数列の文字列からなり,文字寸法と一列の文字数及び文字間隔と列数と列間隔とが所定の文字配置条件を満たす文字列である。また,前記検出対象文字列を構成する各文字の画像は,印字不良や汚れ,照明不良などに起因する画質の悪化がない場合,本来は連結画素からなる画像である。
図5は,検出対象文字列における文字配置条件を模式的に表した図である。
前記検出対象文字列は,複数列の文字列からなり,各文字の外接矩形の高さFH及び横幅FW,一列の文字数NC及び文字間隔dFW,列数NL,列間隔dFHが既知である。図5は,一列の文字数NCが3個であり,列数NLが2列であることを表している。これらFH,FW,NC,dFW,NL,dFHの情報を含む文字配置条件の情報が,前記汎用メモリ46に予め記憶されており,前記CPU41は,その文字配置条件の情報を必要に応じて参照する。
前記画像メモリ43は,カメラ3による撮像画像のデータや,その2値画像のデータなど,各種の画像データを記憶する記憶手段である。
前記画像処理部44は,不図示のROMに予め記憶されたプログラムを実行するプロセッサであり,前記画像メモリ43から画像データを読み出し,読み出した画像データについて各種の画像処理(画像データの加工)を行うとともに,その画像処理後の画像データを前記画像メモリ43に記憶させる。
なお,前記CPU41及び前記画像処理部44が,本発明に係る文字画像の画像処理方法における各手順を実行するプロセッサの一例である。また,前記CPU41及び前記画像処理部44それぞれによって実行されるプログラムが,本発明に係る文字画像の画像処理プログラムの一例である。
前記表示部45は,前記画像メモリ43に記憶された画像データに基づく画像を表示するとともに,前記CPU41から引き渡される情報を画像として表示する映像表示手段である。
前記汎用メモリ46は,前記CPU41によって読み書きされる各種データや,前記CPU41によって実行されるプログラムを記憶する不揮発性メモリであり,例えばハードディスクやフラッシュメモリなどである。
前記通信部47は,前記被管理部材1に関する情報を管理するホストコンピュータと通信を行う通信手段であり,前記検出対象文字列の画像cに基づく文字認識処理によって得られた管理情報(前記検出対象文字列が表す情報)を前記ホストコンピュータに送信するものである。
[ステップS1,S2]
まず,CPU41が,不図示のセンサの検出信号に基づいてカメラ3の正面付近に被管理部材1が到達したことを検知すると,カメラインターフェース42が,カメラ3に撮像を実行させるとともにその撮像画像のデータをカメラ3から取得し,その画像データを画像メモリ43に記憶させる(S1)。
さらに,CPU41の制御指令に従って,画像処理部44が,画像メモリ43に記憶された撮像画像データに2値化処理を施し,その2値化処理により得られる2値画像のデータを画像メモリ43に記憶させる(S1)。
図3は,ステップS1で得られる2値画像(画像処理装置Zによる画像処理の対象)の一例を表す図である。
図3において,一列目の文字列"71C"及び二列目の文字列"07B"からなる2列の文字列の画像が,前記検出対象文字列の2値画像の一例である。
次に,画像処理部44は,画像メモリ43に記憶された前記2値画像のデータに基づいて,その2値画像に含まれる連結画素を抽出してラベリングを行う(S2)。
次に,画像処理部44が,画像メモリ43から2値画像のデータを読み出し,その2値画像のデータに基づいて,前記2値画像における連結画素それぞれについて予め定められた文字画像の条件(以下,文字画像条件という)を満たすか否かを判別し,前記2値画像における連結画素のうち前記文字画像条件を満たすものを第1文字候補の画像として特定する(S3,前記第1の文字候補特定手順の一例)。なお,特定結果は,連結画素のラベル情報(連結画素の識別情報)に対応づけられて前記画像処理部44が備える不図示のメモリに記憶される。
例えば,カメラ3と検出対象文字列の画像cとの距離がほぼ一定であることが保証される場合には,前記文字画像条件を,連結画素の外接矩形の大きさ(高さ及び横幅)が,前記文字画像条件における文字の外接矩形の高さFH及び横幅FWに対して所定の誤差範囲内であるという条件とすることや,或いは連結画素の面積(画素数)が予め定められた範囲内であるという条件とすること等が考えられる。
また,カメラ3と検出対象文字列の画像cとの距離が比較的大きく変動し得る場合には,前記文字画像条件を,連結画素の外接矩形の縦横比が,前記文字画像条件における文字の外接矩形の高さFHと横幅FWとの比(縦横比)に対して所定の誤差範囲内であるという条件とすることや,或いは連結画素とその外接矩形との面積比,又は連結画素の周囲長の2乗とその面積との比が予め定められた範囲内にあるという条件とすること等が考えられる。
また,以上に例示した各条件のうちの複数を同時に満たす連結画素を前記第1文字候補の画像として特定することも考えられる。なお,前記文字画像条件に関する情報は,予め汎用メモリ46に記憶され,画像処理部44がその情報を参照する。
図4は,図3に示した2値画像において,ステップS3の処理によって前記第1文字候補の画像として特定された連結画素ch11〜ch16についてその外接矩形を破線で表した図である。
また,複数の文字画像のうち,その画質が悪いもの(例えば,前記連結状態や前記断裂状態となっているもの)は,このステップS3において第1文字候補の画像として特定されない(候補から漏れる)場合がある。図4において,前記検出対象文字列における一列目の先頭文字"7"は,前記断裂状態となっているため文字画像の候補から漏れることになる。
次に,画像処理部44は,ステップS3で特定した前記連結画素(前記第1文字候補の画像)のうち,その相対的な位置関係が前記文字配置条件(図5参照)における文字相互の相対的な位置関係を所定の誤差範囲内で満たすものを第2文字候補の画像として特定する(S4,前記第2の文字候補特定手順の一例)。なお,特定結果は,連結画素のラベル情報(連結画素の識別情報)に対応づけられて前記画像処理部44が備える不図示のメモリに記憶される。
より具体的には,画像処理装置4は,前記第1文字候補の画像の中から1つの候補をリーダーch1sとして順次選択し,そのリーダーch1sと他の全ての前記第1文字候補の画像ch1iそれぞれとの相対的な位置関係が,後述する(1)式で表される条件及び同(2)式で表される条件の両方(以下,文字配置許容条件という)を満たすか否かを判別し,その判別結果を画像処理部44が備えるメモリに記憶する。
そして,前記第1文字候補の画像全てについて,そのそれぞれをリーダーch1sとして上記判別処理を終了した後に,前記第1文字候補の画像の中で,いずれの前記第1文字候補の画像をリーダーch1sとした場合でも常に前記文字配置許容条件を満たすものを前記第2文字候補の画像(前記文字候補画像に相当)として特定(選択)する。
或いは,リーダーch1sを選択するごとに,そのリーダーch1sとそのリーダーch1sとの位置関係が前記文字配置許容条件を満たす他の全ての第1文字候補の画像とを1つのグループとして設定し,全ての前記第1文字候補の画像それぞれをリーダーch1sとして上記グループの設定を行った後に,そのグループに属する前記第1文字候補の画像の数(グループの要素数)が最も多いグループを選択し,そのグループに属する前記第1文字候補の画像を前記第2文字候補の画像として特定すること等も考えられる。
図6は,リーダーch1sとそのリーダーと位置比較の対象となる他の前記第1文字候補の画像ch1iとの位置関係を表した図である。
画像処理部44は,ステップS4において,リーダーch1sの外接矩形の列方向の寸法W(文字の幅)と,リーダーch1sの外接矩形の列方向に直交する方向(以下,列直交方向という)の寸法H(文字高さ)と,リーダーch1sにおける基準点P0sとそのリーダーとの比較対象となる他の前記第1文字候補の画像ch1sにおける基準点P0iとの間の列方向の位置の差分dWと,リーダーch1sの基準点P0sと他の前記第1文字候補の画像ch1sの基準点P0iとの間の列直交方向の位置の差分dHとを検出する。
なお,図6に示す例では,前記基準点P0s,P0iは,前記第1文字候補の画像(連結画素)の外接矩形における一の頂点であるが,全ての第1文字候補の画像について同じ位置条件の点であれば,他の点(例えば,外接矩形の中央の点など)が基準点であってもかまわない。
この(1)式及び(2)式は,ステップS3で特定した前記第1文字候補の画像(連結画素)の中から,その相対的な位置関係が前記文字配置条件における文字相互の相対的な位置関係(前記検出対象文字列における文字相互の相対的な位置関係)を所定の誤差範囲内で満たすか否かを判別するための条件式の一例である。
このように,ステップS3及びステップS4において,連結画素単体の条件(前記文字画像条件)と,複数の連結画素相互間の配置条件との両方を判別し,文字画像の候補を特定する条件を厳しくすることにより,前記第2文字候補の画像それぞれは,ほぼ確実に前記検出対象文字列を構成する文字の画像であるといえる状態となる。但し,文字画像の候補を特定する条件を厳しくすればするほど,実際は文字画像を表す連結画素が,その画質や位置の乱れによって文字画像の候補から漏れることはあり得る。
次に,画像処理部44は,ステップS4で特定した連結画素である前記第2文字候補の画像(前記文字候補画像に相当)それぞれの位置(前記基準点の位置)及び寸法(W,H)と前記文字配置条件と予め定められた文字配置の変動範囲とに基づいて,前記2値画像において前記第2文字候補の画像全てを含む領域であって前記検出対象文字列の画像全体を含む領域を推定する(S5,前記文字列包含領域推定手順の一例)。このステップS5で推定される領域を,以下,文字列包含推定領域という。また,ステップS5の処理による推定結果(前記文字列包含推定領域を表す座標情報)は,画像処理部44が備える不図示のメモリに記憶される。
図7は,ステップS5で特定される前記文字列包含推定領域A1の画像の一例を表す図である。例えば,画像処理部44は,以下の手順で前記文字包含推定領域A1を推定する。
まず,画像処理部44は,前記第2文字候補の画像の全体の外接矩形の領域A0の中心点Q0の位置を算出する。
さらに,画像処理部44は,前記第2文字候補の画像の前記基準点P0iそれぞれの列方向の間隔dWの平均値と,前記文字配置条件における一列の文字数NCと,列方向の前記変動範囲を表す所定の係数(1より大きい値の係数)とを乗算して得られる値を前記文字列包含推定領域A1の列方向の長さLa1として算出する。
さらに,画像処理部44は,前記第2文字候補の画像の前記基準点P0iそれぞれの前記列直交方向の間隔dHの平均値と,前記文字配置条件における列数NLと,前記列直交方向の前記変動範囲を表す所定の係数(1より大きい値の係数)とを乗算して得られる値を前記文字列包含推定領域A1の列直交の幅Wa1として算出する。
そして,画像処理部44は,前記中心点Q0を中心として,列方向における長さLa1の範囲及び列直交方向における幅Wa1の範囲を,前記文字列包含推定領域A1とする。
従って,前記第2文字候補の画像の位置及び寸法と前記文字配置条件と予め定められた文字配置の変動範囲とに基づく領域推定を行えば,前記検出対象文字列を構成する全ての文字の画像をほぼ確実に含む前記文字列包含推定領域A1を推定(特定)できる。その文字列包含推定領域A1を特定する処理がステップS5の処理である。
図7に示すように,前記文字列包含推定領域A1の画像は,ステップS3及びS4において文字候補の画像として特定されなかった文字"7"の画像も包含する。但し,前記文字列包含推定領域A1は,前記検出対象文字列の画像の実際の存在領域に対し,前記予め定められた文字配置の変動範囲の分だけ余分な領域を含んでいる。
以下,画像処理部44は,前記文字列包含推定領域A1の画像について,文字画像の存在領域の特定処理を実行する。
次に,画像処理部44は,前記2値画像における前記文字列包含推定領域A1の画像について,以下に示すステップS6及びS7の処理(予め定められた処理の一例)を行うことにより,前記検出対象文字列を構成する一列分の文字列の画像それぞれの列方向に直交する列直交方向における存在範囲を推定する(S6,S7:前記列幅範囲推定手順の一例)。
即ち,画像処理部44は,まず,前記2値画像における前記文字列包含推定領域A1の画像について,列方向の投影データの分布を算出する(S6,前記列方向投影データ算出手順の一例)。
次に,画像処理部44は,ステップS6での算出データ(列方向の投影データの分布)に基づいて,前記検出対象文字列を構成する一列分の文字列の画像それぞれの前記列直交方向における存在範囲(以下,列範囲という)を推定する(S7,前記範囲推定手順の一例)。なお,ステップS6の処理による算出結果(列方向の位置と対応づけられた投影データ)と,ステップS7の処理による推定結果(前記列範囲を表す座標情報)は,画像処理部44が備える不図示のメモリに記憶される。
図8は,前記文字列包含推定領域A1の画像及びその画像における列方向の投影データIxの分布の一例を表す図である。
図8からわかるように,文字列の画像が存在する列直交方向の範囲(文字高さの範囲)において,列方向の投影データIxの値が高くなり,文字列の列間(隙間)の範囲において,列方向の投影データIxの値が低くなる。
画像処理部44は,列方向の投影データIxの分布において谷を形成する部分の位置(列直交方向の位置)を特定し,その位置を一列分の文字列の画像それぞれの区切り位置ymとすることにより前記列範囲それぞれを特定(推定)する。
図8に示す例は,列方向の投影データIxの分布において,投影データが所定のしきい値Ixsを下回る範囲(y1〜y2の間の範囲)の中央の位置を,複数の前記列範囲A11,A12それぞれの区切り位置ymとする例である。なお,前記しきい値Ixsは,例えば,列方向の投影データIxの平均値に所定の係数(0より大きく1より小さい係数)を乗算して得られる値,或いは予め定められた定数などである。
また,特許文献1において文字列を切り出すステップとして示される処理を,このステップS7において実行してもよい。
その他,一列分の文字列の画像の前記列直交方向における位置ずれをほとんど考慮しなくてよい場合には,前記文字列包含推定領域A1を既知の文字列の列数NLで等分割することにより,前記列範囲A11,A12(一列分の文字列の画像それぞれの前記列直交方向における存在範囲)を推定することも考えられる。
次に,画像処理部44は,前記文字列包含領域A1の画像における前記列範囲A11,A12の画像(以下,列領域画像g11,g12という)それぞれについて,列直交方向の投影データの分布を算出する(S8)。このステップS8の処理による算出結果(列直交方向の位置と対応づけられた投影データ)は,画像処理部44が備える不図示のメモリに記憶される。
図9は,前記文字列包含推定領域A1における列領域画像g11,g12及びその画像における列直交方向の投影データIy1,Iy2(以下,第1投影データという)の分布の一例を表す図である。
図9からわかるように,列領域画像g11,g12それぞれについて,文字画像が存在する列方向の範囲(文字幅の範囲)において,前記第1投影データIy1,Iy2の値が高く(山に)なり,文字間(隙間)の範囲において,前記第1投影データIy1,Iy2の値が低く(谷に)なる。また,列方向における文字画像の幅及び間隔がほぼ一定であるので,文字列の画像が存在する範囲においては,前記第1投影データIy1,Iy2の山の幅及びピッチがほぼ一定である。
一方,ノイズ画像が存在する場合には,そのノイズ画像が存在する範囲についても,前記第1投影データIy1,Iy2の値が高く(山に)なる。但し,通常は,文字画像とノイズ画像とでは,その画像に対応する前記第1投影データIy1,Iy2の山のピッチが異なる。
次に,画像処理部44は,ステップS8で算出した前記第1投影データIy1,Iy2(列直交方向の投影データ)それぞれについて,上限値を制限する補正処理を施し,補正後のデータ(以下,補正第1投影データIy1’,Iy2’という)を算出する(S9)。このステップS9の処理による算出結果(列直交方向の位置と対応づけられた補正後の投影データ)は,画像処理部44が備える不図示のメモリに記憶される。なお,ステップS8及びS9が,前記第1の列直交方向投影データ算出手順の一例である。
例えば,画像処理部44は,次の(3)式に基づいて,前記第1投影データIy1,Iy2から前記補正第1投影データIy1’,Iy2’を算出する。
図9には,(3)式に基づく補正処理後の前記補正第1投影データIy1’,Iy2’の分布のグラフ(黒塗りグラフ)も示されている。
この補正により,文字画像に対応する前記補正第1投影データIy1’,Iy2’が,文字画像それぞれの形状の違いに起因する値の変化が少ないデータとなり,文字画像が存在する範囲であるか否かを2値的に表すデータとなる。
本実施形態では,移行の処理において,列直交方向の投影データについて,その上限を制限する補正処理を施したデータを用いて文字画像領域の特定処理を行う。しかしながら,その補正を行わずに列直交方向の投影データそのものを用いて以降に示す文字画像領域の特定処理を実行することも考えられる。但し,上限を制限する補正処理を施したデータを用いた方が,文字画像領域をより正確に特定する上で好適である。
次に,CPU41が,ステップS9で算出した前記補正第1投影データIy1’,Iy2’(ステップS8の処理で算出された前記第1投影データについて上限値を制限する補正処理を施したデータ)に基づいて,列方向のシフト量kを変数とする相互相関関数を導出する(S10,前記相互相関関数導出手順の一例)。なお,列方向のシフト量kは,列方向の位置のずらし量或いは列方向の位置のオフセット量と同義である。
このステップS10において,CPU41は,複数の前記列領域画像g11,g12の中から基準とする1つの列領域画像を選択し,その基準とする列画像領域についての前記補正第1投影データと,その他の全ての列画像領域それぞれについての前記補正第1投影データとの間の相互相関関数R(k)を導出する。
図10は,前記列領域画像の前記補正第1投影データ(列直交方向の投影データを補正したデータ)の相互相関関数R(k)の一例を表すグラフである。
図10からわかるように,前記補正第1投影データの相互相関関数R(k)は,あるシフト量kpで最大の相関値Rmaxを頂点とするピーク(山)と,そのピークを中心とするほぼ左右対称の位置(シフト量kを座標とする位置)において生じる相対的に高さが低いピークとが形成される値分布を有する。
文字画像の寸法及び一列分の文字列における文字画像の間隔が概ね一定であれば,前記相互相関関数R(k)において,そのシフト量kが一列分の文字列の画像(前記列領域画像)相互の列方向のずれ量と一致するときに最も相関値Rが高くなる。また,その現象は,一部の文字画像の画質の乱れの影響を受けにくい。
そこで,CPU41は,次のステップS11において,前記相互相関関数R(k)それぞれについて最大相関値Rmaxに対応するシフト量kpを検出(導出)し,そのシフト量kpを,基準とする列領域画像とその他の列領域画像それぞれとの間の(相互の)列方向の位置ずれ量Δxi(以下,列相互ずれ量という)として設定する(S9,前記列相互ずれ量導出手順の一例)。設定結果Δxi(=kp)は前記汎用メモリ46に記憶される。
なお,基準とする列領域画像についての前記列相互ずれ量はゼロである。
次に,CPU41は,ステップS10の処理により得られた前記相互相関関数R(k)における相関値のピーク相互の間隔wk(図10参照)と,前記文字配置条件における一列の文字数NCとに基づいて,前記列領域画像g11,g12それぞれにおける前記検出対象文字列の画像が存在する範囲の列方向の長さL(以下,列長さという)を算出する(S12,前記列長さ算出手順の一例)。
例えば,CPU41は,複数の前記相互相関関数R(k)それぞれについて,最大の相関値Rmaxを頂点とするピークとそれに隣接するピークとの間隔wk(以下,ピーク間隔という)を検出し,それらピーク間隔wkの平均値を算出する。
さらに,CPU41は,前記ピーク間隔wkの平均値と一列の文字数NCとを乗算して得られる値,或いはその値に所定の余裕率β(1より大きい定数)を乗算して得られる値を,前記列長さLとして算出する。或いは,前記ピーク間隔wkの最大値と一列の文字数NCとを乗算して得られる値を前記列長さLとして算出することも考えられる。
文字画像の寸法及び一列分の文字列における文字画像の間隔が概ね一定であれば,前記相互相関関数R(k)における前記ピーク間隔wkは,文字画像のピッチに相当する。従って,前記ピーク間隔wkに文字数NCを乗算することにより,前記列長さL(一列分の文字列の画像の列方向の長さ)を算出できる。
次に,画像処理部44が,ステップS9で算出した前記補正第1投影データIy1’,Iy2’それぞれを列方向に前記相互ずれ量Δxiだけシフト(位置修正)する(S13)。以下,前記補正第1投影データIy1’,Iy2’をΔxiだけシフトしたデータをシフト後補正第1投影データIy1”,Iy2”という。
さらに,画像処理部44は,シフト後補正第1投影データIy1”,Iy2”を列直交方向に積算(列方向の位置ごとに積算)し,積算後のデータを画像処理部44が備えるメモリ(不図示)に記憶させる(S14)。
このステップS14で算出される積算後のデータは,複数の前記列領域画像g11,g12それぞれを前記列相互ずれ量Δxiだけ位置修正(シフト)した画像全体における列直交方向の投影データについて上限値を制限する補正処理を施したデータの分布に相当する。このステップS14で算出される積算後のデータを,以下,補正第2投影データIyt’という。なお,ステップS14が,前記第2の列直交方向投影データ算出手順の一例である。
図11は,列領域画像g11,g12の列方向の位置ずれを修正(Δxiだけシフト)した画像g21,g22及びその画像全体の列直交方向の投影データの上限を補正したデータ(前記補正第2投影データIyt’)の分布の一例を表す図である。
図11に示すように,列方向の位置ずれ修正後の画像g21,g22からなる位置ずれ修正後の全体画像g2は,各列における文字画像の配列位置が列直交方向においてほぼ同じ位置に揃った画像となる。また,前記補正第2投影データIyt’において値の山が形成される位置と位置ずれ修正後の全体画像g2における文字画像の位置とが一致する。
このように,前記検出対象文字列において,文字寸法及び一列分の文字列における文字間隔が概ね一定であれば,列方向の位置ずれが修正された後の前記列領域画像g21,g22は,そのいずれにおいても文字画像と文字画像との間の隙間の位置(文字区切りの位置)が概ね一致する。従って,列方向の位置ずれが修正された複数の前記列領域画像全体g2における列直交方向の投影データに基づいて,列方向の位置ずれが修正された複数の列領域画像g21,g22について共通の文字画像の区切り位置を特定できる。
次に,画像処理部44は,ステップS14の処理による算出データ(前記補正第2投影データ)について,列方向の基準位置を変化させながらその基準位置を基準にして前記列長さLを移動平均区間とする移動平均値を算出する(S15)。即ち,画像処理部44は,前記補正第2投影データについて,列方向における複数の基準位置それぞれを基準として前記列長さLの範囲内の値平均値を算出する。
例えば,画像処理部44は,前記列領域画像g11,g12の左端位置(列方向の一方の端部位置)を基準位置の始点とし,基準位置を順次右方向へシフトする(例えば1画素分ずつシフトする)ごとに,その基準位置から右方向(列方向)へ前記列長さLの区間における前記補正第2投影データの平均値(即ち,移動平均値)を算出する。
ここで,ノイズ画像が文字画像をしのぐほど大きい状態でない限り,通常は,前記移動平均値の平均区間に全ての文字画像が含まれるときに,その区間におけるデータの平均値(前記移動平均値)や積算値が最大となる。
そこで,画像処理部44は,前記移動平均値(前記列長さLの区間の平均値)が最大となるときの基準位置と前記列長さLとに基づいて,前記列領域画像g11,g12それぞれにおける処理対象範囲(文字画像の存在領域と特定する処理の対象とする範囲)を特定する(S15,前記列領域画像処理対象範囲特定手順の一例)。
例えば,画像処理部44は,前記移動平均値が最大となるときの前記基準位置xkから右方向(列方向)へ前記列長さLの範囲を前記処理対象範囲Wxとして特定する(図11参照)。そして,ステップS14及びS15の処理結果は,画像処理部44が備える不図示のメモリに記憶される。
このステップS15において特定される処理対象範囲Wxは,ステップS5において推定された前記文字列包含推定領域A1から,列方向における余分な領域(文字画像が存在しない領域)が除かれた範囲である。
なお,ステップS14及びS15における「平均値」を「積算値」に置き換えてもよく,そのように置き換えても結果は同じである。
次に,画像処理部44は,ステップS14の処理で算出した前記補正第2投影データIyt’に基づいて,前記列領域画像g11,g12それぞれにおける前記検出対象文字列を構成する各文字画像の存在領域の位置を特定する(S16,前記文字領域特定手順の一例)。その特定結果は,画像処理部44が備える不図示のメモリに記憶される。その際,画像処理部44は,ステップS15の処理により特定された前記処理対象範囲Wxを対象に前記検出対象文字列を構成する各文字画像の存在領域を特定する。
図11からわかるように,文字列画像が存在する列方向の範囲(文字幅の範囲)において,前記補正第2投影データIyt’の値が高くなり,文字画像と文字画像との間(隙間)の範囲において,前記補正第2投影データIyt’の値が低くなる。そこで,画像処理部44は,ステップS16において,前記補正第2投影データIyt’において谷を形成する部分の位置(列方向の位置)を特定し,その位置を各列における文字画像それぞれの区切り位置とすることにより文字画像それぞれの存在領域を特定する。なお,画像処理部44は,前記列画像領域g11,g12それぞれの列直交方向における範囲(ステップS7で推定した範囲)を,各文字画像の列直交方向の範囲として特定する。
図11において符号A3で示す各領域が,ステップS16において特定される各文字画像の存在領域の一例を表す。図11に示すように,ステップS16において特定される各文字画像の存在領域A3には,ステップS3及びS4において文字候補の画像として特定されなかった文字"7"の画像が存在する領域も含まれる。このように,本発明によれば,画像に乱れがある文字画像についても,その存在領域を正しく特定できる。
以上に示したように,位置ずれが修正された複数の列領域画像g21,g22全体についての列直交方向の投影データに基づいて列方向の文字区切りの位置を特定する処理を行えば,前記検出対象文字列の画像cにおける一部の文字画像に乱れがある場合に,前記列領域画像g11,g12それぞれについて個別に文字画像領域の特定を行う処理に比べ,一部の文字画像の乱れの影響が小さくなる結果,文字画像の区切り位置をより正しく特定できる。
次に,画像処理部44は,ステップS16で特定した文字画像の存在領域A3それぞれから文字画像を切り出す処理(文字画像の抽出処理)を実行する(S17)。切出された(抽出された)文字画像は,前記画像メモリ43に記憶される。
次に,CPU41が,ステップS17で切出された文字画像それぞれについて,予め定められた文字候補の画像とのパターン認識処理を実行することにより,切出された文字画像がいずれの文字を表す画像であるかを特定する文字認識処理を実行する(S18)。
このステップS18において,画像処理部44は,例えば,予め定められた文字候補の画像のデータを教師データとして学習されたニューラルネットワークに対し,ステップS17で切出された文字画像のデータを入力させることにより,前記文字認識処理を実行する。なお,前記ニューラルネットワークを規定する情報は,前記汎用メモリ46に予め記憶されているものとする。
その他,前記汎用メモリ46に文字候補の画像のデータが予め記憶され,その画像データそれぞれとステップS17で切出された文字画像のデータとのパターンマッチング処理を行う前記文字認識処理も考えられる。
最後に,CPU41は,ステップS19の文字認識処理の結果の出力処理を実行する(S19)。例えば,CPU41は,文字認識処理の結果を前記通信部47を通じて前記ホストコンピュータに送信(出力)したり,或いは前記表示部45に表示させる(出力する)処理,或いは前記汎用メモリ46に記録(出力)する処理等を実行する。
以上に示した処理(文字画像の画像処理方法)によれば,複数列の文字列からなる検出対象文字列の画像について各文字画像の領域を特定する場合に,一列分の文字列それぞれの画像相互の列方向の位置ずれが大きい場合や,前記検出対象文字列を構成する文字の一部について,文字画像と文字画像との間の隙間が明確でない場合(例えば,図12に示すような2値画像である場合)であっても,各文字画像の存在領域を極力正しく特定できる。
c :検出対象文字列の画像
1 :被管理部材
2 :搬送手段
3 :カメラ
41:CPU
42:カメラインターフェース
43:画像メモリ
44:画像処理部
45:表示部
46:汎用メモリ
47:通信部
A1:文字列包含推定領域
A11,A12:列範囲
g1,g2:列領域画像
Claims (7)
- 複数列の文字列からなり文字寸法と一列の文字数及び文字間隔と列数と列間隔とが所定の文字配置条件を満たす検出対象文字列の画像が形成された部材を撮像して得られた画像についての2値画像のデータを所定の記憶手段から読み出し,その読み出しデータに基づいて前記2値画像における前記検出対象文字列を構成する各文字の画像の存在領域を特定し,特定した各文字の画像の存在領域から文字画像を抽出する文字列画像の画像処理方法であって,
所定のプロセッサにより,
前記読み出しデータに基づいて,前記2値画像における連結画素のうち予め定められた文字画像の条件を満たすものを特定する第1の文字候補特定手順と,
前記第1の文字候補特定手順により特定された前記連結画素のうちその相対的な位置関係が,前記文字配置条件における文字相互の相対的な位置関係を所定の誤差範囲内で満たすものを特定する第2の文字候補特定手順と,
前記第2の文字候補特定手順により特定された前記連結画素である文字候補画像それぞれの位置及び寸法と前記文字配置条件と予め定められた文字配置の変動範囲とに基づいて,前記2値画像において前記文字候補画像の全てを含む領域であって前記検出対象文字列の画像全体を含む領域を推定する文字列包含領域推定手順と,
前記2値画像における前記文字列包含領域推定手順により推定された領域である文字列包含推定領域の画像について予め定められた処理を行うことにより,前記検出対象文字列を構成する一列分の文字列の画像それぞれの列方向に直交する列直交方向における存在範囲を推定する列幅範囲推定手順と,
前記文字列包含領域の画像における前記列幅範囲推定手順により推定された範囲それぞれの画像である列領域画像について前記列直交方向の投影データ又はその投影データについて上限値を制限する補正処理を施したデータの分布を算出する第1の列直交方向投影データ算出手順と,
前記第1の列直交方向投影データ算出手順による算出データに基づいて,列方向のシフト量を変数とする相互相関関数を導出する相互相関関数導出手順と,
前記相互相関関数導出手順により得られた前記相互相関関数に基づいて,前記列領域画像相互の列方向の位置ずれ量である列相互ずれ量を導出する列相互ずれ量導出手順と,
複数の前記列領域画像それぞれを前記列相互ずれ量だけ位置修正した画像全体における前記列直交方向の投影データ又はその投影データについて上限値を制限する補正処理を施したデータの分布を算出する第2の列直交方向投影データ算出手順と,
前記第2の列直交方向投影データ算出手順による算出データに基づいて,前記列領域画像それぞれにおける前記検出対象文字列を構成する各文字の画像の存在領域の位置を特定する文字領域特定手順と,
を自動的に実行することを特徴とする文字列画像の画像処理方法。 - 前記文字列包含領域推定手順が,
前記2値画像における前記文字列包含推定領域の画像について列方向の投影データの分布を算出する列方向投影データ算出手順と,
前記列方向投影データ算出手順による算出データに基づいて,前記検出対象文字列を構成する一列分の文字列の画像それぞれの前記列直交方向における存在範囲を推定する範囲推定手順と,
を有してなる請求項1に記載の文字列画像の画像処理方法。 - 前記プロセッサが,
前記相互相関関数導出手順により得られた前記相互相関関数における複数の相関値のピーク相互の間隔と前記文字配置条件における一列の文字数とに基づいて,前記列領域画像それぞれにおける前記検出対象文字列の画像が存在する範囲の列方向の長さを算出する列長さ算出手順と,
前記第2の列直交方向投影データ算出手順による算出データについて,列方向における複数の基準位置それぞれを基準として前記列長さ算出手順による算出結果である列長さの範囲内の値の積算値又は平均値を算出し,その算出値が最大となるときの前記基準位置と前記列長さとに基づいて,前記列領域画像における処理対象範囲を特定する列領域画像処理対象範囲特定手順と,を自動的に実行し,
前記文字領域特定手順において,前記列領域画像処理対象範囲特定手順により特定された前記処理対象範囲を対象に前記検出対象文字列を構成する各文字の画像の存在領域を特定してなる請求項1又は2のいずれかに記載の文字列画像の画像処理方法。 - 前記列相互ずれ量算出手順において,前記相互相関関数導出手順により得られた前記相互相関関数における最大の相関値に対応する列方向のシフト量に基づいて前記列相互ずれ量を導出してなる請求項1〜3のいずれかに記載の文字列画像の画像処理方法。
- 前記予め定められた文字画像の条件が,連結画素の外接矩形の大きさ,連結画素の外接矩形の縦横比,連結画素の面積,連結画素とその外接矩形との面積比,及び連結画素の周囲長の2乗とその面積との比,のうちの少なくとも1つが予め定められた範囲内にあることである請求項1〜4のいずれかに記載の文字列画像の画像処理方法。
- 複数列の文字列からなり文字寸法と一列の文字数及び文字間隔と列数と列間隔とが所定の文字配置条件を満たす検出対象文字列の画像が形成された部材を撮像して得られた画像についての2値画像のデータを所定の記憶手段から読み出し,その読み出しデータに基づいて前記2値画像における前記検出対象文字列を構成する各文字の画像の存在領域を特定し,特定した各文字の画像の存在領域から文字画像を抽出する手順を所定のプロセッサに実行させるための文字列画像の画像処理プログラムであって,
前記読み出しデータに基づいて,前記2値画像における連結画素のうち予め定められた文字画像の条件を満たすものを特定する第1の文字候補特定手順と,
前記第1の文字候補特定手順により特定された前記連結画素のうちその相対的な位置関係が,前記文字配置条件における文字相互の相対的な位置関係を所定の誤差範囲内で満たすものを特定する第2の文字候補特定手順と,
前記第2の文字候補特定手順により特定された前記連結画素である文字候補画像それぞれの位置及び寸法と前記文字配置条件と予め定められた文字配置の変動範囲とに基づいて,前記2値画像において前記文字候補画像の全てを含む領域であって前記検出対象文字列の画像全体を含む領域を推定する文字列包含領域推定手順と,
前記2値画像における前記文字列包含領域推定手順により推定された領域である文字列包含推定領域の画像について予め定められた処理を行うことにより,前記検出対象文字列を構成する一列分の文字列の画像それぞれの列方向に直交する列直交方向における存在範囲を推定する列幅範囲推定手順と,
前記文字列包含領域の画像における前記列幅範囲推定手順により推定された範囲それぞれの画像である列領域画像について前記列直交方向の投影データ又はその投影データについて上限値を制限する補正処理を施したデータの分布を算出する第1の列直交方向投影データ算出手順と,
前記第1の列直交方向投影データ算出手順による算出データに基づいて,列方向のシフト量を変数とする相互相関関数を導出する相互相関関数導出手順と,
前記相互相関関数導出手順により得られた前記相互相関関数に基づいて,前記列領域画像相互の列方向の位置ずれ量である列相互ずれ量を算出する列相互ずれ量算出手順と,
複数の前記列領域画像それぞれを前記列相互ずれ量だけ位置修正した画像全体における前記列直交方向の投影データ又はその投影データについて上限値を制限する補正処理を施したデータの分布を算出する第2の列直交方向投影データ算出手順と,
前記第2の列直交方向投影データ算出手順による算出データに基づいて,前記列領域画像それぞれにおける前記検出対象文字列を構成する各文字の画像の存在領域の位置を特定する文字領域特定手順と,
を所定のプロセッサに実行させるための文字列画像の画像処理プログラム。 - 複数列の文字列からなり文字寸法と一列の文字数及び文字間隔と列数と列間隔とが所定の文字配置条件を満たす検出対象文字列の画像が形成された部材を撮像して得られた画像についての2値画像のデータを所定の記憶手段から読み出し,その読み出しデータに基づいて前記2値画像における前記検出対象文字列を構成する各文字の画像の存在領域を特定し,特定した各文字の画像の存在領域から文字画像を抽出する文字列画像の画像処理装置であって,
前記読み出しデータに基づいて,前記2値画像における連結画素のうち予め定められた文字画像の条件を満たすものを特定する第1の文字候補特定手段と,
前記第1の文字候補特定手段により特定された前記連結画素のうちその相対的な位置関係が,前記文字配置条件における文字相互の相対的な位置関係を所定の誤差範囲内で満たすものを特定する第2の文字候補特定手段と,
前記第2の文字候補特定手段により特定された前記連結画素である文字候補画像それぞれの位置及び寸法と前記文字配置条件と予め定められた文字配置の変動範囲とに基づいて,前記2値画像において前記文字候補画像の全てを含む領域であって前記検出対象文字列の画像全体を含む領域を推定する文字列包含領域推定手段と,
前記2値画像における前記文字列包含領域推定手段により推定された領域である文字列包含推定領域の画像について予め定められた処理を行うことにより,前記検出対象文字列を構成する一列分の文字列の画像それぞれの列方向に直交する列直交方向における存在範囲を推定する列幅範囲推定手段と,
前記文字列包含領域の画像における前記列幅範囲推定手段により推定された範囲それぞれの画像である列領域画像について前記列直交方向の投影データ又はその投影データについて上限値を制限する補正処理を施したデータの分布を算出する第1の列直交方向投影データ算出手段と,
前記第1の列直交方向投影データ算出手段による算出データに基づいて,列方向のシフト量を変数とする相互相関関数を導出する相互相関関数導出手段と,
前記相互相関関数導出手段により得られた前記相互相関関数に基づいて,前記列領域画像相互の列方向の位置ずれ量である列相互ずれ量を算出する列相互ずれ量算出手段と,
複数の前記列領域画像それぞれを前記列相互ずれ量だけ位置修正した画像全体における前記列直交方向の投影データ又はその投影データについて上限値を制限する補正処理を施したデータの分布を算出する第2の列直交方向投影データ算出手段と,
前記第2の列直交方向投影データ算出手段による算出データに基づいて,前記列領域画像それぞれにおける前記検出対象文字列を構成する各文字の画像の存在領域の位置を特定する文字領域特定手段と,
を具備してなることを特徴とする文字列画像の画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007040052A JP4836826B2 (ja) | 2007-02-20 | 2007-02-20 | 文字列画像の画像処理方法,そのプログラム及びその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007040052A JP4836826B2 (ja) | 2007-02-20 | 2007-02-20 | 文字列画像の画像処理方法,そのプログラム及びその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008204203A true JP2008204203A (ja) | 2008-09-04 |
JP4836826B2 JP4836826B2 (ja) | 2011-12-14 |
Family
ID=39781641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007040052A Active JP4836826B2 (ja) | 2007-02-20 | 2007-02-20 | 文字列画像の画像処理方法,そのプログラム及びその装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4836826B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011108025A (ja) * | 2009-11-18 | 2011-06-02 | Kobe Steel Ltd | 文字認識方法及び文字認識装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6394385A (ja) * | 1986-10-08 | 1988-04-25 | Tokyo Keiki Co Ltd | 印字文字ピツチ検出装置 |
JPH0490083A (ja) * | 1990-08-03 | 1992-03-24 | Canon Inc | 文字認識装置 |
JPH06348893A (ja) * | 1993-06-02 | 1994-12-22 | Kawasaki Steel Corp | 文字切り出し方法 |
JPH07282196A (ja) * | 1994-04-05 | 1995-10-27 | Yamaha Motor Co Ltd | パターン確認方法 |
JPH08339421A (ja) * | 1995-06-13 | 1996-12-24 | Kobe Steel Ltd | 画像の文字領域決定方法 |
JPH1069524A (ja) * | 1996-08-28 | 1998-03-10 | Sumitomo Metal Ind Ltd | 文字切り出し方法 |
JP2006338578A (ja) * | 2005-06-06 | 2006-12-14 | Mitsubishi Electric Corp | 文字認識装置 |
-
2007
- 2007-02-20 JP JP2007040052A patent/JP4836826B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6394385A (ja) * | 1986-10-08 | 1988-04-25 | Tokyo Keiki Co Ltd | 印字文字ピツチ検出装置 |
JPH0490083A (ja) * | 1990-08-03 | 1992-03-24 | Canon Inc | 文字認識装置 |
JPH06348893A (ja) * | 1993-06-02 | 1994-12-22 | Kawasaki Steel Corp | 文字切り出し方法 |
JPH07282196A (ja) * | 1994-04-05 | 1995-10-27 | Yamaha Motor Co Ltd | パターン確認方法 |
JPH08339421A (ja) * | 1995-06-13 | 1996-12-24 | Kobe Steel Ltd | 画像の文字領域決定方法 |
JPH1069524A (ja) * | 1996-08-28 | 1998-03-10 | Sumitomo Metal Ind Ltd | 文字切り出し方法 |
JP2006338578A (ja) * | 2005-06-06 | 2006-12-14 | Mitsubishi Electric Corp | 文字認識装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011108025A (ja) * | 2009-11-18 | 2011-06-02 | Kobe Steel Ltd | 文字認識方法及び文字認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4836826B2 (ja) | 2011-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740469B (zh) | 车道线检测方法、装置、计算机设备和存储介质 | |
EP3079101B1 (en) | Image processing apparatus, image processing method and computer-readable storage medium | |
US9189694B2 (en) | Image processing device and image processing method | |
JP5624671B2 (ja) | 文字列切出方法及び文字列切出装置 | |
JP6952094B2 (ja) | 画像処理装置及び画像処理方法 | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20200012879A1 (en) | Text region positioning method and device, and computer readable storage medium | |
US11244194B2 (en) | System and method for object recognition using local binarization | |
US20180082115A1 (en) | Methods of detecting moire artifacts | |
RU2581786C1 (ru) | Определение преобразований изображения для повышения качества оптического распознавания символов | |
US9224065B2 (en) | Character-recognition method and character-recognition device and program using said method | |
US7680329B2 (en) | Character recognition apparatus and character recognition method | |
JP4836826B2 (ja) | 文字列画像の画像処理方法,そのプログラム及びその装置 | |
US10984277B2 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
US20180246041A1 (en) | Print data processing method, print data processing device, and recording medium having recorded therein print data processing program | |
JP6160363B2 (ja) | 物品情報認識装置 | |
CN111670458B (zh) | 读取系统 | |
JP5248074B2 (ja) | 楽譜認識装置、楽譜認識方法、及びコンピュータプログラム | |
KR20200131368A (ko) | 행정구역별 오브젝트 인식방법 및 그 시스템 | |
CN118364839B (zh) | 一种基于图像处理的奶粉食品包装条形码缺陷检测方法 | |
CN117475453B (zh) | 一种基于ocr的文书检测方法、装置及电子设备 | |
EP4036871B1 (en) | Image processing apparatus, image processing method, program and storage medium | |
US20240029238A1 (en) | Inspection apparatus, method of controlling the same, inspection system, and storage medium | |
JP2008107946A (ja) | 画像の文字列領域決定方法,画像の文字列領域決定装置 | |
JP4948282B2 (ja) | 特殊記号読取方法,特殊記号読取プログラム,特殊記号読取装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110318 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110318 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20110324 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110927 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110927 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141007 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4836826 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |