JP2008107946A - 画像の文字列領域決定方法,画像の文字列領域決定装置 - Google Patents
画像の文字列領域決定方法,画像の文字列領域決定装置 Download PDFInfo
- Publication number
- JP2008107946A JP2008107946A JP2006288409A JP2006288409A JP2008107946A JP 2008107946 A JP2008107946 A JP 2008107946A JP 2006288409 A JP2006288409 A JP 2006288409A JP 2006288409 A JP2006288409 A JP 2006288409A JP 2008107946 A JP2008107946 A JP 2008107946A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- connected pixel
- character
- image information
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【課題】予め文字の大きさやアスペクト比などを設定することなく,画像情報に含まれた文字列領域を正確に決定することのできる画像の文字領域決定方法及び画像の文字領域決定装置を提供すること。
【解決手段】複数の連結画素に文字認識処理を施したときの同一性が最も高い同一性最高連結画素を判別して(S4),該同一性最高連結画素と外接矩形の大きさが同じ連結画素を抽出し(S5),さらに,その抽出された上記連結画素から所定の条件で配置された連結画素を抽出する(S6)。その後,その抽出された連結画素と上記同一性最高連結画素とを含む外接矩形領域を画像情報における文字列領域と決定する(S7)。
【選択図】図4
【解決手段】複数の連結画素に文字認識処理を施したときの同一性が最も高い同一性最高連結画素を判別して(S4),該同一性最高連結画素と外接矩形の大きさが同じ連結画素を抽出し(S5),さらに,その抽出された上記連結画素から所定の条件で配置された連結画素を抽出する(S6)。その後,その抽出された連結画素と上記同一性最高連結画素とを含む外接矩形領域を画像情報における文字列領域と決定する(S7)。
【選択図】図4
Description
本発明は,CCDカメラなどによって読み取られた画像情報に含まれた文字を認識するための技術に関し,特に,上記画像情報に含まれた文字列領域を決定する手法に関するものである。
従来から,製鉄所などの製造ラインでは,スラブやビレット等の部材に刻印やマーキングにより識別番号を施して,その識別番号をCCDカメラなどを用いて撮像し,その撮像画像に含まれた識別番号をコンピュータ上で認識させることで,製造工程や在庫の管理が行われている。
ここで,撮像画像における文字列(ここでは識別番号)の存在領域(以下「文字列領域」という)を決定するための手法として,例えば特許文献1には,CCDカメラなどによって撮像された画像情報に適当な閾値で2値化処理を施した後,先ず水平の射影データ分布から対象とする文字列を抽出し,次に垂直方向の射影を求めることによって文字列領域を決定することが開示されている。そして,この決定された文字列領域の途切れている部分を文字と文字との隙間であるとして文字の切り出しが行われる。
しかしながら,上記特許文献1では,例えば図7のように,2値化処理後の画像データに背景画像やノイズ等の文字以外のパターンが存在する場合には,それらも射影に含まれてしまうため,そのままでは正確に文字列領域を決定することは困難である。
一方,特許文献2には,CCDカメラなどによって撮像された画像情報に適当な閾値で2値化処理を施した後,ラベリング処理で得られた連結画素から,予め設定された外接矩形のサイズや縦横比(アスペクト比)などを満足するものを文字候補として抽出し,さらに特定の位置関係をなす文字候補群を文字列領域として決定する手法が開示されている。これにより,2値化処理後の画像データに背景画像やノイズ等の文字以外のパターンが存在する場合であっても,文字列を正確に決定することができる。
特許第3066448号公報
特開平8−339421号公報
ここで,撮像画像における文字列(ここでは識別番号)の存在領域(以下「文字列領域」という)を決定するための手法として,例えば特許文献1には,CCDカメラなどによって撮像された画像情報に適当な閾値で2値化処理を施した後,先ず水平の射影データ分布から対象とする文字列を抽出し,次に垂直方向の射影を求めることによって文字列領域を決定することが開示されている。そして,この決定された文字列領域の途切れている部分を文字と文字との隙間であるとして文字の切り出しが行われる。
しかしながら,上記特許文献1では,例えば図7のように,2値化処理後の画像データに背景画像やノイズ等の文字以外のパターンが存在する場合には,それらも射影に含まれてしまうため,そのままでは正確に文字列領域を決定することは困難である。
一方,特許文献2には,CCDカメラなどによって撮像された画像情報に適当な閾値で2値化処理を施した後,ラベリング処理で得られた連結画素から,予め設定された外接矩形のサイズや縦横比(アスペクト比)などを満足するものを文字候補として抽出し,さらに特定の位置関係をなす文字候補群を文字列領域として決定する手法が開示されている。これにより,2値化処理後の画像データに背景画像やノイズ等の文字以外のパターンが存在する場合であっても,文字列を正確に決定することができる。
しかしながら,上記特許文献2では,予め文字の大きさやアスペクト比などを設定しておく必要があり,CCDカメラと被撮像物との距離が変化して撮像画像における文字の大きさが変化した場合や,設定外のアスペクト比で文字が形成されている場合などに,正確に文字列領域を決定することができないという問題がある。
そこで,文字の大きさやアスペクト比などを設定せずに,特定の位置関係を成すことだけを条件に文字列領域を決定することが考えられるが,この場合,例えば図8(a)に示す画像情報では,図8(b)に示すように文字列領域を決定することが正しいにもかかわらず,その画像情報に汚れや文字欠け等が生じているため,図8(c)や図8(d)のように文字列領域が誤って決定されてしまうことになる。
従って,本発明は上記事情に鑑みてなされたものであり,その目的とするところは,予め文字の大きさやアスペクト比などを設定することなく,画像情報に含まれた文字列領域を正確に決定することのできる画像の文字領域決定方法及び画像の文字領域決定装置を提供することにある。
そこで,文字の大きさやアスペクト比などを設定せずに,特定の位置関係を成すことだけを条件に文字列領域を決定することが考えられるが,この場合,例えば図8(a)に示す画像情報では,図8(b)に示すように文字列領域を決定することが正しいにもかかわらず,その画像情報に汚れや文字欠け等が生じているため,図8(c)や図8(d)のように文字列領域が誤って決定されてしまうことになる。
従って,本発明は上記事情に鑑みてなされたものであり,その目的とするところは,予め文字の大きさやアスペクト比などを設定することなく,画像情報に含まれた文字列領域を正確に決定することのできる画像の文字領域決定方法及び画像の文字領域決定装置を提供することにある。
上記目的を達成するために本発明は,同じ大きさの複数の文字が所定の条件で配置された文字列を含む画像情報を入力して2値化処理を施し,該2値化処理後の画像情報に含まれる複数の連結画素に基づいて上記画像情報における文字列領域を決定する画像の文字列領域決定方法であって,下記の(1)〜(4)の各工程を有してなることを特徴とする画像の文字列領域決定方法である。
(1)複数の上記連結画素のうち該連結画素と近似する文字との同一性が最も高い同一性最高連結画素を判別する同一性最高連結画素判別工程。
(2)複数の上記連結画素から上記同一性最高連結画素と外接矩形の大きさが同じ連結画素を抽出する第1の連結画素抽出工程。
(3)上記第1の連結画素抽出工程で抽出された上記連結画素から上記所定の条件で配置された連結画素を抽出する第2の連結画素抽出工程。
(4)上記同一性最高連結画素と上記第2の連結画素抽出工程で抽出された上記連結画素とを含む外接矩形領域を上記画像情報における文字列領域と決定する文字列領域決定工程。
ここに,上記所定の条件は,上記同一性最高連結画素に対する縦方向や横方向の間隔が既定の関係を充足すること,或いは,隣接する連結画素に対する縦方向や横方向の間隔が既定の関係を充足することであること等が考えられる。
本発明によれば,上記第1の連結画素抽出工程において,文字認識の信頼性(近似するとの同一性)が最も高い上記同一性最高連結画素と同じ大きさの上記連結画素が抽出されるため,予め文字の大きさや縦横比(アスペクト比)などを設定しておくことなく,上記画像情報における文字列領域を正確に決定することができる。
(1)複数の上記連結画素のうち該連結画素と近似する文字との同一性が最も高い同一性最高連結画素を判別する同一性最高連結画素判別工程。
(2)複数の上記連結画素から上記同一性最高連結画素と外接矩形の大きさが同じ連結画素を抽出する第1の連結画素抽出工程。
(3)上記第1の連結画素抽出工程で抽出された上記連結画素から上記所定の条件で配置された連結画素を抽出する第2の連結画素抽出工程。
(4)上記同一性最高連結画素と上記第2の連結画素抽出工程で抽出された上記連結画素とを含む外接矩形領域を上記画像情報における文字列領域と決定する文字列領域決定工程。
ここに,上記所定の条件は,上記同一性最高連結画素に対する縦方向や横方向の間隔が既定の関係を充足すること,或いは,隣接する連結画素に対する縦方向や横方向の間隔が既定の関係を充足することであること等が考えられる。
本発明によれば,上記第1の連結画素抽出工程において,文字認識の信頼性(近似するとの同一性)が最も高い上記同一性最高連結画素と同じ大きさの上記連結画素が抽出されるため,予め文字の大きさや縦横比(アスペクト比)などを設定しておくことなく,上記画像情報における文字列領域を正確に決定することができる。
また,本発明は,画像の文字列領域決定装置として捉えることも可能である。
即ち,上記目的を達成するために本発明は,同じ大きさの複数の文字が所定の条件で配置された文字列を含む画像情報を入力して2値化処理を施し,該2値化処理後の画像情報に含まれる複数の連結画素に基づいて上記画像情報における文字列領域を決定する画像の文字列領域決定装置であって,下記の(5)〜(8)の各手段を有してなることを特徴とする画像の文字列領域決定装置として捉えてもよい。
(5)複数の上記連結画素のうち該連結画素と近似する文字との同一性が最も高い同一性最高連結画素を判別する同一性最高連結画素判別手段。
(6)複数の上記連結画素から上記同一性最高連結画素と外接矩形の大きさが同じ連結画素を抽出する第1の連結画素抽出手段。
(7)上記第1の連結画素抽出手段で抽出された上記連結画素から上記所定の条件で配置された連結画素を抽出する第2の連結画素抽出手段。
(8)上記同一性最高連結画素と上記第2の連結画素抽出手段で抽出された上記連結画素とを含む外接矩形領域を上記画像情報における文字列領域と決定する文字列領域決定手段。
ここに,上記所定の条件は,上記同一性最高連結画素に対する縦方向や横方向の間隔が既定の関係を充足すること,或いは,隣接する連結画素に対する縦方向や横方向の間隔が既定の関係を充足することであること等が考えられる。
即ち,上記目的を達成するために本発明は,同じ大きさの複数の文字が所定の条件で配置された文字列を含む画像情報を入力して2値化処理を施し,該2値化処理後の画像情報に含まれる複数の連結画素に基づいて上記画像情報における文字列領域を決定する画像の文字列領域決定装置であって,下記の(5)〜(8)の各手段を有してなることを特徴とする画像の文字列領域決定装置として捉えてもよい。
(5)複数の上記連結画素のうち該連結画素と近似する文字との同一性が最も高い同一性最高連結画素を判別する同一性最高連結画素判別手段。
(6)複数の上記連結画素から上記同一性最高連結画素と外接矩形の大きさが同じ連結画素を抽出する第1の連結画素抽出手段。
(7)上記第1の連結画素抽出手段で抽出された上記連結画素から上記所定の条件で配置された連結画素を抽出する第2の連結画素抽出手段。
(8)上記同一性最高連結画素と上記第2の連結画素抽出手段で抽出された上記連結画素とを含む外接矩形領域を上記画像情報における文字列領域と決定する文字列領域決定手段。
ここに,上記所定の条件は,上記同一性最高連結画素に対する縦方向や横方向の間隔が既定の関係を充足すること,或いは,隣接する連結画素に対する縦方向や横方向の間隔が既定の関係を充足することであること等が考えられる。
本発明によれば,上記第1の連結画素抽出工程において,文字認識の信頼性(近似するとの同一性)が最も高い上記同一性最高連結画素と同じ大きさの上記連結画素が抽出されるため,予め文字の大きさや縦横比(アスペクト比)などを設定しておくことなく,上記画像情報における文字列領域を正確に決定することができる。
以下添付図面を参照しながら,本発明の実施の形態について説明し,本発明の理解に供する。尚,以下の実施の形態は,本発明を具体化した一例であって,本発明の技術的範囲を限定する性格のものではない。
ここに,図1は本発明の実施の形態に係る文字認識処理装置Xの適用例を示すブロック図,図2はビレット10に描かれた文字列の一例を示す図,図3はCCDカメラ12で撮像された文字列の一例を示す図,図4は上記文字認識処理装置Xで実行される文字認識処理の手順の一例を説明するためのフローチャート,図5は同一性最高連結画素判別処理の手順の一例を説明するためのフローチャート,図6はグループ判定処理の手順の一例を説明するためのフローチャート,図7はCCDカメラ12で撮像された画像情報の一例を示す図,図8はCCDカメラ12で撮像された画像情報の要部拡大図である。
まず,図1を用いて,本発明の実施の形態に係る文字認識処理装置X(画像の文字列領域決定装置の一例)の適用例について説明する。
図1に示すように,金属材料などで成形されたビレット10の製造ラインでは,該ビレット10各々が順にベルトコンベアなどの搬送台11上を流れて,画像を読み取るCCDカメラ12の位置に達する。このビレット10各々の端面101には,該ビレット10各々を識別するべく,予めロット番号や型番などの文字列がマーキング装置(不図示)によって描かれている。
ここに,図1は本発明の実施の形態に係る文字認識処理装置Xの適用例を示すブロック図,図2はビレット10に描かれた文字列の一例を示す図,図3はCCDカメラ12で撮像された文字列の一例を示す図,図4は上記文字認識処理装置Xで実行される文字認識処理の手順の一例を説明するためのフローチャート,図5は同一性最高連結画素判別処理の手順の一例を説明するためのフローチャート,図6はグループ判定処理の手順の一例を説明するためのフローチャート,図7はCCDカメラ12で撮像された画像情報の一例を示す図,図8はCCDカメラ12で撮像された画像情報の要部拡大図である。
まず,図1を用いて,本発明の実施の形態に係る文字認識処理装置X(画像の文字列領域決定装置の一例)の適用例について説明する。
図1に示すように,金属材料などで成形されたビレット10の製造ラインでは,該ビレット10各々が順にベルトコンベアなどの搬送台11上を流れて,画像を読み取るCCDカメラ12の位置に達する。このビレット10各々の端面101には,該ビレット10各々を識別するべく,予めロット番号や型番などの文字列がマーキング装置(不図示)によって描かれている。
ここで,図2を用いて,上記ビレット10各々に描かれた文字列について説明する。
図2に示すように,上記ビレット10の端面101に描かれている文字列「022395」における文字各々の大きさは全て同じであり,例えば外接矩形の大きさが,高さFHが30mm,幅FWが20mm(アスペクト比=30/20=1.5)である。また,上記文字列は2行×3列の形態を成しており,上記文字各々は行間dFH,列間dFWの間隔をあけて配置されている。
図2に示すように,上記ビレット10の端面101に描かれている文字列「022395」における文字各々の大きさは全て同じであり,例えば外接矩形の大きさが,高さFHが30mm,幅FWが20mm(アスペクト比=30/20=1.5)である。また,上記文字列は2行×3列の形態を成しており,上記文字各々は行間dFH,列間dFWの間隔をあけて配置されている。
本発明の実施の形態に係る文字認識処理装置Xは,上記のように構成された製造ラインに適用されるものであって,各種の制御プログラムを実行することにより各種の演算処理を行うCPUや,一時記憶データが展開される高速メモリであるRAM,上記CPUにより実行される上記各種の制御プログラムが予め記憶されたROMなどを有する制御部(不図示)を備えたコンピュータである。
上記文字認識処理装置Xは,上記CCDカメラ12によって撮像された上記ビレット10各々の端面101の画像情報に2値化処理を施して,その2値化処理後の画像情報に含まれた複数の連結画素に基づいて,該端面101に描かれた文字列の存在領域(以下「文字列領域」という)を決定し,その文字列領域に含まれた文字を認識する。上記文字認識処理装置Xによる認識結果は,製造ラインの制御や在庫管理などを行うホストコンピュータ13に入力される。
上記文字認識処理装置Xは,上記CCDカメラ12によって撮像された上記ビレット10各々の端面101の画像情報に2値化処理を施して,その2値化処理後の画像情報に含まれた複数の連結画素に基づいて,該端面101に描かれた文字列の存在領域(以下「文字列領域」という)を決定し,その文字列領域に含まれた文字を認識する。上記文字認識処理装置Xによる認識結果は,製造ラインの制御や在庫管理などを行うホストコンピュータ13に入力される。
以下,図3〜5のフローチャートに従って,上記文字認識処理装置Xにおいて上記制御部によって実行される文字認識処理の手順の一例について説明する。なお,図中のS1,S2,…は処理手順(ステップ)の番号を表している。本発明は,以下の各処理工程を有する画像の文字列領域決定方法として捉えることが可能である。
ここでは,図7に示す画像情報が上記CCD12によって撮像された場合を例に挙げて説明する。図7に示すように上記画像情報には文字列以外に背景画像が含まれている。ここに,図8(a)は,図7に示す画像情報に含まれた文字列部分の拡大図である。なお,図8(a)に示すように,上記文字列には,文字「022395」が含まれているが,文字「0」の上方に汚れが付着しており,文字「0」,「2」及び「9」に文字欠けが生じている。
ここでは,図7に示す画像情報が上記CCD12によって撮像された場合を例に挙げて説明する。図7に示すように上記画像情報には文字列以外に背景画像が含まれている。ここに,図8(a)は,図7に示す画像情報に含まれた文字列部分の拡大図である。なお,図8(a)に示すように,上記文字列には,文字「022395」が含まれているが,文字「0」の上方に汚れが付着しており,文字「0」,「2」及び「9」に文字欠けが生じている。
まず,上記文字認識処理装置Xでは,上記CCDカメラ12から画像情報が入力されたか否か上記制御部によって判断される(S1)。上記ステップS1の処理は,画像情報が入力されたと判断されるまで繰り返し実行され(S1のNo側),画像情報が入力されたと判断されると(S1のYes側),処理はステップS2に移行する。なお,上記CCDカメラ12からの画像情報の入力は,上記ビレット10が所定の位置に達したときや,上記文字認識処理装置Xからの指示に応じて行われる。
ステップS2では,上記制御部によって,上記CCDカメラ12から入力された上記画像情報を適当な閾値で2値化する2値化処理が実行される。
続くステップS3では,上記制御部によって,上記ステップS2で2値化処理が施された後の画像情報から連結画素が抽出され,その連結画素ごとのラベル(識別番号など)付けを行うラベリング処理が実行される。
このとき,上記CCDカメラ12による撮影の際に上記ビレット10が定位置から上下左右及び前後にずれることを想定してカメラ視野が広くとられている場合,上記画像情報には,図7に示すように文字列以外に天井照明などの背景画像が含まれるため,上記ステップS3においてその背景画像なども連結画素として抽出されることになる。
続くステップS3では,上記制御部によって,上記ステップS2で2値化処理が施された後の画像情報から連結画素が抽出され,その連結画素ごとのラベル(識別番号など)付けを行うラベリング処理が実行される。
このとき,上記CCDカメラ12による撮影の際に上記ビレット10が定位置から上下左右及び前後にずれることを想定してカメラ視野が広くとられている場合,上記画像情報には,図7に示すように文字列以外に天井照明などの背景画像が含まれるため,上記ステップS3においてその背景画像なども連結画素として抽出されることになる。
ここで,従来手法では,次のステップにおいて,上記ステップS3で抽出された連結画素のうち,予め設定された大きさやアスペクト比などを満たすものが文字候補として抽出することで,上記画像情報に含まれた背景画像や汚れなどのノイズが除外されていた。しかし,前述したように,このような従来手法では,予め文字の大きさやアスペクト比を設定しておく必要があった。そのため,上記ビレット10と上記CCDカメラ12との距離が異なるために該CCDカメラ12によって撮像された画像情報に含まれた文字の大きさが異なる場合や,上記ビレット10に描かれている文字が設定外のアスペクト比である場合などに,正確に文字列領域を特定することができないという問題が生じていた。
しかしながら,本発明の実施の形態に係る上記文字認識処理装置Xでは,上記ステップS3に続くステップS4において同一性最高連結画素判別処理(図5のフローチャート参照)が実行され,ステップS5では上記同一性最高連結画素判別処理の処理結果に基づいて文字候補が抽出されるため,予め文字の大きさやアスペクト比を設定しておく必要がない。
しかしながら,本発明の実施の形態に係る上記文字認識処理装置Xでは,上記ステップS3に続くステップS4において同一性最高連結画素判別処理(図5のフローチャート参照)が実行され,ステップS5では上記同一性最高連結画素判別処理の処理結果に基づいて文字候補が抽出されるため,予め文字の大きさやアスペクト比を設定しておく必要がない。
ここで,当該文字認識処理のステップS4における同一性最高連結画素判別処理について,図5のフローチャートを参照して説明する。
当該同一性最高連結画素判別処理では,上記制御部によって,一つの連結画素が選択されて(S41),該連結画素の外接矩形領域が上記画像情報から切り出され(S42),該連結画素が予め設定されたサイズに正規化される(S43)。その後,その正規化された連結画素に最も近似する文字を認識するための文字認識処理が実行され(S44),該連結画素と近似する文字との同一性のレベルが検出される(S45)。具体的に,上記文字認識処理(S44)は,予め記憶された文字データベースに含まれた文字との比較により行われ,前記同一性はその比較の一致度合を示すものである。この文字認識処理を,ニューラルネットワークを用いたパターン認識器によって行えば,比較的少ない処理量で解を得ることができる。これらの処理(S41〜S45)は上記画像情報に含まれた連結画素全てに対して実行される(S46)。
そして,ステップS47では,上記制御部によって,上記文字認識処理(S44)により認識された文字の信頼性が最も高い連結画素が判別される。具体的には,上記ステップS45において検出された同一性のレベルに基づいて,近似する文字との同一性が最も高い連結画素(以下「同一性最高連結画素」という)が判別される。ここに,かかる判別処理工程を実行するときの上記制御部が同一性最高連結画素判別手段に相当する。
このとき,複数の連結画素が同一性最高連結画素として判別された場合にはそのうちの一つを任意に選択すればよい。なお,同一性が100%に近い連結画素が存在することが判別された場合に,その時点で該連結画素を同一性最高連結画素として上記ステップS4を終了することで処理時間の短縮を図ってもよい。また,ここでは,全ての上記連結画素について文字認識処理を実行し,最も同一性の高い連結画素を判別する場合を例に説明したが,複数の連結画素をランダムに選出してその連結画素各々に対して文字認識処理を実行し,その中で最も同一性の高い連結画素を判別してもかまわない。
以下,図8(a)に示す文字列のうち文字「3」を形成する連結画素が同一性最高連結画素であると判別された場合を具体例として説明を続ける。
当該同一性最高連結画素判別処理では,上記制御部によって,一つの連結画素が選択されて(S41),該連結画素の外接矩形領域が上記画像情報から切り出され(S42),該連結画素が予め設定されたサイズに正規化される(S43)。その後,その正規化された連結画素に最も近似する文字を認識するための文字認識処理が実行され(S44),該連結画素と近似する文字との同一性のレベルが検出される(S45)。具体的に,上記文字認識処理(S44)は,予め記憶された文字データベースに含まれた文字との比較により行われ,前記同一性はその比較の一致度合を示すものである。この文字認識処理を,ニューラルネットワークを用いたパターン認識器によって行えば,比較的少ない処理量で解を得ることができる。これらの処理(S41〜S45)は上記画像情報に含まれた連結画素全てに対して実行される(S46)。
そして,ステップS47では,上記制御部によって,上記文字認識処理(S44)により認識された文字の信頼性が最も高い連結画素が判別される。具体的には,上記ステップS45において検出された同一性のレベルに基づいて,近似する文字との同一性が最も高い連結画素(以下「同一性最高連結画素」という)が判別される。ここに,かかる判別処理工程を実行するときの上記制御部が同一性最高連結画素判別手段に相当する。
このとき,複数の連結画素が同一性最高連結画素として判別された場合にはそのうちの一つを任意に選択すればよい。なお,同一性が100%に近い連結画素が存在することが判別された場合に,その時点で該連結画素を同一性最高連結画素として上記ステップS4を終了することで処理時間の短縮を図ってもよい。また,ここでは,全ての上記連結画素について文字認識処理を実行し,最も同一性の高い連結画素を判別する場合を例に説明したが,複数の連結画素をランダムに選出してその連結画素各々に対して文字認識処理を実行し,その中で最も同一性の高い連結画素を判別してもかまわない。
以下,図8(a)に示す文字列のうち文字「3」を形成する連結画素が同一性最高連結画素であると判別された場合を具体例として説明を続ける。
ステップS5では,上記制御部によって,上記画像情報に含まれた全ての連結画素の中から上記ステップS4で判別された上記同一性最高連結画素と外接矩形の大きさが同じ連結画素が文字候補として抽出される。ここに,かかる抽出処理工程を実行するときの上記制御部が第1の連結画素抽出手段に相当する。
これにより,この時点で,上記同一性最高連結画素と外接矩形の大きさが同じではない背景画像や汚れなどのノイズは除外される。ここでは,図8(a)に示すように文字欠けが生じている文字「0」,「2」,「9」を除く,文字「2」,「5」が抽出される。
なお,上記同一性最高連結画素の外接矩形の大きさに基づいて文字候補を抽出する例について説明するが,上記同一性最高連結画素の外接矩形のアスペクト比などに基づいて文字候補を抽出することも他の実施例として考えられる。
このように,本実施の形態に係る上記文字認識処理装置Xでは,上記ステップS4で判別された上記同一性最高連結画素の大きさを,上記文字列に含まれた文字の大きさであると同定して,文字候補を抽出しているため,従来手法のように予め文字の大きさやアスペクト比などを設定しておく必要がない。
これにより,この時点で,上記同一性最高連結画素と外接矩形の大きさが同じではない背景画像や汚れなどのノイズは除外される。ここでは,図8(a)に示すように文字欠けが生じている文字「0」,「2」,「9」を除く,文字「2」,「5」が抽出される。
なお,上記同一性最高連結画素の外接矩形の大きさに基づいて文字候補を抽出する例について説明するが,上記同一性最高連結画素の外接矩形のアスペクト比などに基づいて文字候補を抽出することも他の実施例として考えられる。
このように,本実施の形態に係る上記文字認識処理装置Xでは,上記ステップS4で判別された上記同一性最高連結画素の大きさを,上記文字列に含まれた文字の大きさであると同定して,文字候補を抽出しているため,従来手法のように予め文字の大きさやアスペクト比などを設定しておく必要がない。
次に,ステップS6では,上記制御部によって,上記同一性最高連結画素をリーダーとするグループ判定処理が行われる。上記グループとは,上記リーダーとの位置関係が予め設定してある文字列の形態に合致していると判断された文字候補の集合をいう。
ここで,このステップS6におけるグループ判定処理について,図6のフローチャートを参照して説明する。
先ず,上記制御部によって,上記同一性最高連結画素がグループのリーダーに設定される(S61)。そして,上記ステップS5で抽出された連結画素である文字候補の中から順番に1つの文字候補が選出される(S62)。次に,選出された上記文字候補が,上記同一性最高連結画素をリーダとするグループに含まれるかどうかが上記制御部によって判定される(S63)。この判定は具体的には,次の(1)式,(2)式を満たすか否かが判断されることにより行われる。なお,下記の(1)式,(2)式は,上記文字列における文字各々の配置関係を定める所定の条件の一例に過ぎない。
ここで,図3に示すように,変数W,Hはそれぞれ上記画像情報に含まれた上記同一性最高連結画素(ここでは文字「3」)の外接矩形の幅(W),高さ(H)であり,変数dW,dHはそれぞれ上記同一性最高連結画素と文字候補(図3では文字「2」)とのそれぞれの外接矩形の左上の座標の縦,横方向の間隔である。
また,各変数α,βは,予め定められたものであって,変数αは,文字の幅と隣接する文字に対する横方向の間隔との比率,変数βは,文字の高さと隣接する文字に対する縦方向の間隔との比率である。例えば,図2の例では,変数α=dFW/FW,変数β=dFH/FHとなる。
さらに,m,nは上記同一性最高連結画素と文字候補との縦横の位置関係を示す値であり,ここでは,mは−2〜+2,nは−1〜+1の間の整数値をとる。また,dm,dnはそれぞれmとnとのマージン(<0.5)である。
なお,上記(1)式,(2)式は,上記連結画素が,上記同一性最高連結画素に対する縦方向や横方向の間隔が既定の関係を充足することを判断するためのものであるが,他の実施例として,上記同一性最高連結画素に対する間隔ではなく,隣接する連結画素に対する縦方向や横方向の間隔が既定の関係を充足しているか否かを判断するためのものであってもかまわない。
ここで,このステップS6におけるグループ判定処理について,図6のフローチャートを参照して説明する。
先ず,上記制御部によって,上記同一性最高連結画素がグループのリーダーに設定される(S61)。そして,上記ステップS5で抽出された連結画素である文字候補の中から順番に1つの文字候補が選出される(S62)。次に,選出された上記文字候補が,上記同一性最高連結画素をリーダとするグループに含まれるかどうかが上記制御部によって判定される(S63)。この判定は具体的には,次の(1)式,(2)式を満たすか否かが判断されることにより行われる。なお,下記の(1)式,(2)式は,上記文字列における文字各々の配置関係を定める所定の条件の一例に過ぎない。
また,各変数α,βは,予め定められたものであって,変数αは,文字の幅と隣接する文字に対する横方向の間隔との比率,変数βは,文字の高さと隣接する文字に対する縦方向の間隔との比率である。例えば,図2の例では,変数α=dFW/FW,変数β=dFH/FHとなる。
さらに,m,nは上記同一性最高連結画素と文字候補との縦横の位置関係を示す値であり,ここでは,mは−2〜+2,nは−1〜+1の間の整数値をとる。また,dm,dnはそれぞれmとnとのマージン(<0.5)である。
なお,上記(1)式,(2)式は,上記連結画素が,上記同一性最高連結画素に対する縦方向や横方向の間隔が既定の関係を充足することを判断するためのものであるが,他の実施例として,上記同一性最高連結画素に対する間隔ではなく,隣接する連結画素に対する縦方向や横方向の間隔が既定の関係を充足しているか否かを判断するためのものであってもかまわない。
このように,上記ステップS6では,上記ステップS5で抽出された連結画素から,所定の条件を満たす連結画素,即ち上記同一性最高連結画素の左右1つ又は2つ,及び上下1つずれた位置にある連結画素だけが抽出されることになる。ここに,かかる抽出処理工程を実行するときの上記制御部が第2の連結画素抽出手段に相当する。
これにより,上記同一性最高連結画素と外接矩形の大きさが似ている背景画像や汚れが文字候補となってしまった場合であっても,その文字候補はこの段階で除外される。ここでは,上記制御部によって,図8(a)に示す文字「2」,「5」の連結画素が上記グループに含まれると判定される。
そして,全ての文字候補に対して上記ステップS63の判定処理が実行されると(S64のYes側),処理は次のステップ7に進む。判定処理が終わっていない文字候補があれば,上記ステップS61に戻る。
これにより,上記同一性最高連結画素と外接矩形の大きさが似ている背景画像や汚れが文字候補となってしまった場合であっても,その文字候補はこの段階で除外される。ここでは,上記制御部によって,図8(a)に示す文字「2」,「5」の連結画素が上記グループに含まれると判定される。
そして,全ての文字候補に対して上記ステップS63の判定処理が実行されると(S64のYes側),処理は次のステップ7に進む。判定処理が終わっていない文字候補があれば,上記ステップS61に戻る。
ステップS7では,上記制御部によって,上記ステップS6で同じグループに含まれると判定された文字候補(文字「2」,「5」を形成する連結画素)と上記同一性最高連結画素とを含む外接矩形領域が上記画像情報における文字列領域として決定される。ここに,かかる決定処理工程を実行するときの上記制御部が文字列領域決定手段に相当する。
これにより,文字欠けが生じていた文字「0」,「2」,「9」も,上記文字列領域に含まれることになる。つまり,本実施の形態では,上記画像情報の文字列の中に低質な文字が含まれていても,図8(b)に示すように,文字列領域を正確に決定することが可能となる。
これにより,文字欠けが生じていた文字「0」,「2」,「9」も,上記文字列領域に含まれることになる。つまり,本実施の形態では,上記画像情報の文字列の中に低質な文字が含まれていても,図8(b)に示すように,文字列領域を正確に決定することが可能となる。
その後,ステップS8では,上記制御部によって,上記ステップS7で決定された文字列領域に含まれた複数の連結画素に対して文字認識処理が実行される。具体的には,上記画像情報から2行×3列に配置された連結画素が6分割して切り出され,それぞれが文字として認識される。なお,このとき実行される文字認識処理は上記ステップS4と同様の手法で行えばよい。このとき,上記文字列領域の決定が正確に行われているため,該ステップS8における文字認識処理も正確に行われる。
そして,ステップS9では,上記制御部によって,上記ステップS8における文字認識処理の認識結果が上記ホストコンピュータ13に出力される。
そして,ステップS9では,上記制御部によって,上記ステップS8における文字認識処理の認識結果が上記ホストコンピュータ13に出力される。
以上,説明したように,本実施の形態に係る上記文字認識処理装置Xでは,画像情報に含まれた連結画素のなかから文字認識の信頼性(近似するとの同一性)が最も高い上記同一性最高連結画素が判別され,該同一性最高連結画素と外接矩形の大きさが同じ上記連結画素が文字候補として抽出されるため,予め文字の大きさや縦横比(アスペクト比)などを設定しておくことなく,上記画像情報における文字列領域を正確に決定することができる。しかも,上記文字候補を抽出した後,更に所定の条件で配置されたものだけが抽出されるため,背景画像や汚れなどを除外して文字列領域を決定することができる。
10…ビレット
101…端面
11…搬送台
12…CCDカメラ
13…ホストコンピュータ
S1,S2,…,…処理手順(ステップ)番号
X…文字認識処理装置
101…端面
11…搬送台
12…CCDカメラ
13…ホストコンピュータ
S1,S2,…,…処理手順(ステップ)番号
X…文字認識処理装置
Claims (4)
- 同じ大きさの複数の文字が所定の条件で配置された文字列を含む画像情報を入力して2値化処理を施し,該2値化処理後の画像情報に含まれる複数の連結画素に基づいて上記画像情報における文字列領域を決定する画像の文字列領域決定方法であって,
複数の上記連結画素のうち該連結画素と近似する文字との同一性が最も高い同一性最高連結画素を判別する同一性最高連結画素判別工程と,
複数の上記連結画素から上記同一性最高連結画素と外接矩形の大きさが同じ連結画素を抽出する第1の連結画素抽出工程と,
上記第1の連結画素抽出工程で抽出された上記連結画素から上記所定の条件で配置された連結画素を抽出する第2の連結画素抽出工程と,
上記同一性最高連結画素と上記第2の連結画素抽出工程で抽出された上記連結画素とを含む外接矩形領域を上記画像情報における文字列領域と決定する文字列領域決定工程と,
を有してなることを特徴とする画像の文字列領域決定方法。 - 上記所定の条件が,上記同一性最高連結画素に対する縦方向及び/又は横方向の間隔が既定の関係を充足すること,或いは,隣接する連結画素に対する縦方向及び/又は横方向の間隔が既定の関係を充足することである請求項1に記載の画像の文字列領域決定方法。
- 同じ大きさの複数の文字が所定の条件で配置された文字列を含む画像情報を入力して2値化処理を施し,該2値化処理後の画像情報に含まれる複数の連結画素に基づいて上記画像情報における文字列領域を決定する画像の文字列領域決定装置であって,
複数の上記連結画素のうち該連結画素と近似する文字との同一性が最も高い同一性最高連結画素を判別する同一性最高連結画素判別手段と,
複数の上記連結画素から上記同一性最高連結画素と外接矩形の大きさが同じ連結画素を抽出する第1の連結画素抽出手段と,
上記第1の連結画素抽出手段で抽出された上記連結画素から上記所定の条件で配置された連結画素を抽出する第2の連結画素抽出手段と,
上記同一性最高連結画素と上記第2の連結画素抽出手段で抽出された上記連結画素とを含む外接矩形領域を上記画像情報における文字列領域と決定する文字列領域決定手段と,
を有してなることを特徴とする画像の文字列領域決定装置。 - 上記所定の条件が,上記同一性最高連結画素に対する縦方向及び/又は横方向の間隔が既定の関係を充足すること,或いは,隣接する連結画素に対する縦方向及び/又は横方向の間隔が既定の関係を充足することである請求項3に記載の画像の文字列領域決定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006288409A JP2008107946A (ja) | 2006-10-24 | 2006-10-24 | 画像の文字列領域決定方法,画像の文字列領域決定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006288409A JP2008107946A (ja) | 2006-10-24 | 2006-10-24 | 画像の文字列領域決定方法,画像の文字列領域決定装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008107946A true JP2008107946A (ja) | 2008-05-08 |
Family
ID=39441269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006288409A Pending JP2008107946A (ja) | 2006-10-24 | 2006-10-24 | 画像の文字列領域決定方法,画像の文字列領域決定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008107946A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014085841A (ja) * | 2012-10-24 | 2014-05-12 | Glory Ltd | 文字切出装置及び文字切出方法並びに文字認識装置 |
-
2006
- 2006-10-24 JP JP2006288409A patent/JP2008107946A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014085841A (ja) * | 2012-10-24 | 2014-05-12 | Glory Ltd | 文字切出装置及び文字切出方法並びに文字認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US9858477B2 (en) | Character segmenting apparatus, character recognition apparatus, and character segmenting method | |
JP2010117772A (ja) | 特徴量抽出装置、物体識別装置及び特徴量抽出方法 | |
JP5322517B2 (ja) | 画像処理装置および方法 | |
CN112541504A (zh) | 一种针对文本中单个字符目标的检测方法 | |
CN112508913A (zh) | 基于图像检测的电缆截面边沿检测方法 | |
JP2007041730A (ja) | 電線異常検出方法および装置およびプログラム | |
JP2008011484A (ja) | 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体 | |
US8200016B2 (en) | Method and apparatus for character string recognition | |
US10984277B2 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
JP2898562B2 (ja) | ナンバープレート決定方法 | |
JP2008107946A (ja) | 画像の文字列領域決定方法,画像の文字列領域決定装置 | |
CN100456317C (zh) | 行方向判定方法以及装置 | |
WO2010113217A1 (ja) | 文字認識装置及び文字認識方法 | |
JP4492258B2 (ja) | 文字・図形の認識方法および検査方法 | |
JP5439069B2 (ja) | 文字認識装置及び文字認識方法 | |
JP4867894B2 (ja) | 画像認識装置、画像認識方法及びプログラム | |
KR100954137B1 (ko) | 슬라브 정보 인식을 위한 관리번호 추출 방법 | |
JP4244692B2 (ja) | 文字認識装置及び文字認識プログラム | |
JP4078045B2 (ja) | 画像処理装置、方法、プログラム、及び記憶媒体 | |
JPH08339421A (ja) | 画像の文字領域決定方法 | |
Timofte et al. | Automatic stave discovery for musical facsimiles | |
JP6222127B2 (ja) | 刻印文字読取り装置 | |
JPH1069524A (ja) | 文字切り出し方法 | |
KR100533209B1 (ko) | 영상검출방법 |