JP6281309B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP6281309B2 JP6281309B2 JP2014025290A JP2014025290A JP6281309B2 JP 6281309 B2 JP6281309 B2 JP 6281309B2 JP 2014025290 A JP2014025290 A JP 2014025290A JP 2014025290 A JP2014025290 A JP 2014025290A JP 6281309 B2 JP6281309 B2 JP 6281309B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- image processing
- processing
- character
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010354 integration Effects 0.000 claims description 30
- 230000003247 decreasing effect Effects 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 5
- 238000000034 method Methods 0.000 description 43
- 230000008569 process Effects 0.000 description 37
- 238000004590 computer program Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 5
- 230000008602 contraction Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 235000019687 Lamb Nutrition 0.000 description 1
- 206010027146 Melanoderma Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Description
請求項1の発明は、画像と該画像内の黒画素又は白画素の増加量又は減少量を示す引数を受け付ける受付手段と、前記画像内の黒画素又は白画素の画素数である第1の画素数を計数する計数手段と、予め複数準備しておいた画像処理パラメタに基づいて前記画像の黒画素又は白画素を増加又は減少させる画像処理を行う処理手段と、前記処理手段による画像処理結果である画像を出力する出力手段を具備し、前記計数手段は、前記処理手段による画像処理結果である画像内の黒画素又は白画素の画素数である第2の画素数を計数し、出力手段は、前記第1の画素数と前記第2の画素数とに基づいた値が前記引数に合致する場合は、前記処理手段による画像処理結果である画像を出力することを特徴とする画像処理装置である。
本実施の形態が対処としているノイズについて、図3から図7の例を用いて説明する。図3は、ノイズの例を示す説明図である。図3(a)の例に示す「大」という文字画像に図3(b)の例に示すように点がノイズとして付加されたことによって、この文字画像を文字認識した場合は「犬」と認識してしまうことがある。また、図4(a)の例に示す「1」という文字画像に図4(b)の例に示すように点がノイズとして付加されたことによって、この文字画像を文字認識した場合は「い」と認識してしまうことがある。また、図5(a)の例に示す「1」という文字画像に図5(b)の例に示すように内部に白点がノイズとして付加されたことによって、この文字画像を文字認識した場合は「目」と認識してしまうことがある。
ノイズを除去することによって、図3(b)、図4(b)、図5(b)の文字画像が、それぞれ図3(a)、図4(a)、図5(a)の文字画像となり、文字認識結果は「大」、「1」、「1」と正確に認識されることになる。なお、ノイズとして黒画素又は白画素があり、ノイズ除去とは、画像からその黒画素又は白画素を除去することである。
対象としている文字画像にノイズが重畳されている場合、ノイズの影響で文字認識結果(又は認識確度)が誤ってしまう場合がある。ノイズを除去することによって、認識結果(又は認識確度)の精度を高めることが可能である。
しかし、画像によって、ノイズの発生のしかたが異なるため、どのようなノイズ除去を行えばよいか分からない。例えば、図3(b)の黒点をノイズとして除去すると、図3(a)のようになり、「大」という結果を得ることができる。しかしながら、正解は「犬」である場合、ノイズ除去は失敗となる。
特許文献1に記載の技術では、異なるノイズ除去を行った結果を用いる。しかしながら、単純にノイズを除去すると、ノイズを除去しすぎて、文字形状が変形してしまうことが生じる。
文字形状が変形してしまうほどにノイズを除去すると、文字認識結果が全く変わってしまい、正確な認識ができなくなる。極端な例を挙げると、すべての黒点を除去するようなノイズ除去をすると、どのような文字画像に対しても、すべて白の文字画像を認識することになり、常にスペース記号が認識結果として出力されてしまう。このスペース記号の場合、認識確度が非常に高い値となるため、認識結果を誤ってしまう可能性がある。
又は、ノイズ除去の結果、文字形状が潰れてしまって、全く別の文字となって、その文字の認識確度が非常に高い値になる場合がある。この場合も、認識結果を誤ってしまう可能性がある。
つまり、ノイズ除去をしない認識結果が正しいとしても、ノイズ除去をした認識結果を選択してしまう危険性がある。
文字認識の観点で、ノイズ除去の画像処理を行う場合、
・ノイズを除去しすぎないこと、かつ、
・ノイズを確実に除去すること
が重要である。これを達成するポイントは下記の通りである。
・黒画素増加量を指定し、指定通りに黒画素を増加させる。
又は、
・黒画素減少量を指定し、指定通りに黒画素を減少させる。
さらに、
・黒画素増加量又は黒画素減少量は、対象とする画像の黒画素数との比で指定する。
入力画像の文字の太さは不明であるため、事前に黒画素数を減少させる画像処理内容を固定すると、文字自体が消えてしまう危険性がある。図6の例に示すように、幅1画素の直線とノイズの画像(図6(a))に対して収縮処理すると、黒画素のすべてが消えてしまう(図6(b))。なお、収縮処理とは、白画素が隣接する黒画素を白画素に変更する処理である。
このような現象を避けるため、入力画像の文字の量(つまりは黒画素数)に応じて、黒画素数の減少数を規定するようにする。より具体的には、ある割合Uを規定し、入力画像中の黒画素がN画素ある場合、U×N画素の黒画素を削除するノイズ除去を行う。
図7の例に示されるように、文字線間が狭い(白線が細い)場合(図7(a))に対して膨張処理を行うと、線間が潰れてしまい(図7(b))、別の文字となってしまう危険性がある。なお、膨張処理とは、黒画素が隣接する白画素を黒画素に変更する処理である。
そのため、入力画像の黒画素数に応じて、増加させる黒画素数を規定し、文字形状が潰れないようにする。
より具体的には、ある割合Vを規定し、入力画像中の黒画素がN画素ある場合、V×N画素の黒画素を増加させるノイズ除去を行う。なお、上記文章中の「黒」を「白」に変えてもよい。また、黒画素を減少させる場合は黒のノイズ除去となり、黒画素を増加させる場合は白のノイズ除去となる。白画素を減少させる場合は白のノイズ除去となり、白画素を増加させる場合は黒のノイズ除去となる。つまり、黒画素数を増加させることは白画素数を減少させることと同義であり、黒画素数を減少させることは白画素数を増加させることと同義であり、白画素数を増加させることは黒画素数を減少させることと同義であり、白画素数を減少させることは黒画素数を増加させることと同義である。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、すべての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
特に、文字認識のための学習用の辞書を作成するために利用してもよい。つまり、学習用の辞書を作成するためには、文字画像が必要である。その文字画像中にノイズが付加されていると、適切な候補を得ることができない場合がある。文字画像からノイズを除去して、学習用の辞書に使うことができる文字画像を得られるようにするものである。
以下、主に黒画素を対象とした処理について説明を行うが、「黒画素」を「白画素」と読み替えることによって、白画素を対象とした処理であってもよい。
黒画素数計数モジュール130は、制御モジュール110と接続されている。黒画素数計数モジュール130は、制御モジュール110より黒画素数計数入力画像128を受け取り、制御モジュール110に黒画素数132を渡す。
画像処理モジュール120は、制御モジュール110と接続されている。画像処理モジュール120は、制御モジュール110より画像処理パラメタ116と画像処理入力画像118を受け取り、制御モジュール110に画像処理出力画像122を渡す。
(処理1−1)
制御モジュール110は、ノイズ除去入力画像102とそのノイズ除去入力画像102内の黒画素又は白画素の増加量又は減少量を示す引数である制御パラメタ108を受け付ける。ノイズ除去入力画像102は、2値画像であり、文字、図形等を含む文書画像、文字画像、又は図形画像等である。なお、文字画像とは、文字認識処理の対象となる画像単位であり、一般的には1文字だけが記載された画像であるが、実際には文字の一部であってもよいし、複数文字(複数の文字の部分が組み合わさったものであってもよい)が記載されていてもよい。つまり、1文字だけが内部に記入されていると想定する画像で構わない。また、ノイズ除去入力画像102は、文字画像作成プログラムによって作成された画像、又は文書画像から文字画像を切り出した画像であってもよい。
制御パラメタ108は、黒画素数の増加量(又は減少量)を示すパラメタである。より具体的には、第1の実施の形態では、ノイズ除去入力画像102の黒画素数をAとし、ノイズ除去出力画像192の黒画素数をXとした場合、制御パラメタ108は、
(X−A)/A
の値を示すものである。つまり、元の画像に対して増加又は減少した黒画素の割合を示している。なお、この値は、範囲を示すものであってもよい。この値が正であれば、黒画素数を増加させるような画像処理を行う。負であれば、黒画素数を減少させるような画像処理を行う。また、制御パラメタ108は、ノイズ除去入力画像102毎に受け付けてもよいし、複数のノイズ除去入力画像102に対して同一の制御パラメタ108を利用するようにしてもよい。
制御モジュール110は、ノイズ除去入力画像102を受け付けた後、ノイズ除去入力画像102を黒画素数計数入力画像128として黒画素数計数モジュール130に渡す。
黒画素数計数モジュール130は、制御モジュール110から渡された黒画素数計数入力画像128(ここではノイズ除去入力画像102そのもの)内の黒画素又は白画素の画素数である第1の画素数(A)を計数して、制御モジュール110へ黒画素数132(第1の画素数(A))を渡す。
次に、制御モジュール110は、黒画素数計数モジュール130から黒画素数132を受け取って、画像処理パラメタ116と、ノイズ除去入力画像102を画像処理入力画像118として画像処理モジュール120に渡し、画像処理出力画像122を受け取る。画像処理パラメタ116については後述する。
画像処理モジュール120は、画像処理パラメタ116に基づいて、画像処理入力画像118(ここではノイズ除去入力画像102そのもの)の黒画素又は白画素を増加又は減少させる画像処理を行う。いわゆるノイズ除去の処理を行う。そして、制御モジュール110へ処理結果である画像処理出力画像122を渡す。画像処理パラメタ116を用いたノイズ除去処理について後述する。
次に、制御モジュール110は、画像処理モジュール120から画像処理出力画像122を受け取って、画像処理出力画像122を黒画素数計数入力画像128として黒画素数計数モジュール130に渡す。
黒画素数計数モジュール130は、画像処理モジュール120による画像処理結果である黒画素数計数入力画像128(画像処理出力画像122)内の黒画素又は白画素の画素数である第2の画素数(B)を計数して、制御モジュール110へ黒画素数132(第2の画素数(B))を渡す。
そして、制御モジュール110は、第1の画素数(A)と第2の画素数(B)とに基づいた値が制御パラメタ108に合致する場合は、画像処理モジュール120による画像処理結果である画像処理出力画像122をノイズ除去出力画像192として出力する。第1の画素数(A)と第2の画素数(B)とに基づいた値が制御パラメタ108に合致しない場合は、画像処理モジュール120による画像処理結果である画像処理出力画像122に対して、さらに画像処理モジュール120による画像処理を行う。なお、合致するとは、完全一致の他に、比較する両者の差が予め定められた範囲内である場合を含む。また、比較する値の一方が範囲を示す値である場合は、他方の値がその範囲内である場合を含む。
ここでの制御モジュール110の処理として、例えば、
P=(B−A)/A
を算出する。そして、このPの値が制御パラメタ108の値に合致していれば、画像処理出力画像122を、ノイズ除去出力画像192として出力する。Pの値が制御パラメタ108の値に合致していない場合、画像処理パラメタ116を変更して、前述の処理(1−3)、(1−4)を繰り返す。
この結果、図8(a)の例に示すようなノイズ除去入力画像102を入力した場合は、図8(b)の例に示すようなノイズ除去出力画像192を出力することになる。
ステップS202では、制御モジュール110が、ノイズ除去入力画像102を受け付ける。
ステップS204では、制御モジュール110が、制御パラメタ108を受け付ける。
ステップS206では、制御モジュール110が、黒画素数計数モジュール130に黒画素数計数入力画像128(ノイズ除去入力画像102)を渡す。
ステップS208では、黒画素数計数モジュール130が、黒画素数計数入力画像128の黒画素を計数する。
ステップS210では、黒画素数計数モジュール130が、計数した黒画素数を制御モジュール110に渡す。
ステップS214では、制御モジュール110が、画像処理入力画像118を画像処理モジュール120に渡す。なお、画像処理入力画像118は、1回目の処理の場合はノイズ除去入力画像102であり、ステップS226でNoとなった場合である2回目以降の処理の場合は画像処理出力画像122(直前のステップS218で制御モジュール110に渡された画像処理出力画像122)である。
ステップS216では、画像処理モジュール120が、画像処理パラメタ116に基づいて、画像処理入力画像118を画像処理する。
ステップS218では、画像処理モジュール120が、画像処理出力画像122を制御モジュール110に渡す。
ステップS220では、制御モジュール110が、黒画素数計数モジュール130に黒画素数計数入力画像128を渡す。
ステップS224では、黒画素数計数モジュール130が、計数した黒画素数を制御モジュール110に渡す。
ステップS226では、制御モジュール110が、黒画素数132は制御パラメタ108に適しているか否かを判断し、適している場合はステップS228へ進み、それ以外の場合はステップS230へ進む。
ステップS228では、制御モジュール110が、ノイズ除去出力画像192を出力する。なお、ノイズ除去出力画像192は、直前のステップS218で制御モジュール110に渡された画像処理出力画像122である。
ステップS230では、制御モジュール110が、画像処理パラメタ116を変更し、ステップS212に戻る。
画像処理パラメタ116は事前に複数の値を設定しておく。例えば、パラメタ1〜パラメタKのK個のパラメタがあるとする。
一例として、パラメタ1〜パラメタKのK種類の画像処理を画像処理モジュール120に行わせて、その中で、もっとも制御パラメタ108に合致する結果を用いればよい。又は、制御パラメタ108に合致する範囲を規定しておくようにしてもよい。
まずパラメタ1で画像処理を行い、制御パラメタ108が合致範囲に入れば、その結果を用いる。結果が合致しなければ、パラメタ2を用いる。
次にパラメタ2で画像処理を行い、制御パラメタ108が合致範囲に入れば、その結果を用いる。結果が合致しなければ、パラメタ3を用いる、等として、次々にパラメタを変更しながら画像処理を行えばよい。
又は、黒画素数を増加させるような制御パラメタ108であれば、黒画素数を少しずつ増加させるようなパラメタを設定する。
複数のパラメタを用いて、少しずつ黒画素数を増加させていき、制御パラメタ108より大きい又は以上となった時点で、その画像処理結果を用いる。又は、一つ手前のパラメタを用いた画像処理結果を用いる。
同様に、黒画素数を減少させるような制御パラメタ108であれば、黒画素数を少しずつ減少させるようなパラメタを設定する。
複数のパラメタを用いて、少しずつ黒画素数を減少させていき、制御パラメタ108未満又は以下となった時点で、その画像処理結果を用いる。又は、一つ手前のパラメタを用いた画像処理結果を用いる。
画像処理パラメタ116、画像処理内容を、黒画素増加と黒画素減少に場合分けして説明する。画像処理モジュール120は、注目画素の周囲にある画素の黒画素数又は白画素数に基づいて、画像処理を行う。図9の例は、注目画像900に対して、周囲にある周囲画素901〜908の位置関係を示したものである。
(黒画素増加時)
黒画素増加時の画像処理パラメタ116をQとし、注目画素900の周囲画素901〜908(8連結画素)の黒画素数をRとする。
本画像処理は、R>Qであれば、注目画素900を黒画素に変更する。
(黒画素減少時)
黒画素減少時の画像処理パラメタ116をSとし、注目画素900の周囲画素901〜908(8連結画素)の白画素数をTとする。
本画像処理は、T>Sであれば、注目画素900を白画素に変更する。
画像処理入力画像118中の全画素をラスタスキャンし、各画素を注目画素900として、上記処理を行い、画像処理出力画像122を得る。
画像処理モジュール120による画像処理は、以上のように、中間的な膨張、収縮を行う画像処理である。しかも、膨張、収縮の程度を画像処理パラメタ116で制御可能な処理である。
画像処理モジュール120は、ラベリング処理に基づいて、画像処理を行う。
黒画素減少の場合、黒画素をラベリング処理する。ラベリングとは、4連結又は8連結の画素の塊を抽出する処理である。黒画素の塊を抽出した後、画素の塊の黒画素数を計測する。
画像処理パラメタ116として、削除する画素の塊の画素数を指定する。指定画素数よりも小さな画素の塊を削除する。
黒画素増加の場合、白画素をラベリング処理する。白画素の塊を抽出した後、画素の塊の白画素数を計測する。
画像処理パラメタ116として、削除する画素の塊の画素数を指定する。指定画素数よりも小さな画素の塊を削除する。
画像処理モジュール120は、距離変換に基づいて、画像処理を行う。
黒画素減少の場合、黒画素の距離変換を行う。ここでの距離変換とは、各黒画素を注目画素とし、注目画素からもっとも近い白画素までの距離をその注目画素の画素値とする画像処理である。
距離変換後の画像に対して、画素値の閾値を画像処理パラメタ116として指定する。距離変換画像の画素値が画像処理パラメタ116未満又は以下の場合に、その画素位置を白画素に変更する処理を行う。
黒画素増加の場合、上記の「黒画素減少の場合」における、黒画素を白画素として、白画素を黒画素とする。すなわち、白画素の距離変換を行う。
ここでの距離変換とは、各白画素を注目画素とし、注目画素からもっとも近い黒画素までの距離をその注目画素の画素値とする画像処理である。
距離返還後の画像に対して、画素値の閾値を画像処理パラメタ116として指定する。距離変換画像の画素値が画像処理パラメタ116未満又は以下の場合に、その画素位置を黒画素に変更する処理を行う。
図11(a)の例に示すように、太い線で書かれた文字線に対しては、その他の太さの線はノイズであると判断できる。
第1の実施の形態による処理によって、文字ストローク(線)以外のノイズを、図11(b)のように効果的に除去することができる。
逆に、図10(a)のように、細い線に対して、それと同様の線幅のノイズ(のようなもの)が付与されている場合は、そのノイズ(のようなもの)は、実は文字の一部分の可能性があるかもしれないため、消さないほうがよい。第1の実施の形態によるノイズ除去の結果、このような線幅が同等なものは消さずに済む(図10(b))。
さらに、黒画素数の割合(黒画素数濃度)を、隣接する文字も含めて算出してもよい。この場合には、一つの文字だけではなく、複数の文字画像を用いて安定的にノイズ除去量を算出することが可能となる。
また、ある割合Vを規定し、入力画像中の黒画素がN画素ある場合、V×N画素の黒画素を増加させるノイズ除去を行う場合、図13の例に示すように、図13(a)の例に示すノイズとなる黒線内側の白点のみを消すことができる(図13(b))。
また、制御パラメタ108は、ノイズ除去入力画像102の画素数をCとして、(X−A)/Cでもよい。正規化係数Cは、ノイズ除去入力画像102の黒画素数としてもよいし、ノイズ除去入力画像102の画素数としてもよい。
また、第1の実施の形態では黒画素数を指定したが、白画素数を指定してもよい。
第1の実施の形態では、黒画素数計数モジュール130の出力は黒画素数132であるが、出力の形態として黒画素数132ではなくてもよい。例えば、黒の濃度であってもよいし、白画素数であってもよい。また、黒画素数と全画素数から算出できる値であってもよい。
図14は、第2の実施の形態の構成例についての概念的なモジュール構成図である。
第2の実施の形態である画像処理モジュール1400は、文字認識を行うものであって、図14の例に示すように、制御モジュール1410、ノイズ除去モジュール1420、文字認識モジュール1430、文字認識統合モジュール1440を有している。ノイズ除去モジュール1420は、第1の実施の形態におけるノイズ除去モジュール100と同等のものである。つまり、第2の実施の形態は第1の実施の形態を含んでいる。
制御モジュール1410は、入力画像1402を受け付け、ノイズ除去モジュール1420に制御パラメタ1416とノイズ除去入力画像1418を、文字認識モジュール1430に文字認識入力画像1428を、文字認識統合モジュール1440に文字認識結果群1438を渡し、ノイズ除去モジュール1420よりノイズ除去出力画像1422を、文字認識モジュール1430より文字認識結果1432を、文字認識統合モジュール1440より文字認識統合結果1442を受け取り、文字認識結果1492を出力する。
ノイズ除去モジュール1420は、制御モジュール1410と接続されている。
ノイズ除去モジュール1420は、制御モジュール1410より制御パラメタ1416、ノイズ除去入力画像1418を受け取り、制御モジュール1410にノイズ除去出力画像1422を渡す。
文字認識モジュール1430は、制御モジュール1410と接続されている。
文字認識モジュール1430は、制御モジュール1410より文字認識入力画像1428を受け取り、制御モジュール1410に文字認識結果1432を渡す。
文字認識統合モジュール1440は、制御モジュール1410と接続されている。
文字認識統合モジュール1440は、制御モジュール1410より文字認識結果群1438を受け取り、制御モジュール1410に文字認識統合結果1442を渡す。
(処理2−1)
制御モジュール1410は、文字認識の対象である入力画像1402を受け付ける。入力画像1402は、第1の実施の形態におけるノイズ除去入力画像102と同等のものである。
制御モジュール1410は、制御パラメタ1416と入力画像1402をノイズ除去入力画像1418としてノイズ除去モジュール1420に渡す。なお、制御パラメタ1416は、第1の実施の形態における制御パラメタ108と同等のものである。
ノイズ除去モジュール1420は、第1の実施の形態のノイズ除去モジュール100と同等の処理を行い、処理結果としてノイズ除去出力画像1422を制御モジュール1410に渡す。
この処理において、制御モジュール1410は、ノイズ除去モジュール1420からノイズ除去出力画像1422を受け取った後、複数種類の制御パラメタ1416を用意する。例えば、
・制御パラメタ1:ノイズ除去しない
・制御パラメタ2:黒画素数を30%増加させる
・制御パラメタ3:黒画素数を30%減少させる
を制御パラメタ1416として用意する。
最初に、制御パラメタ1を制御パラメタ1416として、ノイズ除去モジュール1420によるノイズ除去を行い、その結果のノイズ除去出力画像1422を、文字認識入力画像1428として、文字認識モジュール1430に渡す。
次に、制御パラメタ2を制御パラメタ1416として、ノイズ除去モジュール1420によるノイズ除去を行い、その結果のノイズ除去出力画像1422を、文字認識入力画像1428として、文字認識モジュール1430に渡す。
最後に、制御パラメタ3を制御パラメタ1416として、ノイズ除去モジュール1420によるノイズ除去を行い、その結果のノイズ除去出力画像1422を、文字認識入力画像1428として、文字認識モジュール1430に渡す。
文字認識モジュール1430は、文字認識入力画像1428(ノイズ除去モジュール1420の処理結果であるノイズ除去出力画像1422)を対象として文字認識し、その文字認識結果1432を制御モジュール1410に渡す。前述の例の場合、制御モジュール1410は、3種類の文字認識入力画像1428に対する文字認識結果1432を3つ得ることになる。つまり、制御モジュール1410は、ノイズ除去モジュール1420、文字認識モジュール1430による処理を複数回行わせる。
(処理2−3)
制御モジュール1410は、複数(前述の例の場合は3つ)の文字認識結果1432を文字認識結果群1438として文字認識統合モジュール1440に渡す。
文字認識統合モジュール1440は、文字認識結果群1438のうち、同じ文字コードとなる結果を統合して、文字認識統合結果1442を制御モジュール1410に渡す。
そして、制御モジュール1410は、文字認識統合結果1442を、入力画像1402に対する最終的な文字認識結果1492として出力する。
そして、文字認識統合モジュール1440は、統合処理として、同じ文字コードにおける最大の認識確度をその文字コードの認識確度として採用するようにしてもよい。
この結果、図16の例に示すような入力画像1402を入力した場合は、図16(b)の例に示すような文字認識結果1492を出力することになる。例えば、その内容は、文字コード「犬」とその認識確度0.9、文字コード「大」とその認識確度0.3、文字コード「太」とその認識確度0.1、文字コード「木」とその認識確度0.05のようである。なお、認識確度は、1に近いほどその文字である確率が高いことを示している。
ステップS1502では、制御モジュール1410が、入力画像1402を受け付ける。
ステップS1504では、制御モジュール1410が、ノイズ除去モジュール1420に制御パラメタ1416とノイズ除去入力画像1418(入力画像1402)を渡す。
ステップS1506では、ノイズ除去モジュール1420が、第1の実施の形態(ノイズ除去モジュール100)と同等の処理を行う。
ステップS1508では、ノイズ除去モジュール1420が、ノイズ除去出力画像1422を制御モジュール1410に渡す。
ステップS1512では、文字認識モジュール1430が、文字認識入力画像1428に対して、文字認識処理を行う。
ステップS1514では、文字認識モジュール1430が、文字認識結果1432を制御モジュール1410に渡す。
ステップS1516では、制御モジュール1410が、制御パラメタ1416を変更して、ステップS1504からステップS1514までの処理を繰り返し、複数の文字認識結果1432を得る。
ステップS1520では、文字認識統合モジュール1440が、文字認識結果群1438を統合処理する。
ステップS1522では、文字認識統合モジュール1440が、文字認識統合結果1442を制御モジュール1410に渡す。
ステップS1524では、制御モジュール1410が、文字認識統合結果1442を最終的な文字認識結果1492として出力する。
図17の例に示すように、
制御パラメタ1に対応する文字認識結果1432を文字認識結果A1702(図17(a))、
制御パラメタ2に対応する文字認識結果1432を文字認識結果B1704(図17(b))、
制御パラメタ3に対応する文字認識結果1432を文字認識結果C1706(図17(c))
とする。図17の例において、「」の中の文字は、認識結果の文字コードを示している。その右側の数値は、認識確度である。
文字認識統合モジュール1440では、複数の文字認識結果1432の中で、同じ文字コードになったものを統合する。例えば、文字認識結果A1702の「犬」と、文字認識結果B1704の「犬」は同じであるため統合する。また、認識確度も出力する場合は、認識確度が高いほうを採用する。
上記の統合を繰り返すことによって、同一の文字コードが複数存在することがないようにする。結果として、図17(d)の例にように文字認識統合結果1710を得ることができる。
また、図17の例では、複数の文字認識結果に1度でも表れた文字コードを、最終的な文字認識結果として採用しているが、複数の文字認識結果において、予め定められた数より多い又は以上であることを、最終的な文字認識結果としての採用の条件としてもよい。例えば、同じ文字コードがすべての文字認識結果に含まれていること、又は2つ以上の文字認識結果に含まれていること等を採用の条件としてもよい。
もちろんのことながら、制御パラメタ1416の数(文字認識処理の回数)は3以外の数でもよい。
制御モジュール1410に外部からパラメタを入力してもよい。つまり、文字種又は言語に応じて、ノイズ除去モジュール1420による画像の黒画素又は白画素を増加又は減少させる度合いを調整するようにしてもよい。そのパラメタは、
・文字の種類を指定するパラメタとしてもよい。例えば、「漢字」「ひらがな」、「カタカナ」、「英語」等を指定する。各文字種類に応じて、予め定めておいた制御パラメタ1416を決定する。
・上記で文字の種類に応じて制御パラメタ1416を設定したが、これを、「言語」に応じて設定するようにしてもよい。
さらに、上記で、外部からパラメタ(文字種又は言語)を入力するとしたが、次のように行ってもよい。まず1回目の文字認識処理で、認識確度が第1位の文字コードを得る。この文字コードを用いて、文字種を特定してもよい。もちろんのことながら、第1位の文字コードではなくてもよい。1位〜n位までの文字候補の中で、もっとも多い文字種を選択してもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
102…ノイズ除去入力画像
108…制御パラメタ
110…制御モジュール
116…画像処理パラメタ
118…画像処理入力画像
120…画像処理モジュール
122…画像処理出力画像
128…黒画素数計数入力画像
130…黒画素数計数モジュール
132…黒画素数
192…ノイズ除去出力画像
1400…画像処理モジュール
1402…入力画像
1410…制御モジュール
1416…制御パラメタ
1418…ノイズ除去入力画像
1420…ノイズ除去モジュール
1422…ノイズ除去出力画像
1428…文字認識入力画像
1430…文字認識モジュール
1432…文字認識結果
1438…文字認識結果群
1440…文字認識統合モジュール
1442…文字認識統合結果
1492…文字認識結果
Claims (7)
- 画像と該画像内の黒画素又は白画素の増加量又は減少量を示す引数を受け付ける受付手段と、
前記画像内の黒画素又は白画素の画素数である第1の画素数を計数する計数手段と、
予め複数準備しておいた画像処理パラメタに基づいて前記画像の黒画素又は白画素を増加又は減少させる画像処理を行う処理手段と、
前記処理手段による画像処理結果である画像を出力する出力手段
を具備し、
前記計数手段は、前記処理手段による画像処理結果である画像内の黒画素又は白画素の画素数である第2の画素数を計数し、
出力手段は、前記第1の画素数と前記第2の画素数とに基づいた値が前記引数に合致する場合は、前記処理手段による画像処理結果である画像を出力する
ことを特徴とする画像処理装置。 - 前記第1の画素数と前記第2の画素数とに基づいた値が前記引数に合致しない場合は、前記処理手段による画像処理結果である画像に対して、さらに該処理手段による画像処理を行う
ことを特徴とする請求項1に記載の画像処理装置。 - 前記処理手段は、注目画素の周囲にある画素の黒画素数又は白画素数に基づいた前記画像処理、ラベリング処理に基づいた前記画像処理、又は、距離変換に基づいた前記画像処理のいずれかを行う
ことを特徴とする請求項1又は2に記載の画像処理装置。 - 前記出力手段によって出力された画像処理結果である画像に対して文字認識を行う文字認識処理手段と、
前記処理手段、前記文字認識処理手段による処理を複数回行い、複数の文字認識結果のうち、同じ文字コードとなる結果を統合する統合処理手段
をさらに具備することを特徴とする請求項1から3のいずれか一項に記載の画像処理装置。 - 前記文字認識処理手段は、文字認識結果として文字コードと該文字コードの認識確度を出力し、
前記統合処理手段は、同じ文字コードにおける最大の認識確度を該文字コードの認識確度として採用する
ことを特徴とする請求項4に記載の画像処理装置。 - 文字種又は言語に応じて、前記処理手段による前記画像の黒画素又は白画素を増加又は減少させる度合いを調整する
ことを特徴とする請求項4又は5に記載の画像処理装置。 - コンピュータを、
画像と該画像内の黒画素又は白画素の増加量又は減少量を示す引数を受け付ける受付手段と、
前記画像内の黒画素又は白画素の画素数である第1の画素数を計数する計数手段と、
予め複数準備しておいた画像処理パラメタに基づいて前記画像の黒画素又は白画素を増加又は減少させる画像処理を行う処理手段と、
前記処理手段による画像処理結果である画像を出力する出力手段
として機能させ、
前記計数手段は、前記処理手段による画像処理結果である画像内の黒画素又は白画素の画素数である第2の画素数を計数し、
出力手段は、前記第1の画素数と前記第2の画素数とに基づいた値が前記引数に合致する場合は、前記処理手段による画像処理結果である画像を出力する
ことを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014025290A JP6281309B2 (ja) | 2014-02-13 | 2014-02-13 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014025290A JP6281309B2 (ja) | 2014-02-13 | 2014-02-13 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015153069A JP2015153069A (ja) | 2015-08-24 |
JP6281309B2 true JP6281309B2 (ja) | 2018-02-21 |
Family
ID=53895263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014025290A Expired - Fee Related JP6281309B2 (ja) | 2014-02-13 | 2014-02-13 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6281309B2 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6330980A (ja) * | 1986-07-25 | 1988-02-09 | Canon Inc | パタ−ン認識装置 |
JPH02254574A (ja) * | 1989-03-29 | 1990-10-15 | Fuji Xerox Co Ltd | ノイズ除去方式 |
JP5316385B2 (ja) * | 2009-12-01 | 2013-10-16 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP5870638B2 (ja) * | 2011-11-09 | 2016-03-01 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法、及び画像処理プログラム |
JP5672059B2 (ja) * | 2011-02-24 | 2015-02-18 | 富士通株式会社 | 文字認識処理装置および方法並びに文字認識処理プログラム |
-
2014
- 2014-02-13 JP JP2014025290A patent/JP6281309B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015153069A (ja) | 2015-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5663866B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6119952B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20100211871A1 (en) | Information processor, information processing method, and computer readable medium | |
US8751214B2 (en) | Information processor for translating in accordance with features of an original sentence and features of a translated sentence, information processing method, and computer readable medium | |
JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6281309B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6131765B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5489894B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2011170481A (ja) | 画像処理装置及び画像処理プログラム | |
JP5821648B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5928714B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6003375B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4995507B2 (ja) | 画像処理システム、文字認識システムおよび画像処理プログラム | |
JP6260181B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5949248B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4930288B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2016009235A (ja) | 情報処理装置及び情報処理プログラム | |
JP4872780B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP5845724B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4973536B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5991076B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2016053797A (ja) | 画像処理装置及び画像処理プログラム | |
JP6229254B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6409423B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160722 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6281309 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |