JP6281309B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP6281309B2
JP6281309B2 JP2014025290A JP2014025290A JP6281309B2 JP 6281309 B2 JP6281309 B2 JP 6281309B2 JP 2014025290 A JP2014025290 A JP 2014025290A JP 2014025290 A JP2014025290 A JP 2014025290A JP 6281309 B2 JP6281309 B2 JP 6281309B2
Authority
JP
Japan
Prior art keywords
image
image processing
processing
character
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014025290A
Other languages
English (en)
Other versions
JP2015153069A (ja
Inventor
木村 俊一
俊一 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2014025290A priority Critical patent/JP6281309B2/ja
Publication of JP2015153069A publication Critical patent/JP2015153069A/ja
Application granted granted Critical
Publication of JP6281309B2 publication Critical patent/JP6281309B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
特許文献1には、活字、もしくは手書きの文字を含む画像データから、文字部分を切り出し、文字認識を行って文字コードに変換する文字認識装置において、ノイズ除去による誤認識を防いで認識精度の高い文字認識を行い得るようにすることを課題とし、制御部は入力された原画像を原画像認識部に送り、また、ノイズ除去部が入力された原画像のノイズを除去し、制御部がノイズ除去された画像をノイズ除去画像認識部に送り、原画像認識部、ノイズ除去画像認識部では、それぞれ認識用辞書を参照しながら文字認識を行い、認識候補を生成し認識候補生成部に送り、認識候補生成部は、原画像認識部、ノイズ除去画像認識部から送られてきたそれぞれの候補を統合して最終的な認識候補を生成し、ディスプレイ装置に表示することが開示されている。
特許文献2には、画像から文字を認識する場合にあって、各文字画像の1つだけの文字認識結果によって認識文字列を決定してしまうことを防止するようにした画像処理装置を提供することを課題とし、画像処理装置の切出位置抽出手段は、画像から文字画像を切り出す位置を抽出し、文字候補抽出手段は、抽出位置によって分けられた文字画像に対して文字認識を行った結果である複数の文字候補を抽出し、グラフ生成手段は、複数の文字候補の各々をノードとし、隣接する文字画像のノード間にリンクを構築することによってグラフを生成し、リンク値生成手段は、前記リンクによって接続されたノードの文字候補間の関係による文字列らしさを表す値に基づいて、リンク値を生成し、パス選択手段は、リンク値に基づいて、グラフ内のパスを選択し、出力手段は、前記パス選択手段によって選択されたパス内の文字候補列を文字認識結果として出力することが開示されている。
特開平10−187884号公報 特開2012−118650号公報
本発明は、画像内の黒画素又は白画素を増加又は減少させる画像処理を行う場合にあって、その画像内の黒画素又は白画素の増加量又は減少量を示す引数に合致する画像処理を行うようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像と該画像内の黒画素又は白画素の増加量又は減少量を示す引数を受け付ける受付手段と、前記画像内の黒画素又は白画素の画素数である第1の画素数を計数する計数手段と、予め複数準備しておいた画像処理パラメタに基づいて前記画像の黒画素又は白画素を増加又は減少させる画像処理を行う処理手段と、前記処理手段による画像処理結果である画像を出力する出力手段を具備し、前記計数手段は、前記処理手段による画像処理結果である画像内の黒画素又は白画素の画素数である第2の画素数を計数し、出力手段は、前記第1の画素数と前記第2の画素数とに基づいた値が前記引数に合致する場合は、前記処理手段による画像処理結果である画像を出力することを特徴とする画像処理装置である。
請求項2の発明は、前記第1の画素数と前記第2の画素数とに基づいた値が前記引数に合致しない場合は、前記処理手段による画像処理結果である画像に対して、さらに該処理手段による画像処理を行うことを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、前記処理手段は、注目画素の周囲にある画素の黒画素数又は白画素数に基づいた前記画像処理、ラベリング処理に基づいた前記画像処理、又は、距離変換に基づいた前記画像処理のいずれかを行うことを特徴とする請求項1又は2に記載の画像処理装置である。
請求項4の発明は、前記出力手段によって出力された画像処理結果である画像に対して文字認識を行う文字認識処理手段と、前記処理手段、前記文字認識処理手段による処理を複数回行い、複数の文字認識結果のうち、同じ文字コードとなる結果を統合する統合処理手段をさらに具備することを特徴とする請求項1から3のいずれか一項に記載の画像処理装置である。
請求項5の発明は、前記文字認識処理手段は、文字認識結果として文字コードと該文字コードの認識確度を出力し、前記統合処理手段は、同じ文字コードにおける最大の認識確度を該文字コードの認識確度として採用することを特徴とする請求項4に記載の画像処理装置である。
請求項6の発明は、文字種又は言語に応じて、前記処理手段による前記画像の黒画素又は白画素を増加又は減少させる度合いを調整することを特徴とする請求項4又は5に記載の画像処理装置である。
請求項7の発明は、コンピュータを、画像と該画像内の黒画素又は白画素の増加量又は減少量を示す引数を受け付ける受付手段と、前記画像内の黒画素又は白画素の画素数である第1の画素数を計数する計数手段と、予め複数準備しておいた画像処理パラメタに基づいて前記画像の黒画素又は白画素を増加又は減少させる画像処理を行う処理手段と、前記処理手段による画像処理結果である画像を出力する出力手段として機能させ、前記計数手段は、前記処理手段による画像処理結果である画像内の黒画素又は白画素の画素数である第2の画素数を計数し、出力手段は、前記第1の画素数と前記第2の画素数とに基づいた値が前記引数に合致する場合は、前記処理手段による画像処理結果である画像を出力することを特徴とする画像処理プログラムである。
請求項1の画像処理装置によれば、画像内の黒画素又は白画素を増加又は減少させる画像処理を行う場合にあって、その画像内の黒画素又は白画素の増加量又は減少量を示す引数に合致する画像処理を行うことができる。
請求項2の画像処理装置によれば、引数に合致しない場合は、画像処理結果である画像に対して、さらに画像処理を行うことができる。
請求項3の画像処理装置によれば、注目画素の周囲にある画素の黒画素数又は白画素数に基づいた前記画像処理を行うこと、ラベリング処理に基づいた前記画像処理を行うこと、又は、距離変換に基づいた前記画像処理を行うことのいずれかを行うことができる。
請求項4の画像処理装置によれば、複数の文字認識結果を統合することができる。
請求項5の画像処理装置によれば、同じ文字コードにおける最大の認識確度をその文字コードの認識確度として採用することができる。
請求項6の画像処理装置によれば、文字種又は言語に応じて、画像の黒画素又は白画素を増加又は減少させる度合いを調整することができる。
請求項7の画像処理プログラムによれば、画像内の黒画素又は白画素を増加又は減少させる画像処理を行う場合にあって、その画像内の黒画素又は白画素の増加量又は減少量を示す引数に合致する画像処理を行うことができる。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 第1の実施の形態による処理例を示すフローチャートである。 ノイズの例を示す説明図である。 ノイズの例を示す説明図である。 ノイズの例を示す説明図である。 ノイズ除去の例を示す説明図である。 ノイズ除去の例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態による処理例を示すフローチャートである。 第2の実施の形態による処理例を示す説明図である。 第2の実施の形態による処理例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
まず、本実施の形態を説明する前に、その前提又は本実施の形態を利用する画像処理装置について説明する。なお、この説明は、本実施の形態の理解を容易にすることを目的とするものである。
本実施の形態が対処としているノイズについて、図3から図7の例を用いて説明する。図3は、ノイズの例を示す説明図である。図3(a)の例に示す「大」という文字画像に図3(b)の例に示すように点がノイズとして付加されたことによって、この文字画像を文字認識した場合は「犬」と認識してしまうことがある。また、図4(a)の例に示す「1」という文字画像に図4(b)の例に示すように点がノイズとして付加されたことによって、この文字画像を文字認識した場合は「い」と認識してしまうことがある。また、図5(a)の例に示す「1」という文字画像に図5(b)の例に示すように内部に白点がノイズとして付加されたことによって、この文字画像を文字認識した場合は「目」と認識してしまうことがある。
ノイズを除去することによって、図3(b)、図4(b)、図5(b)の文字画像が、それぞれ図3(a)、図4(a)、図5(a)の文字画像となり、文字認識結果は「大」、「1」、「1」と正確に認識されることになる。なお、ノイズとして黒画素又は白画素があり、ノイズ除去とは、画像からその黒画素又は白画素を除去することである。
文字画像を認識して文字コードを得たい場合がある。また、この場合、文字コードのみでなく、認識確度を得るようにしてもよい。なお、認識確度とは、その文字コードが文字画像の文字として正当であることを示す度合い(値)である。また、認識結果の文字コードは、一つに限定されていなくてもよく、複数の候補があってもよい。
対象としている文字画像にノイズが重畳されている場合、ノイズの影響で文字認識結果(又は認識確度)が誤ってしまう場合がある。ノイズを除去することによって、認識結果(又は認識確度)の精度を高めることが可能である。
しかし、画像によって、ノイズの発生のしかたが異なるため、どのようなノイズ除去を行えばよいか分からない。例えば、図3(b)の黒点をノイズとして除去すると、図3(a)のようになり、「大」という結果を得ることができる。しかしながら、正解は「犬」である場合、ノイズ除去は失敗となる。
特許文献1に記載の技術では、1文字切り出してから、そのまま認識するパスと、ノイズ除去してから認識するパスに分かれる。それぞれで、複数の文字候補を得る。最終的に2つのパスで認識した結果を統合する。このようにすることによって、ノイズ除去が不要な場合と、ノイズ除去が必要な場合の両方を認識結果として得ることができる。
特許文献1に記載の技術では、異なるノイズ除去を行った結果を用いる。しかしながら、単純にノイズを除去すると、ノイズを除去しすぎて、文字形状が変形してしまうことが生じる。
文字形状が変形してしまうほどにノイズを除去すると、文字認識結果が全く変わってしまい、正確な認識ができなくなる。極端な例を挙げると、すべての黒点を除去するようなノイズ除去をすると、どのような文字画像に対しても、すべて白の文字画像を認識することになり、常にスペース記号が認識結果として出力されてしまう。このスペース記号の場合、認識確度が非常に高い値となるため、認識結果を誤ってしまう可能性がある。
又は、ノイズ除去の結果、文字形状が潰れてしまって、全く別の文字となって、その文字の認識確度が非常に高い値になる場合がある。この場合も、認識結果を誤ってしまう可能性がある。
つまり、ノイズ除去をしない認識結果が正しいとしても、ノイズ除去をした認識結果を選択してしまう危険性がある。
次に、本実施の形態における要点を説明する。なお、この説明も、本実施の形態の理解を容易にすることを目的とするものであり、具体的な説明を用いている部分は例示である。
文字認識の観点で、ノイズ除去の画像処理を行う場合、
・ノイズを除去しすぎないこと、かつ、
・ノイズを確実に除去すること
が重要である。これを達成するポイントは下記の通りである。
・黒画素増加量を指定し、指定通りに黒画素を増加させる。
又は、
・黒画素減少量を指定し、指定通りに黒画素を減少させる。
さらに、
・黒画素増加量又は黒画素減少量は、対象とする画像の黒画素数との比で指定する。
以下、黒が文字部で白が背景部の2値画像を例に説明する。
入力画像の文字の太さは不明であるため、事前に黒画素数を減少させる画像処理内容を固定すると、文字自体が消えてしまう危険性がある。図6の例に示すように、幅1画素の直線とノイズの画像(図6(a))に対して収縮処理すると、黒画素のすべてが消えてしまう(図6(b))。なお、収縮処理とは、白画素が隣接する黒画素を白画素に変更する処理である。
このような現象を避けるため、入力画像の文字の量(つまりは黒画素数)に応じて、黒画素数の減少数を規定するようにする。より具体的には、ある割合Uを規定し、入力画像中の黒画素がN画素ある場合、U×N画素の黒画素を削除するノイズ除去を行う。
同様に、入力画像の文字線と文字線の間隔は不明であるため、事前に黒画素数を増加させる画像処理内容を固定すると、文字線と文字線の間隔が塗りつぶされてしまい、文字形状が潰れてしまう危険性がある。
図7の例に示されるように、文字線間が狭い(白線が細い)場合(図7(a))に対して膨張処理を行うと、線間が潰れてしまい(図7(b))、別の文字となってしまう危険性がある。なお、膨張処理とは、黒画素が隣接する白画素を黒画素に変更する処理である。
そのため、入力画像の黒画素数に応じて、増加させる黒画素数を規定し、文字形状が潰れないようにする。
より具体的には、ある割合Vを規定し、入力画像中の黒画素がN画素ある場合、V×N画素の黒画素を増加させるノイズ除去を行う。なお、上記文章中の「黒」を「白」に変えてもよい。また、黒画素を減少させる場合は黒のノイズ除去となり、黒画素を増加させる場合は白のノイズ除去となる。白画素を減少させる場合は白のノイズ除去となり、白画素を増加させる場合は黒のノイズ除去となる。つまり、黒画素数を増加させることは白画素数を減少させることと同義であり、黒画素数を減少させることは白画素数を増加させることと同義であり、白画素数を増加させることは黒画素数を減少させることと同義であり、白画素数を減少させることは黒画素数を増加させることと同義である。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、すべての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
第1の実施の形態(画像処理装置)であるノイズ除去モジュール100は、画像内の黒画素又は白画素を増加又は減少させる画像処理を行うものであって、図1の例に示すように、制御モジュール110、画像処理モジュール120、黒画素数計数モジュール130を有している。ノイズ除去モジュール100は、ノイズ除去入力画像102に画像処理を行い、画像処理の結果であるノイズ除去出力画像192を得るものである。
特に、文字認識のための学習用の辞書を作成するために利用してもよい。つまり、学習用の辞書を作成するためには、文字画像が必要である。その文字画像中にノイズが付加されていると、適切な候補を得ることができない場合がある。文字画像からノイズを除去して、学習用の辞書に使うことができる文字画像を得られるようにするものである。
以下、主に黒画素を対象とした処理について説明を行うが、「黒画素」を「白画素」と読み替えることによって、白画素を対象とした処理であってもよい。
制御モジュール110は、画像処理モジュール120、黒画素数計数モジュール130と接続されている。制御モジュール110は、ノイズ除去入力画像102、制御パラメタ108を受け付け、黒画素数計数モジュール130に黒画素数計数入力画像128を渡し、黒画素数計数モジュール130より黒画素数132を受け取り、画像処理モジュール120に画像処理パラメタ116と画像処理入力画像118を渡し、画像処理モジュール120より画像処理出力画像122を受け取り、ノイズ除去出力画像192を出力する。
黒画素数計数モジュール130は、制御モジュール110と接続されている。黒画素数計数モジュール130は、制御モジュール110より黒画素数計数入力画像128を受け取り、制御モジュール110に黒画素数132を渡す。
画像処理モジュール120は、制御モジュール110と接続されている。画像処理モジュール120は、制御モジュール110より画像処理パラメタ116と画像処理入力画像118を受け取り、制御モジュール110に画像処理出力画像122を渡す。
処理内容を説明する。
(処理1−1)
制御モジュール110は、ノイズ除去入力画像102とそのノイズ除去入力画像102内の黒画素又は白画素の増加量又は減少量を示す引数である制御パラメタ108を受け付ける。ノイズ除去入力画像102は、2値画像であり、文字、図形等を含む文書画像、文字画像、又は図形画像等である。なお、文字画像とは、文字認識処理の対象となる画像単位であり、一般的には1文字だけが記載された画像であるが、実際には文字の一部であってもよいし、複数文字(複数の文字の部分が組み合わさったものであってもよい)が記載されていてもよい。つまり、1文字だけが内部に記入されていると想定する画像で構わない。また、ノイズ除去入力画像102は、文字画像作成プログラムによって作成された画像、又は文書画像から文字画像を切り出した画像であってもよい。
制御パラメタ108は、黒画素数の増加量(又は減少量)を示すパラメタである。より具体的には、第1の実施の形態では、ノイズ除去入力画像102の黒画素数をAとし、ノイズ除去出力画像192の黒画素数をXとした場合、制御パラメタ108は、
(X−A)/A
の値を示すものである。つまり、元の画像に対して増加又は減少した黒画素の割合を示している。なお、この値は、範囲を示すものであってもよい。この値が正であれば、黒画素数を増加させるような画像処理を行う。負であれば、黒画素数を減少させるような画像処理を行う。また、制御パラメタ108は、ノイズ除去入力画像102毎に受け付けてもよいし、複数のノイズ除去入力画像102に対して同一の制御パラメタ108を利用するようにしてもよい。
制御モジュール110は、ノイズ除去入力画像102を受け付けた後、ノイズ除去入力画像102を黒画素数計数入力画像128として黒画素数計数モジュール130に渡す。
(処理1−2)
黒画素数計数モジュール130は、制御モジュール110から渡された黒画素数計数入力画像128(ここではノイズ除去入力画像102そのもの)内の黒画素又は白画素の画素数である第1の画素数(A)を計数して、制御モジュール110へ黒画素数132(第1の画素数(A))を渡す。
(処理1−3)
次に、制御モジュール110は、黒画素数計数モジュール130から黒画素数132を受け取って、画像処理パラメタ116と、ノイズ除去入力画像102を画像処理入力画像118として画像処理モジュール120に渡し、画像処理出力画像122を受け取る。画像処理パラメタ116については後述する。
画像処理モジュール120は、画像処理パラメタ116に基づいて、画像処理入力画像118(ここではノイズ除去入力画像102そのもの)の黒画素又は白画素を増加又は減少させる画像処理を行う。いわゆるノイズ除去の処理を行う。そして、制御モジュール110へ処理結果である画像処理出力画像122を渡す。画像処理パラメタ116を用いたノイズ除去処理について後述する。
(処理1−4)
次に、制御モジュール110は、画像処理モジュール120から画像処理出力画像122を受け取って、画像処理出力画像122を黒画素数計数入力画像128として黒画素数計数モジュール130に渡す。
黒画素数計数モジュール130は、画像処理モジュール120による画像処理結果である黒画素数計数入力画像128(画像処理出力画像122)内の黒画素又は白画素の画素数である第2の画素数(B)を計数して、制御モジュール110へ黒画素数132(第2の画素数(B))を渡す。
そして、制御モジュール110は、第1の画素数(A)と第2の画素数(B)とに基づいた値が制御パラメタ108に合致する場合は、画像処理モジュール120による画像処理結果である画像処理出力画像122をノイズ除去出力画像192として出力する。第1の画素数(A)と第2の画素数(B)とに基づいた値が制御パラメタ108に合致しない場合は、画像処理モジュール120による画像処理結果である画像処理出力画像122に対して、さらに画像処理モジュール120による画像処理を行う。なお、合致するとは、完全一致の他に、比較する両者の差が予め定められた範囲内である場合を含む。また、比較する値の一方が範囲を示す値である場合は、他方の値がその範囲内である場合を含む。
ここでの制御モジュール110の処理として、例えば、
P=(B−A)/A
を算出する。そして、このPの値が制御パラメタ108の値に合致していれば、画像処理出力画像122を、ノイズ除去出力画像192として出力する。Pの値が制御パラメタ108の値に合致していない場合、画像処理パラメタ116を変更して、前述の処理(1−3)、(1−4)を繰り返す。
この結果、図8(a)の例に示すようなノイズ除去入力画像102を入力した場合は、図8(b)の例に示すようなノイズ除去出力画像192を出力することになる。
図2は、第1の実施の形態による処理例を示すフローチャートである。
ステップS202では、制御モジュール110が、ノイズ除去入力画像102を受け付ける。
ステップS204では、制御モジュール110が、制御パラメタ108を受け付ける。
ステップS206では、制御モジュール110が、黒画素数計数モジュール130に黒画素数計数入力画像128(ノイズ除去入力画像102)を渡す。
ステップS208では、黒画素数計数モジュール130が、黒画素数計数入力画像128の黒画素を計数する。
ステップS210では、黒画素数計数モジュール130が、計数した黒画素数を制御モジュール110に渡す。
ステップS212では、制御モジュール110が、画像処理パラメタ116を画像処理モジュール120に渡す。
ステップS214では、制御モジュール110が、画像処理入力画像118を画像処理モジュール120に渡す。なお、画像処理入力画像118は、1回目の処理の場合はノイズ除去入力画像102であり、ステップS226でNoとなった場合である2回目以降の処理の場合は画像処理出力画像122(直前のステップS218で制御モジュール110に渡された画像処理出力画像122)である。
ステップS216では、画像処理モジュール120が、画像処理パラメタ116に基づいて、画像処理入力画像118を画像処理する。
ステップS218では、画像処理モジュール120が、画像処理出力画像122を制御モジュール110に渡す。
ステップS220では、制御モジュール110が、黒画素数計数モジュール130に黒画素数計数入力画像128を渡す。
ステップS222では、黒画素数計数モジュール130が、黒画素数計数入力画像128の黒画素を計数する。
ステップS224では、黒画素数計数モジュール130が、計数した黒画素数を制御モジュール110に渡す。
ステップS226では、制御モジュール110が、黒画素数132は制御パラメタ108に適しているか否かを判断し、適している場合はステップS228へ進み、それ以外の場合はステップS230へ進む。
ステップS228では、制御モジュール110が、ノイズ除去出力画像192を出力する。なお、ノイズ除去出力画像192は、直前のステップS218で制御モジュール110に渡された画像処理出力画像122である。
ステップS230では、制御モジュール110が、画像処理パラメタ116を変更し、ステップS212に戻る。
画像処理パラメタ116、制御モジュール110が行う画像処理パラメタ116の変更処理について説明する。
画像処理パラメタ116は事前に複数の値を設定しておく。例えば、パラメタ1〜パラメタKのK個のパラメタがあるとする。
一例として、パラメタ1〜パラメタKのK種類の画像処理を画像処理モジュール120に行わせて、その中で、もっとも制御パラメタ108に合致する結果を用いればよい。又は、制御パラメタ108に合致する範囲を規定しておくようにしてもよい。
まずパラメタ1で画像処理を行い、制御パラメタ108が合致範囲に入れば、その結果を用いる。結果が合致しなければ、パラメタ2を用いる。
次にパラメタ2で画像処理を行い、制御パラメタ108が合致範囲に入れば、その結果を用いる。結果が合致しなければ、パラメタ3を用いる、等として、次々にパラメタを変更しながら画像処理を行えばよい。
又は、黒画素数を増加させるような制御パラメタ108であれば、黒画素数を少しずつ増加させるようなパラメタを設定する。
複数のパラメタを用いて、少しずつ黒画素数を増加させていき、制御パラメタ108より大きい又は以上となった時点で、その画像処理結果を用いる。又は、一つ手前のパラメタを用いた画像処理結果を用いる。
同様に、黒画素数を減少させるような制御パラメタ108であれば、黒画素数を少しずつ減少させるようなパラメタを設定する。
複数のパラメタを用いて、少しずつ黒画素数を減少させていき、制御パラメタ108未満又は以下となった時点で、その画像処理結果を用いる。又は、一つ手前のパラメタを用いた画像処理結果を用いる。
画像処理パラメタ116に基づいて画像処理モジュール120が行う画像処理例1について、図9の例を用いて説明する。
画像処理パラメタ116、画像処理内容を、黒画素増加と黒画素減少に場合分けして説明する。画像処理モジュール120は、注目画素の周囲にある画素の黒画素数又は白画素数に基づいて、画像処理を行う。図9の例は、注目画像900に対して、周囲にある周囲画素901〜908の位置関係を示したものである。
(黒画素増加時)
黒画素増加時の画像処理パラメタ116をQとし、注目画素900の周囲画素901〜908(8連結画素)の黒画素数をRとする。
本画像処理は、R>Qであれば、注目画素900を黒画素に変更する。
(黒画素減少時)
黒画素減少時の画像処理パラメタ116をSとし、注目画素900の周囲画素901〜908(8連結画素)の白画素数をTとする。
本画像処理は、T>Sであれば、注目画素900を白画素に変更する。
画像処理入力画像118中の全画素をラスタスキャンし、各画素を注目画素900として、上記処理を行い、画像処理出力画像122を得る。
画像処理モジュール120による画像処理は、以上のように、中間的な膨張、収縮を行う画像処理である。しかも、膨張、収縮の程度を画像処理パラメタ116で制御可能な処理である。
画像処理パラメタ116に基づいて画像処理モジュール120が行う画像処理例2について、説明する。
画像処理モジュール120は、ラベリング処理に基づいて、画像処理を行う。
黒画素減少の場合、黒画素をラベリング処理する。ラベリングとは、4連結又は8連結の画素の塊を抽出する処理である。黒画素の塊を抽出した後、画素の塊の黒画素数を計測する。
画像処理パラメタ116として、削除する画素の塊の画素数を指定する。指定画素数よりも小さな画素の塊を削除する。
黒画素増加の場合、白画素をラベリング処理する。白画素の塊を抽出した後、画素の塊の白画素数を計測する。
画像処理パラメタ116として、削除する画素の塊の画素数を指定する。指定画素数よりも小さな画素の塊を削除する。
画像処理パラメタ116に基づいて画像処理モジュール120が行う画像処理例3について、説明する。
画像処理モジュール120は、距離変換に基づいて、画像処理を行う。
黒画素減少の場合、黒画素の距離変換を行う。ここでの距離変換とは、各黒画素を注目画素とし、注目画素からもっとも近い白画素までの距離をその注目画素の画素値とする画像処理である。
距離変換後の画像に対して、画素値の閾値を画像処理パラメタ116として指定する。距離変換画像の画素値が画像処理パラメタ116未満又は以下の場合に、その画素位置を白画素に変更する処理を行う。
黒画素増加の場合、上記の「黒画素減少の場合」における、黒画素を白画素として、白画素を黒画素とする。すなわち、白画素の距離変換を行う。
ここでの距離変換とは、各白画素を注目画素とし、注目画素からもっとも近い黒画素までの距離をその注目画素の画素値とする画像処理である。
距離返還後の画像に対して、画素値の閾値を画像処理パラメタ116として指定する。距離変換画像の画素値が画像処理パラメタ116未満又は以下の場合に、その画素位置を黒画素に変更する処理を行う。
第1の実施の形態では、入力画像の黒画素量に応じて、ノイズの除去量を適応的に変えることができる。
図11(a)の例に示すように、太い線で書かれた文字線に対しては、その他の太さの線はノイズであると判断できる。
第1の実施の形態による処理によって、文字ストローク(線)以外のノイズを、図11(b)のように効果的に除去することができる。
逆に、図10(a)のように、細い線に対して、それと同様の線幅のノイズ(のようなもの)が付与されている場合は、そのノイズ(のようなもの)は、実は文字の一部分の可能性があるかもしれないため、消さないほうがよい。第1の実施の形態によるノイズ除去の結果、このような線幅が同等なものは消さずに済む(図10(b))。
さらに、黒画素数の割合(黒画素数濃度)を、隣接する文字も含めて算出してもよい。この場合には、一つの文字だけではなく、複数の文字画像を用いて安定的にノイズ除去量を算出することが可能となる。
第1の実施の形態による処理において、適切な割合UやVを事前に設定しておくことによって(すなわち、制御パラメタ108によって)、ある割合Uを規定し、入力画像中の黒画素がN画素ある場合、U×N画素の黒画素を削除するノイズ除去を行う場合、図12の例に示すように、図12(a)の例に示す孤立黒点のみ消すことができる(図12(b))。
また、ある割合Vを規定し、入力画像中の黒画素がN画素ある場合、V×N画素の黒画素を増加させるノイズ除去を行う場合、図13の例に示すように、図13(a)の例に示すノイズとなる黒線内側の白点のみを消すことができる(図13(b))。
第1の実施の形態で、制御パラメタ108として、(X−A)/Aを用いるとしたが、X(ノイズ除去出力画像192の黒画素数)の値を用いるような値であればよい。例えば、X/Aでもよいし、Xの値そのものでもよい。
また、制御パラメタ108は、ノイズ除去入力画像102の画素数をCとして、(X−A)/Cでもよい。正規化係数Cは、ノイズ除去入力画像102の黒画素数としてもよいし、ノイズ除去入力画像102の画素数としてもよい。
また、第1の実施の形態では黒画素数を指定したが、白画素数を指定してもよい。
画像処理パラメタ116の値を予め複数準備しておくとしていたが、画像処理の都度計算によって求めてもよい。1回以上、画像処理を行えば、画像処理パラメタ116と黒画素数の関係式を得ることができるため、制御パラメタに合致するような画像処理パラメタを推定することが可能である。例えば、2回画像処理を行った場合、画像処理パラメタ108と黒画素数の関係を1次式で表すことができる。この1次式を用いて、得たい黒画素数になるような画像処理パラメタ116を得ることができる。次の画像処理は、この画像処理パラメタ116を用いて行う。
第1の実施の形態では、黒画素数計数モジュール130の出力は黒画素数132であるが、出力の形態として黒画素数132ではなくてもよい。例えば、黒の濃度であってもよいし、白画素数であってもよい。また、黒画素数と全画素数から算出できる値であってもよい。
<第2の実施の形態>
図14は、第2の実施の形態の構成例についての概念的なモジュール構成図である。
第2の実施の形態である画像処理モジュール1400は、文字認識を行うものであって、図14の例に示すように、制御モジュール1410、ノイズ除去モジュール1420、文字認識モジュール1430、文字認識統合モジュール1440を有している。ノイズ除去モジュール1420は、第1の実施の形態におけるノイズ除去モジュール100と同等のものである。つまり、第2の実施の形態は第1の実施の形態を含んでいる。
制御モジュール1410は、ノイズ除去モジュール1420、文字認識モジュール1430、文字認識統合モジュール1440と接続されている。
制御モジュール1410は、入力画像1402を受け付け、ノイズ除去モジュール1420に制御パラメタ1416とノイズ除去入力画像1418を、文字認識モジュール1430に文字認識入力画像1428を、文字認識統合モジュール1440に文字認識結果群1438を渡し、ノイズ除去モジュール1420よりノイズ除去出力画像1422を、文字認識モジュール1430より文字認識結果1432を、文字認識統合モジュール1440より文字認識統合結果1442を受け取り、文字認識結果1492を出力する。
ノイズ除去モジュール1420は、制御モジュール1410と接続されている。
ノイズ除去モジュール1420は、制御モジュール1410より制御パラメタ1416、ノイズ除去入力画像1418を受け取り、制御モジュール1410にノイズ除去出力画像1422を渡す。
文字認識モジュール1430は、制御モジュール1410と接続されている。
文字認識モジュール1430は、制御モジュール1410より文字認識入力画像1428を受け取り、制御モジュール1410に文字認識結果1432を渡す。
文字認識統合モジュール1440は、制御モジュール1410と接続されている。
文字認識統合モジュール1440は、制御モジュール1410より文字認識結果群1438を受け取り、制御モジュール1410に文字認識統合結果1442を渡す。
処理内容を説明する。
(処理2−1)
制御モジュール1410は、文字認識の対象である入力画像1402を受け付ける。入力画像1402は、第1の実施の形態におけるノイズ除去入力画像102と同等のものである。
制御モジュール1410は、制御パラメタ1416と入力画像1402をノイズ除去入力画像1418としてノイズ除去モジュール1420に渡す。なお、制御パラメタ1416は、第1の実施の形態における制御パラメタ108と同等のものである。
ノイズ除去モジュール1420は、第1の実施の形態のノイズ除去モジュール100と同等の処理を行い、処理結果としてノイズ除去出力画像1422を制御モジュール1410に渡す。
この処理において、制御モジュール1410は、ノイズ除去モジュール1420からノイズ除去出力画像1422を受け取った後、複数種類の制御パラメタ1416を用意する。例えば、
・制御パラメタ1:ノイズ除去しない
・制御パラメタ2:黒画素数を30%増加させる
・制御パラメタ3:黒画素数を30%減少させる
を制御パラメタ1416として用意する。
最初に、制御パラメタ1を制御パラメタ1416として、ノイズ除去モジュール1420によるノイズ除去を行い、その結果のノイズ除去出力画像1422を、文字認識入力画像1428として、文字認識モジュール1430に渡す。
次に、制御パラメタ2を制御パラメタ1416として、ノイズ除去モジュール1420によるノイズ除去を行い、その結果のノイズ除去出力画像1422を、文字認識入力画像1428として、文字認識モジュール1430に渡す。
最後に、制御パラメタ3を制御パラメタ1416として、ノイズ除去モジュール1420によるノイズ除去を行い、その結果のノイズ除去出力画像1422を、文字認識入力画像1428として、文字認識モジュール1430に渡す。
(処理2−2)
文字認識モジュール1430は、文字認識入力画像1428(ノイズ除去モジュール1420の処理結果であるノイズ除去出力画像1422)を対象として文字認識し、その文字認識結果1432を制御モジュール1410に渡す。前述の例の場合、制御モジュール1410は、3種類の文字認識入力画像1428に対する文字認識結果1432を3つ得ることになる。つまり、制御モジュール1410は、ノイズ除去モジュール1420、文字認識モジュール1430による処理を複数回行わせる。
(処理2−3)
制御モジュール1410は、複数(前述の例の場合は3つ)の文字認識結果1432を文字認識結果群1438として文字認識統合モジュール1440に渡す。
文字認識統合モジュール1440は、文字認識結果群1438のうち、同じ文字コードとなる結果を統合して、文字認識統合結果1442を制御モジュール1410に渡す。
そして、制御モジュール1410は、文字認識統合結果1442を、入力画像1402に対する最終的な文字認識結果1492として出力する。
なお、文字認識結果1492として、文字コードとその文字コードの認識確度を出力するようにしてもよい。文字認識モジュール1430の文字認識結果1432としても、文字コードと認識確度の2種を出力する。このように、画像を入力して文字コードと認識確度を出力するような方式は既存の手法が様々あり、どれも用いてもよい。例えば、特開2011−113125号公報、特開2013−069132号公報記載の技術を用いることができる。
そして、文字認識統合モジュール1440は、統合処理として、同じ文字コードにおける最大の認識確度をその文字コードの認識確度として採用するようにしてもよい。
この結果、図16の例に示すような入力画像1402を入力した場合は、図16(b)の例に示すような文字認識結果1492を出力することになる。例えば、その内容は、文字コード「犬」とその認識確度0.9、文字コード「大」とその認識確度0.3、文字コード「太」とその認識確度0.1、文字コード「木」とその認識確度0.05のようである。なお、認識確度は、1に近いほどその文字である確率が高いことを示している。
図15は、第2の実施の形態による処理例を示すフローチャートである。
ステップS1502では、制御モジュール1410が、入力画像1402を受け付ける。
ステップS1504では、制御モジュール1410が、ノイズ除去モジュール1420に制御パラメタ1416とノイズ除去入力画像1418(入力画像1402)を渡す。
ステップS1506では、ノイズ除去モジュール1420が、第1の実施の形態(ノイズ除去モジュール100)と同等の処理を行う。
ステップS1508では、ノイズ除去モジュール1420が、ノイズ除去出力画像1422を制御モジュール1410に渡す。
ステップS1510では、制御モジュール1410が、文字認識入力画像1428(ノイズ除去出力画像1422)を文字認識モジュール1430に渡す。
ステップS1512では、文字認識モジュール1430が、文字認識入力画像1428に対して、文字認識処理を行う。
ステップS1514では、文字認識モジュール1430が、文字認識結果1432を制御モジュール1410に渡す。
ステップS1516では、制御モジュール1410が、制御パラメタ1416を変更して、ステップS1504からステップS1514までの処理を繰り返し、複数の文字認識結果1432を得る。
ステップS1518では、制御モジュール1410が、文字認識結果群1438(複数の文字認識結果1432)を文字認識統合モジュール1440に渡す。
ステップS1520では、文字認識統合モジュール1440が、文字認識結果群1438を統合処理する。
ステップS1522では、文字認識統合モジュール1440が、文字認識統合結果1442を制御モジュール1410に渡す。
ステップS1524では、制御モジュール1410が、文字認識統合結果1442を最終的な文字認識結果1492として出力する。
文字認識統合モジュール1440による処理例を、図17を用いて詳述する。
図17の例に示すように、
制御パラメタ1に対応する文字認識結果1432を文字認識結果A1702(図17(a))、
制御パラメタ2に対応する文字認識結果1432を文字認識結果B1704(図17(b))、
制御パラメタ3に対応する文字認識結果1432を文字認識結果C1706(図17(c))
とする。図17の例において、「」の中の文字は、認識結果の文字コードを示している。その右側の数値は、認識確度である。
文字認識統合モジュール1440では、複数の文字認識結果1432の中で、同じ文字コードになったものを統合する。例えば、文字認識結果A1702の「犬」と、文字認識結果B1704の「犬」は同じであるため統合する。また、認識確度も出力する場合は、認識確度が高いほうを採用する。
上記の統合を繰り返すことによって、同一の文字コードが複数存在することがないようにする。結果として、図17(d)の例にように文字認識統合結果1710を得ることができる。
また、図17の例では、複数の文字認識結果に1度でも表れた文字コードを、最終的な文字認識結果として採用しているが、複数の文字認識結果において、予め定められた数より多い又は以上であることを、最終的な文字認識結果としての採用の条件としてもよい。例えば、同じ文字コードがすべての文字認識結果に含まれていること、又は2つ以上の文字認識結果に含まれていること等を採用の条件としてもよい。
第2の実施の形態では、すべてのパラメタで文字認識を行ってから、その結果を統合したが、統合は逐次的に行ってもよい。例えば、第1回の文字認識結果と第2回の文字認識結果を統合する。その統合結果と、第3回の文字認識結果を統合する等としてもよい。
もちろんのことながら、制御パラメタ1416の数(文字認識処理の回数)は3以外の数でもよい。
制御モジュール1410に外部からパラメタを入力してもよい。つまり、文字種又は言語に応じて、ノイズ除去モジュール1420による画像の黒画素又は白画素を増加又は減少させる度合いを調整するようにしてもよい。そのパラメタは、
・文字の種類を指定するパラメタとしてもよい。例えば、「漢字」「ひらがな」、「カタカナ」、「英語」等を指定する。各文字種類に応じて、予め定めておいた制御パラメタ1416を決定する。
・上記で文字の種類に応じて制御パラメタ1416を設定したが、これを、「言語」に応じて設定するようにしてもよい。
さらに、上記で、外部からパラメタ(文字種又は言語)を入力するとしたが、次のように行ってもよい。まず1回目の文字認識処理で、認識確度が第1位の文字コードを得る。この文字コードを用いて、文字種を特定してもよい。もちろんのことながら、第1位の文字コードではなくてもよい。1位〜n位までの文字候補の中で、もっとも多い文字種を選択してもよい。
図18を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図18に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1817と、プリンタなどのデータ出力部1818を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1801は、前述の実施の形態において説明した各種のモジュール、すなわち、ノイズ除去モジュール100、制御モジュール110、画像処理モジュール120、黒画素数計数モジュール130、画像処理モジュール1400、制御モジュール1410、ノイズ除去モジュール1420、文字認識モジュール1430、文字認識統合モジュール1440等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1802は、CPU1801が使用するプログラムや演算パラメタ等を格納する。RAM(Random Access Memory)1803は、CPU1801の実行において使用するプログラムや、その実行において適宜変化するパラメタ等を格納する。これらはCPUバスなどから構成されるホストバス1804により相互に接続されている。
ホストバス1804は、ブリッジ1805を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1806に接続されている。
キーボード1808、マウス等のポインティングデバイス1809は、操作者により操作される入力デバイスである。ディスプレイ1810は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1811は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1801によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、ノイズ除去入力画像102、制御パラメタ108、画像処理出力画像122、黒画素数132、ノイズ除去出力画像192、入力画像1402、ノイズ除去出力画像1422、文字認識結果1432、文字認識統合結果1442、文字認識結果1492等が格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1812は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1813に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1807、外部バス1806、ブリッジ1805、及びホストバス1804を介して接続されているRAM1803に供給する。リムーバブル記録媒体1813も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1814は、外部接続機器1815を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1814は、インタフェース1807、及び外部バス1806、ブリッジ1805、ホストバス1804等を介してCPU1801等に接続されている。通信部1816は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部1817は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1818は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図18に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図18に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図18に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
100…ノイズ除去モジュール
102…ノイズ除去入力画像
108…制御パラメタ
110…制御モジュール
116…画像処理パラメタ
118…画像処理入力画像
120…画像処理モジュール
122…画像処理出力画像
128…黒画素数計数入力画像
130…黒画素数計数モジュール
132…黒画素数
192…ノイズ除去出力画像
1400…画像処理モジュール
1402…入力画像
1410…制御モジュール
1416…制御パラメタ
1418…ノイズ除去入力画像
1420…ノイズ除去モジュール
1422…ノイズ除去出力画像
1428…文字認識入力画像
1430…文字認識モジュール
1432…文字認識結果
1438…文字認識結果群
1440…文字認識統合モジュール
1442…文字認識統合結果
1492…文字認識結果

Claims (7)

  1. 画像と該画像内の黒画素又は白画素の増加量又は減少量を示す引数を受け付ける受付手段と、
    前記画像内の黒画素又は白画素の画素数である第1の画素数を計数する計数手段と、
    予め複数準備しておいた画像処理パラメタに基づいて前記画像の黒画素又は白画素を増加又は減少させる画像処理を行う処理手段と、
    前記処理手段による画像処理結果である画像を出力する出力手段
    を具備し、
    前記計数手段は、前記処理手段による画像処理結果である画像内の黒画素又は白画素の画素数である第2の画素数を計数し、
    出力手段は、前記第1の画素数と前記第2の画素数とに基づいた値が前記引数に合致する場合は、前記処理手段による画像処理結果である画像を出力する
    ことを特徴とする画像処理装置。
  2. 前記第1の画素数と前記第2の画素数とに基づいた値が前記引数に合致しない場合は、前記処理手段による画像処理結果である画像に対して、さらに該処理手段による画像処理を行う
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記処理手段は、注目画素の周囲にある画素の黒画素数又は白画素数に基づいた前記画像処理、ラベリング処理に基づいた前記画像処理、又は、距離変換に基づいた前記画像処理のいずれかを行う
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記出力手段によって出力された画像処理結果である画像に対して文字認識を行う文字認識処理手段と、
    前記処理手段、前記文字認識処理手段による処理を複数回行い、複数の文字認識結果のうち、同じ文字コードとなる結果を統合する統合処理手段
    をさらに具備することを特徴とする請求項1から3のいずれか一項に記載の画像処理装置。
  5. 前記文字認識処理手段は、文字認識結果として文字コードと該文字コードの認識確度を出力し、
    前記統合処理手段は、同じ文字コードにおける最大の認識確度を該文字コードの認識確度として採用する
    ことを特徴とする請求項4に記載の画像処理装置。
  6. 文字種又は言語に応じて、前記処理手段による前記画像の黒画素又は白画素を増加又は減少させる度合いを調整する
    ことを特徴とする請求項4又は5に記載の画像処理装置。
  7. コンピュータを、
    画像と該画像内の黒画素又は白画素の増加量又は減少量を示す引数を受け付ける受付手段と、
    前記画像内の黒画素又は白画素の画素数である第1の画素数を計数する計数手段と、
    予め複数準備しておいた画像処理パラメタに基づいて前記画像の黒画素又は白画素を増加又は減少させる画像処理を行う処理手段と、
    前記処理手段による画像処理結果である画像を出力する出力手段
    として機能させ、
    前記計数手段は、前記処理手段による画像処理結果である画像内の黒画素又は白画素の画素数である第2の画素数を計数し、
    出力手段は、前記第1の画素数と前記第2の画素数とに基づいた値が前記引数に合致する場合は、前記処理手段による画像処理結果である画像を出力する
    ことを特徴とする画像処理プログラム。
JP2014025290A 2014-02-13 2014-02-13 画像処理装置及び画像処理プログラム Expired - Fee Related JP6281309B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014025290A JP6281309B2 (ja) 2014-02-13 2014-02-13 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014025290A JP6281309B2 (ja) 2014-02-13 2014-02-13 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2015153069A JP2015153069A (ja) 2015-08-24
JP6281309B2 true JP6281309B2 (ja) 2018-02-21

Family

ID=53895263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014025290A Expired - Fee Related JP6281309B2 (ja) 2014-02-13 2014-02-13 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP6281309B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6330980A (ja) * 1986-07-25 1988-02-09 Canon Inc パタ−ン認識装置
JPH02254574A (ja) * 1989-03-29 1990-10-15 Fuji Xerox Co Ltd ノイズ除去方式
JP5316385B2 (ja) * 2009-12-01 2013-10-16 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5870638B2 (ja) * 2011-11-09 2016-03-01 セイコーエプソン株式会社 画像処理装置、画像処理方法、及び画像処理プログラム
JP5672059B2 (ja) * 2011-02-24 2015-02-18 富士通株式会社 文字認識処理装置および方法並びに文字認識処理プログラム

Also Published As

Publication number Publication date
JP2015153069A (ja) 2015-08-24

Similar Documents

Publication Publication Date Title
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
JP6119952B2 (ja) 画像処理装置及び画像処理プログラム
US20100211871A1 (en) Information processor, information processing method, and computer readable medium
US8751214B2 (en) Information processor for translating in accordance with features of an original sentence and features of a translated sentence, information processing method, and computer readable medium
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
JP6221220B2 (ja) 画像処理装置及び画像処理プログラム
JP6281309B2 (ja) 画像処理装置及び画像処理プログラム
JP6131765B2 (ja) 情報処理装置及び情報処理プログラム
JP5489894B2 (ja) 画像処理装置及び画像処理プログラム
JP2011170481A (ja) 画像処理装置及び画像処理プログラム
JP5821648B2 (ja) 情報処理装置及び情報処理プログラム
JP5928714B2 (ja) 情報処理装置及び情報処理プログラム
JP6003375B2 (ja) 画像処理装置及び画像処理プログラム
JP4995507B2 (ja) 画像処理システム、文字認識システムおよび画像処理プログラム
JP6260181B2 (ja) 情報処理装置及び情報処理プログラム
JP5949248B2 (ja) 情報処理装置及び情報処理プログラム
JP4930288B2 (ja) 画像処理装置及び画像処理プログラム
JP2016009235A (ja) 情報処理装置及び情報処理プログラム
JP4872780B2 (ja) 画像処理システム及び画像処理プログラム
JP5845724B2 (ja) 画像処理装置及び画像処理プログラム
JP4973536B2 (ja) 画像処理装置及び画像処理プログラム
JP5991076B2 (ja) 画像処理装置及び画像処理プログラム
JP2016053797A (ja) 画像処理装置及び画像処理プログラム
JP6229254B2 (ja) 情報処理装置及び情報処理プログラム
JP6409423B2 (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160722

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180108

R150 Certificate of patent or registration of utility model

Ref document number: 6281309

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees