JP6780271B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP6780271B2 JP6780271B2 JP2016057782A JP2016057782A JP6780271B2 JP 6780271 B2 JP6780271 B2 JP 6780271B2 JP 2016057782 A JP2016057782 A JP 2016057782A JP 2016057782 A JP2016057782 A JP 2016057782A JP 6780271 B2 JP6780271 B2 JP 6780271B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- value
- module
- images
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/174—Segmentation; Edge detection involving the use of two or more images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/32—Determination of transform parameters for the alignment of images, i.e. image registration using correlation-based methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
しかし、帳票等の枠罫線を有している文書内から、操作者の操作にしたがって、認識等の対象とする領域が抽出された場合、特許文献1等に記載の技術では、罫線が切断されてしまい、その切断された罫線も文字として抽出することとなってしまう。
そこで、本発明は、操作者の操作にしたがって、画像から領域を抽出し、その領域内に切断された罫線がある場合であっても、その罫線を削除することができるようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
請求項1の発明は、操作者の操作にしたがって、画像から領域を抽出する抽出手段と、前記領域に枠を付加する付加手段と、前記枠に連結する黒画素を削除する削除手段と、前記削除手段による処理結果を出力する出力手段と、2つの画像をそれぞれ複数の領域に分割する分割手段と、前記2つの画像間で対応する分割画像間の類似度を示す値を配置した配列内で、最も類似していることを示す第1の値を抽出し、該第1の値の位置を含むエリア内の類似度を対象から除外して、最も類似していることを示す第2の値を抽出する第2の抽出手段と、前記各分割画像の類似度を示す値のうち、前記第1の値と前記第2の値の差分が、予め定められた閾値未満又は以下である類似度を示す値を除外して、前記2つの画像の位置合わせを行うように制御する制御手段を有し、前記抽出手段は、位置合わせ処理後の画像に対して、領域を抽出する、画像処理装置である。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
画像受付モジュール110が受け付ける複数の画像は、位置合わせ対象の画像である。例えば、同じテンプレート(型、雛型、フォーム等)を用いた文書画像である。位置合わせは、例えば、操作者の操作によって、ある画像(一般的には1枚目の画像)に対して行われた領域指定を、他の画像(2枚目以降の画像)に対しても適用するためのものである。例えば、図5、図6に示す画像のように、両者は納品書というテンプレートに記載された文書であって、内容(記載されている文字等)は異なるが、その元のテンプレート部分(矩形で囲まれた表等)は同じである。したがって、本来ならば、図5の画像に対して行われた領域指定を、そのままの座標で、図6の画像に対して行うことができるはずである。
しかし、画像を読み込んだスキャナ等の性能によって、位置ずれが発生するのが一般的である。図7の例に示す画像は、図5の画像と図6の画像とを単純に重ね合わせたものである。表の罫線等がずれているのがわかる。このように、同じテンプレートを用いた画像であっても、両者にはずれが発生している。したがって、ある画像に対して行われた領域指定を、同じテンプレートを用いた他の画像に対しても適用するためには、位置合わせ(位置ずれの補正)が必要である。
「2つの画像をそれぞれ複数の領域に分割する」とは、具体的には、2つの画像に対して縦方向及び横方向に同じ数だけの領域に分割することであって、2つの画像で同じ数の分割画像を生成することである。また、分割画像は矩形画像(長方形、正方形を含む)となる。
また、一方の画像内の第1の分割画像は他方の画像内の第2の分割画像よりも小さい画像とする。
図8(a)に示す例は、図5に示す画像を領域分割したものである。図8(b)に示す例は、図6に示す画像を領域分割したものである。この例は、横方向に10個の領域、縦方向に15個の領域に、両者の画像を分割したものである。図8(b)に示す分割画像は、図8(a)に示す分割画像よりも小さくしている。具体的には、分割画像を、上方向、下方向、左方向、右方向にそれぞれ予め定められた画素数だけ小さくすればよい。なお、各方向における画素数は、同じであってもよいし、異なっていてもよい。例えば、上下方向に5画素ずつ、左右方向に10画素ずつ小さくしたものであってもよい。
なお、図8の例では、1枚の画像内の分割画像は全て同じ大きさとしているが、異なる大きさの分割画像に分割してもよい。ただし、2枚の画像間で、対応している分割画像が存在している必要がある。
相関係数算出モジュール140は、画像分割モジュール120によって生成された、2つの画像間で対応する分割画像間の類似度を示す値を算出する。「2つの画像間で対応する分割画像」とは、2つの画像内での分割画像の位置が同じことをいう。具体的には、一方の画像の左上に位置する分割画像(A)と他方の画像の左上に位置する分割画像(a)は対応しており、分割画像(A)の右隣に位置する一方の画像の分割画像(B)と分割画像(a)の右隣に位置する他方の画像の分割画像(b)は対応しており、以下同様に、一方の画像内の全ての分割画像に対して、他方の画像内で対応する分割画像が存在する。類似度を示す値として、画像間の類似度を示す値であればよく、具体な例として、相関係数、SAD(Sum of Absolute Difference)、SSD(Sum of Squared Difference)等がある。以下、相関係数を例示して示すが、もちろんのことながら、他の値を用いてもよい。
図9(a1)の例に示す分割画像A:900Aは、図8(a)の例に示した1つの分割画像を示している。図9(a2)の例に示す分割画像B:910Bは、図8(b)の例に示した1つの分割画像を示している。つまり、図8(a)の分割画像A:900Aの位置に対応する図8(b)の領域B:900B内から分割画像B:910Bを抽出したものである。図9(a1)に示すように一方の分割画像A:900Aがあり、それに対応した位置に図9(a2)に示す他方の分割画像B:910Bがある。なお、分割画像B:910Bは、領域B:900B(分割画像A:900Aと同じ大きさ)を小さくしたものである。なお、説明を簡略化するために、分割画像A:900Aを縦5画素、横5画素の矩形とし、分割画像B:910Bを縦3画素、横3画素の矩形としている。この例では、領域B:900Bを上下左右に1画素ずつ小さい領域の画像を分割画像B:910Bとしているが、上側をV(Vは1以上の整数)画素、右側をW(Wは1以上の整数)画素、下側をX(Xは1以上の整数)画素、左側をY(Yは1以上の整数)画素小さくしたものであってもよい。なお、V、W、X、Yはそれぞれ異なる数値であってもよいし、同じ数値が含まれていてもよいし、全てが同じ数値であってもよい。
除外モジュール150は、2つの画像間で対応する分割画像間の相関係数を配置した配列内で、最上位の相関係数である第1の値(配列内で最も類似していることを示す値、いわゆるピーク値)の位置を含むエリア内の相関係数の値を予め定められた値に変換する。ここで、「予め定められた値」として、相関係数の値としての最低値以下の値又はその配列内での最低値以下の値を用いるようにしてもよい。つまり、そのエリア内の値が、第2の値として抽出されることがないようにすればよい。なお、ここで「第1の値の位置を含むエリア」とは、第1の値の位置のいわゆる近傍を意味している。エリアとして、例えば、第1の値の位置を中心として予め定められた大きさの矩形(正方形を含む長方形)内のエリアとしてもよいし、第1の値の位置を中心として予め定められた半径で描かれる円内のエリア等としてもよい。
次に、除外モジュール150は、変換後の配列内での最上位の相関係数である第2の値(いわゆる悪いスコアで塗りつぶした後の配列内でのいわゆるピーク値)を抽出する。
そして、除外モジュール150は、各分割画像の相関係数のうち、第1の値と第2の値の差分が、予め定められた閾値未満又は以下である相関係数を除外して、2つの画像の位置合わせを行うように制御する。つまり、除外した相関係数以外の相関係数を、ずれ算出モジュール160に渡す。
図10では、相関係数の高い位置(白い位置)は、左側中央に位置していることを示している。
図11では、相関係数の高い位置は、全体に位置していることを示している。なお、図11(a)に示す例では、黒くなっている。その理由は2つある。
ひとつは、ゼロ除算になっている場合である。全ての画素が同じ値だと相関係数の計算の分母が0になり、計算不能なため黒にしている。ゼロ除算であるので、全画素の値が一致していたとしても、相関係数としては「計算不能」である。計算不能を「相関が高い」とみなすわけではない。図11(a)の例では、最大値の計算や様子を出力する都合上、「計算不能」をある実数にマッピングする必要がある。この場合、相関がないことを示す「0又は−1」にマッピングするのが妥当である。1にしてしまうと、「計算不能」が最大値として採用されてしまう恐れがある。
もうひとつは、紙の表面の微細な凹凸が画像としてとらえられている場合である。肉眼では真っ白に見えるが、画素値の上では完全な真っ白ではなく、ノイズ等があると考えられる。この場合は、異なる紙の表面の凹凸が高い相関をもつことはまれであるので、どの場所も0に非常に近い値となり、図11(a)の例では黒となる。
図12では、相関係数の高い位置は、横中央に位置していることを示している。つまり、左右にずらしても2つの分割画像は一致していることを示している。
図13では、配列内で最上位の相関係数は左側中央に位置しているので、エリア1300はその位置を含む位置に配置している。
図14では、配列内で最上位の相関係数は、例えば、中央に位置しているので、エリア1400はその位置を含む位置に配置している。
図15では、配列内で最上位の相関係数は中央に位置していることを示しているので、エリア1500はその位置を含む位置に配置している。
そして、エリア1300、エリア1400、エリア1500内を最低値(−1)にする。図では、そのエリア内を黒く塗りつぶしている。
そして、第1の値と第2の値の差分が、予め定められた閾値未満又は以下である場合、相関係数がピークとなった座標を位置合わせのために用いる座標のリストから除外する。図14、図15の例は除外されることとなる。したがって、図13の例が位置合わせのために用いられることとなる。つまり、相関係数のピークが1点に定まっているものを採用する。
なお、最低値とする対象を、点ではなく範囲のあるエリアとした理由は、ピークの周辺はそのピークに近い値の相関係数である可能性が高いためである。
画像補正モジュール170は、テンプレートマッチング処理モジュール130と接続されている。画像補正モジュール170は、ずれ算出モジュール160によって算出されたずれを用いて、画像を補正する。具体的には、ずれている分だけ逆方向にアフィン変換(主に、平行移動)すればよい。つまり、第1の値の位置が配列内の中央になるように、アフィン変換を施せばよい。
図2(a)に示す例は、画像処理装置100に文字認識装置210を接続したものである。前述したように、画像処理装置100は、テンプレートを用いて作成された複数枚の文書画像を読み込んで、位置合わせを行う。そして、操作者の操作によって、そのうちの1枚(一般的には、最初の文書画像)に対して、認識領域を設定する。文字認識装置210は、その認識領域内の文字を認識する。位置合わせが行われているので、操作者は、それ以外の文書画像に対して認識領域を設定する必要はない。なお、画像処理装置100による位置合わせが行われていないと、ずれが発生しているので、全ての文書画像で、認識領域を設定する必要が生じる。又は、1枚目の文書画像に対して行った認識領域の設定をそのまま流用した場合は、ずれがあるので認識率が低くなってしまう。
図2(b)に示す例は、画像読取装置220が、画像処理装置100、文字認識装置210を有しているシステム構成である。画像読取装置220が読み込んだ複数の文書画像に対して、図2(a)に示す例と同様の処理を行うことができる。
画像読取装置230、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)である画像形成装置240で読み込んだ文書画像を、通信回線290を介して画像処理装置100A(又は画像読取装置220内の画像処理装置100B)に送信し、位置合わせした画像を、通信回線290を介して文字認識装置210A(又は画像読取装置220内の文字認識装置210B)に送信し、文字認識結果を得るようにしてもよい。
ステップS302では、画像受付モジュール110は、画像Aを受け付ける。
ステップS304では、画像受付モジュール110は、画像Bを受け付ける。
ステップS306では、画像分割モジュール120は、画像Aを分割することによって、分割画像Aを生成する。
ステップS308では、画像分割モジュール120は、画像Bを分割することによって、分割画像Bを生成する。ただし、分割画像Bは、分割画像Aよりも小さいものとする。
ステップS312では、相関係数算出モジュール140は、分割画像A内で分割画像Bを移動する。
ステップS314では、相関係数算出モジュール140は、走査が終了したか否かを判断し、終了した場合はステップS316へ進み、それ以外の場合はステップS310に戻る。
ステップS318では、除外モジュール150は、相関係数の分布において、ピークAを含む部分領域内を相関係数の低い値(例えば、最も低い値)に変更する。
ステップS320では、除外モジュール150は、ステップS318の処理後の相関係数の分布において、相関係数のピークBを抽出する。
ステップS324では、除外モジュール150は、その分割画像における相関係数は除外する。
ステップS326では、ずれ算出モジュール160は、その分割画像におけるずれ量を算出する。
ステップS330では、画像補正モジュール170は、画像Bを画像Aに合わせる補正をする。
ステップS332では、画像補正モジュール170は、補正後の画像Bを出力する。
図17は、第2の実施の形態の構成例についての概念的なモジュール構成図を示している。
第2の実施の形態である画像処理装置1700は、操作者の操作にしたがって、画像から領域を抽出するものであって、図17の例に示すように、画像受付モジュール110、画像分割モジュール120、テンプレートマッチング処理モジュール130、画像補正モジュール170、トリミング指定モジュール1780、トリミング処理モジュール1790を有している。なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
画像分割モジュール120は、画像受付モジュール110、テンプレートマッチング処理モジュール130と接続されている。
テンプレートマッチング処理モジュール130は、相関係数算出モジュール140、除外モジュール150、ずれ算出モジュール160を有しており、画像分割モジュール120、画像補正モジュール170と接続されている。
画像補正モジュール170は、テンプレートマッチング処理モジュール130、トリミング処理モジュール1790と接続されている。画像補正モジュール170による処理結果を、トリミング指定モジュール1780又はトリミング処理モジュール1790に渡すようにしてもよい。
トリミング指定モジュール1780は、画像受付モジュール110、トリミング処理モジュール1790と接続されている。トリミング指定モジュール1780は、操作者の操作にしたがって、画像から領域を抽出する。いわゆる切り出し処理である。なお、トリミング指定モジュール1780は、画像補正モジュール170による処理結果である画像を対象として、領域の抽出を行ってもよい。
次に、トリミング処理モジュール1790は、その枠に連結する黒画素を削除する。そして、トリミング処理モジュール1790は、黒画素を削除した処理結果を出力する。この処理結果は、トリミング指定モジュール1780の抽出処理によって切断された罫線が削除され、文字だけが残ることになる。そして、トリミング処理モジュール1790による処理結果を、第1の実施の形態で前述したように、文字認識装置210等に渡すようにしてもよい。
ただし、トリミング処理モジュール1790による処理は、各画像(画像補正モジュール170による処理結果の画像)に対して行ったほうがよい。トリミング処理モジュール1790が削除した黒画素の座標を記憶しておき、2枚目以降の画像に対して、その座標の画素を白画素に変更する処理を行うよりも、画像毎に変位する罫線にも対応して削除できるからである。例えば、画像の読み取りによって、罫線のかすれ、太り等が生じてしまい、画像毎に罫線を構成する黒画素の位置が異なることが多いからである。
ステップS1802では、トリミング指定モジュール1780は、画像に対するユーザーのトリミング処理を受け付ける。
例えば、図19に示すように、画像受付モジュール110が受け付けた画像の一部を拡大して表示する。そして、ユーザーは、トリミング処理として、画像から領域を抽出する。抽出する領域は、例えば、文字認識対象の領域である。そして、図20の例に示すように、表内の1行を抽出したとする。この場合、縦線が文字の間(例えば、「標準体重」と「Kg」の間、「Kg」と「59.9」の間等)に入ることとなる。この縦線は、表を構成する罫線の一部であり、本来は文字ではない。しかし、この切り出しした画像に対して文字認識を行うと、「1」等と認識してしまう可能性が高い。特に、数字に近い位置にある縦線は、「1」であるのか罫線の一部であるのかを判別することは困難である。具体的な文字認識結果として、「1標準体重|Kgl59.9151.8|52.1|」のようになることがある。
例えば、図21に示すように、ステップS1802で抽出したトリミング画像2100に対して、枠線2110を付加する。ここでの枠線2110の太さは、1画素である。したがって、トリミング画像2100よりも縦方向に2画素、横方向に2画素大きな画像が生成されることになる。なお、この例では「1画素枠線」としたが、2画素以上の太さであってもよい。ただし、太さは1画素あれば十分である。図20の例に示した画像に1画素枠線を付加したものを、図22の例に示す。付加した枠線に縦線(元の罫線)が接続することになる。
ここで塗りつぶし処理とは、黒画素の開始点に連結(4連結、8連結のいずれでもよい)している黒画素をたどり、白画素に変更することである。例えば、図22に示す画像に対して、この処理を施した結果の画像を、図23の例に示す。図に示すように、縦線が削除され、文字だけの画像が生成されることになる。
ステップS1808では、トリミング処理モジュール1790は、罫線を除去した画像(文字画像)を出力する。
ステップS2402では、トリミング指定モジュール1780は、画像1に対するユーザーのトリミング処理を受け付ける。
ステップS2404では、トリミング処理モジュール1790は、トリミング処理された部分画像の上下左右に1画素枠線を付加する。
ステップS2406では、トリミング処理モジュール1790は、枠線上の一点に連結している黒画素を白画素に塗りつぶす処理を行う。
ステップS2410では、次の画像はあるか否かを判断し、ある場合はステップS2412へ進み、それ以外の場合は処理を終了する(ステップS2499)。
ステップS2412では、補正処理を行い、ステップS2404に戻る。ステップS2412の処理は、次の画像に対して、第1の実施の形態による処理を行う。
なお、ステップS2412の次に、ステップS2404に戻るようにしているが、ステップS2402に戻るようにしてもよい。
また、トリミング処理モジュール1790は、付加した枠線と接触している黒画素数が予め定められた閾値より多い又は以上である場合は、ユーザーに警告(トリミング処理をやり直すことのメッセージ等)を発するようにしてもよい。文字と接触している可能性が高いからである。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分又は全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
[A]
2つの画像をそれぞれ複数の領域に分割する分割手段と、
前記2つの画像間で対応する分割画像間の類似度を示す値を配置した配列内で、最も類似していることを示す第1の値を抽出し、該第1の値の位置を含むエリア内の類似度を対象から除外して、最も類似していることを示す第2の値を抽出する抽出手段と、
前記各分割画像の類似度を示す値のうち、前記第1の値と前記第2の値の差分が、予め定められた閾値未満又は以下である類似度を示す値を除外して、前記2つの画像の位置合わせを行うように制御する制御手段
を有する画像処理装置。
前記予め定められた値として、類似度を示す値としての最低値以下の値又は前記配列内での最低値以下の値を用いる、
[A]に記載の画像処理装置。
前記分割手段は、一方の画像内の第1の分割画像は他方の画像内の第2の分割画像よりも小さくし、
前記類似度を示す値の配列は、第2の分割画像内で第1の分割画像をずらしながら、類似度を示す値を算出した結果の配列である、
[A]又は[B]に記載の画像処理装置。
コンピュータを、
2つの画像をそれぞれ複数の領域に分割する分割手段と、
前記2つの画像間で対応する分割画像間の類似度を示す値を配置した配列内で、最も類似していることを示す第1の値を抽出し、該第1の値の位置を含むエリア内の類似度を対象から除外して、最も類似していることを示す第2の値を抽出する抽出手段と、
前記各分割画像の類似度を示す値のうち、前記第1の値と前記第2の値の差分が、予め定められた閾値未満又は以下である類似度を示す値を除外して、前記2つの画像の位置合わせを行うように制御する制御手段
として機能させるための画像処理プログラム。
[A]の画像処理装置によれば、類似度を示す値の上位の値である第1の値と第2の値の差分が、予め定められた閾値未満又は以下である類似度を示す値を用いて、2つの画像の位置合わせをしてしまうことを防止することができる。
110…画像受付モジュール
120…画像分割モジュール
130…テンプレートマッチング処理モジュール
140…相関係数算出モジュール
150…除外モジュール
160…ずれ算出モジュール
170…画像補正モジュール
210…文字認識装置
220…画像読取装置
230…画像読取装置
240…画像形成装置
290…通信回線
1700…画像処理装置
1780…トリミング指定モジュール
1790…トリミング処理モジュール
Claims (2)
- 操作者の操作にしたがって、画像から領域を抽出する抽出手段と、
前記領域に枠を付加する付加手段と、
前記枠に連結する黒画素を削除する削除手段と、
前記削除手段による処理結果を出力する出力手段と、
2つの画像をそれぞれ複数の領域に分割する分割手段と、
前記2つの画像間で対応する分割画像間の類似度を示す値を配置した配列内で、最も類似していることを示す第1の値を抽出し、該第1の値の位置を含むエリア内の類似度を対象から除外して、最も類似していることを示す第2の値を抽出する第2の抽出手段と、
前記各分割画像の類似度を示す値のうち、前記第1の値と前記第2の値の差分が、予め定められた閾値未満又は以下である類似度を示す値を除外して、前記2つの画像の位置合わせを行うように制御する制御手段
を有し、
前記抽出手段は、位置合わせ処理後の画像に対して、領域を抽出する、
画像処理装置。 - コンピュータを、
操作者の操作にしたがって、画像から領域を抽出する抽出手段と、
前記領域に枠を付加する付加手段と、
前記枠に連結する黒画素を削除する削除手段と、
前記削除手段による処理結果を出力する出力手段と、
2つの画像をそれぞれ複数の領域に分割する分割手段と、
前記2つの画像間で対応する分割画像間の類似度を示す値を配置した配列内で、最も類似していることを示す第1の値を抽出し、該第1の値の位置を含むエリア内の類似度を対象から除外して、最も類似していることを示す第2の値を抽出する第2の抽出手段と、
前記各分割画像の類似度を示す値のうち、前記第1の値と前記第2の値の差分が、予め定められた閾値未満又は以下である類似度を示す値を除外して、前記2つの画像の位置合わせを行うように制御する制御手段
として機能させ、
前記抽出手段は、位置合わせ処理後の画像に対して、領域を抽出する、
画像処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016057782A JP6780271B2 (ja) | 2016-03-23 | 2016-03-23 | 画像処理装置及び画像処理プログラム |
US15/239,641 US10026185B2 (en) | 2016-03-23 | 2016-08-17 | Image processing device, non-transitory computer readable medium, and method for image alignment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016057782A JP6780271B2 (ja) | 2016-03-23 | 2016-03-23 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017174031A JP2017174031A (ja) | 2017-09-28 |
JP6780271B2 true JP6780271B2 (ja) | 2020-11-04 |
Family
ID=59898036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016057782A Active JP6780271B2 (ja) | 2016-03-23 | 2016-03-23 | 画像処理装置及び画像処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10026185B2 (ja) |
JP (1) | JP6780271B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038825B (zh) * | 2017-12-12 | 2020-08-04 | 维沃移动通信有限公司 | 一种图像处理方法及移动终端 |
CN108805119A (zh) * | 2018-05-04 | 2018-11-13 | 广东小天才科技有限公司 | 一种基于指尖穿戴设备的搜索方法及指尖穿戴设备、系统 |
EP3639752A1 (en) | 2018-10-03 | 2020-04-22 | Canon Medical Systems Corporation | Analyzing apparatus and analyzing program |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05298484A (ja) | 1992-04-23 | 1993-11-12 | Toshiba Corp | 光学的文字読取装置 |
US5359513A (en) * | 1992-11-25 | 1994-10-25 | Arch Development Corporation | Method and system for detection of interval change in temporally sequential chest images |
US5848184A (en) * | 1993-03-15 | 1998-12-08 | Unisys Corporation | Document page analyzer and method |
US5604819A (en) * | 1993-03-15 | 1997-02-18 | Schlumberger Technologies Inc. | Determining offset between images of an IC |
JP3586949B2 (ja) | 1995-11-16 | 2004-11-10 | 松下電器産業株式会社 | 帳票認識装置 |
JP3615333B2 (ja) * | 1996-12-05 | 2005-02-02 | 株式会社リコー | 罫線消去装置 |
US6466685B1 (en) * | 1998-07-14 | 2002-10-15 | Kabushiki Kaisha Toshiba | Pattern recognition apparatus and method |
JP4116179B2 (ja) | 1999-03-03 | 2008-07-09 | 株式会社リコー | 画像処理方法、画像処理装置および記録媒体 |
US7245766B2 (en) * | 2000-05-04 | 2007-07-17 | International Business Machines Corporation | Method and apparatus for determining a region in an image based on a user input |
US7200254B2 (en) * | 2002-02-14 | 2007-04-03 | Ngk Insulators, Ltd. | Probe reactive chip, sample analysis apparatus, and method thereof |
US7263224B2 (en) * | 2004-01-16 | 2007-08-28 | Microsoft Corporation | Strokes localization by m-array decoding and fast image matching |
US7962846B2 (en) * | 2004-02-13 | 2011-06-14 | Microsoft Corporation | Organization of annotated clipping views |
JP2009053815A (ja) * | 2007-08-24 | 2009-03-12 | Nikon Corp | 被写体追跡プログラム、および被写体追跡装置 |
US8014603B2 (en) * | 2007-08-30 | 2011-09-06 | Xerox Corporation | System and method for characterizing handwritten or typed words in a document |
US8098957B2 (en) * | 2008-02-13 | 2012-01-17 | Qualcomm Incorporated | Shared block comparison architechture for image registration and video coding |
KR100940301B1 (ko) * | 2008-03-26 | 2010-02-05 | 호서대학교 산학협력단 | 마크 분할 검사 방법 |
JP4926116B2 (ja) * | 2008-04-16 | 2012-05-09 | 株式会社日立ハイテクノロジーズ | 画像検査装置 |
US8655803B2 (en) * | 2008-12-17 | 2014-02-18 | Xerox Corporation | Method of feature extraction from noisy documents |
US8261180B2 (en) * | 2009-04-28 | 2012-09-04 | Lexmark International, Inc. | Automatic forms processing systems and methods |
US9495343B2 (en) * | 2014-09-30 | 2016-11-15 | Konica Minolta Laboratory U.S.A., Inc. | Horizontal and vertical line detection and removal for document images |
US9916508B2 (en) * | 2015-03-12 | 2018-03-13 | Toyota Jidosha Kabushiki Kaisha | Detecting roadway objects in real-time images |
-
2016
- 2016-03-23 JP JP2016057782A patent/JP6780271B2/ja active Active
- 2016-08-17 US US15/239,641 patent/US10026185B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017174031A (ja) | 2017-09-28 |
US10026185B2 (en) | 2018-07-17 |
US20170278250A1 (en) | 2017-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5887770B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4577421B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP7017060B2 (ja) | 画像処理装置及び画像処理プログラム | |
US8331692B2 (en) | Image processing system and computer readable medium | |
JP6780271B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2013126004A (ja) | 画像処理装置、画像生成方法、およびコンピュータプログラム | |
JP6957889B2 (ja) | 画像処理装置及び画像処理プログラム | |
US10075614B2 (en) | Image processing apparatus and non-transitory computer readable medium | |
US20100007912A1 (en) | Image processing apparatus, image processing method, computer-readable medium and computer data signal | |
JP2017174030A (ja) | 画像処理装置及び画像処理プログラム | |
US20180343350A1 (en) | Reading method guidance apparatus, non-transitory computer readable medium, and image processing system | |
US8311322B2 (en) | Image processing apparatus, image processing method, and computer readable medium | |
JP2016063507A (ja) | 画像処理装置及び画像処理プログラム | |
JP5742283B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4420440B2 (ja) | 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 | |
JP5923981B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6606885B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5476884B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5056063B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20220343666A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US20130236101A1 (en) | Information processing apparatus, non-transitory computer readable medium, and information processing method | |
JP5434273B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009060216A (ja) | 画像処理装置及び画像処理プログラム | |
JP2013161158A (ja) | 画像処理装置及び画像処理プログラム | |
JP5434272B2 (ja) | 情報処理装置及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200915 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6780271 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |