JP2011243018A - 画像処理システム及び画像処理方法 - Google Patents

画像処理システム及び画像処理方法 Download PDF

Info

Publication number
JP2011243018A
JP2011243018A JP2010114963A JP2010114963A JP2011243018A JP 2011243018 A JP2011243018 A JP 2011243018A JP 2010114963 A JP2010114963 A JP 2010114963A JP 2010114963 A JP2010114963 A JP 2010114963A JP 2011243018 A JP2011243018 A JP 2011243018A
Authority
JP
Japan
Prior art keywords
pixels
image
pixel
center
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010114963A
Other languages
English (en)
Inventor
Itsumi Majima
伊津美 間嶋
Yutaka Hosogane
豊 細金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyodo Printing Co Ltd
Original Assignee
Kyodo Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyodo Printing Co Ltd filed Critical Kyodo Printing Co Ltd
Priority to JP2010114963A priority Critical patent/JP2011243018A/ja
Publication of JP2011243018A publication Critical patent/JP2011243018A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】撮像画像の撮像の仕方によって大きく影響されることなく、正確に画像を認識することを可能にする。
【解決手段】画像処理システムは、撮像画像から所定の濃度を有する画素を複数抽出し、抽出した複数の画素のうち、画素同士で連結している画素があれば、それらを1つの連結画素としてグループ化する。グループ化した連結画素を所定の2次元座標であるXY平面に配置し、連結画素の(Xmax,Ymax)及び(Xmin,Ymin)から連結画素の重心G1を算出する。重心G1から最も距離の離れた最大離間画素Aを算出し、重心G1を中心とし、重心G1と最大離間画素Aとの距離を半径Rとした円50を生成し、円50の中に、最大離間画素A以外に四角形の角となるべき3つの画素(B,C,D)が存在していれば、最大離間画素A及び3つの画素(B,C,D)を四隅とする四角形の枠の画像が存在すると判断する。
【選択図】図15

Description

本発明は、撮像画像から四角形の画像を抽出する画像処理システム及び画像処理方法に関する。
従来の技術として、2値画像信号(完全な白色と完全な黒色の2色のみで表現された画像の信号)から黒連結成分の外接矩形を抽出し、抽出された外接矩形と黒連結成分との接点情報に基づいて、対象物を抽出する対象物抽出方法が知られている(例えば、特許文献1参照。)。
この先行技術は、矩形抽出部にて2値画像信号から黒連結成分の外接矩形を抽出し、候補矩形判定部にて予め設定された閾値と抽出された矩形の幅、高さを比較し、抽出すべき対象物が長方形であるか否かをチェックするものである。
この先行技術によれば、矩形対象物の抽出処理を、外接矩形と黒連結成分との接点情報に基づいて行っているので、画像中の対象物を高精度に抽出することができるものと考えられる。
特開平7−160886号公報
上述した先行技術では、さらに、対象物が回転しているか否かを判定する回転判定部が存在しており、画像中の対象物が回転していても対象物を抽出することができる点で優位である。
しかし、上述した先行技術では、矩形対象物の抽出処理を、外接矩形と黒連結成分との接点情報に基づいて行っているため、黒連結成分の周りに正確に外接矩形を生成しなければならず、また、接点情報を正確に算出しなければならないという問題がある。この点、抽出対象がはっきりしたとした図形等であればよいが、ぼんやりとした図形であるとか歪んだ形の図形であるとか明暗のはっきりしない図形であるような場合には、黒連結成分に矩形を外接させることは難しく、正確な画像認識ができない。
携帯電話機等のモバイル機器を用いて撮像された画像は、その撮像時の環境が多種多様であるため、その結果、得られた画像には撮像環境の違いが大きく現れる。また、ユーザごとに使用する機器の個体差や機種の違いによる違いが大きく現れることも多く、たとえ異なるユーザが同じ対象物を撮像した場合であっても、撮像環境の違いや機種の違いによってそれぞれが撮像した画像間には無限に近い違いが現れる。
例えば、同じ正方形の画像を撮像する場合であっても、撮像時におけるモバイル機器の傾斜具合や、その場の照明の有無、ユーザの熟練度等、様々な要因によって撮像画像は異なったものとなってくる。このような状況にあっては、たとえ上述した先行技術の手法を適用しても、撮像された画像間の違いがそれぞれの撮像画像に大きく影響し、そのままでは正確な画像認識が困難になるという問題がある。
そこで本発明は、撮像画像の撮像の仕方によって大きく影響されることなく、正確に画像を認識することを可能にする技術の提供を課題としている。
上記の課題を解決するため、本発明は画像処理システム及び画像処理方法を提供する。本発明の画像処理システム及び画像処理方法は、例えば以下に示される流れに沿って画像処理が進行する。
(1)撮像画像から所定の濃度を有する画素が複数抽出される。ここで、「濃度」とは、色の濃さや薄さ、色の明るさや暗さ等を示す指標であり、抽出したい画素に応じて、所定の濃度を予め設定しておく。この処理で、所定の濃度を有する画素、すなわち、撮像画像の中で色の濃い部分の画素や、撮像画像の中で暗い部分の画素が抽出される。抽出された画素は、以降の処理対象となる。その一方で、所定の濃度を有さない画素、すなわち、撮像画像の中で色の薄い部分の画素や、撮像画像の中で明るい部分の画素が取り除かれる。取り除かれた画素は、以降の処理対象から除かれる。
(2)抽出された複数の画素のうち、画素同士で連結している画素があれば、それらは1つの連結画素としてグループ化される。グループ化をすることで、連結画素の取り扱いが容易化され、以降の処理負担が軽減される。
(3)グループ化された連結画素を所定の2次元座標であるXY平面に配置し、連結画素のX方向の最大値及び最小値と、連結画素のY方向の最大値及び最小値とから連結画素の重心が算出される。例えば、2次元座標での連結画素の配置位置の最大値を(Xmax,Ymax)とし、最小値を(Xmin,Ymin)とすれば、連結画素の重心(Xg,Yg)は、((Xmax+Xmin)/2,(Ymax+Ymin)/2)として算出することができる。
(4)連結画素に含まれる各画素のうち、重心から最も距離の離れた最大離間画素が算出される。この処理では、連結画素に含まれる各画素から重心までの距離を算出し、最も距離が離れている画素を最大離間画素と定める。
(5)連結画素の重心を中心とし、重心と最大離間画素との距離を半径とした円が生成される。この処理によって、連結画素がその内部に含まれる円が描かれる。
(6)生成した円の中に、最大離間画素以外に四角形の角となるべき3つの画素が存在していれば、最大離間画素及び3つの画素を四隅とする四角形の画像が存在すると判断される。四角形の角となるべき3つの画素の判定は、連結画素の中にコーナーとなるべき部分が存在しているかや、連結画素の中にある程度の角度を持って屈折している箇所があるか、認定しようとしている画素よりも外周側に連結画素中の画素がないか等によって行う。
このように、本発明の画像処理システム及び画像処理方法によれば、連結画素の重心を算出し、その重心と最大離間画素との距離を半径とした円を生成し、その円の中に四角形の角となるべき3つの画素が存在しているか否かを判断することにより、四角形の画像を探しあてることができる。これは、まず、最大離間画素を四角形の1つの角として定め、最初の1点が定まれば、次は円を生成するのであるが、この円の半径は、連結画素の重心と最大離間画素との距離であるため、連結画素が四角形の形状であれば、四角形の残りの3点は必ず生成する円の中に入ることになる。したがって、撮像画像の中に含まれる四角形の画像が正確な正方形や長方形でなく、ある程度歪んだ形状等であっても、生成円の中には残りの3点が含まれるため、四角形の画像を精度よく抽出することができる。
この点、上述した先行技術は、黒連結成分のエッジに矩形を外接させて対象物を抽出するものであるが、仮に丸みを帯びた四角形の画像や、各辺に凹凸のある四角形の画像であれば、少し大きめに外接矩形を生成しなければならず、画像認識の正確性に欠けるという問題がある。
これに対して本願発明は、上述した先行技術のような接点情報に基づく処理ではなく、四角形の角となるべき残りの3点が円の中に入っているか否かで判断するので、ある程度おおまかなくくりで円を生成し、その円を利用して残りの3点を探すことができるので、処理の簡略化が図れるとともに、画像認識の正確性を高めることができる。
本発明の画像処理システム及び画像処理方法として、四角形の画像が存在すると判断した場合に、その四角形の画像の外側の画素を除去することが好ましい。
本発明によれば、四角形の画像の内側の画素はそのまま残り、四角形の画像の外側の画素は除去されるので、背景等の不要な情報をユーザの補助なしに自動的に削除し、必要な情報のみを残すことができる。
本発明の画像処理システム及び画像処理方法として、抽出した複数の画素のうち、画素同士で連結していない孤立した画素を除去することが好ましい。
本発明によれば、画像処理の対象を画素同士で連結している連結画素に限定し、画素同士で連結していない孤立した画素を除去することによって、その後の処理の迅速化を図りつつ、画像認識の精度を高めることができる。
本発明の画像処理システム及び画像処理方法として、抽出した各画素に対して、固有の識別情報を順に付していき、画素同士で連結している画素があれば、それらに同一の識別情報を付すことによりグループ化することが好ましい。
本発明によれば、識別情報を用いて各画素をグループとしてまとめることができるので、それだけ情報量を少なくすることができる。これにより、その後の処理は識別情報を用いて行えばよく、処理の簡素化を図ることができる。したがって、デジタル処理に極めて好適であるとともに、簡素なコンピュータハードウェアによる処理にも容易に適用することができ、それだけ利用の幅を拡張することができる。
本発明の画像処理システム及び画像処理方法として、抽出した各画素の近傍に新たな画素を付加することにより、各画素を拡大化させることが好ましい。
本発明によれば、各画素を拡大化させることにより、認識の対象となる画素がそれぞれ拡大され、仮に不明瞭な線や文字があっても、それが元の明確な状態に復元され、画像認識の確実性を高めることができる。
本発明の画像処理システム及び画像処理方法として、連結画素の面積値又は連結画素が囲む領域を含めた連結画素の面積値を算出し、算出した面積値が所定の範囲内にあれば、四角形の画像が存在すると判断することが好ましい。
本発明によれば、連結画素の面積値等を判断対象とすることで、認識対象となる四角形の画像の面積がある程度固定されているような場合には、その面積値から大きく外れる面積値を有する連結画素(例えば、極端に小さい面積値を有する連結画素や、極端に大きい面積値を有する連結画素)を認識の対象ではないと判断することができる。
本発明の画像処理システム及び画像処理方法として、連結画素のX方向の最大値及び最小値と、連結画素のY方向の最大値及び最小値とから、連結画素の形状の縦及び横の比率である縦横比を算出し、縦横比が所定の範囲内にあれば、四角形の画像が存在すると判断することが好ましい。
本発明によれば、連結画素の縦横比を判断対象とすることで、認識対象となる四角形の形状が正方形や長方形である場合に、その正方形や長方形の縦横比から大きく外れる縦横比を有する連結画素(例えば、極端に長細い長方形形状の連結画素)を認識の対象ではないと判断することができる。
本発明の画像処理システム及び画像処理方法として、撮像画像の中心を算出し、撮像画像の中心と連結画素の重心との距離を算出し、その距離が所定の範囲内にあれば、四角形の画像が存在すると判断することが好ましい。
本発明によれば、撮像画像の中心と連結画素の重心との距離を判断対象とすることで、通常は認識させたい画像が撮像画像の中心に配置されることが多いものであるから、そのような通常の場面を利用して、撮像画像の中心と連結画素の重心とが極端に離れている場合に、その連結画素を認識の対象ではないと判断することができる。
本発明の画像処理システム及び画像処理方法として、連結画素の各画素の配置状態を含めて重心を算出し、その重心と撮像画像の中心との距離を算出し、その距離が所定の範囲内にあれば、四角形の画像が存在すると判断することが好ましい。
本発明によれば、連結画素の各画素の配置状態を含めて重心を算出することで、幾何学的な形状だけで決定されるいわゆる図心を重心とするのではなく、連結画素の各画素に質量があるものと擬制して決定した重心を用いて判断を行うことができ、いびつな形状を有するにもかかわらず、幾何学的な重心が中央部分に配置されてしまう連結画素を排除することができる。
本発明の画像処理システム及び画像処理方法として、撮像画像は、四角形の撮像対象領域と、撮像対象領域の外縁に形成された黒色又はカラーの第1枠と、第1枠の外縁に形成された余白による第2枠とを備えた印刷物又は画像(いずれでもよい)を撮像した画像であることが好ましい。
本発明によれば、四角形の撮像対象領域の周りに黒色又はカラーの第1枠を配置することで、撮像対象領域を際立たせることができ、画像認識の精度を高めることができる。また、黒色又はカラーの第1枠の周りに余白による第2枠を配置することで、第1枠を強調することができ、第1枠と第2枠との相乗効果で画像認識の精度をより高めることができる。さらに、第1枠と第2枠といった二重の枠で撮像対象領域を囲むことにより、その中の領域が撮像対象領域であるということをユーザに知らしめ、第1枠と第2枠とで囲んだ領域を狙って撮像することをユーザに促すことができる。
本発明の画像処理システム及び画像処理方法によれば、連結画素の重心を算出し、その重心と最大離間画素との距離を半径とした円を生成し、その円の中に四角形の角となるべき3つの画素が存在しているか否かを判断することにより、四角形の画像が存在しているか否かを判断する。したがって、撮像画像の中に含まれる四角形の画像が正確な正方形や長方形でなく、ある程度歪んだ形状等であったり、回転したりしている場合であっても、生成円の中には残りの3点が含まれるため、四角形の画像の認識精度を高めることができる。
画像処理システムの構成を概略的に示した図である。 携帯情報端末1及びサーバ100それぞれの構成例を示すブロック図である。 携帯情報端末1の端末制御部10により実行される端末画像処理の一例を示すフローチャートである。 実際の撮像画像が処理される様子を示す連続図である(1/2)。 実際の撮像画像が処理される様子を示す連続図である(2/2)。 携帯情報端末1を用いて行われる撮像の様子を示す斜視図である。 サンプル画像Imの周辺部分を拡大して示す図である。 孤立画素除去処理について説明する図である。 太線化処理について説明する図である。 グループ化処理について説明する図である。 重心算出処理について説明する図である。 判断処理の内容をさらに詳細に示したフローチャートである。 連結画素の面積値の算出方法について説明する図である。 連結画素の縦横比の算出方法について説明する図である。 最大離間画素算出処理,円生成処理及び判断処理について説明する図である。 画像検索処理の手順例を示すフローチャートである。
以下、本発明の画像処理システム及びこれを用いて行う画像処理方法の実施形態について説明する。
図1は、画像処理システムの構成を概略的に示した図である。この画像処理システムは、例えば個人ユーザが所持する携帯情報端末1をはじめ、移動体通信網の基地局101、ネットワーク102及びサーバコンピュータ100から構成されている。なお画像処理システムはその実行する機能により、携帯情報端末1だけで構成される場合もあれば、携帯情報端末1とその他の要素(基地局101、ネットワーク102及びサーバコンピュータ100)とで構成される場合もあり、サーバコンピュータ100だけで構成される場合もある。
携帯情報端末1は、例えばその表示画面上でHTMLデータに基づく表示を行う機能を有した携帯型の情報端末機器であり、ここでは携帯電話機が例に挙げられている。また携帯情報端末1はコンピュータとしての機能をも有しており、内蔵する記憶装置(メモリ)等に記憶されたアプリケーションプログラムを適宜読み出し、これを実行するシステムリソースを備えている。
本実施形態の画像処理システムは、携帯情報端末1にカメラ機能(撮像機能)が付属している場合を想定している。すなわち、携帯情報端末1には図示しないカメラモジュールが内蔵されており、このカメラモジュールは、例えばCCDイメージセンサ等の撮像素子とレンズとを組み合わせて構成されている。なお携帯情報端末1は携帯電話機に限らず、通信機能とカメラ機能とを有した携帯型コンピュータやノート型のパーソナルコンピュータ等でもよい。またこれらの場合、カメラ機能は外部接続機器(USBカメラ)を用いて実現してもよい。
基地局101は、携帯情報端末1との間で通信を行うためのアンテナを備えている。基地局101は例えばインターネット等のネットワーク102に接続されており、この状態で基地局101は、携帯情報端末1によりネットワーク102を通じて行われるデータ通信を中継する。
ネットワーク102には、サーバコンピュータ(以下「サーバ」と呼称する)100が接続されている。サーバ100は、基地局101及びネットワーク102を経由して、携帯情報端末1との間でデータ通信を行う機能を有するほか、コンピュータとして画像検索プログラムを実行するための機能を有する。またサーバ100は画像データベース(図1には示されていない)を保有し、この画像データベース内に複数の画像データを予め登録している。サーバ100は画像検索プログラムの実行に伴い、画像データベースにアクセスして画像検索を実行する。
図2は、携帯情報端末1及びサーバ100それぞれの構成例を示すブロック図である。なお図2中、基地局101についてはその図示を省略している。
携帯情報端末1は、図示しないCPU(Centoral Processing Unit)やメモリ等のハードウェアリソースを有するほか、無線(RF)通信モジュールやRFアンテナ等をも内蔵している。携帯情報端末1は、これら内蔵するハードウェアリソースを用いてアプリケーションプログラムを実行するとともに、その実行に伴い無線通信モジュールを用いてネットワーク102に接続することができる。
またサーバ100は、図示しないCPU(Centoral Processing Unit)をはじめとして、メモリや周辺IC、ハードディスク等の各種のハードウェアリソースを備えている。サーバ100は、そのハードウェアリソースを用いて画像検索プログラムを実行するほか、その実行に伴い図示しないネットワークインタフェースを通じてネットワーク102に接続することができる。
また携帯情報端末1は端末制御部10を有しており、この端末制御部10は、例えば上記のCPUを用いて実現されている。また端末制御部10には、各種処理部として主に、撮像処理部11、抽出処理部(抽出手段)12、孤立画素除去処理部(孤立画素除去手段)13、太線化処理部(拡大化手段)14、グループ化処理部(グループ化手段)15、重心算出処理部(重心算出手段)16、判断処理部(判断手段)17、不要画素除去処理部(不要画素除去手段)18、特徴量抽出処理部19及びデータ送信処理部191が組み込まれている。
このうち撮像処理部11は、上記のカメラモジュールを用いて撮像を行い、撮像画像(撮影画像)を取得する処理を実行する。抽出処理部12は、撮像画像から複数の画素を抽出する処理を実行する。孤立画素除去処理部13は、抽出した画素から、孤立した画素を除去する処理を実行する。太線化処理部14は、抽出した画素を太線化(拡大化)させる処理を実行する。グループ化処理部15は、抽出した画素を連結画素としてグループ化をする処理を実行する。
重心算出処理部16は、連結画素の重心を算出する処理を実行する。判断処理部17は、算出した重心等の情報に基づいて撮像画像の中に四角形の枠の画像が存在するか否かを判断する処理を実行する。不要画素除去処理部18は、四角形の枠の外側の画素を除去する処理を実行する。特徴量抽出処理部19は、枠外の画素を除去した撮像画像から画像特徴量を抽出する処理を実行する。データ送信処理部191は、上記の無線通信モジュールを用いて、画像特徴量のデータを送信する。なお、各種処理部による処理については、さらに詳しく後述する。また各種処理部の構成は、例えばCPUにより実行されるプログラムモジュールを用いて実現することができる。
その他に携帯情報端末1は、操作キー1aや画像表示部1b等を備えている。操作キー1aは、ユーザのプッシュ操作(押下)を受け付ける各種キーやボタン等のスイッチであり、画像表示部1bは、例えば携帯情報端末1に付属する液晶ディスプレイである。端末制御部10は、携帯情報端末1のユーザが操作キー1aを操作すると、これに応じて各種処理部の機能を働かせる。また、各種処理部で行われる処理の過程又は結果に関する情報は、必要に応じて画像表示部1bに表示される。ユーザは画像表示部1bの表示を確認しながら操作キー1aを操作し、端末制御部10を動作させることができる。
一方、サーバ100はサーバ制御部20を有しており、このサーバ制御部20もまた、サーバ100において上記のCPUを用いて実現することができる。またサーバ100は画像データベース30を保有しており、この画像データベース30は、例えば上記のハードディスクを用いて実現されている。なお画像データベース30には、システムにおいてオリジナル(原画像)となる複数の画像データがその画像特徴量とともに予め登録(記録)されているものとする。
サーバ制御部20には、各種処理部として検索用データ受信部22、画像検索処理部24及び検索結果送信部26が組み込まれている。このうち検索用データ受信部22は、携帯情報端末1から送信される画像特徴量のデータを受信する処理を実行する。また画像検索処理部24は、受信した画像特徴量のデータに基づき、画像データベース30内から対応(マッチ)する画像データを検索する処理を実行する。検索結果送信部26は、検索で得られた結果(商品名、商品番号等)を携帯情報端末1に送信する処理を実行する。
次に、本実施形態の画像処理システムにより実行される画像処理の内容について説明する。また以下の説明により、本発明の画像処理方法を実行するための各工程の内容についても明らかとなる。
本実施形態の画像処理システムは主に、(1)撮像して得た撮像画像の枠外画像を除去し、画像特徴量を抽出する処理、(2)画像特徴量に基づいて画像検索(画像のマッチング)を行う処理の2つを実行することができる。なお、これら(1)と(2)の処理の間には、携帯情報端末1からネットワーク102を通じて画像特徴量データをサーバ100に送信する送信処理が実行される。
先ず、上記(1)の撮像して得た撮像画像の枠外画像を除去し、画像特徴量を抽出する処理とともに、画像特徴量のデータを送信するまでの処理について説明する。ここまでの処理は、携帯情報端末1の各種処理部を用いて実行することができる。
〔携帯情報端末の処理〕
図3は、携帯情報端末1の端末制御部10により実行される端末画像処理の一例を示すフローチャートである。また図4及び図5は、実際の撮像画像が処理される様子を示す連続図である。この処理では、撮像画像の撮像処理からその撮像画像の枠外画像を除去する処理、画像特徴量を抽出する処理、そして画像特徴量の送信処理までの処理が順に行われる。以下、手順例に沿って説明する。
〔撮像処理〕
図3のステップS10:先ず端末制御部10は、撮像処理を実行する。この処理では、端末制御部10は上記の撮像処理部11にて撮像アプリケーションを実行し、図示しないカメラモジュールを用いた撮像による画像の取得を行う。
〔撮像処理の例〕
図6は、携帯情報端末1を用いて行われる撮像の様子を示す斜視図である。上記の撮像処理(図3中:ステップS10)の実行に伴い、端末制御部10は撮像アプリケーションを起動する。これに伴い、携帯情報端末1の図示しないカメラモジュールがアクティブとなる。
本実施形態の画像処理システムは、携帯情報端末1のユーザが例えば紙媒体(印刷物)として頒布された冊子B(カタログ、パンフレット、雑誌等)の商品見本をカメラで撮像し、そのデータを送信することで通信販売による商品の注文を行う、という商取引に適用することができる。
また、本実施形態の画像処理システムは、携帯情報端末1のユーザが例えばデジタルサイネージによって表示された商品見本等の画像をカメラで撮像し、そのデータを送信することで通信販売による商品の注文を行う、という商取引に適用することができる。ここで、デジタルサイネージとは、情報通信技術を用いてターゲットに適したコンテンツを適宜表示する電子機器のことであり、平面ディスプレイ等に映像や情報を表示する広告媒体である。デジタルサイネージは、適切な時間・場所を選んだ広告表示が可能であり、例えば、電子看板、電子ポスター、デジタル掲示板、ウェブページ内広告等が該当する。
ユーザに頒布された冊子Bの紙面には、通信販売の商品見本となるカラーのサンプル画像Imとともにその説明書き(商品番号、商品の詳細、販売価格等)が印刷されている。そしてユーザは、携帯情報端末1に付属するカメラモジュールの撮像領域内に紙面上のサンプル画像Imを位置付けた状態で撮像を行う。このとき撮像領域は、例えば携帯情報端末1の画面上にリアルタイムで表示される。サンプル画像Imが撮像領域内に位置付けられた状態で、ユーザが携帯情報端末1のシャッターボタンを押下すると、携帯情報端末1においてサンプル画像Imを撮像したカラー画像が取得される。このとき取得されたカラー画像は、例えば携帯情報端末1の図示しないメモリ(RAM)に格納される。
〔サンプル画像Imの周辺部分〕
図7は、サンプル画像Imの周辺部分を拡大して示す図である。
サンプル画像Imは、四角形の撮像対象領域であり、図7中の画像例は、白い平皿の上にガラスのうつわが載せられ、そのガラスのうつわの中にイチゴとクリームからなるパフェが盛り付けられている様子の画像である。サンプル画像Imの外縁には、黒色の第1枠41が形成されており、第1枠41の外縁には、余白(何も着色していない部分)による第2枠42が形成されている。なお、第1枠41に関しては、印刷のCMYK値が高いカラーの枠でもよい。
カラーの枠の場合、そのカラー値に関しては、最低でもCMYK値のうち1つの値が「50%以上」であることが好ましく、「C:50%以上」、「Y:100%」、「M:55%以上」、「K:50%以上」の条件を確保することがより好ましい。また、第2枠42については、実際には何も着色していない部分であるが、理解を容易にするためにその外縁を破線で示してある。図7中の英文字「ABC・・XYZ」は、サンプル画像Imの周りの背景画像を示しており、実際には、このような英文字ではなく模様等によって構成される場合もある。
また、上述したデジタルサイネージを利用する場合は、デジタル画像に対応する必要があるため、CMYK値ではなく、RGB値について規定する必要がある。この際、その値に関しては、RGB値が255〜0(8ビット表示)の範囲である場合に、最低でもRGB値のうち1つの値が「128〜0」であることが好ましく、「R値:128〜0」、「G値:128〜0」、「B値:128〜0」の条件を確保することがより好ましい。
ここで、サンプル画像Imの横幅X1を100%とした場合には、第1枠41の幅寸法は、約2%(2.08%)程度の寸法としており、第2枠42の幅寸法は、約5%(4.86%)程度の寸法としている。これらの寸法は、あくまで例示であり、使用環境やシステム仕様によって適宜変更することができる。
このように、サンプル画像Imの周りに黒色又はカラーの第1枠41を配置することで、サンプル画像Imを際立たせることができ、画像認識の精度を高めることができる。また、第1枠41の周りに第2枠42を配置することで、第1枠41を強調することができ、第1枠41と第2枠42との相乗効果で画像認識の精度をより高めることができる。さらに、第1枠41と第2枠42といった二重の枠でサンプル画像Imを囲むことにより、その中のサンプル画像Imが撮像対象領域であるということをユーザに知らしめ、第1枠41と第2枠42とで囲んだ領域を狙って撮像するということをユーザに促すことができる。
そして、携帯情報端末1においてサンプル画像Imを撮像することにより、図4中(A)に示される撮像画像が得られる。
〔抽出処理〕
図3に戻り、ステップS20:次に端末制御部10は、抽出処理を実行する。この処理では、端末制御部10は上記の抽出処理部12にて抽出処理アプリケーションを実行し、撮像して得られた撮像画像から所定の濃度を有する画素を複数抽出する(抽出工程)。ここで、「濃度」とは、色の濃さや薄さ、色の明るさ暗さ等を示す指標であり、抽出したい画素に応じて、所定の濃度を予め設定しておく。この処理で、所定の濃度を有する画素、すなわち、撮像画像の中で色の濃い部分の画素や、撮像画像の中で暗い部分の画素が抽出される。抽出された画素は、以降の処理対象となる。その一方で、所定の濃度を有さない画素、すなわち、撮像画像の中で色の薄い部分の画素や、撮像画像の中で明るい部分の画素が取り除かれる。取り除かれた画素は、以降の処理対象から除かれる。
濃度の抽出処理は、テンプレート・マッチングによって行う。ここでテンプレート・マッチングとは、テンプレート(型紙)とのマッチング(一致具合)を調べる手法であり、輪郭を表す標準パターンをいくつか用意しておき、画像の一部と比較して最も似たものを選択していく方法である。テンプレート・マッチングに用いる一般的な微分フィルタとしては、Prewittフィルタ、Kirishフィルタ、Sobelフィルタ、Robinsonフィルタ等を適用することができる。なお、マスクパターンを用いたテンプレート・マッチングによる各画素の濃度の抽出手法については公知のものを適用できるため、ここではその詳細を省略する。
本実施形態では、エッジ強度や各画素の濃度等を抽出できるPrewittフィルタを用いて抽出処理を行っており、CYMKの各濃度の値が、「C:50%以上」、「Y:100%」、「M:55%以上」、「K:50%以上」の条件のうち少なくとも1つを満たせば、所定の濃度を有する画素と認定する。また、RGB値の場合は、RGBの各濃度の値が、「R値:128〜0」、「G値:128〜0」、「B値:128〜0」の条件のうち少なくとも1つを満たせば、所定の濃度を有する画素と認定する。なお、これらをプログラム上の数値に換算すれば、RBGの1色のエッジ強度が40以上のものであることになる。
そして、これらの抽出処理を実行することにより、所定の濃度を有する画素が抽出され、図4中(B)に示される抽出処理後のデータが得られる。図4中(B)の表示例では、ある程度濃い色が存在している部分が白抜き表示されている。
〔孤立画素除去処理〕
図3に戻り、ステップS30:次に端末制御部10は、孤立画素除去処理を実行する。この処理では、端末制御部10は上記の孤立画素除去処理部13にて孤立画素除去アプリケーションを実行し、ステップS20の抽出処理で抽出した複数の画素のうち、画素同士で連結していない孤立した画素を除去する(孤立画素除去工程)。
図8は、孤立画素除去処理について説明する図である。なお、図8中、1マスは1ピクセルを表しており、各マスの色掛け部分(塗りつぶし部分)は抽出した画素が存在することを表している(以下の図においても同様である)。
孤立画素除去処理については、図8中(A)に示されるように、基本的には、完全に孤立している画素(1ピクセルの画素)を除去するものであるが、図8中(B)に示されるように、ある程度のかたまり(例えば、2ピクセル以下の画素)を孤立している画素とみなして除去するようにしてもよい。孤立画素除去処理を行うことによって、画像処理の対象を画素同士で連結している連結画素に限定することができ、その後の処理の迅速化を図りつつ、画像認識の精度を高めることができる。
そして、この孤立画素除去処理を実行することにより、図4中(B)に示される孤立画素Bが除去され、図5中(C)に示される孤立画素除去処理後のデータが得られる。
〔太線化処理(拡大化処理)〕
図3に戻り、ステップS40:次に端末制御部10は、太線化処理を実行する。この処理では、端末制御部10は上記の太線化処理部14にて太線化処理アプリケーションを実行し、ステップS30の孤立画素除去処理で除去されずに残存した各画素の近傍に新たな画素を付加することにより、各画素を拡大化させる(拡大化工程)。
図9は、太線化処理について説明する図である。
太線化処理については、図9中(A)に示されるように、ある任意の画素があるとすれば、その上下左右の領域に新たな画素を付加することにより太線化を実現することができる。また、図9中(B)に示されるように、ある任意の画素があるとすれば、それを取り囲むすべての領域(8マス)に新たな画素を付加してもよい。太線化処理を行うことによって、認識の対象となる画素がそれぞれ拡大され、仮に不明瞭な線や図形があっても、それが元の明確な状態に復元され、画像認識の確実性を高めることができる。抽出対象となる枠の画像は、繋がっていることが条件となるため、この処理によりそれを強化することができる。
そして、この太線化処理を実行することにより、図5中(D)に示される太線化処理後のデータが得られる。
〔グループ化処理(ラベリング処理)〕
図3に戻り、ステップS50:次に端末制御部10は、グループ化処理を実行する。この処理では、端末制御部10は上記のグループ化処理部15にてグループ化処理アプリケーションを実行し、ステップS40の太線化処理で太線化した画素のうち、画素同士で連結している画素があれば、それらを1つの連結画素としてグループ化する(グループ化工程)。グループ化をすることで、連結画素の取り扱い処理が容易化され、以降の処理負担が軽減される。
図10は、グループ化処理について説明する図である。
グループ化処理については、連結画素の各画素に対して固有の識別番号(識別情報)を順に付していき、画素同士で連結している画素があれば、それらに同一の識別番号を付すことによりグループ化する。図10中では、最初の連結画素の各画素に対して「1」を付し、次の連結画素の各画素に対して「2」を付し、さらにその次の連結画素の各画素に対して「3」を付している。以降の処理では、この識別番号を用いてグループを認識することができる。また、識別番号を用いてグループ化処理を行うことによって、それだけ情報量を少なくすることができ、処理の簡素化を図ることができる。
〔重心算出処理〕
図3に戻り、ステップS60:次に端末制御部10は、重心算出処理を実行する。この処理では、端末制御部10は上記の重心算出処理部16にて重心算出処理アプリケーションを実行することによって行われる。
図11は、重心算出処理について説明する図である。重心については、正方形や長方形の連結画素の場合には、特に問題なく簡単に重心を算出できるため、この図の例では、若干傾いた(回転した)平行四辺形の連結画素の重心を算出する例で説明する。
重心算出処理については、ステップS50のグループ化処理でグループ化した連結画素を所定の2次元座標であるXY平面に配置し、連結画素のX方向の最大値及び最小値と、連結画素のY方向の最大値及び最小値とから連結画素の重心(重心位置)を算出する(重心算出工程)。例えば、図11中(A)に示されるように、2次元座標での連結画素の配置位置の最大値を(Xmax,Ymax)とし、最小値を(Xmin,Ymin)とすれば、連結画素の重心G1(Xg,Yg)は、((Xmax+Xmin)/2,(Ymax+Ymin)/2)として算出することができる。この方法で算出した重心G1は、画像の幾何学的な形状だけで決定されるいわゆる図心であり、これを第1重心G1と定める。
また、重心算出処理では、第2重心も算出する。ここで、第2重心とは、連結画素の各画素の配置状態を含めて算出した重心であり、各画素に質量があるものと擬制して決定した重心である。図11中(B)に示される連結画素は、図中右下の部分に、画素の片寄りがあるため(図中矢印B参照)、第2重心G2は、第1重心G1よりも、図中右下方向にずれる。
このように、第2重心も算出する理由は、第1重心だけでは、図11中(C)に示されるような逆L字状の連結画素が存在していた場合に、第1重心G1が中央付近に配置されてしまうため、第1重心G1だけで後述する判断処理を行うと、図11中(C)に示されるような逆L字状の連結画素が排除できないからであり、このような変則的な連結画素に対しては、第2重心G2,G2−1を用いて後述する判断処理を行う。
〔判断処理〕
図3に戻り、ステップS70:次に端末制御部10は、判断処理を実行する。この処理では、端末制御部10は上記の判断処理部17にて判断処理アプリケーションを実行し、撮像画像中に四角形の枠の画像が存在するか否かを判断する(判断工程)。
図12は、判断処理の内容をさらに詳細に示したフローチャートである。以下、図12のフローチャートに沿って処理の内容を説明する。
〔面積値算出処理〕
ステップS100:端末制御部10は、連結画素の面積値又は連結画素が囲む領域を含めた連結画素の面積値を算出する(面積値算出工程)。ここで、「連結画素の面積値」とは、連結画素に含まれる各画素の面積を単純に足し合わせた面積値であるが、「連結画素が囲む領域を含めた連結画素の面積値」とは、連結画素が例えば環状に連結した画素であってその中央部分に画素がない領域がある場合に、その中央部分の画素がない部分の面積も含めた面積値である。
図13は、連結画素の面積値の算出方法について説明する図である。
図13中(A)に示されるように、連結画素が単純なかたまりであれば、連結画素の面積値は、連結画素に含まれる画素の個数から算出することができる。図13中(A)の例では、7個の画素なので、面積値は7ピクセルであると定める。一方、図13中(B)に示されるように、連結画素が枠状(環状)の形状であれば、環状の連結画素の面積(色掛け部分:16ピクセル)と、環状の連結画素が囲む領域の面積(9ピクセル)とを加えた値(25ピクセル)を連結画素の面積値とする。
図12に戻り、ステップS101:端末制御部10は、算出した面積値が所定の範囲内にあるか否かを確認し、所定の範囲内にあれば(Yes)、ステップS102に進み、所定の範囲内になければ(No)、ステップS113に進む。ここで、面積値の所定の範囲は、自由に設定することができるが、例えば、15000〜62000ピクセルの範囲内と定めることができる。このように、連結画素の面積値等を判断対象とすることで、認識対象となる四角形の枠の画像の面積がある程度固定されているような場合には、その面積値から大きく外れる面積値を有する連結画素(例えば、極端に小さい面積値を有する連結画素や、極端に大きい面積値を有する連結画素)を認識の対象ではないと判断することができる。
〔縦横比算出処理〕
ステップS102:端末制御部10は、連結画素のX方向の最大値及び最小値と、連結画素のY方向の最大値及び最小値とから、連結画素の形状の縦及び横の比率である縦横比を算出する(縦横比算出工程)。
図14は、連結画素の縦横比の算出方法について説明する図である。
連結画素の縦横比を算出するためには、図14中(A)に示されるように、まず、連結画素のX方向の長さX1とY方向の長さY1とを算出する。X方向の長さX1は、「Xmax−Xmin」で算出することができ、Y方向の長さY1は、「Ymax−Ymin」で算出することができる。そして縦横比は、「X1/Y1」又は「Y1/X1」で算出することができる。この場合、小さいほうの値を大きいほうの値で除算すれば、算出される値は1以下となる。
図12に戻り、ステップS103:端末制御部10は、算出した縦横比が所定の範囲内にあるか否かを確認し、所定の範囲内にあれば(Yes)、ステップS104に進み、所定の範囲内になければ(No)、ステップS113に進む。ここで、縦横比の所定の範囲は、自由に設定することができるが、例えば、0.6以上1.0以下の範囲内と定めることができる。このように、連結画素の縦横比を判断対象とすることで、認識対象となる四角形の枠の形状が正方形や長方形である場合に、その正方形や長方形の縦横比から大きく外れる縦横比を有する連結画素(例えば、図14中(B)に示されるような極端に長細い長方形形状の連結画素)を認識の対象ではないと判断することができる。
〔中心算出処理〕
図12に戻り、ステップS104:端末制御部10は、撮像画像の中心(中心位置)を算出する(中心算出工程)。撮像画像の中心は、撮像した画像の4隅から対角線を引き、対角線が交わる地点を撮像画像の中心とする。
ステップS105:端末制御部10は、ステップS104で算出した撮像画像の中心と図3のステップS60で算出した連結画素の第1重心G1との距離を算出する(距離算出工程)。
ステップS106:端末制御部10は、ステップS105で算出した距離が所定の範囲内にあるか否かを確認し、所定の範囲内にあれば(Yes)、ステップS107に進み、所定の範囲内になければ(No)、ステップS113に進む。ここで、距離の所定の範囲は、自由に設定することができるが、例えば、0以上100ピクセル以下の範囲内と定めることができる。このように、撮像画像の中心と連結画素の第1重心G1との距離を判断対象とすることで、通常は認識させたい画像が撮像画像の中心に配置されることが多いものであるから、そのような通常の場面を利用して、撮像画像の中心と連結画素の重心とが極端に離れている場合に、その連結画素を認識の対象ではないと判断することができる。
ステップS107:端末制御部10は、ステップS104で算出した撮像画像の中心と図3のステップS60で算出した連結画素の第2重心G2との距離を算出する(距離算出工程)。
ステップS108:端末制御部10は、ステップS107で算出した距離が所定の範囲内にあるか否かを確認し、所定の範囲内にあれば(Yes)、ステップS109に進み、所定の範囲内になければ(No)、ステップS113に進む。ここで、距離の所定の範囲は、自由に設定することができるが、例えば、0以上60ピクセル以下の範囲内と定めることができる。このように、連結画素の各画素の配置状態を含めて算出した重心G2を利用することで、画像の幾何学的な形状だけで決定される図心ではなく、連結画素の各画素に質量があるものと擬制して決定した重心を用いて判断を行うことができ、いびつな形状を有するのにもかかわらず、幾何学的な重心G1が中央部分に配置されてしまう連結画素を排除することができる(図11中(C)参照)。
〔最大離間画素算出処理〕
図12に戻り、ステップS109:端末制御部10は、最大離間画素算出処理を実行する。この処理では、端末制御部10は上記の判断処理部17にて最大離間画素算出アプリケーションを実行し、連結画素に含まれる各画素のうち、図3のステップS60で算出した第1重心G1から最も距離の離れた最大離間画素を算出する(最大離間画素算出工程)。具体的には、連結画素に含まれる各画素から第1重心G1までの距離を算出し、最も距離が離れている画素を最大離間画素と定める。なお、距離の算出は、第1重心G1ではなく、第2重心G2を基準としてもよい。
〔円生成処理〕
ステップS110:端末制御部10は、円生成処理を実行する。この処理では、端末制御部10は上記の判断処理部17にて円生成アプリケーションを実行し、連結画素の第1重心G1を中心とし、第1重心G1と最大離間画素との距離を半径Rとした円を生成する(円生成工程)。この処理によって、連結画素がその内部に含まれる円が描かれる。
ステップS111:端末制御部10は、ステップS110で生成した円の中に、最大離間画素以外に四角形の角となるべき3つの画素が存在するか否かを判断し、四角形の角となるべき3つの画素が存在すると判断すれば(Yes)、ステップS112に進み、存在しないと判断すれば(No)、ステップS113に進む。
図15は、最大離間画素算出処理,円生成処理及び判断処理について説明する図である。
端末制御部10は、図15中(A)に示されるように、第1重心G1から最も離れた最大離間画素Aを算出し、図15中(B)に示されるように、第1重心G1と最大離間画素Aとの距離を半径Rとした円50を生成し、生成した円50の中に、最大離間画素A以外に四角形の角となるべき3つの画素(B,C,D)が存在するか否かを確認する。四角形の角となるべき3つの画素の判定は、連結画素の中にコーナーとなるべき部分が存在しているかや、連結画素の中にある程度の角度を持って屈折している箇所があるか、認定しようとしている画素よりも外周側に連結画素中の画素がないか等によって行う。なお、円50の中ではなく、円50の円周上に四角形の角となるべき3つの画素が存在していれば、それらを角と判定してもよい。
図12に戻り、ステップS112:端末制御部10は、ステップS101〜ステップS108の判定をすべてクリアし、かつ、ステップS111で四角形の角となるべき3つの画素が存在すると判断した場合には、最大離間画素及び3つの画素を四隅とする四角形の枠の画像が存在すると判断する(判断工程)。
ステップS113:端末制御部10は、ステップS101〜ステップS108の判定を1つでもクリアせず、また、ステップS111で四角形の角となるべき3つの画素が存在しないと判断した場合には、四角形の枠の画像が存在しないと判断する(判断工程)。以上の手順を終えると、端末制御部10は端末画像処理(図3)に復帰し、次に不要画素除去処理(ステップS80)を実行する。
〔不要画素除去処理〕
図3に戻り、ステップS80:端末制御部10は、不要画素除去処理を実行する。この処理では、端末制御部10は上記の不要画素除去処理部18にて不要画素除去処理アプリケーションを実行し、ステップS70の判断処理で撮像画像中に四角形の枠の画像が存在すると判断した場合に、その四角形の枠の外側の画素(枠外画像)を除去する(不要画素除去工程)。
そして、上記ステップS50〜ステップS70のグループ化処理・重心算出処理・判断処理を実行し、上記ステップS80の不要画素除去処理を実行することにより、図5中(E)に示されるように、枠外の画像を除去した撮像画像データが得られる。
〔特徴量抽出処理〕
図3に戻り、ステップS85:端末制御部10は、特徴量抽出処理を実行する。この処理では、端末制御部10は上記の特徴量抽出処理部19にて特徴量抽出処理アプリケーションを実行し、先の不要画素除去処理(ステップS80)において枠外の画素を除去した撮像画像から画像特徴量が抽出される。なお、先の判断処理(ステップS70)において、撮像画像中に四角形の枠の画像が存在しないと判断され、不要画素除去処理(ステップS80)において、枠外の画像が除去されない場合も想定されるが、この場合は、枠外の画像を除去していない撮像画像から画像特徴量を抽出する。
〔データ送信処理〕
ステップS90:端末制御部10は、データ送信処理を実行する。この処理では、端末制御部10は上記のデータ送信処理部191にてデータ送信アプリケーションを実行し、先の特徴量抽出処理(ステップS85)において抽出した画像特徴量のデータを送信する。これにより、画像特徴量のデータがネットワーク102を経由してサーバ100に送信されることになる。
〔サーバ側での処理〕
次に、サーバ100において実行される処理について説明する。すなわちサーバ制御部20は、携帯情報端末1から送信された画像特徴量のデータに基づき、画像データベース30から該当する画像データを検索する処理を実行する。
〔画像検索処理〕
図16は、画像検索処理の手順例を示すフローチャートである。以下、画像検索処理の内容について、その手順に沿って説明する。
ステップS200:サーバ制御部20は、上記の検索用データ受信部22にて受信プログラムを実行し、携帯情報端末1から送信された画像特徴量のデータを受信する。
ステップS202:サーバ制御部20は、上記の画像検索処理部24にて検索プログラムを実行し、画像データベース30にアクセスして今回の比較対象となる画像特徴量のデータを取得する。なお画像データベース30には、予め全ての比較対象となるオリジナル画像について、それぞれの検索用画像特徴量のデータが合わせて登録されている。このとき登録されているオリジナルの検索用画像特徴量のデータは、上述した携帯情報端末1による画像特徴量の抽出手法と同じ手法によって求められたものである。
ステップS204:サーバ制御部20は、今回の比較対象となる画像特徴量のデータと、検索用画像特徴量のデータとを比較する。
ステップS206:サーバ制御部20は、全てのオリジナル画像について比較を完了したか否かを確認する。未だ全てについて完了していなければ(No)、サーバ制御部20はステップS202に戻って次の検索用画像特徴量のデータを取得し、先のステップS202,S204の処理を繰り返す。この後、画像データベース30内の全てのオリジナル画像について比較を完了すると(Yes)、サーバ制御部20は次のステップS208に進む。
ステップS208:サーバ制御部20は、携帯情報端末1から送信された画像特徴量のデータに最も近似した検索用画像特徴量のデータを検索ヒット画像として特定する。
ステップS210:そしてサーバ制御部20は、検索ヒット画像として特定した撮像画像を検索結果として出力する。このときサーバ制御部20は、検索結果送信部26にて送信プログラムを実行し、ネットワーク102を通じて携帯情報端末1にオリジナルの画像データを送信する。またサーバ制御部20は、冊子Bに記載された商品見本の購入ページに対応するURLを送信する。
この後、例えば携帯情報端末1の画像表示部1bに表示されたオリジナルの画像をユーザが確認し、自己が購入する予定の商品に間違いないことを確認すると、送信されたURLにアクセスして商品購入の手続を実行することができる。
以上のように、本実施形態によれば、携帯情報端末1のカメラモジュールを用いてユーザが様々な条件下で撮像した撮像画像を利用する画像処理システムにおいて、予め撮像画像から背景等の不要な情報をユーザの補助なしに自動的に削除し、必要な情報のみを残すことにより、サーバ100での後工程の処理精度を高めることができる。したがって、携帯情報端末1側では、画像を送信する際のパケット量を抑えつつ、サーバ100側では、必要な情報のみを残した撮像画像により高精度に検索処理を行うことができる。
また、連結画素の重心G1を算出し、その重心G1と最大離間画素Aとの距離を半径Rとした円50を生成し、その円50の中に四角形の角となるべき3つの画素(B,C,D)が存在しているか否かを判断することにより、四角形の枠の画像が存在しているか否かを判断することができる。したがって、撮像画像の中に含まれる四角形の枠の画像が正確な正方形や長方形でなく、機種ごとの違いや個体差、撮像環境(周囲の明るさや照明)の違いによってある程度歪んだ形状等となっている場合であっても、連結画素が四角形の形状であれば、生成円50の中には残りの3点(B,C,D)が必ず含まれるため、四角形の枠の画像の精度よく認識することができる。
さらに、四角形の角となるべき残りの3点が円の生成円50に入っているか否かによって四角形の枠の画像を判断するので、ある程度おおまかなくくりで生成円50を生成し、その生成円50を利用して残りの3点を探すことができるので、処理の簡略化が図れるとともに、画像認識の正確性を高めることができ、四角形の枠が回転していたり、ゆがんだりしていても高精度で認識することができる。
本発明は上述した一実施形態に制約されることなく、種々に変形して実施することができる。例えば、一実施形態では携帯情報端末1とサーバ100を用いてシステムを構築しているが、1台のコンピュータを用いて画像処理システムを構築してもよい。また、ネットワーク102はインターネットのような公衆通信網に限らず、ローカルエリアネットワーク(LAN)であってもよい。
また、一実施形態では携帯情報端末1を例に挙げているが、カメラを用いた撮像や枠外の画像を除去する処理は、例えばパーソナルコンピュータにUSBカメラを接続した状態で実行することもできるし、逆にデジタルカメラのような撮像デバイスのリソースを用いて実行することもできる。
さらに、上記アルゴリズムは、携帯情報端末1以外の画像認識処理に適用可能である。
1 携帯情報端末
10 端末制御部
11 撮像処理部
12 抽出処理部
13 孤立画素除去処理部
14 太線化処理部
15 グループ化処理部
16 重心算出処理部
17 判断処理部
18 不要画素除去処理部
19 特徴量抽出処理部
191 データ送信処理部
20 サーバ制御部
22 検索用データ受信部
24 画像検索処理部
26 検索結果送信部
30 画像データベース
100 サーバ
102 ネットワーク

Claims (20)

  1. 撮像画像から所定の濃度を有する画素を複数抽出する抽出手段と、
    前記抽出手段が抽出した複数の画素のうち、画素同士で連結している画素があれば、それらを1つの連結画素としてグループ化するグループ化手段と、
    前記グループ化手段がグループ化した連結画素を所定の2次元座標であるXY平面に配置し、前記連結画素のX方向の最大値及び最小値と、前記連結画素のY方向の最大値及び最小値とから前記連結画素の重心を算出する重心算出手段と、
    前記連結画素に含まれる各画素のうち、前記重心から最も距離の離れた最大離間画素を算出する最大離間画素算出手段と、
    前記連結画素の前記重心を中心とし、前記重心と前記最大離間画素との距離を半径とした円を生成する円生成手段と、
    前記円生成手段が生成した円の中に、前記最大離間画素以外に四角形の角となるべき3つの画素が存在していれば、前記最大離間画素及び前記3つの画素を四隅とする四角形の画像が存在すると判断する判断手段と
    を備えたことを特徴とする画像処理システム。
  2. 請求項1に記載の画像処理システムにおいて、
    前記判断手段が四角形の画像が存在すると判断した場合に、その四角形の画像の外側の画素を除去する不要画素除去手段をさらに備えたことを特徴とする画像処理システム。
  3. 請求項1又は2に記載の画像処理システムにおいて、
    前記抽出手段が抽出した複数の画素のうち、画素同士で連結していない孤立した画素を除去する孤立画素除去手段をさらに備えたことを特徴とする画像処理システム。
  4. 請求項1から3のいずれかに記載の画像処理システムにおいて、
    前記グループ化手段は、
    前記抽出手段が抽出した各画素に対して、固有の識別情報を順に付していき、画素同士で連結している画素があれば、それらに同一の識別情報を付すことによりグループ化することを特徴とする画像処理システム。
  5. 請求項1から4のいずれかに記載の画像処理システムにおいて、
    前記抽出手段が抽出した各画素の近傍に新たな画素を付加することにより、前記各画素を拡大化させる拡大化手段をさらに備えたことを特徴とする画像処理システム。
  6. 請求項1から5のいずれかに記載の画像処理システムにおいて、
    前記連結画素の面積値又は前記連結画素が囲む領域を含めた前記連結画素の面積値を算出する面積値算出手段をさらに備え、
    前記判断手段は、
    前記面積値算出手段が算出した面積値が所定の範囲内にあれば、前記四角形の画像が存在すると判断することを特徴とする画像処理システム。
  7. 請求項1から6のいずれかに記載の画像処理システムにおいて、
    前記連結画素のX方向の最大値及び最小値と、前記連結画素のY方向の最大値及び最小値とから、前記連結画素の形状の縦及び横の比率である縦横比を算出する縦横比算出手段をさらに備え、
    前記判断手段は、
    前記縦横比算出手段が算出した縦横比が所定の範囲内にあれば、前記四角形の画像が存在すると判断することを特徴とする画像処理システム。
  8. 請求項1から7のいずれかに記載の画像処理システムにおいて、
    前記撮像画像の中心を算出する中心算出手段と
    前記中心算出手段が算出した撮像画像の中心と前記重心算出手段が算出した連結画素の重心との距離を算出する距離算出手段とをさらに備え、
    前記判断手段は、
    前記距離算出手段が算出した距離が所定の範囲内にあれば、前記四角形の画像が存在すると判断することを特徴とする画像処理システム。
  9. 請求項8に記載の画像処理システムにおいて、
    前記重心算出手段は、
    前記連結画素の各画素の配置状態を含めて前記重心を算出し、
    前記距離算出手段は、
    前記中心算出手段が算出した撮像画像の中心と前記重心算出手段が各画素の配置状態を含めて算出した連結画素の重心との距離を算出し、
    前記判断手段は、
    前記距離算出手段が算出した距離が所定の範囲内にあれば、前記四角形の画像が存在すると判断することを特徴とする画像処理システム。
  10. 請求項1から9のいずれかに記載の画像処理システムにおいて、
    前記撮像画像は、
    四角形の撮像対象領域と、
    前記撮像対象領域の外縁に形成された黒色又はカラーの第1枠と、
    前記第1枠の外縁に形成された余白による第2枠とを備えた印刷物又は画像を撮像した画像であることを特徴とする画像処理システム。
  11. 撮像画像から所定の濃度を有する画素を複数抽出する抽出工程と、
    前記抽出工程で抽出した複数の画素のうち、画素同士で連結している画素があれば、それらを1つの連結画素としてグループ化するグループ化工程と、
    前記グループ化工程でグループ化した連結画素を所定の2次元座標であるXY平面に配置し、前記連結画素のX方向の最大値及び最小値と、前記連結画素のY方向の最大値及び最小値とから前記連結画素の重心を算出する重心算出工程と、
    前記連結画素に含まれる各画素のうち、前記重心から最も距離の離れた最大離間画素を算出する最大離間画素算出工程と、
    前記連結画素の前記重心を中心とし、前記重心と前記最大離間画素との距離を半径とした円を生成する円生成工程と、
    前記円生成工程で生成した円の中に、前記最大離間画素以外に四角形の角となるべき3つの画素が存在していれば、前記最大離間画素及び前記3つの画素を四隅とする四角形の画像が存在すると判断する判断工程と
    を備えたことを特徴とする画像処理方法。
  12. 請求項11に記載の画像処理方法において、
    前記判断工程で四角形の画像が存在すると判断した場合に、その四角形の画像の外側の画素を除去する不要画素除去工程をさらに備えたことを特徴とする画像処理方法。
  13. 請求項11又は12に記載の画像処理方法において、
    前記抽出工程で抽出した複数の画素のうち、画素同士で連結していない孤立した画素を除去する孤立画素除去工程をさらに備えたことを特徴とする画像処理方法。
  14. 請求項11から13のいずれかに記載の画像処理方法において、
    前記グループ化工程は、
    前記抽出工程で抽出した各画素に対して、固有の識別情報を順に付していき、画素同士で連結している画素があれば、それらに同一の識別情報を付すことによりグループ化する工程であることを特徴とする画像処理方法。
  15. 請求項11から14のいずれかに記載の画像処理方法において、
    前記抽出工程で抽出した各画素の近傍に新たな画素を付加することにより、前記各画素を拡大化させる拡大化工程をさらに備えたことを特徴とする画像処理方法。
  16. 請求項11から15のいずれかに記載の画像処理方法において、
    前記連結画素の面積値又は前記連結画素が囲む領域を含めた前記連結画素の面積値を算出する面積値算出工程をさらに備え、
    前記判断工程は、
    前記面積値算出工程で算出した面積値が所定の範囲内にあれば、前記四角形の画像が存在すると判断する工程であることを特徴とする画像処理方法。
  17. 請求項11から16のいずれかに記載の画像処理方法において、
    前記連結画素のX方向の最大値及び最小値と、前記連結画素のY方向の最大値及び最小値とから、前記連結画素の形状の縦及び横の比率である縦横比を算出する縦横比算出工程をさらに備え、
    前記判断工程は、
    前記縦横比算出工程で算出した縦横比が所定の範囲内にあれば、前記四角形の画像が存在すると判断する工程であることを特徴とする画像処理方法。
  18. 請求項11から17のいずれかに記載の画像処理方法において、
    前記撮像画像の中心を算出する中心算出工程と
    前記中心算出工程で算出した撮像画像の中心と前記重心算出工程で算出した連結画素の重心との距離を算出する距離算出工程とをさらに備え、
    前記判断工程は、
    前記距離算出工程で算出した距離が所定の範囲内にあれば、前記四角形の画像が存在すると判断する工程であることを特徴とする画像処理方法。
  19. 請求項18に記載の画像処理方法において、
    前記重心算出工程は、
    前記連結画素の各画素の配置状態を含めて前記重心を算出する工程であり、
    前記距離算出工程は、
    前記中心算出工程で算出した撮像画像の中心と前記重心算出工程で各画素の配置状態を含めて算出した連結画素の重心との距離を算出する工程であり、
    前記判断工程は、
    前記距離算出工程で算出した距離が所定の範囲内にあれば、前記四角形の画像が存在すると判断する工程であることを特徴とする画像処理方法。
  20. 請求項11から19のいずれかに記載の画像処理方法において、
    前記撮像画像は、
    四角形の撮像対象領域と、
    前記撮像対象領域の外縁に形成された黒色又はカラーの第1枠と、
    前記第1枠の外縁に形成された余白による第2枠とを備えた印刷物又は画像を撮像した画像であることを特徴とする画像処理方法。
JP2010114963A 2010-05-19 2010-05-19 画像処理システム及び画像処理方法 Pending JP2011243018A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010114963A JP2011243018A (ja) 2010-05-19 2010-05-19 画像処理システム及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010114963A JP2011243018A (ja) 2010-05-19 2010-05-19 画像処理システム及び画像処理方法

Publications (1)

Publication Number Publication Date
JP2011243018A true JP2011243018A (ja) 2011-12-01

Family

ID=45409596

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010114963A Pending JP2011243018A (ja) 2010-05-19 2010-05-19 画像処理システム及び画像処理方法

Country Status (1)

Country Link
JP (1) JP2011243018A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200065684A (ko) * 2018-11-30 2020-06-09 카페24 주식회사 온라인 전자상거래의 쇼핑몰의 디자인 자동 생성 방법 및 장치
CN111860319A (zh) * 2020-07-20 2020-10-30 北京百度网讯科技有限公司 车道线的确定方法、定位精度的评测方法、装置、设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200065684A (ko) * 2018-11-30 2020-06-09 카페24 주식회사 온라인 전자상거래의 쇼핑몰의 디자인 자동 생성 방법 및 장치
KR102198545B1 (ko) * 2018-11-30 2021-01-06 카페24 주식회사 온라인 전자상거래의 쇼핑몰의 디자인 자동 생성 방법 및 장치
CN111860319A (zh) * 2020-07-20 2020-10-30 北京百度网讯科技有限公司 车道线的确定方法、定位精度的评测方法、装置、设备
JP2021119507A (ja) * 2020-07-20 2021-08-12 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 車線の決定方法、車線測位精度の評価方法、車線の決定装置、車線測位精度の評価装置、電子デバイス、コンピュータ可読記憶媒体、及びプログラム
JP7223805B2 (ja) 2020-07-20 2023-02-16 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 車線の決定方法、車線測位精度の評価方法、車線の決定装置、車線測位精度の評価装置、電子デバイス、コンピュータ可読記憶媒体、及びプログラム
CN111860319B (zh) * 2020-07-20 2024-03-26 阿波罗智能技术(北京)有限公司 车道线的确定方法、定位精度的评测方法、装置、设备

Similar Documents

Publication Publication Date Title
US10755063B2 (en) Method and apparatus for detecting two-dimensional barcode
CN109948590B (zh) 姿态问题检测方法及装置
US10122888B2 (en) Information processing system, terminal device and method of controlling display of secure data using augmented reality
US10650264B2 (en) Image recognition apparatus, processing method thereof, and program
US20170293992A1 (en) Image code for processing information and device and method for generating and parsing same
CN102779264B (zh) 一种实现条码识读的方法及装置
CN108830186B (zh) 文本图像的内容提取方法、装置、设备及存储介质
CN109784323A (zh) 图像识别的方法、装置、电子设备和计算机存储介质
CN108304839B (zh) 一种图像数据处理方法以及装置
WO2019100407A1 (zh) 基于图样中标志图形点坐标的转换关系定位终端屏幕
JP2018018173A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
CN106203226B (zh) 一种球体表面的二维码的生成和采集方法
CN114937270A (zh) 古籍文字处理方法、装置及计算机可读存储介质
CN114120307A (zh) 显示内容的识别方法、装置、设备和存储介质
US20140019378A1 (en) Evaluation system, method, and computer-readable recording medium
JP2011243018A (ja) 画像処理システム及び画像処理方法
CN112948045A (zh) 图片显示方法、装置、设备及计算机可读存储介质
TWI610282B (zh) 拼接螢幕顯示方法及系統
CN115457055A (zh) 照度计数值识别方法、电子设备及存储介质
JP5278093B2 (ja) 記事関連情報提供方法、装置、プログラム、記録媒体
JP5314521B2 (ja) 画像処理システム及び画像処理方法
JP2010061409A (ja) 画像処理プログラム及び画像処理システム
CN111179332B (zh) 图像处理方法及装置、电子设备及存储介质
KR101625751B1 (ko) 바운더리 코드를 포함하는 ar 마커 장치, 이를 이용한 ar 제공 시스템 및 방법
CN116109643B (zh) 市场布局数据采集方法、设备及计算机可读存储介质

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20111226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120226