JP2018005506A - 画像認識手法評価装置、画像認識手法評価方法、及びプログラム - Google Patents

画像認識手法評価装置、画像認識手法評価方法、及びプログラム Download PDF

Info

Publication number
JP2018005506A
JP2018005506A JP2016130553A JP2016130553A JP2018005506A JP 2018005506 A JP2018005506 A JP 2018005506A JP 2016130553 A JP2016130553 A JP 2016130553A JP 2016130553 A JP2016130553 A JP 2016130553A JP 2018005506 A JP2018005506 A JP 2018005506A
Authority
JP
Japan
Prior art keywords
image
processing
result
target
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016130553A
Other languages
English (en)
Inventor
幸造 伴野
Kozo Tomono
幸造 伴野
池田 信之
Nobuyuki Ikeda
信之 池田
文明 大畑
Fumiaki Ohata
文明 大畑
孝浩 西沢
Takahiro Nishizawa
孝浩 西沢
敏治 和田
Toshiharu Wada
敏治 和田
裕伸 青木
Hironobu Aoki
裕伸 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2016130553A priority Critical patent/JP2018005506A/ja
Publication of JP2018005506A publication Critical patent/JP2018005506A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】画像認識手法の評価に要する時間を短縮することができる。
【解決手段】実施形態の画像認識手法評価装置の第1処理部は、対象画像に含まれる検出対象を検出するための第1処理を実施する。対象画像のうち第1画像の後に処理する第2画像において、第1処理部は、対象画像を複数に分割した部分画像を単位にして第1処理を行うとともに、第1画像に対する第1処理の結果を援用可能である第2画像の部分画像について第1画像に対する第1処理の結果を援用し、第1画像に対する第1処理の結果を援用困難である第2画像の部分画像について第1処理を実行する。第2処理部は、得られた第1処理結果画像が結合された画像に対して第2処理を実施する。評価部は、対象画像に含まれる検出対象を検出した結果を評価する。
【選択図】図3

Description

本発明の実施形態は、画像認識手法評価装置、画像認識手法評価方法、及びプログラムに関する。
対象画像から、検出対象として定めた特定の被写体をそれぞれ検出する画像認識装置が知られている。このような画像認識装置における画像認識手法では、基本的な処理を単位処理とし、異なる処理を実施する単位処理を複数組み合わせて全体の処理を構成することがある。各単位処理において、その処理を特徴づけるパラメータ(変数)を調整することで、単位処理ごとに所望の特性を得ることができる。
各単位処理の組み合わせと、その組み合わせにおける単位処理のパラメータをどのように決定すると良いかは、画像認識装置を適用する適用対象の画像により異なるものとなる。
このように画像認識装置の特性を適用対象の画像に対して適したものになるように調整するためには、適用対象の画像ごとに、各単位処理の組み合わせを代え、その組み合わせにおける単位処理のパラメータを調整するという評価を、繰り返し実施することが必要とされる。また、検出対象の画像を条件が異なる類似の画像に代えて同様の評価を繰り返すことも必要とされる。このように、画像認識手法を決定するうえで、適する単位処理の組み合わせとそのパラメータを決定するのに時間がかかることがある。
特開2009−71734号公報
本発明が解決する課題は、画像認識手法の評価に要する時間を短縮することができる画像認識手法評価装置、画像認識手法評価方法、及びプログラムを提供することである。
実施形態の画像認識手法評価装置は、第1処理部と、第2処理部と、評価部とを持つ。第1処理部は、複数の対象画像のうちから選択された対象画像に対し、前記対象画像に含まれる検出対象を検出するための第1処理を実施する。第2処理部は、画像に含まれる検出対象を検出するための第2処理を実施する。抽出部は、前記対象画像に含まれる検出対象を、前記第1処理部及び前記第2処理部の処理を経て検出した結果を評価する。前記複数の対象画像のうち第1画像の後に処理する第2画像において、前記第1処理部は、前記対象画像を複数に分割した部分画像を単位にして前記第1処理を行うとともに、前記第1画像に対する第1処理の結果を援用可能である前記第2画像の一部又は全部の前記部分画像について前記第1画像に対する第1処理の結果を援用し、前記第1画像に対する第1処理の結果を援用困難である前記第2画像の一部又は全部の前記部分画像について前記第1処理を実行し、前記第2処理部は、前記援用の採否の判定の結果に基づいた前記第1処理結果画像が結合された画像に対して前記第2処理を実施する。
実施形態の画像認識手法評価装置100の使用環境の一例を示す図。 画像認識手法評価装置100のハードウェア構成の一例を示す図。 実施形態における画像認識手法評価装置100の機能構成の一例を示す図。 画像認識処理の対象画像と、画像認識処理の手法(アルゴリズム)の一例を示す図。 画像認識手法評価処理の概要を示すフローチャート。 上記の画像認識手法評価処理で利用するテーブルを示す図。 上記の画像認識手法評価処理で利用するテーブルを示す図。 画像認識手法に対する性能評価処理(S3)の概要を示すフローチャート。 画像認識手法に対する性能評価処理において利用される各テーブルの一例を示す図。 画像認識手法に対する性能評価処理において利用される各テーブルの一例を示す図。 画像認識手法に対する性能評価処理において利用される各テーブルの一例を示す図。 画像分割処理(Sa5)のフローチャート。 中間データ格納部の構成を示す図。 再利用を考慮した処理(Sa6)のフローチャート。 画像結合処理(Sa7)のフローチャート。 再利用を考慮しない処理(Sa8)のフローチャート。 対象画像の一部を再利用する処理について説明するための図。 対象画像を分割する処理を示す図。 複数の単位処理を組み合わせて処理する手法を説明するための図。 画像P1に対する再利用処理について説明するための図。 画像P1に対する再利用処理について説明するための図。 画像P1に対する再利用処理について説明するための図。 画像P1に対する再利用処理について説明するための図。 画像P1に対する再利用処理について説明するための図。 画像P2に対する再利用処理について説明するための図。 グレースケール処理に続き実施する単位処理について説明するための図。 再利用処理を終えた段階の中間データ格納部126に格納されたデータを示す図。 テンプレートマッチ処理について説明するための図。 テンプレートマッチ処理の結果を抽出する処理を説明するための図。 スコア算出に関する処理を説明するための図。 第2の実施形態における画像認識手法に対する性能評価処理の概要を示すフローチャート。 第2の実施形態における再利用処理について説明するための図。
以下、実施形態の画像認識手法評価装置、画像認識手法評価方法、及びプログラムを、図面を参照して説明する。以下、前述の構成と同じ構成には同じ符号を附す。
(第1の実施形態)
[ハードウェア構成など]
図1は、実施形態の画像認識手法評価装置100の使用環境の一例を示す図である。画像認識手法評価装置100は、画像認識装置200が画像認識処理に使用するパラメータ(以下、単にパラメータという。)を好適に設定する装置である。画像認識装置200は、例えば、カメラCMによって対象物OBを撮像した画像IMの中から、対象物OBの像(検出対象)が存在する領域を特定する処理(画像認識処理)を実行する。画像IMは、通信によって、或いは可搬型記憶媒体を介して、画像認識手法評価装置100および画像認識装置200に提供される。また、画像認識装置200がカメラCMを内蔵してもよい。画像認識装置200は、カメラ(監視カメラ)を利用する監視システム、POS(Point Of Sale)システム、カメラを内蔵してユーザ認識を行う携帯電話や車載装置、金融機関端末、或いは、郵便局または物流施設で使用される宛先認識装置、その他の種々の用途に使用することができる。画像認識処理の対象は、カメラCMによる撮像画像に限らず、コンピュータによって生成されたグラフィック画像であってもよい。
画像認識手法評価装置100と画像認識装置200は、例えば、LAN(Local Area Network)やWAN(Wide Area Network)、インターネットなどのネットワーク等を介して通信してもよく、互いに通信することなく独立して構成してもよい。また、画像認識手法評価装置100と画像認識装置200は、一つのコンピュータにより実現される仮想的な複数の装置であってもよい。後者の場合、画像認識手法評価装置100および画像認識装置200が、一体形成された半導体装置に含まれていてもよく、或いは、画像認識手法評価装置100、画像認識装置200、およびカメラが一つの筐体に内蔵された装置として構成されてもよい。
画像認識装置200は、例えば、画像IMの中で、検出対象がどの領域に存在するかを特定する。領域は、画像IMの画素を座標と見立てた場合において、検出対象が存在すると判定された領域に外側から接する矩形領域の左上と右下の座標で表される。画像認識装置200による画像認識処理は、画像認識アルゴリズムによって実現される。
画像認識アルゴリズムは、例えば、画像認識アルゴリズムを構成するひとまとまりの処理である単位処理、および、各単位処理の動作を決定する変数であるパラメータの組み合わせで構成される。単位処理には、例えば、グレースケール処理、明るさ補正処理、2値化処理、テンプレートマッチ処理などが含まれる。パラメータは、例えば、2値化処理の閾値、テンプレートマッチ処理の類似度の閾値などである。
図2は、画像認識手法評価装置100のハードウェア構成の一例を示す図である。画像認識手法評価装置100は、例えば、CPU(Central Processing Unit)100Aと、RAM(Random Access Memory)100Bと、不揮発性記憶装置100Cと、可搬型記憶媒体ドライブ装置100Dと、入出力装置100Eと、通信インターフェース100Fとを備える。画像認識手法評価装置100は、CPU100Aに代えて、任意の形態のプロセッサを備えてもよいし、図2に示した各構成要素のうち一部を省略してもよい。
CPU100Aは、不揮発性記憶装置100Cに格納され、または可搬型記憶媒体ドライブ装置100Dに装着された可搬型記憶媒体に格納されたプログラムをRAM100Bに展開して実行することで、以下に説明する種々の処理を行う。なお、画像認識手法評価装置100は、CPUに代えて、他の種類のプロセッサを備えてもよい。RAM100Bは、CPU100Aによってワーキングエリアとして使用される。不揮発性記憶装置100Cは、例えば、HDD(Hard Disk Drive)やフラッシュメモリ、ROM(Read Only Memory)などである。可搬型記憶媒体ドライブ装置100Dには、DVD(Digital Versatile Disc)やCD(Compact Disc)、SDカードなどの可搬型記憶媒体が装着される。入出力装置100Eは、例えば、キーボードやマウス、タッチパネル、表示装置などを含む。通信インターフェース100Fは、画像認識手法評価装置100が他装置と通信を行う場合のインターフェースとして機能する。例えば、カメラCMがネットワークを介して接続される場合には、通信インターフェース100Fは、カメラCMの画像を取得してもよい。なお、カメラCMがネットワークを介さずに接続される場合には、入出力装置100EがカメラCMの信号を取得するように構成してもよい。或いは、可搬型記憶媒体ドライブ装置100DがDVD等の可搬型記録媒体に書き込まれた画像データを取得してもよい。可搬型記録媒体に書き込まれた画像データには、カメラCMにより撮像された画像、コンピュータにより生成された画像、上記の画像の組み合わせによる画像等を含む。
[機能構成]
図3は、実施形態における画像認識手法評価装置100の機能構成の一例を示す図である。画像認識手法評価装置100は、再利用処理部111(第1処理部)と、通常処理部112(第2処理部)と、スコア算出部113(評価部)と、データ取得部114と、評価制御部115と、格納部120(部分画像格納部を含む)と、を備える。これらの機能部は、例えば、CPU100Aが管理プログラム格納部110などに格納されたプログラムを実行することにより実現される。また、これらの機能部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアが協働することで実現されてもよい。
再利用処理部111は、複数の対象画像のうちから選択された対象画像に対し、対象画像に含まれる検出対象を検出するための処理(第1処理)を実施して、第1処理結果画像を得る。
例えば、再利用処理部111は、対象画像を複数に分割した部分画像を単位にして、対象画像である少なくとも第1画像と第2画像とに対する第1処理を行う。例えば、再利用処理部111が処理対象とする対象画像は、少なくとも第1画像と第1画像の後に処理する第2画像を含む。この場合、再利用処理部111は、第1画像に対する第1処理の結果を援用可能である第2画像の一部又は全部の部分画像について、前記第1画像に対する第1処理の結果である第1処理結果画像を援用する。また、再利用処理部111は、第1処理結果画像を援用困難である第2画像の一部又は全部の部分画像について、第1処理を実行する。以下の説明において、部分画像のことを分割画像ということがある。
上記のとおり再利用処理部111は、画像認識処理のアルゴリズムを評価する処理の過程で、複数の対象画像に対する処理を実施する際に、特定の対象画像の少なくとも一部について、上記処理を実施した場合に得られる画像と同様の第1処理結果画像を援用することで、実施する処理を簡素化する。再利用処理部111は、後に処理する対象画像の処理において、先に処理した対象画像の結果を援用するために、対象画像の一部に対する処理の結果である第1処理結果画像を格納させておき、再利用可能にする。なお、再利用処理部111は、援用元の対象画像(第1画像)と援用先の対象画像(第1画像の後に処理する第2画像)との間で、それぞれ実施する処理の手法を一致させることで、処理の結果である第1処理結果画像を再利用可能にする。
通常処理部112は、再利用処理部111による処理(第1処理)の結果である第1処理結果画像に基づく画像において、それに含まれる検出対象を検出するための処理(第2処理)を実施する。例えば、通常処理部112は、画像認識処理のアルゴリズムを評価する処理の過程で、複数の対象画像に対する処理を実施する際に、対象画像の少なくとも一部に対する処理の結果を援用困難な種類の処理を実施する。通常処理部112は、検出対象を識別する処理を含めた処理を実施してもよい。なお、上記の第1処理結果画像に基づく画像には、例えば、援用元の対象画像に対する処理により得られた第1処理結果画像と、援用先の対象画像に対する処理により得られた第1処理結果画像とを結合した画像などが含まれる。
スコア算出部113は、検出対象を検出する処理の結果を評価する。スコア算出部113は、対象画像に含まれる検出対象を、再利用処理部111及び通常処理部112の処理を経て検出した結果のスコアを算出することにより、検出対象を検出する処理の結果を評価する。
データ取得部14は、入出力装置100E、可搬型記憶媒体ドライブ装置100D、又は通信インターフェース100Fを介して各種データを取得して、評価データ格納部121と、単位処理定義格納部122と、処理順序格納部123のそれぞれに、取得したデータを格納する。なお、可搬型記憶媒体ドライブ装置100Dにより取得される各種データには、DVD等の可搬型記録媒体に書き込まれた対象画像のデータなどが含まれる。
評価制御部115は、画像認識手法評価のための処理に関する順序制御を実施する。評価制御部115は、画像認識手法評価のための処理の一部を上記の再利用処理部111と、通常処理部112と、スコア算出部113とに実施させる。例えば、評価制御部115は、複数の対象画像のうちから対象画像を繰り返し選択して、再利用処理部111と、通常処理部112と、スコア算出部113とに、各対象画像に対する処理を実施させる。上記の再利用処理部111と、通常処理部112と、スコア算出部113などに関する詳細な説明は後述する。
格納部120は、評価データ格納部121と、単位処理定義格納部122と、処理順序格納部123と、共通分割画像格納部124(部分画像格納部)と、検出結果格納部125と、中間データ格納部126とを含む。これらの格納部は、図3に示すRAM100B、不揮発性記憶装置100C、または可搬型記憶媒体ドライブ装置100Dにおける、予め定められた、或いは動的に定められる領域である。中間データ格納部126は、評価制御部115と、再利用処理部111と、通常処理部112のそれぞれで生成される中間データを格納する。評価データ格納部121と、単位処理定義格納部122と、処理順序格納部123と、共通分割画像格納部124と、検出結果格納部125とについての詳細な説明は後述する。
(画像認識処理の手法の評価についての概要)
画像認識手法評価装置100は、対象画像に含まれる検出対象を検出する画像認識処理の手法を評価する処理(画像認識手法評価処理)を実施する。対象画像における検出対象は、対象画像内の任意の位置に存在し得る。対象画像における検出対象を除く領域は、検出対象の特徴や位置に影響されないものとする。例えば、上記の対象画像の例としては、屋内の監視カメラから得られた画像、POS(Point Of Sale)システムにおいて商品又は商品情報を検出する時の画像などがある。上記の画像の場合、検出対象の種類、位置などに変化があっても、同じカメラによって撮像された画像において検出対象を含まない領域があるならば、その領域(部分画像領域)に共通性があることが多い。
図4は、画像認識処理の対象画像と、画像認識処理の手法(アルゴリズム)の一例を示す図である。図4に示す画像認識処理の対象画像は、検出対象と、その背景となる屋内の状況とが映り込んだものである。このような対象画像から検出対象を誤りなく検出するために、対象画像に相当するサンプル画像を複数含む評価データを用意する。図4に示す画像P1(第1画像)と画像P2(第2画像)は、サンプル画像の一例である。例えば、サンプル画像は、それぞれの画像における検出対象の位置、特徴などが互いに異なるものである。評価データには、上記のサンプル画像のデータの他に、画像内に配置された検出対象の位置を示すデータが含まれる。
一般に画像認識処理のアルゴリズムは、複数の処理の組み合わせにより構成される。例えば、対象画像の特徴や処理の目的等に合わせて検出対象を識別する識別処理を簡素化するように、検出対象の識別確率を高めることに適した複数種類の単位処理が選択され、画像認識処理のアルゴリズムは、それらの単位処理を組み合わせて実施するように構成されている。
本実施形態の画像認識手法評価装置100が評価の対象とする画像認識処理の手法(アルゴリズム)は、複数種類の単位処理を組み合わせて、それらの単位処理を順に適用するものである。画像認識手法評価装置100は、複数種類の単位処理の組み合わせに対して、複数の評価データを適用して、所定の順に従って処理を実施する上記の画像認識処理の手法による検出精度を評価する。
(画像認識処理の手法として選択可能な単位処理の例)
画像認識処理の手法として選択可能な処理として定義される単位処理の一例について説明する。上記の単位処理には、「グレースケール」処理と、「明るさ補正」処理と、「テンプレートマッチ」処理と、「2値化」処理などの処理が含まれる。
例えば、「グレースケール」処理は、カラー画像を入力画像とし、モノトーンのグレースケール画像を生成する処理である。その処理を調整するために設定可能なパラメータとして、カラー画像の3原色データ(R,G,B)に対する適量の重み係数(R重み、G重み,B重み)が用いられる。適量の重み係数を用いた重みづけ演算処理が実施されることにより、グレースケール画像が得られる。上記の処理の場合、係数を変更しなければ、処理毎にその結果が変化することはなく、同じ結果を得ることができる。また、入力画像の一部が変化しても、変化のない領域までその処理の結果が変化することはなく、処理の結果が、再利用できるものとして設定される。
「明るさ補正」処理は、グレースケール画像又はカラー画像を入力画像とし、出力する画像の明るさをその画像全体について、入力画像の明るさに基づいて調整する処理である。その処理を調整するために設定可能なパラメータとして補正閾値が用いられる。例えば、補正閾値は、入力画像における明るさの平均値又はピーク値がこの補正閾値と同じ値になるように、出力画像の明るさを補正するための基準値である。画像認識手法評価装置100は、「明るさ補正」処理として以下の処理をする。入力画像の明るさの平均値を補正閾値に一致させる場合には、画像認識手法評価装置100は、入力画像の明るさの平均値と補正閾値とのオフセット量を、各画素の明るさに加算してもよい。或いは、入力画像の明るさのピーク値を補正閾値に一致させる場合には、画像認識手法評価装置100は、入力画像の明るさのピーク値と補正閾値とのオフセット量を、各画素の明るさに加算してもよい。上記の処理の場合、補正閾値を変更しなくても、画像の一部の明るさが変化することにより、入力画像の変化のない領域までその処理の結果が変化するため、処理の結果が、再利用できないものとして設定される。
「テンプレートマッチ」処理は、予め検出対象の特徴をモデル化したテンプレート画像を検出対象毎に定めておき、入力画像におけるテンプレート画像との一致度を判定する処理である。テンプレートマッチ処理そのものは、一般的な手法を適用することができる。例えば、画像認識手法評価装置100は、テンプレート画像が示す特徴量と、対象画像に基づいて生成された画像における検出対象の特徴量とを対比することにより、対象画像における検出対象の位置を特定する。例えば、その処理を調整するための設定可能なパラメータとして、類似度閾値が用いられる。画像認識手法評価装置100は、類似度閾値を用いてテンプレートマッチ処理の結果を評価する。上記の処理の場合、処理の結果が、検出対象の検出結果そのものであり、再利用できないものとして設定される。
「2値化」処理は、グレースケール画像又はカラー画像を入力画像とし、2値化閾値を基準に各画像の明るさを判定して、判定の結果を2値で示す処理である。その処理を調整するために設定可能なパラメータとして2値化閾値が用いられる。例えば、2値化閾値が1つであれば、画像認識手法評価装置100は、その値を超える明るさの画素を「1」で示し、その値以下の明るさの画素を「0」で示す。或いは、2値化閾値が2つであれば、画像認識手法評価装置100は、その第1の値を超え第2の値以下の明るさの画素を「1」で示し、その第1の値以下の明るさの画素と第2の値を超える明るさの画素を「0」で示す。上記の処理の場合、処理の結果が、再利用できるものとして設定される。
画像認識手法評価装置100は、上記の単位処理等の組み合わせから、処理に適した組み合わせを抽出する。
[処理フロー]
(画像認識手法評価処理の概要)
図5は、画像認識手法評価処理の概要を示すフローチャートである。図6と図7は、上記の画像認識手法評価処理で利用するテーブルを示す図である。
まず、評価制御部115は、未評価の単位処理(処理)の組み合わせを探索し、探索により得られた未評価の処理の組み合わせを処理順序テーブルに格納する(S1)。
次に、評価制御部115は、処理順序テーブルに格納された処理の組み合わせにおいて、未評価のパラメータの組み合わせを探索し、探索により得られたパラメータの組み合わせを、当該処理順序テーブルに格納する(S2)。
図6に、処理順序格納部123に格納される処理順序テーブルの一例を示す。処理順序テーブルには、評価対象の画像(対象画像)に対する処理の実施を指定する単位処理IDと、その単位処理IDにより対応付けられた処理のパラメータが、処理を実施する順に従って格納されている。上記の単位処理IDとそれに対応するパラメータは、処理実行前に与えられているものとする。例えば、処理の順序を示す処理順序番号が、1から順にシーケンシャルに付与されるものとする。
図7に、単位処理定義格納部122に格納される単位処理定義テーブルの一例を示す。単位処理定義テーブルには、アルゴリズムを構成する単位処理が格納されている。上記のアルゴリズムを構成する単位処理とは、処理の特徴が異なる処理として分解された個々の処理のことである。上記のアルゴリズムを構成する単位処理は、処理実行前に与えられるものとする。単位処理定義テーブルは、単位処理の処理内容の定義と、各単位処理において設定可能なパラメータの定義と、再利用可否に関する情報を含む。上記の図7には、単位処理IDとして、1が付与された「グレースケール」処理と、2が付与された「明るさ補正」処理と、3が付与された「テンプレートマッチ」処理と、4が付与された「2値化」処理とが例示されている。単位処理定義テーブルには、上記の他、当該処理の結果を、再利用可能か否かを示す結果再利用情報と、当該処理の変数として設定可能な情報(設定可能パラメータ)とが含まれる。処理順序テーブルと単位処理定義テーブルは、単位処理IDによって対応付けられる。
図5に戻り、次に、評価制御部115は、処理順序テーブルに格納された処理の組み合わせとパラメータとに基づいて、処理順序テーブルにより特定される画像認識アルゴリズムについての性能評価処理を実施する(S3)。上記性能評価処理について、その詳細を後述する。
次に、評価制御部115は、処理順序テーブルに格納された処理の組み合わせにおいて、パラメータの組み合わせの探索が完了したか否かを判定し、完了していない場合には、上記S2の処理に進む(S4)。
一方、上記のパラメータの組み合わせの探索が完了した場合には、評価制御部115は、処理の組み合わせの探索が完了したか否かを判定し、完了していない場合には、上記S1の処理に進む(S5)。
一方、上記の処理の組み合わせの探索が完了した場合には、評価制御部115は、検出結果格納部125に格納された各処理の組み合わせと、パラメータの組み合わせとに基づいた判定の結果から、最も適した処理の組み合わせと、パラメータの組み合わせと評価されたものを選択して出力し(S6)、一連の処理を終える。
(性能評価対象の画像認識手法(画像認識処理)の一例)
図8は、画像認識手法に対する性能評価処理(S3)の概要を示すフローチャートである。図9から図11は、画像認識手法に対する性能評価処理において利用される各テーブルの一例を示す図である。例えば、画像認識手法評価装置100は、画像認識手法に対する性能評価処理において、評価データテーブル、共通分割画像保存テーブル、検出結果テーブルなどの各テーブルを利用する。例えば、画像認識手法評価装置100は、画像認識手法に対する性能評価処理の実施に当たり、下記のデータを準備する。
図9に、評価データ格納部121に格納される評価データテーブルの一例を示す。画像認識手法評価装置100は、評価対象の画像を、入出力装置100E、可搬型記憶媒体ドライブ装置100D、又は通信インターフェース100Fを介して取得する。データ取得部114は、取得した評価対象の画像を、評価データテーブルに纏めて、評価データ格納部121に格納する。
上記の画像と、その画像における検出対象の座標との組み合わせを示すデータが、評価データとして処理実行前に与えられているものとする。各画像には、一意に識別可能とする画像IDが付与されている。例えば、画像IDは1から順にシーケンシャルに付与されるものとする。例えば、各画像はカメラによって撮像された画像であってもよく、撮像後に一部が加工された画像であってもよい。以下の説明では、各画像のサイズ(画素数)は同じものとするが、画像から一部を切り出した領域のサイズが同じものであってもよい。
例えば、前述の図4に示す画像の縦横の画素数を(2000画素×2000画素)で構成される場合を例示する。例えば、「画像P1」と「画像P2」には、画像IDとして、1と2がそれぞれ付与される。各画像の左上に座標軸の原点を定め、原点を基準にして画像の縦の辺に沿ってX軸を、画像の横の辺に沿ってY軸を定める。この(x,y)座標系を用いることにより、画像内に配置された検出対象の位置を示す。例えば、検出対象の位置を、矩形の左上と右下の2つの座標の組で示すことができる。「画像P1」については、(200,1200)、(800,1800)の2点を対角とする範囲に検出対象の画像が配置されていることを示す。「画像P2」については、(1200,1200)、(1800,1800)の2点を対角とする範囲に検出対象の画像が配置されていることを示す。上記のように予め定められたアルゴリズムを評価するための画像と検出対象の座標とが対応付けられて、評価データテーブルに格納される。
図10に、共通分割画像保存テーブルの一例を示す。画像認識手法評価装置100は、共通分割画像格納部124に、共通分割画像保存テーブルを格納する。共通分割画像保存テーブルには、再利用対象の分割画像(部分画像)が書き込まれ、格納される。例えば、単位処理毎の分割画像を格納できるように、それぞれの処理の結果のデータ(画像データ)を格納するため各領域が設けられている。なお、共通分割画像保存テーブルは、処理開始時には格納される有効なデータが無く、空になっているものとして扱うことができる。
図11に、検出結果テーブルの一例を示す。画像認識手法評価装置100は、検出結果格納部125に、検出結果テーブルを格納する。検出結果テーブルは、対象画像1枚ごとに、その画像から検出された検出対象の座標(検出座標)を格納する。検出結果テーブルに格納される検出結果は、評価データ格納部121に格納されたデータと同様の座標系に基づいたデータとして格納される。なお、検出結果テーブルは、処理開始時には格納される有効なデータが無く、空になっているものとして扱うことができる。
画像認識手法評価装置100は、上記のように各テーブルを初期化した後、以下の処理を実施する。
まず、評価制御部115は、画像IDに基づいて、評価データテーブルの先頭行から順に一行ずつ、対象画像の画像データを取り出す(Sa1)。
次に、評価制御部115は、処理順序番号に基づいて、処理順序テーブルの先頭行から順に一行ずつ、同テーブルにより指定される処理に関するデータを取り出す(Sa2)。
次に、評価制御部115は、Sa2において、処理順序テーブル123に基づいて順に指定される処理に対応する結果再利用情報を、単位処理定義格納部122に格納される単位処理定義テーブルから取り出す(Sa3)。
次に、評価制御部115は、Sa3において単位処理定義テーブルから取り出した結果再利用情報に基づいて、当該処理が処理結果を再利用可能とする処理か否かを判定する。処理結果を再利用可能とは、処理結果を援用可能とすることである。次に、評価制御部115は、再利用可能であると判定した場合にはSa5に進み、再利用可能ではないと判定した場合にはSa7に進む(Sa4)。
Sa4において再利用可能であると判定した場合には、画像認識手法評価装置100は、画像分割処理(Sa5)と再利用を考慮した処理(Sa6)とを実施する。画像認識手法評価装置100は、評価に係る処理の効率を高めるため、対象画像を分割して、対象画像毎に処理する領域と、対象画像毎に処理しない領域とを区分する。対象画像毎に処理しない領域については、先に処理された結果を再利用して、処理の負荷を低減させる。ここで画像分割処理と再利用を考慮した処理の詳細について順に説明する。
図12は、画像分割処理(Sa5)のフローチャートである。
再利用処理部111は、例えば、中間データ格納部126を利用して画像分割処理を実施する。
図13は、中間データ格納部126に格納される中間データの構成を示す図である。中間データ格納部126は、分割画像位置番号、共通/固有、処理結果の各データを格納する。分割画像位置番号には、対象画像における分割画像を識別する識別子が格納され、例えば、識別子が対象画像において分割画像が配置された位置に対応付けられていてもよい。共通/固有には、処理結果を再利用可能であるか否かを示すデータが格納される。そのデータが、「共通」の場合には、処理結果を再利用可能であることを示し、「固有」の場合には、処理結果を再利用困難であることを示す。処理結果には、各処理の結果の画像データが格納される。上記の「共通/固有」に格納するデータは、属性情報に含まれる。
図12に示すように、まず、再利用処理部111は、中間データ格納部126に分割画像を示す中間データが存在するか否かを判定することにより、分割された対象画像のデータが存在しているか否かを判定し(Sa51)、分割された対象画像のデータが存在している場合には、図示する一連の処理を終える。なお、中間データの詳細については後述する。
一方、分割された対象画像のデータが存在していない場合には、再利用処理部111は、決められた分割数で対象画像を分割画像に分割し、分割画像位置番号を振る(Sa52)。例えば、再利用処理部111は、検出対象の画像を縦と横とに2分割し、全体を4つの分割画像に分割する場合、左上を1、右上を2、左下を3、右下を4とする分割画像位置番号を振ってもよい。
次に、再利用処理部111は、検出対象の少なくとも一部が分割画像に含まれるか否かを判定する。例えば、再利用処理部111は、検出対象と各分割画像が衝突しているか否かを判定する(Sa53)。検出対象と各分割画像の衝突判定とは、検出対象の領域と各分割画像の領域に共通する領域が含まれる場合を検出するための判定であり、共通する領域が含まれる場合を、検出対象と各分割画像とが衝突しているものとする。
検出対象と各分割画像とが衝突している場合には、再利用処理部111は、当該分割画像を固有部と判定し(Sa54)、個別に処理を実施するものであることを示す属性情報をその分割画像に対応付けて、中間データ格納部126に格納する。例えば、再利用処理部111は、上記の属性情報として、中間データ格納部126における「共通/固有」の項目に「固有」を格納する(Sa55)。Sa55の処理を終えると、再利用処理部111は、図示する一連の処理を終える。
検出対象と各分割画像とが衝突していない場合には、再利用処理部111は、当該分割画像を共通部と判定し(Sa56)、処理の結果を共用できるものであることを示す属性情報をその分割画像に対応付けて、中間データ格納部126に格納する。例えば、上記の場合、再利用処理部111は、上記の属性情報として、中間データ格納部126における「共通/固有」の項目に「共通」を格納する(Sa57)。Sa57の処理を終えると、再利用処理部111は、図示する一連の処理を終える。
図14は、再利用を考慮した処理(Sa6)のフローチャートである。なお、再利用を考慮した処理の具体的な一例を、図20から図25に示し、その説明を後述する。
まず、再利用処理部111は、前述の画像分割処理(Sa5)を終えた後、全ての分割画像について、下記する処理が完了したか否かを判定し(Sa61)、完了したと判定した場合に、図示する一連の処理を終える。
次に、再利用処理部111は、所定の順に従い中間データ格納部126から、後段の処理の対象にする対象分割画像の分割画像データを一つ取り出す(Sa62)。
次に、再利用処理部111は、SA62において取り出された対象分割画像の属性情報に基づいて、対象分割画像の属性について判定する(Sa63)。例えば、対象分割画像は、その属性から、各対象画像に共通する分割画像であるか、或いは、対象画像に対応付けられた固有の分割画像であるかの何れかに識別される。再利用処理部111は、中間データ格納部126における「共通/固有」の項目のデータを、対象分割画像の属性情報として取得して、属性情報に基づいて、対象分割画像の属性について判定する。Sa63における判定の結果、分割画像が対象画像に対応付けられた固有の分割画像である場合には、Sa67に進む。
Sa63における判定の結果、対象分割画像が各対象画像に共通する分割画像である場合には、再利用処理部111は、対象分割画像に対応する処理順序番号と分割画像位置番号とに基づいて、共通分割画像保存テーブル(共通分割画像格納部124)に対象分割画像に対応する処理結果が格納されているか否かを判定する(Sa64)。例えば、再利用処理部111は、共通分割画像保存テーブルを参照し、上記共通分割画像保存テーブルにおける処理順序番号が、対象分割画像に対応する処理の処理順序番号に一致して、かつ、上記共通分割画像保存テーブルにおける分割画像位置番号が、対象分割画像の分割画像位置番号と一致する処理結果が、共通分割画像保存テーブルに格納されているか否かを判定する。
Sa64における判定の結果、共通分割画像保存テーブルに、対象分割画像に対応する処理結果が格納されていない場合には、再利用処理部111は、対象分割画像に対する所定の単位処理を実施する。再利用処理部111は、その結果の画像(第1処理結果画像)を中間データ格納部126に上書きするのとともに、共通分割画像保存テーブルに格納して(Sa65)、Sa61に進む。
一方、Sa64における判定の結果、共通分割画像保存テーブルに、対象分割画像に対応する処理結果が格納されている場合には、再利用処理部111は、対象分割画像について、共通分割画像保存テーブルに格納された処理結果を取得し、中間データ格納部126に上書きして(Sa66)、Sa61に進む。
さらに、Sa63における判定の結果、分割画像が対象画像に対応付けられた固有の分割画像である場合には、対象分割画像に対する所定の単位処理を実施して、処理結果を中間データ格納部126に上書きして(Sa67)、Sa61に進む。
以上に示したように、再利用処理部111は、再利用を考慮した処理(Sa6)を実施してもよい。
図8に戻り、Sa4において再利用可能ではないと判定した場合について説明する。Sa4において再利用可能ではないと判定した場合には、画像認識手法評価装置100は、画像結合処理(Sa7)と再利用を考慮しない処理(Sa8)とを実施する。
画像認識手法評価装置100は、処理の効率を高めるために分割された対象画像について、対象画像毎に処理する領域と、対象画像毎に処理しない領域とを区分する。ただし、実施する処理の種類により、対象画像毎に全領域を処理することが必要とされる単位処理がある。画像認識手法評価装置100は、先に処理された結果の画像(第1処理結果画像)を再利用するために、第1処理結果画像としての分割画像を読み出して画像を結合して、上記の第1処理結果画像に基づく画像を得ることで、処理の負荷を低減させる。ここで画像結合処理と再利用を考慮しない処理の詳細について順に説明する。
図15は、画像結合処理(Sa7)のフローチャートである。
まず、再利用処理部111は、対象の処理に対応する処理順序番号と分割画像位置番号とに基づいて、中間データ格納部126に格納された画像の中間データが揃っているか否かを判定し(Sa70)、当該中間データが揃っていない場合には、図示する一連の処理を終える。例えば、対象の処理とは、中間データ格納部126に格納された中間データうち、判定処理の前段に実施する処理である。再利用処理部111は、判定処理の前段に実施する処理に対応する処理順序番号に、中間データ格納部126の処理順序番号が一致して、かつ、上記処理順序番号に対応する中間データの分割画像位置番号が全て揃っている場合を、中間データが揃っている、と判定する。
当該中間データが揃っている場合、再利用処理部111は、中間データ格納部126に格納された中間データに基づいて、判定処理の前段に実施する処理の処理順序番号に対応する画像が結合されているか否かを判定し(Sa71)、当該画像が結合されている場合には、図示する一連の処理を終える。
一方、当該画像が結合されていない場合には、再利用処理部111は、中間データ格納部126に格納され、Sa70において揃っていると判定された全ての分割画像を取出し、それぞれを結合する(Sa72)。上記の全ての分割画像は、第1処理結果画像の一例である。再利用処理部111は、その結合によって得られた第1処理結果画像に基づく結合画像を、結合画像に対応する結合画像処理中間データとして中間データ格納部126に格納し(Sa73)、図示する一連の処理を終える。
図16は、再利用を考慮しない処理(Sa8)のフローチャートである。
まず、通常処理部112は、対象の処理に対応する処理順序番号と分割画像位置番号とに基づいて、中間データ格納部126に格納された画像の中間データが揃っているか否かを判定する(Sa80)。当該中間データが揃っていない場合には、通常処理部112は、図示する一連の処理を終える。例えば、対象の処理とは、中間データ格納部126に格納された中間データうち、判定処理の前段に実施する処理である。再利用処理部111は、判定処理の前段に実施する処理に対応する処理順序番号に、中間データ格納部126の処理順序番号が一致して、かつ、上記処理順序番号に対応する中間データの分割画像位置番号が全て揃っている場合を、中間データが揃っている、と判定する。
当該中間データが揃っている場合、通常処理部112は、再利用処理部111による画像結合処理(Sa5)が完了した後、画像結合処理(Sa5)によって生成された中間データを取り出す(Sa81)。通常処理部112は、当該単位処理を実施して、その結果を結合画像処理中間データとして上書きし(Sa82)、図示する一連の処理を終える。
図8に戻り、各画像に対するSa6又はSa8の処理を終えた後の処理について説明する。Sa6又はSa8の処理を終えた後、評価制御部115は、全ての処理順序テーブルに格納されている処理が完了したか否かを判定し、処理順序テーブルに格納されている処理が完了していない場合には、Sa2の処理に進み、処理順序テーブルについての処理が完了している場合には、Sa10の処理に進む(Sa9)。
次に、評価制御部115は、各対象画像に対するSa6又はSa8の処理による検出対象の検出結果を検出結果テーブルに格納する(Sa10)。
次に、評価制御部115は、評価データテーブルの最終行から取得した画像の評価を終えたか否かを判定し(Sa11)、まだその画像の評価を終えていない場合には、Sa1の処理に進み、既にその画像の評価を終えている場合には、画像認識処理の結果から、処理とパラメータの組み合わせ毎のスコアを計算し(Sa12)、図示する一連の処理を終える。
以上の処理により、画像認識手法評価装置100は、画像認識処理の結果を数値化するための処理を簡素化することにより、画像認識手法の評価に要する時間を短縮することができる。
(分割画像の再利用処理と結合処理の概要)
以下、より具体的な例を示して、分割画像の再利用処理と結合処理の一例を説明する。
図17は、対象画像の一部を再利用する処理について説明するための図である。ここで例示する画像の場合、人物像が存在しない背景部分には、建物の壁と天井、更に、家具が配置されている状況が示されている。対象画像の1枚目、2枚目、3枚目・・・、つまり画像P1、画像P2、画像P3、・・・が順に選択されても、選択された対象画像のうち人物像が存在する領域に変化があるが、人物像が存在しない領域には変化がない。
なお、図17に示す各対象画像を縦横にそれぞれ2分割して、4つの分割画像として処理するものとする。例えば、画像P1は、分割画像D11、分割画像D12、分割画像D13、分割画像D14の4つに分割される。画像P2は、分割画像D21、分割画像D22、分割画像D23、分割画像D24の4つに分割される。画像P3は、分割画像D31、分割画像D32、分割画像D33、分割画像D34の4つに分割される。上記の画像P1から画像P3のうち、少なくとも人物像が存在する画像P1の分割画像D13、画像P2の分割画像D24、画像P3の分割画像D32は、画像内の位置が同じ分割画像と対比すると、当該画像の他の画像とは互いに異なるものとなる。
例えば、画像認識手法評価装置100は、人物像が存在する分割画像を下記の手法で検出してもよい。画像認識手法評価装置100は、各種処理に用いるデータとその結果のデータを格納する中間データ格納部126を利用してもよい。
図18は、対象画像を分割する処理を示す図である。画像認識手法評価装置100は、上記のように定めた分割方法で分割した各分割画像に対し、その範囲に検出対象の人物像が存在するか否かを判定し、その結果に基づいて、当該分割画像を再利用可能とする共通画像であるか、再利用困難な固有画像であるかを特定する。
例えば、画像認識手法評価装置100は、対象画像から、画像P1と画像P1に含まれる検出対象の位置座標とを抽出する。この図18に示す場合は、検出対象の位置座標は、左上隅の位置座標を(200、1200)とし、右下隅の位置座標を(800、1800)とするものである。
画像認識手法評価装置100は、画像P1の分割画像を生成し、それぞれを中間データ格納部126に格納する。生成された分割画像は、分割画像D11、分割画像D12、分割画像D13、分割画像D14の4つである。画像認識手法評価装置100は、画像P1の各分割画像の位置座標を抽出する。例えば、画像P1の分割画像D11は、左上隅の位置座標を(0、0)とし、右下隅の位置座標を(999、999)とする範囲の画像である。
画像認識手法評価装置100は、各分割画像の位置座標と、検出対象の位置情報とに基づいて、各分割画像の範囲と検出対象の範囲に共通する領域があり、所謂範囲同士が重なるか否かを判定し、分割画像D11の場合は重ならないことから、分割画像D11を共通画像と特定し、中間データ格納部126にその結果「共通」を書き込む。分割画像D12と分割画像D14についても、分割画像D11と同様の結果を得る。
これに対し、分割画像D13は、左上隅の位置座標を(0、1000)とし、右下隅の位置座標を(999、1999)とする範囲の画像である。
各分割画像の位置座標と検出対象の位置情報とに基づいて、各分割画像の範囲と検出対象の範囲が互いに重なるか否かを判定すると、分割画像D13の場合は重なることから、画像認識手法評価装置100は、分割画像D11を固有画像と特定し、中間データ格納部126にその結果「固有」を書き込む。
画像認識手法評価装置100は、分割処理が施された対象画像に対して、定められた単位処理を実施する。
例えば、前述の図17に示すように、画像認識手法評価装置100は、最初に処理する画像P1については、それに対応する分割画像D11、分割画像D12、分割画像D13、分割画像D14の4つに対するグレースケール処理を実施して、結果画像R111、結果画像R112、結果画像R113、結果画像R114を得て、人物像が含まれた結果画像R113を除く各結果画像を共通分割画像格納部124に格納する。画像認識手法評価装置100は、結果画像R111、結果画像R112、結果画像R113、結果画像R114を結合することで、結合画像C1を得る。
画像認識手法評価装置100は、次に処理する画像P2については、それに対応する分割画像D23、分割画像D24の2つに対するグレースケール処理を実施して、結果画像R123、結果画像R124を得て、人物像が含まれた結果画像R124を除く結果画像R123を共通分割画像格納部124に格納する。画像認識手法評価装置100は、上記のとおり、画像P2については、分割画像D21、分割画像D22の2つに対するグレースケール処理を実施しない。それに代えて、画像認識手法評価装置100は、共通分割画像格納部124に格納されている結果画像R111、結果画像R112を読み出して、結果画像R123、結果画像R124と結合することで、結合画像C2を得る。
画像認識手法評価装置100は、次に処理する画像P3については、それに対応する分割画像D32に対するグレースケール処理を実施して、結果画像R132を得る。画像認識手法評価装置100は、上記のとおり、画像P3については、分割画像D31、分割画像D33、分割画像D34の3つに対するグレースケール処理を実施しない。それに代えて、画像認識手法評価装置100は、共通分割画像格納部124に格納されている結果画像R111、結果画像R123、結果画像R114を読み出して、結果画像R132と結合することで、結合画像C3を得る。
画像認識手法評価装置100は、上記の方法で、画像を分割して処理することで、互いに共通する分割画像については、画像毎の処理を省略しても、既に処理された結果の結果画像と組み合わせることで、結合画像を得ることができる。なお、結合画像C1から結合画像C3は、結合画像処理中間データとして中間データ格納部126に格納される。
上記は、単位処理の一例であるグレースケール処理を例示して、画像の分割から結合画像を得るまでを説明したものであるが、複数の単位処理を組み合わせて処理する場合も同様の手法で処理することができる。
図19は、複数の単位処理を組み合わせて処理する手法を説明するための図である。この図19に示すように、複数の単位処理は、処理結果を再利用する処理と、その処理の結果に基づいて実施する処理結果を再利用しない処理の組み合わせを示す。
例えば、画像認識手法評価装置100は、最初に処理する画像P1については、それに対応する分割画像D11、分割画像D12、分割画像D13、分割画像D14の4つに対するグレースケール処理を実施して、結果画像R111、結果画像R112、結果画像R113、結果画像R114を得る。
次に、画像認識手法評価装置100は、結果画像R111、結果画像R112、結果画像R113、結果画像R114の4つに対する2値化処理を実施して、結果画像R211、結果画像R212、結果画像R213、結果画像R214を得て、人物像が含まれた結果画像R213を除く各結果画像を共通分割画像格納部124に格納する。画像認識手法評価装置100は、結果画像R211、結果画像R212、結果画像R213、結果画像R214を結合することで、結合画像C1を得る。上記の処理までが、画像P1に対する単位処理の結果を再利用するための一連の処理である。
次に、画像認識手法評価装置100は、結合画像C1に対するテンプレートマッチ処理を実施して、結合画像C1における検出対象(人物像)の位置を検出する。このテンプレートマッチ処理は、単位処理の結果を再利用しない処理である。
続いて、画像認識手法評価装置100は、次に処理する画像P2については、それに対応する分割画像D23、分割画像D24の2つに対するグレースケール処理を実施して、結果画像R113、結果画像R114を得る。
次に、画像認識手法評価装置100は、結果画像R113、結果画像R114の2つに対する2値化処理を実施して、結果画像R213、結果画像R214を得て、人物像が含まれない結果画像R213を共通分割画像格納部124に格納する。画像認識手法評価装置100は、結果画像R211、結果画像R212を共通分割画像格納部124から読み出して、結果画像R213、結果画像R214と結合することで、結合画像C2を得る。上記の処理までが、画像P2に対する単位処理の結果を再利用するための一連の処理である。
次に、画像認識手法評価装置100は、結合画像C2に対するテンプレートマッチ処理を実施して、結合画像C2における検出対象(人物像)の位置を検出する。このテンプレートマッチ処理は、単位処理の結果を再利用しない処理である。
(再利用処理の詳細について)
図20から図24を参照して、画像P1に対する再利用処理についてより詳細に説明する。図20から図24は、画像P1に対する再利用処理について説明するための図である。以下の説明では、再利用処理としてグレースケール処理を例示する。
図20に、初期状態の中間データ格納部126と共通分割画像保存テーブルを示す。中間データ格納部126には、画像P1の分割画像D11から分割画像D14の画像データが、分割画像位置番号の順に格納されている。分割画像D13が固有画像として設定され、その他の分割画像は共通画像として設定される。共通分割画像格納部124における共通分割画像保存テーブルは、データが未登録の状態である。
図21に、画像P1の分割画像D11に対する第1の単位処理であるグレースケール処理を示す。画像認識手法評価装置100は、処理順序テーブルの第1行目、つまり処理順序番号を1とする単位処理IDの1と、パラメータの2、4、1を読み出す。画像認識手法評価装置100は、単位処理定義テーブルを参照し、単位処理IDを1として格納されているグレースケール処理を、処理順序テーブルから読み出したパラメータの設定に従って再利用処理部111にて実行させる。再利用処理部111は、分割画像D11を中間データ格納部126から読み出し、グレースケール処理を実施する。再利用処理部111は、その結果の画像R111(第1処理結果画像)を中間データ格納部126に上書きするのとともに、共通分割画像格納部124における共通分割画像保存テーブルに格納する。この処理は、前述の図14におけるSa65に相当する。
図22に、画像P1の分割画像D12に対するグレースケール処理を示す。再利用処理部111は、分割画像D11の場合と同様に、分割画像D12を中間データ格納部126から読み出し、グレースケール処理を実施する。再利用処理部111は、分割画像D11の場合と同様に、その結果の画像R112(第1処理結果画像)を中間データ格納部126に上書きするのとともに、共通分割画像格納部124における共通分割画像保存テーブルに格納する。
図23に、画像P1の分割画像D13に対するグレースケール処理を示す。再利用処理部111は、分割画像D11の場合と同様に、分割画像D13を中間データ格納部126から読み出し、グレースケール処理を実施する。分割画像D13は固有画像であるので再利用することはない。再利用処理部111は、その結果の画像R113(第1処理結果画像)を中間データ格納部126に上書きするが、共通分割画像格納部124における共通分割画像保存テーブルには格納しない。この処理は、前述の図14におけるSa67に相当する。
図24に、画像P1の分割画像D14に対するグレースケール処理を示す。再利用処理部111は、分割画像D11の場合と同様に、分割画像D14を中間データ格納部126から読み出し、グレースケール処理を実施する。再利用処理部111は、分割画像D11の場合と同様に、その結果の画像R114(第1処理結果画像)を中間データ格納部126に上書きするのとともに、共通分割画像格納部124における共通分割画像保存テーブルに格納する。
上記までの処理により、画像P1の各分割画像に対するグレースケール処理を終える。
次に、2枚目以降の画像に対する再利用処理について説明する。図25は、画像P2に対する再利用処理(グレースケール処理)について説明するための図である。2枚目以降の画像では、以前の分割画像処理結果が、共通分割画像格納部124における共通分割画像保存テーブルに格納されている。例えば、2枚目の画像P2に対して再利用処理する場合には、1枚目の画像P1に対する処理の結果が、単位処理定義テーブルに再利用可能なデータとして格納されている。画像認識手法評価装置100は、共通分割画像保存テーブルに格納されている共通分割画像データのうち、「処理順序番号」が互いに一致し、かつ、「分割画像位置番号」が互いに一致するものがあれば再利用する。上記の場合、再利用処理部111は、画像R111(第1処理結果画像)を中間データ格納部126から読み出して、中間データ格納部126に上書きする。この処理は、前述の図13におけるSa66に相当する。
(異なる単位処理の再利用処理を続けて実施する場合について)
図26は、グレースケール処理に続き実施する単位処理について説明するための図である。画像認識手法評価装置100は、処理順序テーブルにおける処理順序番号の順に、その第2行目、第3行目にあたる単位処理IDとパラメータとをそれぞれ読み出し、それぞれの処理を実施する。
例えば、処理順序番号を2とする場合には、画像認識手法評価装置100は、処理順序番号2に対応する単位処理IDの4に基づいて、単位処理定義テーブルを参照し、2値化処理を、処理順序テーブルから読み出したパラメータの設定に従って再利用処理部111にて実行させる。例えば、再利用処理部111は、画像R111を中間データ格納部126から読み出し、2値化処理を実施する。再利用処理部111は、その結果の画像R211(第1処理結果画像)を中間データ格納部126に上書きするのとともに、共通分割画像保存テーブルに格納する。再利用処理部111は、画像R112、画像R113、画像R114についても、前述の画像R111と同様に処理をして、その結果である画像R212、画像R213、画像R214を格納する。再利用処理を終えた段階の中間データ格納部126には、画像R211から画像R214が格納される。
(画像を結合する処理と検出対象の検出処理について)
また、前述の図26において、処理順序番号の順で最後の3を処理する場合には、画像認識手法評価装置100は、分割された画像を結合する処理と、検出対象の検出処理とを実施する。
図27は、再利用処理を終えた段階の中間データ格納部126に格納されたデータを示す図である。中間データ格納部126には、画像P1の画像R211から画像R214の画像データが、分割画像位置番号の順に格納されている。例えば、再利用処理部111は、画像R211、画像R212、画像R213、画像R214の画像データを中間データ格納部126から読み出してそれぞれを結合して画像C1を合成し、中間データ格納部126に格納する。
次に、通常処理部112は、画像C1を中間データ格納部126から読み出して、画像C1に対してテンプレートマッチ処理を実施する。図28は、テンプレートマッチ処理について説明するための図である。例えば、画像認識手法評価装置100は、前述の図26に示したように、処理順序番号3に対応する単位処理ID3に基づいて、単位処理定義テーブルを参照し、テンプレートマッチ処理を、処理順序テーブルから読み出したパラメータの設定に従って通常処理部112にて実行させる。テンプレートマッチ処理におけるパラメータは、検出対象とテンプレートとの類似度を判定するための閾値として決定されている。例えば、通常処理部112は、類似度が所定の閾値を超えるものを類似性が高いと判定したり、最も大きな類似度を示す検出対象を抽出したりしてもよい。類似性が低い0から類似性が高い1まで変化するものとした場合に、通常処理部112は、閾値を0.5にしてもよい。例えば、画像認識手法評価装置100は、一般的に利用されている類似度指標である、Sum of Absolute Difference(SAD)、Sum of Squared Difference(SSD)、Normalized Cross-Correlation(NCC)、Zero-means Normalized Cross-Correlation(ZNCC)などの方法を用いて、テンプレートマッチ処理による類似度を算出してもよい。
通常処理部112は、テンプレートマッチ処理の結果として、画像CR1と、その処理によって検出した検出対象の位置座標とを中間データ格納部126に格納する。
図29は、テンプレートマッチ処理の結果を抽出する処理を説明するための図である。図29に示すように、通常処理部112は、テンプレートマッチ処理により検出した検出対象の位置座標を、検出結果テーブルに格納する。なお、テンプレートマッチ処理の結果として検出した検出対象が複数存在する場合には、通常処理部112は、例えば、類似度が高い方の検出対象の位置座標を抽出して、検出結果テーブルに格納してもよい。
(スコア算出処理について)
図30は、スコア算出に関する処理を説明するための図である。画像認識手法評価装置100は、単位処理とパラメータの組み合わせについて評価するために、その良し悪しを示すスコア(評価値)を算出する。例えば、スコア算出部113は、検出結果テーブルの検出座標と、評価データテーブルの検出対象座標に基づいて、スコアを算出する。スコア算出部113は、スコアの算出方法として、検出位置のずれ量の全画像に対する平均値等の値を適用してもよく、その他の既存技術を利用してもよい。例えば、スコア算出部113は、検出位置のずれ量をユークリッド距離として算出してもよい。
以上の処理により、処理とパラメータの組み合わせに対する一連の処理を終える。
(画像認識手法の評価に要する時間の短縮について)
以下、本実施形態による画像認識手法の評価に要する時間の短縮について説明する。本実施形態の画像認識手法の評価に要する時間TTを式(1)のようにモデル化する。
TT=(T×1)+(T×(n/N)×(p/P)+T×1×(P−p)/P)×M
・・・(1)
上記の式(1)において、Tが対象画像一枚当たりの処理時間、Mが対象画像の枚数、Nが対象画像の分割数、nが検出対象を含む分割画像数、Pが全単位処理数、pが再利用可能の単位処理数である。
上記の処理時間算出についての前提条件は、下記のとおりとする。
・分割画像に対する単位処理の処理時間は同じであるとする。その時間は(T/N)である。
・各単位処理の処理時間は画素数に比例する。
・画像の分割、結合等にかかる処理時間は単位処理の処理時間と比較して十分小さく、無視できるものとする。
さらに、検出対象の分割画像数を1とし(n=1)、pがPに対して十分大きい(p≒P)とすると、上記の式(1)は、下記の式(2)で近似できる。
TT=(T×1)+(T/N)×M ・・・(2)
さらに、Mが十分大きいとすると、上記の式(1)は、下記の式(3)で近似できる。
TT=(T×M/N) ・・・(3)
上記に対し、再利用をしない場合を比較例として式(4)に示す。
TT=T×M ・・・(4)
上記の式(3)によれば、上記式(4)に示す対象画像一枚当たりの処理時間Tと対象画像の枚数Mの積の(1/N)になる。
上記式(1)と式(4)に対し、下記の式(5)に示す値を代入して対比する。
対象画像一枚当たりの処理時間:T=216(秒)、
対象画像の枚数:M=100(枚)、
対象画像の分割数:N=4、
検出対象を含む分割画像数:n=1、
全単位処理数:P=3、
全単位処理のうち再利用可能の単位処理数:p=2
・・・(5)
式(1)による本実施形態の場合、3.06時間であるのに対し、式(4)による比較例の場合には、約6時間になる。この結果から、本実施形態による処理時間は、比較例による処理時間の約半分の時間で処理することができることが分かる。
以上の実施形態の画像認識手法評価装置100によれば、再利用処理部111は、複数の対象画像のうちから選択された対象画像に対し、前記対象画像に含まれる検出対象を検出するための第1処理を実施する。通常処理部112は、画像に含まれる検出対象を検出するための第2処理を実施する。スコア算出部113は、前記対象画像に含まれる検出対象を、再利用処理部111及び通常処理部112の処理を経て検出した結果を評価する。前記複数の対象画像のうち画像P1の後に処理する画像P2において、前記第1処理部は、対象画像を複数に分割した部分画像を単位にして前記第1処理を行うとともに、画像P1に対する第1処理の結果を援用可能である画像P2の一部又は全部の前記部分画像について画像P1に対する第1処理の結果を援用し、画像P1に対する第1処理の結果を援用困難である画像P2の一部又は全部の部分画像について前記第1処理を実行し、通常処理部112は、前記援用の採否の判定の結果に基づいた前記第1処理結果画像が結合された画像C1に対して前記第2処理を実施することにより、画像認識手法の評価に要する時間を短縮することができる。
また、再利用処理部111は、第1処理の結果を援用可能な部分画像が共通分画像格納部124に存在しない場合には、画像P1と異なる画像(たとえば画像P2)に基づく第1処理を実施して、当該実施した第1処理の結果を共通分画像格納部124に格納する。たとえば画像P1に対応するR113のように、第1処理結果画像に基づく部分画像が部共通分画像格納部124に存在しない場合には、再利用処理部111は、画像P2に基づく第1の単位処理の結果の部分画像(たとえば、R213)を、共通分画像格納部124に存在しない部分画像として、共通分画像格納部124に格納する。これにより、再利用処理部111が処理する画像の枚数を増加させることに対応して、共通分画像格納部124に存在しない部分画像の枚数を低減することができる。
また、再利用処理部111は、画像P1に対する第1の単位処理と、画像P2に対する第1の単位処理とにおいて、第1の単位処理の処理手法(アルゴリズムとパラメータ)を一致させて実施することにより、分割画像の再利用を容易とする。
また、画像認識手法評価装置100は、再利用処理部111が過去の処理結果を援用可能な種類の処理を前記第1処理として実施して、通常処理部112が過去の処理結果を援用困難な種類の処理を前記第2処理として実施するように構成してもよい。
(第2の実施形態)
以下、第2の実施形態について説明する。図31は、本実施形態における画像認識手法に対する性能評価処理の概要を示すフローチャートである。図31に示すSb1からSb12に示す各ステップの処理は、Sb3以外は、図8に示すSa1からSa12までの各ステップの処理に対応する。
画像認識手法評価装置100における再利用処理部111は、Sb2において取り出された画像について、再利用を考慮しない処理を1度も実施していないものであるか否かを判定する(Sb3)。判定の結果、再利用を考慮しない処理を1度も実施していないものである場合には、Sb4の処理に進み、再利用を考慮しない処理を1度も実施していないものではない場合には、Sb7の処理に進めて以降の処理を実施する。
図32は、本実施形態における再利用処理について説明するための図である。
前述したとおり、単位処理には、処理結果の再利用が可能な処理と、処理結果の再利用が困難な処理とがある。組み合わせた単位処理の順序により、処理結果の再利用が困難な処理を前段の処理として実施した場合、それより後段の処理で再利用可能な単位処理を実施する場合であっても再利用が困難になる。
例えば、前述した明るさ補正処理は、入力画像の状態により、検出対象の背景に当たる部分画像の明るさまで変化するものである。このような明るさ補正処理を前段で実施する単位処理の組み合わせでは、再利用が困難となる。
上記の図31に示した処理の手順に従えば、上記のように再利用が困難な単位処理の組み合わせの場合に、画像認識手法評価装置100は、再利用可能とするための処理の実施を制限する。画像認識手法評価装置100は、再利用が困難とされる場合に、無駄に再利用可能とするための処理を実施することが無く、必要な処理を効率よく実施することができる。
以上の実施形態の画像認識手法評価装置100によれば、第1の実施形態の効果を奏するものであり、更に、上記のように再利用が困難な単位処理をその組み合わせに含む場合には、再利用可能か否かの判定などの処理を簡素化することにより、必要な処理を中心にして評価のための処理を効率よく実施することが可能になり、画像認識手法の評価に要する時間を短縮することができる。
以上に説明した少なくともひとつの実施形態によれば、複数の対象画像のうちから選択された対象画像に対し、前記対象画像に含まれる検出対象を検出するための第1処理を実施する第1処理部(再利用処理部111)と、画像に含まれる検出対象を検出するための第2処理を実施する第2処理部(通常処理部112)と、前記対象画像に含まれる検出対象を、前記第1処理部及び前記第2処理部の処理を経て検出した結果を評価する評価部(スコア算出部113)と、を持ち、前記複数の対象画像のうち第1画像の後に処理する第2画像において、前記第1処理部は、前記対象画像を複数に分割した部分画像を単位にして前記第1処理を行うとともに、前記第1画像に対する第1処理の結果を援用可能である前記第2画像の一部又は全部の前記部分画像について前記第1画像に対する第1処理の結果を援用し、前記第1画像に対する第1処理の結果を援用困難である前記第2画像の一部又は全部の前記部分画像について前記第1処理を実行し、前記第2処理部は、前記援用の採否の判定の結果に基づいた前記第1処理結果画像が結合された画像に対して前記第2処理を実施することにより、画像認識手法の評価に要する時間を短縮し、画像認識手法を決定するまでの時間を短縮することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
例えば、複数種類の単位処理を組み合わせて、それらの単位処理を順に実施する際に、それぞれの単位処理間でデータを受け渡す記憶領域として、共通する中間データ格納部126を利用する実施方法を例示した。画像認識手法評価装置100は、それぞれの単位処理間でデータを受け渡す記憶領域として、共通する中間データ格納部126を利用することに代えて、格納部120内の一時的な記憶領域を利用するようにしてもよい。
100…画像認識手法評価装置、111…再利用処理部(第1処理部)、112…通常処理部(第2処理部)、113…スコア算出部(評価部)、114…データ取得部、115…評価制御部、120…格納部、121…評価データ格納部、122…単位処理定義格納部、123…処理順序格納部、124…共通分割画像格納部(部分画像格納部)、125…検出結果格納部、126…中間データ格納部

Claims (7)

  1. 複数の対象画像のうちから選択された対象画像に対し、前記対象画像に含まれる検出対象を検出するための第1処理を実施する第1処理部と、
    画像に含まれる検出対象を検出するための第2処理を実施する第2処理部と、
    前記対象画像に含まれる検出対象を、前記第1処理部及び前記第2処理部の処理を経て検出した結果を評価する評価部と、
    を備え、
    前記複数の対象画像のうち第1画像の後に処理する第2画像において、
    前記第1処理部は、
    前記対象画像を複数に分割した部分画像を単位にして前記第1処理を行うとともに、
    前記第1画像に対する第1処理の結果を援用可能である前記第2画像の一部又は全部の前記部分画像について前記第1画像に対する第1処理の結果を援用し、
    前記第1画像に対する第1処理の結果を援用困難である前記第2画像の一部又は全部の前記部分画像について前記第1処理を実行し、
    前記第2処理部は、
    前記援用の採否の判定の結果に基づいた前記第1処理結果画像が結合された画像に対して前記第2処理を実施する、
    画像認識手法評価装置。
  2. 前記第1処理部は、
    前記第1処理の結果を援用可能な前記部分画像が部分画像格納部に存在しない場合には、前記第1画像と異なる第2画像に基づく前記第1処理を実施して、当該実施した第1処理の結果を前記部分画像格納部に格納する、
    請求項1に記載の画像認識手法評価装置。
  3. 前記第1処理部は、
    前記第1画像に対する第1処理と、前記第2画像に対する第1処理とにおいて、前記第1処理の処理手法を一致させて実施する、
    請求項1又は請求項2に記載の画像認識手法評価装置。
  4. 前記第1処理部は、
    過去の処理結果を援用可能な種類の処理を前記第1処理として実施し、
    前記第2処理部は、
    過去の処理結果を援用困難な種類の処理を前記第2処理として実施する
    請求項1から請求項3の何れか1項に記載の画像認識手法評価装置。
  5. 前記第1処理部は、
    順に実施する複数の処理を含み、前記複数の処理の何れかに処理の結果を援用可能としない処理が含まれる場合、前記第1画像に対する前記第1処理の結果を前記第2画像における前記第2処理で援用しないものとする
    請求項1から請求項4の何れか1項に記載の画像認識手法評価装置。
  6. 複数の対象画像のうちから選択された対象画像に対し、前記対象画像に含まれる検出対象を検出するための第1処理を実施するステップと、
    画像に含まれる検出対象を検出するための第2処理を実施するステップと、
    前記対象画像に含まれる検出対象を、前記第1処理及び前記第2処理を経て検出した結果を評価するステップと、
    前記複数の対象画像のうち第1画像の後に処理する第2画像において、
    前記対象画像を複数に分割した部分画像を単位にして前記第1処理を行うとともに、前記第1画像に対する第1処理の結果を援用可能である前記第2画像の一部又は全部の前記部分画像について前記第1画像に対する第1処理の結果を援用し、
    前記第1画像に対する第1処理の結果を援用困難である前記第2画像の一部又は全部の前記部分画像について前記第1処理を実行し、
    前記援用の採否の判定の結果に基づいた前記第1処理結果画像が結合された画像に対して前記第2処理を実施するステップと、
    を含む画像認識手法評価方法。
  7. 複数の対象画像のうちから選択された対象画像に対し、前記対象画像に含まれる検出対象を検出するための第1処理を実施するステップと、
    画像に含まれる検出対象を検出するための第2処理を実施するステップと、
    前記対象画像に含まれる検出対象を、前記第1処理及び前記第2処理を経て検出した結果を評価するステップと、
    前記複数の対象画像のうち第1画像の後に処理する第2画像において、
    前記対象画像を複数に分割した部分画像を単位にして前記第1処理を行うとともに、前記第1画像に対する第1処理の結果を援用可能である前記第2画像の一部又は全部の前記部分画像について前記第1画像に対する第1処理の結果を援用し、
    前記第1画像に対する第1処理の結果を援用困難である前記第2画像の一部又は全部の前記部分画像について前記第1処理を実行し、
    前記援用の採否の判定の結果に基づいた前記第1処理結果画像が結合された画像に対して前記第2処理を実施するステップと、
    を、画像認識手法評価装置のコンピュータに実行させるためのプログラム。
JP2016130553A 2016-06-30 2016-06-30 画像認識手法評価装置、画像認識手法評価方法、及びプログラム Pending JP2018005506A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016130553A JP2018005506A (ja) 2016-06-30 2016-06-30 画像認識手法評価装置、画像認識手法評価方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016130553A JP2018005506A (ja) 2016-06-30 2016-06-30 画像認識手法評価装置、画像認識手法評価方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2018005506A true JP2018005506A (ja) 2018-01-11

Family

ID=60946280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016130553A Pending JP2018005506A (ja) 2016-06-30 2016-06-30 画像認識手法評価装置、画像認識手法評価方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2018005506A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111460877A (zh) * 2019-01-22 2020-07-28 斯特拉德视觉公司 利用图像级联及cnn的客体检测方法及装置
WO2021193287A1 (ja) * 2020-03-25 2021-09-30 旭化成株式会社 評価方法及び評価装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111460877A (zh) * 2019-01-22 2020-07-28 斯特拉德视觉公司 利用图像级联及cnn的客体检测方法及装置
JP2020119540A (ja) * 2019-01-22 2020-08-06 株式会社ストラドビジョン 遠距離検出または軍事目的のために、イメージコンカチネーションを利用したcnn基盤のハードウェア最適化が可能な物体検出器を学習する方法及び学習装置、それを利用したテスト方法及びテスト装置{learning method and learning device for object detector with hardware optimization based on cnn for detection at distance or military purpose using image concatenation, and testing method and testing device using the same}
CN111460877B (zh) * 2019-01-22 2023-10-13 斯特拉德视觉公司 利用图像级联及cnn的客体检测方法及装置
WO2021193287A1 (ja) * 2020-03-25 2021-09-30 旭化成株式会社 評価方法及び評価装置
JP2021157791A (ja) * 2020-03-25 2021-10-07 旭化成株式会社 評価方法及び評価装置

Similar Documents

Publication Publication Date Title
US9697416B2 (en) Object detection using cascaded convolutional neural networks
US20200134313A1 (en) Detection method and detection device
JP6511986B2 (ja) プログラム生成装置、プログラム生成方法および生成プログラム
WO2019107157A1 (ja) 棚割情報生成装置及び棚割情報生成プログラム
AU2016225841B2 (en) Predicting accuracy of object recognition in a stitched image
US20230245443A1 (en) Reducing scale estimate errors in shelf images
JP2020061158A (ja) 画像処理装置、表示制御装置、画像処理方法、および、記録媒体
US10424068B2 (en) Image processing apparatus and image processing method for person identification
US20180322364A1 (en) Information processing apparatus, image processing method, and computer-readable recording medium recording image processing program
CN112597837A (zh) 图像检测方法、装置、设备、存储介质和计算机程序产品
CN110210480B (zh) 文字识别方法、装置、电子设备和计算机可读存储介质
KR20110074453A (ko) 정보처리장치 및 정보처리방법
CN111445021B (zh) 学习方法、学习设备和计算机可读记录介质
US11328176B2 (en) Information processing apparatus, information processing method, and storage medium
JP2018005506A (ja) 画像認識手法評価装置、画像認識手法評価方法、及びプログラム
JP6623851B2 (ja) 学習方法、情報処理装置および学習プログラム
US11580721B2 (en) Information processing apparatus, control method, and program
JP2019144703A (ja) 読取システム、読取方法、プログラム、及び記憶媒体
US20230127469A1 (en) Computer-readable recording medium storing inference program, computer-readable recording medium storing learning program, inference method, and learning method
US11954865B2 (en) Image processing apparatus, image processing method, and storage medium for foreground extraction
JP2011141664A (ja) 文書比較装置、文書比較方法、及びプログラム
JP6695454B1 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2018005505A (ja) 画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラム
US9390347B2 (en) Recognition device, method, and computer program product
JP6175904B2 (ja) 照合対象抽出システム、照合対象抽出方法、照合対象抽出プログラム