JP2018005505A - 画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラム - Google Patents
画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラム Download PDFInfo
- Publication number
- JP2018005505A JP2018005505A JP2016130552A JP2016130552A JP2018005505A JP 2018005505 A JP2018005505 A JP 2018005505A JP 2016130552 A JP2016130552 A JP 2016130552A JP 2016130552 A JP2016130552 A JP 2016130552A JP 2018005505 A JP2018005505 A JP 2018005505A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image recognition
- evaluation
- parameter set
- partial image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
【課題】適度な処理負荷で好適なパラメータを設定することである。【解決手段】実施形態の画像認識パラメータ設定装置は、第1の評価部と、第2の評価部とを持つ。第1の評価部は、入力画像の一部である部分画像に対して、パラメータセットを変えながら、検出対象物の位置を特定する画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価する。第2の評価部は、前記入力画像における前記部分画像よりも広い範囲の画像に対し、前記第1の評価部により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して前記画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する。【選択図】図3
Description
本発明の実施形態は、画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラムに関する。
コンピュータによって画像に存在する検出対象物を検出したり、画像に映された物体を認識したりする処理(画像認識処理)が行われている。画像認識処理においては、種々のパラメータが設定される。例えば、2値化処理における閾値、テンプレートマッチにおける類似度の閾値などが、パラメータの例として挙げられる。ところで、検出対象物の種類や画像の撮像条件などに応じて好適なパラメータは異なるため、画像認識処理のセットアップとしての準備的な処理、或いは画像認識処理の前処理として、パラメータを設定する処理が行われる場合がある。
画像認識処理が高度化するのに応じて、多くのパラメータを設定する必要が生じる。そして、多くのパラメータを好適な値に設定する処理には、多くの処理時間が必要となる場合がある。複数のパラメータを個別に変動させて設定されるパラメータセットの数は、個別のパラメータの採り得る値の数を乗算した数となるからである。
これに関連し、部分画像で推定したパラメータを全体画像に適用する技術が開示されているが、従来の技術では、部分画像と全体画像の特性が異なる場合などにおいて、好適なパラメータを設定することができない場合があった。
本発明が解決しようとする課題は、適度な処理負荷で好適なパラメータを設定することができる画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラムを提供することである。
実施形態の画像認識パラメータ設定装置は、第1の評価部と、第2の評価部とを持つ。第1の評価部は、入力画像の一部である部分画像に対して、パラメータセットを変えながら、検出対象物の位置を特定する画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価する。第2の評価部は、前記入力画像における前記部分画像よりも広い範囲の画像に対し、前記第1の評価部により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して、前記画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する。
以下、実施形態の画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラムを、図面を参照して説明する。
[ハードウェア構成など]
図1は、実施形態の画像認識パラメータ設定装置100の使用環境の一例を示す図である。画像認識パラメータ設定装置100は、画像認識装置200が画像認識処理に使用するパラメータ(画像認識パラメータ)を好適に設定する装置である。画像認識装置200は、例えば、カメラCMによって対象物OBを撮像した画像IMの中から、対象物OBの存在する領域を特定する処理(画像認識処理)を実行する。画像IMは、通信によって、或いは可搬型記憶媒体を介して、画像認識パラメータ設定装置100および画像認識装置200に提供される。また、画像認識装置200がカメラCMを内蔵してもよい。画像認識装置200は、カメラを内蔵してユーザ認識を行う携帯電話や車載装置、金融機関端末、或いは、郵便局または物流施設で使用される宛先認識装置、その他の種々の用途に使用することができる。画像認識処理の対象は、カメラCMによる撮像画像に限らず、コンピュータによって生成されたグラフィック画像であってもよい。
図1は、実施形態の画像認識パラメータ設定装置100の使用環境の一例を示す図である。画像認識パラメータ設定装置100は、画像認識装置200が画像認識処理に使用するパラメータ(画像認識パラメータ)を好適に設定する装置である。画像認識装置200は、例えば、カメラCMによって対象物OBを撮像した画像IMの中から、対象物OBの存在する領域を特定する処理(画像認識処理)を実行する。画像IMは、通信によって、或いは可搬型記憶媒体を介して、画像認識パラメータ設定装置100および画像認識装置200に提供される。また、画像認識装置200がカメラCMを内蔵してもよい。画像認識装置200は、カメラを内蔵してユーザ認識を行う携帯電話や車載装置、金融機関端末、或いは、郵便局または物流施設で使用される宛先認識装置、その他の種々の用途に使用することができる。画像認識処理の対象は、カメラCMによる撮像画像に限らず、コンピュータによって生成されたグラフィック画像であってもよい。
画像認識パラメータ設定装置100と画像認識装置200は、例えば、LAN(Local Area Network)やWAN(Wide Area Network)、インターネットなどのネットワークを介して互いに通信する。また、画像認識パラメータ設定装置100と画像認識装置200は、一つのコンピュータにより実現される仮想的な複数の装置であってもよい。後者の場合、画像認識パラメータ設定装置100、画像認識装置200、およびカメラが一つの筐体に内蔵された装置として構成されてもよい。
画像認識装置200は、例えば、画像IMの中で、検出対象物がどの領域に存在するかを特定する。検出対象物は、対象物OBそのものであってもよいし、対象物OBにおける所望の部分であってもよい。「領域」は、画像IMの画素を座標と見立てた場合において、検出対象物が存在すると判定された領域に外側から接する矩形領域の左上と右下の座標で表される。画像認識装置200による画像認識処理は、画像認識アルゴリズムによって実現される。
画像認識アルゴリズムは、例えば、画像認識アルゴリズムを構成するひとまとまりの処理である部品、および、各部品の動作を決定する変数であるパラメータの組み合わせで構成される。部品には、例えば、グレースケール処理、明るさ補正処理、2値化処理、テンプレートマッチ処理、オープニング処理、クロージング処理などが含まれる。パラメータは、例えば、2値化処理の閾値、テンプレートマッチ処理の類似度の閾値、オープニング処理における対象領域の半径などである。
図2は、画像認識パラメータ設定装置100のハードウェア構成の一例を示す図である。画像認識パラメータ設定装置100は、例えば、CPU(Central Processing Unit)100Aと、RAM(Random Access Memory)100Bと、不揮発性記憶装置100Cと、可搬型記憶媒体ドライブ装置100Dと、入出力装置100Eと、通信インターフェース100Fとを備える。画像認識パラメータ設定装置100は、CPU100Aに代えて、任意の形態のプロセッサを備えてもよいし、図2に示した各構成要素のうち一部を省略してもよい。
CPU100Aは、不揮発性記憶装置100Cに格納され、または可搬型記憶媒体ドライブ装置100Dに装着された可搬型記憶媒体に格納されたプログラムをRAM100Bに展開して実行することで、以下に説明する種々の処理を行う。なお、画像認識パラメータ設定装置100は、CPUに代えて、他の種類のプロセッサを備えてもよい。RAM100Bは、CPU100Aによってワーキングエリアとして使用される。不揮発性記憶装置100Cは、例えば、HDD(Hard Disk Drive)やフラッシュメモリ、ROM(Read Only Memory)などである。可搬型記憶媒体ドライブ装置100Dには、DVD(Digital Versatile Disc)やCD(Compact Disc)、SDカードなどの可搬型記憶媒体が装着される。入出力装置100Eは、例えば、キーボードやマウス、タッチパネル、表示装置などを含む。通信インターフェース100Fは、画像認識パラメータ設定装置100が他装置と通信を行う場合のインターフェースとして機能する。
[機能構成]
[機能構成]
図3は、画像認識パラメータ設定装置100の機能構成の一例を示す図である。画像認識パラメータ設定装置100は、データの格納部として、管理プログラム格納部110と、原画像格納部112と、部分画像領域設定データ格納部114と、部分画像格納部116と、最適パラメータセット選択設定格納部118と、部品定義データ格納部120と、部品処理順序格納部122と、部品ごと実行プログラム格納部124と、最適パラメータセット候補格納部126と、最適パラメータセット格納部128とを備える。これらの格納部は、図2に示すRAM100B、不揮発性記憶装置100C、または可搬型記憶媒体ドライブ装置100Dにおける、予め定められた、或いは動的に定められる領域である。
また、画像認識パラメータ設定装置100は、機能部として、マスター管理部140と、部分画像領域設定部150と、最適パラメータセット候補選択部160と、最適パラメータセット選択部170とを備える。これらの機能部は、例えば、CPU100Aが管理プログラム格納部110などに格納されたプログラムを実行することにより実現される。また、これらの機能部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアが協働することで実現されてもよい。
以下、各機能構成について概説する。なお、画像認識パラメータ設定装置100により実行される処理の内容の詳細に関しては、各機能構成の概説の後に、フローチャートを用いて説明する。
マスター管理部140は、管理プログラム格納部110に格納されたプログラムによって機能し、部分画像領域設定部150、最適パラメータセット候補選択部160、および最適パラメータセット選択部170を適宜、呼び出すことで、以下に説明する処理を実行させる。
部分画像領域設定部150は、原画像格納部112に格納された原画像に対し、部分画像領域設定データ格納部114に格納された設定項目に従い、部分画像領域の設定(切り出し)を行う。部分画像領域設定部150は、例えば、後述する正解データの範囲に基づいて設定される当初部分画像領域に対して、後述する拡張率を反映させて拡張を行った領域を部分画像領域とする。部分画像領域設定部150により設定された(或いは切り出された)部分画像の情報は、部分画像格納部116に格納される。
図4は、原画像格納部112に格納されるデータの一例を示す図である。図示するように、原画像格納部112には、例えば、原画像の識別情報である原画像IDに対し、画像情報(例えば各画素に輝度や色彩情報が付与された情報、ベクトル画像情報その他の情報)、および正解データが対応付けられたデータが格納される。正解データとは、原画像から検出されることが期待される検出対象物の存在する領域を示すデータである。正解データは、検出対象物が存在すると判定されるべき領域に外側から接する矩形領域の左上と右下の座標で表される。
図5は、部分画像領域設定データ格納部114に格納されるデータの一例を示す図である。部分画像領域設定データ格納部114には、例えば、部分画像領域拡張率などのデータが格納される。部分画像領域拡張率は、前述した当初部分画像領域に対して拡張処理を行う際に使用される値である。部分画像領域設定データ格納部114に格納されるデータは、入出力装置100Eに対する操作者の操作によって変更可能である。部分画像領域拡張率の意義については後述する。なお、本実施形態における拡張率は、矩形の各辺をそれぞれ拡張する率であってもよいし、面積を拡張する率であってもよい。
図6は、部分画像格納部116に格納されるデータの一例を示す図である。部分画像格納部116には、例えば、部分画像の識別情報である部分画像IDに対し、画像情報(前述)、その部分画像が切り出された原画像に対応して原画像格納部112に格納された正解データ、およびその部分画像が切り出された原画像の原画像IDが対応付けられたデータが格納される。
最適パラメータセット候補選択部160は、部分画像格納部116に格納された部分画像に対し、最適パラメータセット選択設定格納部118に格納されたデータに従い、部品定義データ格納部120、部品処理順序格納部122、および部品ごと実行プログラム格納部124に格納されたデータ(プログラム)に基づく画像認識処理を、パラメータセットを変更しながら行う。そして、最適パラメータセット候補選択部160は、画像認識処理の結果と正解データとを比較することでパラメータセットを評価し、評価が良好なパラメータセットを最適パラメータセット候補として選択する。パラメータセットとは、部品にそれぞれ与えられるパラメータの集合である。最適パラメータセット候補とは、原画像から検出対象物を検出するのに最も適していると考えられるパラメータセット(最適パラメータセット)の候補である。最適パラメータセット候補選択部160により選択された最適パラメータセット候補は、最適パラメータセット候補格納部126に格納される。
図7は、最適パラメータセット選択設定格納部118に格納されるデータの一例を示す図である。最適パラメータセット選択設定格納部118には、例えば、全パラメータセットの数のうち、最適パラメータセット候補として選択するパラメータセットの割合を示す候補数比率、各パラメータの探索範囲(および探索の刻み幅)を示す値域などのデータが格納されている。
図8は、部品定義データ格納部120に格納されるデータの一例を示す図である。部品定義データ格納部120には、例えば、部品の識別情報である部品IDに対し、必要拡張率、処理内容、設定可能パラメータなどが対応付けられたデータが格納される。必要拡張率とは、前述した当初部分画像領域に対して拡張処理を行う際に使用される値である。なお、必要拡張率の項目が「全体処理要」となっている部品は、部分画像領域に対する処理が不可(全体画像に対する処理が必須)の部品である。
図9は、部品処理順序格納部122に格納されるデータの一例を示す図である。部品処理順序格納部122には、例えば、画像認識処理において実行される順序(手順)を示す手順IDに対し、部品IDが対応付けられたデータが格納される。
部品ごと実行プログラム格納部124には、図8の処理内容に示す各種処理を実行するためのプログラムが格納される。
図10は、最適パラメータセット候補格納部126に格納されるデータの一例を示す図である。最適パラメータセット候補格納部126には、例えば、評価が良好な複数のパラメータセットに対して、評価の結果を数値化したスコアが対応付けられたデータが格納される。
最適パラメータセット選択部170は、原画像格納部に格納された原画像に対し、最適パラメータセット候補格納部126に格納されたパラメータセットを順次選択しながら、部品定義データ格納部120、部品処理順序格納部122、および部品ごと実行プログラム格納部124に格納されたデータ(プログラム)に基づく画像認識処理を行う。そして、最適パラメータセット選択部170は、画像認識処理の結果と正解データとを比較することでパラメータセットを評価し、評価が良好なパラメータセットを最適パラメータセットとして選択する。最適パラメータセット選択部170により選択された最適パラメータセットは、最適パラメータセット格納部128に格納される。
[処理フロー]
以下、各機能部による処理の内容について、フローチャートを用いて説明する。図11は、画像認識パラメータ設定装置100により実行される全体処理の流れの一例を示すフローチャートである。
以下、各機能部による処理の内容について、フローチャートを用いて説明する。図11は、画像認識パラメータ設定装置100により実行される全体処理の流れの一例を示すフローチャートである。
まず、マスター管理部140は、部分画像領域設定部150に、部分画像領域設定処理を実行させる(ステップS100)。この部分画像領域設定処理の詳細については図12を用いて説明する。
次に、マスター管理部140は、最適パラメータセット候補選択部160に、最適パラメータセット候補選択処理を実行させる(ステップS200)。この最適パラメータセット候補選択処理の詳細については図15を用いて説明する。
次に、マスター管理部140は、最適パラメータセット選択部170に、最適パラメータセット選択処理を実行させる(ステップS300)。この最適パラメータセット選択処理の詳細については図16を用いて説明する。
図12は、部分画像領域設定部150により実行される部分画像領域設定処理の流れの一例を示すフローチャートである。まず、部分画像領域設定部150は、部品定義データ格納部120の「部分画像領域拡張率」の項目を参照し(ステップS101)、「全体処理要」となっている部品が存在するか否かを判定する(ステップS103)。「全体処理要」となっている部品が存在する場合、部分画像領域設定部150は、本フローチャートの処理をエラー終了する。この場合、画像認識パラメータ設定装置100は、原画像に対して、最適パラメータセット選択設定格納部118に規定される値域で網羅的にパラメータセットを探索し、最適パラメータセットを求めてよい。
「全体処理要」となっている部品が存在しない場合、部分画像領域設定部150は、部分画像領域設定データ格納部114に格納された値を参照し(ステップS105)、ステップS101で参照した「部分画像領域拡張率」と、ステップS105で参照した値との中で最も大きい値を、拡張率として採用する(ステップS107)。図5および図8の例では、部分画像領域設定データ格納部114に格納された値が最も大きいため、[1.25]が拡張率として採用される。
次に、部分画像領域設定部150は、原画像格納部112から原画像を一つ読み込み(ステップS109)、正解データの範囲から当初部分画像領域を設定する(ステップS111)。そして、部分画像領域設定部150は、当初部分画像領域をステップS107で採用した拡張率で拡張した部分画像領域を設定可能であるか否かを判定する(ステップS113)。詳しくは、後述する。部分画像領域を設定可能である場合、部分画像領域設定部150は、部分画像領域を部分画像格納部116に格納する(ステップS115)。
次に、部分画像領域設定部150は、全ての原画像を選択済であるか否かを判定する(ステップS117)。全ての原画像を選択済でない場合、部分画像領域設定部150は、ステップS109に戻り、次の原画像を一つ読み込む。一方、全ての原画像を選択済である場合、部分画像領域設定部150は、部分画像格納部116にデータがあるか否かを判定する(ステップS119)。部分画像領域設定部150は、部分画像格納部116にデータがある場合、部分画像領域設定処理を正常終了し、部分画像格納部116にデータがない場合、部分画像領域設定処理をエラー終了する。
図13は、部分画像領域設定部150により実行される処理を模式的に示す図である。部分画像領域設定部150は、複数の原画像のそれぞれに対し、対応する正解データの範囲から当初部分画像領域を設定し、これを拡張して部分画像領域を設定する。本図の例では、検出対象物は、原画像に複数映されているクッキーの中で、一つだけ色の濃いクッキーである。
ここで、当初部分画像領域を拡張して部分画像領域を設定する意義について説明する。例えば、部品には、着目画素の周辺画素に対する処理を含むオープニング処理など、処理結果として出力する画像のサイズよりも、入力画像に必要とされるサイズが広い処理が含まれている。この場合、正解データの範囲についてのみ処理を行えば十分なのではなく、正解データの範囲よりも若干広い範囲に対して画像認識処理を行うことが好ましい。
また、当初部分画像領域を拡張して部分画像領域を設定することにより、部分画像と原画像とで最適パラメータセットの傾向が乖離するのを防ぐことができる。例えば、部分画像の大部分を検出対象物が占めるような場合、画像認識処理において比較的重要な検出対象物と背景との境界部分を、十分に部分画像に含めることができない場合がある。本実施形態では、拡張によって、このような不都合が生じるのを抑制することができる。
このように、当初部分画像領域を拡張して部分画像領域を設定することによって、画像認識処理の精度を高く維持することができる。なお、部分画像領域設定データ格納部に格納された拡張率は、部品の種類を問わず、背景の認識などを考慮すると最低限これ位の拡張は行った方がよいという値である。一方、部品定義データ格納部120に格納された「部分画像領域拡張率」は、部品の種類ごとに現実に必要とされる拡張率である。このように二種類の拡張率を設定しておくことで、画像認識処理の精度を更に高く維持することができる。
図14は、図12のステップS113において、部分画像領域を設定可能でないと判定される場面の一例を示す図である。図示するように、正解データの範囲に基づく当初部分画像領域が原画像の端部に位置する場合、これを拡張すると原画像の範囲をはみ出してしまう場合がある。この場合、原画像の範囲をはみ出した部分について画像認識処理を行うのは適切でないため、部分画像領域設定部150は、この原画像について部分画像領域を設定しない。
図15は、最適パラメータセット候補選択部160により実行される最適パラメータセット候補選択処理の流れの一例を示すフローチャートである。まず、最適パラメータセット候補選択部160は、最適パラメータセット選択設定格納部118に格納されたデータに従い、探索するパラメータセットを生成する(ステップS201)。
次に、最適パラメータセット候補選択部160は、ステップS201において生成したパラメータセットから、パラメータセットを一つ選択する(ステップS203)。次に、最適パラメータセット候補選択部160は、選択したパラメータセットについて、スコア代表値をゼロにする(ステップS205)。
次に、最適パラメータセット候補選択部160は、部分画像格納部116に格納された部分画像から、部分画像を一つ選択する(ステップS207)。そして、最適パラメータセット候補選択部160は、ステップS205で選択したパラメータセットで、ステップS203で選択した部分画像に対して画像認識処理を行い(ステップS209)、認識結果と正解データとの一致度合に基づいてスコアを算出する(ステップS211)。このスコアは、例えば、認識結果である矩形領域と、正解データの矩形領域との一致度合が高ければ値が大きくなるものである。スコアの算出手法に関しては、上記の傾向を有する限り、如何なる手法を用いてもよい。簡易な例では、例えば、二つの矩形領域のそれぞれにおける相手側との重複率を加算または乗算してスコアを求めてよい。
次に、最適パラメータセット候補選択部160は、ステップS211で算出したスコアがスコア代表値を超えるか否かを判定する(ステップS213)。スコアがスコア代表値を超える場合、最適パラメータセット候補選択部160は、スコアでスコア代表値を更新する(置き換える)(ステップS215)。
次に、最適パラメータセット候補選択部160は、ステップS207において全ての部分画像を選択したか否かを判定する(ステップS217)。全ての部分画像を選択していない場合、ステップS207に戻り、次の部分画像を一つ選択する。
全ての部分画像を選択した場合、最適パラメータセット候補選択部160は、スコア代表値をパラメータセットに対応付けてRAM100Bなどに保存する(ステップS219)。そして、最適パラメータセット候補選択部160は、ステップS203において全てのパラメータセットを選択したか否かを判定する(ステップS221)。全てのパラメータセットを選択していない場合、ステップS203に戻り、次のパラメータセットを一つ選択する。
全てのパラメータセットを選択した場合、最適パラメータセット候補選択部160は、スコア代表値の高い(良好な評価を得た)パラメータセットから順に所定数のパラメータセットを選択し、最適パラメータセット候補格納部126に格納する(ステップS223)。所定数とは、例えば、探索するパラメータセットの数に、部分画像格納部116に格納された候補数比率を乗算した数である。これによって、最適パラメータセット候補選択処理が終了する。
図16は、最適パラメータセット選択部170により実行される最適パラメータセット選択処理の流れの一例を示すフローチャートである。まず、最適パラメータセット選択部170は、最適パラメータセット候補格納部126に格納された最適パラメータセット候補の中から、最適パラメータセット候補を一つ選択する(ステップS301)。
次に、最適パラメータセット選択部170は、ステップS301で選択した最適パラメータセット候補について、スコア代表値をゼロにする(ステップS303)。
次に、最適パラメータセット選択部170は、原画像格納部112に格納された原画像から、原画像を一つ選択する(ステップS305)。そして、最適パラメータセット選択部170は、ステップS301で選択した最適パラメータセット候補で、ステップS305で選択した原画像に対して画像認識処理を行い(ステップS307)、認識結果と正解データとの一致度合に基づいてスコアを算出する(ステップS309)。スコアについては、前述した通りである。なお、部分画像に対する画像認識処理と、原画像に対する画像認識処理とでスコアの算出手法を異ならせてもよい。その場合、評価の傾向等が大きく相違しない程度に異ならせることが望ましい。
次に、最適パラメータセット選択部170は、ステップS309で算出したスコアがスコア代表値を超えるか否かを判定する(ステップS311)。スコアがスコア代表値を超える場合、最適パラメータセット選択部170は、スコアでスコア代表値を更新する(置き換える)(ステップS313)。
次に、最適パラメータセット選択部170は、ステップS305において全ての原画像を選択したか否かを判定する(ステップS315)。全ての原画像を選択していない場合、ステップS305に戻り、次の原画像を一つ選択する。
全ての原画像を選択した場合、最適パラメータセット選択部170は、スコア代表値を最適パラメータセット候補に対応付けてRAM100Bなどに保存する(ステップS317)。そして、最適パラメータセット選択部170は、ステップS301において全ての最適パラメータセット候補を選択したか否かを判定する(ステップS319)。全ての最適パラメータセット候補を選択していない場合、ステップS301に戻り、次の最適パラメータセット候補を一つ選択する。
全ての最適パラメータセット候補を選択した場合、最適パラメータセット選択部170は、スコア代表値の高い(良好な評価を得た)最適パラメータセット候補を選択し、最適パラメータセットとする(ステップS321)。これによって、最適パラメータセット選択処理が終了する。なお、ステップS321において、最適パラメータセット選択部170は、スコア代表値の高い複数の(但し最適パラメータセット候補の数よりは少ない)最適パラメータセット候補を選択し、最適パラメータセットとしてもよい。この場合、利用者がいずれかの最適パラメータセットを選択して画像認識処理を行うことができる。
係る処理によって、適度な処理負荷で好適なパラメータセットを設定することができる。画像認識処理の部品に設定するパラメータは多岐に亘り、仮にパラメータセットを最初から原画像に対して全範囲で探索するものとすると、多くの処理時間が必要となってしまう。パラメータセットの探索処理に必要な処理時間は、例えば以下の式で表される。
(処理時間)=(1回の画像認識処理に必要な時間)×(パラメータセットの数)
(処理時間)=(1回の画像認識処理に必要な時間)×(パラメータセットの数)
パラメータセットの数は、各パラメータの採り得る値の数を乗算した数となり、すなわち繰り返し処理を行う回数となる。そして、それぞれの回において、長時間の処理が必要な原画像に対する処理を行うものとすると、全体としての処理時間が長くなってしまう。
これに対し、本実施形態の画像認識パラメータ設定装置100では、「パラメータセットの数」が多い「最適パラメータセット候補選択処理」の段階では、部分画像に対する処理を行うことで、上記の「1回の画像認識処理に必要な時間」を短縮し、「パラメータセットの数」を絞った後に原画像に対する処理を行うことで、画像認識処理の精度が低下するのを抑制しつつ、処理時間を短縮することができる。すなわち、適度な処理負荷で好適なパラメータセットを設定することができる。
図15および図16のフローチャートでは、あるパラメータセット(最適パラメータセット候補を含む)について、スコア代表値によって評価を行う、すなわち複数の部分画像または原画像のうちいずれかに対して画像認識処理を行った結果の評価の最大値に基づいて、そのパラメータセットを評価するものとしたが、これに限らず、例えば複数の部分画像または原画像に対して画像認識処理を行った結果の評価の平均値などを、評価の指標として採用してもよい。
図17は、最適パラメータセットを用いて画像認識処理が行われる様子を示す図である。この画像認識処理は、「最適パラメータセット候補選択処理」として行われるものであってもよいし、画像認識パラメータ設定装置100の処理結果を受けて画像認識装置200が行うものであってもよい。
図17に示すように、画像認識処理は、例えば、グレースケール処理→区間で2値化する処理→オープニング処理→外接矩形を求める処理の順に行われる。2値化する処理は、例えば、一つだけ色が濃いクッキーの部分と、それ以外の部分とに分類する処理である。オープニング処理によって、ノイズと扱うべき細かい2値化された画素が除外される。これによって、一つだけ色が濃いクッキーの部分を抽出することができ、外接矩形を精度よく求めることができる。
以上説明した少なくともひとつの実施形態によれば、入力画像(原画像)の一部である部分画像に対して、パラメータセットを変えながら検出対象物の位置を特定する画像認識処理を複数回実行し、複数回特定した結果をそれぞれ評価する第1の評価部(最適パラメータセット候補選択部160)と、入力画像における部分画像よりも広い範囲の画像に対し、第1の評価部により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して画像認識処理を複数回実行し、複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する第2の評価部(最適パラメータセット選択部170)と、を持つことにより、適度な処理負荷で好適なパラメータを設定することができる。
また、実施形態によれば、当初部分画像領域を拡張して部分画像領域を設定することによって、画像認識処理の精度を高く維持することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
100…画像認識パラメータ設定装置、110…管理プログラム格納部、112…原画像格納部、114…部分画像領域設定データ格納部、116…部分画像格納部、118…最適パラメータセット選択設定格納部、120…部品定義データ格納部、122…部品処理順序格納部、124…部品ごと実行プログラム格納部、126…最適パラメータセット候補格納部、128…最適パラメータセット格納部、140…マスター管理部、150…部分画像領域設定部、160…最適パラメータセット候補選択部、170…最適パラメータセット選択部
Claims (7)
- 入力画像の一部である部分画像に対して、パラメータセットを変えながら、検出対象物の位置を特定する画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価する第1の評価部と、
前記入力画像における前記部分画像よりも広い範囲の画像に対し、前記第1の評価部により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して、前記画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する第2の評価部と、
を備える画像認識パラメータ設定装置。 - 前記画像認識処理は、複数の処理を含み、
前記第1の評価部は、前記複数の処理に、前記入力画像の全体に対して行う必要のある処理が含まれる場合、当該入力画像に対して前記評価を行わない、
請求項1記載の画像認識パラメータ設定装置。 - 前記入力画像と共に、前記検出対象物の位置を示す正解データの範囲を示す情報を取得し、前記正解データの範囲に基づいて前記部分画像の領域を生成する部分画像領域設定部を更に備える、
請求項1または2記載の画像認識パラメータ設定装置。 - 前記部分画像領域設定部は、前記正解データの範囲に基づく当初部分画像領域に対して、所定の拡張率で拡張した領域を、前記部分画像の領域とする、
請求項3記載の画像認識パラメータ設定装置。 - 前記画像認識処理は、処理結果として出力する画像のサイズよりも、入力画像に必要とされるサイズが広い処理を含む、
請求項3または4記載の画像認識パラメータ設定装置。 - 入力画像の一部である部分画像に対して、パラメータセットを変えながら、検出対象物の位置を特定する画像認識処理を複数回実行し、
前記複数回特定した結果をそれぞれ評価する第1の評価を行い、
前記入力画像における前記部分画像よりも広い範囲の画像に対し、前記第1の評価により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して、前記画像認識処理を複数回実行し、
前記複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する第2の評価を行う、
画像認識パラメータ設定方法。 - コンピュータに、
入力画像の一部である部分画像に対して、パラメータセットを変えながら、検出対象物の位置を特定する画像認識処理を複数回実行させ、
前記複数回特定した結果をそれぞれ評価する第1の評価を行わせ、
前記入力画像における前記部分画像よりも広い範囲の画像に対し、前記第1の評価により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して、前記画像認識処理を複数回実行させ、
前記複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する第2の評価を行わせる、
画像認識パラメータ設定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016130552A JP2018005505A (ja) | 2016-06-30 | 2016-06-30 | 画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016130552A JP2018005505A (ja) | 2016-06-30 | 2016-06-30 | 画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018005505A true JP2018005505A (ja) | 2018-01-11 |
Family
ID=60944933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016130552A Pending JP2018005505A (ja) | 2016-06-30 | 2016-06-30 | 画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018005505A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022149544A1 (ja) * | 2021-01-06 | 2022-07-14 | ファナック株式会社 | 画像処理装置 |
JP7166509B1 (ja) * | 2021-05-11 | 2022-11-07 | 三菱電機株式会社 | 画像解析装置、画像解析方法及び、画像解析プログラム |
-
2016
- 2016-06-30 JP JP2016130552A patent/JP2018005505A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022149544A1 (ja) * | 2021-01-06 | 2022-07-14 | ファナック株式会社 | 画像処理装置 |
JP7166509B1 (ja) * | 2021-05-11 | 2022-11-07 | 三菱電機株式会社 | 画像解析装置、画像解析方法及び、画像解析プログラム |
WO2022239096A1 (ja) * | 2021-05-11 | 2022-11-17 | 三菱電機株式会社 | 画像解析装置、画像解析方法及び、画像解析プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11210513B2 (en) | Detection method and detection device | |
AU2016225841B2 (en) | Predicting accuracy of object recognition in a stitched image | |
JP6458394B2 (ja) | 対象追跡方法及び対象追跡装置 | |
US10769473B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
EP3540636A1 (en) | Method for distinguishing a real three-dimensional object from a two-dimensional spoof of the real object | |
JP2018005640A (ja) | 分類器生成装置、画像検査装置、及び、プログラム | |
JP2018005639A (ja) | 画像分類装置、画像検査装置、及び、プログラム | |
US8244044B2 (en) | Feature selection and extraction | |
CN108776834B (zh) | 系统增强学习方法和装置、电子设备、计算机存储介质 | |
US20230334235A1 (en) | Detecting occlusion of digital ink | |
US11297248B2 (en) | Real-time glare detection inside a dynamic region of an image | |
US11747284B2 (en) | Apparatus for optimizing inspection of exterior of target object and method thereof | |
CN111079638A (zh) | 基于卷积神经网络的目标检测模型训练方法、设备和介质 | |
US20190066311A1 (en) | Object tracking | |
JP6756406B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
CN111640123B (zh) | 无背景图像的生成方法、装置、设备及介质 | |
CN112767354A (zh) | 基于图像分割的缺陷检测方法、装置、设备及存储介质 | |
CN112488999A (zh) | 一种图像中小目标检测方法、系统、存储介质及终端 | |
CN110910445A (zh) | 一种物件尺寸检测方法、装置、检测设备及存储介质 | |
CN113643260A (zh) | 用于检测图像质量的方法、装置、设备、介质和产品 | |
JP2007025902A (ja) | 画像処理装置、画像処理方法 | |
JP2019220014A (ja) | 画像解析装置、画像解析方法及びプログラム | |
JP2018005505A (ja) | 画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラム | |
JP2006323779A (ja) | 画像処理方法、画像処理装置 | |
JP2002269545A (ja) | 顔画像処理方法及び顔画像処理装置 |