JP2018005505A

JP2018005505A - 画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラム

Info

Publication number: JP2018005505A
Application number: JP2016130552A
Authority: JP
Inventors: 孝浩西沢; Takahiro Nishizawa; 池田　信之; Nobuyuki Ikeda; 信之池田; 文明大畑; Fumiaki Ohata; 幸造伴野; Kozo Tomono; 敏治和田; Toshiharu Wada; 裕伸青木; Hironobu Aoki
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2016-06-30
Filing date: 2016-06-30
Publication date: 2018-01-11

Abstract

【課題】適度な処理負荷で好適なパラメータを設定することである。【解決手段】実施形態の画像認識パラメータ設定装置は、第１の評価部と、第２の評価部とを持つ。第１の評価部は、入力画像の一部である部分画像に対して、パラメータセットを変えながら、検出対象物の位置を特定する画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価する。第２の評価部は、前記入力画像における前記部分画像よりも広い範囲の画像に対し、前記第１の評価部により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して前記画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する。【選択図】図３

Description

本発明の実施形態は、画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラムに関する。

コンピュータによって画像に存在する検出対象物を検出したり、画像に映された物体を認識したりする処理（画像認識処理）が行われている。画像認識処理においては、種々のパラメータが設定される。例えば、２値化処理における閾値、テンプレートマッチにおける類似度の閾値などが、パラメータの例として挙げられる。ところで、検出対象物の種類や画像の撮像条件などに応じて好適なパラメータは異なるため、画像認識処理のセットアップとしての準備的な処理、或いは画像認識処理の前処理として、パラメータを設定する処理が行われる場合がある。

画像認識処理が高度化するのに応じて、多くのパラメータを設定する必要が生じる。そして、多くのパラメータを好適な値に設定する処理には、多くの処理時間が必要となる場合がある。複数のパラメータを個別に変動させて設定されるパラメータセットの数は、個別のパラメータの採り得る値の数を乗算した数となるからである。

これに関連し、部分画像で推定したパラメータを全体画像に適用する技術が開示されているが、従来の技術では、部分画像と全体画像の特性が異なる場合などにおいて、好適なパラメータを設定することができない場合があった。

特開２００９−７１７６８号公報

本発明が解決しようとする課題は、適度な処理負荷で好適なパラメータを設定することができる画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラムを提供することである。

実施形態の画像認識パラメータ設定装置は、第１の評価部と、第２の評価部とを持つ。第１の評価部は、入力画像の一部である部分画像に対して、パラメータセットを変えながら、検出対象物の位置を特定する画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価する。第２の評価部は、前記入力画像における前記部分画像よりも広い範囲の画像に対し、前記第１の評価部により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して、前記画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する。

実施形態の画像認識パラメータ設定装置１００の使用環境の一例を示す図。画像認識パラメータ設定装置１００のハードウェア構成の一例を示す図。画像認識パラメータ設定装置１００の機能構成の一例を示す図。原画像格納部１１２に格納されるデータの一例を示す図。部分画像領域設定データ格納部１１４に格納されるデータの一例を示す図。部分画像格納部１１６に格納されるデータの一例を示す図。最適パラメータセット選択設定格納部１１８に格納されるデータの一例を示す図。部品定義データ格納部１２０に格納されるデータの一例を示す図。部品処理順序格納部１２２に格納されるデータの一例を示す図。最適パラメータセット候補格納部１２６に格納されるデータの一例を示す図。画像認識パラメータ設定装置１００により実行される全体処理の流れの一例を示すフローチャート。部分画像領域設定部１５０により実行される部分画像領域設定処理の流れの一例を示すフローチャート。部分画像領域設定部１５０により実行される処理を模式的に示す図。図１２のステップＳ１１３において、部分画像領域を設定可能でないと判定される場面の一例を示す図。最適パラメータセット候補選択部１６０により実行される最適パラメータセット候補選択処理の流れの一例を示すフローチャート。最適パラメータセット選択部１７０により実行される最適パラメータセット選択処理の流れの一例を示すフローチャート。最適パラメータセットを用いて画像認識処理が行われる様子を示す図。

以下、実施形態の画像認識パラメータ設定装置、画像認識パラメータ設定方法、および画像認識パラメータ設定プログラムを、図面を参照して説明する。

［ハードウェア構成など］
図１は、実施形態の画像認識パラメータ設定装置１００の使用環境の一例を示す図である。画像認識パラメータ設定装置１００は、画像認識装置２００が画像認識処理に使用するパラメータ（画像認識パラメータ）を好適に設定する装置である。画像認識装置２００は、例えば、カメラＣＭによって対象物ＯＢを撮像した画像ＩＭの中から、対象物ＯＢの存在する領域を特定する処理（画像認識処理）を実行する。画像ＩＭは、通信によって、或いは可搬型記憶媒体を介して、画像認識パラメータ設定装置１００および画像認識装置２００に提供される。また、画像認識装置２００がカメラＣＭを内蔵してもよい。画像認識装置２００は、カメラを内蔵してユーザ認識を行う携帯電話や車載装置、金融機関端末、或いは、郵便局または物流施設で使用される宛先認識装置、その他の種々の用途に使用することができる。画像認識処理の対象は、カメラＣＭによる撮像画像に限らず、コンピュータによって生成されたグラフィック画像であってもよい。

画像認識パラメータ設定装置１００と画像認識装置２００は、例えば、ＬＡＮ（Local Area Network）やＷＡＮ（Wide Area Network）、インターネットなどのネットワークを介して互いに通信する。また、画像認識パラメータ設定装置１００と画像認識装置２００は、一つのコンピュータにより実現される仮想的な複数の装置であってもよい。後者の場合、画像認識パラメータ設定装置１００、画像認識装置２００、およびカメラが一つの筐体に内蔵された装置として構成されてもよい。

画像認識装置２００は、例えば、画像ＩＭの中で、検出対象物がどの領域に存在するかを特定する。検出対象物は、対象物ＯＢそのものであってもよいし、対象物ＯＢにおける所望の部分であってもよい。「領域」は、画像ＩＭの画素を座標と見立てた場合において、検出対象物が存在すると判定された領域に外側から接する矩形領域の左上と右下の座標で表される。画像認識装置２００による画像認識処理は、画像認識アルゴリズムによって実現される。

画像認識アルゴリズムは、例えば、画像認識アルゴリズムを構成するひとまとまりの処理である部品、および、各部品の動作を決定する変数であるパラメータの組み合わせで構成される。部品には、例えば、グレースケール処理、明るさ補正処理、２値化処理、テンプレートマッチ処理、オープニング処理、クロージング処理などが含まれる。パラメータは、例えば、２値化処理の閾値、テンプレートマッチ処理の類似度の閾値、オープニング処理における対象領域の半径などである。

図２は、画像認識パラメータ設定装置１００のハードウェア構成の一例を示す図である。画像認識パラメータ設定装置１００は、例えば、ＣＰＵ（Central Processing Unit）１００Ａと、ＲＡＭ（Random Access Memory）１００Ｂと、不揮発性記憶装置１００Ｃと、可搬型記憶媒体ドライブ装置１００Ｄと、入出力装置１００Ｅと、通信インターフェース１００Ｆとを備える。画像認識パラメータ設定装置１００は、ＣＰＵ１００Ａに代えて、任意の形態のプロセッサを備えてもよいし、図２に示した各構成要素のうち一部を省略してもよい。

ＣＰＵ１００Ａは、不揮発性記憶装置１００Ｃに格納され、または可搬型記憶媒体ドライブ装置１００Ｄに装着された可搬型記憶媒体に格納されたプログラムをＲＡＭ１００Ｂに展開して実行することで、以下に説明する種々の処理を行う。なお、画像認識パラメータ設定装置１００は、ＣＰＵに代えて、他の種類のプロセッサを備えてもよい。ＲＡＭ１００Ｂは、ＣＰＵ１００Ａによってワーキングエリアとして使用される。不揮発性記憶装置１００Ｃは、例えば、ＨＤＤ（Hard Disk Drive）やフラッシュメモリ、ＲＯＭ（Read Only Memory）などである。可搬型記憶媒体ドライブ装置１００Ｄには、ＤＶＤ（Digital Versatile Disc）やＣＤ（Compact Disc）、ＳＤカードなどの可搬型記憶媒体が装着される。入出力装置１００Ｅは、例えば、キーボードやマウス、タッチパネル、表示装置などを含む。通信インターフェース１００Ｆは、画像認識パラメータ設定装置１００が他装置と通信を行う場合のインターフェースとして機能する。
［機能構成］

図３は、画像認識パラメータ設定装置１００の機能構成の一例を示す図である。画像認識パラメータ設定装置１００は、データの格納部として、管理プログラム格納部１１０と、原画像格納部１１２と、部分画像領域設定データ格納部１１４と、部分画像格納部１１６と、最適パラメータセット選択設定格納部１１８と、部品定義データ格納部１２０と、部品処理順序格納部１２２と、部品ごと実行プログラム格納部１２４と、最適パラメータセット候補格納部１２６と、最適パラメータセット格納部１２８とを備える。これらの格納部は、図２に示すＲＡＭ１００Ｂ、不揮発性記憶装置１００Ｃ、または可搬型記憶媒体ドライブ装置１００Ｄにおける、予め定められた、或いは動的に定められる領域である。

また、画像認識パラメータ設定装置１００は、機能部として、マスター管理部１４０と、部分画像領域設定部１５０と、最適パラメータセット候補選択部１６０と、最適パラメータセット選択部１７０とを備える。これらの機能部は、例えば、ＣＰＵ１００Ａが管理プログラム格納部１１０などに格納されたプログラムを実行することにより実現される。また、これらの機能部は、ＬＳＩ（Large Scale Integration）やＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field-Programmable Gate Array）などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアが協働することで実現されてもよい。

以下、各機能構成について概説する。なお、画像認識パラメータ設定装置１００により実行される処理の内容の詳細に関しては、各機能構成の概説の後に、フローチャートを用いて説明する。

マスター管理部１４０は、管理プログラム格納部１１０に格納されたプログラムによって機能し、部分画像領域設定部１５０、最適パラメータセット候補選択部１６０、および最適パラメータセット選択部１７０を適宜、呼び出すことで、以下に説明する処理を実行させる。

部分画像領域設定部１５０は、原画像格納部１１２に格納された原画像に対し、部分画像領域設定データ格納部１１４に格納された設定項目に従い、部分画像領域の設定（切り出し）を行う。部分画像領域設定部１５０は、例えば、後述する正解データの範囲に基づいて設定される当初部分画像領域に対して、後述する拡張率を反映させて拡張を行った領域を部分画像領域とする。部分画像領域設定部１５０により設定された（或いは切り出された）部分画像の情報は、部分画像格納部１１６に格納される。

図４は、原画像格納部１１２に格納されるデータの一例を示す図である。図示するように、原画像格納部１１２には、例えば、原画像の識別情報である原画像ＩＤに対し、画像情報（例えば各画素に輝度や色彩情報が付与された情報、ベクトル画像情報その他の情報）、および正解データが対応付けられたデータが格納される。正解データとは、原画像から検出されることが期待される検出対象物の存在する領域を示すデータである。正解データは、検出対象物が存在すると判定されるべき領域に外側から接する矩形領域の左上と右下の座標で表される。

図５は、部分画像領域設定データ格納部１１４に格納されるデータの一例を示す図である。部分画像領域設定データ格納部１１４には、例えば、部分画像領域拡張率などのデータが格納される。部分画像領域拡張率は、前述した当初部分画像領域に対して拡張処理を行う際に使用される値である。部分画像領域設定データ格納部１１４に格納されるデータは、入出力装置１００Ｅに対する操作者の操作によって変更可能である。部分画像領域拡張率の意義については後述する。なお、本実施形態における拡張率は、矩形の各辺をそれぞれ拡張する率であってもよいし、面積を拡張する率であってもよい。

図６は、部分画像格納部１１６に格納されるデータの一例を示す図である。部分画像格納部１１６には、例えば、部分画像の識別情報である部分画像ＩＤに対し、画像情報（前述）、その部分画像が切り出された原画像に対応して原画像格納部１１２に格納された正解データ、およびその部分画像が切り出された原画像の原画像ＩＤが対応付けられたデータが格納される。

最適パラメータセット候補選択部１６０は、部分画像格納部１１６に格納された部分画像に対し、最適パラメータセット選択設定格納部１１８に格納されたデータに従い、部品定義データ格納部１２０、部品処理順序格納部１２２、および部品ごと実行プログラム格納部１２４に格納されたデータ（プログラム）に基づく画像認識処理を、パラメータセットを変更しながら行う。そして、最適パラメータセット候補選択部１６０は、画像認識処理の結果と正解データとを比較することでパラメータセットを評価し、評価が良好なパラメータセットを最適パラメータセット候補として選択する。パラメータセットとは、部品にそれぞれ与えられるパラメータの集合である。最適パラメータセット候補とは、原画像から検出対象物を検出するのに最も適していると考えられるパラメータセット（最適パラメータセット）の候補である。最適パラメータセット候補選択部１６０により選択された最適パラメータセット候補は、最適パラメータセット候補格納部１２６に格納される。

図７は、最適パラメータセット選択設定格納部１１８に格納されるデータの一例を示す図である。最適パラメータセット選択設定格納部１１８には、例えば、全パラメータセットの数のうち、最適パラメータセット候補として選択するパラメータセットの割合を示す候補数比率、各パラメータの探索範囲（および探索の刻み幅）を示す値域などのデータが格納されている。

図８は、部品定義データ格納部１２０に格納されるデータの一例を示す図である。部品定義データ格納部１２０には、例えば、部品の識別情報である部品ＩＤに対し、必要拡張率、処理内容、設定可能パラメータなどが対応付けられたデータが格納される。必要拡張率とは、前述した当初部分画像領域に対して拡張処理を行う際に使用される値である。なお、必要拡張率の項目が「全体処理要」となっている部品は、部分画像領域に対する処理が不可（全体画像に対する処理が必須）の部品である。

図９は、部品処理順序格納部１２２に格納されるデータの一例を示す図である。部品処理順序格納部１２２には、例えば、画像認識処理において実行される順序（手順）を示す手順ＩＤに対し、部品ＩＤが対応付けられたデータが格納される。

部品ごと実行プログラム格納部１２４には、図８の処理内容に示す各種処理を実行するためのプログラムが格納される。

図１０は、最適パラメータセット候補格納部１２６に格納されるデータの一例を示す図である。最適パラメータセット候補格納部１２６には、例えば、評価が良好な複数のパラメータセットに対して、評価の結果を数値化したスコアが対応付けられたデータが格納される。

最適パラメータセット選択部１７０は、原画像格納部に格納された原画像に対し、最適パラメータセット候補格納部１２６に格納されたパラメータセットを順次選択しながら、部品定義データ格納部１２０、部品処理順序格納部１２２、および部品ごと実行プログラム格納部１２４に格納されたデータ（プログラム）に基づく画像認識処理を行う。そして、最適パラメータセット選択部１７０は、画像認識処理の結果と正解データとを比較することでパラメータセットを評価し、評価が良好なパラメータセットを最適パラメータセットとして選択する。最適パラメータセット選択部１７０により選択された最適パラメータセットは、最適パラメータセット格納部１２８に格納される。

［処理フロー］
以下、各機能部による処理の内容について、フローチャートを用いて説明する。図１１は、画像認識パラメータ設定装置１００により実行される全体処理の流れの一例を示すフローチャートである。

まず、マスター管理部１４０は、部分画像領域設定部１５０に、部分画像領域設定処理を実行させる（ステップＳ１００）。この部分画像領域設定処理の詳細については図１２を用いて説明する。

次に、マスター管理部１４０は、最適パラメータセット候補選択部１６０に、最適パラメータセット候補選択処理を実行させる（ステップＳ２００）。この最適パラメータセット候補選択処理の詳細については図１５を用いて説明する。

次に、マスター管理部１４０は、最適パラメータセット選択部１７０に、最適パラメータセット選択処理を実行させる（ステップＳ３００）。この最適パラメータセット選択処理の詳細については図１６を用いて説明する。

図１２は、部分画像領域設定部１５０により実行される部分画像領域設定処理の流れの一例を示すフローチャートである。まず、部分画像領域設定部１５０は、部品定義データ格納部１２０の「部分画像領域拡張率」の項目を参照し（ステップＳ１０１）、「全体処理要」となっている部品が存在するか否かを判定する（ステップＳ１０３）。「全体処理要」となっている部品が存在する場合、部分画像領域設定部１５０は、本フローチャートの処理をエラー終了する。この場合、画像認識パラメータ設定装置１００は、原画像に対して、最適パラメータセット選択設定格納部１１８に規定される値域で網羅的にパラメータセットを探索し、最適パラメータセットを求めてよい。

「全体処理要」となっている部品が存在しない場合、部分画像領域設定部１５０は、部分画像領域設定データ格納部１１４に格納された値を参照し（ステップＳ１０５）、ステップＳ１０１で参照した「部分画像領域拡張率」と、ステップＳ１０５で参照した値との中で最も大きい値を、拡張率として採用する（ステップＳ１０７）。図５および図８の例では、部分画像領域設定データ格納部１１４に格納された値が最も大きいため、［１．２５］が拡張率として採用される。

次に、部分画像領域設定部１５０は、原画像格納部１１２から原画像を一つ読み込み（ステップＳ１０９）、正解データの範囲から当初部分画像領域を設定する（ステップＳ１１１）。そして、部分画像領域設定部１５０は、当初部分画像領域をステップＳ１０７で採用した拡張率で拡張した部分画像領域を設定可能であるか否かを判定する（ステップＳ１１３）。詳しくは、後述する。部分画像領域を設定可能である場合、部分画像領域設定部１５０は、部分画像領域を部分画像格納部１１６に格納する（ステップＳ１１５）。

次に、部分画像領域設定部１５０は、全ての原画像を選択済であるか否かを判定する（ステップＳ１１７）。全ての原画像を選択済でない場合、部分画像領域設定部１５０は、ステップＳ１０９に戻り、次の原画像を一つ読み込む。一方、全ての原画像を選択済である場合、部分画像領域設定部１５０は、部分画像格納部１１６にデータがあるか否かを判定する（ステップＳ１１９）。部分画像領域設定部１５０は、部分画像格納部１１６にデータがある場合、部分画像領域設定処理を正常終了し、部分画像格納部１１６にデータがない場合、部分画像領域設定処理をエラー終了する。

図１３は、部分画像領域設定部１５０により実行される処理を模式的に示す図である。部分画像領域設定部１５０は、複数の原画像のそれぞれに対し、対応する正解データの範囲から当初部分画像領域を設定し、これを拡張して部分画像領域を設定する。本図の例では、検出対象物は、原画像に複数映されているクッキーの中で、一つだけ色の濃いクッキーである。

ここで、当初部分画像領域を拡張して部分画像領域を設定する意義について説明する。例えば、部品には、着目画素の周辺画素に対する処理を含むオープニング処理など、処理結果として出力する画像のサイズよりも、入力画像に必要とされるサイズが広い処理が含まれている。この場合、正解データの範囲についてのみ処理を行えば十分なのではなく、正解データの範囲よりも若干広い範囲に対して画像認識処理を行うことが好ましい。

また、当初部分画像領域を拡張して部分画像領域を設定することにより、部分画像と原画像とで最適パラメータセットの傾向が乖離するのを防ぐことができる。例えば、部分画像の大部分を検出対象物が占めるような場合、画像認識処理において比較的重要な検出対象物と背景との境界部分を、十分に部分画像に含めることができない場合がある。本実施形態では、拡張によって、このような不都合が生じるのを抑制することができる。

このように、当初部分画像領域を拡張して部分画像領域を設定することによって、画像認識処理の精度を高く維持することができる。なお、部分画像領域設定データ格納部に格納された拡張率は、部品の種類を問わず、背景の認識などを考慮すると最低限これ位の拡張は行った方がよいという値である。一方、部品定義データ格納部１２０に格納された「部分画像領域拡張率」は、部品の種類ごとに現実に必要とされる拡張率である。このように二種類の拡張率を設定しておくことで、画像認識処理の精度を更に高く維持することができる。

図１４は、図１２のステップＳ１１３において、部分画像領域を設定可能でないと判定される場面の一例を示す図である。図示するように、正解データの範囲に基づく当初部分画像領域が原画像の端部に位置する場合、これを拡張すると原画像の範囲をはみ出してしまう場合がある。この場合、原画像の範囲をはみ出した部分について画像認識処理を行うのは適切でないため、部分画像領域設定部１５０は、この原画像について部分画像領域を設定しない。

図１５は、最適パラメータセット候補選択部１６０により実行される最適パラメータセット候補選択処理の流れの一例を示すフローチャートである。まず、最適パラメータセット候補選択部１６０は、最適パラメータセット選択設定格納部１１８に格納されたデータに従い、探索するパラメータセットを生成する（ステップＳ２０１）。

次に、最適パラメータセット候補選択部１６０は、ステップＳ２０１において生成したパラメータセットから、パラメータセットを一つ選択する（ステップＳ２０３）。次に、最適パラメータセット候補選択部１６０は、選択したパラメータセットについて、スコア代表値をゼロにする（ステップＳ２０５）。

次に、最適パラメータセット候補選択部１６０は、部分画像格納部１１６に格納された部分画像から、部分画像を一つ選択する（ステップＳ２０７）。そして、最適パラメータセット候補選択部１６０は、ステップＳ２０５で選択したパラメータセットで、ステップＳ２０３で選択した部分画像に対して画像認識処理を行い（ステップＳ２０９）、認識結果と正解データとの一致度合に基づいてスコアを算出する（ステップＳ２１１）。このスコアは、例えば、認識結果である矩形領域と、正解データの矩形領域との一致度合が高ければ値が大きくなるものである。スコアの算出手法に関しては、上記の傾向を有する限り、如何なる手法を用いてもよい。簡易な例では、例えば、二つの矩形領域のそれぞれにおける相手側との重複率を加算または乗算してスコアを求めてよい。

次に、最適パラメータセット候補選択部１６０は、ステップＳ２１１で算出したスコアがスコア代表値を超えるか否かを判定する（ステップＳ２１３）。スコアがスコア代表値を超える場合、最適パラメータセット候補選択部１６０は、スコアでスコア代表値を更新する（置き換える）（ステップＳ２１５）。

次に、最適パラメータセット候補選択部１６０は、ステップＳ２０７において全ての部分画像を選択したか否かを判定する（ステップＳ２１７）。全ての部分画像を選択していない場合、ステップＳ２０７に戻り、次の部分画像を一つ選択する。

全ての部分画像を選択した場合、最適パラメータセット候補選択部１６０は、スコア代表値をパラメータセットに対応付けてＲＡＭ１００Ｂなどに保存する（ステップＳ２１９）。そして、最適パラメータセット候補選択部１６０は、ステップＳ２０３において全てのパラメータセットを選択したか否かを判定する（ステップＳ２２１）。全てのパラメータセットを選択していない場合、ステップＳ２０３に戻り、次のパラメータセットを一つ選択する。

全てのパラメータセットを選択した場合、最適パラメータセット候補選択部１６０は、スコア代表値の高い（良好な評価を得た）パラメータセットから順に所定数のパラメータセットを選択し、最適パラメータセット候補格納部１２６に格納する（ステップＳ２２３）。所定数とは、例えば、探索するパラメータセットの数に、部分画像格納部１１６に格納された候補数比率を乗算した数である。これによって、最適パラメータセット候補選択処理が終了する。

図１６は、最適パラメータセット選択部１７０により実行される最適パラメータセット選択処理の流れの一例を示すフローチャートである。まず、最適パラメータセット選択部１７０は、最適パラメータセット候補格納部１２６に格納された最適パラメータセット候補の中から、最適パラメータセット候補を一つ選択する（ステップＳ３０１）。

次に、最適パラメータセット選択部１７０は、ステップＳ３０１で選択した最適パラメータセット候補について、スコア代表値をゼロにする（ステップＳ３０３）。

次に、最適パラメータセット選択部１７０は、原画像格納部１１２に格納された原画像から、原画像を一つ選択する（ステップＳ３０５）。そして、最適パラメータセット選択部１７０は、ステップＳ３０１で選択した最適パラメータセット候補で、ステップＳ３０５で選択した原画像に対して画像認識処理を行い（ステップＳ３０７）、認識結果と正解データとの一致度合に基づいてスコアを算出する（ステップＳ３０９）。スコアについては、前述した通りである。なお、部分画像に対する画像認識処理と、原画像に対する画像認識処理とでスコアの算出手法を異ならせてもよい。その場合、評価の傾向等が大きく相違しない程度に異ならせることが望ましい。

次に、最適パラメータセット選択部１７０は、ステップＳ３０９で算出したスコアがスコア代表値を超えるか否かを判定する（ステップＳ３１１）。スコアがスコア代表値を超える場合、最適パラメータセット選択部１７０は、スコアでスコア代表値を更新する（置き換える）（ステップＳ３１３）。

次に、最適パラメータセット選択部１７０は、ステップＳ３０５において全ての原画像を選択したか否かを判定する（ステップＳ３１５）。全ての原画像を選択していない場合、ステップＳ３０５に戻り、次の原画像を一つ選択する。

全ての原画像を選択した場合、最適パラメータセット選択部１７０は、スコア代表値を最適パラメータセット候補に対応付けてＲＡＭ１００Ｂなどに保存する（ステップＳ３１７）。そして、最適パラメータセット選択部１７０は、ステップＳ３０１において全ての最適パラメータセット候補を選択したか否かを判定する（ステップＳ３１９）。全ての最適パラメータセット候補を選択していない場合、ステップＳ３０１に戻り、次の最適パラメータセット候補を一つ選択する。

全ての最適パラメータセット候補を選択した場合、最適パラメータセット選択部１７０は、スコア代表値の高い（良好な評価を得た）最適パラメータセット候補を選択し、最適パラメータセットとする（ステップＳ３２１）。これによって、最適パラメータセット選択処理が終了する。なお、ステップＳ３２１において、最適パラメータセット選択部１７０は、スコア代表値の高い複数の（但し最適パラメータセット候補の数よりは少ない）最適パラメータセット候補を選択し、最適パラメータセットとしてもよい。この場合、利用者がいずれかの最適パラメータセットを選択して画像認識処理を行うことができる。

係る処理によって、適度な処理負荷で好適なパラメータセットを設定することができる。画像認識処理の部品に設定するパラメータは多岐に亘り、仮にパラメータセットを最初から原画像に対して全範囲で探索するものとすると、多くの処理時間が必要となってしまう。パラメータセットの探索処理に必要な処理時間は、例えば以下の式で表される。
（処理時間）＝（１回の画像認識処理に必要な時間）×（パラメータセットの数）

パラメータセットの数は、各パラメータの採り得る値の数を乗算した数となり、すなわち繰り返し処理を行う回数となる。そして、それぞれの回において、長時間の処理が必要な原画像に対する処理を行うものとすると、全体としての処理時間が長くなってしまう。

これに対し、本実施形態の画像認識パラメータ設定装置１００では、「パラメータセットの数」が多い「最適パラメータセット候補選択処理」の段階では、部分画像に対する処理を行うことで、上記の「１回の画像認識処理に必要な時間」を短縮し、「パラメータセットの数」を絞った後に原画像に対する処理を行うことで、画像認識処理の精度が低下するのを抑制しつつ、処理時間を短縮することができる。すなわち、適度な処理負荷で好適なパラメータセットを設定することができる。

図１５および図１６のフローチャートでは、あるパラメータセット（最適パラメータセット候補を含む）について、スコア代表値によって評価を行う、すなわち複数の部分画像または原画像のうちいずれかに対して画像認識処理を行った結果の評価の最大値に基づいて、そのパラメータセットを評価するものとしたが、これに限らず、例えば複数の部分画像または原画像に対して画像認識処理を行った結果の評価の平均値などを、評価の指標として採用してもよい。

図１７は、最適パラメータセットを用いて画像認識処理が行われる様子を示す図である。この画像認識処理は、「最適パラメータセット候補選択処理」として行われるものであってもよいし、画像認識パラメータ設定装置１００の処理結果を受けて画像認識装置２００が行うものであってもよい。

図１７に示すように、画像認識処理は、例えば、グレースケール処理→区間で２値化する処理→オープニング処理→外接矩形を求める処理の順に行われる。２値化する処理は、例えば、一つだけ色が濃いクッキーの部分と、それ以外の部分とに分類する処理である。オープニング処理によって、ノイズと扱うべき細かい２値化された画素が除外される。これによって、一つだけ色が濃いクッキーの部分を抽出することができ、外接矩形を精度よく求めることができる。

以上説明した少なくともひとつの実施形態によれば、入力画像（原画像）の一部である部分画像に対して、パラメータセットを変えながら検出対象物の位置を特定する画像認識処理を複数回実行し、複数回特定した結果をそれぞれ評価する第１の評価部（最適パラメータセット候補選択部１６０）と、入力画像における部分画像よりも広い範囲の画像に対し、第１の評価部により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して画像認識処理を複数回実行し、複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する第２の評価部（最適パラメータセット選択部１７０）と、を持つことにより、適度な処理負荷で好適なパラメータを設定することができる。

また、実施形態によれば、当初部分画像領域を拡張して部分画像領域を設定することによって、画像認識処理の精度を高く維持することができる。

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

１００…画像認識パラメータ設定装置、１１０…管理プログラム格納部、１１２…原画像格納部、１１４…部分画像領域設定データ格納部、１１６…部分画像格納部、１１８…最適パラメータセット選択設定格納部、１２０…部品定義データ格納部、１２２…部品処理順序格納部、１２４…部品ごと実行プログラム格納部、１２６…最適パラメータセット候補格納部、１２８…最適パラメータセット格納部、１４０…マスター管理部、１５０…部分画像領域設定部、１６０…最適パラメータセット候補選択部、１７０…最適パラメータセット選択部

Claims

入力画像の一部である部分画像に対して、パラメータセットを変えながら、検出対象物の位置を特定する画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価する第１の評価部と、
前記入力画像における前記部分画像よりも広い範囲の画像に対し、前記第１の評価部により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して、前記画像認識処理を複数回実行し、前記複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する第２の評価部と、
を備える画像認識パラメータ設定装置。
前記画像認識処理は、複数の処理を含み、
前記第１の評価部は、前記複数の処理に、前記入力画像の全体に対して行う必要のある処理が含まれる場合、当該入力画像に対して前記評価を行わない、
請求項１記載の画像認識パラメータ設定装置。
前記入力画像と共に、前記検出対象物の位置を示す正解データの範囲を示す情報を取得し、前記正解データの範囲に基づいて前記部分画像の領域を生成する部分画像領域設定部を更に備える、
請求項１または２記載の画像認識パラメータ設定装置。
前記部分画像領域設定部は、前記正解データの範囲に基づく当初部分画像領域に対して、所定の拡張率で拡張した領域を、前記部分画像の領域とする、
請求項３記載の画像認識パラメータ設定装置。
前記画像認識処理は、処理結果として出力する画像のサイズよりも、入力画像に必要とされるサイズが広い処理を含む、
請求項３または４記載の画像認識パラメータ設定装置。
入力画像の一部である部分画像に対して、パラメータセットを変えながら、検出対象物の位置を特定する画像認識処理を複数回実行し、
前記複数回特定した結果をそれぞれ評価する第１の評価を行い、
前記入力画像における前記部分画像よりも広い範囲の画像に対し、前記第１の評価により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して、前記画像認識処理を複数回実行し、
前記複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する第２の評価を行う、
画像認識パラメータ設定方法。
コンピュータに、
入力画像の一部である部分画像に対して、パラメータセットを変えながら、検出対象物の位置を特定する画像認識処理を複数回実行させ、
前記複数回特定した結果をそれぞれ評価する第１の評価を行わせ、
前記入力画像における前記部分画像よりも広い範囲の画像に対し、前記第１の評価により良好な評価が得られた複数の結果にそれぞれ対応する複数のパラメータセットを順次選択して、前記画像認識処理を複数回実行させ、
前記複数回特定した結果をそれぞれ評価して良好な評価が得られた一以上のパラメータセットを選択する第２の評価を行わせる、
画像認識パラメータ設定プログラム。