JP6208018B2 - Image recognition algorithm combination selection device - Google Patents

Image recognition algorithm combination selection device Download PDF

Info

Publication number
JP6208018B2
JP6208018B2 JP2014001470A JP2014001470A JP6208018B2 JP 6208018 B2 JP6208018 B2 JP 6208018B2 JP 2014001470 A JP2014001470 A JP 2014001470A JP 2014001470 A JP2014001470 A JP 2014001470A JP 6208018 B2 JP6208018 B2 JP 6208018B2
Authority
JP
Japan
Prior art keywords
algorithm
information
image
list
learning data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014001470A
Other languages
Japanese (ja)
Other versions
JP2015130093A (en
Inventor
義紀 千秋
義紀 千秋
池田 信之
信之 池田
圭介 橋本
圭介 橋本
三宅 達也
達也 三宅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2014001470A priority Critical patent/JP6208018B2/en
Publication of JP2015130093A publication Critical patent/JP2015130093A/en
Application granted granted Critical
Publication of JP6208018B2 publication Critical patent/JP6208018B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stored Programmes (AREA)
  • Image Analysis (AREA)

Description

本発明の実施形態は、画像認識アルゴリズム組合せ選択装置に関する。   Embodiments described herein relate generally to an image recognition algorithm combination selection apparatus.

車載カメラにおける歩行者検知や、顔認識によるセキュリティなど、様々な分野において画像認識技術が使用されることが増えている。   Image recognition technology is increasingly used in various fields such as pedestrian detection in in-vehicle cameras and security by face recognition.

画像認識用のアルゴリズムは認識対象に依存し、識別を行いたい対象によって、有効なアルゴリズムが異なる。例えば、ある種のアルゴリズムは、歩行者の識別は可能でも果物の識別には適切とはいえない。さらに、代替アルゴリズムも多数存在し、適切な知識がなくては選択が困難である。そのため、従来は、適切なアルゴリズムを有識者の知見により選択している。   The algorithm for image recognition depends on the recognition target, and the effective algorithm differs depending on the target to be identified. For example, certain algorithms may be able to identify pedestrians but are not suitable for identifying fruits. In addition, there are a number of alternative algorithms that are difficult to select without proper knowledge. Therefore, conventionally, an appropriate algorithm is selected based on the knowledge of an expert.

しかしながら、画像認識に関連するアプリケーションのニーズの高まりに呼応して、それらアプリケーションの開発を加速したい、画像認識に詳しくなくても対象物に応じた最適なアルゴリズムを決定可能にしたい、との要請が高まっている。   However, in response to the growing needs of applications related to image recognition, there is a demand for accelerating the development of such applications and making it possible to determine the optimal algorithm according to the object even if not familiar with image recognition. It is growing.

画像認識用のアルゴリズムの選択を機械的に行おうとする場合、画像認識アルゴリズムの多様性、換言すれば、評価対象となるアルゴリズムやそのパラメータなどの組合せ数が膨大であるという現実がある。そのため、評価のための辞書作成に時間がかかり、組合せ数の多い評価に極めて長時間要するという、問題があった。   When attempting to select an algorithm for image recognition mechanically, there is a reality that the variety of image recognition algorithms, in other words, the number of combinations of algorithms to be evaluated and their parameters is enormous. Therefore, it takes time to create a dictionary for evaluation, and there is a problem that it takes a very long time to evaluate a large number of combinations.

特開平11−259282号公報JP 11-259282 A 特開平10−149280号公報JP-A-10-149280 特開2000−56958号公報JP 2000-56958 A

本発明が解決しようとする課題は、有識者でなくとも、認識対象に応じて画像認識アルゴリズムの組合せ構成を選択可能な画像認識アルゴリズム組合せ選択装置を提供することである。   The problem to be solved by the present invention is to provide an image recognition algorithm combination selection device capable of selecting a combination configuration of image recognition algorithms according to a recognition target even if it is not an expert.

実施形態の画像認識アルゴリズム組合せ選択装置は、画像認識用のアルゴリズム部品の組合せを選択する装置であって、画像から識別しようとする対象を切り出した画像データと識別単位から成る学習データ、および前記画像データの画像フォーマット情報を入力し、前記学習データ、前記画像データおよび前記画像フォーマット情報の組みの全てを学習データリストとし、この学習データリストから一部を抽出し、画像認識の性能評価に使用される辞書を作成するための抽出済学習データリストを作成する学習データリスト決定部と、前記アルゴリズム部品と前記アルゴリズム部品が実行できるための情報を表す開始条件を含むアルゴリズム情報と、接続が可能な前記アルゴリズム部品の組合せを表す依存関係情報と、前記アルゴリズム部品で使用されるパラメータの全てを表すパラメータセット情報とを利用してアルゴリズム候補リストを作成する画像認識アルゴリズム決定部と、前記アルゴリズム候補リストに対して、デフォルト値の前記パラメータセット情報および前記抽出済学習データリストを使用して辞書を作成する辞書作成部と、前記抽出済学習データリストに対して、前記パラメータセット情報および前記辞書を使って前記アルゴリズム候補リストを性能評価する性能評価部とを備え、前記画像認識アルゴリズム決定部は、前記性能評価部の評価結果が、最も良い前記アルゴリズム候補リストを最適なアルゴリズム候補リストとして、前記パラメータセット情報のパラメータを設定し、前記辞書作成部は、前記最適なアルゴリズム候補リストに対応して、前記辞書を再作成し、前記性能評価部は、再作成された前記辞書を使って前記最適なアルゴリズム候補リストの性能を再評価し、前記画像認識アルゴリズム決定部は、前記再評価結果に基づいて最適なパラメータセットを決定し、前記辞書作成部は、全ての前記学習データを使用して、最終的に前記辞書を再作成する。   An image recognition algorithm combination selection apparatus according to an embodiment is an apparatus for selecting a combination of algorithm parts for image recognition, and includes learning data including image data obtained by cutting out an object to be identified from an image and an identification unit, and the image The image format information of the data is input, the learning data, the image data, and the set of the image format information are all set as a learning data list, and a part is extracted from the learning data list and used for image recognition performance evaluation. A learning data list determination unit for creating an extracted learning data list for creating a dictionary, algorithm information including a start condition representing the algorithm component and information for execution of the algorithm component, and the connection possible Dependency information representing a combination of algorithm parts and the algorithm part An image recognition algorithm determination unit that creates an algorithm candidate list using parameter set information representing all the parameters used in the above, and the parameter set information of default values and the extracted learning for the algorithm candidate list A dictionary creation unit that creates a dictionary using a data list; and a performance evaluation unit that evaluates the algorithm candidate list using the parameter set information and the dictionary for the extracted learning data list, The image recognition algorithm determination unit sets the parameters of the parameter set information with the algorithm candidate list having the best evaluation result of the performance evaluation unit as the optimal algorithm candidate list, and the dictionary creation unit The dictionary corresponding to the algorithm candidate list The performance evaluation unit re-evaluates the performance of the optimal algorithm candidate list using the re-created dictionary, and the image recognition algorithm determination unit determines the optimal parameter based on the re-evaluation result. The set is determined, and the dictionary creation unit finally recreates the dictionary using all the learning data.

本発明の実施形態に係る画像認識アルゴリズム組合せ選択装置の概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the image recognition algorithm combination selection apparatus which concerns on embodiment of this invention. アルゴリズム部品格納部に格納されるアルゴリズム部品の情報の一例を示す図である。It is a figure which shows an example of the information of the algorithm component stored in an algorithm component storage part. 依存関係の情報の一例を示す図である。It is a figure which shows an example of the information of dependence. パラメータの情報の一例を示す図である。It is a figure which shows an example of the information of a parameter. 学習データの情報の一例を示す図である。It is a figure which shows an example of the information of learning data. アルゴリズム候補リストの一例を示す図である。It is a figure which shows an example of an algorithm candidate list. アルゴリズム性能情報リストの一例を示す図である。It is a figure which shows an example of an algorithm performance information list. アルゴリズム組合せの決定までの処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process until determination of an algorithm combination. 開始可能アルゴリズム情報リストの一例を示す図である。It is a figure which shows an example of a startable algorithm information list. 処理1が再帰的に呼び出されるたびに生成されるデータの一例を示す図である。It is a figure which shows an example of the data produced | generated every time process 1 is called recursively. 処理1における作業を説明する図で、図10の点線内における下段データの算出を説明する図である。It is a figure explaining the operation | work in the process 1, and is a figure explaining calculation of the lower stage data in the dotted line of FIG. 抽出後の学習データリストの一例を示す図である。It is a figure which shows an example of the learning data list after extraction. 評価結果の算出の一例を示す図である。It is a figure which shows an example of calculation of an evaluation result. ステップS811までの処理で得られた最適なアルゴリズム候補リストの一例を示す図である。It is a figure which shows an example of the optimal algorithm candidate list | wrist obtained by the process to step S811. パラメータ組合せの決定までの処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process until determination of a parameter combination. 処理3が再帰的に呼び出されるたびに生成されるデータの一例を示す図である。It is a figure which shows an example of the data produced | generated every time process 3 is called recursively. 処理3における作業を説明する図である。It is a figure explaining the operation | work in the process 3. FIG. ステップS1505までの処理で得られた最適なアルゴリズム候補リストの一例を示す図である。It is a figure which shows an example of the optimal algorithm candidate list | wrist obtained by the process to step S1505. アルゴリズム候補リストと辞書の出力までの処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process until an algorithm candidate list | wrist and a dictionary output. 全ての学習データを使用して作成される辞書を説明する図である。It is a figure explaining the dictionary created using all the learning data.

以下、本発明の一実施の形態について、図面を参照して説明する。尚、各図において同一箇所については同一の符号を付すとともに、重複した説明は省略する。   Hereinafter, an embodiment of the present invention will be described with reference to the drawings. In the drawings, the same portions are denoted by the same reference numerals, and redundant description is omitted.

まず、本実施形態で用いる主要な用語について説明する。   First, main terms used in the present embodiment will be described.

「特徴量」とは、画像の性質を表す数値のベクトルデータをいう。   The “feature amount” refers to numeric vector data representing the properties of an image.

「事前処理」とは、特徴抽出や他の事前処理を行う際に必要となる、画像変換のアルゴリズムをいう。例えば、エッジの抽出や色の変換などである。   “Pre-processing” refers to an image conversion algorithm that is required when performing feature extraction or other pre-processing. For example, edge extraction or color conversion.

「制御処理」とは、画像認識処理のフローを制御するアルゴリズムをいう。   “Control processing” refers to an algorithm for controlling the flow of image recognition processing.

「特徴抽出」とは、画像を特徴量へ変換するアルゴリズムをいう。   “Feature extraction” refers to an algorithm for converting an image into a feature value.

「学習」とは、特徴量を元に、その特徴量が何を指しているかを判定するため辞書の機械学習を行うアルゴリズムをいう。   “Learning” refers to an algorithm that performs machine learning of a dictionary to determine what the feature value indicates based on the feature value.

「識別」とは、学習の結果を用いた識別を行うアルゴリズムをいう。学習アルゴリズムに1対1で存在する。   “Identification” refers to an algorithm for performing identification using learning results. There exists one-to-one in the learning algorithm.

「画像認識アルゴリズム」とは、上記した事前処理、制御処理、特徴抽出、学習、識別の各アルゴリズムを含む。   The “image recognition algorithm” includes the above-described preprocessing, control processing, feature extraction, learning, and identification algorithms.

「アルゴリズム部品」とは、上記した事前処理、制御処理、特徴抽出、学習、識別に属する具体的なアルゴリズムの一つ一つをいう。尚、事前処理、制御処理、特徴抽出の各アルゴリズムには、それぞれ複数のパラメータが付随する。   The “algorithm component” refers to each specific algorithm belonging to the above-described preprocessing, control processing, feature extraction, learning, and identification. Note that each of the pre-processing, control processing, and feature extraction algorithms is accompanied by a plurality of parameters.

「辞書」とは、機械学習によって得られる、画像を識別する際に使用するデータをいう。アルゴリズム、パラメータ、認識対象の組合せに付き一つ作られる。   A “dictionary” refers to data used by machine learning to identify images. One is created for each combination of algorithm, parameter, and recognition target.

「学習データ」とは、辞書を作成する際の機械学習に使用する「画像データ+カテゴリID(識別したい対象の単位)」の組合せをいう。   “Learning data” refers to a combination of “image data + category ID (target unit to be identified)” used for machine learning when creating a dictionary.

「画像データ」とは、識別したい対象が画像から切り出されたものをいう。   “Image data” refers to data obtained by cutting out an object to be identified from an image.

本実施形態においては、画像認識アルゴリズムの組合せをデフォルト値のパラメータを使用して決定した後に、決定されたアルゴリズムに対して、パラメータの組合せの決定を行うことにより、画像認識する際に使用する辞書の作成回数を少なくするとともに、辞書作成に使用する学習データを間引くことにより、画像認識性能の評価に要する時間の最小化を図るものである。   In this embodiment, after determining a combination of image recognition algorithms using parameters of default values, a dictionary used for image recognition is determined by determining a combination of parameters for the determined algorithm. The number of times of creation is reduced, and the learning data used for creating the dictionary is thinned out, thereby minimizing the time required for evaluating the image recognition performance.

図1は、本発明の実施形態に係る画像認識アルゴリズム組合せ選択装置の概略構成を示すブロック図である。この装置は汎用のコンピュータ(例えばパーソナルコンピュータ(PC)等)と、同コンピュータ上で動作するソフトウェアとを用いて実現される。コンピュータとしては、CAD(Computer Aided Design)やCAE(Computer Aided Engineering)に好適なエンジニアリングワークステーション(EWS)等も含む。本実施形態はこのようなコンピュータに、最適なアルゴリズム候補の決定、最適なパラメータセットの決定、および辞書の作成を実行するプログラムとして実施することもできる。   FIG. 1 is a block diagram showing a schematic configuration of an image recognition algorithm combination selection apparatus according to an embodiment of the present invention. This apparatus is realized using a general-purpose computer (for example, a personal computer (PC) or the like) and software operating on the computer. The computer includes an engineering workstation (EWS) suitable for CAD (Computer Aided Design) and CAE (Computer Aided Engineering). The present embodiment can also be implemented as a program that executes determination of an optimal algorithm candidate, determination of an optimal parameter set, and creation of a dictionary in such a computer.

図1に示すように、本実施形態に係る画像認識アルゴリズム組合せ選択装置100は、主として、入力部10、画像認識アルゴリズム決定部20、学習データリスト決定部30、辞書作成部40、性能評価部50、アルゴリズム部品格納部60、アルゴリズム情報格納部70、学習データ格納部80から構成されている。   As shown in FIG. 1, the image recognition algorithm combination selecting apparatus 100 according to the present embodiment mainly includes an input unit 10, an image recognition algorithm determination unit 20, a learning data list determination unit 30, a dictionary creation unit 40, and a performance evaluation unit 50. , An algorithm component storage unit 60, an algorithm information storage unit 70, and a learning data storage unit 80.

入力部10へは、ユーザによって、学習データおよび画像フォーマット情報が入力される。学習データは、画像から識別しようとする対象を切り出した画像データと識別単位を表すカテゴリIDから成る。画像フォーマット情報は、画像データの色空間フォーマットとピクセルフォーマットから成る。入力した学習データおよび画像フォーマット情報は、学習データ格納部80に格納される。   Learning data and image format information are input to the input unit 10 by the user. The learning data includes image data obtained by cutting out an object to be identified from an image and a category ID representing an identification unit. The image format information includes a color space format and a pixel format of image data. The input learning data and image format information are stored in the learning data storage unit 80.

学習データリスト決定部30は、学習データ格納部80の学習データリスト(後述する)から一部分の画像データを抽出し、評価に使用する辞書を作成するための学習データリストを作成する。学習データリスト決定部30は、詳細は後述するが、画像から識別しようとする対象を切り出した画像データと識別単位から成る学習データ、および画像データの画像フォーマット情報を入力し、学習データ、画像データおよび画像フォーマット情報の組みの全てを学習データリストとし、この学習データリストから一部を抽出し、画像認識の性能評価に使用される辞書を作成するための抽出済学習データリストを作成する。   The learning data list determination unit 30 extracts a part of image data from a learning data list (described later) in the learning data storage unit 80, and creates a learning data list for creating a dictionary used for evaluation. As will be described in detail later, the learning data list determination unit 30 inputs learning data composed of image data obtained by cutting out an object to be identified from an image and an identification unit, and image format information of the image data. All the combinations of the image format information and the learning data list are used as a learning data list, a part is extracted from the learning data list, and an extracted learning data list for creating a dictionary used for image recognition performance evaluation is created.

画像認識アルゴリズム決定部20は、辞書作成部40を起動し、性能評価部50からの評価結果を受け取ることで最適なアルゴリズムの組合せおよび最適なパラメータの組合せを決定する。画像認識アルゴリズム決定部20は、詳細は後述するが、アルゴリズム部品とアルゴリズム部品が実行できるための情報を表す開始条件を含むアルゴリズム情報と、接続が可能なアルゴリズム部品の組合せを表す依存関係情報と、アルゴリズム部品で使用されるパラメータの全てを表すパラメータセット情報とを利用してアルゴリズム候補リストを作成する。そして、再評価結果に基づいて最適なパラメータセットを決定する。   The image recognition algorithm determination unit 20 activates the dictionary creation unit 40 and receives an evaluation result from the performance evaluation unit 50 to determine an optimal algorithm combination and an optimal parameter combination. Although details will be described later, the image recognition algorithm determination unit 20 includes algorithm information including a start condition indicating information for executing the algorithm component and the algorithm component, dependency information indicating a combination of connectable algorithm components, An algorithm candidate list is created using parameter set information representing all parameters used in the algorithm component. Then, an optimal parameter set is determined based on the reevaluation result.

辞書作成部40は、アルゴリズム候補リストに対して、デフォルト値のパラメータセット情報および抽出済学習データリストを使用して辞書を作成する。辞書作成部40は、詳細は後述するが、最適なアルゴリズム候補リストに対応して、辞書を再作成し、さらに、全ての学習データを使用して、最終的に辞書を再作成する。   The dictionary creation unit 40 creates a dictionary for the algorithm candidate list using the default parameter set information and the extracted learning data list. Although the details will be described later, the dictionary creation unit 40 recreates the dictionary corresponding to the optimal algorithm candidate list, and finally recreates the dictionary using all the learning data.

性能評価部50は、抽出済学習データリストに対して、パラメータセット情報および辞書を使ってアルゴリズム候補リストを性能評価する。性能評価部50は、詳細は後述するが、再作成された辞書を使って最適なアルゴリズム候補リストの性能を再評価する。   The performance evaluation unit 50 evaluates the performance of the algorithm candidate list using the parameter set information and the dictionary with respect to the extracted learning data list. Although details will be described later, the performance evaluation unit 50 re-evaluates the performance of the optimal algorithm candidate list using the re-created dictionary.

アルゴリズム部品格納部60には、アルゴリズムの情報の列が格納される。図2は、アルゴリズム部品格納部60に格納されるアルゴリズムの情報の一例を示す図である。図2に示すように、アルゴリズムの情報として、アルゴリズムID、アルゴリズム部品、開始条件を組みとして格納する。アルゴリズム情報の列をアルゴリズム情報リストと呼ぶ。ここで、アルゴリズム部品は、アルゴリズム部品(バイナリ)そのものでもよいし、アルゴリズム部品を取得するための情報でもよい。開始条件は、学習データ格納部80の画像フォーマット情報が何である場合にアルゴリズム部品を実行できるかの情報である。アルゴリズム部品が画像データを入力としない場合は、“不可能”が入る。本実施形態では、入力される画像データの色空間フォーマットとピクセルフォーマットを、画像フォーマット情報としている。さらに、全ての画像データの画像フォーマットが統一されていることを前提としている。   The algorithm component storage unit 60 stores a sequence of algorithm information. FIG. 2 is a diagram illustrating an example of algorithm information stored in the algorithm component storage unit 60. As shown in FIG. 2, an algorithm ID, an algorithm component, and a start condition are stored as a set as algorithm information. The sequence of algorithm information is called an algorithm information list. Here, the algorithm component may be the algorithm component (binary) itself or information for acquiring the algorithm component. The start condition is information indicating what algorithm component can be executed when the image format information in the learning data storage unit 80 is. When the algorithm component does not receive image data, “impossible” is entered. In the present embodiment, the color space format and pixel format of input image data are used as image format information. Furthermore, it is assumed that the image formats of all image data are unified.

図2に示す例では、アルゴリズムID“0”として“YUV変換”、アルゴリズムID“1”として“エッジ抽出”、アルゴリズムID“10”として“CoHOG”、アルゴリズムID“11”として“Haar-Like”、アルゴリズムID“21”として“AdaBoost”、アルゴリズムID“22”として“SVM”などが格納されている。図2に示す例によれば、アルゴリズム部品“YUV変換”は、画像フォーマット情報が“RGB444”である場合に、実行できることを表している。また、アルゴリズム部品“エッジ抽出”は、画像フォーマット情報が“Y”である場合に、実行できることを表している。   In the example shown in FIG. 2, the algorithm ID “0” is “YUV conversion”, the algorithm ID “1” is “edge extraction”, the algorithm ID “10” is “CoHOG”, and the algorithm ID “11” is “Haar-Like”. “AdaBoost” is stored as the algorithm ID “21”, “SVM” is stored as the algorithm ID “22”, and the like. According to the example illustrated in FIG. 2, the algorithm component “YUV conversion” indicates that it can be executed when the image format information is “RGB444”. Further, the algorithm component “edge extraction” indicates that it can be executed when the image format information is “Y”.

アルゴリズム情報格納部70には、依存関係情報およびパラメータセット情報が格納される。ここで、依存関係とは、接続可能なアルゴリズムの組合せであり、ループになるような関係は含まない。図3は、依存関係の情報の一例を示す図である。図3に示す例では、アルゴリズムID“0”が前段のアルゴリズム部品であり、アルゴリズムID“10”が後段のアルゴリズム部品である場合には、接続可能となっている。同様に、アルゴリズムID“1”が前段のアルゴリズム部品であり、アルゴリズムID“10”が後段のアルゴリズム部品である場合にも、接続可能となっている。   The algorithm information storage unit 70 stores dependency relationship information and parameter set information. Here, the dependency relationship is a combination of connectable algorithms and does not include a relationship that forms a loop. FIG. 3 is a diagram illustrating an example of dependency relationship information. In the example shown in FIG. 3, when the algorithm ID “0” is the preceding algorithm part and the algorithm ID “10” is the latter algorithm part, the connection is possible. Similarly, connection is possible even when the algorithm ID “1” is the preceding algorithm part and the algorithm ID “10” is the latter algorithm part.

さらに、アルゴリズム情報格納部70には、アルゴリズム毎に、使用し得るパラメータの情報が格納される。一つのアルゴリズムで使用するパラメータの組合せをパラメータセットとすると、各アルゴリズムは、それぞれ、複数のパラメータセットを持っている。   Further, the algorithm information storage unit 70 stores information on parameters that can be used for each algorithm. If a combination of parameters used in one algorithm is a parameter set, each algorithm has a plurality of parameter sets.

図4は、パラメータの情報の一例を示す図である。図4に示すように、パラメータの情報には、アルゴリズムID、パラメータセットID、パラメータを格納する。   FIG. 4 is a diagram illustrating an example of parameter information. As shown in FIG. 4, the parameter information stores an algorithm ID, a parameter set ID, and a parameter.

図4に示す例では、アルゴリズムID“10”が使用し得る2つのパラメータセットが、パラメータセットID“1”、パラメータセットID“2”として格納されている。さらに、アルゴリズムID“23”が使用し得る2つのパラメータセットが、パラメータセットID“1”、パラメータセットID“2”として格納されている。本実施形態においては、パラメータセットID“1”のものをデフォルト値として使用する。   In the example shown in FIG. 4, two parameter sets that can be used by the algorithm ID “10” are stored as the parameter set ID “1” and the parameter set ID “2”. Further, two parameter sets that can be used by the algorithm ID “23” are stored as a parameter set ID “1” and a parameter set ID “2”. In this embodiment, the parameter set ID “1” is used as a default value.

アルゴリズムID“10”のパラメータセットID“1”の具体的なパラメータとして、“方向量子化数=4”、“領域分割数(x)=1”、“領域分割数(y)=1”が格納され、アルゴリズムID“10”のパラメータセットID“2”の具体的なパラメータとして、“方向量子化数=4”、“領域分割数(x)=2”、“領域分割数(y)=3”が格納されている。   Specific parameters of the parameter set ID “1” of the algorithm ID “10” include “direction quantization number = 4”, “region division number (x) = 1”, and “region division number (y) = 1”. As specific parameters of the parameter set ID “2” stored in the algorithm ID “10”, “direction quantization number = 4”, “region division number (x) = 2”, “region division number (y) = 3 "is stored.

同様に、アルゴリズムID“23”のパラメータセットID“1”の具体的なパラメータとして、“基底数=100”、“正クラス数=20”、“負クラス数=20”、“類似域値=0.2”が格納され、アルゴリズムID“23”のパラメータセットID“2”の具体的なパラメータとして、“基底数=200”、“正クラス数=20”、“負クラス数=20”、“類似域値=0.3”が格納されている。   Similarly, as specific parameters of the parameter set ID “1” of the algorithm ID “23”, “basic number = 100”, “positive class number = 20”, “negative class number = 20”, “similar range value = 0.2 ”is stored, and specific parameters of the parameter set ID“ 2 ”of the algorithm ID“ 23 ”are“ basic number = 200 ”,“ positive class number = 20 ”,“ negative class number = 20 ”, “Similar range value = 0.3” is stored.

学習データ格納部80には、ユーザによって準備される、学習データおよび画像フォーマット情報が格納される。図5は、学習データの情報の一例を示す図である。図5に示すように、学習データの情報として、学習データID、カテゴリID、画像データおよび画像フォーマット情報を格納し、これら全てを学習データリストと呼ぶ。ここで、学習データIDは、カテゴリIDと画像データの組みに対して付与するIDである。カテゴリIDは、識別したい対象ごとに、機械学習や辞書を評価するための識別結果の正解として使用するデータをいう。画像データは、画像から識別したい対象が切り出されたもので、例えばバイナリデータそのものでもよいし、バイナリデータを取得するための情報でもよい。   The learning data storage unit 80 stores learning data and image format information prepared by the user. FIG. 5 is a diagram illustrating an example of learning data information. As shown in FIG. 5, learning data ID, category ID, image data, and image format information are stored as learning data information, all of which are called a learning data list. Here, the learning data ID is an ID assigned to a combination of a category ID and image data. The category ID refers to data used as a correct answer of an identification result for evaluating machine learning or a dictionary for each target to be identified. The image data is obtained by cutting out an object to be identified from an image, and may be binary data itself or information for acquiring binary data, for example.

画像フォーマット情報は、入力される画像データの色空間フォーマットとピクセルフォーマットであり、本実施形態では、1回の組合せ最適化処理を実行する際の全ての画像データの画像フォーマットが統一されている。すなわち、あるアルゴリズムの組合せ最適化処理では、全て“RGB444”のフォーマットの画像データを対象とし、別のアルゴリズムの組合せ最適化処理では、全て“Y”フォーマットの画像データを対象とし、別のアルゴリズムの組合せ最適化処理では、全て“YUV”フォーマットの画像データを対象とする。   The image format information is the color space format and the pixel format of the input image data. In this embodiment, the image formats of all the image data when performing one combination optimization process are unified. That is, the combination optimization processing of a certain algorithm targets all image data in the “RGB444” format, and the combination optimization processing of another algorithm targets all image data in the “Y” format. In the combination optimization process, all image data in the “YUV” format is targeted.

図5に示す例では、人物認識を識別する対象とし、学習データID“1”として、カテゴリID“1”、画像データ“人物画像1”が格納され、学習データID“3107”として、カテゴリID“2”、画像データ“背景画像1”が格納されている。さらに、画像フォーマット情報として“RGB444”が格納されている。   In the example shown in FIG. 5, the category ID “1” and the image data “person image 1” are stored as the learning data ID “1”, and the category ID is set as the learning data ID “3107”. “2” and image data “background image 1” are stored. Furthermore, “RGB444” is stored as image format information.

<アルゴリズム候補リスト>
画像認識アルゴリズムの辞書作成および評価を行う際には、アルゴリズム部品とパラメータセットを組みにして使用する。この組みを「アルゴリズム候補」と呼び、アルゴリズム部品とパラメータセットの列を「アルゴリズム候補リスト」と呼ぶ。アルゴリズム候補およびアルゴリズム候補リストは、画像認識アルゴリズム決定部20で作成される。図6は、アルゴリズム候補リストの一例を示す図である。図6に示す例では、アルゴリズムID“7”とパラメータセットID“1”の組みが、アルゴリズム候補となっている。そして、この組みを含む4つの列でアルゴリズム候補リストとなっている。
<Algorithm candidate list>
When creating and evaluating a dictionary for an image recognition algorithm, an algorithm component and a parameter set are used in combination. This combination is called an “algorithm candidate”, and a sequence of algorithm parts and parameter sets is called an “algorithm candidate list”. The algorithm candidates and the algorithm candidate list are created by the image recognition algorithm determination unit 20. FIG. 6 is a diagram illustrating an example of the algorithm candidate list. In the example shown in FIG. 6, a combination of algorithm ID “7” and parameter set ID “1” is an algorithm candidate. The algorithm candidate list is composed of four columns including this set.

<アルゴリズム性能情報リスト>
アルゴリズムの組合せ構成が最適であるか否かについては、ある指標の下で評価する必要がある。本実施形態では、係る評価結果を例えば、正解率(識別に成功したデータ数/評価に使用した学習データ数)のような数値データで行う。本実施形態では、アルゴリズム候補リストと評価結果の組みをアルゴリズム性能情報と呼ぶ。アルゴリズム性能情報は、画像認識アルゴリズム決定部20にて作成される。図7は、アルゴリズム性能情報リストの一例を示す図である。図7に示す例では、アルゴリズムID“0”、“7”、“10”、“23”とパラメータセットID“1”から成るアルゴリズム候補リストについて、1898/2000との評価結果がアルゴリズム性能情報として、リスト化されている。
<Algorithm performance information list>
It is necessary to evaluate whether or not the algorithm combination configuration is optimal under a certain index. In this embodiment, the evaluation result is performed by numerical data such as a correct answer rate (number of data successfully identified / number of learning data used for evaluation). In the present embodiment, the combination of the algorithm candidate list and the evaluation result is referred to as algorithm performance information. The algorithm performance information is created by the image recognition algorithm determination unit 20. FIG. 7 is a diagram illustrating an example of the algorithm performance information list. In the example shown in FIG. 7, for an algorithm candidate list composed of algorithm IDs “0”, “7”, “10”, “23” and parameter set ID “1”, an evaluation result of 1898/2000 is used as algorithm performance information. Are listed.

以上のように構成された画像認識アルゴリズム組合せ選択装置100における処理の流れについて説明する。本実施形態では、辞書作成回数が少なくなるように、「アルゴリズム組合せの決定」、「パラメータの組合せの決定」の2ステップに分割し、辞書作成回数を(m*n)回のオーダーから(m+n)回のオーダーに削減する。ここで、mはアルゴリズムの組合せの数、nはパラメータの組合せの数を表している。画像を識別できるかどうかはアルゴリズム組合せが最も重要である。そこで、デフォルト値のパラメータを使用してアルゴリズム組合せを決定し、決定されたアルゴリズムに対してパラメータを決定する。   A flow of processing in the image recognition algorithm combination selecting apparatus 100 configured as described above will be described. In this embodiment, the number of times of dictionary creation is divided into two steps of “determination of algorithm combination” and “determination of parameter combination” so that the number of dictionary creation times is reduced from the order of (m * n) times to (m + n). ) Reduce to order times. Here, m represents the number of algorithm combinations, and n represents the number of parameter combinations. The combination of algorithms is the most important whether an image can be identified. Accordingly, algorithm combinations are determined using parameters of default values, and parameters are determined for the determined algorithm.

以下、処理について、アルゴリズム組合せの決定まで、パラメータ組合せの決定まで、アルゴリズム候補リストと辞書の出力までに大別して説明する。   In the following, processing will be broadly described until algorithm combination determination, parameter combination determination, algorithm candidate list and dictionary output.

<アルゴリズム組合せの決定までの処理>
図8は、アルゴリズム組合せの決定までの処理の流れを示すフローチャートである。
<Processing until determination of algorithm combination>
FIG. 8 is a flowchart showing the flow of processing up to the determination of the algorithm combination.

まず、ユーザが全ての学習データを入力する(ステップS801)。   First, the user inputs all learning data (step S801).

次に、ユーザが画像フォーマットを入力する(ステップS802)。   Next, the user inputs an image format (step S802).

次いで、アルゴリズム情報リストから、アルゴリズム情報の開始条件と、入力された画像フォーマット情報が等しいアルゴリズム情報を全てとりだした開始可能アルゴリズム情報リストを作成する(ステップS803)。例えば、図2に示すアルゴリズム部品格納部60に格納されているアルゴリズム情報リストと図5に示す学習データ格納部80に格納されている画像フォーマット情報に基づいて、図9に示す開始可能アルゴリズム情報リストが作成される。   Next, from the algorithm information list, a startable algorithm information list in which all algorithm information having the same start condition of the algorithm information and the input image format information is extracted is created (step S803). For example, based on the algorithm information list stored in the algorithm component storage unit 60 shown in FIG. 2 and the image format information stored in the learning data storage unit 80 shown in FIG. 5, the startable algorithm information list shown in FIG. Is created.

次に、開始可能アルゴリズム情報リストが空であるか否かを判定する(ステップS804)。   Next, it is determined whether or not the startable algorithm information list is empty (step S804).

開始可能アルゴリズム情報リストが空であれば(ステップS804でYes)、画像認識アルゴリズム組合せ選択装置における処理を終了し、開始可能アルゴリズム情報リストが空でなければ(ステップS804でNo)、空のアルゴリズム性能情報リスト(図7参照)を作成する(ステップS805)。   If the startable algorithm information list is empty (Yes in step S804), the process in the image recognition algorithm combination selection device is terminated. If the startable algorithm information list is not empty (No in step S804), empty algorithm performance is obtained. An information list (see FIG. 7) is created (step S805).

次いで、開始可能アルゴリズム情報リスト(図9参照)からアルゴリズム情報を一つ取り出して、元のリストから削除する(ステップS806)。   Next, one piece of algorithm information is extracted from the startable algorithm information list (see FIG. 9) and deleted from the original list (step S806).

次に、空のアルゴリズム候補を作成し、作成したアルゴリズム候補(図6参照)のアルゴリズムIDを、ステップS806で取り出したアルゴリズム情報のアルゴリズムIDに設定する。さらにそのアルゴリズム候補のパラメータセットIDを1(デフォルト値)にする(ステップS807)。図9に示す例から、アルゴリズムID“0”およびパラメータセットID“1”のアルゴリズム候補が作成される。   Next, an empty algorithm candidate is created, and the algorithm ID of the created algorithm candidate (see FIG. 6) is set as the algorithm ID of the algorithm information extracted in step S806. Further, the parameter set ID of the algorithm candidate is set to 1 (default value) (step S807). From the example shown in FIG. 9, algorithm candidates with algorithm ID “0” and parameter set ID “1” are created.

次に、空のアルゴリズム候補リストを作成し、ステップS807で作成したアルゴリズム候補を作成したアルゴリズム候補リストの最下段に追加する(ステップS808)。ステップS807の例では、アルゴリズムID“0”およびパラメータセットID“1”から成るアルゴリズム候補だけが、アルゴリズム候補リストに記載されている。   Next, an empty algorithm candidate list is created, and the algorithm candidate created in step S807 is added to the bottom of the created algorithm candidate list (step S808). In the example of step S807, only algorithm candidates consisting of the algorithm ID “0” and the parameter set ID “1” are described in the algorithm candidate list.

次いで、アルゴリズム候補リストを引数として処理1を実行する(ステップS809)。係るステップS809でm個のアルゴリズム候補リストに対して辞書を作成する。ここで、処理1は、与えられたアルゴリズム候補リストに対し、依存関係情報で与えられた条件の下で、逐次、接続可能なアルゴリズム候補を追加して新たなアルゴリズム候補リストを作成するものである。   Next, process 1 is executed using the algorithm candidate list as an argument (step S809). In step S809, a dictionary is created for the m algorithm candidate lists. Here, the process 1 is to create a new algorithm candidate list by sequentially adding connectable algorithm candidates to the given algorithm candidate list under the conditions given by the dependency relationship information. .

以下に、処理1の詳細の一例を記す。   Below, an example of the detail of the process 1 is described.

処理1(引数:アルゴリズム候補リスト){
f1.1. アルゴリズム候補リストの最下段のアルゴリズム候補を取得する。
Process 1 (argument: algorithm candidate list) {
f1.1. Get the algorithm candidate at the bottom of the algorithm candidate list.

f1.2. 取得したアルゴリズム候補からアルゴリズムIDを取得する。     f1.2. Get the algorithm ID from the obtained algorithm candidates.

f1.3. 依存関係情報リストから取得したアルゴリズムIDと前段アルゴリズムIDが等しい、依存関係情報を全て取得する。     f1.3. Get all dependency information where the algorithm ID obtained from the dependency information list is the same as the previous algorithm ID.

f1.4. 取得した全ての依存関係情報から後段アルゴリズムIDを取り出し、後段アルゴリズムIDリストを作成する。     f1.4. Extract the latter algorithm ID from all the acquired dependency information and create the latter algorithm ID list.

f1.5. リストが空でない場合以下を実行する。     f1.5. If the list is not empty:

f1.6. 後段アルゴリズムIDの各要素について以下を実行する。     f1.6. Execute the following for each element of the latter algorithm ID.

f1.7. 空のアルゴリズム候補を作成する。     f1.7. Create an empty algorithm candidate.

f1.8. 後段アルゴリズムIDを作成したアルゴリズム候補のアルゴリズムIDに設定する。     f1.8. Set the latter algorithm ID to the algorithm ID of the candidate algorithm created.

f1.9. さらにそのアルゴリズム候補のパラメータセットIDを1(デフォルト値)にする。     f1.9. Furthermore, the parameter set ID of the algorithm candidate is set to 1 (default value).

f1.10. 引数のアルゴリズム候補リストのコピーを作成する。     f1.10. Make a copy of the argument algorithm candidate list.

f1.11. コピーとして作成したアルゴリズム候補リストの最下段に、作成したアルゴリズム候補を追加する。     f1.11. Add the created algorithm candidates to the bottom of the algorithm candidate list created as a copy.

f1.12. コピーとして作成したアルゴリズム候補リストを引数として処理1を実行する。     f1.12. Process 1 is executed with the algorithm candidate list created as a copy as an argument.

f1.13. リストが空である場合
f1.14. 引数のアルゴリズム候補リストを引数として処理2(後述する)を実行する。
f1.13. If the list is empty
f1.14. Process 2 (described later) is executed with the argument algorithm candidate list as an argument.
}

図10は、処理1が再帰的に呼び出されるたびに生成されるデータの一例を示す図である。図11は、処理1における作業を説明する図で、図10の点線内における下段データの算出を説明する図である。   FIG. 10 is a diagram illustrating an example of data generated every time the process 1 is recursively called. FIG. 11 is a diagram for explaining the work in the process 1, and is a diagram for explaining the calculation of the lower data within the dotted line in FIG.

処理2は、処理1でそれ以上接続可能なアルゴリズム候補が存在しない場合、その時点のアルゴリズム候補リストに基づき辞書作成と性能評価を実施するものである。以下に、処理2の詳細の一例を記す。   In process 2, when there are no more algorithm candidates that can be connected in process 1, dictionary creation and performance evaluation are performed based on the algorithm candidate list at that time. Below, an example of the detail of the process 2 is described.

処理2(引数:アルゴリズム候補リスト){
f2.1. 学習データリストから、カテゴリID毎に一部の学習データを抽出した、学習データリストを作成する。一部の学習データは、例えば、カテゴリID毎に、同じカテゴリIDを持つ学習データの中から無作為に4割抽出する。カテゴリに含まれる画像データの枚数がゼロにならないことが必要である。図12は、抽出後の学習データリストの一例を示す図である。
Process 2 (argument: algorithm candidate list) {
f2.1. Create a learning data list by extracting some learning data for each category ID from the learning data list. For example, 40% of some learning data is randomly extracted from learning data having the same category ID for each category ID. It is necessary that the number of image data included in the category does not become zero. FIG. 12 is a diagram illustrating an example of the learning data list after extraction.

f2.2. アルゴリズム候補リストに対して、作成した学習データリストを使用して辞書を作成し、性能評価し評価結果を算出する。アルゴリズム候補リストの評価には、例えば、交差検定など一般的な手法を用いることができる。図13は、評価結果の算出の一例を示す図である。評価結果には、正解率(識別に成功したデータ数/評価に使用した学習データ数)のような識別性能を定量的に比較できる数値を含むことができる。     f2.2. For the algorithm candidate list, create a dictionary using the created learning data list, evaluate the performance, and calculate the evaluation result. For example, a general method such as cross-validation can be used for evaluating the algorithm candidate list. FIG. 13 is a diagram illustrating an example of calculation of an evaluation result. The evaluation result can include a numerical value capable of quantitatively comparing the identification performance such as the accuracy rate (number of data successfully identified / number of learning data used for evaluation).

f2.3. 空のアルゴリズム性能情報リストを作成し、設定値として引数のアルゴリズム候補リストと、算出した評価結果を設定する。     f2.3. Create an empty algorithm performance information list, and set the argument algorithm candidate list and the calculated evaluation result as setting values.

f2.4. 作成したアルゴリズム性能情報リストに、作成したアルゴリズム性能情報を追加する。
f2.4. Add the created algorithm performance information to the created algorithm performance information list.
}

次に、開始可能アルゴリズム情報リストが空か否かを判定する(ステップS810)。   Next, it is determined whether or not the startable algorithm information list is empty (step S810).

開始可能アルゴリズム情報リストが空であれば(ステップS810でYes)、ステップS806で作成したアルゴリズム性能情報リストから、最も評価結果の良いアルゴリズム候補リストを最適なアルゴリズム候補リストと決定(ステップS811)し、アルゴリズム組合せの決定までの処理が完了する。図14は、ステップS811までの処理で得られた最適なアルゴリズム候補リストの一例を示す図である。   If the startable algorithm information list is empty (Yes in step S810), the algorithm candidate list having the best evaluation result is determined as the optimum algorithm candidate list from the algorithm performance information list created in step S806 (step S811). The process up to the determination of the algorithm combination is completed. FIG. 14 is a diagram illustrating an example of an optimal algorithm candidate list obtained by the processing up to step S811.

一方、開始可能アルゴリズム情報リストが空でなければ(ステップS810でNo)、ステップS806に移行する。   On the other hand, if the startable algorithm information list is not empty (No in step S810), the process proceeds to step S806.

<パラメータ組合せの決定までの処理>
図15は、パラメータ組合せの決定までの処理の流れを示すフローチャートである。
<Processing until determination of parameter combination>
FIG. 15 is a flowchart showing the flow of processing up to the determination of the parameter combination.

まず、空のアルゴリズム性能情報リストを作成する(ステップS1501)。   First, an empty algorithm performance information list is created (step S1501).

次に、ステップS811で決定した最適なアルゴリズム候補のコピーを作成する(ステップS1502)。   Next, a copy of the optimal algorithm candidate determined in step S811 is created (step S1502).

次いで、コピーとして作成したアルゴリズム候補リストの各アルゴリズム候補のパラメータセットを空にする(ステップS1503)。   Next, the parameter set of each algorithm candidate in the algorithm candidate list created as a copy is emptied (step S1503).

次に、コピーとして作成したアルゴリズム候補リストを引数として処理3を実行する(ステップS1504)。係るステップS1504で、n個のパラメータ組合せに対して辞書を作成する。処理3は、与えられたアルゴリズム候補リストに対し、パラメータ情報で与えられたパラメータを、逐次、各アルゴリズム候補リストに対応して設定するものである。以下に、処理3の詳細の一例を記す。   Next, process 3 is executed using the algorithm candidate list created as a copy as an argument (step S1504). In step S1504, a dictionary is created for n parameter combinations. Process 3 is to sequentially set the parameters given by the parameter information for the given algorithm candidate list corresponding to each algorithm candidate list. Below, an example of the detail of the process 3 is described.

処理3(引数:アルゴリズム候補リスト){
f3.1. アルゴリズム候補リストからパラメータセットIDが空であるアルゴリズム候補を一つ取得する。
Process 3 (argument: algorithm candidate list) {
f3.1. Get one algorithm candidate whose parameter set ID is empty from the algorithm candidate list.

f3.2. 取得したアルゴリズム候補からアルゴリズムIDを取得する。     f3.2. Get the algorithm ID from the obtained algorithm candidates.

f3.3. 引数のアルゴリズム候補リストに含まれるアルゴリズム候補のうち、パラメータセットIDが空であるものが存在する場合。     f3.3. If there is an algorithm candidate included in the argument algorithm candidate list with an empty parameter set ID.

f3.4. パラメータ情報から、取得したアルゴリズムIDとアルゴリズムIDが等しいパラメータセットをすべて取得してパラメータセットリストを作成する。     f3.4. From the parameter information, obtain all parameter sets with the same algorithm ID as the obtained algorithm ID and create a parameter set list.

f3.5. パラメータセットリストの各要素について以下を実行。     f3.5. Execute the following for each element of the parameter set list.

f3.6. パラメータセットからパラメータセットIDを取得する。     f3.6. Get parameter set ID from parameter set.

f3.7. 引数のアルゴリズム候補リストのコピーを作成する。     f3.7. Make a copy of the argument algorithm candidate list.

f3.8. コピーとして作成したアルゴリズム候補リストから、取得したアルゴリズムIDとアルゴリズムIDが等しいアルゴリズム候補を取得する。     f3.8. From the algorithm candidate list created as a copy, obtain an algorithm candidate with the same algorithm ID as the obtained algorithm ID.

f3.9. f3.8で取得したアルゴリズム候補のパラメータセットIDの値として取得したパラメータセットIDを設定する。     f3.9. Set the parameter set ID obtained as the parameter set ID value of the algorithm candidate obtained in f3.8.

f3.10. コピーとして作成したアルゴリズム候補リストを引数として処理3を実行する。     f3.10. Execute process 3 with the algorithm candidate list created as a copy as an argument.

f3.11. 引数のアルゴリズム候補リストに含まれるアルゴリズム候補のうち、パラメータセットIDが空であるものが存在しない場合。     f3.11. If none of the algorithm candidates included in the argument algorithm candidate list has an empty parameter set ID.

f3.12. 引数のアルゴリズム候補リストを引数として処理4を実行する。
f3.12. Process 4 is executed with the argument algorithm candidate list as an argument.
}

処理4は、処理3において、それ以上設定可能なパラメータが存在しない場合、その時点のアルゴリズム候補リストに基づき辞書作成と性能評価を実施するものである。以下に、処理4の詳細の一例を記す。   In the process 4, when there are no more parameters that can be set in the process 3, the dictionary is created and the performance is evaluated based on the algorithm candidate list at that time. Below, an example of the detail of the process 4 is described.

処理4(引数:アルゴリズム候補リスト){
f4.1. 学習データリストから、カテゴリID毎に一部の学習データを抽出した、学習データリストを作成する。一部の学習データは、上記と同様である。
Process 4 (argument: algorithm candidate list) {
f4.1. Create a learning data list by extracting some learning data for each category ID from the learning data list. Some of the learning data is the same as described above.

f4.2. アルゴリズム候補リストに対して、作成した学習データリストを使用して辞書を作成し、性能評価し評価結果を算出する。     f4.2. For the algorithm candidate list, create a dictionary using the created learning data list, evaluate the performance, and calculate the evaluation result.

f4.3. 空のアルゴリズム性能情報を作成し、設定値として引数のアルゴリズム候補リストと、算出した評価結果を設定する。     f4.3. Create empty algorithm performance information and set the argument algorithm candidate list and the calculated evaluation result as the setting values.

f4.4. 作成したアルゴリズム性能情報リストに作成したアルゴリズム性能情報を追加する。
f4.4. Add the created algorithm performance information to the created algorithm performance information list.
}

図16は、処理3が再帰的に呼び出されるたびに生成されるデータの一例を示す図である。図17は、処理3における作業を説明する図である。   FIG. 16 is a diagram illustrating an example of data generated every time the process 3 is recursively called. FIG. 17 is a diagram for explaining the work in the process 3.

次いで、ステップS1501で作成したアルゴリズム性能情報リストから、最も評価結果の良いアルゴリズム候補リストを最適なアルゴリズム候補リストと決定(ステップS1505)し、パラメータ組合せの決定までの処理を完了する。図18は、ステップS1505までの処理で得られた最適なアルゴリズム候補リストの一例を示す図である。   Next, the algorithm candidate list with the best evaluation result is determined as the optimum algorithm candidate list from the algorithm performance information list created in step S1501 (step S1505), and the process up to the determination of the parameter combination is completed. FIG. 18 is a diagram illustrating an example of the optimum algorithm candidate list obtained by the processing up to step S1505.

<アルゴリズム候補リストと辞書の出力までの処理>
図19は、アルゴリズム候補リストと辞書の出力までの処理の流れを示すフローチャートである。
<Processing up to algorithm candidate list and dictionary output>
FIG. 19 is a flowchart showing the flow of processing up to the algorithm candidate list and dictionary output.

まず、ステップS1505で決定した最適なアルゴリズム候補リストに対して、学習データリストを使って辞書を作成する(ステップS1901)。   First, a dictionary is created using the learning data list for the optimal algorithm candidate list determined in step S1505 (step S1901).

次に、ステップS1505で決定した最適なアルゴリズム候補リストと、ステップS1901で作成した辞書を出力する(ステップS1902)。図20は、全ての学習データを使用して作成される最終的な辞書を説明する図である。このように、決定されたアルゴリズムの組合せと各アルゴリズムで使用されるパラメータが最適化され、辞書も作成されているので、最適な組合せの画像認識器を構成することができる。   Next, the optimal algorithm candidate list determined in step S1505 and the dictionary created in step S1901 are output (step S1902). FIG. 20 is a diagram illustrating a final dictionary created using all learning data. As described above, the combination of the determined algorithms and the parameters used in each algorithm are optimized, and a dictionary is created, so that an image recognizer having an optimal combination can be configured.

<変形例>
本実施形態については、以下のような変形例も適用することが可能である。
<Modification>
The following modifications can also be applied to the present embodiment.

(1)ステップS811やステップS1505において、最適なアルゴリズム候補リストを決定しているが、一覧を表示するようにしてもよい。
(2)ステップS809やステップS1504では、再帰的な処理によりアルゴリズムを実現しているが、この部分については周知の木構造の中間データ等を用いることにより反復的な処理に変換することもできる。
(3)ステップS1901では、学習データリスト全体を用いて辞書を作成するイメージで描いているが、全体でなく十分な量の一部分の学習データリストを用いて辞書を作成してもよい。
(1) Although an optimal algorithm candidate list is determined in step S811 or step S1505, a list may be displayed.
(2) In step S809 and step S1504, the algorithm is realized by recursive processing. However, this portion can be converted to repetitive processing by using well-known intermediate data of a tree structure or the like.
(3) In step S1901, the dictionary is created using the entire learning data list. However, the dictionary may be created using a sufficient amount of the learning data list instead of the entire learning data list.

以上説明したように、本実施形態によれば、画像認識アルゴリズムの組合せ構成を機械的に決定するのに必要な時間を、「アルゴリズム組合せ(m通り)」*「パラメータ組合せ(n通り)」の(m*n)のオーダーから、「アルゴリズム組合せ(m通り)」+「パラメータ組合せ(n通り)」の(m+n)のオーダーに削減し、画像認識の有識者でなくとも、認識対象に応じた画像認識のためのアルゴリズムの組合せ、各アルゴリズムのパラメータの組合せ、辞書を決定することができる。   As described above, according to the present embodiment, the time required to mechanically determine the combination configuration of the image recognition algorithms is “algorithm combination (m ways)” * “parameter combination (n ways)”. The order of (m * n) is reduced to the order of (m + n) of “algorithm combination (m ways)” + “parameter combination (n ways)”. A combination of algorithms for recognition, a combination of parameters for each algorithm, and a dictionary can be determined.

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although several embodiments of the present invention have been described, these embodiments are presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.

100・・・画像認識アルゴリズム組合せ選択装置
10・・・入力部
20・・・画像認識アルゴリズム決定部
30・・・学習データリスト決定部
40・・・辞書作成部
50・・・性能評価部
60・・・アルゴリズム部品格納部
70・・・アルゴリズム情報格納部
80・・・学習データ格納部
DESCRIPTION OF SYMBOLS 100 ... Image recognition algorithm combination selection apparatus 10 ... Input part 20 ... Image recognition algorithm determination part 30 ... Learning data list determination part 40 ... Dictionary creation part 50 ... Performance evaluation part 60- ..Algorithm component storage unit 70 ... Algorithm information storage unit 80 ... Learning data storage unit

Claims (9)

画像認識用のアルゴリズム部品の組合せを選択する装置であって、
画像から識別しようとする対象を切り出した画像データと識別単位から成る学習データ、および前記画像データの画像フォーマット情報を入力し、前記学習データ、前記画像データおよび前記画像フォーマット情報の組みの全てを学習データリストとし、この学習データリストから一部を抽出し、画像認識の性能評価に使用される辞書を作成するための抽出済学習データリストを作成する学習データリスト決定部と、
前記アルゴリズム部品と前記アルゴリズム部品が実行できるための情報を表す開始条件を含むアルゴリズム情報と、接続が可能な前記アルゴリズム部品の組合せを表す依存関係情報と、前記アルゴリズム部品で使用されるパラメータの全てを表すパラメータセット情報とを利用してアルゴリズム候補リストを作成する画像認識アルゴリズム決定部と、
前記アルゴリズム候補リストに対して、デフォルト値の前記パラメータセット情報および前記抽出済学習データリストを使用して辞書を作成する辞書作成部と、
前記抽出済学習データリストに対して、前記パラメータセット情報および前記辞書を使って前記アルゴリズム候補リストを性能評価する性能評価部とを備え、
前記画像認識アルゴリズム決定部は、前記性能評価部の評価結果が、最も良い前記アルゴリズム候補リストを最適なアルゴリズム候補リストとして、前記パラメータセット情報のパラメータを設定し、
前記辞書作成部は、前記最適なアルゴリズム候補リストに対応して、前記辞書を再作成し、
前記性能評価部は、再作成された前記辞書を使って前記最適なアルゴリズム候補リストの性能を再評価し、
前記画像認識アルゴリズム決定部は、前記再評価結果に基づいて最適なパラメータセットを決定し、
前記辞書作成部は、全ての前記学習データを使用して、最終的に前記辞書を再作成する画像認識アルゴリズム組合せ選択装置。
An apparatus for selecting a combination of algorithm parts for image recognition,
Input learning data consisting of image data obtained by cutting out an object to be identified from an image and an identification unit, and image format information of the image data, and learn all sets of the learning data, the image data, and the image format information A learning data list determination unit for creating a data list, extracting a part from the learning data list, and creating an extracted learning data list for creating a dictionary used for performance evaluation of image recognition;
Algorithm information including a start condition that represents the algorithm component and information for enabling execution of the algorithm component, dependency information that represents a combination of the algorithm components that can be connected, and all parameters used in the algorithm component An image recognition algorithm determination unit that creates an algorithm candidate list using parameter set information to represent,
A dictionary creation unit that creates a dictionary using the parameter set information of default values and the extracted learning data list for the algorithm candidate list,
A performance evaluation unit that evaluates the algorithm candidate list using the parameter set information and the dictionary for the extracted learning data list,
The image recognition algorithm determination unit sets the parameters of the parameter set information, with the algorithm candidate list having the best evaluation result of the performance evaluation unit as the optimal algorithm candidate list,
The dictionary creation unit recreates the dictionary corresponding to the optimal algorithm candidate list,
The performance evaluation unit re-evaluates the performance of the optimal algorithm candidate list using the re-created dictionary,
The image recognition algorithm determination unit determines an optimal parameter set based on the reevaluation result,
The dictionary creation unit is an image recognition algorithm combination selection device that finally recreates the dictionary using all the learning data.
前記学習データの抽出は、前記識別単位を表すカテゴリID毎に、前記カテゴリIDに含まれる画像データの枚数がゼロにならないように、同じ前記カテゴリIDを持つ前記学習データの中から無作為に所定割合抽出する請求項1に記載の画像認識アルゴリズム組合せ選択装置。   The learning data is extracted at random from the learning data having the same category ID so that the number of image data included in the category ID does not become zero for each category ID representing the identification unit. The image recognition algorithm combination selection apparatus according to claim 1, wherein the ratio is extracted. 前記学習データおよび前記画像フォーマット情報を入力する入力部と、
前記アルゴリズム情報の列を格納するアルゴリズム部品格納部と、
前記依存関係情報および前記パラメータセット情報を格納するアルゴリズム情報格納部と、
前記学習データリストおよび前記画像フォーマット情報を格納する学習データ格納部を備える請求項1又は請求項2に記載の画像認識アルゴリズム組合せ選択装置。
An input unit for inputting the learning data and the image format information;
An algorithm component storage section for storing a column of the algorithm information;
An algorithm information storage unit for storing the dependency relationship information and the parameter set information;
The image recognition algorithm combination selection apparatus according to claim 1, further comprising a learning data storage unit that stores the learning data list and the image format information.
前記辞書は、アルゴリズム、パラメータ、認識対象の組合せについて1つ作成される請求項1乃至請求項3のいずれか1項に記載の画像認識アルゴリズム組合せ選択装置。   The image recognition algorithm combination selection device according to any one of claims 1 to 3, wherein one dictionary is created for a combination of an algorithm, a parameter, and a recognition target. 前記依存関係情報は、前段の前記アルゴリズム部品と後段の前記アルゴリズム部品の接続が、ループになるような組合せは含まない請求項1乃至請求項4のいずれか1項に記載の画像認識アルゴリズム組合せ選択装置。   The image recognition algorithm combination selection according to any one of claims 1 to 4, wherein the dependency relationship information does not include a combination in which the connection between the algorithm component in the previous stage and the algorithm component in the subsequent stage is a loop. apparatus. 前記画像フォーマット情報は、前記画像データの色空間フォーマットとピクセルフォーマットから成り、全ての前記画像データの前記画像フォーマット情報が統一されている請求項1乃至請求項5のいずれか1項に記載の画像認識アルゴリズム組合せ選択装置。   The image according to any one of claims 1 to 5, wherein the image format information includes a color space format and a pixel format of the image data, and the image format information of all the image data is unified. Recognition algorithm combination selection device. 前記最適なアルゴリズム候補リストの決定では、前記アルゴリズム候補リストと前記評価結果の組みから成るアルゴリズム性能情報リストを作成して、最も評価結果の良い前記アルゴリズム候補リストを前記最適なアルゴリズム候補リストとする請求項1乃至請求項6のいずれか1項に記載の画像認識アルゴリズム組合せ選択装置。   In determining the optimum algorithm candidate list, an algorithm performance information list including a combination of the algorithm candidate list and the evaluation result is created, and the algorithm candidate list having the best evaluation result is used as the optimum algorithm candidate list. The image recognition algorithm combination selection apparatus according to any one of claims 1 to 6. 前記アルゴリズム部品は、バイナリデータあるいは前記アルゴリズム部品を取得するための情報である請求項1乃至請求項7のいずれか1項に記載の画像認識アルゴリズム組合せ選択装置。   The image recognition algorithm combination selection device according to any one of claims 1 to 7, wherein the algorithm component is binary data or information for acquiring the algorithm component. 前記評価結果は、(識別に成功したデータ数/評価に使用した学習データ数)で表す正解率の数値データで行う請求項1乃至請求項8のいずれか1項に記載の画像認識アルゴリズム組合せ選択装置。   The image recognition algorithm combination selection according to any one of claims 1 to 8, wherein the evaluation result is numerical data with a correct answer rate expressed by (number of data successfully identified / number of learning data used for evaluation). apparatus.
JP2014001470A 2014-01-08 2014-01-08 Image recognition algorithm combination selection device Expired - Fee Related JP6208018B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014001470A JP6208018B2 (en) 2014-01-08 2014-01-08 Image recognition algorithm combination selection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014001470A JP6208018B2 (en) 2014-01-08 2014-01-08 Image recognition algorithm combination selection device

Publications (2)

Publication Number Publication Date
JP2015130093A JP2015130093A (en) 2015-07-16
JP6208018B2 true JP6208018B2 (en) 2017-10-04

Family

ID=53760761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014001470A Expired - Fee Related JP6208018B2 (en) 2014-01-08 2014-01-08 Image recognition algorithm combination selection device

Country Status (1)

Country Link
JP (1) JP6208018B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6528723B2 (en) 2016-05-25 2019-06-12 トヨタ自動車株式会社 Object recognition apparatus, object recognition method and program
JP7006159B2 (en) 2017-11-14 2022-01-24 トヨタ自動車株式会社 Server device
JP7269122B2 (en) * 2019-07-18 2023-05-08 株式会社日立ハイテク Data analysis device, data analysis method and data analysis program
JP2021196912A (en) * 2020-06-15 2021-12-27 ヤフー株式会社 Execution apparatus, execution method, and execution program
JP2022158647A (en) * 2021-04-02 2022-10-17 日立造船株式会社 Information processing device, determination method and determination program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11282822A (en) * 1998-03-26 1999-10-15 Toshiba Corp Image processing program combination method and device and optimum solution searching method and device
JP2004038744A (en) * 2002-07-05 2004-02-05 Nippon Telegr & Teleph Corp <Ntt> Image recognition algorithm generation method, image recognition algorithm generation device, image recognition algorithm generation program, and recording medium recorded with image recognition algorithm generation program
JP3756507B1 (en) * 2004-09-17 2006-03-15 シャープ株式会社 Image processing algorithm evaluation method and apparatus, image processing algorithm generation method and apparatus, program, and program recording medium
JP2006215880A (en) * 2005-02-04 2006-08-17 Fuji Xerox Co Ltd Image processor and image processing method
JP4961161B2 (en) * 2006-04-27 2012-06-27 株式会社日立ハイテクノロジーズ Inspection device

Also Published As

Publication number Publication date
JP2015130093A (en) 2015-07-16

Similar Documents

Publication Publication Date Title
JP6208018B2 (en) Image recognition algorithm combination selection device
RU2693916C1 (en) Character recognition using a hierarchical classification
US11176417B2 (en) Method and system for producing digital image features
KR102370910B1 (en) Method and apparatus for few-shot image classification based on deep learning
JP6282045B2 (en) Information processing apparatus and method, program, and storage medium
JP6312467B2 (en) Information processing apparatus, information processing method, and program
JP6107531B2 (en) Feature extraction program and information processing apparatus
CN115170449B (en) Multi-mode fusion scene graph generation method, system, equipment and medium
JP6989450B2 (en) Image analysis device, image analysis method and program
Sicre et al. Discriminative part model for visual recognition
JP2021051589A5 (en)
CN111950579A (en) Training method and training device for classification model
Stanescu et al. State-aware configuration detection for augmented reality step-by-step tutorials
JP5370267B2 (en) Image processing system
CN111666965A (en) Multi-level depth feature and multi-matcher fusion for improved image recognition
KR102413588B1 (en) Object recognition model recommendation method, system and computer program according to training data
KR102580131B1 (en) Cycle generative adversarial network conditional gen erative adversarial network
CN112817560B (en) Computing task processing method, system and computer readable storage medium based on table function
KR102335114B1 (en) Artificial intelligence feedback method and artificial intelligence feedback system
Calarasanu et al. From text detection to text segmentation: a unified evaluation scheme
US20230114374A1 (en) Storage medium, machine learning apparatus, and machine learning method
JP6491345B2 (en) Information processing apparatus, information processing method, and program
CN115049899B (en) Model training method, reference expression generation method and related equipment
US20240037449A1 (en) Teaching device, teaching method, and computer program product
US20230237097A1 (en) Information processing device, information processing method, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160923

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170906

R151 Written notification of patent or utility model registration

Ref document number: 6208018

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees