JP2008242638A - Image discrimination method, image discrimination device, and program - Google Patents

Image discrimination method, image discrimination device, and program Download PDF

Info

Publication number
JP2008242638A
JP2008242638A JP2007079892A JP2007079892A JP2008242638A JP 2008242638 A JP2008242638 A JP 2008242638A JP 2007079892 A JP2007079892 A JP 2007079892A JP 2007079892 A JP2007079892 A JP 2007079892A JP 2008242638 A JP2008242638 A JP 2008242638A
Authority
JP
Japan
Prior art keywords
image
identification process
partial
identification
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007079892A
Other languages
Japanese (ja)
Other versions
JP2008242638A5 (en
Inventor
Kenji Fukazawa
賢二 深沢
Hirokazu Kasahara
広和 笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2007079892A priority Critical patent/JP2008242638A/en
Publication of JP2008242638A publication Critical patent/JP2008242638A/en
Publication of JP2008242638A5 publication Critical patent/JP2008242638A5/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To improve the speed of the discrimination processing of image data. <P>SOLUTION: This image identification method includes evaluating an image shown by image data, determining the order of first discrimination processing for discriminating whether or not an image shown by the image data is belonging to a first category base on the evaluation result and second discrimination processing for judging whether or not the image shown by the image data is belonging to a second category different from the first category, and when it is judged that the image belongs to the specific category in the discrimination processing performed first between the first discrimination processing and the second discrimination processing, omitting the discrimination processing performed later between the first discrimination processing and the second discrimination processing. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、画像識別方法、画像識別装置及びプログラムに関する。   The present invention relates to an image identification method, an image identification apparatus, and a program.

デジタルスチルカメラには撮影モードを設定するモード設定ダイヤルを持つものがある。ユーザがダイヤルで撮影モードを設定すると、デジタルスチルカメラは撮影モードに応じた撮影条件(露光時間等)を決定し、撮影を行う。撮影が行われると、デジタルスチルカメラは、画像ファイルを生成する。この画像ファイルには、撮影した画像の画像データに、撮影時の撮影条件等の付加データが付加されている。   Some digital still cameras have a mode setting dial for setting a shooting mode. When the user sets the shooting mode with the dial, the digital still camera determines shooting conditions (such as exposure time) according to the shooting mode and performs shooting. When shooting is performed, the digital still camera generates an image file. In this image file, additional data such as shooting conditions at the time of shooting is added to the image data of the shot image.

付加データに応じて画像データに画像処理することが行われている。例えば、プリンタが画像ファイルに基づいて印刷を行うとき、付加データの示す撮影条件に応じて画像データを補正し、補正した画像データに従って印刷することが行われている(特許文献1参照)。   Image processing is performed on the image data according to the additional data. For example, when a printer performs printing based on an image file, the image data is corrected according to the shooting conditions indicated by the additional data, and printing is performed according to the corrected image data (see Patent Document 1).

また、画像データを解析し、画像データの示す画像のカテゴリを分類することも行われている(特許文献2、3参照)。
特開2001−238177号公報 特開平10−302067号公報 特表2006−511000号公報
In addition, image data is analyzed to classify image categories indicated by the image data (see Patent Documents 2 and 3).
JP 2001-238177 A Japanese Patent Laid-Open No. 10-302067 JP 2006-511000 Gazette

画像データの示す画像が特定のカテゴリに属するか否かを識別する識別器を複数組み合わせることによって、画像データを複数のカテゴリに分類することが行われている。このように複数の識別器を用いる場合、常に全ての識別器を用いることにすると、識別処理の速度が低下してしまう。
本発明は、画像データの識別処理の速度を向上させることを目的とする。
The image data is classified into a plurality of categories by combining a plurality of discriminators for identifying whether or not the image indicated by the image data belongs to a specific category. When using a plurality of discriminators as described above, if all the discriminators are always used, the speed of the discrimination process is reduced.
An object of the present invention is to improve the speed of image data identification processing.

上記目的を達成するための主たる発明は、画像データの示す画像を評価し、評価結果に基づいて、前記画像データの示す画像が第1カテゴリに属するか否かを識別する第1識別処理、及び前記画像データの示す画像が前記第1カテゴリとは別の第2カテゴリに属するか否かを識別する第2識別処理の順序を決定し、前記第1識別処理及び前記第2識別処理のうちの先に行われる識別処理において前記画像が特定のカテゴリに属することが識別できた場合、前記第1識別処理及び前記第2識別処理のうちの後に行われる識別処理を省略することを特徴とする。
本発明の他の特徴については、本明細書及び添付図面の記載により明らかにする。
A main invention for achieving the above object is to evaluate an image indicated by image data, and based on the evaluation result, identify whether the image indicated by the image data belongs to a first category, and Determining an order of second identification processing for identifying whether or not an image indicated by the image data belongs to a second category different from the first category, and wherein, among the first identification processing and the second identification processing, When it is possible to identify that the image belongs to a specific category in the identification process performed first, the identification process performed after the first identification process and the second identification process is omitted.
Other features of the present invention will become apparent from the description of the present specification and the accompanying drawings.

本明細書及び添付図面の記載により、少なくとも、以下の事項が明らかとなる。   At least the following matters will become clear from the description of the present specification and the accompanying drawings.

(A)画像データの示す画像を評価し、(B)評価結果に基づいて、前記画像データの示す画像が第1カテゴリに属するか否かを識別する第1識別処理、及び前記画像データの示す画像が前記第1カテゴリとは別の第2カテゴリに属するか否かを識別する第2識別処理の順序を決定し、(C)前記第1識別処理及び前記第2識別処理のうちの先に行われる識別処理において前記画像が特定のカテゴリに属することが識別できた場合、前記第1識別処理及び前記第2識別処理のうちの後に行われる識別処理を省略することを特徴とする画像識別方法が明らかになる。
このような画像識別方法によれば、処理速度が速くなる。
(A) Evaluating the image indicated by the image data, (B) First identification processing for identifying whether the image indicated by the image data belongs to the first category based on the evaluation result, and indicating the image data Determining an order of second identification processing for identifying whether an image belongs to a second category different from the first category; and (C) first of the first identification processing and the second identification processing. An image identification method characterized by omitting an identification process performed after the first identification process and the second identification process when it can be identified that the image belongs to a specific category in the identification process performed. Becomes clear.
According to such an image identification method, the processing speed is increased.

また、前記画像識別方法は、前記画像の全体の特徴を示す全体特徴量に基づいて、前記画像が前記第1カテゴリに属するか否かを識別する第1全体識別処理と、前記全体特徴量に基づいて、前記画像が前記第2カテゴリに属するか否かを識別する第2全体識別処理と、前記画像の一部の特徴を示す部分特徴量に基づいて、前記画像が前記第1カテゴリに属するか否かを識別する第1部分識別処理と、前記部分特徴量に基づいて、前記画像が前記第2カテゴリに属するか否かを識別する第2部分識別処理と、を有し、前記第1識別処理は前記第1部分識別処理に相当し、前記第2識別処理は前記第2部分識別処理に相当し、前記第1全体識別処理の結果と前記第2全体識別処理の結果とを前記評価結果として、前記第1識別処理と前記第2識別処理の順序が決定されることが望ましい。これにより、処理時間が短くなる。   Further, the image identification method includes a first overall identification process for identifying whether the image belongs to the first category based on an overall feature amount indicating an overall feature of the image, and the overall feature amount. The image belongs to the first category based on a second overall identification process for identifying whether or not the image belongs to the second category and a partial feature amount indicating a partial feature of the image. A first partial identification process for identifying whether the image belongs to the second category based on the partial feature amount, and a first partial identification process for identifying whether the image belongs to the second category. The identification process corresponds to the first partial identification process, the second identification process corresponds to the second partial identification process, and the result of the first overall identification process and the result of the second overall identification process are evaluated. As a result, the first identification process and the second identification It is desirable that the management of the order is determined. This shortens the processing time.

また、前記第1全体識別処理では、前記全体特徴量に基づいて前記画像が前記第1カテゴリに属する確率に応じた第1データが算出され、前記第1データに基づいて前記画像が前記第1カテゴリに属するか否かが識別され、前記第2全体識別処理では、前記全体特徴量に基づいて、前記画像が前記第2カテゴリに属する確率に応じた第2データが算出され、前記第2データに基づいて前記画像が前記第2カテゴリに属するか否かが識別され、前記第1データ及び前記第2データが前記評価結果として用いられることが望ましい。これにより、処理速度が速くなる。   In the first overall identification process, first data corresponding to a probability that the image belongs to the first category is calculated based on the overall feature amount, and the image is converted to the first data based on the first data. Whether the image belongs to a category is identified, and in the second overall identification process, second data corresponding to the probability that the image belongs to the second category is calculated based on the overall feature amount, and the second data It is preferable that whether or not the image belongs to the second category is identified based on the first data and the first data and the second data are used as the evaluation result. This increases the processing speed.

また、前記第1部分識別処理及び前記第2部分識別処理において、前記画像を分割した複数の部分画像のそれぞれの部分特徴量に基づいて、各前記部分画像が特定のカテゴリに属するか否かがそれぞれ識別され、前記特定のカテゴリに属すると識別された前記部分画像の数に基づいて、前記画像が特定のカテゴリに属するか否かが識別されることが望ましい。このような場合に特に有効である。   In the first partial identification process and the second partial identification process, whether each partial image belongs to a specific category based on each partial feature amount of a plurality of partial images obtained by dividing the image. It is preferable that whether or not the image belongs to a specific category is identified based on the number of partial images that are identified and belong to the specific category. This is particularly effective in such a case.

また、前記第1全体識別処理又は前記第2全体識別処理において前記画像が特定のカテゴリに属することが識別できた場合、前記第1識別処理及び前記第2識別処理が省略されることが望ましい。これにより、処理速度が速くなる。   In addition, when it is possible to identify that the image belongs to a specific category in the first overall identification process or the second overall identification process, it is preferable that the first identification process and the second identification process are omitted. This increases the processing speed.

また、前記第1識別処理及び前記第2識別処理を行うための処理時間は、前記画像データの示す画像を評価して前記評価結果を取得するための処理時間よりも遅いことが望ましい。このような場合に特に有効である。   The processing time for performing the first identification processing and the second identification processing is preferably slower than the processing time for evaluating the image indicated by the image data and acquiring the evaluation result. This is particularly effective in such a case.

コントローラを備えた画像識別装置であって、前記コントローラは、(A)画像データの示す画像を評価し、(B)評価結果に基づいて、前記画像データの示す画像が第1カテゴリに属するか否かを識別する第1識別処理、及び前記画像データの示す画像が前記第1カテゴリとは別の第2カテゴリに属するか否かを識別する第2識別処理の順序を決定し、(C)前記第1識別処理及び前記第2識別処理のうちの先に行われる識別処理において前記画像が特定のカテゴリに属することが識別できた場合、前記第1識別処理及び前記第2識別処理のうちの後に行われる識別処理を省略することを特徴とする画像識別装置も明らかになる。   An image identification apparatus including a controller, wherein the controller (A) evaluates an image indicated by image data, and (B) whether the image indicated by the image data belongs to a first category based on an evaluation result. Determining an order of a first identification process for identifying whether or not an image indicated by the image data belongs to a second category different from the first category, and (C) When it can be identified that the image belongs to a specific category in the first identification process and the second identification process, after the first identification process and the second identification process. An image identification device characterized by omitting the identification process to be performed is also clarified.

画像識別装置に、(A)画像データの示す画像を評価させ、(B)評価結果に基づいて、前記画像データの示す画像が第1カテゴリに属するか否かを識別する第1識別処理、及び前記画像データの示す画像が前記第1カテゴリとは別の第2カテゴリに属するか否かを識別する第2識別処理の順序を決定させ、(C)前記第1識別処理及び前記第2識別処理のうちの先に行われる識別処理において前記画像が特定のカテゴリに属することが識別できた場合、前記第1識別処理及び前記第2識別処理のうちの後に行われる識別処理を省略させることを特徴とするプログラムも明らかになる。   (A) causing the image identification device to evaluate the image indicated by the image data, and (B) a first identification process for identifying whether the image indicated by the image data belongs to the first category based on the evaluation result; and An order of second identification processing for identifying whether or not an image indicated by the image data belongs to a second category different from the first category; and (C) the first identification processing and the second identification processing If the image can be identified as belonging to a specific category in the identification process performed earlier, the identification process performed after the first identification process and the second identification process is omitted. The program will be revealed.

===全体構成===
図1は、画像処理システムの説明図である。この画像処理システムは、デジタルスチルカメラ2と、プリンタ4とを備える。
=== Overall structure ===
FIG. 1 is an explanatory diagram of an image processing system. This image processing system includes a digital still camera 2 and a printer 4.

デジタルスチルカメラ2は、被写体をデジタルデバイス(CCDなど)に結像させることによりデジタル画像を取得するカメラである。デジタルスチルカメラ2には、モード設定ダイヤル2Aが設けられている。ユーザは、ダイヤル2Aによって、撮影条件に応じた撮影モードを設定することができる。例えば、ダイヤル2Aによって「夜景」モードが設定されると、デジタルスチルカメラ2は、シャッター速度を遅くしたり、ISO感度を高くしたりして、夜景撮影に適した撮影条件にて撮影を行う。   The digital still camera 2 is a camera that acquires a digital image by forming an image of a subject on a digital device (CCD or the like). The digital still camera 2 is provided with a mode setting dial 2A. The user can set the shooting mode according to the shooting conditions by using the dial 2A. For example, when the “night scene” mode is set by the dial 2A, the digital still camera 2 performs shooting under shooting conditions suitable for night scene shooting by decreasing the shutter speed or increasing the ISO sensitivity.

デジタルスチルカメラ2は、ファイルフォーマット規格に準拠して、撮影により生成した画像ファイルをメモリカード6に保存する。画像ファイルには、撮影した画像のデジタルデータ(画像データ)だけでなく、撮影時の撮影条件(撮影データ)等の付加データも保存される。   The digital still camera 2 stores an image file generated by photographing in the memory card 6 in accordance with the file format standard. In the image file, not only digital data (image data) of a captured image but also additional data such as a shooting condition (shooting data) at the time of shooting is stored.

プリンタ4は、画像データの示す画像を紙に印刷する印刷装置である。プリンタ4には、メモリカード6を挿入するスロット21が設けられている。ユーザは、デジタルスチルカメラ2で撮影した後、デジタルスチルカメラ2からメモリカード6を取り出し、スロット21にメモリカード6を挿入することができる。   The printer 4 is a printing device that prints an image indicated by image data on paper. The printer 4 is provided with a slot 21 into which the memory card 6 is inserted. The user can take a picture with the digital still camera 2, remove the memory card 6 from the digital still camera 2, and insert the memory card 6 into the slot 21.

図2は、プリンタ4の構成の説明図である。プリンタ4は、印刷機構10と、この印刷機構10を制御するプリンタ側コントローラ20とを備える。印刷機構10は、インクを吐出するヘッド11と、ヘッド11を制御するヘッド制御部12と、紙を搬送するため等のモータ13と、センサ14とを有する。プリンタ側コントローラ20は、メモリカード6からデータを送受信するためのメモリ用スロット21と、CPU22と、メモリ23と、モータ13を制御する制御ユニット24と、駆動信号(駆動波形)を生成する駆動信号生成部25とを有する。   FIG. 2 is an explanatory diagram of the configuration of the printer 4. The printer 4 includes a printing mechanism 10 and a printer-side controller 20 that controls the printing mechanism 10. The printing mechanism 10 includes a head 11 that ejects ink, a head control unit 12 that controls the head 11, a motor 13 for conveying paper, and a sensor 14. The printer-side controller 20 includes a memory slot 21 for transmitting and receiving data from the memory card 6, a CPU 22, a memory 23, a control unit 24 for controlling the motor 13, and a drive signal for generating a drive signal (drive waveform). And a generation unit 25.

メモリカード6がスロット21に挿入されると、プリンタ側コントローラ20は、メモリカード6に保存されている画像ファイルを読み出してメモリ23に記憶する。そして、プリンタ側コントローラ20は、画像ファイルの画像データを、印刷機構10で印刷するための印刷データに変換し、印刷データに基づいて印刷機構10を制御し、紙に画像を印刷する。この一連の動作は、「ダイレクトプリント」と呼ばれている。   When the memory card 6 is inserted into the slot 21, the printer-side controller 20 reads out the image file stored in the memory card 6 and stores it in the memory 23. Then, the printer-side controller 20 converts the image data of the image file into print data for printing by the printing mechanism 10, controls the printing mechanism 10 based on the printing data, and prints an image on paper. This series of operations is called “direct printing”.

なお、「ダイレクトプリント」は、メモリカード6をスロット21に挿入することによって行われるだけでなく、デジタルスチルカメラ2とプリンタ4とをケーブル(不図示)で接続することによっても可能である。   “Direct printing” is not only performed by inserting the memory card 6 into the slot 21, but also by connecting the digital still camera 2 and the printer 4 with a cable (not shown).

メモリカード6に記憶される画像ファイルは、画像データと、付加データとから構成されている。画像データは、複数の画素データから構成されている。画素データは、画素の色情報(階調値)を示すデータである。画素がマトリクス状に配置されることによって、画像が構成される。このため、画像データは、画像を示すデータである。付加データには、画像データの特性を示すデータや、撮影データや、サムネイル画像データ等が含まれる。   The image file stored in the memory card 6 is composed of image data and additional data. The image data is composed of a plurality of pixel data. The pixel data is data indicating pixel color information (gradation value). An image is formed by arranging the pixels in a matrix. Therefore, the image data is data indicating an image. The additional data includes data indicating the characteristics of image data, shooting data, thumbnail image data, and the like.

===自動補正機能の概要===
「人物」の写真を印刷するときには、肌色をきれいにしたいという要求がある。また、「風景」の写真を印刷するときには、空の青色を強調し、木や草の緑色を強調したいという要求がある。そこで、本実施形態のプリンタ4は、画像ファイルを分析して自動的に適した補正処理を行う自動補正機能を備えている。
=== Outline of automatic correction function ===
When printing a “person” photo, there is a demand to clean the skin tone. In addition, when printing a “landscape” photograph, there is a demand for emphasizing the blue of the sky and the green of trees and grass. Therefore, the printer 4 of the present embodiment includes an automatic correction function that analyzes an image file and automatically performs a suitable correction process.

図3は、プリンタ4の自動補正機能の説明図である。図中のプリンタ側コントローラ20の各要素は、ソフトウェアとハードウェアによって実現される。   FIG. 3 is an explanatory diagram of the automatic correction function of the printer 4. Each element of the printer-side controller 20 in the figure is realized by software and hardware.

記憶部31は、メモリ23の一部の領域及びCPU22によって実現される。メモリカード6から読み出された画像ファイルの全部又は一部は、記憶部31の画像記憶部31Aに展開される。また、プリンタ側コントローラ20の各要素の演算結果は、記憶部31の結果記憶部31Bに格納される。   The storage unit 31 is realized by a partial area of the memory 23 and the CPU 22. All or part of the image file read from the memory card 6 is developed in the image storage unit 31 </ b> A of the storage unit 31. In addition, the calculation result of each element of the printer-side controller 20 is stored in the result storage unit 31B of the storage unit 31.

顔識別部32は、CPU22と、メモリ23に記憶された顔識別プログラムとによって実現される。顔識別部32は、画像記憶部31Aに記憶された画像データを分析し、顔の有無を識別する。顔識別部32によって顔が有ると識別された場合、識別対象となる画像が「人物」のシーンに属すると識別される。この場合、シーン識別部33によるシーン識別処理は行われない。顔識別部32による顔識別処理は、既に広く行われている処理と同様なので、詳細な説明は省略する。   The face identification unit 32 is realized by the CPU 22 and a face identification program stored in the memory 23. The face identification unit 32 analyzes the image data stored in the image storage unit 31A and identifies the presence or absence of a face. When the face identifying unit 32 identifies that there is a face, the image to be identified is identified as belonging to the “person” scene. In this case, the scene identification process by the scene identification unit 33 is not performed. Since the face identification process by the face identification unit 32 is the same as a process that has already been widely performed, detailed description thereof is omitted.

シーン識別部33は、CPU22と、メモリ23に記憶されたシーン識別プログラムとによって実現される。シーン識別部33は、画像記憶部31Aに記憶された画像ファイルを分析し、画像データの示す画像のシーンを識別する。顔識別部32によって顔がないと識別された場合に、シーン識別部33によるシーン識別処理が行われる。後述するように、シーン識別部33は、識別対象となる画像が「風景」、「夕景」、「夜景」、「花」、「紅葉」、「その他」のいずれの画像であるかを識別する。   The scene identification unit 33 is realized by the CPU 22 and a scene identification program stored in the memory 23. The scene identification unit 33 analyzes the image file stored in the image storage unit 31A and identifies the scene of the image indicated by the image data. When the face identifying unit 32 identifies that there is no face, a scene identifying process by the scene identifying unit 33 is performed. As will be described later, the scene identifying unit 33 identifies whether the image to be identified is a “landscape”, “evening scene”, “night scene”, “flower”, “autumn leaves”, or “other” image. .

図4は、画像のシーンと補正内容との関係の説明図である。
画像補正部34は、CPU22と、メモリ23に記憶された画像補正プログラムとによって実現される。画像補正部34は、記憶部31の結果記憶部31B(後述)に記憶されている識別結果(顔識別部32やシーン識別部33の識別結果)に基づいて、画像記憶部31Aの画像データを補正する。例えば、シーン識別部33の識別結果が「風景」である場合には、青色を強調し、緑色を強調するような補正が行われる。なお、画像補正部34は、シーンの識別結果だけでなく、画像ファイルの撮影データの内容も反映して、画像データを補正しても良い。例えば、露出補正がマイナスの場合、暗い雰囲気の画像を明るくしないように画像データを補正しても良い。
プリンタ制御部35は、CPU22、駆動信号生成部25、制御ユニット24及びメモリ23に記憶されたプリンタ制御プログラムによって、実現される。プリンタ制御部35は、補正後の画像データを印刷データに変換し、印刷機構10に画像を印刷させる。
FIG. 4 is an explanatory diagram of a relationship between an image scene and correction contents.
The image correction unit 34 is realized by the CPU 22 and an image correction program stored in the memory 23. The image correction unit 34 converts the image data of the image storage unit 31A based on the identification results (identification results of the face identification unit 32 and the scene identification unit 33) stored in the result storage unit 31B (described later) of the storage unit 31. to correct. For example, when the identification result of the scene identification unit 33 is “landscape”, correction is performed so that blue is emphasized and green is emphasized. The image correction unit 34 may correct the image data by reflecting not only the scene identification result but also the contents of the image data of the image file. For example, when the exposure correction is negative, the image data may be corrected so as not to brighten the dark atmosphere image.
The printer control unit 35 is realized by a printer control program stored in the CPU 22, the drive signal generation unit 25, the control unit 24, and the memory 23. The printer control unit 35 converts the corrected image data into print data, and causes the printing mechanism 10 to print the image.

===シーン識別処理===
図5は、シーン識別部33によるシーン識別処理のフロー図である。図6は、シーン識別部33の機能の説明図である。図中のシーン識別部33の各要素は、ソフトウェアとハードウェアによって実現される。シーン識別部33は、図6に示す特徴量取得部40と、全体識別器50と、部分識別器60と、統合識別器70とを備えている。
=== Scene Identification Processing ===
FIG. 5 is a flowchart of the scene identification process performed by the scene identification unit 33. FIG. 6 is an explanatory diagram of the function of the scene identification unit 33. Each element of the scene identification unit 33 in the figure is realized by software and hardware. The scene identification unit 33 includes a feature amount acquisition unit 40, an overall classifier 50, a partial classifier 60, and an integrated classifier 70 shown in FIG.

最初に、特徴量取得部40が、記憶部31の画像記憶部31Aに展開された画像データを分析し、部分特徴量を取得する(S101)。具体的には、特徴量取得部40は、画像データを8×8の64ブロックに分割し、各ブロックの色平均と分散を算出し、この色平均と分散を部分特徴量として取得する。なお、ここでは各画素はYCC色空間における階調値のデータをもっており、各ブロックごとに、Yの平均値、Cbの平均値及びCrの平均値がそれぞれ算出され、Yの分散、Cbの分散及びCrの分散がそれぞれ算出される。つまり、各ブロックごとに3つの色平均と3つの分散が部分特徴量として算出される。これらの色平均や分散は、各ブロックにおける部分画像の特徴を示すものである。なお、RGB色空間における平均値や分散を算出しても良い。
ブロックごとに色平均と分散が算出されるので、特徴量取得部40は、画像記憶部31Aには画像データの全てを展開せずに、ブロック分の画像データをブロック順に展開する。このため、画像記憶部31Aは、必ずしも画像ファイルの全てを展開できるだけの容量を備えていなくても良い。
First, the feature amount acquisition unit 40 analyzes the image data developed in the image storage unit 31A of the storage unit 31 and acquires partial feature amounts (S101). Specifically, the feature amount acquisition unit 40 divides the image data into 8 × 8 64 blocks, calculates the color average and variance of each block, and acquires the color average and variance as partial feature amounts. Here, each pixel has gradation value data in the YCC color space, and the average value of Y, the average value of Cb, and the average value of Cr are calculated for each block, and the variance of Y and the variance of Cb are calculated. And the variance of Cr are calculated respectively. That is, three color averages and three variances are calculated as partial feature amounts for each block. These color averages and variances indicate the characteristics of the partial images in each block. Note that an average value or variance in the RGB color space may be calculated.
Since the color average and variance are calculated for each block, the feature amount acquisition unit 40 expands the image data for the blocks in the block order without expanding all the image data in the image storage unit 31A. For this reason, the image storage unit 31A does not necessarily have a capacity sufficient to expand all of the image files.

次に、特徴量取得部40が、全体特徴量を取得する(S102)。具体的には、特徴量取得部40は、画像データの全体の色平均、分散、重心及び撮影情報を、全体特徴量として取得する。なお、これらの色平均や分散は、画像の全体の特徴を示すものである。画像データ全体の色平均、分散及び重心は、先に算出した部分特徴量を用いて算出される。このため、全体特徴量を算出する際に、画像データを再度展開する必要がないので、全体特徴量の算出速度が速くなる。全体識別処理(後述)は部分識別処理(後述)よりも先に行われるにも関わらず、全体特徴量が部分特徴量よりも後に求められるのは、このように算出速度を速めるためである。なお、撮影情報は、画像ファイルの撮影データから抽出される。具体的には、絞り値、シャッター速度、フラッシュ発光の有無などの情報が全体特徴量として用いられる。但し、画像ファイルの撮影データの全てが全体特徴量として用いられるわけではない。   Next, the feature amount acquisition unit 40 acquires the entire feature amount (S102). Specifically, the feature quantity acquisition unit 40 acquires the overall color average, variance, center of gravity, and shooting information of the image data as the overall feature quantity. Note that these color averages and variances indicate the overall characteristics of the image. The color average, variance, and center of gravity of the entire image data are calculated using the partial feature values calculated previously. For this reason, it is not necessary to re-expand the image data when calculating the entire feature amount, and the calculation speed of the entire feature amount is increased. Although the overall identification process (described later) is performed prior to the partial identification process (described later), the overall feature value is obtained after the partial feature value in order to increase the calculation speed. The shooting information is extracted from the shooting data of the image file. Specifically, information such as the aperture value, shutter speed, and the presence or absence of flash emission is used as the overall feature amount. However, not all shooting data of the image file is used as the entire feature amount.

次に、全体識別器50が、全体識別処理を行う(S103)。全体識別処理とは、全体特徴量に基づいて、画像データの示す画像のシーンを識別(推定)する処理である。全体識別処理の詳細については、後述する。   Next, the overall classifier 50 performs overall identification processing (S103). The overall identification process is a process for identifying (estimating) an image scene indicated by image data based on the overall feature amount. Details of the overall identification process will be described later.

全体識別処理によってシーンの識別ができる場合(S104でYES)、シーン識別部33は、記憶部31の結果記憶部31Bに識別結果を記憶することによってシーンを決定し(S109)、シーン識別処理を終了する。つまり、全体識別処理によってシーンの識別ができた場合(S104でYES)、部分識別処理や統合識別処理が省略される。これにより、シーン識別処理の速度が速くなる。   If the scene can be identified by the overall identification process (YES in S104), the scene identification unit 33 determines the scene by storing the identification result in the result storage unit 31B of the storage unit 31 (S109), and performs the scene identification process. finish. That is, when the scene can be identified by the overall identification process (YES in S104), the partial identification process and the integrated identification process are omitted. This increases the speed of the scene identification process.

全体識別処理によってシーンの識別ができない場合(S104でNO)、次に部分識別器60が、部分識別処理を行う(S105)。部分識別処理とは、部分特徴量に基づいて、画像データの示す画像全体のシーンを識別する処理である。部分識別処理の詳細については、後述する。   If the scene cannot be identified by the overall identification process (NO in S104), the partial classifier 60 performs the partial identification process (S105). The partial identification process is a process for identifying the scene of the entire image indicated by the image data based on the partial feature amount. Details of the partial identification processing will be described later.

部分識別処理によってシーンの識別ができる場合(S106でYES)、シーン識別部33は、記憶部31の結果記憶部31Bに識別結果を記憶することによってシーンを決定し(S109)、シーン識別処理を終了する。つまり、部分識別処理によってシーンの識別ができた場合(S106でYES)、統合識別処理が省略される。これにより、シーン識別処理の速度が速くなる。
部分識別処理によってシーンの識別ができない場合(S106でNO)、次に統合識別器70が、統合識別処理を行う(S107)。統合識別処理の詳細については、後述する。
When the scene can be identified by the partial identification process (YES in S106), the scene identification unit 33 determines the scene by storing the identification result in the result storage unit 31B of the storage unit 31 (S109), and performs the scene identification process. finish. That is, when the scene can be identified by the partial identification process (YES in S106), the integrated identification process is omitted. This increases the speed of the scene identification process.
If the scene cannot be identified by the partial identification process (NO in S106), the integrated discriminator 70 performs the integrated identification process (S107). Details of the integrated identification process will be described later.

統合識別処理によってシーンの識別ができる場合(S108でYES)、シーン識別部33は、記憶部31の結果記憶部31Bに識別結果を記憶することによってシーンを決定し(S109)、シーン識別処理を終了する。一方、統合識別処理によってシーンの識別ができない場合(S108でNO)、画像データの示す画像が「その他」のシーン(「風景」、「夕景」、「夜景」、「花」又は「紅葉」以外のシーン)である旨の識別結果を結果記憶部31Bに記憶する(S110)。   When the scene can be identified by the integrated identification process (YES in S108), the scene identification unit 33 determines the scene by storing the identification result in the result storage unit 31B of the storage unit 31 (S109), and performs the scene identification process. finish. On the other hand, if the scene cannot be identified by the integrated identification process (NO in S108), the image indicated by the image data is “other” (other than “landscape”, “evening scene”, “night scene”, “flower” or “autumn leaves”. Is stored in the result storage unit 31B (S110).

===全体識別処理===
図7は、全体識別処理のフロー図である。ここでは図6も参照しながら全体識別処理について説明する。
=== Overall identification processing ===
FIG. 7 is a flowchart of the overall identification process. Here, the overall identification process will be described with reference to FIG.

まず、全体識別器50は、複数のサブ識別器51の中から1つのサブ識別器51を選択する(S201)。全体識別器50には、識別対象となる画像(識別対象画像)が特定のシーンに属するか否かを識別するサブ識別器51が5つ設けられている。5つのサブ識別器51は、それぞれ風景、夕景、夜景、花、紅葉のシーンを識別する。ここでは、全体識別器50は、風景→夕景→夜景→花→紅葉の順に、サブ識別器51を選択する(なお、サブ識別器51の選択順序については、後述する)。このため、最初には、識別対象画像が風景のシーンに属するか否かを識別するサブ識別器51(風景識別器51L)が選択される。   First, the overall classifier 50 selects one sub-classifier 51 from the plurality of sub-classifiers 51 (S201). The overall classifier 50 is provided with five sub-classifiers 51 for identifying whether an image to be identified (identification target image) belongs to a specific scene. The five sub classifiers 51 identify scenes of scenery, evening scene, night scene, flowers, and autumn leaves, respectively. Here, the overall classifier 50 selects the sub classifier 51 in the order of landscape → evening scene → night scene → flower → autumn leaves (the selection order of the sub classifier 51 will be described later). For this reason, first, the sub classifier 51 (landscape classifier 51L) for identifying whether or not the classification target image belongs to a landscape scene is selected.

次に、全体識別器50は、識別対象テーブルを参照し、選択したサブ識別器51を用いてシーンを識別すべきか否かを判断する(S202)。
図8は、識別対象テーブルの説明図である。この識別対象テーブルは、記憶部31の結果記憶部31Bに記憶される。識別対象テーブルは、最初の段階では全ての欄がゼロに設定される。S202の処理では、「否定」欄が参照され、ゼロであればYESと判断され、1であればNOと判断される。ここでは、全体識別器50は、識別対象テーブルにおける「風景」欄の「否定」欄を参照し、ゼロであるのでYESと判断する。
Next, the overall classifier 50 refers to the classification target table and determines whether or not a scene should be identified using the selected sub-classifier 51 (S202).
FIG. 8 is an explanatory diagram of the identification target table. This identification target table is stored in the result storage unit 31B of the storage unit 31. In the identification target table, all fields are set to zero in the first stage. In the process of S202, the “No” column is referred to, and if it is zero, it is determined as YES, and if it is 1, it is determined as NO. Here, the overall classifier 50 refers to the “No” column in the “Scenery” column in the identification target table, and determines “YES” because it is zero.

次に、サブ識別器51は、全体特徴量に基づいて、識別対象画像が特定のシーンに属する確率(確信度)を算出する(S203)。本実施形態のサブ識別器51には、サポートベクタマシン(SVM)による識別手法が用いられている。なお、サポートベクタマシンについては、後述する。識別対象画像が特定のシーンに属する場合、サブ識別器51の判別式は、プラスの値になりやすい。識別対象画像が特定のシーンに属しない場合、サブ識別器51の判別式は、マイナスの値になりやすい。また、判別式は、識別対象画像が特定のシーンに属する確信度が高いほど、大きい値になる。このため、判別式の値が大きければ、識別対象画像が特定のシーンに属する確率(確信度)が高くなり、判別式の値が小さければ、識別対象画像が特定のシーンに属する確率が低くなる。   Next, the sub classifier 51 calculates the probability (confidence) that the classification target image belongs to a specific scene based on the entire feature amount (S203). For the sub classifier 51 of this embodiment, a classification method using a support vector machine (SVM) is used. The support vector machine will be described later. When the classification target image belongs to a specific scene, the discriminant of the sub classifier 51 tends to be a positive value. When the classification target image does not belong to a specific scene, the discriminant of the sub classifier 51 tends to be a negative value. Further, the discriminant becomes a larger value as the certainty that the identification target image belongs to the specific scene is higher. For this reason, if the discriminant value is large, the probability (confidence) that the identification target image belongs to a specific scene is high, and if the discriminant value is small, the probability that the classification target image belongs to a specific scene is low. .

次に、サブ識別器51は、判別式の値が肯定閾値より大きいか否かを判断する(S204)。判別式の値が肯定閾値より大きければ、サブ識別器51は、識別対象画像が特定のシーンに属すると判断することになる。   Next, the sub discriminator 51 determines whether or not the value of the discriminant is larger than the positive threshold (S204). If the value of the discriminant is larger than the positive threshold, the sub discriminator 51 determines that the classification target image belongs to a specific scene.

図9は、全体識別処理の肯定閾値の説明図である。同図において、横軸は肯定閾値を示し、縦軸はRecall又はPrecisionの確率を示す。図10は、RecallとPrecisionの説明図である。判別式の値が肯定閾値以上の場合には識別結果はPositiveであり、判別式の値が肯定閾値以上でない場合には識別結果はNegativeである。   FIG. 9 is an explanatory diagram of an affirmative threshold value of the overall identification process. In the figure, the horizontal axis indicates an affirmative threshold, and the vertical axis indicates the probability of recall or precision. FIG. 10 is an explanatory diagram of Recall and Precision. If the discriminant value is greater than or equal to the positive threshold, the identification result is Positive. If the discriminant value is not greater than or equal to the positive threshold, the identification result is Negative.

Recallは、再現率や検出率を示すものである。Recallは、特定のシーンの画像の総数に対する、特定のシーンに属すると識別された画像の数の割合である。言い換えると、Recallは、特定のシーンの画像をサブ識別器51に識別させたときに、サブ識別器51がPositiveと識別する確率(特定のシーンの画像が特定のシーンに属すると識別される確率)を示すものである。例えば、風景画像を風景識別器51Lに識別させたときに、風景のシーンに属すると風景識別器51Lが識別する確率を示すものである。   Recall indicates the recall rate and detection rate. Recall is the ratio of the number of images identified as belonging to a specific scene to the total number of images of the specific scene. In other words, Recall is the probability that the sub-identifier 51 identifies the image as a positive when the image of the specific scene is identified by the sub-identifier 51 (the probability that the image of the specific scene belongs to the specific scene. ). For example, when a landscape image is identified by the landscape classifier 51L, it indicates the probability that the landscape classifier 51L identifies it as belonging to a landscape scene.

Precisionは、正答率や正解率を示すものである。Precisionは、Positiveと識別された画像の総数に対する、特定のシーンの画像の数の割合である。言い換えると、Precisionは、特定のシーンを識別するサブ識別器51がPositiveと識別したときに、識別対象の画像が特定のシーンである確率を示すものである。例えば、風景識別器51Lが風景のシーンに属すると識別したときに、その識別した画像が本当に風景画像である確率を示すものである。   Precision indicates the correct answer rate and the correct answer rate. Precision is the ratio of the number of images in a particular scene to the total number of images identified as Positive. In other words, Precision indicates the probability that the image to be identified is a specific scene when the sub-classifier 51 that identifies the specific scene identifies it as Positive. For example, when the landscape classifier 51L identifies that it belongs to a landscape scene, it indicates the probability that the identified image is really a landscape image.

図9から分かる通り、肯定閾値を大きくするほど、Precisionが大きくなる。このため、肯定閾値を大きくするほど、例えば風景のシーンに属すると識別された画像が風景画像である確率が高くなる。つまり、肯定閾値を大きくするほど、誤識別の確率が低くなる。
一方、肯定閾値を大きくするほど、Recallは小さくなる。この結果、例えば、風景画像を風景識別器51Lで識別した場合であっても、風景のシーンに属すると正しく識別しにくくなる。ところで、識別対象画像が風景のシーンに属すると識別できれば(S204でYES)、残りの別のシーン(夕景など)の識別を行わないようにして全体識別処理の速度を速めている。このため、肯定閾値を大きくするほど、全体識別処理の速度は低下することになる。また、全体識別処理によってシーンが識別できれば部分識別処理を行わないようにしてシーン識別処理の速度を速めているため(S104)、肯定閾値を大きくするほど、シーン識別処理の速度は低下することになる。
つまり、肯定閾値が小さすぎると誤識別の確率が高くなり、大きすぎると処理速度が低下することになる。本実施形態では、正答率(Precision)を97.5%に設定するため、風景の肯定閾値は1.27に設定されている。
As can be seen from FIG. 9, the greater the positive threshold, the greater the Precision. For this reason, the larger the positive threshold value, the higher the probability that an image identified as belonging to a landscape scene, for example, is a landscape image. That is, the greater the positive threshold, the lower the probability of misidentification.
On the other hand, the larger the positive threshold, the smaller the Recall. As a result, for example, even when a landscape image is identified by the landscape classifier 51L, it is difficult to correctly identify it as belonging to a landscape scene. By the way, if the image to be identified can be identified as belonging to a landscape scene (YES in S204), the speed of the overall identification process is increased so as not to identify other remaining scenes (such as sunsets). For this reason, the larger the positive threshold, the lower the overall identification processing speed. Further, if the scene can be identified by the overall identification process, the partial identification process is not performed and the speed of the scene identification process is increased (S104). Therefore, as the positive threshold is increased, the scene identification process speed decreases. Become.
That is, if the positive threshold is too small, the probability of misidentification increases, and if it is too large, the processing speed decreases. In this embodiment, since the correct answer rate (Precision) is set to 97.5%, the landscape affirmation threshold is set to 1.27.

判別式の値が肯定閾値より大きければ(S204でYES)、サブ識別器51は、識別対象画像が特定のシーンに属すると判断し、肯定フラグを立てる(S205)。「肯定フラグを立てる」とは、図8の「肯定」欄を1にすることである。この場合、全体識別器50は、次のサブ識別器51による識別を行わずに、全体識別処理を終了する。例えば、風景画像であると識別できれば、夕景などの識別を行わずに、全体識別処理を終了する。この場合、次のサブ識別器51による識別を省略しているので、全体識別処理の速度を速めることができる。
判別式の値が肯定閾値より大きくなければ(S204でNO)、サブ識別器51は、識別対象画像が特定のシーンに属すると判断できず、次のS206の処理を行う。
If the discriminant value is greater than the affirmative threshold value (YES in S204), the sub-classifier 51 determines that the classification target image belongs to a specific scene and sets an affirmative flag (S205). “Set an affirmative flag” means that the “affirmation” column in FIG. In this case, the overall discriminator 50 ends the overall discrimination process without performing discrimination by the next sub discriminator 51. For example, if the image can be identified as a landscape image, the entire identification process is terminated without identifying the sunset scene or the like. In this case, since the identification by the next sub-identifier 51 is omitted, the speed of the overall identification process can be increased.
If the value of the discriminant is not greater than the positive threshold (NO in S204), the sub discriminator 51 cannot determine that the classification target image belongs to a specific scene, and performs the next process of S206.

次に、サブ識別器51は、判別式の値と否定閾値とを比較する(S206)。これにより、サブ識別器51は、識別対象画像が所定のシーンに属しないかを判断する。このような判断としては、2種類ある。第1に、ある特定のシーンのサブ識別器51の判別式の値が第1否定閾値より小さければ、その特定のシーンに識別対象画像が属しないと判断されることになる。例えば、風景識別器51Lの判別式の値が第1否定閾値より小さければ、識別対象画像が風景のシーンに属しないと判断されることになる。第2に、ある特定のシーンのサブ識別器51の判別式の値が第2否定閾値より大きければ、その特定のシーンとは別のシーンに識別対象画像が属しないと判断されることになる。例えば、風景識別器51Lの判別式の値が第2否定閾値より大きければ、識別対象画像が夜景のシーンに属しないと判断されることになる。   Next, the sub discriminator 51 compares the discriminant value with a negative threshold value (S206). Thereby, the sub classifier 51 determines whether the classification target image does not belong to a predetermined scene. There are two types of such determinations. First, if the value of the discriminant of the sub-identifier 51 of a specific scene is smaller than the first negative threshold, it is determined that the classification target image does not belong to the specific scene. For example, if the discriminant value of the landscape classifier 51L is smaller than the first negative threshold, it is determined that the classification target image does not belong to a landscape scene. Second, if the value of the discriminant of the sub-identifier 51 of a specific scene is larger than the second negative threshold, it is determined that the classification target image does not belong to a scene different from the specific scene. . For example, if the discriminant value of the landscape classifier 51L is larger than the second negative threshold, it is determined that the classification target image does not belong to the night scene.

図11は、第1否定閾値の説明図である。同図において、横軸は第1否定閾値を示し、縦軸は確率を示す。グラフの太線は、True Negative Recallのグラフであり、風景画像以外の画像を風景画像ではないと正しく識別する確率を示している。グラフの細線は、False Negative Recallのグラフであり、風景画像なのに風景画像ではないと誤って識別する確率を示している。   FIG. 11 is an explanatory diagram of the first negative threshold. In the figure, the horizontal axis indicates the first negative threshold, and the vertical axis indicates the probability. The bold line in the graph is a True Negative Recall graph, and indicates the probability of correctly identifying an image other than a landscape image as not a landscape image. The thin line in the graph is a False Negative Recall graph, which indicates the probability of erroneously identifying a landscape image that is not a landscape image.

図11から分かる通り、第1否定閾値を小さくするほど、False Negative Recallが小さくなる。このため、第1否定閾値を小さくするほど、例えば風景のシーンに属しないと識別された画像が風景画像である確率が低くなる。つまり、誤識別の確率が低くなる。
一方、第1否定閾値を小さくするほど、True Negative Recallも小さくなる。この結果、風景画像以外の画像を風景画像ではないと識別しにくくなる。その一方、識別対象画像が特定シーンでないことを識別できれば、部分識別処理の際に、その特定シーンのサブ部分識別器61による処理を省略してシーン識別処理速度を速めている(後述、図14のS302)。このため、第1否定閾値を小さくするほど、シーン識別処理速度は低下する。
つまり、第1否定閾値が大きすぎると誤識別の確率が高くなり、小さすぎると処理速度が低下することになる。本実施形態では、False Negative Recallを2.5%に設定するため、第1否定閾値は−1.10に設定されている。
As can be seen from FIG. 11, the smaller the first negative threshold is, the smaller False Negative Recall is. For this reason, the smaller the first negative threshold, the lower the probability that an image identified as not belonging to a landscape scene is a landscape image, for example. That is, the probability of misidentification is reduced.
On the other hand, the True Negative Recall decreases as the first negative threshold decreases. As a result, it is difficult to identify an image other than a landscape image unless it is a landscape image. On the other hand, if it is possible to identify that the identification target image is not a specific scene, the process by the sub partial classifier 61 for the specific scene is omitted during the partial identification process to increase the scene identification processing speed (described later in FIG. 14). S302). For this reason, the scene identification processing speed decreases as the first negative threshold is decreased.
That is, if the first negative threshold is too large, the probability of misidentification increases, and if it is too small, the processing speed decreases. In the present embodiment, in order to set False Negative Recall to 2.5%, the first negative threshold is set to -1.10.

ところで、ある画像が風景のシーンに属する確率が高ければ、必然的にその画像が夜景のシーンに属する確率は低くなる。このため、風景識別器51Lの判別式の値が大きい場合には、夜景ではないと識別できる場合がある。このような識別を行うために、第2否定閾値が設けられる。   By the way, if the probability that an image belongs to a landscape scene is high, the probability that the image belongs to a night scene is inevitably low. For this reason, when the discriminant value of the landscape discriminator 51L is large, it may be identified that the scene is not a night scene. In order to perform such identification, a second negative threshold is provided.

図12は、第2否定閾値の説明図である。同図において、横軸は風景の判別式の値を示し、縦軸は確率を示す。同図には、図9のRecallとPrecisionのグラフとともに、夜景のRecallのグラフが点線で描かれている。この点線のグラフに注目すると、風景の判別式の値が−0.45よりも大きければ、その画像が夜景画像である確率は2.5%である。言い換えると、風景の判別式の値が−0.45より大きい場合にその画像が夜景画像でないと識別しても、誤識別の確率は2.5%にすぎない。そこで、本実施形態では、第2否定閾値が−0.45に設定されている。   FIG. 12 is an explanatory diagram of the second negative threshold. In the figure, the horizontal axis indicates the value of the landscape discriminant, and the vertical axis indicates the probability. In the same figure, the Recall graph of the night view is drawn with a dotted line together with the Recall and Precision graph of FIG. If attention is paid to this dotted line graph, if the value of the discriminant of the landscape is larger than −0.45, the probability that the image is a night scene image is 2.5%. In other words, if the landscape discriminant value is greater than −0.45, even if the image is identified as not a night scene image, the probability of misidentification is only 2.5%. Therefore, in the present embodiment, the second negative threshold is set to −0.45.

そして、判別式の値が第1否定閾値より小さい場合、又は、判別式の値が第2否定閾値より大きい場合(S206でYES)、サブ識別器51は、識別対象画像が所定のシーンに属しないと判断し、否定フラグを立てる(S207)。「否定フラグを立てる」とは、図8の「否定」欄を1にすることである。例えば、第1否定閾値に基づいて識別対象画像が風景のシーンに属しないと判断された場合、「風景」欄の「否定」欄が1になる。また、第2否定閾値に基づいて識別対象画像が夜景のシーンに属しないと判断された場合、「夜景」欄の「否定」欄が1になる。   When the discriminant value is smaller than the first negative threshold value, or when the discriminant value is larger than the second negative threshold value (YES in S206), the sub-classifier 51 determines that the classification target image belongs to a predetermined scene. It is determined not to do so, and a negative flag is set (S207). “Set a negative flag” means to set the “No” column in FIG. For example, when it is determined that the image to be identified does not belong to a landscape scene based on the first negative threshold, the “denial” column in the “landscape” column is 1. Further, when it is determined that the identification target image does not belong to the night scene based on the second negative threshold, the “Negation” field in the “Night scene” field is “1”.

図13Aは、閾値テーブルの説明図である。この閾値テーブルは、記憶部31に記憶されていても良いし、全体識別処理を実行させるためのプログラムの一部に組み込まれていても良い。閾値テーブルには、前述の肯定閾値や否定閾値に関するデータが格納されている。   FIG. 13A is an explanatory diagram of a threshold table. The threshold value table may be stored in the storage unit 31 or may be incorporated in a part of a program for executing the overall identification process. The threshold table stores data related to the affirmative threshold and the negative threshold described above.

図13Bは、上記で説明した風景識別器51Lにおける閾値の説明図である。風景識別器51Lには、肯定閾値及び否定閾値が予め設定されている。肯定閾値として1.27が設定されている。否定閾値には第1否定閾値と第2否定閾値とがある。第1否定閾値として−1.10が設定されている。また、第2否定閾値として、風景以外の各シーンにそれぞれ値が設定されている。   FIG. 13B is an explanatory diagram of threshold values in the landscape classifier 51L described above. An affirmative threshold value and a negative threshold value are preset in the landscape discriminator 51L. 1.27 is set as the positive threshold. The negative threshold includes a first negative threshold and a second negative threshold. -1.10 is set as the first negative threshold. In addition, a value is set for each scene other than the landscape as the second negative threshold.

図13Cは、上記で説明した風景識別器51Lの処理の概要の説明図である。ここでは、説明の簡略化のため、第2否定閾値については夜景についてのみ説明する。風景識別器51Lは、判別式の値が1.27より大きければ(S204でYES)、識別対象画像が風景のシーンに属すると判断する。また、判別式の値が1.27以下であり(S204でNO)、−0.45より大きければ(S206でYES)、風景識別器51Lは、識別対象画像が夜景のシーンに属しないと判断する。また、判別式の値が−1.10より小さければ(S206でYES)、風景識別器51Lは、識別対象画像が風景のシーンに属しないと判断する。なお、風景識別器51Lは、夕景や花や紅葉についても、第2否定閾値に基づいて、識別対象画像がそのシーンに属しないかを判断する。但し、これらの第2否定閾値は肯定閾値よりも大きいため、識別対象画像がこれらのシーンに属しないことを風景識別器51Lが判断することはない。   FIG. 13C is an explanatory diagram outlining the processing of the landscape classifier 51L described above. Here, for simplification of description, only the night view will be described for the second negative threshold. If the discriminant value is greater than 1.27 (YES in S204), the landscape classifier 51L determines that the classification target image belongs to a landscape scene. If the discriminant value is 1.27 or less (NO in S204) and is greater than −0.45 (YES in S206), the landscape classifier 51L determines that the classification target image does not belong to the night scene. To do. If the value of the discriminant is smaller than −1.10 (YES in S206), the landscape classifier 51L determines that the classification target image does not belong to a landscape scene. Note that the landscape discriminator 51L also determines whether the image to be identified does not belong to the scene based on the second negative threshold for sunset scenes, flowers, and autumn leaves. However, since these second negative threshold values are larger than the positive threshold values, the landscape discriminator 51L does not determine that the classification target image does not belong to these scenes.

S202においてNOの場合、S206でNOの場合、又はS207の処理を終えた場合、全体識別器50は、次のサブ識別器51の有無を判断する(S208)。ここでは風景識別器51Lによる処理を終えた後なので、全体識別器50は、S208において、次のサブ識別器51(夕景識別器51S)があると判断する。   In the case of NO in S202, in the case of NO in S206, or when the processing in S207 is completed, the overall discriminator 50 determines the presence or absence of the next sub discriminator 51 (S208). Here, since the process by the landscape classifier 51L is finished, the overall classifier 50 determines in S208 that there is a next sub-classifier 51 (evening scene classifier 51S).

そして、S205の処理を終えた場合(識別対象画像が特定のシーンに属すると判断された場合)、又は、S208において次のサブ識別器51がないと判断された場合(識別対象画像が特定のシーンに属すると判断できなかった場合)、全体識別器50は、全体識別処理を終了する。   Then, when the process of S205 is finished (when it is determined that the identification target image belongs to a specific scene), or when it is determined in S208 that there is no next sub-classifier 51 (the identification target image is a specific image). When it cannot be determined that the scene belongs to the scene), the overall discriminator 50 ends the overall discrimination process.

なお、既に説明した通り、全体識別処理が終了すると、シーン識別部33は、全体識別処理によってシーンの識別ができたか否かを判断する(図5のS104)。このとき、シーン識別部33は、図8の識別対象テーブルを参照し、「肯定」欄に1があるか否かを判断することになる。
全体識別処理によってシーンの識別ができた場合(S104でYES)、部分識別処理や統合識別処理が省略される。これにより、シーン識別処理の速度が速くなる。
As already described, when the overall identification process is completed, the scene identification unit 33 determines whether or not the scene has been identified by the overall identification process (S104 in FIG. 5). At this time, the scene identification unit 33 refers to the identification target table in FIG. 8 and determines whether or not there is 1 in the “affirmation” column.
If the scene can be identified by the overall identification process (YES in S104), the partial identification process and the integrated identification process are omitted. This increases the speed of the scene identification process.

ところで、上記の説明には無いが、全体識別器50は、サブ識別器51によって判別式の値を算出したときには、判別式の値に対応するPrecisionを、確信度に関する情報として結果記憶部31Bに記憶する(後述する図19も参照)。もちろん、判別式の値そのものを確信度に関する情報として記憶しても良い。   By the way, although not described above, the overall discriminator 50, when the sub discriminator 51 calculates the discriminant value, the Precision corresponding to the discriminant value is stored in the result storage unit 31B as information on the certainty factor. Store (see also FIG. 19 described later). Of course, the discriminant value itself may be stored as information on the certainty factor.

===部分識別処理===
図14は、部分識別処理のフロー図である。部分識別処理は、全体識別処理によってシーンの識別ができなかった場合(図5のS104でNO)に行われる。以下に説明するように、部分識別処理は、分割された部分画像のシーンをそれぞれ識別することによって、画像全体のシーンを識別する処理である。ここでは図6も参照しながら部分識別処理について説明する。
=== Partial identification processing ===
FIG. 14 is a flowchart of the partial identification process. The partial identification process is performed when the scene cannot be identified by the overall identification process (NO in S104 of FIG. 5). As will be described below, the partial identification process is a process for identifying the scene of the entire image by identifying each scene of the divided partial images. Here, the partial identification process will be described with reference to FIG.

まず、部分識別器60は、複数のサブ部分識別器61の中から1つのサブ部分識別器61を選択する(S301)。部分識別器60には、サブ部分識別器61が3つ設けられている。各サブ部分識別器61は、8×8の64ブロックに分割された部分画像がそれぞれ特定のシーンに属するか否かを識別する。ここでの3つのサブ部分識別器61は、それぞれ夕景、花、紅葉のシーンを識別する。ここでは、部分識別器60は、夕景→花→紅葉の順に、サブ部分識別器61を選択する(なお、サブ部分識別器61の選択順序については、後述する)。このため、最初には、部分画像が夕景のシーンに属するか否かを識別するサブ部分識別器61(夕景部分識別器61S)が選択される。   First, the partial classifier 60 selects one sub partial classifier 61 from the plurality of sub partial classifiers 61 (S301). The partial discriminator 60 is provided with three sub partial discriminators 61. Each sub partial discriminator 61 discriminates whether or not each partial image divided into 8 × 8 64 blocks belongs to a specific scene. Here, the three sub partial classifiers 61 identify the scenes of sunset, flowers, and autumn leaves, respectively. Here, the partial discriminator 60 selects the sub partial discriminator 61 in the order of sunset scene → flower → autumn leaves (the selection order of the sub partial discriminator 61 will be described later). Therefore, first, the sub partial classifier 61 (evening scene partial classifier 61S) for identifying whether or not the partial image belongs to the sunset scene is selected.

次に、部分識別器60は、識別対象テーブル(図8)を参照し、選択したサブ部分識別器61を用いてシーンを識別すべきか否かを判断する(S302)。ここでは、部分識別器60は、識別対象テーブルにおける「夕景」欄の「否定」欄を参照し、ゼロであればYESと判断し、1であればNOと判断する。なお、全体識別処理の際に、夕景識別器51Sが第1否定閾値により否定フラグを立てたとき、又は、他のサブ識別器51が第2否定閾値により否定フラグを立てたとき、このS302でNOと判断される。仮にNOと判断されると夕景の部分識別処理は省略されることになるので、部分識別処理の速度が速くなる。但し、ここでは説明の都合上、YESと判断されるものとする。   Next, the partial discriminator 60 refers to the discrimination target table (FIG. 8) and determines whether or not the scene should be discriminated using the selected sub partial discriminator 61 (S302). Here, the partial discriminator 60 refers to the “No” column of the “Evening Scene” column in the classification target table, and determines YES if it is zero, and NO if it is 1. When the evening scene classifier 51S sets a negative flag with the first negative threshold during the overall identification process or when another sub-classifier 51 sets a negative flag with the second negative threshold, in S302 It is judged as NO. If it is determined NO, the sunset partial identification process is omitted, and the partial identification process speed increases. However, for the convenience of explanation, it is assumed that YES is determined here.

次に、サブ部分識別器61は、8×8の64ブロックに分割された部分画像の中から、1つの部分画像を選択する(S303)。
図15は、夕景部分識別器61Sが選択する部分画像の順番の説明図である。部分画像から画像全体のシーンを識別するような場合、識別に用いられる部分画像は、被写体が存在する部分であることが望ましい。そこで、本実施形態では、数千枚のサンプルの夕景画像を用意し、各夕景画像を8×8の64ブロックに分割し、夕景部分画像(夕景の太陽と空の部分画像)を含むブロックを抽出し、抽出されたブロックの位置に基づいて各ブロックにおける夕景部分画像の存在確率を算出した。そして、本実施形態では、存在確率の高いブロックから順番に、部分画像が選択される。なお、図に示す選択順序の情報は、プログラムの一部としてメモリ23に格納されている。
Next, the sub partial discriminator 61 selects one partial image from the partial images divided into 8 × 8 64 blocks (S303).
FIG. 15 is an explanatory diagram of the order of partial images selected by the evening scene partial classifier 61S. When a scene of the entire image is identified from the partial image, it is desirable that the partial image used for identification is a portion where the subject exists. Therefore, in this embodiment, thousands of samples of sunset scene images are prepared, each sunset scene image is divided into 64 blocks of 8 × 8, and blocks including sunset scene partial images (sun and sky partial images of the sunset scene) are included. The presence probability of the sunset partial image in each block was calculated based on the extracted block position. And in this embodiment, a partial image is selected in an order from a block with a high existence probability. Note that the selection order information shown in the figure is stored in the memory 23 as part of the program.

なお、夕景画像の場合、画像の中央付近から上半分に夕景の空が広がっていることが多いため、中央付近から上半分のブロックにおいて存在確率が高くなる。また、夕景画像の場合、画像の下1/3では逆光で陰になり、部分画像単体では夕景か夜景か区別がつかないことが多いため、下1/3のブロックにおいて存在確率が低くなる。花画像の場合、花を中央付近に配置させる構図にすることが多いため、中央付近における花部分画像の存在確率が高くなる。   In the case of an evening scene image, since the sky of the evening scene often spreads from the vicinity of the center to the upper half, the existence probability increases in the upper half block from the vicinity of the center. In the case of an evening scene image, the lower 1/3 of the image is shaded by backlight, and the partial image alone often cannot be distinguished from the evening scene or the night scene, so the existence probability is lower in the lower 1/3 block. In the case of a flower image, since the composition is often such that a flower is arranged near the center, the probability of existence of a flower partial image near the center increases.

次に、サブ部分識別器61は、選択された部分画像の部分特徴量に基づいて、その部分画像が特定のシーンに属するか否かを判断する(S304)。サブ部分識別器61には、全体識別器50のサブ識別器51と同様に、サポートベクタマシン(SVM)による判別手法が用いられている。なお、サポートベクタマシンについては、後述する。判別式の値が正の値であれば、部分画像が特定のシーンに属すると判断し、サブ部分識別器61は正カウント値をインクリメントする。また、判別式の値が負の値であれば、部分画像が特定のシーンに属しないと判断し、サブ部分識別器61は負カウント値をインクリメントする。   Next, the sub partial classifier 61 determines whether or not the partial image belongs to a specific scene based on the partial feature amount of the selected partial image (S304). Similar to the sub classifier 51 of the overall classifier 50, the sub partial classifier 61 uses a discrimination method using a support vector machine (SVM). The support vector machine will be described later. If the discriminant value is a positive value, it is determined that the partial image belongs to a specific scene, and the sub partial classifier 61 increments the positive count value. If the discriminant value is a negative value, it is determined that the partial image does not belong to a specific scene, and the sub partial discriminator 61 increments the negative count value.

次に、サブ部分識別器61は、正カウント値が肯定閾値よりも大きい否かを判断する(S305)。なお、正カウント値は、特定のシーンに属すると判断された部分画像の数を示すものである。正カウント値が肯定閾値より大きければ(S305でYES)、サブ部分識別器61は、識別対象画像が特定のシーンに属すると判断し、肯定フラグを立てる(S306)。この場合、部分識別器60は、次のサブ部分識別器61による識別を行わずに、部分識別処理を終了する。例えば、夕景画像であると識別できれば、花や紅葉の識別を行わずに、部分識別処理を終了する。この場合、次のサブ部分識別器61による識別を省略しているので、部分識別処理の速度を速めることができる。   Next, the sub partial discriminator 61 determines whether or not the positive count value is larger than the positive threshold value (S305). The positive count value indicates the number of partial images determined to belong to a specific scene. If the positive count value is larger than the affirmative threshold (YES in S305), the sub partial classifier 61 determines that the classification target image belongs to a specific scene, and sets an affirmative flag (S306). In this case, the partial discriminator 60 ends the partial discriminating process without performing discrimination by the next sub partial discriminator 61. For example, if the image can be identified as an evening scene image, the partial identification process is terminated without identifying flowers and autumn leaves. In this case, since the identification by the next sub partial classifier 61 is omitted, the speed of the partial classification process can be increased.

正カウント値が肯定閾値より大きくなければ(S305でNO)、サブ部分識別器61は、識別対象画像が特定のシーンに属すると判断できず、次のS307の処理を行う。   If the positive count value is not greater than the positive threshold value (NO in S305), the sub partial classifier 61 cannot determine that the classification target image belongs to a specific scene, and performs the next process of S307.

サブ部分識別器61は、正カウント値と残りの部分画像数との和が肯定閾値よりも小さければ(S307でYES)、S309の処理へ進む。正カウント値と残りの部分画像数との和が肯定閾値よりも小さい場合、残り全ての部分画像によって正カウント値がインクリメントされても正カウント値が肯定閾値より大きくなることがないので、S309に処理を進めることによって、残りの部分画像についてサポートベクタマシンによる識別を省略する。これにより、部分識別処理の速度を速めることができる。   If the sum of the positive count value and the number of remaining partial images is smaller than the positive threshold (YES in S307), the sub partial discriminator 61 proceeds to the process of S309. If the sum of the positive count value and the number of remaining partial images is smaller than the positive threshold value, the positive count value does not become larger than the positive threshold value even if the positive count value is incremented by all the remaining partial images. By proceeding with the process, the remaining partial images are not identified by the support vector machine. Thereby, the speed of the partial identification process can be increased.

サブ部分識別器61がS307でNOと判断した場合、サブ部分識別器61は、次の部分画像の有無を判断する(S308)。なお、本実施形態では、64個に分割された部分画像の全てを順に選択していない。図15において太枠で示された上位10番目までの10個の部分画像だけを順に選択している。このため、10番目の部分画像の識別を終えれば、サブ部分識別器61は、S308において次の部分画像はないと判断する。(この点を考慮して、S307の「残りの部分画像数」も決定される。)
図16は、上位10番目までの10個の部分画像だけで夕景画像の識別をしたときのRecall及びPrecisionのグラフである。図に示すような肯定閾値を設定すれば、正答率(Precision)を80%程度に設定でき、再現率(Recall)を90%程度に設定でき、精度の高い識別が可能である。
If the sub partial discriminator 61 determines NO in S307, the sub partial discriminator 61 determines whether there is a next partial image (S308). In the present embodiment, not all of the partial images divided into 64 are selected in order. In FIG. 15, only the top 10 partial images indicated by thick frames are selected in order. Therefore, when the identification of the tenth partial image is completed, the sub partial classifier 61 determines in S308 that there is no next partial image. (In consideration of this point, the “number of remaining partial images” in S307 is also determined.)
FIG. 16 is a Recall and Precision graph when an evening scene image is identified using only the top 10 partial images. If an affirmative threshold as shown in the figure is set, the accuracy rate (Precision) can be set to about 80%, the recall rate (Recall) can be set to about 90%, and identification with high accuracy is possible.

本実施形態では、10個の部分画像だけで夕景画像の識別を行っている。このため、本実施形態では、64個の全ての部分画像を用いて夕景画像の識別を行うよりも、部分識別処理の速度を速めることができる。
また、本実施形態では、夕景部分画像の存在確率の高い上位10番目の部分画像を用いて夕景画像の識別を行っている。このため、本実施形態では、存在確率を無視して抽出された10個の部分画像を用いて夕景画像の識別を行うよりも、Recall及びPrecisionをともに高く設定することが可能になる。
また、本実施形態では、夕景部分画像の存在確率の高い順に部分画像を選択している。この結果、早い段階でS305の判断がYESになりやすくなる。このため、本実施形態では、存在確率の高低を無視した順で部分画像を選択したときよりも、部分識別処理の速度を速めることができる。
In this embodiment, the evening scene image is identified using only 10 partial images. For this reason, in the present embodiment, it is possible to increase the speed of the partial identification process compared to the case where the evening scene image is identified using all 64 partial images.
In this embodiment, the sunset scene image is identified using the top tenth partial image having a high existence probability of the sunset scene partial image. For this reason, in the present embodiment, it is possible to set both Recall and Precision higher than the identification of an evening scene image using 10 partial images extracted by ignoring the existence probability.
In this embodiment, the partial images are selected in descending order of the existence probability of the sunset partial image. As a result, the determination in S305 is likely to be YES at an early stage. For this reason, in the present embodiment, the speed of the partial identification process can be increased as compared with the case where the partial images are selected in the order in which the presence probability level is ignored.

S307においてYESと判断された場合、又は、S308において次の部分画像がないと判断された場合、サブ部分識別器61は、負カウント値が否定閾値よりも大きいか否かを判断する(S309)。この否定閾値は、前述の全体識別処理における否定閾値(図7のS206)とほぼ同様の機能を果たすものなので、詳しい説明は省略する。S309でYESと判断された場合、図7のS207と同様に、否定フラグを立てる。   When it is determined YES in S307, or when it is determined that there is no next partial image in S308, the sub partial discriminator 61 determines whether or not the negative count value is larger than the negative threshold (S309). . Since this negative threshold performs substantially the same function as the negative threshold (S206 in FIG. 7) in the above-described overall identification process, detailed description thereof is omitted. When YES is determined in S309, a negative flag is set as in S207 of FIG.

S302においてNOの場合、S309でNOの場合、又はS310の処理を終えた場合、部分識別器60は、次のサブ部分識別器61の有無を判断する(S311)。夕景部分識別器61Sによる処理を終えた後の場合、サブ部分識別器61として花部分識別器61Fや紅葉部分識別器61Rがまだあるので、部分識別器60は、S311において、次のサブ部分識別器61があると判断する。   In the case of NO in S302, in the case of NO in S309, or when the process of S310 is completed, the partial discriminator 60 determines whether or not there is a next sub partial discriminator 61 (S311). In the case after the processing by the evening scene partial classifier 61S is finished, since the flower partial classifier 61F and the autumnal leaves partial classifier 61R are still present as the sub partial classifier 61, the partial classifier 60 determines the next sub partial classifier in S311. It is determined that there is a container 61.

そして、S306の処理を終えた場合(識別対象画像が特定のシーンに属すると判断された場合)、又は、S311において次のサブ部分識別器61がないと判断された場合(識別対象画像が特定のシーンに属すると判断できなかった場合)、部分識別器60は、部分識別処理を終了する。   Then, when the process of S306 is completed (when it is determined that the identification target image belongs to a specific scene), or when it is determined in S311 that there is no next sub partial classifier 61 (the identification target image is specified). If it cannot be determined that the scene belongs to the scene), the partial discriminator 60 ends the partial discrimination processing.

なお、既に説明した通り、部分識別処理が終了すると、シーン識別部33は、部分識別処理によってシーンの識別ができたか否かを判断する(図5のS106)。このとき、シーン識別部33は、図8の識別対象テーブルを参照し、「肯定」欄に1があるか否かを判断することになる。
部分識別処理によってシーンの識別ができた場合(S106でYES)、統合識別処理が省略される。これにより、シーン識別処理の速度が速くなる。
As already described, when the partial identification process is completed, the scene identification unit 33 determines whether or not the scene has been identified by the partial identification process (S106 in FIG. 5). At this time, the scene identification unit 33 refers to the identification target table in FIG. 8 and determines whether or not there is 1 in the “affirmation” column.
When the scene can be identified by the partial identification process (YES in S106), the integrated identification process is omitted. This increases the speed of the scene identification process.

ところで、上記の説明では、夕景部分識別器61Sは、10個の部分画像を用いて夕景画像の識別を行っているが、識別に用いられる部分画像の数は10個に限られるものではない。また、他のサブ部分識別器61が、夕景部分識別器61Sとは異なる数の部分画像を用いて画像を識別しても良い。本実施形態では、花部分識別器61Fは20個の部分画像を用いて花画像を識別し、また、紅葉部分識別器61Rは15個の部分画像を用いて紅葉画像を識別するものとする。   In the above description, the evening scene partial classifier 61S identifies evening scene images using ten partial images. However, the number of partial images used for identification is not limited to ten. Further, the other sub partial classifier 61 may identify an image using a different number of partial images from the sunset scene partial classifier 61S. In the present embodiment, it is assumed that the flower partial discriminator 61F identifies a flower image using 20 partial images, and the autumnal foliage partial discriminator 61R identifies a autumnal foliage image using 15 partial images.

===サポートベクタマシン===
統合識別処理について説明する前に、全体識別処理のサブ識別器51や部分識別処理のサブ部分識別器61において用いられているサポートベクタマシン(SVM)について説明する。
=== Support vector machine ===
Before describing the integrated identification process, the support vector machine (SVM) used in the sub-identifier 51 for the overall identification process and the sub-partial identifier 61 for the partial identification process will be described.

図17Aは、線形サポートベクタマシンによる判別の説明図である。ここでは、2つの特徴量x1、x2によって、学習用サンプルを2次元空間に示している。学習用サンプルは2つのクラスA、Bに分けられている。図中では、クラスAに属するサンプルは丸で示されており、クラスBに属するサンプルは四角で示されている。
学習用サンプルを用いた学習によって、2次元空間を2つに分ける境界が定義される。境界は、<w・x>+b=0で定義される(なお、x=(x1,x2)であり、wは重みベクトルであり、<w・x>はwとxの内積である)。但し、境界は、マージンが最大になるように、学習用サンプルを用いた学習によって定義される。つまり、図の場合、境界は、太点線ではなく、太実線のようになる。
判別は、判別式f(x)=<w・x>+bを用いて行われる。ある入力x(この入力xは学習用サンプルとは別である)について、f(x)>0であればクラスAに属すると判別され、f(x)<0であればクラスBに属すると判別される。
FIG. 17A is an explanatory diagram of determination by the linear support vector machine. Here, the learning sample is shown in a two-dimensional space by two feature amounts x1 and x2. The learning sample is divided into two classes A and B. In the figure, samples belonging to class A are indicated by circles, and samples belonging to class B are indicated by squares.
A boundary that divides the two-dimensional space into two is defined by learning using the learning sample. The boundary is defined by <w · x> + b = 0 (where x = (x1, x2), w is a weight vector, and <w · x> is an inner product of w and x). However, the boundary is defined by learning using a learning sample so that the margin is maximized. That is, in the case of the figure, the boundary is not a thick dotted line but a thick solid line.
The discrimination is performed using the discriminant f (x) = <w · x> + b. It is determined that a certain input x (this input x is different from the learning sample) belongs to class A if f (x)> 0, and belongs to class B if f (x) <0. Determined.

ここでは2次元空間を用いて説明しているが、これに限られない(つまり、特徴量は2以上でも良い)。この場合、境界は超平面で定義される。   Here, the description is made using a two-dimensional space, but the present invention is not limited to this (that is, the feature amount may be two or more). In this case, the boundary is defined by a hyperplane.

ところで、2つのクラスに線形関数で分離できないことがある。このような場合に線形サポートベクタマシンによる判別を行うと、判別結果の精度が低下する。そこで、入力空間の特徴量を非線形変換すれば、すなわち入力空間からある特徴空間へ非線形写像すれば、特徴空間において線形関数で分離することができるようになる。非線形サポートベクタマシンでは、これを利用している。   By the way, there are cases where the two classes cannot be separated by a linear function. In such a case, if the determination is performed by the linear support vector machine, the accuracy of the determination result is lowered. Therefore, if the feature quantity of the input space is nonlinearly transformed, that is, if the input space is nonlinearly mapped to a certain feature space, it can be separated by a linear function in the feature space. This is used in the nonlinear support vector machine.

図17Bは、カーネル関数を用いた判別の説明図である。ここでは、2つの特徴量x1、x2によって、学習用サンプルを2次元空間に示している。図17Bの入力空間からの非線形写像が図17Aのような特徴空間になれば、線形関数で2つのクラスに分離することが可能になる。この特徴空間においてマージンが最大になるように境界が定義されれば、特徴空間における境界の逆写像が、図17Bに示す境界になる。この結果、図17Bに示すように、境界は非線形になる。   FIG. 17B is an explanatory diagram of discrimination using a kernel function. Here, the learning sample is shown in a two-dimensional space by two feature amounts x1 and x2. If the nonlinear mapping from the input space of FIG. 17B becomes a feature space as shown in FIG. 17A, it can be separated into two classes by a linear function. If the boundary is defined so that the margin is maximized in this feature space, the inverse mapping of the boundary in the feature space becomes the boundary shown in FIG. 17B. As a result, the boundary becomes nonlinear as shown in FIG. 17B.

本実施形態ではガウスカーネルを利用することにより、判別式f(x)は次式のようになる(なお、Mは特徴量の数であり、Nは学習用サンプルの数(若しくは境界に寄与する学習用サンプルの数)であり、wは重み係数であり、yは学習用サンプルの特徴量であり、xは入力xの特徴量である)。

Figure 2008242638
In this embodiment, by using a Gaussian kernel, the discriminant f (x) becomes as follows (where M is the number of features and N is the number of learning samples (or contributes to the boundary): The number of learning samples), w i is a weighting factor, y j is the feature quantity of the learning sample, and x j is the feature quantity of the input x).
Figure 2008242638

ある入力x(この入力xは学習用サンプルとは別である)について、f(x)>0であればクラスAに属すると判別され、f(x)<0であればクラスBに属すると判別される。また、判別式f(x)の値が大きい値になるほど、入力x(この入力xは学習用サンプルとは別である)がクラスAに属する確率が高くなる。逆に、判別式f(x)の値が小さい値になるほど、入力x(この入力xは学習用サンプルとは別である)がクラスAに属する確率が低くなる。   It is determined that a certain input x (this input x is different from the learning sample) belongs to class A if f (x)> 0, and belongs to class B if f (x) <0. Determined. Further, the larger the value of the discriminant f (x), the higher the probability that the input x (this input x is different from the learning sample) belongs to the class A. On the contrary, the smaller the value of the discriminant f (x), the lower the probability that the input x (this input x is different from the learning sample) belongs to the class A.

前述の全体識別処理のサブ識別器51や部分識別処理のサブ部分識別器61では、上記のサポートベクタマシンの判別式f(x)の値を用いている。サポートベクタマシンによる判別式f(x)の値の算出には、学習用サンプルの数(本実施形態では数万個)が多くなると時間がかかる。このため、判別式f(x)の値を複数回算出する必要があるサブ部分識別器61は、判別式f(x)の値を1回算出すれば済むサブ識別器51よりも、処理時間がかかる。   In the sub-identifier 51 for the overall identification process and the sub-partial identifier 61 for the partial identification process, the value of the discriminant f (x) of the support vector machine is used. The calculation of the value of the discriminant f (x) by the support vector machine takes time when the number of learning samples (in this embodiment, tens of thousands) increases. For this reason, the sub partial classifier 61 that needs to calculate the value of the discriminant f (x) a plurality of times requires more processing time than the sub classifier 51 that only needs to calculate the value of the discriminant f (x) once. It takes.

なお、学習用サンプルとは別に評価用サンプルが用意されている。前述のRecallやPrecisionのグラフは、評価用サンプルに対する識別結果に基づくものである。   An evaluation sample is prepared separately from the learning sample. The above Recall and Precision graphs are based on the identification results for the evaluation samples.

===統合識別処理===
前述の全体識別処理や部分識別処理では、サブ識別器51やサブ部分識別器61における肯定閾値を比較的高めに設定し、Precision(正解率)を高めに設定している。なぜならば、例えば全体識別器の風景識別器51Lの正解率が低く設定されると、風景識別器51Lが紅葉画像を風景画像であると誤識別してしまい、紅葉識別器51Rによる識別を行う前に全体識別処理を終えてしまう事態が発生してしまうからである。本実施形態では、Precision(正解率)が高めに設定されることにより、特定のシーンに属する画像が特定のシーンのサブ識別器51(又はサブ部分識別器61)に識別されるようになる(例えば紅葉画像が紅葉識別器51R(又は紅葉部分識別器61R)によって識別されるようになる)。
=== Integrated identification processing ===
In the above-described overall identification process and partial identification process, the positive threshold value in the sub-classifier 51 and the sub-classifier 61 is set relatively high, and the Precision (correct answer rate) is set high. This is because, for example, if the accuracy rate of the landscape classifier 51L of the overall classifier is set low, the scene classifier 51L erroneously identifies the autumnal image as a landscape image, and before the autumnal classifier 51R performs the classification. This is because a situation occurs in which the entire identification process ends. In the present embodiment, by setting the Precision (accuracy rate) high, an image belonging to a specific scene is identified by the sub-classifier 51 (or sub-partial classifier 61) of the specific scene ( For example, the autumnal leaves image is identified by the autumnal leaves discriminator 51R (or the autumnal leaf partial discriminator 61R).

但し、全体識別処理や部分識別処理のPrecision(正解率)を高めに設定すると、全体識別処理や部分識別処理ではシーンの識別ができなくなる可能性が高くなる。そこで、本実施形態では、全体識別処理及び部分識別処理によってシーンの識別ができなかった場合、以下に説明する統合識別処理が行われる。   However, if the Precision (accuracy rate) of the overall identification process or the partial identification process is set to be high, there is a high possibility that the scene cannot be identified by the overall identification process or the partial identification process. Therefore, in this embodiment, when the scene cannot be identified by the overall identification process and the partial identification process, the integrated identification process described below is performed.

図18は、統合識別処理のフロー図である。以下に説明するように、統合識別処理は、全体識別処理の各サブ識別器51の判別式の値に基づいて、最も確信度の高いシーンを選択する処理である。   FIG. 18 is a flowchart of the integrated identification process. As will be described below, the integrated identification process is a process of selecting a scene with the highest certainty factor based on the discriminant value of each sub-classifier 51 in the overall identification process.

まず、統合識別器70は、5つのサブ識別器51の判別式の値に基づいて、正となるシーンを抽出する(S401)。このとき、全体識別処理の際に各サブ識別器51が算出した判別式の値が用いられる。   First, the integrated discriminator 70 extracts a positive scene based on the discriminant values of the five sub discriminators 51 (S401). At this time, the value of the discriminant calculated by each sub classifier 51 during the overall identification process is used.

次に、統合識別器70は、判別式の値が正のシーンが存在するか否かを判断する(S402)。
判別式の値が正のシーンが存在する場合(S402でYES)、最大値のシーンの欄に肯定フラグを立てて(S403)、統合識別処理を終了する。これにより、最大値のシーンに識別対象画像が属すると判断される。
一方、判別式の値が正であるシーンが存在しない場合(S402でNO)、肯定フラグを立てずに、統合識別処理を終了する。これにより、図8の識別対象テーブルの肯定欄において、1のシーンが無いままの状態になる。つまり、識別対象画像が、どのシーンに属するか識別できなかったことになる。
Next, the integrated discriminator 70 determines whether or not a scene having a positive discriminant value exists (S402).
If there is a scene with a positive discriminant value (YES in S402), an affirmative flag is set in the maximum value scene column (S403), and the integrated identification process is terminated. Accordingly, it is determined that the identification target image belongs to the maximum value scene.
On the other hand, if there is no scene having a positive discriminant value (NO in S402), the integrated identification process is terminated without setting an affirmative flag. As a result, there is no scene in the affirmative column of the identification target table in FIG. That is, it cannot be identified to which scene the identification target image belongs.

なお、既に説明した通り、統合識別処理が終了すると、シーン識別部33は、統合識別処理によってシーンの識別ができたか否かを判断する(図5のS108)。このとき、シーン識別部33は、図8の識別対象テーブルを参照し、「肯定」欄に1があるか否かを判断することになる。S402でNOとの判断の場合、S108の判断もNOになる。   As already described, when the integrated identification process is completed, the scene identification unit 33 determines whether or not the scene has been identified by the integrated identification process (S108 in FIG. 5). At this time, the scene identification unit 33 refers to the identification target table in FIG. 8 and determines whether or not there is 1 in the “affirmation” column. If it is determined NO in S402, the determination in S108 is also NO.

===サブ識別器・サブ部分識別器の選択順序===
<概要>
上記の説明では、全体識別器50は、図7のS201において、風景→夕景→夜景→花→紅葉の順に、サブ識別器51を選択している。また、部分識別器60は、図14のS301において、夕景→花→紅葉の順に、サブ部分識別器61を選択している。
但し、サブ識別器51(又はサブ部分識別器61)の順序を固定してしまうと、シーン識別処理の処理速度を速くすることができない。例えば、識別対象画像が紅葉画像である可能性が高いにもかかわらず、全体識別処理において紅葉識別器51Rを最後に選択したり、部分識別処理において紅葉部分識別器61Rを最後に選択したりすると、シーン識別処理の処理速度の期待値は遅くなる。
そこで、本実施形態では、識別対象画像の評価結果に応じて、サブ識別器51やサブ部分識別器61の選択順序を変更している。
=== Selection Order of Sub Classifier / Sub Partial Classifier ===
<Overview>
In the above description, the overall classifier 50 selects the sub-classifier 51 in the order of landscape → evening scene → night scene → flower → autumn leaves in S201 in FIG. Further, the partial discriminator 60 selects the sub partial discriminator 61 in the order of evening scene → flower → autumn leaves in S301 of FIG.
However, if the order of the sub classifier 51 (or sub partial classifier 61) is fixed, the processing speed of the scene classification process cannot be increased. For example, when there is a high possibility that the image to be identified is an autumnal image, the autumnal color classifier 51R is selected last in the overall classification process, or the autumnal color partial classifier 61R is selected last in the partial identification process. The expected value of the processing speed of the scene identification process is slow.
Therefore, in this embodiment, the selection order of the sub classifier 51 and the sub partial classifier 61 is changed according to the evaluation result of the classification target image.

<第1実施例>
この第1実施例では、全体識別処理において算出された確信度を識別対象画像の評価結果として利用し、部分識別処理におけるサブ部分識別器61の選択順序を変更する。以下、第1実施例を詳しく説明する。
<First embodiment>
In the first embodiment, the certainty factor calculated in the overall identification process is used as the evaluation result of the identification target image, and the selection order of the sub partial classifiers 61 in the partial identification process is changed. The first embodiment will be described in detail below.

前述の部分識別処理は、全体識別処理(図5のS103)によってシーンの識別ができない場合(S104でNO)に、行われる(S105)。つまり、部分識別処理が行われる前には、必ず全体識別処理が行われている。   The partial identification process described above is performed when the scene cannot be identified (NO in S104) by the overall identification process (S103 in FIG. 5) (S105). That is, the entire identification process is always performed before the partial identification process is performed.

図19は、全体識別処理の際に算出された確信度の説明図である。前述したように、全体識別器50は、サブ識別器51によって判別式の値を算出したときには、判別式の値に対応するPrecisionを、確信度に関する情報として結果記憶部31Bに記憶している。ここでは、風景の確信度が0%であり、夕景の確信度が30%であり、夜景の確信度が0%であり、花の確信度が40%であり、紅葉の確信度が30%であるとする。なお、ここでは全てのシーンの確信度の合計がちょうど100%になっているが、各シーンの確信度は判別式の値に基づいて算出しているので、全てのシーンの確信度の合計が100%にならないこともある。   FIG. 19 is an explanatory diagram of the certainty factor calculated in the overall identification process. As described above, when the discriminant value is calculated by the sub discriminator 51, the overall discriminator 50 stores the Precision corresponding to the discriminant value in the result storage unit 31B as information on the certainty factor. Here, the certainty of the landscape is 0%, the certainty of the evening scene is 30%, the certainty of the night view is 0%, the certainty of the flower is 40%, and the certainty of the autumn leaves is 30%. Suppose that Here, the total certainty of all scenes is exactly 100%, but the certainty of each scene is calculated based on the discriminant value, so the total certainty of all scenes is It may not be 100%.

部分識別器60は、図14のS301において、まず、図19の確信度のうちの夕景・花・紅葉の確信度を抽出する。そして、部分識別器60は、確信度の高いシーンから順に、サブ部分識別器61を選択する。このため、花部分識別器61Fが最初に選択されることになる。   In S301 of FIG. 14, the partial discriminator 60 first extracts the certainty of evening scene / flower / autumn among the certainty of FIG. Then, the partial discriminator 60 selects the sub partial discriminators 61 in order from the scene with the highest certainty factor. For this reason, the flower part discriminator 61F is selected first.

仮に、識別対象画像が花画像であることを花部分識別器61Fが識別できた場合(図14のS305でYES)、他のサブ部分識別器61(この場合、夕景部分識別器61Sや紅葉部分識別器61R)によるS303〜S311の処理を省略することができるので、部分識別処理の速度が速くなる。そして、第1実施例では、確信度の高いシーンから順にサブ部分識別器61を選択するため、他のサブ部分識別器61による処理が省略される確率が高くなり、部分識別処理の速度が速くなる確率が高くなる。言い換えると、第1実施例では、部分識別処理(図5のS105)の処理時間の期待値が、サブ部分識別器61の順序を固定した場合よりも、短くなる。   If the flower part classifier 61F can identify that the identification target image is a flower image (YES in S305 in FIG. 14), the other sub part classifier 61 (in this case, the sunset scene part classifier 61S or the autumnal leaves part). Since the processing of S303 to S311 by the discriminator 61R) can be omitted, the speed of the partial discrimination processing is increased. In the first embodiment, since the sub partial classifiers 61 are selected in order from the scene with the highest certainty factor, the probability that the processing by the other sub partial classifiers 61 is omitted increases, and the speed of the partial classification process increases. The probability of becoming higher. In other words, in the first embodiment, the expected processing time of the partial identification process (S105 in FIG. 5) is shorter than when the order of the sub partial classifiers 61 is fixed.

花部分識別器61Fが花画像を識別できなかった場合(S305でNO)、次のS301において、残りのサブ部分識別器61(夕景部分識別器61Sと紅葉部分識別器61R)のいずれかが選択される。ここで、夕景と紅葉の確信度が同じであるため、次に夕景部分識別器61Sと紅葉部分識別器61Rのうちのどちらを選択すべきか、問題になる。   When the flower part classifier 61F cannot identify the flower image (NO in S305), in the next S301, one of the remaining sub partial classifiers 61 (the sunset scene part classifier 61S and the autumn leaves part classifier 61R) is selected. Is done. Here, since the certainty of the evening scene and the autumn leaves is the same, it becomes a question which of the evening scene partial classifier 61S and the autumnal scene partial classifier 61R should be selected next.

第1実施例では、確信度が同じ場合、部分識別器60は、各サブ部分識別器61の処理時間の短い方を選択する。これにより、部分識別処理全体の処理時間の期待値を短くすることができる。   In the first embodiment, when the certainty factor is the same, the partial discriminator 60 selects the shorter processing time of each sub partial discriminator 61. Thereby, the expected value of the processing time of the whole partial identification process can be shortened.

前述の通り、夕景部分識別器61Sは、10個の部分画像を用いて夕景画像を識別している。一方、紅葉部分識別器61Rは、15個の部分画像を用いて紅葉画像を識別している。このため、第1実施例では、夕景部分識別器61Sの方が紅葉部分識別器61Rよりも処理時間が短いと考えられる。そこで、夕景と紅葉の確信度が同じである場合、夕景部分識別器61Sが紅葉部分識別器61Rよりも優先して選択される。   As described above, the evening scene partial classifier 61S identifies the evening scene image using the ten partial images. On the other hand, the autumnal leaf partial classifier 61R identifies the autumnal leaf image using 15 partial images. For this reason, in the first embodiment, the evening scene partial classifier 61S is considered to have a shorter processing time than the autumnal leaves partial classifier 61R. Therefore, when the certainty of the evening scene and the autumn leaves is the same, the evening scene partial classifier 61S is selected with priority over the autumnal scene partial classifier 61R.

なお、第1実施例では、サブ部分識別器61の処理時間の長短の比較は、識別に用いられる部分画像の数の多少に基づいて行われているが、これに限られるものではない。例えば、各サブ部分識別器61の処理時間を予め記憶しておき、記憶している処理時間に基づいて、サブ部分識別器61の処理時間の長短を比較しても良い。   In the first embodiment, the comparison of the processing time of the sub partial classifier 61 is performed based on the number of partial images used for identification, but is not limited thereto. For example, the processing time of each sub partial classifier 61 may be stored in advance, and the length of the processing time of the sub partial classifier 61 may be compared based on the stored processing time.

以上説明したように、全体識別処理の際に算出された確信度が図19に示す通りであれば、部分識別器60は、花→夕景→紅葉の順に、サブ部分識別器61を選択する。これにより、部分識別処理の処理時間の期待値は短くなる。   As described above, if the certainty factor calculated in the overall identification process is as shown in FIG. 19, the partial classifier 60 selects the sub partial classifier 61 in the order of flower → evening scene → autumn leaves. Thereby, the expected value of the processing time of the partial identification processing is shortened.

<第2実施例>
この第2実施例では、全体特徴量の一部を識別対象画像の評価結果として利用し、全体識別処理におけるサブ識別器51の選択順序を変更する。
<Second embodiment>
In the second embodiment, a part of the entire feature amount is used as the evaluation result of the identification target image, and the selection order of the sub classifiers 51 in the entire identification process is changed.

一般的に、夜景画像は、画像全体が暗いため、画像全体の輝度の平均値は暗い値を示す。一方、風景画像等は、画像全体が明るいため、画像全体の輝度の平均値は明るい値を示す。このため、識別対象画像の輝度の平均値が暗い値であれば、夜景画像である確率が高くなり、風景画像である確率が低くなる。このことを利用して、第2実施例では、識別対象画像の輝度(Y)の平均値を利用し、全体識別処理におけるサブ識別器51の選択順序を変更する。   In general, since a night scene image is dark as a whole, the average luminance value of the entire image is a dark value. On the other hand, since the entire image of a landscape image or the like is bright, the average value of the luminance of the entire image shows a bright value. For this reason, if the average luminance value of the identification target image is a dark value, the probability of being a night scene image is high, and the probability of being a landscape image is low. Using this fact, in the second embodiment, the average value of the luminance (Y) of the identification target image is used to change the selection order of the sub-identifiers 51 in the overall identification process.

図20は、第2実施例におけるサブ識別器51の選択順序の説明図である。各シーンに対応する輝度データが予め記憶部31に記憶されており、全体識別器50は、図7のS201において、このデータを参照する。若しくは、全体識別処理を実行させるためのプログラムに、予め、各シーンの輝度データが組み込まれている。   FIG. 20 is an explanatory diagram of the selection order of the sub-identifier 51 in the second embodiment. Luminance data corresponding to each scene is stored in the storage unit 31 in advance, and the overall discriminator 50 refers to this data in S201 of FIG. Alternatively, luminance data of each scene is incorporated in advance in a program for executing the overall identification process.

そして、全体識別器50は、図7のS201において、各輝度データと識別対象画像のY(輝度)の平均値との差を算出し、差の小さいシーンから順に、サブ識別器51を選択する。図20の場合、全体識別器50は、夜景→夕景→紅葉→花→風景の順に、サブ識別器51を選択する。   Then, in S201 of FIG. 7, the overall classifier 50 calculates the difference between each luminance data and the average value of Y (luminance) of the classification target image, and selects the sub-classifier 51 in order from the scene with the smallest difference. . In the case of FIG. 20, the overall classifier 50 selects the sub classifier 51 in the order of night view → evening scene → autumn leaves → flower → landscape.

仮に、識別対象画像が夜景画像であることを夜景識別器51Nが識別できた場合(図7のS204でYES)、他のサブ識別器51によるS203〜S208の処理を省略することができるので、全体識別処理の速度が速くなる。そして、第2実施例では、S204でYESになる可能性の高い順にサブ識別器51を選択することになるため、他のサブ識別器51による処理が省略される確率が高くなり、全体識別処理の速度が速くなる確率が高くなる。言い換えると、第2実施例では、全体識別処理の処理時間の期待値が、サブ識別器51の順序を固定した場合よりも、短くなる。   If the night scene classifier 51N can identify that the classification target image is a night scene image (YES in S204 in FIG. 7), the processing of S203 to S208 by the other sub classifiers 51 can be omitted. The speed of the entire identification process is increased. In the second embodiment, since the sub discriminators 51 are selected in descending order of the possibility of being YES in S204, the probability that the processing by the other sub discriminators 51 is omitted increases, and the overall discrimination processing is performed. The probability that the speed of will increase. In other words, in the second embodiment, the expected value of the processing time of the overall identification process is shorter than when the order of the sub-identifiers 51 is fixed.

なお、第2実施例では、識別対象画像の輝度の平均値に基づいて、サブ識別器51の選択順序を変更しているが、これに限られるものではない。例えば、識別対象画像の色相(HSB色空間におけるHデータ)に基づいて、サブ識別器51の選択順序を変更しても良い。この場合、識別対象画像の色相が赤色に近ければ夕景や紅葉のサブ識別器51が優先して選択され、識別対象画像の色相が青色や緑色に近ければ風景のサブ識別器51が優先して選択されるようにすると良い。   In the second embodiment, the selection order of the sub-identifier 51 is changed based on the average luminance value of the identification target image, but the present invention is not limited to this. For example, the selection order of the sub-identifier 51 may be changed based on the hue of the identification target image (H data in the HSB color space). In this case, if the hue of the identification target image is close to red, the sub-classifier 51 for evening scenes and autumn leaves is selected with priority. If the hue of the classification target image is close to blue or green, the sub-classifier 51 for landscape is prioritized. It should be selected.

また、第2実施例では、識別対象画像に関する一つの値に基づいてサブ識別器51の選択順序を変更しているが、二つ以上の値(例えば、輝度の平均値と色差の平均値)に基づいてサブ識別器51の選択順序を変更しても良い。また、第2実施例では、全体特徴量の一部(ここでは輝度の平均値)に基づいてサブ識別器51の選択順序を変更しているが、全体特徴量以外の情報を利用しても良い。   In the second embodiment, the selection order of the sub-identifier 51 is changed based on one value related to the image to be identified, but two or more values (for example, an average value of luminance and an average value of color difference). The selection order of the sub classifiers 51 may be changed based on the above. In the second embodiment, the selection order of the sub discriminators 51 is changed based on a part of the entire feature amount (here, the average value of luminance). However, information other than the entire feature amount may be used. good.

以上説明したように、識別対象画像の輝度の平均値が図20に示す通りであれば、全体識別器50は、夜景→夕景→紅葉→花→風景の順に、サブ識別器51を選択する。これにより、全体識別処理の処理時間の期待値は短くなる。   As described above, if the average luminance value of the identification target image is as shown in FIG. 20, the overall classifier 50 selects the sub classifier 51 in the order of night view → evening scene → autumn leaves → flower → landscape. Thereby, the expected value of the processing time of the entire identification process is shortened.

===その他の実施の形態===
一実施形態としてのプリンタ等を説明したが、上記の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれることは言うまでもない。特に、以下に述べる実施形態であっても、本発明に含まれるものである。
=== Other Embodiments ===
Although a printer or the like as one embodiment has been described, the above embodiment is for facilitating understanding of the present invention, and is not intended to limit the present invention. The present invention can be changed and improved without departing from the gist thereof, and it is needless to say that the present invention includes equivalents thereof. In particular, the embodiments described below are also included in the present invention.

<プリンタについて>
前述の実施形態ではプリンタ4がシーン識別処理をしていたが、デジタルスチルカメラ2がシーン識別処理をしても良い。また、上記のシーン識別処理を行う画像識別装置は、プリンタ4やデジタルスチルカメラ2に限られるものではない。例えば、大量の画像ファイルを保存するフォトストレージのような画像識別装置が、上記のシーン識別処理を行っても良い。もちろん、パーソナルコンピュータやインターネット上に設置されたサーバーが、上記のシーン識別処理を行っても良い。
<About the printer>
In the above-described embodiment, the printer 4 performs the scene identification process, but the digital still camera 2 may perform the scene identification process. Further, the image identification device that performs the above-described scene identification processing is not limited to the printer 4 or the digital still camera 2. For example, an image identification device such as a photo storage that stores a large amount of image files may perform the scene identification process described above. Of course, a personal computer or a server installed on the Internet may perform the scene identification process.

<画像ファイルについて>
前述の画像ファイルはExif形式であったが、画像ファイルフォーマットはこれに限られるものではない。また、前述の画像ファイルは静止画であるが、動画であっても良い。要するに、画像ファイルが画像データと付加データとを備えていれば、前述のようなシーン識別処理を行うことが可能である。
<About image files>
The image file described above is in the Exif format, but the image file format is not limited to this. Further, the above-described image file is a still image, but may be a moving image. In short, if the image file includes image data and additional data, the scene identification process as described above can be performed.

<サポートベクタマシンについて>
前述のサブ識別器51やサブ部分識別器61には、サポートベクタマシン(SVM)による識別手法が用いられている。しかし、識別対象画像が特定シーンに属するか否かの識別手法は、サポートベクタマシンを用いるものに限られるものではない。例えば、ニューラルネットワーク等のパターン認識を採用しても良い。
<About Support Vector Machine>
For the above-described sub classifier 51 and sub partial classifier 61, a classification method using a support vector machine (SVM) is used. However, the method for identifying whether or not the identification target image belongs to a specific scene is not limited to using a support vector machine. For example, pattern recognition such as a neural network may be employed.

<シーンの識別について>
前述の実施形態では、サブ識別器51やサブ部分識別器61は、画像データの示す画像が特定のシーンに属するか否かを識別している。しかし、サブ識別器51やサブ部分識別器61は、特定のシーンに属するか否かを識別するものに限られず、画像データの示す画像が特定のカテゴリに属するか否かを分類できれば良い。このため、サブ識別器51やサブ部分識別器61は、例えば画像データの示す画像が特定のパターン形状か否かを識別しても良い。
<About scene identification>
In the above-described embodiment, the sub classifier 51 and the sub partial classifier 61 identify whether or not the image indicated by the image data belongs to a specific scene. However, the sub discriminator 51 and the sub partial discriminator 61 are not limited to identifying whether or not they belong to a specific scene, as long as they can classify whether or not an image indicated by image data belongs to a specific category. For this reason, the sub classifier 51 and the sub partial classifier 61 may identify whether the image indicated by the image data has a specific pattern shape, for example.

<サブ識別器・サブ部分識別器の選択順序について>
前述の実施形態では、全体識別器50による全体識別処理の後、部分識別器60による部分識別処理が行われていた(図6、図7参照)。但し、これに限られるものではない。
例えば、図20の場合において、シーン識別部33が、「夜景識別器51Nによる識別処理」→「夕景識別器51Sによる識別処理」→「夕景部分識別器61Sによる識別処理」→「紅葉識別器51Rによる識別処理」→「紅葉部分識別器61Rによる識別処理」→・・・のように、全体識別器50のサブ識別器51と部分識別器60のサブ部分識別器61とを混在させて選択しても良い。
このようにしても、例えば識別対象画像が夜景画像であることを夜景識別器51Nが識別できた場合に、他のサブ識別器51による識別処理を省略すれば、識別処理の速度が速くなる。
<Selection order of sub classifier / sub partial classifier>
In the above-described embodiment, after the overall identification process by the overall classifier 50, the partial identification process by the partial classifier 60 is performed (see FIGS. 6 and 7). However, the present invention is not limited to this.
For example, in the case of FIG. 20, the scene discriminating unit 33 performs “identification processing by the night scene discriminator 51N” → “identification processing by the evening scene discriminator 51S” → “discrimination processing by the evening scene partial discriminator 61S” → “autumn leaf discriminator 51R. "Identification process by" and "Identification process by autumn color partial discriminator 61R"-> ..., the sub-classifier 51 of the overall discriminator 50 and the sub-partial discriminator 61 of the partial classifier 60 are mixed and selected. May be.
Even in this case, for example, when the night scene classifier 51N can identify that the classification target image is a night scene image, the classification process speed increases if the identification process by the other sub classifier 51 is omitted.

===まとめ===
(1)前述の実施形態では、全体識別器50は複数のサブ識別器51を有し、部分識別器60は複数のサブ部分識別器61を有している。サブ識別器51やサブ部分識別器61は、画像データの示す画像が特定のシーンに属するか否かを識別する識別処理を行っている。そして、前述の実施形態では、このようなサブ識別器を複数組み合わせることによって、画像データの示す画像のシーン(カテゴリの一例)を分類している。
=== Summary ===
(1) In the above-described embodiment, the overall classifier 50 has a plurality of sub-classifiers 51, and the partial classifier 60 has a plurality of sub-partial classifiers 61. The sub classifier 51 and the sub partial classifier 61 perform identification processing for identifying whether or not the image indicated by the image data belongs to a specific scene. And in the above-mentioned embodiment, the scene (an example of a category) of the image which image data shows is classified by combining several such sub discriminators.

ここで、仮にシーン識別処理を行うたびに全てのサブ識別器51(又は全てのサブ部分識別器61)による識別処理を行っていたのでは、シーン識別処理の処理速度が遅くなってしまう。そこで、前述の実施形態では、画像データの示す画像が特定のシーンに属することをサブ識別器51(又はサブ部分識別器61)が識別できたとき、別のサブ識別器51による処理を省略し、シーン識別処理の処理速度を速くしている。例えば、全体識別器50の風景識別器51Lが風景画像を識別できれば(図7のS204でYES)、全体識別器50の夕景識別器51Sによる処理や、部分識別器60の夕景部分識別器61Sによる処理が省略され、シーン識別処理の処理速度が速くなる。   Here, if the identification process is performed by all the sub classifiers 51 (or all the sub partial classifiers 61) every time the scene identification process is performed, the processing speed of the scene identification process becomes slow. Therefore, in the above-described embodiment, when the sub discriminator 51 (or the sub partial discriminator 61) can identify that the image indicated by the image data belongs to a specific scene, the processing by another sub discriminator 51 is omitted. The processing speed of scene identification processing is increased. For example, if the landscape classifier 51L of the overall classifier 50 can identify a landscape image (YES in S204 of FIG. 7), the process by the evening scene classifier 51S of the overall classifier 50 or the evening scene partial classifier 61S of the partial classifier 60 will be described. The processing is omitted, and the processing speed of the scene identification processing is increased.

但し、サブ識別器51やサブ部分識別器61の順序を固定してしまうと、シーン識別処理の処理速度を速くすることができない。例えば、識別対象画像が紅葉画像である可能性が高いにも関わらず、全体識別処理において紅葉識別器51Rを最後に選択したり、部分識別処理において紅葉部分識別器61Rを最後に選択したりすると、シーン識別処理の処理速度の期待値が遅くなる。   However, if the order of the sub classifier 51 and the sub partial classifier 61 is fixed, the processing speed of the scene classification process cannot be increased. For example, when the identification target image is highly likely to be an autumnal image, the autumnal color identifier 51R is selected last in the overall identification process, or the autumnal color partial identifier 61R is selected last in the partial identification process. The expected value of the processing speed of the scene identification process becomes slow.

そこで、前述の実施形態では、プリンタ側コントローラ20は、識別対象画像の評価を行い、この評価結果に応じて、サブ識別器51(又はサブ部分識別器61)の選択順序を決定している。例えば、前述の第1実施例では、全体識別処理において算出された確信度を識別対象画像の評価結果として利用し、部分識別処理におけるサブ部分識別器61の選択順序を決定している。また、前述の第2実施例では、全体特徴量の一部を識別対象画像の評価結果として利用し、全体識別処理におけるサブ識別器51の選択順序を決定している。
これにより、優先順位が後になるサブ識別器の識別処理が省略される確率が高くなり、シーン識別処理の処理速度が速くなる。
Therefore, in the above-described embodiment, the printer-side controller 20 evaluates the identification target image, and determines the selection order of the sub classifier 51 (or sub partial classifier 61) according to the evaluation result. For example, in the above-described first embodiment, the certainty factor calculated in the overall identification process is used as the evaluation result of the identification target image, and the selection order of the sub partial classifier 61 in the partial identification process is determined. Further, in the above-described second embodiment, a part of the entire feature amount is used as the evaluation result of the identification target image, and the selection order of the sub classifiers 51 in the entire identification process is determined.
As a result, the probability that the identification process of the sub-classifier with the later priority is omitted is increased, and the processing speed of the scene identification process is increased.

(2)前述の全体識別器50は、全体特徴量に基づいて識別対象画像が夕景のシーン(第1カテゴリに相当)に属するか否かを識別する夕景識別器51Sと、全体特徴量に基づいて識別対象画像が花のシーン(第2カテゴリに相当)に属するか否かを識別する花識別器51Fとを備えている。また、部分識別器60は、部分特徴量に基づいて識別対象画像が夕景のシーンに属するか否かを識別する夕景部分識別器61Sと、部分特徴量に基づいて識別対象画像が花のシーンに属するか否かを識別する花部分識別器61Fとを備えている。 (2) The above-described overall classifier 50 is based on the overall feature quantity and the evening scene classifier 51S that identifies whether or not the classification target image belongs to an evening scene (corresponding to the first category). And a flower discriminator 51F for discriminating whether or not the classification target image belongs to a flower scene (corresponding to the second category). Further, the partial discriminator 60 is an evening scene partial discriminator 61S for discriminating whether or not the classification target image belongs to an evening scene based on the partial feature amount, and the classification target image is a flower scene based on the partial feature amount. It includes a flower part identifier 61F that identifies whether it belongs or not.

そして、前述の第1実施例では、プリンタ側コントローラ20は、全体識別器50の夕景識別器51Sの算出した確信度と花識別器51Fの算出した確信度とに基づいて、部分識別器60の夕景部分識別器61Sと花部分識別器61Fの順序を決定する。例えば、図19のように全体識別器50の夕景識別器51Sの算出した確信度が30%であり、花識別器51Fの算出した確信度が40%である場合、花部分識別器61Fが夕景部分識別器61Sよりも先に選択される。
これにより、後に選択される夕景部分識別器61Sによる処理が省略される確率が高くなるので、部分識別処理(図5のS105)の処理時間の期待値が、サブ部分識別器61の順序を固定した場合よりも、短くなる。
In the first embodiment described above, the printer-side controller 20 uses the certainty factor calculated by the evening scene discriminator 51S of the overall discriminator 50 and the certainty factor calculated by the flower discriminator 51F. The order of the evening scene partial classifier 61S and the flower partial classifier 61F is determined. For example, as shown in FIG. 19, when the certainty factor calculated by the evening scene classifier 51S of the overall classifier 50 is 30% and the certainty factor calculated by the flower classifier 51F is 40%, the flower partial classifier 61F has the sunset scene. It is selected before the partial discriminator 61S.
This increases the probability that processing by the evening scene partial discriminator 61S selected later is omitted, so that the expected value of the processing time of the partial discriminating processing (S105 in FIG. 5) fixes the order of the sub partial discriminators 61. It becomes shorter than the case.

(3)前述の全体識別器50の夕景識別器51Sは、全体特徴量に基づいて判別式の値(第1データに相当)を算出し、判別式の値と肯定閾値とを比較することによって、識別対象画像が夕景のシーンに属するか否かを識別する。同様に、全体識別器50の花識別器51Fは、全体特徴量に基づいて判別式の値(第2データに相当)を算出し、判別式の値と肯定閾値とを比較することによって、識別対象画像が花のシーンに属するか否かを識別する。なお、判別式の値は特定のシーンに属する確率と関連しており(図9のPrecisionを参照)、判別式の値が大きいほど、識別対象画像が特定のシーンに属する確率が高くなる。 (3) The evening scene discriminator 51S of the overall discriminator 50 described above calculates a discriminant value (corresponding to the first data) based on the overall feature quantity, and compares the discriminant value with an affirmative threshold value. , It is determined whether or not the image to be identified belongs to a sunset scene. Similarly, the flower discriminator 51F of the overall discriminator 50 calculates a discriminant value (corresponding to the second data) based on the overall feature amount, and compares the discriminant value with an affirmative threshold value, thereby identifying the discriminant. Whether or not the target image belongs to a flower scene is identified. Note that the value of the discriminant is related to the probability of belonging to a specific scene (see Precision in FIG. 9), and the greater the value of the discriminant, the higher the probability that the image to be identified belongs to the specific scene.

そして、前述の第1実施例では、判別式の値から求められる確信度(%)を識別対象画像の評価結果として利用し、部分識別処理における夕景部分識別器61Sと花部分識別器61Fの選択順序を決定する。これにより、部分識別器60のサブ部分識別器61の順序を決定するためのデータを新たに算出することなく、全体識別処理で算出されるデータを流用しているので、処理速度が速くなる。   In the first embodiment described above, the certainty factor (%) obtained from the discriminant value is used as the evaluation result of the classification target image, and the selection of the evening scene partial classifier 61S and the flower partial classifier 61F in the partial classification processing is performed. Determine the order. As a result, since the data calculated in the overall identification process is diverted without newly calculating data for determining the order of the sub partial classifiers 61 of the partial classifier 60, the processing speed is increased.

(4)前述の部分識別器60のサブ部分識別器61は、64個に分割された部分画像のそれぞれの部分特徴量に基づいて、各部分画像が特定のシーンに属するか否かをそれぞれ識別し、特定のシーンに属すると識別された部分画像の数に基づいて、識別対象画像が特定のシーンに属するか否かを識別する。このため、部分識別器60のサブ部分識別器61は、判別式の値を複数回算出しなければならず、全体識別器50のサブ識別器51よりも、処理速度が遅い。
このため、部分識別器60のサブ部分識別器61の順序を変更することによって、後に選択されるサブ部分識別器61による処理が省略できると、処理速度が顕著に向上する。
(4) The sub partial classifier 61 of the partial classifier 60 described above identifies whether each partial image belongs to a specific scene based on the partial feature amount of each of the 64 divided partial images. Then, based on the number of partial images identified as belonging to a specific scene, it is identified whether the identification target image belongs to a specific scene. For this reason, the sub partial discriminator 61 of the partial discriminator 60 has to calculate the discriminant value a plurality of times, and the processing speed is slower than that of the sub discriminator 51 of the overall discriminator 50.
For this reason, if processing by the sub partial classifier 61 selected later can be omitted by changing the order of the sub partial classifiers 61 of the partial classifier 60, the processing speed is significantly improved.

(5)前述の全体識別処理によってシーンの識別ができた場合(S104でYES)、部分識別処理が省略される。これにより、シーン識別処理の速度が速くなる。 (5) If the scene can be identified by the above-described overall identification process (YES in S104), the partial identification process is omitted. This increases the speed of the scene identification process.

(6)前述の第1実施例では、部分識別器60のサブ部分識別器61が判別式の値を複数算出して識別対象画像が特定のシーンに属するか否かを識別するための処理時間は、全体識別器50のサブ識別器51が判別式の値(評価結果に相当)を算出するための処理時間よりも遅い。つまり、前述の第1実施例では、処理速度の遅い部分識別器60のサブ部分識別器61の順序を変更している。 (6) In the first embodiment described above, the processing time for the sub partial discriminator 61 of the partial discriminator 60 to calculate a plurality of discriminant values and discriminate whether or not the classification target image belongs to a specific scene. Is slower than the processing time for the sub classifier 51 of the overall classifier 50 to calculate the value of the discriminant (corresponding to the evaluation result). That is, in the first embodiment described above, the order of the sub partial classifiers 61 of the partial classifier 60 having a low processing speed is changed.

また、前述の第2実施例では、全体識別器50のサブ識別器51が判別式の値を算出して識別対象画像が特定のシーンに属するか否かを識別するための処理時間は、サブ識別器51の順序の決定に用いられる輝度の平均値(評価結果に相当)を算出するための処理時間よりも遅い(サポートベクタマシンによる判別式の値の算出には、学習用サンプル数(本実施形態では数万個)が多くなると時間がかかるため)。   In the second embodiment described above, the processing time for the sub-classifier 51 of the overall classifier 50 to calculate the discriminant value and identify whether or not the classification target image belongs to a specific scene is It is slower than the processing time for calculating the average value of the luminance (corresponding to the evaluation result) used for determining the order of the discriminator 51 (the calculation of the discriminant value by the support vector machine includes the number of learning samples (this number (In the embodiment, it takes time when tens of thousands) increase).

このように、処理に時間のかかるサブ識別器の順序を変更することによって、後に選択されるサブ識別器による処理が省略できると、処理速度が顕著に向上する。
なお、仮に、全体識別処理と部分識別処理の順番を入れ替えて、部分識別器60の処理結果に基づいて全体識別器50のサブ識別器51の順序を変更したとしても、前述の実施形態ほど処理速度は向上しないと考えられる。
In this way, by changing the order of the sub classifiers that take a long time to process, if the process by the sub classifier to be selected later can be omitted, the processing speed is significantly improved.
Note that even if the order of the overall identification process and the partial identification process is changed and the order of the sub-classifiers 51 of the overall classifier 50 is changed based on the processing result of the partial classifier 60, the processing as in the above embodiment is performed. Speed is not expected to improve.

(7)前述のプリンタ(画像識別装置に相当)は、プリンタ側コントローラ20を備えている(図2参照)。そして、このプリンタ側コントローラ20は、識別対象画像の評価を行い、この評価結果に応じて、サブ識別器の選択順序を決定している。例えば、前述の第1実施例では、プリンタ側コントローラ20は、全体識別処理において算出された確信度を識別対象画像の評価結果として利用し、部分識別処理におけるサブ部分識別器61の選択順序を決定している。
これにより、優先順位が後になるサブ識別器の識別処理が省略される確率が高くなり、シーン識別処理の処理速度が速くなる。
(7) The printer described above (corresponding to an image identification device) includes a printer-side controller 20 (see FIG. 2). The printer-side controller 20 evaluates the identification target image and determines the selection order of the sub-identifiers according to the evaluation result. For example, in the first embodiment described above, the printer-side controller 20 uses the certainty factor calculated in the overall identification process as the evaluation result of the identification target image, and determines the selection order of the sub partial classifier 61 in the partial identification process. is doing.
As a result, the probability that the identification process of the sub-classifier with the later priority is omitted is increased, and the processing speed of the scene identification process is increased.

(8)前述のメモリ23には、図5、図7及び図14の処理をプリンタ4に実行させるためのプログラムが記憶されている。すなわち、このプログラムは、前記画像データの示す画像を評価させるコードと、評価結果に基づいて、前記画像データの示す画像が第1カテゴリに属するか否かを識別する第1識別処理、及び前記画像データの示す画像が前記第1カテゴリとは別の第2カテゴリに属するか否かを識別する第2識別処理の順序を決定させるコードと、前記第1識別処理及び前記第2識別処理のうちの先に行われる識別処理において前記画像が特定のカテゴリに属することが識別できた場合、前記第1識別処理及び前記第2識別処理のうちの後に行われる識別処理を省略させるコードと、を備えている。 (8) The above-described memory 23 stores a program for causing the printer 4 to execute the processes of FIGS. 5, 7, and 14. That is, the program includes a code for evaluating the image indicated by the image data, a first identification process for identifying whether the image indicated by the image data belongs to a first category based on the evaluation result, and the image A code for determining an order of a second identification process for identifying whether an image indicated by data belongs to a second category different from the first category, the first identification process, and the second identification process; And a code for omitting the identification process performed after the first identification process and the second identification process when the image can be identified as belonging to a specific category in the identification process performed first. Yes.

画像処理システムの説明図である。It is explanatory drawing of an image processing system. プリンタの構成の説明図である。2 is an explanatory diagram of a configuration of a printer. FIG. プリンタの自動補正機能の説明図である。It is explanatory drawing of the automatic correction function of a printer. 画像のシーンと補正内容との関係の説明図である。It is explanatory drawing of the relationship between the scene of an image, and the correction content. シーン識別部によるシーン識別処理のフロー図である。It is a flowchart of the scene identification process by a scene identification part. シーン識別部の機能の説明図である。It is explanatory drawing of the function of a scene identification part. 全体識別処理のフロー図である。It is a flowchart of a whole identification process. 識別対象テーブルの説明図である。It is explanatory drawing of an identification object table. 全体識別処理の肯定閾値の説明図である。It is explanatory drawing of the affirmation threshold value of the whole identification process. RecallとPrecisionの説明図である。It is explanatory drawing of Recall and Precision. 第1否定閾値の説明図である。It is explanatory drawing of a 1st negative threshold value. 第2否定閾値の説明図である。It is explanatory drawing of a 2nd negative threshold value. 図13Aは、閾値テーブルの説明図である。図13Bは、風景識別器における閾値の説明図である。図13Cは、風景識別器の処理の概要の説明図である。FIG. 13A is an explanatory diagram of a threshold table. FIG. 13B is an explanatory diagram of threshold values in the landscape classifier. FIG. 13C is an explanatory diagram of an outline of the process of the landscape classifier. 部分識別処理のフロー図である。It is a flowchart of a partial identification process. 夕景部分識別器が選択する部分画像の順番の説明図である。It is explanatory drawing of the order of the partial image which an evening scene partial identifier selects. 上位10番目までの10個の部分画像だけで夕景画像の識別をしたときのRecall及びPrecisionのグラフである。It is a Recall and Precision graph when the evening scene image is identified only by the top 10 partial images. 図17Aは、線形サポートベクタマシンによる判別の説明図である。図17Bは、カーネル関数を用いた判別の説明図である。FIG. 17A is an explanatory diagram of determination by the linear support vector machine. FIG. 17B is an explanatory diagram of discrimination using a kernel function. 統合識別処理のフロー図である。It is a flowchart of an integrated identification process. 全体識別処理の際に算出された確信度の説明図である。It is explanatory drawing of the certainty degree calculated in the case of a whole identification process. 第2実施例におけるサブ識別器51の選択順序の説明図である。It is explanatory drawing of the selection order of the sub discrimination device 51 in 2nd Example.

符号の説明Explanation of symbols

2 デジタルスチルカメラ、2A モード設定ダイヤル、
4 プリンタ、6 メモリカード、
10 印刷機構、11 ヘッド、12 ヘッド制御部、13 モータ、14 センサ、
20 プリンタ側コントローラ、21 スロット、22 CPU、23 メモリ、
24 制御ユニット、25 駆動信号生成部、
31 記憶部、31A 画像記憶部、31B 結果記憶部、
32 顔識別部、33 シーン識別部、34 画像補正部、35 プリンタ制御部、
40 特徴量取得部、50 全体識別器、51 サブ識別器、51L 風景識別器、
51S 夕景識別器、51N 夜景識別器、51F 花識別器、51R 紅葉識別器、
60 部分識別器、61 サブ部分識別器、61S 夕景部分識別器、
61F 花部分識別器、61R 紅葉部分識別器、70 統合識別器
2 Digital still camera, 2A mode setting dial,
4 Printer, 6 Memory card,
10 printing mechanism, 11 head, 12 head control unit, 13 motor, 14 sensor,
20 printer-side controller, 21 slots, 22 CPU, 23 memory,
24 control unit, 25 drive signal generator,
31 storage unit, 31A image storage unit, 31B result storage unit,
32 face identification unit, 33 scene identification unit, 34 image correction unit, 35 printer control unit,
40 feature quantity acquisition unit, 50 global classifier, 51 sub classifier, 51L landscape classifier,
51S evening scene classifier, 51N night scene classifier, 51F flower classifier, 51R autumn leaves classifier,
60 partial classifiers, 61 sub partial classifiers, 61S evening scene partial classifiers,
61F Flower partial classifier, 61R Colored leaves partial classifier, 70 Integrated classifier

Claims (8)

画像データの示す画像を評価し、
評価結果に基づいて、前記画像データの示す画像が第1カテゴリに属するか否かを識別する第1識別処理、及び前記画像データの示す画像が前記第1カテゴリとは別の第2カテゴリに属するか否かを識別する第2識別処理の順序を決定し、
前記第1識別処理及び前記第2識別処理のうちの先に行われる識別処理において前記画像が特定のカテゴリに属することが識別できた場合、前記第1識別処理及び前記第2識別処理のうちの後に行われる識別処理を省略する
ことを特徴とする画像識別方法。
Evaluate the image indicated by the image data,
A first identification process for identifying whether the image indicated by the image data belongs to the first category based on the evaluation result, and the image indicated by the image data belongs to a second category different from the first category Determining the order of the second identification process for identifying whether or not
If the image can be identified as belonging to a specific category in the first identification process and the second identification process, the first identification process and the second identification process. An image identification method characterized by omitting a subsequent identification process.
請求項1に記載の画像識別方法であって、
前記画像識別方法は、
前記画像の全体の特徴を示す全体特徴量に基づいて、前記画像が前記第1カテゴリに属するか否かを識別する第1全体識別処理と、
前記全体特徴量に基づいて、前記画像が前記第2カテゴリに属するか否かを識別する第2全体識別処理と、
前記画像の一部の特徴を示す部分特徴量に基づいて、前記画像が前記第1カテゴリに属するか否かを識別する第1部分識別処理と、
前記部分特徴量に基づいて、前記画像が前記第2カテゴリに属するか否かを識別する第2部分識別処理と、
を有し、
前記第1識別処理は前記第1部分識別処理に相当し、前記第2識別処理は前記第2部分識別処理に相当し、
前記第1全体識別処理の結果と前記第2全体識別処理の結果とを前記評価結果として、前記第1識別処理と前記第2識別処理の順序が決定される
ことを特徴とする画像識別方法。
The image identification method according to claim 1,
The image identification method includes:
First overall identification processing for identifying whether or not the image belongs to the first category based on an overall feature amount indicating an overall feature of the image;
A second overall identification process for identifying whether the image belongs to the second category based on the overall feature amount;
A first partial identification process for identifying whether or not the image belongs to the first category based on a partial feature amount indicating a partial feature of the image;
A second partial identification process for identifying whether the image belongs to the second category based on the partial feature amount;
Have
The first identification process corresponds to the first partial identification process, the second identification process corresponds to the second partial identification process,
An image identification method, wherein an order of the first identification process and the second identification process is determined by using the result of the first overall identification process and the result of the second overall identification process as the evaluation result.
請求項2に記載の画像識別方法であって、
前記第1全体識別処理では、前記全体特徴量に基づいて前記画像が前記第1カテゴリに属する確率に応じた第1データが算出され、前記第1データに基づいて前記画像が前記第1カテゴリに属するか否かが識別され、
前記第2全体識別処理では、前記全体特徴量に基づいて前記画像が前記第2カテゴリに属する確率に応じた第2データが算出され、前記第2データに基づいて前記画像が前記第2カテゴリに属するか否かが識別され、
前記第1データ及び前記第2データが前記評価結果として用いられる
ことを特徴とする画像識別方法。
The image identification method according to claim 2,
In the first overall identification process, first data corresponding to a probability that the image belongs to the first category is calculated based on the overall feature amount, and the image is assigned to the first category based on the first data. Whether it belongs or not,
In the second overall identification process, second data corresponding to the probability that the image belongs to the second category is calculated based on the overall feature amount, and the image is assigned to the second category based on the second data. Whether it belongs or not,
The image identification method, wherein the first data and the second data are used as the evaluation result.
請求項2又は請求項3に記載の画像識別方法であって、
前記第1部分識別処理及び前記第2部分識別処理において、
前記画像を分割した複数の部分画像のそれぞれの部分特徴量に基づいて、各前記部分画像が特定のカテゴリに属するか否かがそれぞれ識別され、
前記特定のカテゴリに属すると識別された前記部分画像の数に基づいて、前記画像が特定のカテゴリに属するか否かが識別される
ことを特徴とする画像識別方法。
The image identification method according to claim 2 or claim 3, wherein
In the first partial identification process and the second partial identification process,
Whether each of the partial images belongs to a specific category is identified based on each partial feature amount of each of the partial images obtained by dividing the image,
An image identification method, wherein whether or not the image belongs to a specific category is identified based on the number of the partial images identified as belonging to the specific category.
請求項2〜4のいずれかに記載の画像識別方法であって、
前記第1全体識別処理又は前記第2全体識別処理において前記画像が特定のカテゴリに属することが識別できた場合、前記第1識別処理及び前記第2識別処理が省略される
ことを特徴とする画像識別方法。
The image identification method according to any one of claims 2 to 4,
The image in which the first identification process and the second identification process are omitted when the image can be identified as belonging to a specific category in the first overall identification process or the second overall identification process. Identification method.
請求項1〜5のいずれかに記載の画像識別方法であって、
前記第1識別処理及び前記第2識別処理を行うための処理時間は、前記画像データの示す画像を評価して前記評価結果を取得するための処理時間よりも遅いことを特徴とする画像識別方法。
The image identification method according to any one of claims 1 to 5,
An image identification method characterized in that a processing time for performing the first identification process and the second identification process is slower than a processing time for evaluating an image indicated by the image data and acquiring the evaluation result. .
コントローラを備えた画像識別装置であって、
前記コントローラは、
画像データの示す画像を評価し、
評価結果に基づいて、前記画像データの示す画像が第1カテゴリに属するか否かを識別する第1識別処理、及び前記画像データの示す画像が前記第1カテゴリとは別の第2カテゴリに属するか否かを識別する第2識別処理の順序を決定し、
前記第1識別処理及び前記第2識別処理のうちの先に行われる識別処理において前記画像が特定のカテゴリに属することが識別できた場合、前記第1識別処理及び前記第2識別処理のうちの後に行われる識別処理を省略する
ことを特徴とする画像識別装置。
An image identification device including a controller,
The controller is
Evaluate the image indicated by the image data,
A first identification process for identifying whether the image indicated by the image data belongs to the first category based on the evaluation result, and the image indicated by the image data belongs to a second category different from the first category Determining the order of the second identification process for identifying whether or not
If the image can be identified as belonging to a specific category in the first identification process and the second identification process, the first identification process and the second identification process. An image identification apparatus characterized by omitting a subsequent identification process.
画像識別装置に、
画像データの示す画像を評価させ、
評価結果に基づいて、前記画像データの示す画像が第1カテゴリに属するか否かを識別する第1識別処理、及び前記画像データの示す画像が前記第1カテゴリとは別の第2カテゴリに属するか否かを識別する第2識別処理の順序を決定させ、
前記第1識別処理及び前記第2識別処理のうちの先に行われる識別処理において前記画像が特定のカテゴリに属することが識別できた場合、前記第1識別処理及び前記第2識別処理のうちの後に行われる識別処理を省略させる
ことを特徴とするプログラム。
In the image identification device,
Evaluate the image indicated by the image data,
A first identification process for identifying whether the image indicated by the image data belongs to the first category based on the evaluation result, and the image indicated by the image data belongs to a second category different from the first category Determining the order of the second identification processing for identifying whether or not
If the image can be identified as belonging to a specific category in the first identification process and the second identification process, the first identification process and the second identification process. A program characterized in that identification processing performed later is omitted.
JP2007079892A 2007-03-26 2007-03-26 Image discrimination method, image discrimination device, and program Withdrawn JP2008242638A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007079892A JP2008242638A (en) 2007-03-26 2007-03-26 Image discrimination method, image discrimination device, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007079892A JP2008242638A (en) 2007-03-26 2007-03-26 Image discrimination method, image discrimination device, and program

Publications (2)

Publication Number Publication Date
JP2008242638A true JP2008242638A (en) 2008-10-09
JP2008242638A5 JP2008242638A5 (en) 2010-04-02

Family

ID=39913940

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007079892A Withdrawn JP2008242638A (en) 2007-03-26 2007-03-26 Image discrimination method, image discrimination device, and program

Country Status (1)

Country Link
JP (1) JP2008242638A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017538999A (en) * 2014-12-17 2017-12-28 ノキア テクノロジーズ オーユー Object detection by neural network

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005227933A (en) * 2004-02-12 2005-08-25 Oki Electric Ind Co Ltd Biometrics collation speed-increasing method
JP2006146737A (en) * 2004-11-24 2006-06-08 Sony Corp Collation method, computer, and program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005227933A (en) * 2004-02-12 2005-08-25 Oki Electric Ind Co Ltd Biometrics collation speed-increasing method
JP2006146737A (en) * 2004-11-24 2006-06-08 Sony Corp Collation method, computer, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017538999A (en) * 2014-12-17 2017-12-28 ノキア テクノロジーズ オーユー Object detection by neural network
US10275688B2 (en) 2014-12-17 2019-04-30 Nokia Technologies Oy Object detection with neural network

Similar Documents

Publication Publication Date Title
US20080292181A1 (en) Information Processing Method, Information Processing Apparatus, and Storage Medium Storing a Program
JP5040624B2 (en) Information processing method, information processing apparatus, and program
US20090016616A1 (en) Category Classification Apparatus, Category Classification Method, and Storage Medium Storing a Program
JP2008282267A (en) Scene discrimination device and scene discrimination method
JP2009093334A (en) Identification method and program
JP2009080557A (en) Identification method and program
JP2008234627A (en) Category classification apparatus and method
JP4862720B2 (en) Information processing method, information processing apparatus, program, and storage medium
JP4946750B2 (en) Setting method, identification method and program
US20080199084A1 (en) Category Classification Apparatus and Category Classification Method
JP4992519B2 (en) Information processing method, information processing apparatus, and program
JP4910821B2 (en) Image identification method
JP4992646B2 (en) Identification method and program
JP2008282085A (en) Scene discrimination device and scene discrimination method
JP2008284868A (en) Printing method, printer, and program
JP4882927B2 (en) Category identification method
JP2009044249A (en) Image identification method, image identification device, and program
JP2008242638A (en) Image discrimination method, image discrimination device, and program
JP2008234626A (en) Information processing method, information processor, and program
JP2008228087A (en) Information processing method, information processor, and program
JP2009080556A (en) Setting method, identification method and program
US8243328B2 (en) Printing method, printing apparatus, and storage medium storing a program
JP2008228086A (en) Information processing method, information processor, and program
JP2008234624A (en) Category classification apparatus, category classification method, and program
JP2009116691A (en) Image processing method, image processor, and program

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100209

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100216

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20110812