JP2007304771A - Subject recognition device, subject recognition program and image retrieval service provision method - Google Patents
Subject recognition device, subject recognition program and image retrieval service provision method Download PDFInfo
- Publication number
- JP2007304771A JP2007304771A JP2006131308A JP2006131308A JP2007304771A JP 2007304771 A JP2007304771 A JP 2007304771A JP 2006131308 A JP2006131308 A JP 2006131308A JP 2006131308 A JP2006131308 A JP 2006131308A JP 2007304771 A JP2007304771 A JP 2007304771A
- Authority
- JP
- Japan
- Prior art keywords
- subject
- image data
- type
- image
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、被写体認識装置、被写体認識プログラム、および画像検索サービス提供方法に関する。 The present invention relates to a subject recognition device, a subject recognition program, and an image search service providing method.
従来、画像の顔認識技術のように、画像データに映っている顔部分を認識する技術が知られている。
また、下記の特許文献1には、画像データから被写体を認識し、画像データと共に被写体の情報を表示する装置が開示されている。
一方、インターネット上などの検索サイトでは、画像データに付随するテキスト情報(画像ファイル名、撮影日時情報など)をキーワード検索することにより、画像検索サービスを提供している。
Patent Document 1 below discloses an apparatus that recognizes a subject from image data and displays subject information together with the image data.
On the other hand, search sites on the Internet provide an image search service by searching for text information (image file name, shooting date / time information, etc.) attached to image data.
上述した顔認識技術のように、画像データから被写体を認識する技術は日々進歩しており、それに伴って、認識すべき被写体種類が将来にわたって増加することが予想される。 Like the face recognition technology described above, a technology for recognizing a subject from image data is progressing day by day, and it is expected that the types of subjects to be recognized will increase in the future.
一方、従来の特許文献1では、被写体の種類1つ1つについて、被写体認識を逐一行う必要がある。そのため、認識すべき被写体種類が膨大になると、被写体認識の処理回数が膨大になり、被写体認識に係る総処理時間が長くなってしまう。 On the other hand, in the conventional patent document 1, it is necessary to perform subject recognition one by one for each kind of subject. For this reason, if the types of subjects to be recognized become enormous, the number of times of subject recognition processing becomes enormous and the total processing time for subject recognition becomes longer.
そこで、本発明では、画像データの被写体認識を効率良く行う技術を提供することを目的とする。 Therefore, an object of the present invention is to provide a technique for efficiently recognizing a subject of image data.
《1》 本発明の被写体認識装置は、画像入力部、被写体辞書部、および処理部を備える。
画像入力部は、画像データを取り込む。
被写体辞書部は、被写体種類を特定するための被写体条件を記憶する。
処理部は、画像データを被写体条件に照合して、画像データに映っている被写体種類を特定する。
特に、本発明では、被写体辞書部は、被写体条件を階層に分類して記憶する。処理部は、上位階層に位置する被写体条件と画像データとの照合結果に基づいて、下位階層に位置する被写体条件を絞り込みつつ、画像データと下位階層の被写体条件との照合を行う。
《2》 なお好ましくは、処理部は、認識された被写体種類に関連して予め定められたキーワード情報を、画像データに対応付けて記録する。さらに、処理部は、入力されるキーワードを、このキーワード情報と照合することによって画像検索を行う。
《3》 なお好ましくは、被写体辞書部は、被写体種類Kdおよび被写体条件Cdを追加登録する機能を有する。処理部は、この追加登録に応じて、被写体種類Kdを包含する上位階層の被写体種類Kuを求め、被写体種類Kuを検出済みの画像データについて、被写体条件Cdとの照合を追加実施する。
《4》 また好ましくは、被写体辞書部は、被写体条件のバージョン情報を管理する機能を有する。処理部は、被写体種類の特定に使用した被写体条件のバージョン情報を、画像データに対応付けて記録する。
《5》 本発明の被写体認識プログラムは、コンピュータを、請求項1ないし請求項4のいずれか1項に記載の被写体認識装置として機能させるためのプログラムである。
《6》 本発明の画像検索サービス提供方法は、コンピュータが画像検索サービスを実施する方法であって、次のステップを備える。
(1)被写体種類を特定するための被写体条件を階層に分類して記憶するステップ。
(2)画像データを階層に従って被写体条件と順次照合することにより、画像データに映っている被写体種類を求めるステップ。
(3)認識された被写体種類に関連して予め定められたキーワード情報を、画像データに対応付けて記録するステップ。
(4)入力されるキーワードを、画像データに対応するキーワード情報と照合して、画像検索を行うステップ。
<< 1 >> The subject recognition apparatus of the present invention includes an image input unit, a subject dictionary unit, and a processing unit.
The image input unit captures image data.
The subject dictionary unit stores subject conditions for specifying the subject type.
The processing unit collates the image data with the subject condition, and identifies the subject type shown in the image data.
In particular, in the present invention, the subject dictionary unit stores subject conditions classified into hierarchies. The processing unit collates the image data with the subject condition of the lower layer while narrowing down the subject conditions located at the lower layer based on the collation result between the subject condition located at the upper layer and the image data.
<< 2 >> Preferably, the processing unit records keyword information predetermined in association with the recognized subject type in association with the image data. Further, the processing unit performs an image search by comparing the input keyword with this keyword information.
<< 3 >> Preferably, the subject dictionary unit has a function of additionally registering the subject type Kd and the subject condition Cd. In response to this additional registration, the processing unit obtains a higher-level subject type Ku that includes the subject type Kd, and additionally performs collation with the subject condition Cd for the image data for which the subject type Ku has been detected.
<< 4 >> Also preferably, the subject dictionary unit has a function of managing version information of subject conditions. The processing unit records the version information of the subject condition used for specifying the subject type in association with the image data.
<< 5 >> The subject recognition program of the present invention is a program for causing a computer to function as the subject recognition device according to any one of claims 1 to 4.
<< 6 >> The image search service providing method of the present invention is a method in which a computer executes an image search service, and includes the following steps.
(1) A step of classifying and storing subject conditions for specifying a subject type in a hierarchy.
(2) A step of obtaining a subject type shown in the image data by sequentially comparing the image data with subject conditions according to the hierarchy.
(3) A step of recording keyword information predetermined in relation to the recognized subject type in association with the image data.
(4) A step of performing an image search by collating the input keyword with keyword information corresponding to the image data.
本発明では、階層に分類された被写体条件を上位階層から下位階層に辿りながら、画像データの被写体認識を実施する。この場合、被写体条件を絞り込むように被写体認識が実施され、可能性の低い下位階層の被写体認識を省くことができる。その結果、被写体認識の処理回数を低減し、多数の被写体種類について効率の良い被写体認識を行うことができる。 In the present invention, subject recognition of image data is performed while tracing subject conditions classified into hierarchies from an upper hierarchy to a lower hierarchy. In this case, subject recognition is performed so as to narrow down the subject condition, and it is possible to omit subject recognition of a lower hierarchy with a low possibility. As a result, the number of subject recognition processes can be reduced, and efficient subject recognition can be performed for many types of subjects.
[構成説明]
図1は、画像検索システム11の構成を示すブロック図である。
図1において、画像検索システム11は、被写体認識装置12、画像データベース13、および端末装置14(ユーザーのパソコンなど)を、インターネットなどの通信回線により通信接続して構成される。
[Description of configuration]
FIG. 1 is a block diagram showing the configuration of the
In FIG. 1, an
なお、この画像検索システム11を、コンピュータ単体で実現することにより、コンピュータ内に記憶される画像データを高速検索するシステムを構築してもよい。
In addition, you may construct | assemble the system which searches the image data memorize | stored in a computer at high speed by implement | achieving this
さらに、上記の被写体認識装置12は、画像入力部21、被写体辞書部22、および処理部23を備えて構成される。さらに、この処理部23は、特徴量演算部31、特徴量記憶部32、制御部33、および被写体キーワード記憶部34を備えて構成される。
なお、このような被写体認識装置12の一部または全部を、コンピュータ上で被写体認識プログラムを実行することによって、ソフトウェア的に実現してもよい。また、被写体認識装置12の一部または全部を、ハードウェア的に実現してもよい。
以下、画像検索システム11の動作について、具体的に説明する。
Further, the subject recognition device 12 includes an
Note that a part or all of the subject recognition apparatus 12 may be realized in software by executing a subject recognition program on a computer. Further, part or all of the subject recognition device 12 may be realized by hardware.
Hereinafter, the operation of the
[新規画像に対する被写体認識]
図2は、新規の画像データに対する被写体認識を説明する流れ図である。以下、この図2に示すステップ番号に沿って、動作説明を行う。
[Subject recognition for new images]
FIG. 2 is a flowchart illustrating subject recognition for new image data. Hereinafter, the operation will be described along the step numbers shown in FIG.
ステップS1: 画像入力部21は、画像データベース13のデータ更新を定期的に監視する。画像入力部21は、この監視によって、画像データベース13内にキーワード未付与の新規な画像データを発見すると、この画像データを取り込む。
Step S1: The
ステップS2: 特徴量演算部31は、被写体認識を効率良く行うため、取り込んだ画像データから画像特徴量を抽出する。この画像特徴量は、後述する被写体条件との照合に使用される。抽出された画像特徴量は、特徴量記憶部32に記憶される。
この種の画像特徴量としては、例えば、下記のようなデータが有効である。
Step S2: The feature
For example, the following data is effective as this kind of image feature amount.
(1)画像の色相ヒストグラム…風景被写体/人物被写体などを色傾向により認識する際に使用する。
(2)画像の抽出エッジ…エッジ形状に基づいて特定被写体の認識に使用する。
(3)輪郭が閉曲線を示している領域・・顔や物などの閉領域の認識に使用する。
(4)顔(肌色)部分の部分画像…特定個人の認識に使用する。
(5)唇付近の色…男女の認識に使用する。
(6)髪付近の色…男女や高齢者の認識に使用する。
(7)画像内のテクスチャー…目/鼻/口/衣服の模様/草原/樹林などの認識に使用する。
(8)縦ラインの頻度…建物/樹林などの認識に使用する。
(9)画面を横断する横ライン…水平線/地平線などの認識に使用する。
(10)光源の推定色温度…室内/屋外などの認識に使用する。
(11)画像データの部分画像・・パターンマッチングに使用する。
(12)GPS情報、撮影日時、被写体距離、露出情報、音声データ、画像の縦、横方向を示す情報、焦点制御情報などの付随情報
(1) Hue histogram of image: Used when recognizing landscape subject / person subject by color tendency.
(2) Image extraction edge: Used to recognize a specific subject based on the edge shape.
(3) Used for recognizing a closed region such as a face or an object where the contour shows a closed curve.
(4) Partial image of the face (skin color) part ... Used for recognition of specific individuals.
(5) Color near the lips: Used to recognize men and women.
(6) Color near hair: Used to recognize men and women and the elderly.
(7) Texture in image: Used to recognize eyes / nose / mouth / clothing pattern / meadow / forest.
(8) Vertical line frequency: Used to recognize buildings / forests.
(9) Horizontal line across the screen: Used to recognize horizontal / horizontal lines.
(10) Estimated color temperature of light source: Used to recognize indoor / outdoor conditions.
(11) Used for partial image pattern matching of image data.
(12) GPS information, shooting date and time, subject distance, exposure information, audio data, information indicating the vertical and horizontal directions of the image, accompanying information such as focus control information
ステップS3: 被写体辞書部22の被写体辞書には、被写体種類を特定するための被写体条件が、図3に示すような、階層構造で予め登録されている。制御部33は、この被写体辞書の階層構造の中から最上位の階層を選んで探索階層とする。
Step S3: In the subject dictionary of the
ステップS4: 制御部33は、探索階層に属する被写体種類1つ1つの被写体条件を被写体辞書部22から読み出し、画像特徴量と1つずつ照合する。
例えば、図3では、最上位の探索階層であれば、人物・風景といった並列概念(最上位階層からの深さが等しい)の被写体種類が定義されている。
例えば、人物については、色相ヒストグラムに肌色の高頻度分布が現れる等の被写体条件が成立すれば、画像データ内に人物被写体が映っていると判断する。
また、風景については、色相ヒストグラムに青色や緑色の高頻度分布が現れ、かつ被写体距離が遠方である等の被写体条件が成立すれば、画像データ内に風景被写体が映っていると判断する。
以上のような動作により、探索階層に属ずる並列概念の被写体種類の1つ1つについて、画像データ内に映っているか否かの条件判定が行われる。
Step S4: The
For example, in FIG. 3, in the highest search hierarchy, a subject type of a parallel concept such as a person / landscape (the depth from the highest hierarchy is equal) is defined.
For example, for a person, if a subject condition such as the appearance of a high frequency distribution of skin color appears in the hue histogram, it is determined that the person subject appears in the image data.
For a landscape, if a subject condition such as a high-frequency distribution of blue or green appears in the hue histogram and the subject distance is far away, it is determined that a landscape subject is reflected in the image data.
With the operation as described above, whether each of the parallel concept subject types belonging to the search hierarchy is reflected in the image data is determined.
ステップS5: 制御部33は、条件成立した被写体種類に関連するキーワードを、画像データに対応付けて、被写体キーワード記憶部34に記録する。
Step S5: The
ステップS6: 制御部33は、条件不成立となった被写体種類に包含される下位階層を被写体辞書の参照範囲から省く。例えば、人物の被写体条件が不成立となった場合、人物被写体に包含される下位階層(図3では、特定個人,男性,女性など)を、被写体辞書の参照範囲から省く。このように被写体辞書の参照範囲を、上位階層の被写体認識結果に従って限定することにより、可能性の高い被写体種類に絞り込みながら、効率良く被写体認識を実行することができる。
Step S6: The
ステップS7: ここで、制御部33は、被写体辞書の探索階層が、最下位の階層に到達したか否かを判断する。
まだ、探索階層の下に下位階層が残っている場合、制御部33は、この下位階層について被写体認識を行うため、ステップS8に動作を移行する。
一方、探索階層が既に最下位の階層に到達している場合、制御部33は、新規の画像データについて、全ての被写体認識を完了したと見なして、ステップS9に動作を移行する。
Step S7: Here, the
If the lower hierarchy still remains below the search hierarchy, the
On the other hand, if the search hierarchy has already reached the lowest hierarchy, the
ステップS8: 制御部33は、探索階層を1つ下げて、ステップS4に動作を戻す。
Step S8: The
ステップS9: 制御部33は、被写体辞書部22から被写体辞書のバージョン情報を取得し、画像データに対応付けて被写体キーワード記憶部34に記録する。
以上の動作により、キーワード未付与の画像データに対する被写体認識と、キーワード付与の処理が完了する。
Step S9: The
With the above operation, the subject recognition and keyword assignment processing for image data to which no keyword is assigned are completed.
[被写体辞書の更新に伴う処理]
図4は、辞書更新に伴う処理を説明する流れ図である。以下、この図4に示すステップ番号に沿って、動作説明を行う。
[Process associated with subject dictionary update]
FIG. 4 is a flowchart for explaining processing associated with dictionary update. Hereinafter, the operation will be described along the step numbers shown in FIG.
ステップS21: 被写体辞書部22は、下記の項目を被写体辞書に追加登録する機能を有する。
Step S21: The
(1)被写体種類Kd
(2)その被写体種類Kdを特定するための被写体条件Cd
(3)その被写体種類Kdに関連するキーワード
(4)その被写体種類Kdの被写体辞書内での階層位置
(1) Subject type Kd
(2) Subject condition Cd for specifying the subject type Kd
(3) Keyword related to the subject type Kd (4) Hierarchy position in the subject dictionary of the subject type Kd
ユーザーは、端末装置14を介してこれら項目の追加登録を行うことにより、被写体辞書をカスタマイズすることができる。また、画像検索システム11の管理者側で、この追加登録を実施することにより、被写体辞書を定期的にバージョンアップすることもできる。
The user can customize the subject dictionary by additionally registering these items via the
なお、階層位置の登録については、被写体辞書の階層構造の知識が必要になるため、これを省略してもよい。また、被写体条件Cdの登録については、被写体種類Kdに該当する代表的な画像の一部または全部を登録することで簡易に済ませてもよい。
一方、被写体辞書部22側では、このような追加登録のたびに、被写体辞書の更新内容を履歴として保存し、被写体辞書の版数を示すバージョン情報を更新する。
Note that the registration of the hierarchical position may be omitted because knowledge of the hierarchical structure of the subject dictionary is required. Registration of the subject condition Cd may be simplified by registering a part or all of a representative image corresponding to the subject type Kd.
On the other hand, each time such additional registration is performed, the
ステップS22: 制御部33は、被写体種類Kdについて、階層位置が追加登録されたか否かを判定する。
ここで、階層位置の登録が省略されていた場合、制御部33は、被写体種類Kdの階層位置を調べるため、ステップS24に動作を移行する。
一方、被写体種類Kdの階層位置が登録されている場合、制御部33はステップS23に動作を移行する。
Step S22: The
Here, when the registration of the hierarchy position is omitted, the
On the other hand, when the layer position of the subject type Kd is registered, the
ステップS23: 制御部33は、登録された階層位置に従って、被写体種類Kdを包含する一階層上の被写体種類Kuを求める。この動作の後、制御部33はステップS27に動作を移行する。
Step S23: The
ステップS24: 制御部33は、被写体種類Kdの階層位置が不明なため、まずテスト的に被写体認識を行う。すなわち、制御部33は、過去に被写体認識を済ませている所定数の画像データ(テスト画像)について、画像特徴量と被写体条件Cdとの照合を一通り実施する。
Step S24: Since the hierarchical position of the subject type Kd is unknown, the
ステップS25: 制御部33は、ステップS24における照合結果と、テスト画像の過去の被写体認識結果とに基づいて、被写体種類Kdを論理的に包含する被写体種類Kuを求める。
Step S25: The
ステップS26: 制御部33は、被写体辞書部22の被写体辞書を書き換え、被写体種類Kdの階層位置を被写体種類Kuの下位階層とする。
Step S26: The
ステップS27: 制御部33は、過去の被写体認識において被写体種類Kuが映っていると判断された画像データ群を選択する。
Step S27: The
ステップS28: 制御部33は、ステップS27で選択された画像データ群の画像特徴量を、被写体条件Cdと順次に照合し、条件成立する画像データを選別する。
Step S28: The
ステップS29: 制御部33は、ステップS28で条件成立した画像データに対応付けて、被写体種類Kdに関連するキーワードを被写体キーワード記憶部24に記録する。
Step S29: The
ステップS30: 制御部33は、被写体辞書部22から被写体辞書のバージョン情報を取得し、ステップS27で選択された画像データに対応付けて、被写体キーワード記憶部34に記録する。
以上の動作により、被写体辞書の更新に応じて、画像データに新たな被写体キーワードを追加的に付与することができる。
Step S30: The
With the above operation, a new subject keyword can be additionally given to the image data in accordance with the update of the subject dictionary.
[画像検索の動作]
図5は、本実施形態における画像検索を説明する流れ図である。以下、図5に示すステップ番号に沿って、この動作を説明する。
[Image search operation]
FIG. 5 is a flowchart illustrating image search in the present embodiment. Hereinafter, this operation will be described along the step numbers shown in FIG.
ステップS41: ユーザーは、所望の被写体が映っている画像データを検索するため、その被写体に関連するキーワードを端末装置14に入力する。端末装置14は、この入力キーワードを制御部33に伝達する。
Step S41: The user inputs a keyword related to the subject to the
ステップS42: 制御部33は、被写体キーワード記憶部34に入力キーワードを照会し、入力キーワードに合致または類似する画像データを選び出す。
Step S42: The
ステップS43: 制御部33は、ステップS42で選出された画像データのサムネイルを並べて、リンク付きサムネイル頁を作成する。制御部33は、作成したサムネイル頁のデータを、画像検索結果として端末装置14に転送する。ユーザーは、端末装置14を用いてこのサムネイル頁を閲覧し、サムネイル頁のリンクを辿ることで、探索結果である画像データにアクセスすることができる。
この動作により、画像データ群の中から、入力キーワードに関連する被写体種類の映っているものを迅速に検索することが可能になる。
Step S43: The
With this operation, it is possible to quickly search the image data group for the subject type related to the input keyword.
[実施形態の効果など]
以上説明したように、本実施形態では、階層構造の被写体辞書を使用するため、被写体種類を絞り込むように被写体認識を実施することができる。そのため、上位階層の認識状況に従って、可能性の低い下位階層の被写体認識を柔軟に省くことができる。その結果、認識すべき被写体種類が多くなっても、被写体認識の回数を効率良く減らし、被写体認識に所要する総処理時間を短縮することができる。
[Effects of the embodiment, etc.]
As described above, in the present embodiment, since a subject dictionary having a hierarchical structure is used, subject recognition can be performed so as to narrow down subject types. Therefore, it is possible to flexibly omit the lower-level subject recognition with low possibility according to the recognition status of the upper layer. As a result, even if the number of types of subjects to be recognized increases, the number of times of subject recognition can be efficiently reduced, and the total processing time required for subject recognition can be shortened.
さらに、本実施形態は、画像データに映っている被写体種類を予め認識し、その被写体種類に関連するキーワードを記録しておく。そのため、キーワードの照合によって、所望の被写体が映っている画像データを簡易に検索することが可能になる。 Further, in the present embodiment, the subject type reflected in the image data is recognized in advance, and a keyword related to the subject type is recorded. Therefore, it is possible to easily search for image data showing a desired subject by matching keywords.
なお、本実施形態は、追加登録された被写体種類Kdの照合範囲を、上位階層の被写体種類Kuに過去分類された画像データ群に絞る。その結果、追加登録のたびに、過去の全ての画像データに対して被写体認識を再実行する必要がなくなり、被写体辞書のバージョンアップに伴う処理負荷を少なくすることができる。 In this embodiment, the collation range of the additionally registered subject type Kd is narrowed down to the image data group that has been previously classified into the higher-level subject type Ku. As a result, it is not necessary to re-execute subject recognition on all past image data every time additional registration is performed, and the processing load associated with version upgrade of the subject dictionary can be reduced.
[実施形態の補足事項]
なお、上述した実施形態では、画像検索の用途を中心に説明した。しかしながら、この用途に限定されるものではない。例えば、画像データに映っている被写体種類を判別し、その被写体種類に対応する画像処理(画質調整を含む)を画像データに施してもよい。この動作により、被写体種類に適した画像処理を選択実行する画像処理装置を実現することができる。
[Supplementary items of the embodiment]
In the above-described embodiment, the description is focused on the use of image search. However, it is not limited to this application. For example, the subject type shown in the image data may be determined, and image processing (including image quality adjustment) corresponding to the subject type may be performed on the image data. With this operation, an image processing apparatus that selects and executes image processing suitable for the type of subject can be realized.
また、上述した実施形態では、画像データから画像特徴量を抽出している。しかしながら、これに限定されるものではない。被写体種類を示すテンプレート画像(被写体条件に相当)と画像データとをパターンマッチングで照合することにより、画像データ内に被写体種類が映っているか否かを判定してもよい。 In the above-described embodiment, the image feature amount is extracted from the image data. However, the present invention is not limited to this. It may be determined whether or not the subject type is reflected in the image data by collating a template image indicating the subject type (corresponding to the subject condition) and image data by pattern matching.
さらに、上述した実施形態において、画像データを複数の分割領域に分け、これら分割領域ごとに被写体認識を実施してもよい。 Furthermore, in the above-described embodiment, the image data may be divided into a plurality of divided areas, and subject recognition may be performed for each of the divided areas.
また、上述した実施形態では、上下階層の包含関係に基づいて被写体種類を絞り込み、被写体認識の回数を省いている。しかしながら、これに限定されるものではない。 Further, in the above-described embodiment, subject types are narrowed down based on the inclusion relationship of the upper and lower layers, and the number of subject recognition is omitted. However, the present invention is not limited to this.
例えば、人物および女性について被写体認識を行った場合、人物であって女性でないと判定された被写体を、男性その他にそのまま分類することが可能である。このように、並列概念の排他関係に基づいて被写体種類の可能性を絞り込むことで、被写体認識の回数を効率良く省くことが可能である。 For example, when subject recognition is performed for a person and a woman, it is possible to classify a subject that is a person and is determined not to be a woman as male or other. In this way, by narrowing down the possibility of the subject type based on the parallel concept exclusive relationship, the number of times of subject recognition can be efficiently eliminated.
なお、上述した実施形態では、被写体キーワード記憶部34に画像データのキーワードやバージョン情報を記録している。しかしながら、これに限定されるものではない。画像データのファイル内(例えばEXIFデータなど)に、キーワード情報および/またはバージョン情報を記録してもよい。
In the embodiment described above, the keyword and version information of the image data are recorded in the subject
また、上述した実施形態では、静止画像を前提に説明したが、これに限定されるものではない。動画像の被写体認識にも同様に適用することができる。例えば、1つの動画像ファイルのうち、人物が映っているシーンを判別し、さらに、人物シーンから女性が映っているシーンを判別することができる。 In the above-described embodiment, the description has been made on the assumption of a still image, but the present invention is not limited to this. It can be similarly applied to subject recognition of moving images. For example, it is possible to determine a scene in which a person is shown in one moving image file, and further to determine a scene in which a woman is shown from the person scene.
以上説明したように、本発明は、画像検索システムや被写体認識装置などに利用可能な技術である。 As described above, the present invention is a technique that can be used for an image search system, a subject recognition device, and the like.
11…画像検索システム,12…被写体認識装置,13…画像データベース,14…端末装置,21…画像入力部,22…被写体辞書部,23…処理部,24…被写体キーワード記憶部,31:…特徴演算部,31…特徴量演算部,32…特徴量記憶部,33…制御部,34…被写体キーワード記憶部
DESCRIPTION OF
Claims (6)
被写体種類を特定するための被写体条件を記憶する被写体辞書部と、
前記画像データを前記被写体条件に照合して、前記画像データに映っている前記被写体種類を特定する処理部とを備え、
前記被写体辞書部は、前記被写体条件を階層に分類して記憶し、
前記処理部は、上位階層に位置する被写体条件の照合結果に基づいて、下位階層に位置する被写体条件を絞り込みながら照合を行う
ことを特徴とする被写体認識装置。 An image input unit for capturing image data;
A subject dictionary section for storing subject conditions for specifying a subject type;
A processing unit that collates the image data with the subject condition and identifies the subject type shown in the image data,
The subject dictionary unit classifies and stores the subject conditions in a hierarchy,
The subject recognition apparatus characterized in that the processing unit performs collation while narrowing down subject conditions located in a lower layer based on a collation result of subject conditions located in an upper layer.
前記処理部は、
認識された被写体種類に関連して予め定められたキーワード情報を、前記画像データに対応付けて記録し、
入力されるキーワードを、前記画像データに対応する前記キーワード情報と照合して画像検索を行う
ことを特徴とする被写体認識装置。 The subject recognition apparatus according to claim 1,
The processor is
Predetermined keyword information related to the recognized subject type is recorded in association with the image data,
A subject recognition apparatus, wherein an image search is performed by comparing an input keyword with the keyword information corresponding to the image data.
前記被写体辞書部は、前記被写体種類Kdおよび前記被写体条件Cdを追加登録する機能を有し、
前記処理部は、前記被写体辞書部の追加登録に応じて、前記被写体種類Kdを包含する上位階層の被写体種類Kuを求め、前記被写体種類Kuを検出済みの画像データについて、前記被写体条件Cdとの照合を追加実施する
ことを特徴とする被写体認識装置。 The subject recognition apparatus according to any one of claims 1 to 2,
The subject dictionary unit has a function of additionally registering the subject type Kd and the subject condition Cd,
The processing unit obtains a higher-level subject type Ku that includes the subject type Kd according to the additional registration in the subject dictionary unit, and the image data for which the subject type Ku has been detected is compared with the subject condition Cd. An object recognition apparatus characterized by additionally performing collation.
前記被写体辞書部は、前記被写体条件のバージョン情報を管理する機能を有し、
前記処理部は、前記被写体種類の特定に使用した前記被写体条件のバージョン情報を、前記画像データに対応付けて記録する
ことを特徴とする被写体認識装置。 The subject recognition apparatus according to any one of claims 1 to 3,
The subject dictionary unit has a function of managing version information of the subject condition,
The processing unit records version information of the subject condition used for specifying the subject type in association with the image data.
被写体種類を特定するための被写体条件を階層に分類して記憶するステップと、
前記画像データを前記階層に従って前記被写体条件と順次照合することにより、前記画像データに映っている被写体種類を求めるステップと、
認識された被写体種類に関連して予め定められたキーワード情報を、前記画像データに対応付けて記録するステップと、
入力されるキーワードを、前記画像データに対応する前記キーワード情報と照合して、画像検索を行うステップと
を備えたことを特徴とする画像検索サービス提供方法。
A method for a computer to implement an image search service, comprising:
Categorizing and storing subject conditions for specifying a subject type in a hierarchy;
Obtaining a subject type shown in the image data by sequentially comparing the image data with the subject condition according to the hierarchy;
Recording predetermined keyword information related to the recognized subject type in association with the image data;
A method for providing an image search service, comprising: comparing an input keyword with the keyword information corresponding to the image data and performing an image search.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006131308A JP4725408B2 (en) | 2006-05-10 | 2006-05-10 | Subject recognition device and subject recognition program |
EP18154505.4A EP3336765A1 (en) | 2006-05-10 | 2007-05-09 | Object recognition device, object recognition program, and image search service providing method |
PCT/JP2007/000494 WO2007129474A1 (en) | 2006-05-10 | 2007-05-09 | Object recognition device, object recognition program, and image search service providing method |
EP07737150A EP2023288A4 (en) | 2006-05-10 | 2007-05-09 | Object recognition device, object recognition program, and image search service providing method |
US12/227,124 US8379990B2 (en) | 2006-05-10 | 2007-05-09 | Object recognition apparatus, computer readable medium storing object recognition program, and image retrieval service providing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006131308A JP4725408B2 (en) | 2006-05-10 | 2006-05-10 | Subject recognition device and subject recognition program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007304771A true JP2007304771A (en) | 2007-11-22 |
JP4725408B2 JP4725408B2 (en) | 2011-07-13 |
Family
ID=38838654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006131308A Active JP4725408B2 (en) | 2006-05-10 | 2006-05-10 | Subject recognition device and subject recognition program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4725408B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010075311A2 (en) * | 2008-12-26 | 2010-07-01 | Five Apes, Inc. | Multi-stage image pattern recognizer |
US8229209B2 (en) | 2008-12-26 | 2012-07-24 | Five Apes, Inc. | Neural network based pattern recognizer |
US8290250B2 (en) | 2008-12-26 | 2012-10-16 | Five Apes, Inc. | Method and apparatus for creating a pattern recognizer |
JP2017530451A (en) * | 2014-12-30 | 2017-10-12 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | Information retrieval method and apparatus |
US11902650B2 (en) | 2019-05-30 | 2024-02-13 | Canon Kabushiki Kaisha | Image capturing apparatus, notification apparatus, notification method, and storage medium |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0689316A (en) * | 1992-01-09 | 1994-03-29 | Nippon Steel Corp | Symbol recognizing system |
JPH08115334A (en) * | 1994-10-18 | 1996-05-07 | Canon Inc | Retrieval device |
JPH08305718A (en) * | 1995-05-01 | 1996-11-22 | Canon Inc | Method and device for processing information |
JPH08335223A (en) * | 1995-06-08 | 1996-12-17 | Hitachi Ltd | Image retrieval system |
JPH0944518A (en) * | 1995-08-02 | 1997-02-14 | Adoin Kenkyusho:Kk | Method for structuring image data base, and method and device for retrieval from image data base |
JP2004054957A (en) * | 2002-07-19 | 2004-02-19 | Mitsubishi Electric Information Technology Centre Europa Bv | Method of representing data distribution, method of representing data element, descriptor of data element, method of collating or classifying query data element, device set to execute the method, computer program, and computer readable storage medium |
JP2004070450A (en) * | 2002-08-02 | 2004-03-04 | Fuji Photo Film Co Ltd | Image display controller |
JP2005078529A (en) * | 2003-09-02 | 2005-03-24 | Sony Corp | Robot control apparatus and method, recording medium, and program |
JP2005284487A (en) * | 2004-03-29 | 2005-10-13 | Sony Corp | Information processor and method, recording medium, and program |
-
2006
- 2006-05-10 JP JP2006131308A patent/JP4725408B2/en active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0689316A (en) * | 1992-01-09 | 1994-03-29 | Nippon Steel Corp | Symbol recognizing system |
JPH08115334A (en) * | 1994-10-18 | 1996-05-07 | Canon Inc | Retrieval device |
JPH08305718A (en) * | 1995-05-01 | 1996-11-22 | Canon Inc | Method and device for processing information |
JPH08335223A (en) * | 1995-06-08 | 1996-12-17 | Hitachi Ltd | Image retrieval system |
JPH0944518A (en) * | 1995-08-02 | 1997-02-14 | Adoin Kenkyusho:Kk | Method for structuring image data base, and method and device for retrieval from image data base |
JP2004054957A (en) * | 2002-07-19 | 2004-02-19 | Mitsubishi Electric Information Technology Centre Europa Bv | Method of representing data distribution, method of representing data element, descriptor of data element, method of collating or classifying query data element, device set to execute the method, computer program, and computer readable storage medium |
JP2004070450A (en) * | 2002-08-02 | 2004-03-04 | Fuji Photo Film Co Ltd | Image display controller |
JP2005078529A (en) * | 2003-09-02 | 2005-03-24 | Sony Corp | Robot control apparatus and method, recording medium, and program |
JP2005284487A (en) * | 2004-03-29 | 2005-10-13 | Sony Corp | Information processor and method, recording medium, and program |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010075311A2 (en) * | 2008-12-26 | 2010-07-01 | Five Apes, Inc. | Multi-stage image pattern recognizer |
WO2010075311A3 (en) * | 2008-12-26 | 2010-10-28 | Five Apes, Inc. | Multi-stage image pattern recognizer |
US8160354B2 (en) | 2008-12-26 | 2012-04-17 | Five Apes, Inc. | Multi-stage image pattern recognizer |
US8229209B2 (en) | 2008-12-26 | 2012-07-24 | Five Apes, Inc. | Neural network based pattern recognizer |
US8290250B2 (en) | 2008-12-26 | 2012-10-16 | Five Apes, Inc. | Method and apparatus for creating a pattern recognizer |
JP2017530451A (en) * | 2014-12-30 | 2017-10-12 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | Information retrieval method and apparatus |
US11902650B2 (en) | 2019-05-30 | 2024-02-13 | Canon Kabushiki Kaisha | Image capturing apparatus, notification apparatus, notification method, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP4725408B2 (en) | 2011-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11526549B2 (en) | Method and system for interfacing with a user to facilitate an image search for an object-of-interest | |
US9875303B2 (en) | System and process for building a catalog using visual objects | |
WO2007129474A1 (en) | Object recognition device, object recognition program, and image search service providing method | |
US10891509B2 (en) | Method and system for facilitating identification of an object-of-interest | |
US8036432B2 (en) | System and method of saving digital content classified by person-based clustering | |
US9367756B2 (en) | Selection of representative images | |
US8553949B2 (en) | Classification and organization of consumer digital images using workflow, and face detection and recognition | |
US7587068B1 (en) | Classification database for consumer digital images | |
US7716157B1 (en) | Searching images with extracted objects | |
US7564994B1 (en) | Classification system for consumer digital images using automatic workflow and face detection and recognition | |
JP6039942B2 (en) | Information processing apparatus, control method thereof, and program | |
JP4232774B2 (en) | Information processing apparatus and method, and program | |
TW201921270A (en) | Method and system for interfacing with a user to facilitate an image search for a person-of-interest | |
JP2004005456A (en) | Face recognizing method and its device using constitutive component base pca/ica | |
WO2007105768A1 (en) | Face-image registration device, face-image registration method, face-image registration program, and recording medium | |
JP2005518001A (en) | Modular intelligent multimedia analysis system | |
US20120213421A1 (en) | Method and System for Searching Images With Figures and Recording Medium Storing Metadata of Image | |
US20170249367A1 (en) | Dynamic thumbnail selection for search results | |
JP4725408B2 (en) | Subject recognition device and subject recognition program | |
Corcoran et al. | Automated sorting of consumer image collections using face and peripheral region image classifiers | |
JP2007310646A (en) | Search information management device, search information management program and search information management method | |
JP5890340B2 (en) | Image classification device and image classification program | |
JP4946282B2 (en) | Subject recognition apparatus, subject recognition program, and image search service providing method | |
JP4888111B2 (en) | Subject recognition device, image search method, and subject recognition program | |
JP2002133412A (en) | Image region retrieving method, system, its program and computer-readable recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4725408 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140422 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140422 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |