JP4946282B2 - 被写体認識装置、被写体認識プログラム、および画像検索サービス提供方法 - Google Patents
被写体認識装置、被写体認識プログラム、および画像検索サービス提供方法 Download PDFInfo
- Publication number
- JP4946282B2 JP4946282B2 JP2006242054A JP2006242054A JP4946282B2 JP 4946282 B2 JP4946282 B2 JP 4946282B2 JP 2006242054 A JP2006242054 A JP 2006242054A JP 2006242054 A JP2006242054 A JP 2006242054A JP 4946282 B2 JP4946282 B2 JP 4946282B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- subject
- subject type
- type
- data group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Description
また、下記の特許文献1には、画像データから被写体を認識し、画像データと共に被写体の情報を表示する装置が開示されている。
一方、インターネット上などの検索サイトでは、画像データに付随するテキスト情報(画像ファイル名、撮影日時情報など)をキーワード検索することにより、画像検索サービスを提供している。
一方、従来の特許文献1では、被写体の種類1つ1つについて、被写体認識を逐一行う必要がある。そのため、認識すべき被写体種類が膨大になると、被写体認識の処理回数が膨大になり、被写体認識に係る総処理時間が長くなってしまう。
そこで、本発明では、画像データの被写体認識を効率良く行う技術を提供することを目的とする。
また、前記被写体辞書部は、登録済みの複数の被写体種類Kdをまとめて上位階層の被写体種類Kuとして追加登録を受け付ける機能を有し、前記第1の処理部は、前記追加登録に応じて、前記登録済みの複数の被写体種類Kdのそれぞれに分類される画像データを、前記画像データ群Aに含まれる画像データとして選択した後、前記被写体種類Kuの上位階層に該当する被写体種類の画像データ群Bに含まれる画像データから、被写体種類Kdの画像データ群Aに含まれる画像データを除外することを特徴とする。
また、前記被写体辞書部は、前記被写体条件のバージョン情報を管理する機能を有し、前記処理部は、前記被写体種類Kuと見なした画像データに対応付けて、前記追加登録後のバージョン情報を記録することを特徴とする。
本発明の被写体認識プログラムは、コンピュータを上述した被写体認識装置として機能させるためのプログラムである。
本発明の画像検索サービス提供方法は、画像データを取り込む画像入力工程と、
被写体種類を特定するための被写体条件を、前記被写体種類の階層構造に従って記憶する条件記憶工程と、前記画像データを前記被写体条件に照合して、前記画像データに写っている前記被写体種類を特定する処理工程と、前記入力されるキーワードを前記キーワード情報に照合することで、画像検索を行う検索工程と、を含み、前記処理工程は、登録済みの被写体種類Kdの上位階層として、被写体種類Kuの追加登録を受け付けたときに、前記被写体種類Kuの上位階層に該当する被写体種類の画像データ群Bに含まれる画像データから、前記被写体種類Kuの下位階層に該当する被写体種類Kdの画像データ群Aに含まれる画像データを除外する第1の制御工程と、前記第1の制御部により前記画像データ群Aに含まれる画像データが除外された前記画像データ群Bに含まれる画像データのうち、前記被写体種類Kuを特定するための被写体条件Cuに該当する画像データを画像データ群Cとして選択する第2の制御工程と、前記第2の制御部により選択された前記画像データ群C及び前記画像データ群Aに含まれる画像データを、前記被写体種類Kuを検出済みの画像データとして見なして、前記被写体種類Kuに関連するキーワードを、前記画像データ群C及び前記画像データ群Aに含まれる画像データに対応付けて記憶するキーワード記憶工程と、を、さらに含むことを特徴とする。
図1は、画像検索システム11の構成を示すブロック図である。
図1において、画像検索システム11は、被写体認識装置12、画像データベース13、および端末装置14(ユーザーのパソコンなど)を、インターネットなどの通信回線により通信接続して構成される。
なお、この画像検索システム11を、コンピュータ単体で実現することにより、コンピュータ内に記憶される画像データを高速検索するシステムを構築してもよい。
さらに、上記の被写体認識装置12は、画像入力部21、被写体辞書部22、および処理部23を備えて構成される。さらに、この処理部23は、特徴量演算部31、特徴量記憶部32、制御部33、および被写体キーワード記憶部34を備えて構成される。
なお、このような被写体認識装置12の一部または全部を、コンピュータ上で被写体認識プログラムを実行することによって、ソフトウェア的に実現してもよい。また、被写体認識装置12の一部または全部を、ハードウェア的に実現してもよい。
以下、画像検索システム11の動作について、具体的に説明する。
図2は、新規の画像データに対する被写体認識を説明する流れ図である。以下、この図2に示すステップ番号に沿って、動作説明を行う。
この種の画像特徴量としては、例えば、下記のようなデータが有効である。
(1)画像の色相ヒストグラム…風景被写体/人物被写体などを色傾向により認識する際に使用する。
(2)画像の抽出エッジ…エッジ形状に基づいて特定被写体の認識に使用する。
(3)輪郭が閉曲線を示している領域・・顔や物などの閉領域の認識に使用する。
(4)顔(肌色)部分の部分画像…特定個人の認識に使用する。
(5)唇付近の色…男女の認識に使用する。
(6)髪付近の色…男女や高齢者の認識に使用する。
(7)画像内のテクスチャー…目/鼻/口/衣服の模様/草原/樹林などの認識に使用する。
(8)縦ラインの頻度…建物/樹林などの認識に使用する。
(9)画面を横断する横ライン…水平線/地平線などの認識に使用する。
(10)光源の推定色温度…室内/屋外などの認識に使用する。
(11)画像データの部分画像・・パターンマッチングに使用する。
(12)GPS情報、撮影日時、被写体距離、露出情報、音声データ、画像の縦、横方向を示す情報、焦点制御情報などの付随情報
例えば、図3では、最上位の探索階層であれば、人物・風景といった並列概念(最上位階層からの深さが等しい)の被写体種類が定義されている。
例えば、人物については、色相ヒストグラムに肌色の高頻度分布が現れる等の被写体条件が成立すれば、画像データ内に人物被写体が映っていると判断する。
また、風景については、色相ヒストグラムに青色や緑色の高頻度分布が現れ、かつ被写体距離が遠方である等の被写体条件が成立すれば、画像データ内に風景被写体が映っていると判断する。
以上のような動作により、探索階層に属ずる並列概念の被写体種類の1つ1つについて、画像データ内に映っているか否かの条件判定が行われる。
まだ、探索階層の下に下位階層が残っている場合、制御部33は、この下位階層について被写体認識を行うため、ステップS8に動作を移行する。
一方、探索階層が既に最下位の階層に到達している場合、制御部33は、新規の画像データについて、全ての被写体認識を完了したと見なして、ステップS9に動作を移行する。
以上の動作により、キーワード未付与の画像データに対する被写体認識と、キーワード付与の処理が完了する。
図4は、下位階層の辞書追加に伴う処理を説明する流れ図である。以下、この図4に示すステップ番号に沿って、動作説明を行う。
(1)被写体種類Kd
(2)その被写体種類Kdを特定するための被写体条件Cd
(3)その被写体種類Kdに関連するキーワード
(4)その被写体種類Kdの被写体辞書内での階層位置
ユーザーは、端末装置14を介してこれら項目の追加登録を行うことにより、被写体辞書をカスタマイズすることができる。また、画像検索システム11の管理者側で、この追加登録を実施することにより、被写体辞書を定期的にバージョンアップすることもできる。
なお、階層位置の登録については、被写体辞書の階層構造の知識が必要になるため、これを省略してもよい。また、被写体条件Cdの登録については、被写体種類Kdに該当する代表的な画像の一部または全部を登録することで簡易に済ませてもよい。
一方、被写体辞書部22側では、このような追加登録のたびに、被写体辞書の更新内容を履歴として保存し、被写体辞書の版数を示すバージョン情報を更新する。
ここで、階層位置の登録が省略されていた場合、制御部33は、被写体種類Kdの階層位置を調べるため、ステップS24に動作を移行する。
一方、被写体種類Kdの階層位置が登録されている場合、制御部33はステップS23に動作を移行する。
以上の動作により、下位階層の被写体種類Kdの辞書追加に応じて、画像データに新たな被写体キーワードを追加的に付与することができる。
図5は、本実施形態における画像検索を説明する流れ図である。以下、図5に示すステップ番号に沿って、この動作を説明する。
この動作により、画像データ群の中から、入力キーワードに関連する被写体種類の映っているものを迅速に検索することが可能になる。
図6は、上位階層の辞書追加に伴う処理を説明する流れ図である。以下、この図6に示すステップ番号に沿って、動作説明を行う。
(1)被写体種類Ku
(2)その被写体種類Kuを特定するための被写体条件Cu
(3)その被写体種類Kuに関連するキーワード
(4)その被写体種類Kuの被写体辞書内での階層位置
ユーザーは、端末装置14を介してこれら項目の追加登録を行うことにより、被写体辞書をカスタマイズすることができる。また、画像検索システム11の管理者側で、この追加登録を実施することにより、被写体辞書を定期的にバージョンアップすることもできる。
なお、階層位置の登録については、被写体辞書の階層構造の知識が必要になるため、これを省略してもよい。また、被写体条件Cuの登録については、被写体種類Kuに該当する代表的な画像の一部または全部を登録することで簡易に済ませてもよい。
一方、被写体辞書部22側では、このような追加登録のたびに、被写体辞書の更新内容を履歴として保存し、被写体辞書の版数を示すバージョン情報を更新する。
ここで、階層位置の登録が省略されていた場合、制御部33は、被写体種類Kuの階層位置を調べるため、ステップS54に動作を移行する。
一方、被写体種類Kuの階層位置が登録されている場合、制御部33はステップS53に動作を移行する。
(1)画像データベース13内の全ての画像データ。
(2)最近数ヶ月間に登録された新しい画像データ。
(3)過去の画像検索のヒット回数が閾値以上の画像データ。
(4)過去の閲覧回数が閾値以上の画像データ。
この画像データ群[B and (notA)]を被写体条件Cuと順次に照合し、条件成立する画像データ群Cを選択する。
以上の動作により、上位階層の被写体種類Kuの辞書追加に応じて、画像データに新たな被写体キーワードを追加的に付与することができる。
以上説明したように、本実施形態では、階層構造の被写体辞書を使用するため、被写体種類を絞り込むように被写体認識を実施することができる。そのため、上位階層の認識状況に従って、可能性の低い下位階層の被写体認識を柔軟に省くことができる。その結果、認識すべき被写体種類が多くなっても、被写体認識の回数を効率良く減らし、被写体認識に所要する総処理時間を短縮することができる。
なお、上述した実施形態では、画像検索の用途を中心に説明した。しかしながら、この用途に限定されるものではない。例えば、画像データに映っている被写体種類を判別し、その被写体種類に対応する画像処理(画質調整を含む)を画像データに施してもよい。この動作により、被写体種類に適した画像処理を選択実行する画像処理装置を実現することができる。
Claims (5)
- 画像データを取り込む画像入力部と、
被写体種類を特定するための被写体条件を、前記被写体種類の階層構造に従って記憶する被写体辞書部と、
前記画像データを前記被写体条件に照合して、前記画像データに写っている前記被写体種類を特定する処理部とを備え、
前記被写体辞書部は、登録済みの被写体種類Kdの上位階層として、被写体種類Kuの追加登録を受け付ける機能を有し、
前記処理部は、
前記被写体種類Kuの追加登録に応じて、前記被写体種類Kuの上位階層に該当する被写体種類の画像データ群Bに含まれる画像データから、前記被写体種類Kuの下位階層に該当する被写体種類Kdの画像データ群Aに含まれる画像データを除外する第1の制御部と、
前記第1の制御部により前記画像データ群Aに含まれる画像データが除外された前記画像データ群Bに含まれる画像データのうち、前記被写体種類Kuを特定するための被写体条件Cuに該当する画像データを画像データ群Cとして選択する第2の制御部と、
前記第2の制御部により選択された前記画像データ群C及び前記画像データ群Aに含まれる画像データを、前記被写体種類Kuを検出済みの画像データとして見なして、前記被写体種類Kuに関連するキーワードを、前記画像データ群C及び前記画像データ群Aに含まれる画像データに対応付けて記憶するキーワード記憶部と、
を備えることを特徴とする被写体認識装置。 - 請求項1に記載の被写体認識装置において、
前記被写体辞書部は、登録済みの複数の被写体種類Kdをまとめて上位階層の被写体種類Kuとして追加登録を受け付ける機能を有し、
前記処理部は、前記追加登録に応じて、前記登録済みの複数の被写体種類Kdのそれぞれに分類される画像データを、前記画像データ群Aに含まれる画像データとして選択した後、前記被写体種類Kuの上位階層に該当する被写体種類の画像データ群Bに含まれる画像データから、被写体種類Kdの画像データ群Aに含まれる画像データを除外することを特徴とする被写体認識装置。 - 請求項1または請求項3に記載の被写体認識装置において、
前記被写体辞書部は、前記被写体条件のバージョン情報を管理する機能を有し、
前記処理部は、前記被写体種類Kuと見なした画像データに対応付けて、前記追加登録後のバージョン情報を記録する
ことを特徴とする被写体認識装置。 - コンピュータを、請求項1ないし請求項3のいずれか1項に記載の被写体認識装置として機能させるための被写体認識プログラム。
- 画像データを取り込む画像入力工程と、
被写体種類を特定するための被写体条件を、前記被写体種類の階層構造に従って記憶する条件記憶工程と、
前記画像データを前記被写体条件に照合して、前記画像データに写っている前記被写体種類を特定する処理工程と、
前記入力されるキーワードを前記キーワード情報に照合することで、画像検索を行う検索工程と、
を含み、
前記処理工程は、
登録済みの被写体種類Kdの上位階層として、被写体種類Kuの追加登録を受け付けたときに、前記被写体種類Kuの上位階層に該当する被写体種類の画像データ群Bに含まれる画像データから、前記被写体種類Kuの下位階層に該当する被写体種類Kdの画像データ群Aに含まれる画像データを除外する第1の制御工程と、
前記第1の制御部により前記画像データ群Aに含まれる画像データが除外された前記画像データ群Bに含まれる画像データのうち、前記被写体種類Kuを特定するための被写体条件Cuに該当する画像データを画像データ群Cとして選択する第2の制御工程と、
前記第2の制御部により選択された前記画像データ群C及び前記画像データ群Aに含まれる画像データを、前記被写体種類Kuを検出済みの画像データとして見なして、前記被写体種類Kuに関連するキーワードを、前記画像データ群C及び前記画像データ群Aに含まれる画像データに対応付けて記憶するキーワード記憶工程と、
を、さらに含むことを特徴とする画像検索サービス提供方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006242054A JP4946282B2 (ja) | 2006-09-06 | 2006-09-06 | 被写体認識装置、被写体認識プログラム、および画像検索サービス提供方法 |
PCT/JP2007/000494 WO2007129474A1 (ja) | 2006-05-10 | 2007-05-09 | 被写体認識装置、被写体認識プログラム、および画像検索サービス提供方法 |
EP18154505.4A EP3336765A1 (en) | 2006-05-10 | 2007-05-09 | Object recognition device, object recognition program, and image search service providing method |
EP07737150A EP2023288A4 (en) | 2006-05-10 | 2007-05-09 | OBJECT RECOGNITION DEVICE, OBJECT RECOGNITION PROGRAM, AND METHOD FOR OBTAINING IMAGE RECORDING SERVICE |
US12/227,124 US8379990B2 (en) | 2006-05-10 | 2007-05-09 | Object recognition apparatus, computer readable medium storing object recognition program, and image retrieval service providing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006242054A JP4946282B2 (ja) | 2006-09-06 | 2006-09-06 | 被写体認識装置、被写体認識プログラム、および画像検索サービス提供方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008065560A JP2008065560A (ja) | 2008-03-21 |
JP4946282B2 true JP4946282B2 (ja) | 2012-06-06 |
Family
ID=39288230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006242054A Expired - Fee Related JP4946282B2 (ja) | 2006-05-10 | 2006-09-06 | 被写体認識装置、被写体認識プログラム、および画像検索サービス提供方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4946282B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5791909B2 (ja) * | 2011-01-26 | 2015-10-07 | オリンパス株式会社 | キーワード付与装置 |
KR101350221B1 (ko) * | 2012-02-24 | 2014-01-24 | 주식회사 시티캣 | 인지모방 기법을 이용한 지능형 영상 검색 방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08115334A (ja) * | 1994-10-18 | 1996-05-07 | Canon Inc | 検索装置 |
JPH0944518A (ja) * | 1995-08-02 | 1997-02-14 | Adoin Kenkyusho:Kk | 画像データベースの構築方法と、画像データベースの検索方法及び検索装置 |
JP2004070450A (ja) * | 2002-08-02 | 2004-03-04 | Fuji Photo Film Co Ltd | 画像表示制御装置 |
-
2006
- 2006-09-06 JP JP2006242054A patent/JP4946282B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008065560A (ja) | 2008-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2007129474A1 (ja) | 被写体認識装置、被写体認識プログラム、および画像検索サービス提供方法 | |
US9875303B2 (en) | System and process for building a catalog using visual objects | |
US9367756B2 (en) | Selection of representative images | |
US9552511B2 (en) | Identifying images using face recognition | |
KR100996066B1 (ko) | 얼굴화상 등록 장치, 얼굴화상 등록 방법, 및 기록 매체 | |
JP6039942B2 (ja) | 情報処理装置及びその制御方法及びプログラム | |
US8036432B2 (en) | System and method of saving digital content classified by person-based clustering | |
KR20200136961A (ko) | 관심 대상에 대한 이미지 검색을 촉진하기 위해 사용자와 상호 작용하는 방법 및 시스템 | |
JP5385759B2 (ja) | 画像処理装置及び画像処理方法 | |
TWI223171B (en) | System for classifying files of non-textual subject data, method for categorizing files of non-textual data and method for identifying a class for data file at a classification node | |
US20100211551A1 (en) | Method, system, and computer readable recording medium for filtering obscene contents | |
TW201921270A (zh) | 針對一感興趣的人與一使用者介接以促進影像搜尋之方法及系統 | |
JP2004005456A (ja) | 構成成分基盤pca/icaを利用した顔認識方法及びその装置 | |
CN112966758B (zh) | 一种农作物病虫草害识别方法、装置、系统及存储介质 | |
JP2014016968A (ja) | 人物検索装置及びデータ収集装置 | |
JP4725408B2 (ja) | 被写体認識装置および被写体認識プログラム | |
CN113963303A (zh) | 图像处理方法、视频识别方法、装置、设备及存储介质 | |
JP2013140475A (ja) | 映像検索装置 | |
JP5782035B2 (ja) | 情報処理装置、処理方法、コンピュータプログラム及び集積回路 | |
JP2007310646A (ja) | 検索情報管理装置、検索情報管理プログラムおよび検索情報管理方法 | |
JP4946282B2 (ja) | 被写体認識装置、被写体認識プログラム、および画像検索サービス提供方法 | |
JP2014164499A (ja) | 画像分類装置及び画像分類プログラム | |
JP2022133547A (ja) | 映像解析システム、及び映像解析方法 | |
JP7314338B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、および画像処理プログラム | |
Cerosaletti et al. | Approaches to consumer image organization based on semantic categories |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090630 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120220 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4946282 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |