JP2011203769A - 画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラム - Google Patents
画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラム Download PDFInfo
- Publication number
- JP2011203769A JP2011203769A JP2010067511A JP2010067511A JP2011203769A JP 2011203769 A JP2011203769 A JP 2011203769A JP 2010067511 A JP2010067511 A JP 2010067511A JP 2010067511 A JP2010067511 A JP 2010067511A JP 2011203769 A JP2011203769 A JP 2011203769A
- Authority
- JP
- Japan
- Prior art keywords
- search
- image
- faces
- face
- designation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】画像上で複数の人物の顔が指定されたとき、指定された複数の顔画像を検索条件と決定し、決定した検索条件に基づく画像を検索する。
【解決手段】ユーザが、表示部16に表示されているサムネイル画像一覧の中から、複数の顔を指定したとき、指定受付部21は、その入力信号を受け付け、受け付けた入力信号を検索クエリ決定部22に出力する。検索クエリ決定部22は、指定受付部21からの入力信号に基づいて、指定された顔画像の特徴量に基づいて、検索クエリを決定する。画像検索部23は、検索クエリ決定部22で決定された検索クエリに基づいて、リムーバブルメディア2内に記憶されている検索対象画像群を検索し、検索クエリとの類似度が閾値以上の画像を抽出する。
【選択図】図3
【解決手段】ユーザが、表示部16に表示されているサムネイル画像一覧の中から、複数の顔を指定したとき、指定受付部21は、その入力信号を受け付け、受け付けた入力信号を検索クエリ決定部22に出力する。検索クエリ決定部22は、指定受付部21からの入力信号に基づいて、指定された顔画像の特徴量に基づいて、検索クエリを決定する。画像検索部23は、検索クエリ決定部22で決定された検索クエリに基づいて、リムーバブルメディア2内に記憶されている検索対象画像群を検索し、検索クエリとの類似度が閾値以上の画像を抽出する。
【選択図】図3
Description
本発明は、画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラムに関し、特に、画像上で複数の人物の顔が指定されたとき、指定された複数の顔画像を検索条件と決定し、決定した検索条件に基づく画像を検索することが可能な画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラムに関する。
近年のマルチメディアの普及により、デジタルデータの蓄積は益々増加の一途をたどっており、その一環をなす静止画像においては、特にその傾向が著しい。
ユーザは、デジタルスチルカメラで撮影され、メモリカードに保存されている大量の画像の中から、所望の画像を家庭用のプリンターで出力する場合、プリンターにそのメモリカードを装着し、サムネイル画像を一覧表示させ、1つ1つ画像を確認しながら出力すべき画像を選択する。そして、選択した画像の印刷を行う。
しかしながら、ユーザは、大量の画像の中から所望の画像を見つけるまでに時間がかかるという理由から、たくさん撮影したものの、撮影画像を印刷するのが面倒になり、結局、撮影したまま大量のデータが埋もれていくことになる。このように、大量のデータを扱うには、データ検索や検索結果の表示といった技術が非常に重要となる。
そこで、特許文献1には、撮影された不特定多数の人物画像を予めデータベースに蓄積しておき、新たに撮像部が対象者を撮影すると、撮影した画像を用いて、データベースに蓄積されている既登録人物と一致する人物画像があるか否かを判定し、撮影した対象者が既登録人物と一致する場合には、撮影した対象者を含む人物画像を出力する技術が提案されている。
しかしながら、特許文献1の技術では、対象者が撮影される毎に、その対象者と一致する既登録人物があるか否かを判定するとともに、一致する既登録人物がない場合には、新たな対象者として登録する処理が必要になり、処理量およびデータ量が膨大になる課題があった。
また、特許文献1の技術では、対象者が複数になる場合を想定していないため、仮に、複数の対象者が撮影された場合には、その複数の対象者を1つのグループとしてデータベースに登録し、かつ、そのグループに既登録人物でない対象者が含まれている場合には、その対象者も新たにデータベースに登録する必要があり、さらに処理量およびデータ量が膨大になる課題があった。
本発明はこのような状況に鑑みてなされたものであり、その目的は、画像上で複数の人物の顔が指定されたとき、指定された複数の顔画像を検索条件と決定し、決定した検索条件に基づく画像を検索することが可能な画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラムを提供することである。
本発明の一側面は、複数の検索対象画像における複数の顔の指定を受け付ける指定受付手段と、指定受付手段により受け付けられた複数の顔の画像に基づいて、検索条件を決定する決定手段と、決定手段により決定された検索条件に基づいて、複数の検索対象画像の中から画像を検索する検索手段とを備えることを特徴とする。このことより、複数の顔画像を含む画像を容易に検索することができる。
検索手段により検索された画像の表示を制御する表示制御手段、またはその画像を印刷する印刷手段をさらに備えることができる。これにより検索結果を表示または印刷することができる。
決定手段は、指定受付手段により受け付けられた複数の顔のち、同一人物の顔を複数含むと判定した場合、複数の同一人物の顔のうちの1つの顔の画像の特徴量と、他の人物の顔の画像の特徴量に基づいて、検索条件を決定することができる。これにより、たとえば、ユーザの意図にあった画像検索を行うことができる。
決定手段は、指定受付手段により受け付けられた複数の顔が全て同一人物の顔であると判定した場合、同一人物の顔のうち、最も正面を向いている顔の画像の特徴量に基づいて、検索条件を決定することができる。これにより、たとえば、ユーザの意図にあった画像検索を行うことができる。
決定手段は、指定受付手段により受け付けられた複数の顔が全て異なる人物の顔であると判定した場合、先に指定された顔の画像の特徴量ほど大きな重み係数を設定することができる。これにより、たとえば、ユーザの意図にあった画像検索を行うことができる。
決定手段は、指定受付手段により受け付けられた複数の顔のうち、同一人物の顔を複数含むと判定した場合は、複数の同一人物の顔の画像の特徴量に最も大きな重み係数を設定し、他の人物の顔の画像の特徴量のうち、先に指定された顔の画像の特徴量ほど大きな重み係数を設定することができる。これにより、たとえば、ユーザの意図にあった画像検索を行うことができる。
決定手段は、指定受付手段により、1つの検索対象画像から複数の顔の指定が受け付けられた場合、大きい顔の画像の特徴量ほど大きな重み係数を設定することができる。これにより、たとえば、ユーザの意図にあった画像検索を行うことができる。
検索手段は、検索対象画像のうち、決定手段により決定された検索条件との類似度が閾値以上の画像を抽出することができる。これにより、たとえば、ユーザの意図にあった画像検索を行うことができる。
本発明の一側面は、複数の検索対象画像における複数の顔の指定を受け付ける指定受付ステップと、指定受付ステップの処理により受け付けられた複数の顔の画像に基づいて、検索条件を決定する決定ステップと、決定ステップの処理により決定された検索条件に基づいて、複数の検索対象画像の中から画像を検索する検索ステップとを含むことを特徴とする。このことより、複数の顔画像を含む画像を容易に検索することができる。
本発明の一側面は、複数の検索対象画像における複数の顔の指定を受け付ける指定受付手段と、指定受付手段により受け付けられた複数の顔の画像に基づいて、検索条件を決定する決定手段と、決定手段により決定された検索条件を、画像検索装置に送信する検索条件送信手段と、画像検索装置から送信されてきた、検索条件に基づく検索結果を受信する検索結果受信手段とを備えることを特徴とする。このことより、複数の顔画像を含む画像を容易に検索することができる。
本発明の一側面は、複数の検索対象画像における複数の顔の指定を受け付ける指定受付ステップと、指定受付ステップの処理により受け付けられた複数の顔の画像に基づいて、検索条件を決定する決定ステップと、決定ステップの処理により決定された検索条件を、画像検索装置に送信する検索条件送信ステップと、画像検索装置から送信されてきた、検索条件に基づく検索結果を受信する検索結果受信ステップとを含むことを特徴とする。このことより、複数の顔画像を含む画像を容易に検索することができる。
本発明の一側面は、情報端末、および、複数の検索対象画像を蓄積する画像検索装置からなる画像検索システムにおいて、情報端末が、複数の検索対象画像における複数の顔の指定を受け付ける指定受付手段と、指定受付手段により受け付けられた複数の顔の画像に基づいて、検索条件を決定する決定手段と、決定手段により決定された検索条件を、画像検索装置に送信する検索条件送信手段と、画像検索装置から送信されてきた、検索条件に基づく検索結果を受信する検索結果受信手段とを備え、画像検索装置が、情報端末から送信されてきた検索条件を受信し、受信した検索条件に基づいて、複数の検索対象画像の中から画像を検索する検索手段と、検索手段により検索された画像を検索結果として、情報端末に送信する検索結果送信手段とを備えることを特徴とする。このことより、複数の顔画像を含む画像を容易に検索することができる。
本発明によれば、画像上で複数の人物の顔が指定されたとき、指定された複数の顔画像を検索条件と決定し、決定した検索条件に基づく画像を検索することが可能な画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラムを提供することができる。
以下、本発明の実施の形態について図面を参照して詳細に説明する。
[本発明の第1の実施の形態]
図1は、第1の実施の形態に係るプリンターの構成例を示すブロック図である。このプリンター1は、CPU(Central Processing Unit)11、メモリ12、および入出力インターフェース13が、バス14を介して接続されている。入出力インターフェース13には、入力部15、表示部16、ドライブ17、およびプリンターエンジン18が接続されている。
図1は、第1の実施の形態に係るプリンターの構成例を示すブロック図である。このプリンター1は、CPU(Central Processing Unit)11、メモリ12、および入出力インターフェース13が、バス14を介して接続されている。入出力インターフェース13には、入力部15、表示部16、ドライブ17、およびプリンターエンジン18が接続されている。
CPU11は、入力部15からの入力信号に基づいてプリンター1を起動するためのブートプログラムをメモリ12から読み出して実行し、さらにメモリ12に格納されている各種オペレーティングシステムを読み出す。
またCPU11は、入力部15からの入力信号に基づいて各種の制御を行ったり、メモリ12に記憶されているプログラムを読み出し、読み出したプログラムのコマンドに基づいて一連の処理を実行したりする。
メモリ12は、半導体メモリなどで構成されており、CPU11で実行されるプログラムなどを記憶する。メモリ12には、CPU11が実行するプログラムとして、例えば、ユーザによって指定された検索クエリに基づく画像を検索するアプリケーションが用意される。以下、適宜、ユーザによって指定された検索クエリに基づく画像を検索するこのアプリケーションを画像検索アプリケーションという。
検索クエリとは、画像検索のための抽出条件や処理要求などを文字列として表わしたものであって、検索条件に相当する。本発明では、ユーザによって、画像上で複数の顔が指定されたとき、指定された複数の顔のそれぞれの特徴量を得て、得たそれぞれの特徴量から検索クエリを決定する。さらに、決定された検索クエリにおいて、同一人物の顔を含むか否かによって、および、指定された順によって、重み係数を設定する。
入力部15は、プリンター1の操作者が各種の操作を入力する操作パネル、ボタン、スイッチなどの入力デバイスにより構成されており、操作者の操作に基づいて入力信号を生成し、入出力インターフェース13およびバス14を介してCPU11に送信する。
表示部16は、例えば液晶ディスプレイであり、CPU11からバス14および入出力インターフェース13を介して受信した信号に基づいて、各種画面などを表示する。また表示部16は、タッチパネルとして機能するようにしてもよい。
ドライブ17は、CPU11の制御の下、リムーバブルメディア2から読み出したデータを、入出力インターフェース13を介して表示部16に表示させる。
プリンターエンジン18は、CPU11から供給された印刷データに基づき印刷を行う印刷機構である。
リムーバブルメディア2は、例えばフラッシュメモリや超小型のハードディスクを内蔵したメモリカードである。このリムーバブルメディア2には、図示せぬデジタルスチルカメラで撮影された画像データ、およびパーソナルコンピュータから取り込んだ画像データなどが記憶されている。また画像データには、画像特徴量(色、テクスチャ、物体形状といった画像の特徴を数値ベクトル化したものや色情報など)が付随されている。
図2は、画像検索アプリケーションが実行されることに応じて表示部16に表示される、サムネイル画像一覧の表示例を示す図である。なおここに表示されるサムネイル画像は、たとえば、所定の記憶媒体やフォルダに記憶されている画像のサムネイル画像であったり、何らかの検索処理により抽出された画像のサムネイル画像である。
図2に示す表示例では、表示部16に、サムネイル画像P1からP9が一覧表示されているとともに、サムネイル画像一覧の下方に、複数選択ボタンB1、次ページボタンB2、および検索スタートボタンB3が表示されている。
サムネイル画像P1からP9は、リムーバブルメディア2から読み出した画像を、視認性を高めるために縮小したものである。複数選択ボタンB1は、検索画像を複数選択する場合に操作される。次ページボタンB2は、リムーバブルメディア2から読み出した画像のサムネイル画像を一度に表示することができない場合に表示され、次のサムネイル画像を表示させる場合に操作される。検索スタートボタンB3は、指定(選択)された画像に基づく画像を検索する場合に操作される。
図3は、プリンター1の機能構成例を示すブロック図である。図3に示す機能部のうちの少なくとも一部は、図1のCPU11により画像検索アプリケーションが実行されることによって実現される。
指定受付部21は、表示部16に表示されたサムネイル画像一覧(図2)において、ユーザが入力部15を用いて人物の顔を指定したとき、その入力信号を受け付け、受け付けた入力信号を検索クエリ決定部22に出力する。
検索クエリ決定部22は、指定受付部21からの入力信号に基づいて、検索クエリを決定する。検索クエリの決定方法としては、まず、指定された人物の顔を構成する目、鼻、口といったパーツなどから顔と判断できる画像が取り出される。次に、取り出した顔画像の、例えば、色、テクスチャ、物体形状といった画像の特徴を要素に持つ特徴ベクトルを作成して検索クエリとして決定されたり、あるいは、色情報を作成して検索クエリとして決定される。検索クエリ決定部22は、決定した検索クエリ(特徴ベクトルや色情報など)を画像検索部23に出力する。
画像検索部23は、検索クエリ決定部22から出力された検索クエリに基づいて、リムーバブルメディア2内に記憶されている検索対象画像群を検索し、検索クエリと類似する画像を抽出する。
検索方法としては、例えば、検索クエリに含まれる特徴ベクトルと、検索対象画像に付随する特徴ベクトルとの距離を算出し、それを画像の類似度とし、類似度が閾値以上の画像を抽出する(たとえば、特開平9−251534号公報)。また例えば、検索クエリに含まれる色情報と、検索対象画像に付随する色情報とを比較し、似ている画像同士では画像を構成する色が似ていることを利用して、色ヒストグラムから画像を抽出する。
画像検索部23は、抽出した画像を検索結果として表示制御部24に出力する。
表示制御部24は、画像検索部23から出力された検索結果である画像を表示部16に表示させる。
次に、図4のフローチャートを参照して、画像検索アプリケーションが実行する画像検索処理について説明する。この処理を開始するにあたり、画像検索アプリケーションの起動に伴って、表示部16には、図2に示したようなサムネイル画像一覧が表示されている。
ステップS1において、指定受付部21は、ユーザによって入力部15が用いられ、サムネイル画像一覧の中から顔の指定を受け付けたか否かを判定し、顔の指定を受け付けるまで待機する。
例えば、ユーザは、図2に示すサムネイル画像一覧の中から、入力部15を用いて、検索画像としたい顔を1つまたは複数指定する。なお、表示部16がタッチパネルで構成されている場合には、表示部16上を直接押下することで検索画像としたい顔を指定することができる。
ステップS1において、指定受付部21は、顔の指定を受け付けたと判定した場合、その入力信号を検索クエリ決定部22に出力し、ステップS2に進む。
ステップS2において、検索クエリ決定部22は、指定受付部21からの入力信号に基づいて、検索クエリの決定処理を行う。
図5は、図4のステップS2における、検索クエリの決定処理の詳細を説明するフローチャートである。
ステップS11において、検索クエリ決定部22は、指定受付部21から出力された入力信号から、複数の顔が指定されたか否かを判定し、複数の顔が指定されたと判定した場合、ステップS12に進む。
複数の顔が指定される場合とは、表示部16に表示されたサムネイル画像一覧において、例えば、ユーザが、入力部15を用いて、複数選択ボタンB1を押下した後で、サムネイル画像P3に含まれる顔F1、およびサムネイル画像P9に含まれる顔F2を指定し、検索スタートボタンB3を押下することである。
ステップS12において、検索クエリ決定部22は、指定された複数の顔において、それぞれの顔を構成する目、鼻、口といったパーツなどから顔と判断できる画像を取り出し、取り出した顔画像の特徴量を得る。
ステップS13において、検索クエリ決定部22は、ステップS12の処理で得た特徴量から、指定された複数の顔が全て同一人物の顔であるか否かを判定する。ステップS13において、検索クエリ決定部22は、指定された複数の顔が全て同一人物の顔であると判定した場合、ステップS14に進む。
ステップS14において、検索クエリ決定部22は、指定された複数の顔のうち、顔の輪郭、目、鼻、口の位置などから、最も正面を向いている顔画像のみの特徴量に基づいて、検索クエリを決定する。
ステップS13において、検索クエリ決定部22は、指定された複数の顔が全て同一人物ではないと判定した場合、ステップS15に進み、さらに、指定された複数の顔のうち、同一人物の顔を複数含むか否かを判定する。ステップS15において、検索クエリ決定部22は、指定された複数の顔のうち、同一人物の顔を複数含むと判定した場合、ステップS16に進む。
ステップS16において、検索クエリ決定部22は、複数の同一人物の顔のうちの1つの顔画像の特徴量と、他の人物の顔画像の特徴量に基づいて、検索クエリ画像を決定する。
例えば、ユーザが、図2に示すサムネイル画像一覧の中から、入力部15を用いて、検索画像としたい顔として、サムネイル画像P1に含まれる顔F3、サムネイル画像P3に含まれる顔F1、サムネイル画像P8に含まれる顔F4、およびサムネイル画像P9に含まれる顔F2を順に指定したとする。この場合において、検索クエリ決定部22は、顔F2と顔F4が同一人物の顔であると判断したとすると、顔F2と顔F4のうちの最も正面を向いている顔F2の画像の特徴量と、他の人物の顔F1の画像の特徴量および顔F3の画像の特徴量とに基づいて、検索クエリを決定する。
ステップS17において、検索クエリ決定部22は、ステップS16の処理で決定された検索クエリに含まれる特徴量のうち、同一人物の顔の特徴量に最も大きな重み係数を設定し、他の人物の顔の特徴量のうち、先に指定された顔ほど、大きな重み係数を設定する。
例えば、上述したようにして指定された顔F2、顔F1、および顔F3の特徴量を含む検索クエリのうち、同一人物とされた顔F2の特徴量に最も大きな重み係数を設定し、他の人物の顔のうち、先に指定された顔F1の特徴量に2番目に大きな重み係数を設定し、他の人物の顔のうち、顔F3の特徴量に、3つの顔の特徴量の中では最も小さな重み係数を設定する。
ステップS15において、検索クエリ決定部22は、複数の顔のうち、同一人物の顔を含まない、すなわち、全て異なる人物の顔であると判定した場合、ステップS18に進む。ステップS18において、検索クエリ決定部22は、指定された複数の顔の特徴量に基づいて、検索クエリを決定し、先に指定された顔ほど、大きな重み係数を設定する。
例えば、ユーザが、図2に示すサムネイル画像一覧の中から、入力部15を用いて、検索画像としたい顔として、サムネイル画像P1に含まれる顔F3、サムネイル画像P3に含まれる顔F1、およびサムネイル画像P8に含まれる顔F4を順に指定したとする。この場合において、検索クエリ決定部22は、顔F3の特徴量に最も大きな重み係数を設定し、顔F1の特徴量に2番目に大きな重み係数を設定し、顔F4の特徴量に、3つの顔の特徴量の中では最も小さな重み係数を設定する。
ステップS11において、検索クエリ決定部22は、複数の顔が指定されていないと判定した場合、ステップS19に進み、指定された1つの顔の画像を取り出し、取り出した顔画像の特徴量を得る。ステップS20において、検索クエリ決定部22は、ステップS19の処理で得た特徴量に基づいて、検索クエリを決定する。
図4の説明に戻る。ステップS3において、画像検索部23は、ステップS2の処理で決定された検索クエリに基づいて、リムーバブルメディア2内に記憶されている検索対象画像群を検索し、検索クエリとの類似度が閾値以上の画像を抽出する。
画像検索に用いる類似度は、デフォルトに設定されているが、ユーザによって、いつでもその値を変更することができ、検索精度を自由に調整することが可能である。なお、指定された複数の顔が全て異なる人物である場合の類似度の閾値は、指定された複数の顔が全て同一人物である場合の類似度の閾値よりも低く設定されている。これによって、同一人物であると指定された顔を含む画像を精度良く検索することができる。また、複数の人物が指定された場合には、その複数の人物の顔を含む画像を検索し易く(引っかかり易く)することができる。
ステップS4において、表示制御部24は、ステップS3の処理による検索結果に基づいて、例えば、図6に示すような検索結果を表示部16に表示させる。
図6に示す表示例では、検索クエリとされた顔F1を含むサムネイル画像P3および検索クエリとされた顔F2を含むサムネイル画像P9が表示されているとともに、これらの検索クエリに基づいて検索された結果が、画像P11からP13(それらの顔画像と類似する画像を含む画像)として表示されている。
[発明の第1の実施の形態における効果]
1.以上のように、複数の顔の指定を受け付け、受け付けた複数の顔の画像に基づいて、検索クエリを決定し、その検索クエリに基づいて、検索対象画像から画像を検索するようにしたので、複数の顔画像を含む画像を容易に検索することができる。
1.以上のように、複数の顔の指定を受け付け、受け付けた複数の顔の画像に基づいて、検索クエリを決定し、その検索クエリに基づいて、検索対象画像から画像を検索するようにしたので、複数の顔画像を含む画像を容易に検索することができる。
2.また以上のように、ユーザによって検索画像としたい複数の顔が指定された場合において、同一人物の顔を複数含む場合には、最も正面を向いている顔画像のみの特徴量に基づいて検索クエリを決定し、また、同一人物の顔の特徴量に最も大きな重み係数を設定し、他の人物の顔のうち、先に指定された顔の特徴量ほど大きな重み係数を設定することで、所望の画像を、より効果的に検索することができる。つまり、ユーザが最も検索したい顔の特徴量に大きな重み係数を設定することによって、検索精度を向上させることができる。
3.また以上においては、1つのサムネイル画像につき、1つの顔を指定し、その操作を複数回行うことで、複数の顔画像の特徴量を検索クエリとして決定する場合について説明したが、本発明はこれに限らず、1つのサムネイル画像につき、複数の顔を指定する場合にも適用することが可能である。
例えば、ユーザが、図2に示すサムネイル画像一覧の中から、入力部15を用いて、サムネイル画像P9に含まれる顔F2と顔F5を指定したとする。この場合において、顔の大きさを考慮して、顔F2の特徴量の重み係数を顔F5の特徴量の重み係数よりも大きく設定する。これにより、1つのサムネイル画像で複数の顔を指定した場合にも、顔の大きさを考慮した重み係数を設定することにより、重要度の高いと思われる画像を精度良く検索することが可能となる。
なお、1つのサムネイル画像につき、1つの顔を指定し、その操作を複数回行うことで複数の顔画像を指定した場合には、顔の大きさを考慮せず、上述したように、先に指定された顔画像の特徴量ほど大きな重み係数を設定するようにする。
[本発明の第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。なお、第2の実施の形態において、上述の第1の実施の形態において説明した構成要素と同一の構成要素には同一の符号を付してあり、重複する説明は適宜省略する。
次に、本発明の第2の実施の形態について説明する。なお、第2の実施の形態において、上述の第1の実施の形態において説明した構成要素と同一の構成要素には同一の符号を付してあり、重複する説明は適宜省略する。
第2の実施の形態においては、図7に示すような、画像検索システムで構成されている。この画像検索システムは、画像検索を要求する情報端末51、および、要求された画像の検索を行う画像検索装置としての画像検索サーバー52がネットワーク53を介して接続されており、情報端末51には、プリンター1が接続されている。また情報端末51には、リムーバブルメディア2が装着可能になされている。
この構成例において、情報端末51には、上述した第1の実施の形態においてプリンター1が持っていた画像の指定受付機能(指定受付部21)、検索クエリの決定機能(検索クエリ決定部22)、および検索結果の表示機能(表示制御部24)のみを有する構成とし、プリンター1が持っていた画像の検索機能(画像検索部23)は、画像検索サーバー52に移した点に特徴がある。なお、図7の例では、ネットワーク53に1台の情報端末51と1台の画像検索サーバー52とが接続されているが、情報端末51と画像検索サーバー52が、それぞれ複数台であってもよい。
さらに検索対象となる画像群は、予め画像検索サーバー52に蓄積されているが、情報端末51に装着されたリムーバブルメディア2から読み出した画像データ、あるいは、情報端末51内に記憶されている画像データを、ネットワーク53を介して画像検索サーバー52に送信し、そこに蓄積させるようにしてもよい。
図8は、画像検索サーバー52の構成例を示すブロック図である。この画像検索サーバー52は、CPU61、ROM(Read Only Memory)62、RAM(Random Access Memory)63、および入出力インターフェース64が、バス65を介して接続されている。入出力インターフェース64には、入力部66、表示部67、通信部68、記憶部69、およびデータベース70が接続されている。
CPU61は、入力部66からの入力信号に基づいて画像検索サーバー52を起動するためのブートプログラムをROM62から読み出して実行し、記憶部69に格納されている各種オペレーティングシステムを読み出す。またCPU61は、入力部66からの入力信号に基づいて各種の制御を行ったり、ROM62や記憶部69に記憶されたプログラムおよびデータを読み出してRAM63にロードしたり、あるいはRAM63から読み出されたプログラムのコマンドに基づいて、データ演算または加工などの一連の処理を実行する。
入力部66は、画像検索サーバー52の操作者が各種の操作を入力するキーボードやマウスなどの入力デバイスにより構成されており、操作者の操作に基づいて入力信号を生成し、入出力インターフェース64およびバス65を介してCPU61に送信する。表示部67は、例えば液晶ディスプレイであり、CPU61からバス65および入出力インターフェース64を介して受信した信号に基づいて、CPU61の処理結果などを表示する。
通信部68は、LAN(Local Area Network)カードやモデムなどで構成されており、画像サーバー52をネットワーク53に接続することを可能にする。すなわち通信部68は、ネットワーク53から受信したデータを、入出力インターフェース64およびバス65を介してCPU61に送信し、CPU61からバス65および入出力インターフェース64を介して受信したデータを、ネットワーク53に送信する。
記憶部69は、半導体メモリや磁気ディスクなどで構成されており、CPU61で実行されるプログラムやデータを記憶する。記憶部69には、CPU61が実行するプログラムとして、画像検索アプリケーションが用意される。
データベース70は、大容量のハードディスクなどで構成されており、大量の画像データを蓄積する。
なお、情報端末51は、汎用のパーソナルコンピュータで構成され、基本的には、図8に示した画像検索サーバー52のデータベース70を含まない構成と同等であるため、図示およびその説明は省略する。
図9は、情報端末51と画像検索サーバー52の機能構成例を示すブロック図である。
情報端末51は、指定受付部21、検索クエリ決定部22、検索クエリ送信部81、検索結果受信部82、および表示制御部24とから構成され、画像検索サーバー52は、検索クエリ受信部91、画像検索部23、および検索結果送信部92とから構成される。
情報端末51における指定受付部21、検索クエリ決定部22、表示制御部24、および、画像検索サーバー52における画像検索部23は、第1の実施の形態で上述した通りである。
情報端末51における検索クエリ送信部81は、検索クエリ決定部22で決定された検索クエリを、ネットワーク53を介して画像検索サーバー52に送信する。検索結果受信部82は、ネットワーク53を介して画像検索サーバー52から送信されてきた、検索クエリに基づく検索結果を受信し、それを表示制御部24に出力する。
画像検索サーバー52における検索クエリ受信部91は、ネットワーク53を介して情報端末51から送信されてきた検索クエリを受信し、それを画像検索部23に出力する。検索結果送信部92は、画像検索部23で検索クエリに基づいて検索された画像を検索結果として、ネットワーク53を介して情報端末51に送信する。
次に、図10のフローチャートを参照して、情報端末51と画像検索サーバー52との間で行われる画像検索処理について説明する。
まず、画像検索アプリケーションの起動に伴って、情報端末51は、ネットワーク53を介して画像検索サーバー52にアクセスし、データベース70に蓄積されている画像のサムネイル画像を取得する。これにより、情報端末51の図示せぬ表示部には、例えば、図2に示したようなサムネイル画像一覧が表示される。
ステップS31において、情報端末51の指定受付部21は、ユーザによってサムネイル画像一覧の中から顔の指定を受け付けたか否かを判定し、顔の指定を受け付けるまで待機する。
ステップS31において、指定受付部21は、顔の指定を受け付けたと判定した場合、その入力信号を検索クエリ決定部22に出力し、ステップS32に進む。
ステップS32において、検索クエリ決定部22は、指定受付部21からの入力信号に基づいて、図5のフローチャートを用いて上述したようにして、検索クエリの決定処理を行う。
ステップS33において、検索クエリ送信部81は、ステップS32の処理で決定された検索クエリを、ネットワーク53を介して画像検索サーバー52に送信する。
ステップS41において、画像検索サーバー52の検索クエリ受信部91は、ネットワーク53を介して情報端末51から送信されてきた検索クエリを受信する。ステップS42において、画像検索部23は、ステップS41の処理で検索クエリ受信部91により受信された検索クエリに基づいて、データベース70に蓄積されている検索対象画像群を検索し、検索クエリとの類似度が閾値以上の画像を抽出する。
ステップS43において、検索結果送信部92は、ステップS42の処理により検索された画像を検索結果として、ネットワーク53を介して情報端末51に送信する。
ステップS34において、情報端末51の検索結果受信部82は、ネットワーク53を介して画像検索サーバー52から送信されてきた検索結果を受信する。ステップS35において、表示制御部24は、ステップS34の処理で検索結果受信部82により受信された検索結果に基づいて、例えば、図6に示したような検索結果を図示せぬ表示部に表示させる。
[発明の第2の実施の形態における効果]
以上のように、情報端末51では、検索画像としたい顔が指定されたとき、指定された顔画像の特徴量に基づいて検索クエリを決定し、決定した検索クエリを画像検索サーバー52に送信し、この検索クエリを受信した画像検索サーバー52では、検索クエリとの類似度が閾値以上の画像を検索し、その検索結果を情報端末51に送信する。そして、情報端末51では、受信した検索結果を表示させることができる。
以上のように、情報端末51では、検索画像としたい顔が指定されたとき、指定された顔画像の特徴量に基づいて検索クエリを決定し、決定した検索クエリを画像検索サーバー52に送信し、この検索クエリを受信した画像検索サーバー52では、検索クエリとの類似度が閾値以上の画像を検索し、その検索結果を情報端末51に送信する。そして、情報端末51では、受信した検索結果を表示させることができる。
つまり、画像検索アプリケーションの複数の機能のうち、指定受付機能、検索クエリ決定機能、および検索結果の表示機能を情報端末51に設け、画像の検索機能を画像検索サーバー52に設けることで、処理を分散させることが可能となり、処理能力の高いサーバーで検索処理を実行させることができる。
[変形例]
1.以上において、画像検索アプリケーションの機能を、プリンター1、情報端末51、あるいは画像検索サーバー52に適用するようにしたが、本実施の形態はこれに限定されず、例えば、iPhone(商標)などの携帯電話機、iPod(商標)などの携帯型情報端末、携帯型ゲーム機、デジタルスチルカメラ、ハードディスクレコーダなどに適用するようにしても良い。
1.以上において、画像検索アプリケーションの機能を、プリンター1、情報端末51、あるいは画像検索サーバー52に適用するようにしたが、本実施の形態はこれに限定されず、例えば、iPhone(商標)などの携帯電話機、iPod(商標)などの携帯型情報端末、携帯型ゲーム機、デジタルスチルカメラ、ハードディスクレコーダなどに適用するようにしても良い。
2.また以上においては、図2に示したサムネイル画像から顔の指定を行う場合を例として説明したが、図6に示した検索結果として表示された画像から顔の指定を行うこともできる。
3.また以上においては、人物の顔画像を検索する場合において、検索クエリの数を変更するものとしたが、他の画像(たとえば、ペット、自動車の画像)についても同様に適用することができる。
4.上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図11は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータにおいて、CPU101,ROM102,RAM103、および入出力インターフェース104は、バス105により相互に接続されている。
入出力インターフェース105には、さらに、キーボード、マウス、マイクロホンなどよりなる入力部106、ディスプレイ、スピーカなどよりなる出力部107、ハードディスクや不揮発性のメモリなどよりなる記憶部108、ネットワークインタフェースなどよりなる通信部109、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111を駆動するドライブ110が接続されている。
以上のように構成されるコンピュータでは、CPU101が、例えば、記憶部108に記憶されているプログラムを、入出力インターフェース104およびバス105を介して、RAM103にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU101)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア111に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア111をドライブ110に装着することにより、入出力インターフェース104を介して、記憶部108にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部109で受信し、記憶部108にインストールすることができる。その他、プログラムは、ROM102や記憶部108に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
5.この発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化したり、上記実施の形態に開示されている複数の構成要素を適宜組み合わせたりすることにより種々の発明を形成できる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施の形態に亘る構成要素を適宜組み合わせても良い。
1 プリンター
2 リムーバブルメディア
21 指定受付部
22 検索クエリ決定部
23 画像検索部
24 表示制御部
51 画像検索サーバー
52 情報端末
53 ネットワーク
70 データベース
81 検索クエリ送信部
82 検索結果受信部
91 検索クエリ受信部
92 検索結果送信部
2 リムーバブルメディア
21 指定受付部
22 検索クエリ決定部
23 画像検索部
24 表示制御部
51 画像検索サーバー
52 情報端末
53 ネットワーク
70 データベース
81 検索クエリ送信部
82 検索結果受信部
91 検索クエリ受信部
92 検索結果送信部
Claims (20)
- 複数の検索対象画像における複数の顔の指定を受け付ける指定受付手段と、
前記指定受付手段により受け付けられた前記複数の顔の画像に基づいて、検索条件を決定する決定手段と、
前記決定手段により決定された前記検索条件に基づいて、前記複数の検索対象画像の中から画像を検索する検索手段と
を備えることを特徴とする画像検索装置。 - 前記検索手段により検索された前記画像の表示を制御する表示制御手段、またはその画像を印刷する印刷手段をさらに備える
ことを特徴とする請求項1に記載の画像検索装置。 - 前記決定手段は、前記指定受付手段により受け付けられた前記複数の顔のち、同一人物の顔を複数含むと判定した場合、複数の前記同一人物の顔のうちの1つの顔の画像の特徴量と、他の人物の顔の画像の特徴量に基づいて、前記検索条件を決定する
ことを特徴とする請求項1に記載の画像検索装置。 - 前記決定手段は、前記指定受付手段により受け付けられた前記複数の顔が全て同一人物の顔であると判定した場合、前記同一人物の顔のうち、最も正面を向いている顔の画像の特徴量に基づいて、前記検索条件を決定する
ことを特徴とする請求項1に記載の画像検索装置。 - 前記決定手段は、前記指定受付手段により受け付けられた前記複数の顔が全て異なる人物の顔であると判定した場合、先に指定された顔の画像の特徴量ほど大きな重み係数を設定する
ことを特徴とする請求項1に記載の画像検索装置。 - 前記決定手段は、前記指定受付手段により受け付けられた前記複数の顔のうち、同一人物の顔を複数含むと判定した場合は、複数の前記同一人物の顔の画像の特徴量に最も大きな重み係数を設定し、他の人物の顔の画像の特徴量のうち、先に指定された顔の画像の特徴量ほど大きな重み係数を設定する
ことを特徴とする請求項1に記載の画像検索装置。 - 前記決定手段は、前記指定受付手段により、1つの検索対象画像から複数の顔の指定が受け付けられた場合、大きい顔の画像の特徴量ほど大きな重み係数を設定する
ことを特徴とする請求項1に記載の画像検索装置。 - 前記検索手段は、前記検索対象画像のうち、前記決定手段により決定された前記検索条件との類似度が閾値以上の画像を抽出する
ことを特徴とする請求項1に記載の画像検索装置。 - 複数の検索対象画像における複数の顔の指定を受け付ける指定受付ステップと、
前記指定受付ステップの処理により受け付けられた前記複数の顔の画像に基づいて、検索条件を決定する決定ステップと、
前記決定ステップの処理により決定された前記検索条件に基づいて、前記複数の検索対象画像の中から画像を検索する検索ステップと
を含むことを特徴とする画像検索方法。 - 複数の検索対象画像における複数の顔の指定を受け付ける指定受付ステップと、
前記指定受付ステップの処理により受け付けられた前記複数の顔の画像に基づいて、検索条件を決定する決定ステップと、
前記決定ステップの処理により決定された前記検索条件に基づいて、前記複数の検索対象画像の中から画像を検索する検索ステップと
を含む処理をコンピュータに実行させることを特徴とするプログラム。 - 複数の検索対象画像における複数の顔の指定を受け付ける指定受付手段と、
前記指定受付手段により受け付けられた前記複数の顔の画像に基づいて、検索条件を決定する決定手段と、
前記決定手段により決定された前記検索条件を、画像検索装置に送信する検索条件送信手段と、
前記画像検索装置から送信されてきた、前記検索条件に基づく検索結果を受信する検索結果受信手段と
を備えることを特徴とする情報端末。 - 前記検索結果受信手段により受信された前記検索結果の表示を制御する表示制御手段をさらに備える
ことを特徴とする請求項11に記載の情報端末。 - 前記決定手段は、前記指定受付手段により受け付けられた前記複数の顔のち、同一人物の顔を複数含むと判定した場合、複数の前記同一人物の顔のうちの1つの顔の画像の特徴量と、他の人物の顔の画像の特徴量に基づいて、前記検索条件を決定する
ことを特徴とする請求項11に記載の情報端末。 - 前記決定手段は、前記指定受付手段により受け付けられた前記複数の顔が全て同一人物の顔であると判定した場合、前記同一人物の顔のうち、最も正面を向いている顔の画像の特徴量に基づいて、前記検索条件を決定する
ことを特徴とする請求項11に記載の情報端末。 - 前記決定手段は、前記指定受付手段により受け付けられた前記複数の顔が全て異なる人物の顔であると判定した場合、先に指定された顔の画像の特徴量ほど大きな重み係数を設定する
ことを特徴とする請求項11に記載の情報端末。 - 前記決定手段は、前記指定受付手段により受け付けられた前記複数の顔のうち、同一人物の顔を複数含むと判定した場合は、複数の前記同一人物の顔の画像の特徴量に最も大きな重み係数を設定し、他の人物の顔の画像の特徴量のうち、先に指定された顔の画像の特徴量ほど大きな重み係数を設定する
ことを特徴とする請求項11に記載の情報端末。 - 前記決定手段は、前記指定受付手段により、1つの検索対象画像から複数の顔の指定が受け付けられた場合、大きい顔の画像の特徴量ほど大きな重み係数を設定する
ことを特徴とする請求項11に記載の情報端末。 - 複数の検索対象画像における複数の顔の指定を受け付ける指定受付ステップと、
前記指定受付ステップの処理により受け付けられた前記複数の顔の画像に基づいて、検索条件を決定する決定ステップと、
前記決定ステップの処理により決定された前記検索条件を、画像検索装置に送信する検索条件送信ステップと、
前記画像検索装置から送信されてきた、前記検索条件に基づく検索結果を受信する検索結果受信ステップと
を含むことを特徴とする情報処理方法。 - 複数の検索対象画像における複数の顔の指定を受け付ける指定受付ステップと、
前記指定受付ステップの処理により受け付けられた前記複数の顔の画像に基づいて、検索条件を決定する決定ステップと、
前記決定ステップの処理により決定された前記検索条件を、画像検索装置に送信する検索条件送信ステップと、
前記画像検索装置から送信されてきた、前記検索条件に基づく検索結果を受信する検索結果受信ステップと
を含む処理をコンピュータに実行させることを特徴とするプログラム。 - 情報端末、および、複数の検索対象画像を蓄積する画像検索装置からなる画像検索システムにおいて、
前記情報端末は、
複数の検索対象画像における複数の顔の指定を受け付ける指定受付手段と、
前記指定受付手段により受け付けられた前記複数の顔の画像に基づいて、検索条件を決定する決定手段と、
前記決定手段により決定された前記検索条件を、前記画像検索装置に送信する検索条件送信手段と、
前記画像検索装置から送信されてきた、前記検索条件に基づく検索結果を受信する検索結果受信手段と
を備え、
前記画像検索装置は、
前記情報端末から送信されてきた前記検索条件を受信し、受信した前記検索条件に基づいて、前記複数の検索対象画像の中から画像を検索する検索手段と、
前記検索手段により検索された前記画像を検索結果として、前記情報端末に送信する検索結果送信手段と
を備えることを特徴とする画像検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010067511A JP2011203769A (ja) | 2010-03-24 | 2010-03-24 | 画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010067511A JP2011203769A (ja) | 2010-03-24 | 2010-03-24 | 画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011203769A true JP2011203769A (ja) | 2011-10-13 |
Family
ID=44880393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010067511A Withdrawn JP2011203769A (ja) | 2010-03-24 | 2010-03-24 | 画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011203769A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014041931A1 (ja) * | 2012-09-13 | 2014-03-20 | 株式会社エヌ・ティ・ティ・ドコモ | ユーザインタフェース装置、検索方法及びプログラム |
WO2015053604A1 (en) * | 2013-10-08 | 2015-04-16 | Data Calibre Sdn Bhd | A face retrieval method |
-
2010
- 2010-03-24 JP JP2010067511A patent/JP2011203769A/ja not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014041931A1 (ja) * | 2012-09-13 | 2014-03-20 | 株式会社エヌ・ティ・ティ・ドコモ | ユーザインタフェース装置、検索方法及びプログラム |
CN104380233A (zh) * | 2012-09-13 | 2015-02-25 | 株式会社Ntt都科摩 | 用户接口设备、搜索方法和程序 |
JP5788605B2 (ja) * | 2012-09-13 | 2015-10-07 | 株式会社Nttドコモ | ユーザインタフェース装置、検索方法及びプログラム |
WO2015053604A1 (en) * | 2013-10-08 | 2015-04-16 | Data Calibre Sdn Bhd | A face retrieval method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108900902B (zh) | 确定视频背景音乐的方法、装置、终端设备及存储介质 | |
US9013604B2 (en) | Video summary including a particular person | |
RU2597232C1 (ru) | Способ предоставления видео в режиме реального времени и устройство для его осуществления, а также сервер и терминальное устройство | |
US8665345B2 (en) | Video summary including a feature of interest | |
CN103004228A (zh) | 获取关键词用于搜索 | |
US10095713B2 (en) | Information device, server, recording medium with image file recorded thereon, image file generating method, image file management method, and computer readable recording medium | |
KR20140045897A (ko) | 시각적 이미지 매칭을 기반으로 한 미디어 스트림 식별 장치 및 방법 | |
JP2010086194A (ja) | シェア画像閲覧方法および装置 | |
US20110064319A1 (en) | Electronic apparatus, image display method, and content reproduction program | |
US20170251504A1 (en) | Apparatus and method for requesting and transferring contents | |
JP6214762B2 (ja) | 画像検索システム、検索画面表示方法 | |
JP5336759B2 (ja) | 画像出力装置及び画像出力方法 | |
JP2011203769A (ja) | 画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラム | |
JP2011203768A (ja) | 画像検索装置および方法、情報端末、情報処理方法、画像検索システム、並びにプログラム | |
US9076031B2 (en) | Image capture apparatus, control method of image capture apparatus, and recording medium | |
US8463052B2 (en) | Electronic apparatus and image search method | |
JP2016012869A (ja) | ネットワークカメラシステム、情報処理方法、プログラム | |
JP4326753B2 (ja) | 映像情報インデキシング支援システム、プログラム及び記憶媒体 | |
JP2012059067A (ja) | データ管理装置、データ管理方法、およびデータ管理プログラム | |
WO2020057130A1 (zh) | 应用控制方法及装置 | |
KR101759563B1 (ko) | 콘텐츠 요청 장치 및 방법과 콘텐츠 전송 장치 및 방법 | |
KR20150106621A (ko) | 단말, 서비스 제공 장치, 그 제어 방법, 컴퓨터 프로그램이 기록된 기록 매체 및 이미지 검색 시스템 | |
CN110866148A (zh) | 信息处理系统、信息处理装置及存储介质 | |
WO2021019987A1 (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
CN117951097A (zh) | 相册管理方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20130604 |