以下、情報処理装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、1以上の撮影画像からオブジェクトを識別する2以上のオブジェクト識別子を取得し、2以上のオブジェクト識別子を用いて、情報を取得し、取得した情報を出力する情報処理装置について説明する。情報処理装置において、2以上の各撮影画像から2以上のオブジェクト識別子を取得してもよい。情報処理装置において、2以上の撮影画像の指定順序により取得される情報が異なるようにしてもよいし、2以上のオブジェクト識別子の用い方を、撮影画像の指定操作により区別できるようにしてもよい。
本実施の形態において、1以上の撮影画像は、例えば、撮影された写真である。撮影画像からオブジェクト識別子を取得する技術としては、オブジェクト認識技術を用いることができるが、画像検索により類似度の高い画像を検索し、当該検索した画像と対になるオブジェクト識別子を取得する技術を用いてもよい。
なお、オブジェクトとは、ここでは、情報を取得するために利用される物理的な又は概念的な物、観念をいう。具体的には、花、バラ、猫、及び自動車等の物理的な物体そのものや、黄色、緑色、屋内、屋外、オフィス、及び道路などの概念的、具象的な物、状態がオブジェクトには含まれる。また、以下の実施の形態において、オブジェクトには、暑い、寒い、元気、人気がある、明るい、早い、又は遅いなどというような、抽象的な、心象や印象など(これらを、コンテキストと表現することがある)が含まれるものとする。
オブジェクト識別子とは、オブジェクトを識別する識別子をいう。例えば、上述のようなオブジェクトに対して、「花」、「バラ」、「猫」、「自動車」、「黄色」、「緑」、「屋内」、「屋外」、「オフィス」、「道路」、「暑い」、「寒い」、「元気」、「人気がある」、「明るい」、「早い」、又は「遅い」などがオブジェクト識別子に該当する。なお、オブジェクト識別子は、このような自然言語で表されるものに限られず、オブジェクトに対応付けられている符号等で示されてもよい。
情報の取得とは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付け、他の情報を用いた情報処理などによる別の情報の生成、変換等により、情報を得ることを含む概念である。
以下、本実施の形態における情報処理装置100を備える情報システム1について説明する。
図1は、実施の形態1における情報システム1の概念図である。図2は、同情報システム1のブロック図である。
図1に示されるように、情報システム1は、利用者端末装置300と、情報処理装置100とを備える。利用者端末装置300と情報処理装置100とは、例えばインターネットなどのネットワークを介して互いに通信可能である。
なお、図1においては、例えばいわゆるスマートフォンなどの携帯情報端末装置や、タブレット型の情報端末装置、及びラップトップコンピュータなどのパーソナルコンピュータ(PC)などが利用者端末装置300として示されているが、利用者端末装置300として用いられるのはこれらのうちいずれであってもよいし、これら以外の装置であってもよい。情報システム1のユーザ(利用者)は、利用者端末装置300を利用して、情報システム1を利用することができる。
図2に示されるように、利用者端末装置300は、端末格納部310、端末処理部320、端末表示部330、操作受付部340、端末通信部350、及び撮像部370を備える。本実施の形態において、利用者端末装置300は、例えばタッチパネルを備えたディスプレイデバイスを端末表示部330及び操作受付部340として有する、いわゆるスマートフォンである。
端末格納部310は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。端末格納部310には、種々の情報やプログラム等が記憶されている。これらの情報等が記憶される過程は問わない。例えば、記録媒体を介して情報が端末格納部310で記憶されるようになってもよく、通信回線等を介して送信された情報が端末格納部310で記憶されるようになってもよく、あるいは、操作受付部340等の入力デバイスを介して入力された情報が端末格納部310で記憶されるようになってもよい。
端末処理部320は、通常、MPUやメモリ等から実現されうる。端末処理部320の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
本実施の形態において、端末表示部330は、操作受付部340に含まれるタッチパネルを有するディスプレイデバイスを含んでいる(以下、ディスプレイデバイスを指して端末表示部330ということがある)。端末表示部330は、ディスプレイデバイスのドライバーソフトとディスプレイデバイス等で実現されうるが、端末表示部330がディスプレイデバイスを含まないと考えてもよい。
操作受付部340は、ディスプレイデバイスに設けられているタッチパネルを有している。操作受付部340の入力手段は、このようなタッチパネルのほか、その他のデジタイザや、テンキーやキーボードやマウスやメニュー画面によるもの等、何でもよい。操作受付部340は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現されうる。
端末通信部350は、利用者端末装置300をネットワークに接続し、ネットワークに接続されている他の装置との間での通信を行えるように制御する。端末通信部350は、例えば無線LANや携帯電話のデータ通信などを利用して無線通信を行うように構成されていてもよいし、各種の有線による通信を行うように構成されていてもよい。
撮像部370は、例えば、レンズや撮像素子を含むカメラである。撮像部370は、カメラの動作を制御する制御ソフトウェア等を含んでいてもよい。撮像部370は、カメラにより撮影して静止画である画像を生成する。撮像部370は、カメラにより撮影して静止画を生成するものに限られず、動画を生成するものであってもよい。
利用者端末装置300は、写真撮影機能を有している。写真撮影機能では、撮像部370によりカメラで撮影した画像を生成し、端末格納部310に撮影画像として格納することができる。カメラによる撮影は、例えば、端末表示部330にプレビュー映像を表示させながらユーザによるシャッタを切る操作を操作受付部340で受け付け、操作が受け付けられたタイミングで撮像された画像を生成することにより行われる。なお、ユーザによる操作に基づかずに画像を生成するようにしてもよい。
利用者端末装置300は、端末格納部310に格納されている情報を、ネットワークを介して他の装置に送信することができる。例えば、利用者端末装置300は、端末格納部310に記憶されている撮影画像を、情報処理装置100に送信することができる。
これらの利用者端末装置300の動作は、例えば、端末処理部320が他の各部の動作を制御することにより実現されうる。
図2に示されるように、情報処理装置100は、格納部110、処理部120、及び通信部150などを備える。
格納部110は、画像格納部111、取得情報格納部113、出力情報格納部115、及び取得パターン格納部117を有している。格納部110は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。格納部110の各部に情報等が記憶される過程は問わない。例えば、記録媒体を介して情報等が格納部110で記憶されるようになってもよく、通信回線等を介して送信された情報等が格納部110で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報等が格納部110で記憶されるようになってもよい。
画像格納部111には、情報処理装置100で取得された撮影画像が格納される。画像格納部111には、1以上の撮影画像が格納されており、好ましくは、2以上の撮影画像が格納されている。図2に示される例においては、例えば、第1撮影画像P1と第2撮影画像P2とが格納されている。
ここで、撮影画像とは、上述のように利用者端末装置300においてカメラで撮影され、情報処理装置100に送信された撮影画像(写真)であるが、これに限られるものではない。例えば、利用者端末装置300において予め端末格納部310に格納された撮影画像が利用者端末装置300から情報処理装置100に送信され、その画像が撮影画像とされてもよい。また、利用者端末装置300において指定されたネットワーク上におけるロケーションに存在する画像を情報処理装置100が取得して、撮影画像として画像格納部111に格納されてもよい。
取得情報格納部113には、後述のように、情報出力機能に関して用いられる種々の情報が格納される。例えば、撮影画像から取得されたオブジェクト識別子が、その撮影画像に対応付けて格納される。また、利用者端末装置300から送信された方法情報や、撮影画像に関する順序情報などが格納される。
出力情報格納部115には、後述のように、情報出力機能によって取得された出力情報が格納される。本実施の形態においては、情報出力機能によって利用者端末装置300に送信される出力情報が格納される。
取得パターン格納部117には、例えば後述するように情報出力機能において用いられる取得パターンが格納される。取得パターンは、予め取得パターン格納部117に格納されていてもよいし、情報出力機能を利用するユーザによる操作に基づいて利用者端末装置300から送信された情報に基づいて格納されてもよい。
取得パターンとは、情報出力機能における、2以上のオブジェクト識別子を用いた検索情報の検索態様(検索方法)と出力情報の出力内容(出力方法)との少なくとも一方を規定するものである。
取得パターンとして、様々なものを用いることができる。すなわち、例えば、取得パターンとして、2以上のオブジェクト識別子を用いて検索を行うときに使用する検索エンジンに関する情報や、オブジェクト識別子のほかに指定する検索条件などが規定されうる。
また、取得パターンにおいては、2以上のオブジェクト識別子について、後述のような、2以上の撮影画像について決定された順序(順序情報)に基づいた規定を行うようにしてもよい。例えば、2つの撮影画像についてそれぞれ1つのオブジェクト識別子が取得される場合において、1番目の撮影画像についてのオブジェクト識別子(1番目のオブジェクト識別子ということがある)と2番目の撮影画像についてのオブジェクト識別子(2番目のオブジェクト識別子ということがある)とを、検索においてそれぞれどのように用いるかを規定することができる。具体的には、例えば、1番目のオブジェクト識別子が表すものについて、2番目のオブジェクト識別子で表される検索コンテキスト(例えば、検索する場所、範囲、観点などをいうが、これに限られるものではない。)に基づいて情報の検索を行う、などというような規定を行うことができる。
取得パターンの具体例について説明する。
図3は、同情報システム1における情報出力機能で用いられる取得パターンの具体例について説明する表である。
図3に示される表において、第1のオブジェクト識別子が「$OBJ1」として、第2のオブジェクト識別子が「$OBJ2」として、出力情報が「$output」として表されている。その他、情報処理装置100で実行されるプログラムまたは利用者端末装置300で実行されるプログラムにおいて、以下のとおり、所定の処理を行うための所定の関数が予め定められているものとする。
例えば、図3に示される例においては、第2のオブジェクト識別子が、表のいずれかの行に規定されているものに一致するとき、それに対応するものとして規定されている出力情報が、第1のオブジェクト識別子の内容に基づいて取得される。すなわち、第2のオブジェクト識別子に所定の関数が対応付けられているとき、その関数を出力情報としたり、その関数の戻り値を出力情報としたりすることができる。
例えば、第2のオブジェクト識別子が「道」であるとき、出力情報として、利用者端末装置300の位置情報(「$geometry」)と第1のオブジェクト識別子とを引数とする関数「navi」が出力情報とされる。例えばこの関数が出力情報として利用者端末装置300に渡されると、利用者端末装置300において、利用者端末装置300の位置から、第1のオブジェクト識別子で検索される地点までの道順が示されるようにすることができる。
また、例えば、第2のオブジェクト識別子が特定の通信販売ウェブサイトである「ショップA」であるとき、出力情報として、第1のオブジェクト識別子をクエリとして含む通信販売ウェブサイトのウェブページのURIを引数とする関数「shopsearch」が出力情報とされる。例えばこの関数が出力情報として利用者端末装置300に渡されると、利用者端末装置300において機能するウェブブラウザにおいて、URIが示すウェブページが表示されるようにすることができる。
また、例えば、第2のオブジェクト識別子が「カタログ」であるとき、出力情報として、所定のアプリ名と第1のオブジェクト識別子に基づいて検索される品物ID(「item_id($OBJ1)」)とを引数として、利用者端末装置300において所定のアプリ名のアプリを起動させる関数「start_app」が出力情報とされる。
また、例えば、第2のオブジェクト識別子が「表」であるとき、出力情報として、第1のオブジェクト識別子についての検索結果を引数として表を作成して利用者端末装置300において表示させる関数「make_table」が出力情報とされる。
なお、情報出力機能の利用時に使用する取得パターンは、ユーザによって指定可能であってもよい。この場合、例えば、利用者端末装置300においてユーザによる指定を受け付けて、利用者端末装置300から送信される方法情報において取得パターンが指定されるようにしてもよい。
他方、情報出力機能の利用時に使用する取得パターンは、情報取得部124が自動的に決定するようにしてもよい。この場合には、例えば、情報取得部124が、オブジェクト識別子取得処理において取得されたオブジェクト識別子の数や種類に応じて、用いることができる取得パターンを指定するようにしてもよい。
また、単一の取得パターンのみが規定されており、常に同じ態様で情報の検索が行われるように規定されていてもよい。
処理部120は、識別子取得部121、順序取得部122、方法取得部123、情報取得部124、及び情報出力部125を有している。
処理部120及びその各部は、通常、MPUやメモリ等から実現されうる。処理部120及びその各部の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
識別子取得部121は、例えば以下に説明するようにして、画像格納部111に格納された1又は2以上の撮影画像から、オブジェクトを識別する2以上のオブジェクト識別子を取得する。本実施の形態においては、識別子取得部121は、画像格納部111に格納された2以上の撮影画像のそれぞれからオブジェクト識別子を取得する。識別子取得部121は、取得した2以上のオブジェクト識別子を取得情報格納部113に格納する。
本実施の形態においては、例えば、識別子取得部121は、オブジェクト認識技術を用いてオブジェクト識別子を取得する。
オブジェクト認識技術としては、例えば、パターンマッチング技術などを用いることができる。例えば、画像から特徴量を抽出し、予め保有するデータベースを参照して適合度が高いレコードに関連付けられているオブジェクト識別子を取得するようにしてもよい。また、オブジェクト認識技術として、機械学習のアルゴリズムを利用したものを用いることができる。これにより、的確に、撮影画像からオブジェクト識別子を取得することができる。
機械学習のアルゴリズムの利用については、例えば次のようにすることができる。すなわち、撮影画像を入力とし、オブジェクト識別子を出力とする学習器を、機械学習のアルゴリズムにより構成する。例えば、撮影画像と、オブジェクト識別子との組の情報を2以上、取得し、当該取得した2組以上の情報を、機械学習の学習器を構成するためのモジュールに与え、学習器を構成し、格納部110に蓄積する。なお、機械学習のアルゴリズムは、例えば、深層学習、ランダムフォレスト、SVR等、問わない。また、機械学習のモジュールは、例えば、TensorFlowのモジュール、fasttext、tiny_svm、各種のrandomForest関数等、種々のものを用いることができる。なお、学習器は分類器ということもできる。
なお、各撮影画像についてのオブジェクト識別子の取得態様が規定されていてもよい。例えば、各撮影画像についてオブジェクト認識技術を用いる場合に、取得するオブジェクト識別子の種類(例えば、物体の名称に対応するものであるのか、色名に対応するものであるのか、コンテキストを示すものであるのか、など)が規定されるようにしてもよい。
また、このようなオブジェクト識別子の取得態様に関する規定は、順序情報に基づく各撮影画像において個別に規定可能であってもよい(例えば、1番目の撮影画像については物体名に対応するオブジェクト識別子を取得し、2番目の撮影画像についてはコンテキストを示すオブジェクト識別子を取得するなど)。換言すると、処理対象の撮影画像の順序(何番目の撮影画像であるか)に応じて、オブジェクト識別子の取得態様を設定してもよい。例えば、赤いバラの花が写っている撮影画像について、その撮影画像が1番目の撮影画像であれば「バラ」や「花」をオブジェクト識別子として取得し、2番目の撮影画像であれば「赤色」をオブジェクト識別子として取得するというように、オブジェクト識別子の取得態様を設定することができる。すなわち、1枚目の撮影画像であれば写っている物を具体的に表すオブジェクト識別子を取得し、2枚目の撮影画像であれば色や状態などを表すオブジェクト識別子を取得するようにしてもよい。
このようなオブジェクト識別子の取得態様の設定は、例えば、予め取得パターン格納部117に格納されている取得パターンに基づいて行われるようにしてもよい。取得パターンとして、又は取得パターンに関連付けて、各撮影画像についてのオブジェクト識別子の取得態様が規定されていてもよい。また、取得パターンによらず、例えば利用者端末装置300から送信されたユーザの指定操作に基づく情報に基づいて行われるようにしてもよい。
順序取得部122は、例えば以下に説明するようにして、2以上の撮影画像の順序を決定する。順序取得部122は、決定した順序と各撮影画像とを対応付けて、取得情報格納部113に格納する。
本実施の形態において、例えば、順序取得部122は、ユーザにより指定された2以上の撮影画像の順序に関する順序情報を取得し、順序情報に基づいて2以上の撮影画像の順序を決定する。例えば、2以上の撮影画像の順序は、利用者端末装置300をユーザが操作することによって指定されてもよいし、指定したい順序に一致するようにユーザが撮影することにより指定されてもよい。後者の場合においては、例えば、撮影画像の順序を、撮影順に対応するものとすることができる。
なお、例えば、順序取得部122は、利用者端末装置300から2以上の撮影画像が格納されている送信ファイルを情報処理装置100が受信するように構成されている場合において、その送信ファイルにおける撮影画像の格納順等に基づいて2以上の撮影画像の順序を決定するようにしてもよい。また、例えば、順序取得部122は、利用者端末装置300にて設けられた送信用バッファへの撮影画像の受付順や、情報処理装置100に設けられた受信用バッファへの撮影画像の受付順に基づいて、2以上の撮影画像の順序を決定するようにしてもよい。2以上の撮影画像の順序の決定方法についてはこれに限られず、適宜設定することができる。
方法取得部123は、ユーザにより指定された、情報出力機能における2以上のオブジェクト識別子の組み合わせ方法に関する方法情報を取得する。方法取得部123は、例えば、利用者端末装置300から送信された取得された方法情報を受信する。取得された方法情報は、取得情報格納部113に格納される。
なお、ここで、組み合わせ方法としては、例えば、2以上のオブジェクト識別子の少なくとも2つについて、「AND」条件で用いて出力情報の取得を行う方法や「OR」条件で用いて出力情報の取得を行う方法が該当するが、これらに限られない。例えば、順序情報に基づいて、2以上のオブジェクト識別子のうち所定の順番の撮影画像について取得されたオブジェクト識別子に関連するものを除くようにして出力情報の取得を行う方法などを採用するようにしてもよい。このような組み合わせ方法を識別する情報(識別子)が、方法情報として取得情報格納部113に格納される。
情報取得部124は、例えば以下に説明するようにして、識別子取得部121により取得された2以上のオブジェクト識別子を用いて、出力情報を取得する。取得された出力情報は、出力情報格納部115に格納される。
本実施の形態においては、情報取得部124は、順序取得部122により取得された順序情報に基づいて、出力情報を取得する。また、本実施の形態において、情報取得部124は、方法取得部123により取得された方法情報に基づいて、出力情報を取得する。なお、順序情報や方法情報によらずに出力情報の取得が行われるようにしてもよい。
出力情報とは、情報出力機能により情報処理装置100が出力する情報である。出力情報は、例えば、利用者端末装置300において端末表示部330に出力表示画面を表示させるために用いられる情報であるが、これに限られない。例えば、電子メールとして出力(送信)される情報であってもよいし、用紙にプリントされて出力される文書データを構成する情報であってもよいし、音声を出力するための情報やオーディオデータであってもよい。
出力情報の取得とは、情報処理装置100が装置内で出力情報を生成することであってもよいし、ネットワークを介して通信可能な他の装置から出力情報を受信することであってもよい。
例えば、情報取得部124は、情報出力機能において使用すると設定された取得パターンにおいて規定されている、2以上のオブジェクト識別子を用いた検索情報の検索態様又は出力情報の出力内容に基づいて、出力情報を取得する。具体的には、例えば、取得パターンにおいて、1番目のオブジェクト識別子が表すものについて、2番目のオブジェクト識別子で表される検索コンテキストに基づいて情報の検索を行うことが規定されている場合には、2番目のオブジェクト識別子で表される検索コンテキストに基づいて、1番目のオブジェクト識別子が表すものに関する情報を検索し、その検索結果を出力情報として取得することができる。この場合、出力情報とは、例えば、検索結果を表すウェブページのURIであってもよいし、検索結果を所定のデータ形式で表すデータファイルやそのデータファイルの所在を示す情報であってもよい。
情報出力部125は、情報取得部124が取得した出力情報を出力する。
出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。
本実施の形態においては、情報出力部125は、出力情報を出力情報格納部115から読み出して、利用者端末装置300に送信する。
通信部150は、情報処理装置100をネットワークに接続し、ネットワークに接続されている他の装置との間での通信を行えるように制御する。これにより、情報処理装置100は、例えば利用者端末装置300との間で情報の送受信を行うことができる。
情報システム1において、情報処理装置100は、情報出力機能を有している。ユーザは、利用者端末装置300を用いて、情報出力機能を利用することができる。
図4は、同情報システム1における情報出力機能の利用時の利用者端末装置300と情報処理装置100の動作の一例を大まかに示すシーケンス図である。
図4に示されるように、ユーザは、例えば利用者端末装置300で動作する所定のアプリケーションプログラム(アプリ)を利用することで、情報出力機能を利用することができる。なお、これに限られず、例えば情報処理装置100やその他の装置がウェブサーバ等として機能することにより利用者端末装置300において利用可能となるウェブアプリケーションを利用することで情報出力機能が利用できるように構成されてもよいし、電子メールの送信など、その他の方法で情報出力機能が利用できるように構成されていてもよい。
(ステップS11)利用者端末装置300において、アプリが起動する。
(ステップS12)利用者端末装置300において、撮像部370が、写真撮影を行う。これにより、撮影画像が端末格納部310に格納される。また、本実施の形態においては、写真撮影に伴って、端末処理部320が、方法情報を取得する。端末処理部320は、方法情報を、例えば撮影画像に対応付けて端末格納部310に格納する。また、本実施の形態においては、写真撮影に伴って、端末処理部320が、順序情報を取得する。端末処理部320は、順序情報を、例えば撮影画像に対応付けて端末格納部310に格納する。
(ステップS13)利用者端末装置300において、端末格納部310に格納された撮影画像が、情報処理装置100に送信される。本実施の形態においては、端末格納部310に格納された方法情報や順序情報も、あわせて情報処理装置100に送信される。
このようなステップS11からステップS13における利用者端末装置300のそれぞれの動作はユーザの指示操作に基づいて行われるが、これに限られるものではなく、明示の指示操作が行われなくても自動的に行われるようにしてもよい。
(ステップS14)情報処理装置100において、処理部120は、利用者端末装置300から送信された撮影画像を受信(取得)する。取得された撮影画像は画像格納部111に格納される。本実施の形態において、利用者端末装置300からは方法情報や順序情報も送信されている。方法取得部123や順序取得部122はこれらの情報を受信し、撮影画像に対応付けて取得情報格納部113に格納する。
(ステップS15)情報処理装置100において、後述するように、画像格納部111に格納された撮影画像を用いて出力情報が取得される。そして、情報出力部125は、出力情報を利用者端末装置300に送信する。
(ステップS16)利用者端末装置300において、端末処理部320は、情報処理装置100から送信された出力情報を取得し、端末格納部310に格納する。そして、端末処理部320は、例えば、端末表示部330に、出力情報に基づいて画面表示を行う。これにより、出力情報をユーザが確認することができる。この処理が終了すると、情報出力機能に関する一連の動作が終了する。
このような情報出力機能が利用される場合に、利用者端末装置300における写真撮影時に、端末処理部320が例えば以下のようにして方法情報や順序情報を取得することができる。
図5は、同利用者端末装置300の画面表示例を示す第1の図である。図6は、同利用者端末装置300の画面表示例を示す第2の図である。
図5及び図6においては、写真撮影時において端末表示部330に表示される画面表示例が示されている。画面表示にはカメラにより撮像されているプレビュー画像(リアルタイム画像)が表示されているが、その図示は省略されている。端末表示部330の画面表示には、例えば、何枚目の撮影画像として撮影されるかを示す順序表示D1と、シャッタボタンD2と、方法選択ボタンD3と、画像特定ボタンD4とが含まれる。これらは、画像として、プレビュー画像にオーバレイされて表示される。なお、各表示の有無や表示態様等については、これに限られず、適宜設定することができる。
ユーザは、シャッタボタンD2、方法選択ボタンD3、及び画像特定ボタンD4について、タッチ操作を行うことで、それぞれに対応する動作を端末処理部320に実行させることができる。
シャッタボタンD2が操作されると、シャッタが切られ、その時点でカメラにより撮像されている画像が、撮影画像として取得される。
方法選択ボタンD3は、撮影により得られる撮影画像に対応するオブジェクト識別子の情報取得時における利用方法についてユーザによる指定を受け付けるためのボタンである。本実施の形態においては、複数のオブジェクト識別子を「AND」条件で用いる(「ANDモード」と呼ぶ)か、「OR」条件で用いる(「ORモード」と呼ぶ)かを指定可能となっている。
画像特定ボタンD4は、例えば利用者端末装置300において予め撮影されて端末格納部310に格納されている撮影画像を、情報出力機能において利用するために特定するためのボタンである。ユーザは、シャッタボタンD2を操作して撮影した撮影画像を用いるのに代えて、端末格納部310に格納されている撮影画像を特定することで、情報出力機能において利用することができる。
図5においては、1枚目の撮影を行う場合であって、方法選択ボタンD3で「ANDモード」が指定されている場合の画面表示が示されている。順序表示D1には、1枚目の撮影を行う旨と「ANDモード」が指定されている旨とが表示されているが、いずれか一方のみが表示されていてもよい。この場合において、ユーザによりシャッタボタンD2の操作や、画像選択ボタンD4の利用により撮影画像の特定が行われると、端末処理部320は、撮影された撮影画像や特定された撮影画像について、情報出力機能において用いられる1枚目の撮影として順序情報を取得する。また、端末処理部320は、方法情報として、複数のオブジェクト識別子を「AND」条件で用いる旨の情報を取得する。
図6においては、2枚目の撮影を行う場合であって、方法選択ボタンD3で「ORモード」が指定されている場合の画面表示が示されている。順序表示D1には、2枚目の撮影を行う旨と「ORモード」が指定されている旨とが表示されているが、いずれか一方のみが表示されていてもよい。この場合において、ユーザによりシャッタボタンD2の操作や、画像選択ボタンD4の利用により撮影画像の特定が行われると、端末処理部320は、撮影された撮影画像や特定された撮影画像について、情報出力機能において用いられる2枚目の撮影として順序情報を取得する。また、端末処理部320は、方法情報として、複数のオブジェクト識別子を「OR」条件で用いる旨の情報を取得する。
なお、方法情報は、各撮影画像に対応づけて取得されるようにしてもよいし、各回の情報出力機能の利用について1つの方法情報が取得されるようにしてもよい。後者の場合には、各回の情報出力機能の利用について複数の撮影画像が用いられるとき、いずれか1つの撮影画像に対応付けて方法情報が取得されるようにしてもよいし、各撮影画像に対応付けて方法情報が取得されるようにしてもよい。
また、各回の情報出力機能の利用について複数の撮影画像が用いられるとき、カメラによる撮影や既に格納されている撮影画像の特定操作により、用いられる複数の撮影画像が選択された後、選択された複数の撮影画像のそれぞれの順序を指定する操作をユーザから受け付け、その結果に基づいて端末処理部320が順序情報を取得するようにしてもよい。撮影画像の順序を指定する方法はこれに限られない。
利用者端末装置300から情報処理装置100への撮影画像等の送信は、各回の情報出力機能の利用について用いられる撮影画像が利用者端末装置300において選択される度に行われてもよいし、用いられる複数の撮影画像の全てが選択された後で一括して行われるようにしてもよい。
図7は、同情報処理装置100の情報出力機能に関する動作の一例を示すフローチャートである。
図7に示されるように、情報処理装置100は、情報出力機能を実現する際、次のように動作する。
(ステップS101)処理部120は、利用者端末装置300から送信された撮影画像等を受信したか否かを判断する。受信していない場合には、判断を繰り返し行い、受信した場合には、ステップS102に進む。
(ステップS102)処理部120は、受信した撮影画像を、画像格納部111に格納する。また、方法取得部123や順序取得部122は、受信した方法情報や順序情報を、撮影画像に対応付けて取得情報格納部113に格納する。なお、各回の情報出力機能の実行に用いるものとして複数の撮影画像を受信した場合には、処理部120は、それらの複数の撮影画像を互いに関連付けて格納する。
(ステップS103)識別子取得部121は、オブジェクト識別子取得処理を行う。オブジェクト識別子取得処理については、後述する。
(ステップS104)情報取得部124は、オブジェクト識別子取得処理で取得されたオブジェクト識別子に基づいて、出力情報取得処理を行う。出力情報取得処理については、後述する。
(ステップS105)情報出力部125は、出力情報取得処理で取得された出力情報を、利用者端末装置300に送信する。一連の処理を終了する。
図8は、同情報処理装置100が行うオブジェクト識別子取得処理の一例を示すフローチャートである。
(ステップS201)識別子取得部121は、カウンタiに1を代入する。
(ステップS202)識別子取得部121は、i番目の撮影画像が、各回の情報出力機能の実行に用いるものとして画像格納部111に存在するか否かを判断する。i番目の撮影画像が存在する場合はステップS203に進み、i番目の撮影画像が存在しない場合は、オブジェクト識別子取得処理を終了する(図7のステップS104に進む)。
(ステップS203)識別子取得部121は、i番目の撮影画像を画像格納部111から取得する。
(ステップS204)識別子取得部121は、i番目の撮影画像について、オブジェクト認識技術により、オブジェクト識別子を取得する。
(ステップS205)識別子取得部121は、取得したオブジェクト識別子をi番目のオブジェクト識別子として、i番目の撮影画像に対応付けて格納部110に格納する。オブジェクト識別子は、例えば、取得情報格納部113に格納される。
(ステップS206)識別子取得部121は、カウンタiを、1インクリメントする。ステップS202に戻る。
図9は、同情報処理装置100が行う出力情報取得処理の一例を示すフローチャートである。
(ステップS401)情報取得部124は、カウンタkに1を代入する。
(ステップS402)情報取得部124は、k番目のオブジェクト識別子が、各回の情報出力機能の実行に用いるものとして取得情報格納部113に存在するか否かを判断する。k番目のオブジェクト識別子が存在する場合はステップS403に進み、k番目のオブジェクト識別子が存在しない場合は、ステップS405に進む。
(ステップS403)情報取得部124は、k番目のオブジェクト識別子を取得情報格納部113から取得する。
(ステップS404)情報取得部124は、カウンタkを、1インクリメントする。ステップS402に戻る。
(ステップS405)情報取得部124は、方法情報を、取得情報格納部113から取得する。
(ステップS406)情報取得部124は、取得パターンを、取得パターン格納部117から取得する。
(ステップS407)情報取得部124は、取得した取得パターンと方法情報とに従って、取得した2以上のオブジェクト識別子を用いて情報を検索し、探し出した情報(検索情報と呼ぶ)を取得する。
(ステップS408)情報取得部124は、探し出した検索情報に基づいて、出力情報を生成する。情報取得部124は、生成した出力情報を出力情報格納部115に格納する。出力情報取得処理を終了する(図7のステップS105に進む)。
なお、図8及び図9に示されている処理において、「i番目」や「k番目」とは、各回の情報出力機能の実行に用いられる複数の撮影画像の順序に対応するものとすればよく、この場合、順序情報に従って複数の撮影画像について順番にオブジェクト識別子が取得されるが、これに限られるものではない。オブジェクト識別子が取得される順番と、順序情報に基づく撮影画像の順序とが異なっていてもよい。
本実施の形態によれば、このように、撮影画像から2以上のオブジェクト識別子が取得され、オブジェクト識別子に基づいて出力情報が生成され、出力される。したがって、情報処理装置100から、撮影画像の内容に応じて取得された情報を出力することができる。そして、利用者端末装置300において出力情報に基づいて画面表示が行われ、ユーザは、画像を撮影したり選択する操作を行うだけで、出力情報に基づく情報を得ることができる。言語により表現された情報の入力が求められる通常の情報の入力方法を用いた情報システムにより得られるものとは異なる、斬新なユーザエクスペリエンスが情報システム1において提供される。
本実施の形態では、2以上の撮影画像から取得した2以上のオブジェクト識別子を用いて、情報を出力することができる。撮影画像中において最も特徴的な1つのオブジェクトについて1つのオブジェクト識別子を取得するようにすることで、撮影画像において映り込んだユーザの意図しないオブジェクトについて取得されることを防ぐことができ、よりユーザの意図に即した情報の出力を行うことができる。
本実施の形態では、順序情報に基づいて出力情報が取得される。したがって、2以上のオブジェクト識別子を用いて複数通りの情報の取得態様で出力情報を取得することができる。
本実施の形態では、2以上のオブジェクト識別子の組み合わせ方法に関する方法情報に基づいて、情報を出力することができる。ユーザの指定操作により2以上のオブジェクト識別子の用い方を調整し、ユーザの意図した方法で情報を取得し、出力することができる。
以下、本実施の形態における情報システム1で行われうる情報出力機能の利用シーンの具体例について説明する。
(第1の具体例)
第1の具体例では、1番目の撮影画像(第1撮影画像P1)に含まれるオブジェクトについて、2番目の撮影画像(第2撮影画像P2)に含まれるオブジェクトに対応する通信販売ウェブサイトにおいて検索した結果を、出力情報(例えば、検索した結果のウェブページに対応するURI)とするものである。利用者端末装置300においては、出力情報について端末表示部330で画面表示が行われる(例えば、URIで示されるウェブページ等が表示される)。
図10は、同情報システム1で行われうる情報出力機能の利用シーンの第1の具体例について説明するフローチャートである。
(ステップS511)まず、利用者端末装置300で、例えば、花を含む写真が撮影されて、第1撮影画像P1が得られる。
(ステップS512)次に、利用者端末装置300で、例えば、ユーザが指定する通信販売ウェブサイト(指定ウェブサイトということがある)のロゴ画像を含む写真が撮影されて、第2撮影画像P2が得られる。
このように第1撮影画像P1と第2撮影画像P2とが利用者端末装置300で取得されると、第1撮影画像P1と第2撮影画像P2とが、他の情報(例えば、方法情報や順序情報など)とともに情報処理装置100に送信される。そうすると、情報処理装置100において、第1撮影画像P1と第2撮影画像P2とのそれぞれについてオブジェクト識別子が取得される。第1の具体例では、花について指定ウェブサイトにおいて検索した結果が、出力情報として利用者端末装置300に送信される。
(ステップS513)そうすると、利用者端末装置300で、花について指定ウェブサイトにおいて検索した結果について、端末表示部330で画面表示が行われる。
図11は、同第1の具体例における第1撮影画像P1を示す図である。
図11に示されるように、花の写真が撮影され、第1撮影画像P1とされる。このような第1撮影画像P1についてオブジェクト識別子取得処理が行われ、例えば「花」が第1オブジェクト識別子として取得される。
図12は、同第1の具体例における第2撮影画像P2を示す図である。
図12に示されるように、指定ウェブサイトのロゴ画像が撮影され、第2撮影画像P2とされる。このような第2撮影画像P2についてオブジェクト識別子取得処理が行われると、ロゴ画像が示す通信販売ウェブサイトを特定する名称(通信販売ウェブサイトのURIなどの符号であってもよい)が第2オブジェクト識別子として取得される。
図13は、同第1の具体例における利用者端末装置300の出力情報についての画面表示R1を示す図である。
図13に示されるように、出力情報についての画面表示R1は、利用者端末装置300の端末表示部330に表示される。画面表示R1は、花について指定ウェブサイトにおいて検索した結果を表すものである。これにより、ユーザは、2つの撮影画像P1,P2に基づいて、検索した結果を得ることができる。
(第2の具体例)
第2の具体例では、1番目の撮影画像(第1撮影画像P1)に含まれるオブジェクトに関する、2番目の撮影画像(第2撮影画像P2)に含まれるオブジェクトに対応する観点の情報を検索した結果を、出力情報とするものである。
図14は、同情報システム1で行われうる情報出力機能の利用シーンの第2の具体例について説明するフローチャートである。
(ステップS521)まず、利用者端末装置300で、例えば、名所を含む写真が撮影されて、第1撮影画像P1が得られる。例えば、歴史的に有名な寺院などの建築物や、有名な展望台からの眺望などを撮影することができる。印刷物等に印刷されているものであってもよい(すなわち、実際の風景等ではなくてもよい)。
(ステップS522)次に、利用者端末装置300で、例えば、道路の風景を示す写真が撮影されて、第2撮影画像P2が得られる。
そうすると、上述のように、これらの情報を利用者端末装置300から受信した情報処理装置100において、オブジェクト識別子が取得され、出力情報が利用者端末装置300に送信される。本具体例では、第1撮影画像P1に含まれる名所のロケーションを示す情報が、出力情報として出力される。
(ステップS523)そうすると、利用者端末装置300で、名所までの経路を示す地図が、端末表示部330で表示される。なお、名所までの経路を示す地図の画像データ等が情報処理装置100から送信され、利用者端末装置300がその画像データを画面表示として表示するようにしてもよい。
図15は、同第2の具体例における第1撮影画像P1を示す図である。
図15に示されるように、例えば名所である寺院を含む写真が撮影され、第1撮影画像P1とされる。このような第1撮影画像P1についてオブジェクト識別子取得処理が行われ、例えば名所の名前が第1オブジェクト識別子として取得される。
図16は、同第2の具体例における第2撮影画像P2を示す図である。
図16に示されるように、道路を含む写真が撮影され、第2撮影画像P2とされる。このような第2撮影画像P2についてオブジェクト識別子取得処理が行われると、例えば、「道路」が第2オブジェクト識別子として取得される。
図17は、同第2の具体例における利用者端末装置300の出力情報についての画面表示R1を示す図である。
図17に示されるように、出力情報についての画面表示R1は、撮影された名所についての場所を検索した結果を表すものである。ここではさらに、検索した場所までの経路を結果として表すことができる。このように、ユーザは、2つの撮影画像P1,P2に基づいて、検索した結果を得ることができる。
(第3の具体例)
第3の具体例では、1番目の撮影画像(第1撮影画像P1)に含まれるオブジェクトに対応するもののうち、2番目の撮影画像(第2撮影画像P2)に含まれるオブジェクトに対応する観点で検索情報の絞り込みを行った結果を、出力情報とするものである。
図18は、同情報システム1で行われうる情報出力機能の利用シーンの第3の具体例について説明するフローチャートである。
(ステップS521)まず、利用者端末装置300で、例えば、洋服を含む写真が撮影されて、第1撮影画像P1が得られる。例えば、ビジネススーツなどを撮影することができる。
(ステップS522)次に、利用者端末装置300で、例えば、人物の笑顔を示す笑顔写真が撮影されて、第2撮影画像P2が得られる。笑顔写真としては、例えば、簡便な方法として、ユーザが利用者端末装置300でセルフィーを撮影(いわゆる自撮り)したものを用いることができるが、これに限られるものではない。
そうすると、上述のように、これらの情報を利用者端末装置300から受信した情報処理装置100において、オブジェクト識別子が取得され、出力情報が利用者端末装置300に送信される。本具体例では、第1撮影画像P1に含まれる洋服についての所定の検索エンジン等における検索結果のうち、第2撮影画像P2から取得されたオブジェクト識別子に対応する絞り込み観点で絞り込みを行った結果(当該絞り込み観点に対応するものについてさらに検索を行った結果)を示す情報が、出力情報として出力される。具体的には、例えば、笑顔写真からの印象を示すオブジェクト識別子として「人気がある」が取得され、この点を絞り込み観点として、人気のある洋服を示す情報が出力情報として出力される。出力情報としては、例えば、当該洋服の画像が掲載されているウェブページ又は画像そのものを示すURIなどであってもよいし、所定の通信販売ウェブサイト等で当該洋服を特定する識別符号等であってもよい。
(ステップS523)そうすると、利用者端末装置300で、例えば、人気のある洋服の画像等が、端末表示部330で表示される。
図19は、同第3の具体例における第1撮影画像P1を示す図である。
図19に示されるように、例えば洋服であるビジネススーツを含む写真が撮影され、第1撮影画像P1とされる。このような第1撮影画像P1についてオブジェクト識別子取得処理が行われると、例えば、「洋服」が第1オブジェクト識別子として取得される。
図20は、同第3の具体例における第2撮影画像P2を示す図である。
図20に示されるように、ユーザの笑顔写真が撮影され、第2撮影画像P2とされる。このような第2撮影画像P2についてオブジェクト識別子取得処理が行われると、例えば、「人気がある」が第2オブジェクト識別子として取得される。
図21は、同第3の具体例における利用者端末装置300の出力情報についての画面表示R1を示す図である。
図21に示されるように、出力情報についての画面表示R1は、検索により得られた、人気のある洋服を表す画像である。なお、1つの洋服のみでなく、複数の洋服を表示するようにしてもよい。
なお、本具体例において、第1オブジェクト識別子として「スーツ」が取得されてもよい。このような場合において、人気のあるスーツの情報について画面表示R1が行われるようにしてもよいし、情報取得部124において「スーツ」を上位概念化した検索範囲を採用して、結果として図21に表されるように人気のある洋服の情報について画面表示R1が行われるようにしてもよい。どのような検索態様を採用するかは、例えば、取得パターンなどにおいて規定することができる。
また、本具体例において、第2オブジェクト識別子として「笑顔」などが取得されてもよい。このような場合においても、「笑顔」に対応するイメージとして「人気がある」を予め対応付けておくなどし、「人気がある」を絞り込み観点として用いることで、上述と同様の結果を得ることができる。また、予め、第2撮影画像P2からオブジェクト識別子を取得する際には人物の表情に対応するコンテキストを表現するものを取得するというように規定しておくことにより、そのようなコンテキストを表現する第2オブジェクト識別子を的確に取得させることができる。例えば、取得パターンなどにおいてそのような規定を行ってもよい。
(第4の具体例)
第4の具体例では、3つの撮影画像を用いる。本具体例では、1番目の撮影画像(第1撮影画像P1)に含まれるオブジェクトについて、2番目の撮影画像(第2撮影画像P2)に含まれるオブジェクトに関連する情報を検索した結果を、3番目の撮影画像(以下、第3撮影画像P3という)に含まれるオブジェクトに対応する態様で出力情報として出力するものである。
図22は、同情報システム1で行われうる情報出力機能の利用シーンの第4の具体例について説明するフローチャートである。
(ステップS541)まず、利用者端末装置300で、例えば、電動工具を含む写真が撮影されて、第1撮影画像P1が得られる。
(ステップS542)次に、利用者端末装置300で、例えば、工具の商品カタログを含む写真が撮影されて、第2撮影画像P2が得られる。
(ステップS543)さらに、利用者端末装置300で、例えば、表を示す写真が撮影されて、第3撮影画像P3が得られる。
そうすると、上述のように、これらの情報を利用者端末装置300から受信した情報処理装置100において、オブジェクト識別子が取得され、出力情報が利用者端末装置300に送信される。本具体例では、第1撮影画像P1として撮影された電動工具について、第2撮影画像P2として撮影されたカタログに掲載されているべき情報を検索した結果を表形式のフォーマットで表す情報が、出力情報として出力される。
(ステップS544)そうすると、利用者端末装置300で、撮影された電動工具の情報が、表形式のフォーマットで、端末表示部330に表示される。
図23は、同第4の具体例における第1撮影画像P1を示す図である。
図23に示されるように、例えば電動工具である充電池式電動ドリルを含む写真が撮影され、第1撮影画像P1とされる。このような第1撮影画像P1についてオブジェクト識別子取得処理が行われ、例えば充電池式電動ドリルの品番が第1オブジェクト識別子として取得される。
図24は、同第4の具体例における第2撮影画像P2を示す図である。
図24に示されるように、工具の商品カタログを含む写真が撮影され、第2撮影画像P2とされる。このような第2撮影画像P2についてオブジェクト識別子取得処理が行われると、例えば、「商品カタログ」が第2オブジェクト識別子として取得される。
図25は、同第4の具体例における第3撮影画像P3を示す図である。
図25に示されるように、表を含む写真が撮影され、第3撮影画像P3とされる。このような第3撮影画像P3についてオブジェクト識別子取得処理が行われると、例えば、「表」が第3オブジェクト識別子(3番目の撮影画像に対応するオブジェクト識別子)として取得される。
図26は、同第4の具体例における利用者端末装置300の出力情報についての画面表示R1を示す図である。
図26に示されるように、出力情報についての画面表示R1は、撮影された電動工具について、撮影されたカタログに掲載されている情報を検索した結果を表形式のフォーマットで表したものである。なお、当該カタログに掲載されていない事項について、他の情報ソースから検索した結果を用いて情報を補完して結果を表示するようにしてもよい。このように、ユーザは、3つの撮影画像P1,P2,P3に基づいて、検索した結果を得ることができる。
(その他の具体例)
情報システム1で行われうる情報出力機能の利用シーンについての他の具体例として、上述の具体例とは一部が異なるものについて以下に説明する。
図27は、同情報システム1で行われうる情報出力機能の利用シーンの第5の具体例について説明するフローチャートである。
第5の具体例は、上述の第2の具体例において、道路の撮影画像と名所である寺院の撮影画像とが逆の順序で選択されているものである。すなわち、第1撮影画像P1として道路を含む写真撮影が行われ(ステップS1521)、第2撮影画像P2として寺院を含む写真撮影が行われる(ステップS1522)。この場合、出力情報を、例えば、利用者端末装置300の近隣にある寺院の位置を示す情報として、端末表示部330において、近隣にある寺院の位置を示す地図が表示されるようにしてもよい(ステップS1523)。なお、この場合において、情報取得部124は、利用者端末装置300の現在位置を、利用者端末装置300にてGPS(衛星利用測位システム)を利用することなどにより取得された位置情報に基づいて判断するようにすればよい。
図28は、同情報システム1で行われうる情報出力機能の利用シーンの第6の具体例について説明するフローチャートである。
第6の具体例は、上述の第3の具体例において、笑顔の撮影画像と洋服の撮影画像とが逆の順序で選択されているものである。すなわち、第1撮影画像P1としてユーザの笑顔についての写真撮影が行われ(ステップS1531)、第2撮影画像P2として洋服を含む写真撮影が行われる(ステップS1532)。この場合、例えば、端末表示部330において、撮影された洋服を含む洋服についての、ユーザの試着シミュレーション画像が表示されるようにしてもよい(ステップS1533)。
図29は、同第6の具体例における利用者端末装置300の出力情報についての画面表示R1を示す図である。
第6の具体例において、画面表示R1としては、例えば、第1撮影画像P1として撮影されたユーザの顔部分の画像と、「洋服」について検索された画像との合成画像が、ユーザの試着シミュレーション画像として表示される。
第5の具体例や第6の具体例として示されるように、ユーザにより指定された2以上の撮影画像の順序が異なる場合には、出力情報も異なるようにしてもよい。
図30は、同情報システム1で行われうる情報出力機能の利用シーンの第6の具体例について説明するフローチャートである。
第6の具体例は、上述の第4の具体例において、第3撮影画像P3を用いずに、第1撮影画像P1と第2撮影画像P2とを用いて情報を出力するようにしたものである。すなわち、第1撮影画像P1として電動工具を含む写真撮影が行われ(ステップS1541)、第2撮影画像P2としてカタログを含む写真撮影が行われる(ステップS1542)。この場合、例えば、端末表示部330において、撮影された電動工具を、撮影されたカタログに関連する通信販売ウェブサイトで発注するためのウェブページが表示されるようにしてもよい(ステップS1543)。この場合、出力情報として、例えば、当該ウェブページのURIなどが情報処理装置100から利用者端末装置300に送信されるようにすればよい。
このように、用いられる撮影画像の数や順番によって、検索情報の検索態様や出力情報の出力態様が異なるようにしてもよい。
なお、本実施の形態における処理は、ソフトウェアで実現してもよい。そして、このソフトウェアをソフトウェアダウンロード等により配布してもよい。また、このソフトウェアをCD-ROMなどの記録媒体に記録して流布してもよい。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置100を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、1以上の撮影画像が格納される画像格納部を有するコンピュータを、画像格納部に格納された撮影画像から、オブジェクトを識別する2以上のオブジェクト識別子を取得する識別子取得部と、識別子取得部により取得されたオブジェクト識別子を用いて、出力情報を取得する情報取得部と、情報取得部が取得した出力情報を出力する情報出力部として機能させるための、プログラムである。
(実施の形態2)
まず、実施の形態2の概要を、上述の実施の形態1とは異なる部分について説明する。実施の形態2では、動画中から選択された静止画が撮影画像として用いられる。シーンの切り替わり検索などにより、動画から静止画が自動選択されるようにしてもよい。本実施の形態では、動画中の静止画の選択は、情報処理装置100において行われる。なお、利用者端末装置300において、撮影された動画から、静止画が選択され、撮影画像として情報処理装置100に送信されるようにしてもよい。
図31は、実施の形態2に係る情報システム2001を示すブロック図である。
情報システム2001において、基本的な構成は実施の形態1の情報システム1と同じである。情報処理装置100の格納部110に動画格納部2111が設けられており、処理部120に静止画選択部2126が設けられている点が情報システム1とは異なっている。
実施の形態2においては、情報出力機能が利用されるとき、利用者端末装置300で動画が撮影され、動画が情報処理装置100に送信される。処理部120は、受信した動画を、動画格納部2111に格納する。そうすると、静止画選択部2126が、所定の条件に従って、格納された動画から2以上の静止画を選択し、選択した静止画を撮影画像として画像格納部111に格納する。
すなわち、静止画選択部2126は、動画格納部2111に格納されている動画を読み込み、動画の内容を解析する。静止画選択部2126は、動画を解析した内容に基づいて、動画の中から静止画を選択する。本実施の形態においては、静止画選択部2126は、1つの動画から2つの静止画を選択する。なお、さらに多くの静止画を選択するようにしてもよいし、1つの静止画を選択するようにしてもよい。
静止画が撮影画像として画像格納部111に格納されると、それ以後の情報出力機能についての動作は実施の形態1と同様にして行われる。
なお、上述の所定の条件に従って動画から静止画を選択するとは、例えば以下のようにして行われればよい。すなわち、静止画選択部2126は、動画中において、シーンの変わり目を検出する。そして、シーンの変わり目の直後(例えば、所定フレーム後)の静止画を選択し、撮影画像として用いる。
図32は、同静止画選択部2126が行う静止画の選択について説明する図である。
図32に示されるように、例えば、シーン1(再生時間t0から再生時間t1まで)と、シーン2(再生時間t1から再生時間t2まで)と、シーン3(再生時間t2以降)との3つのシーンを含む動画がある場合を想定する。静止画選択部2126は、動画の解析を行い、これらの3つのシーンの切り替わりタイミングである再生時間t1と再生時間t2とを特定する。静止画選択部2126は、例えば、再生時間t1の所定フレーム後の静止画を第1撮影画像P1として選択し、また、再生時間t2の所定フレーム後の静止画を第2撮影画像P2として選択する。なお、再生時間t0の所定フレーム後の静止画も選択するようにしてもよい。
なお、例えば、動画の所定の再生時間帯のみを静止画の選択対象とするようにしたり、2以上の所定数の静止画を選択した場合において処理を終了し、以後の静止画の選択を行わないようにしてもよい。また、1つの動画から1つの静止画を選択するようにし、2以上の動画のそれぞれについて静止画を1つずつ選択し、得られた2以上の撮影画像を情報出力機能において用いるようにしてもよい。
また、動画から選択する静止画は、ユーザの操作に基づいて決定されるようにしてもよい。
このように、動画から選択された静止画を撮影画像として情報出力機能が行われ、動画中に含まれる静止画の内容に応じて情報を出力することができる。したがって、通常の情報の入力方法を用いた情報処理システムにより得られるものとは異なる、斬新なユーザエクスペリエンスを提供することができる。
なお、本実施の形態において用いられる動画は、動画ファイルとして端末格納部310に記憶されているものなどの録画された動画であってもよいが、これに限られない。例えば、利用者端末装置300において静止画の選択が行われる場合において、動画ファイルとしては記憶されていない、撮像部370でカメラにより現在撮像されているプレビュー映像(リアルタイム画像)を処理対象の動画として、プレビュー映像から静止画を選択し、撮影画像として用いるようにしてもよい。
(実施の形態3)
まず、実施の形態3の概要を、上述の実施の形態1とは異なる部分について説明する。実施の形態3では、実施の形態1と同様の構成を有する情報システム1が用いられる。本実施の形態では、識別子取得部121が、撮影画像からオブジェクト識別子を取得する技術として、類似画像を検索する技術を用いる点が実施の形態1とは異なっている。
すなわち、本実施の形態において、識別子取得部121は、画像とその画像の内容を表すものとして予め定められた識別子とが対応付けられて記憶されている類似画像データベースを利用する。識別子取得部121は、類似画像データベースにおいて、撮影画像と類似度の高い画像を検索するとともに、検索により探し出された画像に対応付けられている識別子をオブジェクト識別子として取得する。
なお、類似画像データベースとしては、情報処理装置100とは異なるサーバ等に記憶されているもの(外部の検索ウェブサービス等により利用可能となっているものを含む)を用いるようにしてもよいし、予め情報処理装置100において構築され格納されている物を用いるようにしてもよい。
図33は、実施の形態3に係る情報処理装置100が行うオブジェクト識別子取得処理の一例を示すフローチャートである。
図33において、ステップS1201からステップS1203までの処理は、上述の図8におけるステップS201からステップS203までの処理と同じであるため、説明を省略する。
(ステップS1204)識別子取得部121は、i番目の撮影画像について、類似画像データベースを利用して、類似画像を検索する。
(ステップS1205)識別子取得部121は、探し出された類似画像に対応する識別子を、オブジェクト識別子として取得する。例えば、撮影画像について探し出された類似画像が、類似画像データベースにおいて「花」を検索キーワード(識別子)にして検索したときに探し出される画像であれば、その「花」がオブジェクト識別子として取得される。
(ステップS1206)識別子取得部121は、取得したオブジェクト識別子をi番目のオブジェクト識別子として、i番目の撮影画像に対応付けて取得情報格納部113に格納する。
(ステップS1207)識別子取得部121は、カウンタiを、1インクリメントする。ステップS1202に戻る。
このように、実施の形態3によれば、探し出された類似画像に対応する識別子がオブジェクト識別子として取得されるので、容易に撮影画像からオブジェクト識別子を取得することができる。
(その他)
図34は、上記実施の形態におけるコンピュータシステム800の概観図である。図35は、同コンピュータシステム800のブロック図である。
これらの図においては、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の情報処理装置100等を実現するコンピュータの構成が示されている。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現されうる。
コンピュータシステム800は、CD-ROMドライブを含むコンピュータ801と、キーボード802と、マウス803と、モニタ804とを含む。
コンピュータ801は、CD-ROMドライブ8012に加えて、MPU8013と、CD-ROMドライブ8012等に接続されたバス8014と、ブートアッププログラム等のプログラムを記憶するためのROM8015と、MPU8013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM8016と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク8017とを含む。ここでは、図示しないが、コンピュータ801は、さらに、LANへの接続を提供するネットワークカードを含んでもよい。
コンピュータシステム800に、上述した実施の形態の情報処理装置等の機能を実行させるプログラムは、CD-ROM8101に記憶されて、CD-ROMドライブ8012に挿入され、さらにハードディスク8017に転送されてもよい。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ801に送信され、ハードディスク8017に記憶されてもよい。プログラムは実行の際にRAM8016にロードされる。プログラムは、CD-ROM8101またはネットワークから直接、ロードされてもよい。
プログラムは、コンピュータ801に、上述した実施の形態の情報処理装置等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくてもよい。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいればよい。コンピュータシステム800がどのように動作するかは周知であり、詳細な説明は省略する。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されてもよいことは言うまでもない。
また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
上述の複数の実施の形態を適宜組み合わせた実施の形態を構成してもよい。例えば、上述の実施の形態の構成そのものに限られず、上述の実施の形態のそれぞれの構成要素を、適宜、他の実施の形態の構成要素と置換したり組み合わせたりしてもよい。また、上述の実施の形態のうち、一部の構成要素や機能が省略されていてもよい。
上述の実施の形態において、予め情報処理装置において記憶されている撮影画像や動画を利用して、情報出力機能が実行されるようにしてもよい。
上述の実施の形態において、利用者端末装置が情報出力機能に関する処理を行って、出力情報を出力するようにしてもよい。