以下に添付図面を参照して、本実施形態に係る情報処理装置及び情報処理プログラムを詳細に説明する。
ここでまず、本実施の形態で取り扱うコンテンツの特徴量について述べる。コンテンツとは、音声、又は画像、又は両方を言う。画像とは、静止画、又は動画、又は両方を言う。コンテンツとして、例えば、MPEG2等の動画データの音声部分、MP3等の音声データ、JPEG等の静止画データ、MPEG2等の動画データがある。特徴量とは、コンテンツの特徴を数値化又は分類したものである。本実施の形態においては、利用者が居る場所に流れている音楽等の音声や、利用者が居る周辺の画像がコンテンツとなる。以下では特に、コンテンツとして、音声を取り扱う例を説明する。音声の特徴量としては、例えば、参考文献1にて開示されている、短時間周波数スペクトル、符号スペクトル、やそれらをヒストグラム化したものがある。他には、ケプストラム特徴量、部分的な周波数のみを特徴にするピーク周波数やベクトル量子化によりスペクトルを有限の単語で表現する方法等、様々な特徴量が考えられる。
(参考文献1)特表2004−519015号公報
次に、本実施の形態に係る情報提供システムの構成について図1を用いて説明する。情報提供システムは、サービスを提供するサービス提供者の有する情報処理装置であるサーバ50と、当該サービスの利用者の有する情報処理装置であるクライアント70とを備え、これらが通信網NT1を介して接続されている。通信網NT1とは、例えば、無線LAN(Local Area Network)、有線LAN、光回線網、電話回線網、イントラネット、イーサネット(登録商標)及びインターネットやこれらの組み合わせである。尚、同図では、情報提供システムに接続されるサーバ50及びクライアント70は各々1つのみ示されているが、これらは各々複数であっても良い。
次に、サーバ50となる情報処理装置及びクライアント70となる情報処理装置のハードウェア構成について説明する。情報処理装置は、装置全体を制御するCPU(Central Processing Unit)等の制御部と、各種データや各種プログラムを記憶するROM(Read Only Memory)やRAM(Random Access Memory)等の主記憶部と、各種データや各種プログラムを記憶するHDD(Hard Disk Drive)やCD(Compact Disk)ドライブ装置等の補助記憶部と、これらを接続するバスとを備えており、通常のコンピュータを利用したハードウェア構成となっている。CPUは、時刻を計時する計時機能を有する。また、情報処理装置には、情報を表示する表示部と、ユーザの指示入力を受け付けるキーボードやマウス等の操作入力部と、外部装置の通信を制御する通信I/F(interface)とが有線又は無線により各々接続される。尚、クライアント70は、例えば、利用者が携帯可能な携帯電話、スマートフォン(登録商標)、iPad(登録商標)等のスレート端末などの携帯端末であり、音声が入力される音声入力部を更に備える。
次に、このようなハードウェア構成において、サーバ50によって実現される各種機能について図2を用いて説明する。サーバ50は、送受信部51と、制御部52と、照合部53と、受信履歴記憶部54と、特徴量記憶部55と、時計部(不図示)と、情報記憶部56と、第1取得部57と、第2取得部58とを有する。送受信部51の機能は、サーバ50の有する通信I/Fと、サーバ50の有するCPUが主記憶部や補助記憶部に記憶された各種プログラムを実行することにより実現される。制御部52及び照合部53の各機能は、サーバ50の有するCPUが主記憶部や補助記憶部に記憶された各種プログラムを実行することにより実現される。時計部の機能は、CPUの有する計時機能によって実現される。受信履歴記憶部54、特徴量記憶部55及び情報記憶部56はそれぞれ、サーバ50の有する例えば補助記憶部に確保される記憶領域である。
特徴量記憶部55は、特徴量場所対応情報を記憶する。特徴量場所対応情報とは、少なくともコンテンツを提供する場所とコンテンツの特徴量とを対応付けた情報である。これは第1情報に相当する。また、例えば、コンテンツを提供する場所、コンテンツの特徴量以外に、コンテンツ識別情報(コンテンツID)、コンテンツの長さ、コンテンツを提供する期間のいずれかを更に含むか、コンテンツ識別情報(コンテンツID)、コンテンツの長さ、コンテンツを提供する期間の2以上の組み合わせを対応付けても良い。コンテンツを提供する期間は第5情報に相当する。コンテンツを提供とは、利用者を特定して提供される場合のみならず、利用者の存在する場所の周辺で個々の利用者を特定せずに提供される場合も含み、利用者が認識しているか、認識していないかは問わない。ここでは、コンテンツとして音声を取り扱うから、コンテンツの特徴量は、例えば、サービス提供者が関連情報の提供を行うそれぞれの場所において流れる(提供される)音声の特徴量である。このような音声とは、例えば所定の内容を所定の期間示す音声である。各内容に応じた音声には、これらを各々識別するためのコンテンツ識別情報が付与されているものとする。図3は、特徴量場所対応情報のデータ例を示す図である。
情報記憶部56は、コンテンツを提供する場所と、当該場所に応じた関連情報とを対応付けて記憶する。関連情報とは、例えば、当該場所の周辺にある店舗やテーマパーク等に関する情報である。このような情報としては、例えば、店舗で使用可能なクーポンを示す情報や、テーマパークでの整理券や入場券を示す情報や、スタンプラリーにおけるスタンプに代わる情報がある。関連情報は第4情報及び第8情報に相当する。
送受信部51は、クライアント70等の外部装置との通信を制御する。尚、サーバ50とクライアント70と間の通信は暗号化されるようにしても良いが、以下では、説明を簡単にするため、通信の暗号化を省略して説明する。また、サーバ50とクライアント70との間の通信は、相互認証又は片側認証を行った上で行うことが望ましいが、いずれかの認証を行うことを省略して説明する。送受信部51は、具体的には、後述のクライアント識別情報を含み、後述の特徴量抽出方法情報を要求する要求メッセージをクライアント70から受信したり、特徴量抽出方法情報をクライアント70に送信したり、後述の特徴量情報及びクライアント識別情報をクライアント70から受信したり、関連情報をクライアント70に送信したりする。
制御部52は、送受信部51が要求メッセージを受信した場合、特徴量抽出方法として、当該要求メッセージに含まれるクライアント識別情報によって識別されるクライアント70が特徴量の抽出を開始する時刻(開始時刻という)及び特徴量を抽出する期間(抽出期間という)を決定する。このとき、制御部52は、クライアント70毎に異なるように開始時刻及び抽出期間を決定する。そして、制御部52は、決定した開始時刻及び抽出期間を示す特徴量抽出方法情報を生成して、これを当該クライアント識別情報と対応付けて受信履歴記憶部54に記憶させると共に、送受信部51を介して当該特徴量抽出方法情報を当該クライアント70に送信する。特徴量抽出方法情報は第2情報及び第6情報に相当する。
受信履歴記憶部54は、制御部52の制御の下、特徴量抽出方法情報及びクライアント識別情報を対応付けて記憶する。
照合部53は、送受信部51が特徴量情報及びクライアント識別情報を受信した場合、第1取得部57経由で特徴量記憶部55に記憶された特徴量場所対応情報を読み出して、特徴量情報によって示される特徴量と、特徴量場所対応情報によって示される特徴量との照合を行う。前者の特徴量に一致又は類似する後者の特徴量がある場合、照合部53は、後者の特徴量に対応して特徴量場所対応情報によって示される場所を利用者の存在する場所として特定する。そして、照合部53は、当該場所に対応付けられて情報記憶部56に記憶されている関連情報を第2取得部58経由で読み出し、送受信部51を介して当該関連情報をクライアント70に送信する。
第1取得部57は、特徴量情報を照合部53から受け付け、特徴量情報をキーとして特徴量記憶部55に記憶された特徴量場所対応情報を読み出し、読み出した特徴量場所対応情報を照合部53に渡す。
第2取得部58は、照合部53が特定した場所を示す場所情報を照合部53から受け付け、場所情報をキーとして当該場所情報によって示される場所に対応付けられて情報記憶部56に記憶されている関連情報を読み出し、読み出した関連情報を照合部53に渡す。
次に、クライアント70によって実現される各種機能について図2を用いて説明する。クライアント70は、送受信部71と、録音部72と、特徴量抽出部73と、クライアント識別情報記憶部74と、時計部(不図示)とを有する。送受信部71の機能は、クライアント70の有する通信I/Fと、クライアントの有するCPUが主記憶部や補助記憶部に記憶された各種プログラムを実行することにより実現される。録音部72の機能は、クライアント70の有する音声入力部と、クライアント70の有するCPUが主記憶部や補助記憶部に記憶された各種プログラムを実行することにより実現される。特徴量抽出部73の機能は、クライアント70の有するCPUが主記憶部や補助記憶部に記憶された各種プログラムを実行することにより実現される。時計部の機能は、CPUの有する計時機能によって実現される。クライアント識別情報記憶部74は、クライアント70の有する例えば補助記憶部に確保される記憶領域である。
クライアント識別情報記憶部74は、クライアント70を識別するために当該クライアント70に付与されたクライアント識別情報を記憶する。クライアント識別情報は、クライアント70を一意に識別できる情報であれば特に限定されず、例えば、クライアント70の工場出荷時に割り当てられたシリアル番号でも良いし、クライアント70のMACアドレスでも良いし、サービスの利用申請時に利用者が定めたハンドルネームでも良い。時計部は、時刻を計時する。送受信部71は、サーバ50等の外部装置との通信を制御する。送受信部71は、具体的には、上述の要求メッセージをサーバ50に送信したり、上述の特徴量抽出方法情報をサーバ50から受信したり、後述の特徴量情報及びクライアント識別情報をサーバ50に送信したり、関連情報をサーバ50から受信したりする。
録音部72は、送受信部71が特徴量抽出方法情報を受信した場合、当該特徴量抽出方法情報によって示される開始時刻から抽出期間までの間に音声入力部を介して入力された音声を録音する。特徴量抽出部73は、録音部72が録音した音声を解析して、当該音声から特徴量を抽出する。そして、特徴量抽出部73は、抽出した特徴量を用いて、特徴量情報を生成して、当該特徴量情報及びクライアント識別情報記憶部74に記憶されたクライアント識別情報をサーバ50に送信する。特徴量情報は、抽出された特徴量を示す情報である。特徴量を示す情報は第3情報及び第7情報に相当する。特徴量情報は、更に、特徴量抽出方法情報によって示される開始時刻及び抽出期間を示しても良い。特徴量抽出方法情報によって示される開始時刻及び抽出期間は、第9情報に相当する。
次に、本実施の形態に係る情報提供システムで行う情報提供処理の手順について図4を用いて説明する。ステップS1では、クライアント70は、送受信部71の機能により、クライアント識別情報記憶部74に記憶されたクライアント識別情報を含み、特徴量抽出方法情報を要求する要求メッセージをサーバ50に送信する。ステップS2では、サーバ50は、送受信部51の機能により、当該要求メッセージを受信すると、制御部52の機能により、特徴量抽出方法として、当該要求メッセージに含まれるクライアント識別情報によって識別されるクライアント70が特徴量の抽出を開始する時刻(開始時刻)及び特徴量を抽出する期間(抽出期間)を決定する。尚、ここでサーバ50が決定する開始時刻及び抽出期間は、1つであっても良いし、複数であっても良い。また、サーバ50は、抽出期間を複数決定する場合、規則的に特徴量の抽出が繰り返されるように、開始時刻と共に、抽出期間、待ち期間及び繰り返し回数を決定するようにしても良い。また、サーバ50は、抽出期間自体を決定するのではなく、特徴量の抽出を終了する時刻(終了時刻)を決定することにより、開始時刻及び抽出期間を決定するようにしても良い。
図5〜7は、開始時刻及び抽出期間の例を示す図である。図5の例では、開始時刻が10時20分30秒であり、この開始時刻からの抽出期間が40秒であることが示されている。図6は、開始時刻及び抽出期間が複数決定された場合の例を示すものであり、この例では、開始時刻が10時20分30秒且つ終了時刻が10時21分00秒であり、この開始時刻から終了時刻までが抽出時間として示されていると共に、開始時刻が10時22分10秒且つ終了時刻が10時22分30秒であり、この開始時刻から終了時刻までが抽出期間として示されている。図7は、規則的に特徴量の抽出が繰り返される例を示すものであり、この例では、開始時刻が10時20分30秒であり、抽出期間が10秒であり、抽出期間後の待ち時間が5秒であり、特徴量の抽出の繰り返し回数が3回であることが示されている。即ち、この例では、クライアント70に対して、時刻10時20分30秒から10秒間入力された音声の特徴量の抽出を行わせ、時刻10時20分40秒から5秒間待って時刻10時20分45秒から10秒間入力された音声の特徴量の抽出を行わせ、時刻10時20分55秒から5秒間待って時刻10時21分00秒から10秒間入力された音声の特徴量の抽出を行わせることが示されている。
このとき、サーバ50は、異なるクライアント70に対して各々異なる開始時刻及び抽出期間を決定する。ここで、特徴量の例と、クライアント毎に異なる開始時刻及び抽出期間の例について図8を用いて説明する。同図の(a)では、特徴量として、一次元のものを取り扱い、当該特徴量を時刻毎に示す特徴量系列として、各時刻におけるパワーを表す特徴量系列が例示されており、(b)では、複数のクライアント70に対して各々決定された開始時刻及び抽出期間が例示されている。尚、同図では、複数のクライアント70を各々区別するために、クライアントA,B,Cとしている。同図の例では、クライアントAには時刻T1を開始時刻として当該時刻T1から時刻T3までの抽出期間及び時刻T5を開始時刻として当該時刻T5から時刻T6までの抽出期間において特徴量の抽出を行わせることが決定されたことを表しており、クライアントBには時刻T3を開始時刻として当該時刻T3から時刻T5までの抽出期間及び時刻T6を開始時刻として当該時刻T6から時刻T8までの抽出期間において特徴量の抽出を行わせることが決定されたことを表しており、クライアントCには時刻T2を開始時刻として当該時刻T2から時刻T4までの抽出期間及び時刻T7を開始時刻として当該時刻T7から時刻T9までの抽出期間において特徴量の抽出を行わせることが決定されたことを表している。
尚、特徴量として、一次元のものに限らず、複数次元のものを取り扱うようにしても良い。図9の(a)では、特徴量として3次元のものを取り扱い、当該特徴量を時刻毎に示す特徴量系列として、各時刻における周波数スペクトルを表す特徴量系列が例示されており、(b)では、複数のクライアントに対して各々決定された開始時刻及び抽出期間が例示されている。同図の(a)において、色が濃いほどエネルギーが高いことを表す。例えば、時刻T1から時刻T2までの間において、周波数f2から周波数f3の帯域におけるエネルギーが最も高く、周波数f1から周波数f2の帯域におけるエネルギーが次に高く、周波数f3から周波数f4の帯域におけるエネルギーが最も低いことを表している。
尚、サーバ50は、開始時刻及び抽出期間を決定する際に、毎回、開始時刻及び抽出期間を任意に選択し、ステップS1で要求メッセージを送信したクライアント70と異なる他のクライアント70に対して過去に同一の開始時刻及び抽出期間を決定していないか否かを判定し、他のクライアント70に対して過去に同一の開始時刻及び抽出期間を決定していない場合、選択した開始時刻及び抽出期間を、ステップS1で要求メッセージを送信したクライアント70に対する開始時刻及び抽出期間として決定しても良い。具体的には、サーバ50は、ステップS1で要求メッセージに含まれるクライアント識別情報とは異なるクライアント識別情報と対応付けられて受信履歴記憶部54に記憶されている特徴量抽出方法情報を参照して、選択した開始時刻及び抽出期間と同一の開始時刻及び抽出期間を示す特徴量抽出方法情報がない場合、選択した開始時刻及び抽出時刻を、ステップS1で要求メッセージを送信したクライアント70に対する開始時刻及び抽出期間として決定する。また、クライアント識別情報を入力の一部とする関数を定め、サーバ50は、ステップS2で受信した要求メッセージに含まれるクライアント識別情報及びその他の変数をその関数に入力して得られる出力値を用いて、開始時刻及び抽出期間を決定しても良い。
サーバ50は、以上のようにして決定した開始時刻及び抽出時刻を示す特徴量抽出方法情報を生成する。そして、サーバ50は、クライアント70から受信した要求メッセージに含まれるクライアント識別情報と、生成した特徴量抽出方法情報とを対応付けて受信履歴記憶部54に記憶させる。また、サーバ50は、送受信部51の機能により、ステップS1で要求メッセージを送信したクライアント70に当該特徴量抽出方法情報を送信する。
ステップS3では、クライアント70は、送受信部71の機能により、サーバ50から送信された特徴量抽出方法情報を受信すると、特徴量抽出方法情報に従って、録音部72の機能より、音声入力部に入力された音声を録音し、特徴量抽出部73の機能により、録音された音声を解析して、当該音声から特徴量を抽出する。そして、クライアント70は、抽出した特徴量と、特徴量抽出方法情報によって示される開始時刻及び抽出期間とを示す特徴量情報を生成する。
ここで、ステップS3の詳細な処理の手順について図10を用いて説明する。クライアント70は、録音部72の機能より、ステップS2でサーバ50から送信されて受信した特徴量抽出方法情報によって示される開始時刻から抽出期間までの間に音声入力部に入力された音声を録音する(ステップS31)。そして、クライアント70は、特徴量抽出部73の機能により、ステップS31で録音された音声を解析して、当該音声から特徴量を抽出する(ステップS32)。クライアント70は、例えば、特許文献1に開示されている特徴量を抽出すれば良い。そして、クライアント70は、ステップS32で抽出した特徴量と、特徴量抽出方法情報によって示される開始時刻及び抽出期間とを示す特徴量情報を生成する(ステップS33)。図11〜13は、特徴量情報のデータ例を示す図である。図11〜13はそれぞれ、図5〜7に対応している。例えば、図11の例では、図5に示される開始時刻10時20分30秒及び抽出期間40秒間と、開始時刻10時20分30秒から抽出期間40秒間に抽出された特徴量の値(A)とが特徴量情報によって示されている。
図4の説明に戻る。ステップS4では、クライアント70は、送受信部71の機能により、ステップS3で生成した特徴量情報及びクライアント識別情報記憶部74に記憶されたクライアント識別情報をサーバ50に送信する。
ステップS5では、サーバ50は、送受信部51の機能により、特徴量情報及びクライアント識別情報をクライアント70から受信すると、制御部52の機能により、当該クライアント70以外の他のクライアント70に対して、当該特徴量情報によって示される開始時刻及び抽出期間と同一の開始時刻及び抽出期間を示す特徴量抽出方法情報が受信履歴記憶部54に記憶されているか否かを判定する。つまり、サーバ50は、リプレイ攻撃が行われているか否かをチェックする。具体的には、サーバ50は、当該クライアント識別情報と異なるクライアント識別情報と対応付けられて受信履歴記憶部54に記憶されている特徴量抽出方法情報を読み出して、当該特徴量情報によって示される開始時刻及び抽出期間と同一の開始時刻及び抽出期間を示す特徴量抽出方法情報があるか否かを判定する。サーバ50は、特徴量情報によって示される開始時刻及び抽出期間と同一の開始時刻及び抽出期間を示す特徴量抽出方法情報がないと判定した場合、リプレイ攻撃が行われていないとして、ステップS6では、照合部53の機能により、当該特徴量情報によって示される特徴量と、特徴量記憶部55に記憶された特徴量場所対応情報によって示される特徴量との照合を行い、利用者が存在する場所を特定する。尚、サーバ50は、特徴量の照合の際には、特徴量情報によって示される特徴量と一致又は類似するものがあるか否かを、特徴量記憶部55に記憶された複数の特徴量場所対応情報によって各々示される特徴量の中から検索するため、特徴量情報によって示される特徴量を入力信号と呼び、特徴量場所対応情報によって示される特徴量を参照信号と呼ぶ。
ここで、ステップS6の詳細な処理の手順について図14を用いて説明する。まず、サーバ50は、照合部53の機能により、ステップS5でクライアント70から送信されて受信した特徴量情報によって示される開始時刻及び抽出期間を用いて、参照信号の候補を選択する(ステップS61)。例えば、当該特徴量情報が図11に示されるものであった場合、当該特徴量情報によって示される開始時刻は10時20分であるから、図3に例示される、コンテンツを提供する期間が10時からであることが示されるコンテンツ、即ち、コンテンツ識別情報がID2であるコンテンツは参照信号の候補から除外することができる。
次いで、サーバ50は、入力信号と、ステップS61で選択した参照信号とが一致するか又は類似するか否かの照合を行う(ステップS62)。例えば、ある2つの特徴量が類似しているか否かを判定する指標として、特徴量による照合結果の信頼度がある。音声の特徴量による照合結果の信頼度とは、抽出された音声の特徴量を照合した結果の確からしさである。その照合の方法及び信頼度を決定する方法は、例えば、参考文献2にて開示されている方法を用いれば良い。
(参考文献2)特許4469785号公報
図3に例示されるように、特徴量記憶部55に記憶されている特徴量場所対応情報によって、音声の特徴量と対応付けて示されるコンテンツを提供する期間は、厳密に正しい時刻である必要はなく、サービス提供者が関連情報の提供を行うそれぞれの場所においてコンテンツとして実際に音声が提供される時刻と多少のずれが生じていても構わない。参考文献2にて開示されている方法では、入力信号が参照信号のどの部分と一致又は類似しているかを、スキップ処理が入るものの基本的に各時刻について照合するので、上述のずれは問題とならない。
ステップS62における照合の結果、サーバ50は、入力信号に一致又は類似する参照信号があるか否かを判定する(ステップS63)。サーバ50は、入力信号に一致又は類似する参照信号があると判定した場合(ステップS63:YES)、特徴量記憶部55に記憶されている特徴量場所対応情報を参照して、入力信号に一致又は類似する参照信号である特徴量に対応して特徴量場所対応情報によって示される場所を、利用者の居る場所として特定して(ステップS64)、図4のステップS7へ進む。一方、サーバ50は、入力信号に一致又は類似する参照信号がないと判定した場合(ステップS63:NO)、利用者の居る場所を特定することができないため、送信された特徴量に一致又は類似する特徴量がない旨を示すメッセージをクライアント70に送信して(ステップS65)、処理を終了する。
図4の説明に戻る。ステップS7では、サーバ50は、ステップS6で特定した場所に対応して情報記憶部56に記憶された関連情報を読み出し、送受信部51の機能により、当該関連情報をクライアント70に送信する。尚、ステップS5で、サーバ50は、特徴量情報によって示される開始時刻及び抽出期間と同一の開始時刻及び抽出期間を示す特徴量抽出方法情報があると判定した場合、リプレイ攻撃が行われている可能性があるため、送受信部51の機能により、他のクライアント70に対して同一の特徴量抽出方法情報がある旨を示す通知メッセージをクライアント70に送信して、処理を終了する。
以上のように、本実施の形態によれば、サーバ50は、利用者が特定の場所に存在するか否かを的確に判定することができる。
[変形例]
尚、本発明は前記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、前記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除しても良い。更に、異なる実施形態にわたる構成要素を適宜組み合わせても良い。また、以下に例示するような種々の変形が可能である。
上述した実施の形態において、サーバ50で実行される各種プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また当該各種プログラムを、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供するように構成しても良い。クライアント70についても同様である。
上述した実施の形態において、サーバ50は、上述の特徴量場所対応情報を記憶する特徴量記憶部55を有するとしたが、これに限らず、サーバ50以外の情報処理装置が有するようにしても良く、その場合は、サーバ50外の特徴量記憶部55から第1取得部57は特徴量場所対応情報を読み出す。この場合、サーバ50は、第1取得部57の機能により、特徴量情報及びクライアント識別情報をクライアント70から受信することにより取得すると、当該特徴量情報によって示される開始時刻及び抽出期間が、コンテンツを提供する期間に含まれる特徴量場所対応情報の送信を当該情報処理装置に要求して、当該情報処理装置から当該特徴量場所対応情報を受信することにより、当該特徴量場所対応情報を取得すれば良い。そして、サーバ50は、上述の実施の形態と同様にして、当該特徴量場所対応情報によって示される特徴量と、特徴量情報によって示される特徴量との照合を行えば良い。
上述した実施の形態において、サーバ50は、上述のコンテンツを提供する場所と、当該場所に応じた関連情報とを対応付けて記憶する情報記憶部56を有するとしたが、これに限らず、サーバ50以外の情報処理装置が有するようにしても良く、その場合は、サーバ50外の情報記憶部56から第2取得部58は関連情報を読み出す。この場合、サーバ50は、利用者の存在する場所を特定すると、第2取得部58の機能により、当該場所に対応付けられている関連情報を当該情報処理装置に要求して、当該情報処理装置から当該関連情報を受信することにより、当該関連情報を取得すれば良い。そして、サーバ50は、上述の実施の形態と同様にして、当該関連情報をクライアント70に送信すれば良い。
上述した実施の形態においては、特徴量記憶部55には、コンテンツ自体が記憶されていても良い。この場合、サーバ50が、特徴量記憶部55において記憶されているコンテンツから特徴量を抽出しても良い。また、特徴量記憶部55に記憶される特徴量場所対応情報は、上述の例に限らない。例えば、図15に例示されるように、特徴量場所対応情報は、コンテンツを提供する期間を示さないようにしても良い。この場合、図14のステップS61では、サーバ50は、特徴量記憶部55に記憶されている全ての特徴量場所対応情報によって各々示される特徴量を各々参照信号として選択して、ステップS62では、入力信号と当該参照信号との照合を行う。
上述した実施の形態において、サーバ50は、利用者が特定の場所に存在するか否かの判定に、音声の特徴量を用いたが、これに代えて、画像の特徴量を用いても良い。この場合、クライアント70は、音声入力部及び録音部72に代えて、画像を撮影する撮影部を備える。特徴量の種類が異なることを除けば、サーバ50及びクライアント70のそれぞれの有する機能的構成は第1の実施の形態と略同様であるため、その説明を省略する。
画像の特徴量としては、輝度ヒストグラム、エッジヒストグラム、方向ヒストグラム、色ヒストグラム、輝度勾配方向共起ヒストグラム等がある。これらの特徴量は必ずしもヒストグラム化する必要はなく、ヒストグラム化していない輝度特徴量、エッジ特徴量、方向特徴量、色特徴量を用いても良い。また、局所特徴量を用いても良い。局所特徴量としてはSIFT(Scale-invariant feature transform)、SURF(Speeded Up Robust Features)が知られている。
また、クライアント70の特徴量抽出部73は、画像について1つのフレームを複数の領域に分割し、分割した各領域の輝度比を特徴量として抽出するようにしても良い。例えば、特徴量抽出部73は、フレームを左右に2分割し、分割した2つの領域の輝度比を特徴量として抽出するようにしても良い。また、特徴量抽出部73は、画像の水平周波数、垂直周波数、2次元空間周波数等の周波数に関する情報を特徴量として抽出するようにしても良い。また、特徴量抽出部73は、高速フーリエ変換や離散コサイン変換等の変換を施した上で得られる係数を特徴量として抽出するようにしても良い。
更に、特徴量抽出部73は、MPEG画像におけるフレームのピクチャ種別(I、P、Bピクチャ)に基づいて分類する方法(例えば、フレームのピクチャ種別が、I又はPピクチャか、Bピクチャかによって、二つのグループに分類する方法)、フレームの特徴量(例えば、平均輝度)に基づいて分類する方法(例えば、フレーム毎に平均輝度を計算し、平均輝度の高低レベル(レベルは何段階に設定しても構わない)によって分類する方法)、それらを適宜組み合わせた方法を用いて各フレームを分類し、あるフレームが属する種類をそのフレームの特徴量として抽出するようにしても良い。
尚、画像のフレーム単位で特徴量を抽出する例を挙げたが、これに限らず、特徴量抽出部73は、フィールド単位で特徴量を抽出しても良いし、複数フレームを一つの単位として特徴量を抽出しても良いし、複数フィールドを一つの単位として特徴量を抽出しても良い。
尚、特徴量抽出部73は、コンテンツを構成する画像全体ではなくその一部から特徴量を抽出するようにしても良い。また、特徴量抽出部73は、コンテンツを構成する画像全てについて特徴量を抽出しても良いししなくても良い。例えば、特徴量抽出部73は、コンテンツを構成する全ての画像のうち、ある区間に属する画像については特徴量を抽出し、次のある区間に属する画像については特徴量を抽出せずに、更に次のある区間に属する画像については特徴量を抽出するようにしても良い。これにより、特徴量の抽出に係る処理負荷を軽減することができる。
照合部53における画像の特徴量の照合の方法は、例えば、以下の参考文献3にて開示されている方法を用いれば良い。
(参考文献3)US A1 6711293
画像の特徴量による照合結果の信頼度とは、抽出された画像の特徴量を照合した結果の確からしさである。例えば、信頼度は、2つの特徴量の距離の逆数で表される。特徴量の距離はSAD(Sum of absolute differences,誤差の絶対値和)やSSD(Sum of square differences,誤差の自乗和)を用いて定義すれば良い。2つの特徴量の距離が大きいほど信頼度は低い。二つのN次元特徴量ベクトルvec1,vec2のSADは次の式1のように計算される。ここで、Nは自然数であり、absは絶対値を表し、vec1[i]はvec1のi番目の成分であり、vec2[i]はvec2のi番目の成分である。
上述した実施の形態においては、サーバ50は、利用者が特定の場所に存在するか否かの判定に、音声の特徴量の複数の特徴量を組み合わせて用いても良い。また、サーバ50は、利用者が特定の場所に存在するか否かの判定に、画像の特徴量を用いる場合も、画像の特徴量の複数の特徴量を組み合わせて用いても良い。
上述した実施の形態においては、サーバ50は、利用者が特定の場所に存在するか否かの判定に、音声の特徴量と画像の特徴量の両方を用いても良い。この場合、クライアント70は、音声入力部及び録音部と、上述の変形例と同様の撮影部とを有する。変形例1と同じく、サーバ、クライアントとも動作は上述の実施の形態と同様である。
上述した実施の形態においては、サーバ50は、利用者が特定の場所に存在するか否かの判定に、画像の特徴量を用いる場合、特徴量抽出方法として、開始時刻及び抽出期間の決定に代えて、撮影対象の物に関する決定を行うようにしても良い。例えば、サーバ50は、利用者の居る場所周辺の目立つ建物、看板、デジタルサイネージ(電子看板)等を撮影してその画像の特徴量を送信することをクライアント70に指示するために、撮影対象となる物を決定して、当該物を撮影対象として示す特徴量抽出方法情報をクライアント70に送信するように良い。一方、クライアント70は、当該特徴量抽出方法情報を受信すると、当該特徴量抽出方法情報によって示される撮影対象の物の画像を撮影し、当該画像の特徴量を抽出して、当該特徴量と、撮影対象の物とを示す特徴量情報及びクライアント識別情報をサーバ50に送信すれば良い。
上述した実施の形態においては、サーバ50が、特徴量抽出方法として、クライアント70が特徴量の抽出を開始する開始時刻及び抽出期間を決定したが、クライアント70が開始時刻及び抽出期間を決定し、当該開始時刻及び抽出期間を示す特徴量抽出方法情報を生成することによりこれを取得して、当該特徴量抽出方法情報及びクライアント識別情報をサーバ50へ送信しても良い。この場合、ステップS1では、クライアント70は、要求メッセージではなく、自身が決定した開始時刻及び抽出期間を示す特徴量抽出方法情報及びクライアント識別情報をサーバ50に送信する。ステップS2では、サーバ50は、送受信部51の機能により、特徴量抽出方法情報及びクライアント識別情報を受信すると、受信履歴記憶部54を参照して、当該特徴量抽出方法情報によって示される開始時刻及び抽出期間が、過去に他のクライアント70に対しても割り当てられていないか否かを判定する。具体的には、サーバ50は、当該特徴量抽出方法情報によって示される開始時刻及び抽出期間と同一の開始時刻及び抽出期間を示す特徴量抽出方法情報が、当該クライアント識別情報と異なるクライアント識別情報と対応付けられて受信履歴記憶部54に記憶されているか否かを判定する。当該判定結果が否定的である場合、当該クライアント70が決定した開始時刻及び抽出期間は他のクライアント70には割り当てられていないため、サーバ50は、クライアント70から受信した特徴量抽出方法情報が示す開始時刻及び抽出期間を、当該クライアント70に割り当てる開始時刻及び抽出期間として、当該特徴量抽出方法情報を、受信したクライアント識別情報と対応付けて受信履歴記憶部54に記憶する。
以上のような構成によっても、サーバ50は、利用者が特定の場所に存在するか否かを的確に判定することができる。
上述の実施の形態においては、クライアント70は、抽出した特徴量と、特徴量抽出方法情報によって示される開始時刻及び抽出期間とを示す特徴量情報を生成して、これとクライアント識別情報とをサーバ50に送信したが、これに限らず、開始時刻及び抽出期間を示さずに特徴量を示す特徴量情報及びクライアント識別情報をサーバ50に送信するようにしても良い。図16は、本変形例に係る情報提供処理の手順を示すフローチャートである。ステップS1〜S2は上述の実施の形態と同様である。ステップS3´では、クライアント70は、上述の実施の形態と同様にして、サーバ50から受信した特徴量抽出方法情報を用いて、音声から特徴量を抽出する。
図17は、ステップS3´の詳細な処理の手順を示すフローチャートである。ステップS31〜S32は上述の実施の形態と同様であり、本実施の形態においては、クライアント70がステップS33の処理を行わない点が上述の実施の形態と異なる。図16の説明に戻る。ステップS4では、クライアント70は、ステップS3´で抽出した特徴量を示す特徴量情報及びクライアント識別情報をサーバ50に送信する。ステップS5´では、サーバ50は、特徴量情報及びクライアント識別情報をクライアント70から受信すると、当該クライアント識別情報に対応付けられて受信履歴記憶部54に記憶されている特徴量抽出方法情報を読み出す。ステップS6´では、サーバ50は、特徴量情報によって示される特徴量と、特徴量記憶部55に記憶された特徴量場所対応情報によって示される特徴量との照合を行い、利用者が存在する場所を特定する。ステップS6´の詳細な処理の手順は図14に示されるものと同様である。但し、ステップS61では、サーバ50は、ステップS5´で受信履歴記憶部54から読み出した特徴量抽出方法情報によって示される開始時刻及び抽出期間を用いて、参照信号の候補を選択する。ステップS62〜S63は上述の実施の形態と同様である。図4のステップS7も上述の実施の形態と同様である。
以上のような構成によれば、特徴量情報としてクライアント70がサーバ50に送信するデータ量を小さくすることができるため、通信負荷を低減することができると共に、サーバ50は、利用者が特定の場所に存在するか否かを的確に判定することができる。
上述の実施の形態においては、クライアント70の録音部72が、サーバ50から受信された特徴量抽出方法情報によって示される開始時刻から抽出期間までの間に音声入力部に入力された音声を録音し、録音された音声を特徴量抽出部73が解析して、当該音声から特徴量を抽出する例について説明した。しかし、これに限らず、録音部72が、サーバ50から特徴量抽出方法情報が受信されてから音声の録音を開始して、録音した音声を開始時刻及び抽出期間と対応付けて出力し、録音された音声のうち、特徴量抽出方法情報によって示される開始時刻から抽出期間の間の音声を特徴量抽出部73が解析して、当該音声から特徴量を抽出しても良い。本変形例に係る情報提供システムで行う情報提供処理の手順自体は図4に示されるものと略同様であるからその説明を省略する。本変形例においては、ステップS3の詳細な詳細の手順が上述の実施の形態と異なる。図18は本変形例に係るステップS3の詳細な処理の手順を示すフローチャートである。ステップS31´では、クライアント70は、録音部72の機能より、ステップS2で特徴量抽出方法情報が受信されてから音声入力部に入力された音声を録音する。そして、クライアント70は、録音した音声を示す録音データと、開始時刻及び抽出期間と対応付けて出力する。図19〜21は、開始時刻及び抽出期間と対応付けられて出力される録音データのデータ例を示す図である。図19〜21ではそれぞれ図5〜7に例示された特徴量抽出方法情報を受信した場合に録音されて出力された録音データが示されている。例えば、図19では、開始時刻10時20分10秒から抽出期間1分間の録音データの値(α)が当該開始時刻及び抽出期間と対応付けられて示されている。図18の説明に戻る。ステップS32´では、クライアント70は、特徴量抽出部73の機能により、ステップS31´で出力された録音データによって示される音声のうち、当該録音データに対応付けられている開始時刻から抽出期間の間の音声を解析して、当該音声から特徴量を抽出する。ステップS33は上述の実施の形態と同様である。
以上のような構成によっても、サーバ50は、利用者が特定の場所に存在するか否かを的確に判定することができる。