JP6016322B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP6016322B2
JP6016322B2 JP2010065115A JP2010065115A JP6016322B2 JP 6016322 B2 JP6016322 B2 JP 6016322B2 JP 2010065115 A JP2010065115 A JP 2010065115A JP 2010065115 A JP2010065115 A JP 2010065115A JP 6016322 B2 JP6016322 B2 JP 6016322B2
Authority
JP
Japan
Prior art keywords
sound
sound data
unit
storage unit
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010065115A
Other languages
English (en)
Other versions
JP2011197477A (ja
Inventor
松田 晃一
晃一 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010065115A priority Critical patent/JP6016322B2/ja
Priority to US13/046,004 priority patent/US20110228983A1/en
Priority to CN201110061737.0A priority patent/CN102193772B/zh
Publication of JP2011197477A publication Critical patent/JP2011197477A/ja
Application granted granted Critical
Publication of JP6016322B2 publication Critical patent/JP6016322B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09FDISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
    • G09F27/00Combined visual and audible advertising or displaying, e.g. for public address
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09FDISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
    • G09F27/00Combined visual and audible advertising or displaying, e.g. for public address
    • G09F2027/001Comprising a presence or proximity detector
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09FDISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
    • G09F27/00Combined visual and audible advertising or displaying, e.g. for public address
    • G09F2027/002Advertising message recorded in a memory device

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、ある物体を見ている人にのみ、その物体に関連付けられて用意されている音データの再生音を聞かせることができるようにした情報処理装置、情報処理方法、およびプログラムに関する。
広告を見ている人に、広告に関連する音を聞かせようとする場合に、広告の裏や側面にスピーカを配置して、そのスピーカから音を出力する技術がある(特許文献1)。
また、広告が貼られている壁にカメラなどのセンサを取り付け、広告の前に人がいることを検出して、関連する音を出力する技術がある(特許文献2)。
特開2004−77654号公報 特開2001−142420号公報
上記技術によれば、ポスターなどに印刷されている広告を見ている人の近くに、広告を見ていない人がいる場合、広告を見ている人以外の人にも音が聞こえてしまうといった不具合がある。
また、複数枚の異なる広告のポスターが貼られている場合、それぞれの広告の音が混ざることによって音が聞きづらくなるといった不具合がある。
上記技術は、通常、特定の人にのみ音を聞かせることによって広告効果を向上させるという効果を期待して採用されるものであるが、これらの不具合は、その効果を低減させてしまうことにもなる。
本発明はこのような状況に鑑みてなされたものであり、ある物体を見ている人にのみ、その物体に関連付けられて用意されている音データの再生音を聞かせることができるようにするものである。
本発明の一側面の情報処理装置は、位置を検出する測位部と、認識対象の物体の特徴量のデータと前記物体と関連付けられた音データとのデータベースを有するサーバと通信を行い、前記測位部により検出された位置を含むエリアに設置されている前記物体の前記特徴量のデータと、前記物体と関連付けられた前記音データとをダウンロードする通信部と、前記通信部によりダウンロードされた前記特徴量のデータと前記音データとを記憶する記憶部と、カメラにより撮影された、認識対象の前記物体の画像を取得する取得部と、前記画像に含まれる前記物体を、前記記憶部に記憶されている前記特徴量のデータに基づいて認識する認識部と、前記認識部により認識された前記物体に関連付けられた、前記記憶部に記憶されている前記音データを再生してユーザが装着する出力装置から再生音を出力させる再生部とを備える。
本発明の一側面の情報処理方法は、位置を検出し、認識対象の物体の特徴量のデータと前記物体と関連付けられた音データとのデータベースを有するサーバと通信を行い、検出した位置を含むエリアに設置されている前記物体の前記特徴量のデータと、前記物体と関連付けられた前記音データとをダウンロードし、ダウンロードした前記特徴量のデータと前記音データとを記憶部に記憶し、カメラにより撮影された、認識対象の前記物体の画像を取得し、前記画像に含まれる前記物体を、前記記憶部に記憶されている前記特徴量のデータに基づいて認識し、認識した前記物体に関連付けられた、前記記憶部に記憶されている前記音データを再生してユーザが装着する出力装置から再生音を出力させるステップを含む。
本発明の一側面のプログラムは、位置を検出し、認識対象の物体の特徴量のデータと前記物体と関連付けられた音データとのデータベースを有するサーバと通信を行い、検出した位置を含むエリアに設置されている前記物体の前記特徴量のデータと、前記物体と関連付けられた前記音データとをダウンロードし、ダウンロードした前記特徴量のデータと前記音データとを記憶部に記憶し、カメラにより撮影された、認識対象の前記物体の画像を取得し、前記画像に含まれる前記物体を、前記記憶部に記憶されている前記特徴量のデータに基づいて認識し、認識した前記物体に関連付けられた、前記記憶部に記憶されている前記音データを再生してユーザが装着する出力装置から再生音を出力させるステップを含む処理をコンピュータに実行させる。
本発明の一側面においては、位置が検出され、認識対象の物体の特徴量のデータと前記物体と関連付けられた音データとのデータベースを有するサーバと通信が行われ、検出された位置を含むエリアに設置されている前記物体の前記特徴量のデータと、前記物体と関連付けられた前記音データとがダウンロードされ、記憶部に記憶される。また、カメラにより撮影された、認識対象の物体の前記画像が取得され、前記画像に含まれる前記物体が、前記記憶部に記憶されている前記特徴量のデータに基づいて認識される。また、認識された前記物体に関連付けられた、前記記憶部に記憶されている前記音データが再生され、ユーザが装着する出力装置から再生音が出力される
本発明によれば、ある物体を見ている人にのみ、その物体に関連付けられて用意されている音データの再生音を聞かせることができる。
本発明の一実施形態に係る情報処理装置を用いたARシステムの外観例を示す図である。 図1のユーザの外観の例を示す図である。 ARシステムの他の外観例を示す図である。 情報処理装置のハードウェアの構成例を示すブロック図である。 情報処理装置の機能構成例を示すブロック図である。 物体の認識について説明する図である。 情報処理装置の音再生処理について説明するフローチャートである。 情報処理装置の他の機能構成例を示すブロック図である。 図8に示す構成を有する情報処理装置のダウンロード処理について説明するフローチャートである。 ポスターに設定された部分の例を示す図である。 ポスターの部分と対応させて記憶されているモデルデータと音データの例を示す図である。 情報処理装置の設置の例を示す図である。
[AR(Augmented Reality)システム]
図1は、本発明の一実施形態に係る情報処理装置を用いたARシステムの外観例を示す図である。
図1の例においては、壁面WにポスターP1乃至P4が並べて貼られている。ポスターP1乃至P4には、例えば、商品やサービスなどの広告が印刷されている。
また、図1の例においては、壁面Wの前方にユーザU1乃至U3が立っている。ユーザU1は壁面Wに貼られたポスターP1を見ており、ユーザU3はポスターP4を見ている。ユーザU2は、壁面Wに貼られたポスターP1乃至P4のうちのどのポスターも見ていない。図1の破線矢印#1乃至#3は、それぞれ、ユーザU1乃至U3の視線を表している。
この場合、各ユーザの近傍の吹き出しに示すように、ポスターP1を見ているユーザU1にのみ聞こえるように、ポスターP1に関連付けられた音が出力される。また、ポスターP4を見ているユーザU3にのみ聞こえるように、ポスターP4に関連付けられた音が出力される。ポスターP1やP4に関連付けられた音は、ポスターを見ていないユーザU2には聞こえない。
それぞれのユーザが携帯している情報処理装置においては、それを携帯しているユーザがポスターを見ていることが検出された場合、そのポスターに関連付けられた音データの再生が行われ、ユーザにのみ聞こえるように再生音が出力される。ポスターに関連付けられた音データは、例えば、ポスターに印刷されている商品やサービスを紹介する音声や音楽のデータである。
図2は、図1のユーザU1の外観の例を示す図である。
図2に示すように、ユーザU1は、携帯型のコンピュータである情報処理装置1を携帯している。また、ユーザU1は、ヘッドマウントディスプレイ(HMD(Head Mounted Display))2を装着している。情報処理装置1とHMD2は、有線または無線で通信を行うことが可能になっている。
HMD2には、カメラ11、ヘッドホン12、およびディスプレイ13が設けられる。
カメラ11は、HMD2を装着したユーザU1の前方を撮影可能な位置に取り付けられる。カメラ11の撮影範囲にはユーザの視線が含まれる。カメラ11により撮影された画像は情報処理装置1に送信される。所定のフレームレートで画像(動画)の撮影がカメラ11により続けられることにより、情報処理装置1には、ユーザが見ている風景の画像が提供されることになる。
ヘッドホン12は、HMD2を装着したユーザU1の左右の耳の位置にくるように取り付けられる。ヘッドホン12は、情報処理装置1から送信されてきた再生音を出力する。
ディスプレイ13は、HMD2を装着したユーザU1の目の前方に表示部がくるように取り付けられる。ディスプレイ13は透過性のある部材により構成され、情報処理装置1から送信されてきたデータに基づいて画像やテキストなどの情報を表示する。ユーザは、風景をディスプレイ13越しに見ることもできるし、ディスプレイ13に表示された情報を見ることもできる。
図1のユーザU2,U3も、ユーザU1と同様に、情報処理装置1を携帯し、HMD2を装着している。
例えばユーザU1が携帯する情報処理装置1においては、カメラ11により撮影された画像に基づいて、ユーザU1がどのポスターを見ているかが物体認識により認識される。情報処理装置1には、どのポスターを見ているかを認識するための、ポスターP1乃至P4の認識用のデータが記憶されている。
また、情報処理装置1においては、ポスターP1乃至P4のうちのいずれかのポスターをユーザU1が見ていることが検出された場合、ユーザU1が見ているポスターに関連付けられた音データが再生され、再生音がヘッドホン12から出力される。情報処理装置1には、ポスターP1乃至P4のそれぞれと関連付けて音データが記憶されている。
これにより、ポスターに関連付けられた音を、そのポスターを見ているユーザにのみ聞かせることが可能になる。
すなわち、再生音がヘッドホン12から出力されるから、ポスターを見ている人以外の人に音が聞こえてしまうといった不具合はない。また、ポスターP1乃至P4のうちのいずれかのポスターに関連付けられた音データの再生が行われるから、それぞれの広告の音が混ざってしまうことによって音が聞きづらくなるといった不具合もない。
ポスターに関連付けられた音データの再生は、ユーザがそのポスターを見ている間だけ行われる。
例えば、図3に示すように、ユーザU1が位置p1で破線矢印#11の先に示すようにポスターP3を見ている場合、ポスターP3に関連付けられた音データの再生が行われる。ユーザU1は、ポスターP3に関連付けられた音データの再生音を聞くことができる。
また、実線矢印#12で示すように位置p2に移動したことによって、破線矢印#13の先に示すようにユーザU1がポスターP3を見ていない状態になった場合、ポスターP3に関連付けられた音データの再生は停止される。ユーザU1は、ポスターP3に関連付けられた音データの再生音を聞くことができない。
以上のようにして音データの再生を制御する情報処理装置1の一連の処理については後述する。
[情報処理装置の構成]
図4は、情報処理装置1のハードウェア構成例を示すブロック図である。
CPU(Central Processing Unit)31、ROM(Read Only Memory)32、RAM(Random Access Memory)33は、バス34により相互に接続されている。
バス34には、さらに、入出力インタフェース35が接続されている。入出力インタフェース35には、入力部36、出力部37、記憶部38、通信部39、およびドライブ40が接続される。
入力部36は、HMD2と通信を行い、HMD2のカメラ11により撮影された画像を受信する。
出力部37は、HMD2と通信を行い、音データの再生音をヘッドホン12から出力させる。また、出力部37は、表示データをHMD2に送信し、画像やテキストなどの情報をディスプレイ13に表示させる。
記憶部38は、ハードディスクや不揮発性のメモリなどよりなり、ポスターの認識用のデータや、それぞれのポスターに関連付けられた音データを記憶する。
通信部39は、無線LAN(Local Area Network)モジュールなどのネットワークインタフェースなどよりなり、ネットワークを介して接続されるサーバと通信を行う。記憶部38に記憶されている、ポスターの認識用のデータや音データは、例えばサーバからダウンロードされることによって情報処理装置1に提供される。
ドライブ40は、装着されたリムーバブルメディア41に記憶されているデータを読み出したり、リムーバブルメディア41にデータを書き込んだりする。
図5は、情報処理装置1の機能構成例を示すブロック図である。
図5に示すように、情報処理装置1においては、画像取得部51、認識部52、音再生制御部53、モデルデータ記憶部54、音データ記憶部55、および通信制御部56が実現される。これらの構成のうちの少なくとも一部は、図4のCPU31により所定のプログラムが実行されることによって実現される。モデルデータ記憶部54と音データ記憶部55は例えば記憶部38に形成される。
画像取得部51は、入力部36において受信された、カメラ11により撮影された画像を取得する。画像取得部51は、取得した画像を認識部52に出力する。
認識部52は、画像取得部51から供給された画像をクエリ画像として、クエリ画像に含まれる物体を、モデルデータ記憶部54に記憶されているモデルデータに基づいて認識する。モデルデータ記憶部54には、ポスターを含む画像から抽出された、ポスターの特徴を表すデータが記憶されている。認識部52による物体認識については後述する。
認識部52は、例えば、認識した物体(ポスター)のIDと、認識したポスターとカメラ11(ユーザ)の相対的な位置関係を表す姿勢情報とを認識結果として音再生制御部53に出力する。姿勢情報により、例えば認識されたポスターの位置を基準として、ユーザの位置までの距離、ユーザのいる方向が特定される。
音再生制御部53は、認識部52から供給されたIDに関連付けられている音データを音データ記憶部55から読み出して再生する。音再生制御部53は、再生して得られた再生音のデータを、図4の出力部37を制御してHMD2に送信し、ヘッドホン12から出力させる。音データ記憶部55には、ポスターのIDと音データが関連付けて記憶されている。
通信制御部56は、通信部39を制御してサーバ61と通信を行い、ポスターの特徴を表す認識用のデータであるモデルデータと、ポスターに関連付けられた音データをダウンロードする。サーバ61はモデルデータと音データのデータベースを有している。通信制御部56は、ダウンロードしたモデルデータをモデルデータ記憶部54に記憶させ、音データを音データ記憶部55に記憶させる。
図6は、物体(ポスター)の認識について説明する図である。
認識部52による物体認識のアルゴリズムとしては、例えば、RandomizedFernやSIFT(Scale Invariant Feature Transform)がある。RandomizedFernについては、”Fast Keypoint Recognition using Random Ferns Mustafa Ozuysal, Michael Calonder, Vincent Lepetit and Pascal FuaEcole Polytechnique Federale de Lausanne (EPFL) Computer Vision Laboratory, &C Faculty CH-1015 Lausanne, Switzerland”に開示されている。SIFTについては、” Distinctive Image Features from Scale-Invariant Keypoints David G. Lowe January 5, 2004”に開示されている。
図6に示すように、学習装置であるサーバ61においては、画像処理部71、特徴点検出部72、特徴量抽出部73、および合成部74が実現される。図6に示す各構成は、サーバ61のCPUにより所定のプログラムが実行されることによって実現される。サーバ61も図4に示すようなコンピュータにより構成される。
画像処理部71は、モデル画像にアフィン変換などの処理を施し、処理を施すことによって得られたモデル画像を特徴点検出部72に出力する。画像処理部71に対しては、ポスターP1乃至P4のそれぞれの画像が、モデル画像として順次入力される。モデル画像は特徴量抽出部73にも入力される。
特徴点検出部72は、画像処理部71から供給されたモデル画像上の各点をモデル特徴点として決定し、モデル特徴点の位置を表す情報を特徴量抽出部73に出力する。
特徴量抽出部73は、モデル画像を構成する画素のうち、モデル特徴点の位置に対応する画素の情報をモデル特徴量として抽出する。特徴量抽出部73により抽出されたモデル特徴量のデータは、特徴量の抽出元になったモデル画像に含まれるポスターのIDと対応付けてモデル辞書D1に登録される。モデル辞書D1は、ポスターのIDと、ポスターを含む画像から抽出された各モデル特徴点のモデル特徴量のデータとを対応付けたデータとして構成される。
また、特徴量抽出部73は、抽出したモデル特徴量のデータを合成部74に出力する。
合成部74は、入力された3Dモデルデータと、特徴量抽出部73から供給されたモデル特徴量のデータを合成する。合成部74に対しては、ポスターP1乃至P4のそれぞれの三次元形状を表すデータが3Dモデルデータとして入力される。
例えば、合成部74は、3Dモデルデータに基づいて、ポスターを様々な角度から見たときのそれぞれのモデル特徴点の3Dモデル上の位置を計算する。合成部74は、計算したそれぞれのモデル特徴点の位置にモデル特徴量のデータを割り当てることによって、3Dモデルデータとモデル特徴量のデータを合成し、3DモデルデータD2を生成する。
モデル辞書D1と、合成部74により生成された3DモデルデータD2は情報処理装置1に提供され、モデルデータ記憶部54に記憶される。
図6に示すように、認識部52は、画像処理部81、特徴点検出部82、特徴量抽出部83、マッチング部84、および姿勢推定部85から構成される。画像処理部81に対しては、カメラ11により撮影され、画像取得部51により取得された画像がクエリ画像として入力される。クエリ画像は特徴量抽出部83にも供給される。
画像処理部81は、画像処理部71と同様にして、クエリ画像にアフィン変換などの処理を施し、処理を施すことによって得られたクエリ画像を特徴点検出部82に出力する。
特徴点検出部82は、画像処理部81から供給されたクエリ画像上の各点をクエリ特徴点として決定し、クエリ特徴点の位置を表す情報を特徴量抽出部83に出力する。
特徴量抽出部83は、クエリ画像を構成する画素のうち、クエリ特徴点の位置に対応する画素の情報をクエリ特徴量として抽出し、抽出したクエリ特徴量のデータをマッチング部84に出力する。
マッチング部84は、モデル辞書D1に含まれる特徴量のデータに基づいてK-NNなどの最近傍探索を行い、それぞれのクエリ特徴点の最近傍となるモデル特徴点を決定する。マッチング部84は、クエリ特徴点の最近傍となるモデル特徴点の数に基づいて、例えば最近傍となるモデル特徴点が最も多いポスターを選択する。マッチング部84は、選択したポスターのIDを認識結果として出力する。
マッチング部84から出力されたポスターのIDは、図5の音再生制御部53に供給されるとともに、姿勢推定部85に供給される。姿勢推定部85に対しては、各クエリ特徴点の位置を表す情報なども供給される。
姿勢推定部85は、マッチング部84により認識されたポスターの3DモデルデータD2をモデルデータ記憶部54から読み出し、3DモデルデータD2に基づいて、それぞれのクエリ特徴点の最近傍であるモデル特徴点の3Dモデル上の位置を特定する。また、姿勢推定部85は、ポスターとユーザの位置関係を表す姿勢情報を出力する。
カメラ11により撮影されたクエリ画像から検出されたクエリ特徴点の最近傍であるモデル特徴点の3Dモデル上の位置を特定することができれば、クエリ画像がポスターをどの位置から撮影したものであるのか、すなわち、ユーザがどの位置にいるのかを特定することが可能である。また、画像に含まれるポスターの大きさと距離が予め対応付けられていれば、カメラ11により撮影されたクエリ画像に含まれるポスターの大きさから、ポスターの位置からユーザの位置までの距離を特定することが可能である。カメラ11のレンズは、例えば、ズーム機能がない単焦点のレンズである。
ユーザが見ているポスターと、ポスターとユーザの相対的な位置関係は以上のようにして認識される。
[情報処理装置の動作]
ここで、図7のフローチャートを参照して、情報処理装置1の音再生処理について説明する。図7の処理は、例えば、カメラ11により撮影が行われている間、繰り返し行われる。
ステップS1において、画像取得部51は、カメラ11により撮影された画像を取得する。
ステップS2において、認識部52は、画像取得部51により取得された画像を対象として物体認識を行う。
ステップS3において、認識部52は、認識した物体のIDと一致するIDが、ポスターのIDとしてモデルデータ記憶部54に記憶されているか否か、すなわちユーザがポスターを見ているか否かを判定する。
ユーザがポスターを見ていないとステップS3において判定された場合、ステップS4において、音再生制御部53は、音データの再生中であるか否かを判定する。
音データの再生中であるとステップS4において判定した場合、音再生制御部53は、ステップS5において、音データの再生を停止する。ステップS5において音データの再生が停止された場合、または、音データの再生中ではないとステップS4において判定された場合、ステップS1に戻り、それ以降の処理が繰り返される。
一方、ユーザがポスターを見ているとステップS3において判定された場合、ステップS6において、音再生制御部53は、ユーザが見ているポスターに関連付けられた音データが音データ記憶部55に記憶されているか否かを判定する。
ユーザが見ているポスターに関連付けられた音データが記憶されていないとステップS6において判定された場合、ステップS1に戻り、それ以降の処理が繰り返される。
ユーザが見ているポスターに関連付けられた音データが記憶されているとステップS6において判定された場合、ステップS7において、音再生制御部53は、ユーザが見ているポスターに関連付けられた音データ以外の音データの再生中であるか否かを判定する。
ユーザが見ているポスターに関連付けられた音データ以外の音データの再生中であるとステップS7において判定した場合、ステップS8において、音再生制御部53は、音データの再生を停止する。ステップS8において音データの再生が停止された場合、ステップS1に戻り、それ以降の処理が繰り返される。
一方、ユーザが見ているポスターに関連付けられた音データ以外の音データの再生中ではないとステップS7において判定した場合、ステップS9において、音再生制御部53は、ユーザが見ているポスターに関連付けられた音データの再生中であるか否かを判定する。
ユーザが見ているポスターに関連付けられた音データの再生中であるとステップS9において判定された場合、ステップS1に戻り、それ以降の処理が行われる。この場合、ユーザが見ているポスターに関連付けられた音データの再生が続けられることになる。
ユーザが見ているポスターに関連付けられた音データの再生中ではないとステップS9において判定された場合、ステップS10において、音再生制御部53は、ユーザが見ているポスターに関連付けられた音データを音データ記憶部55から読み出し、再生を開始する。その後、ステップS1以降の処理が繰り返される。
以上の処理により、ポスターを見ている人にのみ、そのポスターに関連付けられた音データの再生音を聞かせることが可能になる。
カメラ11により撮影された画像に複数のポスターが含まれていると認識された場合、画像の中央に最も近い位置に含まれるポスターが、ユーザが見ているポスターとして認識されるようにしてもよい。
ユーザが見ているとして認識されたポスターの貼り付け位置を音源位置とし、姿勢情報により表されるユーザの位置において再生音が定位するように、ヘッドホン12の左右のスピーカから出力される音の音量や出力タイミングが調整されるようにしてもよい。これにより、ポスターから音が出力されているような印象をユーザに与えることが可能になる。
[変形例]
情報処理装置1のモデルデータ記憶部54に記憶されるモデルデータと、音データ記憶部55に記憶されている音データが、ユーザの位置に応じて更新されるようにしてもよい。
図8は、情報処理装置1の他の機能構成例を示すブロック図である。
測位部57が追加されている点を除いて、図8に示す構成は図5に示す構成と同じである。重複する説明については省略する。
測位部57は、情報処理装置1内に設けられるGPS(Global Positioning System)センサ(図示せず)の出力に基づいて情報処理装置1の位置、すなわち、情報処理装置1を携帯するユーザの位置を検出する。測位部57は、現在位置を表す位置情報を通信制御部56に出力する。
通信制御部56は、位置情報をサーバ61に送信し、現在位置を含むエリア内に貼られているポスターのモデルデータと、ポスターに関連付けられた音データをダウンロードする。
サーバ61においては、ポスターのモデルデータと音データが、ポスターが貼られているエリア毎に分けて管理されている。モデルデータと音データのダウンロードは、例えば1つのエリア内に貼られているポスターに関するモデルデータと音データの単位で行われる。
通信制御部56は、ダウンロードしたモデルデータをモデルデータ記憶部54に記憶させ、音データを音データ記憶部55に記憶させる。
図9のフローチャートを参照して、図8に示す構成を有する情報処理装置1のダウンロード処理について説明する。
ステップS21において、測位部57は、現在位置を検出し、位置情報を通信制御部56に出力する。
ステップS22において、通信制御部56は、位置情報をサーバ61に送信する。
ステップS23において、通信制御部56は、現在位置を含むエリアに貼られているポスターのモデルデータと、ポスターに関連付けられた音データをダウンロードする。
ステップS24において、通信制御部56は、ダウンロードしたモデルデータをモデルデータ記憶部54に記憶させ、音データを音データ記憶部55に記憶させる。その後、処理は終了される。
新たにダウンロードされたモデルデータと音データが記憶された後、直前のユーザの位置を含むエリア内に貼られているポスターのモデルデータと音データが、モデルデータ記憶部54と音データ記憶部55から消去されるようにしてもよい。これにより、モデルデータと音データのデータ量を減らすことが可能になる。
以上においては、ポスター単位で、ユーザがどのポスターを見ているかが認識され、ポスターに関連付けられた音データが再生されるものとしたが、1枚のポスターの部分単位で処理が行われるようにしてもよい。この場合、ユーザがどのポスターのどの部分を見ているかが認識され、認識されたポスターの部分に関連付けられた音データが再生される。
図10は、ポスターP1に設定された部分(領域)の例を示す図である。
図10の例においては、ポスターP1には、部分1−1,1−2,1−3がそれぞれ設定されている。商品の写真が異なるといったように、部分1−1,1−2,1−3には、それぞれ異なる内容の情報が印刷されている。
情報処理装置1には、図11に示すように、ポスターの部分と対応させて、モデルデータと音データが記憶される。
図11の例においては、ポスターP1の部分1−1に対応させて、モデルデータ1−1と音データ1−1が記憶されており、部分1−2に対応させて、モデルデータ1−2と音データ1−2が記憶されている。また、部分1−3に対応させて、モデルデータ1−3と音データ1−3が記憶されている。
ポスターP2乃至P4についても同様に、ポスター内の各部分に対応させて、モデルデータと音データが記憶されている。
情報処理装置1においては、カメラ11により撮影された画像と、部分毎のモデルデータに基づいて、ユーザがポスターP1の部分1−1を見ていると判定された場合、音データ1−1の再生が開始される。
これにより、ユーザが見ているポスターの部分に応じて、ユーザに聞かせる音データを切り替えることが可能になる。
また、以上においては、情報処理装置1はユーザが携帯するものとしたが、他の場所に設置されるようにしてもよい。
図12は、情報処理装置1の設置の例を示す図である。
図12の例においては、ポスターP1乃至P4が貼られている壁面Wに、情報処理装置1が設置されている。情報処理装置1と、ユーザが装着するHMD2の間では通信が行われ、カメラ11により撮影された画像や、情報処理装置1により再生された音データの送受信が行われる。
以上においては、認識対象の物体がポスターである場合について説明したが、ディスプレイに表示される画像が認識され、認識された画像に関連付けられた音データが再生されるようにしてもよい。
また、以上においては、情報処理装置1と通信を行う機器がHMD2である場合について説明したが、情報処理装置1と通信を行う機器は、カメラ機能を有する携帯音楽プレーヤなどの、ユーザが携帯する他の機器であってもよい。ユーザは、携帯音楽プレーヤによってポスターを撮影することによって、ポスターに関連付けられた音を、携帯音楽プレーヤのイヤホンを用いて聞くことができる。
再生する音データの種類をユーザが選択することができるようにしてもよい。例えば、同じポスターに関連付けて、大人用の音声、子供用の音声といったように、対象の異なる複数の音声が情報処理装置1に用意されている場合、ユーザにより選択された音声が再生される。
この場合、ユーザは、大人用の音声を再生するのか、子供用の音声を再生するのかを予め選択し、選択の内容を表す情報を情報処理装置1に記憶させておくことになる。あるポスターをユーザが見ていることが検出された場合、情報処理装置1においては、そのポスターに関連付けられている音データのうち、記憶されている情報により表される種類の音データの再生が開始される。これにより、ユーザは、同じポスターを見た場合であっても、自分の好みの音声を聞くことが可能になる。
また、日本語の音声、外国語の音声といったように、言語の異なる音声の中から、再生させる音声の言語をユーザが選択できるようにしてもよい。
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
インストールされるプログラムは、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)や半導体メモリなどよりなる図4に示されるリムーバブルメディア41に記録して提供される。また、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供されるようにしてもよい。プログラムは、ROM32や記憶部38に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
1 情報処理装置, 2 HMD, 11 カメラ, 12 ヘッドホン, 13 ディスプレイ, 51 画像取得部, 52 認識部, 53 音再生制御部, 54 モデルデータ記憶部, 55 音データ記憶部, 56 通信制御部

Claims (6)

  1. 位置を検出する測位部と、
    認識対象の物体の特徴量のデータと前記物体と関連付けられた音データとのデータベースを有するサーバと通信を行い、前記測位部により検出された位置を含むエリアに設置されている前記物体の前記特徴量のデータと、前記物体と関連付けられた前記音データとをダウンロードする通信部と、
    前記通信部によりダウンロードされた前記特徴量のデータと前記音データとを記憶する記憶部と、
    カメラにより撮影された、認識対象の前記物体の画像を取得する取得部と、
    前記画像に含まれる前記物体を、前記記憶部に記憶されている前記特徴量のデータに基づいて認識する認識部と、
    前記認識部により認識された前記物体に関連付けられた、前記記憶部に記憶されている前記音データを再生してユーザが装着する出力装置から再生音を出力させる再生部と
    を備える情報処理装置。
  2. 位置を検出し、
    認識対象の物体の特徴量のデータと前記物体と関連付けられた音データとのデータベースを有するサーバと通信を行い、検出した位置を含むエリアに設置されている前記物体の前記特徴量のデータと、前記物体と関連付けられた前記音データとをダウンロードし、
    ダウンロードした前記特徴量のデータと前記音データとを記憶部に記憶し、
    カメラにより撮影された、認識対象の前記物体の画像を取得し、
    前記画像に含まれる前記物体を、前記記憶部に記憶されている前記特徴量のデータに基づいて認識し、
    認識した前記物体に関連付けられた、前記記憶部に記憶されている前記音データを再生してユーザが装着する出力装置から再生音を出力させる
    ステップを含む情報処理方法。
  3. 位置を検出し、
    認識対象の物体の特徴量のデータと前記物体と関連付けられた音データとのデータベースを有するサーバと通信を行い、検出した位置を含むエリアに設置されている前記物体の前記特徴量のデータと、前記物体と関連付けられた前記音データとをダウンロードし、
    ダウンロードした前記特徴量のデータと前記音データとを記憶部に記憶し、
    カメラにより撮影された、認識対象の前記物体の画像を取得し、
    前記画像に含まれる前記物体を、前記記憶部に記憶されている前記特徴量のデータに基づいて認識し、
    認識した前記物体に関連付けられた、前記記憶部に記憶されている前記音データを再生してユーザが装着する出力装置から再生音を出力させる
    ステップを含む処理をコンピュータに実行させるプログラム。
  4. 位置を検出する測位部と、
    認識対象の物体に設定された部分の特徴量のデータと前記物体に設定された部分と関連付けられた音データとのデータベースを有するサーバと通信を行い、前記測位部により検出された位置を含むエリアに設置されている前記物体に設定された部分の前記特徴量のデータと、前記物体に設定された部分と関連付けられた前記音データとをダウンロードする通信部と、
    前記通信部によりダウンロードされた前記特徴量のデータと前記音データとを記憶する記憶部と、
    カメラにより撮影された、認識対象の前記物体に設定された部分の画像を取得する取得部と、
    前記画像に含まれる前記物体に設定された部分を、前記記憶部に記憶されている前記特徴量のデータに基づいて認識する認識部と、
    前記認識部により認識された前記物体に設定された部分に関連付けられた、前記記憶部に記憶されている前記音データを再生してユーザが装着する出力装置から再生音を出力させる再生部と
    を備える情報処理装置。
  5. 位置を検出し、
    認識対象の物体に設定された部分の特徴量のデータと前記物体に設定された部分と関連付けられた音データとのデータベースを有するサーバと通信を行い、検出した位置を含むエリアに設置されている前記物体に設定された部分の前記特徴量のデータと、前記物体に設定された部分と関連付けられた前記音データとをダウンロードし、
    ダウンロードした前記特徴量のデータと前記音データとを記憶部に記憶し、
    カメラにより撮影された、認識対象の前記物体に設定された部分の画像を取得し、
    前記画像に含まれる前記物体に設定された部分を、前記記憶部に記憶されている前記特徴量のデータに基づいて認識し、
    認識した前記物体に設定された部分に関連付けられた、前記記憶部に記憶されている前記音データを再生してユーザが装着する出力装置から再生音を出力させる
    ステップを含む情報処理方法。
  6. 位置を検出し、
    認識対象の物体に設定された部分の特徴量のデータと前記物体に設定された部分と関連付けられた音データとのデータベースを有するサーバと通信を行い、検出した位置を含むエリアに設置されている前記物体に設定された部分の前記特徴量のデータと、前記物体に設定された部分と関連付けられた前記音データとをダウンロードし、
    ダウンロードした前記特徴量のデータと前記音データとを記憶部に記憶し、
    カメラにより撮影された、認識対象の前記物体に設定された部分の画像を取得し、
    前記画像に含まれる前記物体に設定された部分を、前記記憶部に記憶されている前記特徴量のデータに基づいて認識し、
    認識した前記物体に設定された部分に関連付けられた、前記記憶部に記憶されている前記音データを再生してユーザが装着する出力装置から再生音を出力させる
    ステップを含む処理をコンピュータに実行させるプログラム。
JP2010065115A 2010-03-19 2010-03-19 情報処理装置、情報処理方法、およびプログラム Active JP6016322B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010065115A JP6016322B2 (ja) 2010-03-19 2010-03-19 情報処理装置、情報処理方法、およびプログラム
US13/046,004 US20110228983A1 (en) 2010-03-19 2011-03-11 Information processor, information processing method and program
CN201110061737.0A CN102193772B (zh) 2010-03-19 2011-03-11 一种信息处理器和信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010065115A JP6016322B2 (ja) 2010-03-19 2010-03-19 情報処理装置、情報処理方法、およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015117537A Division JP6217696B2 (ja) 2015-06-10 2015-06-10 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2011197477A JP2011197477A (ja) 2011-10-06
JP6016322B2 true JP6016322B2 (ja) 2016-10-26

Family

ID=44601899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010065115A Active JP6016322B2 (ja) 2010-03-19 2010-03-19 情報処理装置、情報処理方法、およびプログラム

Country Status (3)

Country Link
US (1) US20110228983A1 (ja)
JP (1) JP6016322B2 (ja)
CN (1) CN102193772B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013101248A (ja) * 2011-11-09 2013-05-23 Sony Corp 音声制御装置、音声制御方法、およびプログラム
CN103257703B (zh) * 2012-02-20 2016-03-30 联想(北京)有限公司 一种增强现实装置及方法
KR101989893B1 (ko) * 2012-10-29 2019-09-30 엘지전자 주식회사 헤드 마운트 디스플레이 및 이를 이용한 오디오 신호 출력 방법
JP6102213B2 (ja) * 2012-11-22 2017-03-29 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム
EP3637419A3 (en) * 2012-11-29 2020-07-22 SoundSight IP, LLC Video headphones, system, platform, methods, apparatuses and media
JP6201615B2 (ja) * 2013-10-15 2017-09-27 富士通株式会社 音響装置、音響システム、音響処理方法及び音響処理プログラム
JP6194740B2 (ja) * 2013-10-17 2017-09-13 富士通株式会社 音声処理装置、音声処理方法、及びプログラム
SG11201605692WA (en) * 2014-01-16 2016-08-30 Sony Corp Audio processing device and method, and program therefor
US9918176B2 (en) * 2014-05-13 2018-03-13 Lenovo (Singapore) Pte. Ltd. Audio system tuning
CN104182051B (zh) * 2014-08-29 2018-03-09 百度在线网络技术(北京)有限公司 头戴式智能设备和具有该头戴式智能设备的交互系统
WO2019065345A1 (ja) * 2017-09-28 2019-04-04 日本電気株式会社 録音再生システム、録音再生方法、録音装置、記録媒体および録画装置
JP7140810B2 (ja) * 2020-10-23 2022-09-21 ソフトバンク株式会社 制御装置、プログラム、システム、及び制御方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3594068B2 (ja) * 1998-03-09 2004-11-24 富士ゼロックス株式会社 記録再生装置および記録再生方法
US6195640B1 (en) * 1999-01-29 2001-02-27 International Business Machines Corporation Audio reader
JP2003521202A (ja) * 2000-01-28 2003-07-08 レイク テクノロジー リミティド 地理的な環境で使用される空間オーディオシステム。
JP2002251572A (ja) * 2000-11-29 2002-09-06 Keiichi Kato 広告配信システム
JP2002269298A (ja) * 2001-03-13 2002-09-20 Matsushita Electric Ind Co Ltd 展示物解説システム
GB2378301A (en) * 2001-07-31 2003-02-05 Hewlett Packard Co Personal object recognition system for visually impaired persons
US7194148B2 (en) * 2001-09-07 2007-03-20 Yavitz Edward Q Technique for providing simulated vision
JP2003143477A (ja) * 2001-10-31 2003-05-16 Canon Inc 映像合成装置および方法
US7369685B2 (en) * 2002-04-05 2008-05-06 Identix Corporation Vision-based operating method and system
US20040136570A1 (en) * 2002-04-30 2004-07-15 Shimon Ullman Method and apparatus for image enhancement for the visually impaired
US7963652B2 (en) * 2003-11-14 2011-06-21 Queen's University At Kingston Method and apparatus for calibration-free eye tracking
CN1556496A (zh) * 2003-12-31 2004-12-22 天津大学 唇形识别发声器
JP4855654B2 (ja) * 2004-05-31 2012-01-18 ソニー株式会社 車載装置、車載装置の情報提供方法、車載装置の情報提供方法のプログラム及び車載装置の情報提供方法のプログラムを記録した記録媒体
JP2007183924A (ja) * 2005-02-10 2007-07-19 Fujitsu Ltd 情報提供装置および情報提供システム
US7620316B2 (en) * 2005-11-28 2009-11-17 Navisense Method and device for touchless control of a camera
WO2007088236A1 (en) * 2006-02-03 2007-08-09 Nokia Corporation A hearing agent and a related method
JP5119636B2 (ja) * 2006-09-27 2013-01-16 ソニー株式会社 表示装置、表示方法
US20080218381A1 (en) * 2007-03-05 2008-09-11 Buckley Stephen J Occupant exit alert system
US8594387B2 (en) * 2007-04-23 2013-11-26 Intel-Ge Care Innovations Llc Text capture and presentation device
TW200900285A (en) * 2007-06-22 2009-01-01 Mitac Int Corp Vehicle distance measurement device and method used thereby
JP4956375B2 (ja) * 2007-10-30 2012-06-20 キヤノン株式会社 画像処理装置、画像処理方法
JP2010081480A (ja) * 2008-09-29 2010-04-08 Fujifilm Corp 携帯型不審者検出装置、不審者検出方法及びプログラム

Also Published As

Publication number Publication date
CN102193772B (zh) 2016-08-10
CN102193772A (zh) 2011-09-21
US20110228983A1 (en) 2011-09-22
JP2011197477A (ja) 2011-10-06

Similar Documents

Publication Publication Date Title
JP6016322B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5992210B2 (ja) 情報処理プログラム、情報処理装置、情報処理システム、および情報処理方法
TWI496480B (zh) 偕同一可攜式電子裝置用於產生多頻道音訊之系統和方法
WO2021109678A1 (zh) 视频生成方法、装置、电子设备及存储介质
JP6017854B2 (ja) 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム
JP7100824B2 (ja) データ処理装置、データ処理方法及びプログラム
US10298876B2 (en) Information processing system, control method, and storage medium
CN110322760B (zh) 语音数据生成方法、装置、终端及存储介质
JP2011239141A (ja) 情報処理方法、情報処理装置、情景メタデータ抽出装置、欠損補完情報生成装置及びプログラム
WO2021143574A1 (zh) 增强现实眼镜、基于增强现实眼镜的ktv实现方法与介质
JP2020520576A (ja) 空間オーディオの提示のための装置および関連する方法
JP7428763B2 (ja) 情報取得システム
JP2020520576A5 (ja)
CN109547843B (zh) 对音视频进行处理的方法和装置
CN101867708B (zh) 摄影装置、显示装置、再现装置、摄影方法以及显示方法
JP6217696B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN106101576A (zh) 一种增强现实照片的拍摄方法、装置及移动终端
KR20140089829A (ko) 전자 장치에서 움직이는 사진 제어 장치 및 방법
JP5201540B2 (ja) カラオケ装置及びカラオケ歌唱者の静止画出力方法
JP5310682B2 (ja) カラオケ装置
KR20140037439A (ko) 음악의 분위기를 이용한 슬라이드 쇼 생성 방법 및 장치
CN106060394A (zh) 一种拍照方法、装置和终端设备
JP7065708B2 (ja) 録画再生装置及びプログラム
JP6166070B2 (ja) 再生装置および再生方法
JP2015211338A (ja) 画像処理装置、それを備える撮像装置、画像処理方法及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140327

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140512

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150402

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150610

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20150617

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20150731

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160526

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160927

R150 Certificate of patent or registration of utility model

Ref document number: 6016322

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250