JP2018037842A - 情報処理装置、情報処理システム、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理システム、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2018037842A
JP2018037842A JP2016169319A JP2016169319A JP2018037842A JP 2018037842 A JP2018037842 A JP 2018037842A JP 2016169319 A JP2016169319 A JP 2016169319A JP 2016169319 A JP2016169319 A JP 2016169319A JP 2018037842 A JP2018037842 A JP 2018037842A
Authority
JP
Japan
Prior art keywords
information
sound
area
video
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016169319A
Other languages
English (en)
Inventor
大明 山根
Oaki Yamane
大明 山根
一浩 片桐
Kazuhiro Katagiri
一浩 片桐
▲徳▼郎 山口
Tokuro Yamaguchi
▲徳▼郎 山口
茂 立澤
Shigeru Tatezawa
茂 立澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2016169319A priority Critical patent/JP2018037842A/ja
Publication of JP2018037842A publication Critical patent/JP2018037842A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】視聴者に明瞭化された所望の音を提供することと、視聴者に提供する映像および音に対する臨場感を向上させることと、を両立させることが可能な仕組みを提供する。【解決手段】情報処理システム1は、特定の空間に係る映像情報を取得する映像情報取得部400A、400Bと、映像情報に係る映像における、特定の空間における第1の領域の表示態様に係る情報に応じて、第1の領域に係る第1の音情報および特定の空間における第1の領域よりも広い範囲に係る第2の音情報に基づく音出力に係る制御情報を生成する音出力制御部と、を備える。【選択図】図1

Description

本発明は、情報処理装置、情報処理システム、情報処理方法及びプログラムに関する。
近年、情報通信技術の発達により、遠隔地の状況を伝達する技術が研究開発されるようになっている。具体的には、遠隔地の映像および音を配信するシステムがある。このようなシステムでは、視聴者がさも遠隔地にいるような臨場感を与えることが望まれる。
臨場感を与える方法として、視聴が所望される音以外の雑音を抑制することが考えられる。例えば、特許文献1では、マイクロホンアレーを用いて背景雑音の量を減衰させる収音装置に係る発明が開示されている。当該収音装置は、電話会議システムなどに活用されることが想定されている。
また、視聴者に臨場感を与えるためには、配信される映像と音とが位置について合致していることが望ましい。例えば、特許文献2では、監視区域の撮影により得られる画像および当該監視区域の音声を取得し、取得された画像の送信中に取得された音声を送信する画像監視装置に係る発明が開示されている。
特開2007−235358号公報 特開2010−233145号公報
しかし、上述した発明に代表される従来技術では、臨場感が不足するおそれがあるという問題があった。例えば、特許文献1で開示される収音装置を用いた電話会議システムでは、常に局所的な音のみが配信されるため、視聴者が違和感を覚えるおそれがある。また、特許文献2で開示される画像監視装置では、監視区域全体の音が送信されるため、視聴者は監視区域の一部の音を局所的に聴くことが困難である。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、視聴者に明瞭化された所望の音を提供することと、視聴者に提供する映像および音に対する臨場感を向上させることと、を両立させることが可能な仕組みを提供することにある。
上記課題を解決するために、本発明のある観点によれば、特定の空間に係る映像情報を取得する映像情報取得部と、前記映像情報に係る映像における、前記特定の空間における第1の領域の表示態様に係る情報に応じて、前記第1の領域に係る第1の音情報および前記特定の空間における前記第1の領域よりも広い範囲に係る第2の音情報に基づく音出力に係る制御情報を生成する音出力制御部と、を備える情報処理装置が提供される。
また、前記表示態様に係る情報は、前記第1の領域の大きさを示す情報を含んでもよい。
また、前記表示態様に係る情報は、前記映像情報に係るズーム情報を含んでもよい。
また、前記表示態様に係る情報は、前記映像情報に係る映像についての仮想的な視聴位置と前記映像情報に係る映像における前記第1の領域との位置関係を示す情報を含んでもよい。
また、前記音出力に係る制御情報は、前記第1の音情報および前記第2の音情報に基づく音の混合に係る制御情報を含んでもよい。
また、前記音の混合に係る制御情報は、前記第1の音情報および前記第2の音情報の音量制御情報を含んでもよい。
また、前記第1の領域は、前記表示態様に係る情報に応じて特定される領域を含んでもよい。
また、前記第1の領域は、指定操作情報に基づいて特定される指定領域を含んでもよい。
また、前記指定操作情報に係る操作は、前記第1の領域の選択操作または前記映像情報に係る映像における物体の選択操作を含んでもよい。
また、前記第1の領域は、前記指定領域に応じて特定される領域を含んでもよい。
また、前記音出力に係る制御情報は、前記指定領域の特定に応じて生成されてもよい。
また、前記音出力に係る制御情報は、前記表示態様に係る情報の変化に応じて生成されてもよい。
また、前記音出力に係る制御情報は、前記映像情報の変更に応じて生成されてもよい。
また、前記第1の音情報は、前記第2の音情報からの抽出により生成されてもよい。
また、前記音出力制御部は、前記音出力に係る制御情報の生成に用いられる前記第1の音情報に応じて複数の前記第2の音情報から前記音出力に係る制御情報の生成に用いられる前記第2の音情報を選択してもよい。
また、上記課題を解決するために、本発明の別の観点によれば、特定の空間における第1の領域に係る第1の音情報と、前記特定の空間における前記第1の領域よりも広い範囲に係る第2の音情報と、を取得する音情報取得部と、前記特定の空間に係る映像情報を取得する映像情報取得部と、前記映像情報に係る映像における前記第1の領域の表示態様に係る情報に応じて、前記第1の音情報および前記第2の音情報に基づく音出力に係る制御情報を生成する音出力制御部と、前記音出力に係る制御情報に基づいて前記第1の音情報および前記第2の音情報に基づく音出力を行う音出力部と、を備える情報処理システムが提供される。
また、上記課題を解決するために、本発明の別の観点によれば、プロセッサを用いて、特定の空間に係る映像情報を取得することと、前記映像情報に係る映像における、前記特定の空間における第1の領域の表示態様に係る情報に応じて、前記第1の領域に係る第1の音情報および前記特定の空間における前記第1の領域よりも広い範囲に係る第2の音情報に基づく音出力に係る制御情報を生成することと、を含む情報処理方法が提供される。
また、上記課題を解決するために、本発明の別の観点によれば、特定の空間に係る映像情報を取得する映像情報取得機能と、前記映像情報に係る映像における、前記特定の空間における第1の領域の表示態様に係る情報に応じて、前記第1の領域に係る第1の音情報および前記特定の空間における前記第1の領域よりも広い範囲に係る第2の音情報に基づく音出力に係る制御情報を生成する音出力制御機能と、をコンピュータに実現させるためのプログラムが提供される。
以上説明したように本発明によれば、視聴者に明瞭化された所望の音を提供することと、視聴者に提供する映像および音に対する臨場感を向上させることと、を両立させることが可能な仕組みが提供される。
本発明の一実施形態に係る情報処理システムの概要を説明するための図である。 本発明の一実施形態に係る情報処理システムの概略的な機能構成の例を示すブロック図である。 本発明の一実施形態に係る情報処理システムにおいて再生される映像の例を説明するための図である。 本発明の一実施形態に係る情報処理システムにおいて再生される映像の例を説明するための図である。 本発明の一実施形態に係る情報処理システムにおいて再生される映像の例を説明するための図である。 本発明の一実施形態に係る情報処理システムにおける音制御のパターン例を示す図である。 本発明の一実施形態に係る情報処理システムにおけるターゲットが未選択である場合の処理の例を概念的に示す図である。 本発明の一実施形態に係る情報処理システムにおけるターゲットが選択された場合の処理の例を概念的に示す図である。 本発明の一実施形態に係る情報処理システムにおける映像が切り替えられた場合の処理の例を概念的に示す図である。 本発明の一実施形態に係る情報処理システムにおける映像がさらに切り替えられた場合の処理の例を概念的に示す図である。 本発明の一実施形態の第1の変形例に係る情報処理システムにおける音制御のパターン例を示す図である。 本発明の一実施形態の第1の変形例に係る情報処理システムにおける音制御の別のパターン例を示す図である。 本発明の一実施形態の第2の変形例に係る情報処理システムの処理の例を概念的に示す図である。 本発明の一実施形態に係る情報処理装置のハードウェア構成を示した説明図である。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なる番号を付して区別する場合もある。例えば、実質的に同一の機能を有する複数の構成を、必要に応じて撮影装置400Aおよび撮影装置400Bなどのように区別する。ただし、実質的に同一の機能構成を区別する必要が無い場合、同一符号のみを付する。例えば、撮影装置400Aおよび撮影装置400Bを特に区別する必要がない場合には、単に撮影装置400と称する。
<1.本発明の一実施形態>
本発明の一実施形態に係る情報処理システム1および当該情報処理システムの構成要素の1つである情報処理装置100について説明する。
<1.1.システムの概要>
まず、図1を参照して、情報処理システム1の概要について説明する。図1は、本発明の一実施形態に係る情報処理システム1の概要を説明するための図である。
情報処理システム1は、情報処理装置100、収音装置200、エリア音生成装置300、撮影装置400およびメディア再生装置500を備える。情報処理システム1では、収音装置200および撮影装置400が同一の空間に配置され、収音装置200および撮影装置400は当該空間で収音および撮影を行う。
ここで、情報処理システム1では、収音および撮影の対象となる空間(以下、対象空間とも称する。)が複数の領域(以下、エリアとも称する。)に分割される。例えば、対象空間は、図1に示したようなエリアA〜エリアIに分割される。なお、収音装置200は、当該エリアよりも広い範囲について収音する。
エリア音生成装置300は、収音装置200の収音により得られる音(以下、広範囲音とも称する。)情報(第2の音情報)に基づいて、各エリアにおいて知覚されると想定される音(以下、エリア音とも称する。)情報(第1の音情報)をエリア毎に生成する。例えば、エリア音生成装置300は、収音装置200A〜200Dなどから得られる広範囲音情報に基づいてエリアA〜エリアIについてのエリア音情報をそれぞれ生成する。なお、エリア音の生成には、既存技術が用いられてよい。
そして、情報処理装置100は、メディア再生装置500に再生させる映像および音を制御する。具体的には、情報処理装置100は、撮影装置400を制御することによりメディア再生装置500に映像情報を提供する。また、情報処理装置100は、映像の態様に応じて、収音装置200から得られた広範囲音情報およびエリア音生成装置300から得られたエリア音情報の混合処理により得られる音情報(以下、混合音情報とも称する。)を生成し、生成された混合音情報をメディア再生装置500に提供する。メディア再生装置500は、提供された映像情報および混合音情報に基づいて映像および音を再生する。例えば、情報処理装置100は、図1に示したようなエリアEを中心としたズームイン制御を撮影装置400Aに指示する。撮影装置400Aは、指示に基づいて撮影により得られた映像から切り出された映像、または指示に基づいて光学系を制御することにより拡大された映像を映像情報としてメディア再生装置500に提供する。また、情報処理装置100は、映像に大きく映っているエリアEについてのエリア音情報と広範囲音情報との混合処理により得られる混合音情報をメディア再生装置500に提供する。
このように、情報処理システム1は、映像に合わせてエリア音と広範囲音との混合音を再生する。そのため、再生される映像において視聴者が聴きたい音であると想定される音(以下、所望音とも称する。)を明瞭化しながら当該所望音以外の音(以下、背景音とも称する。)を再生することができる。例えば、図1に示したように、メディア再生装置500により再生される映像においてフォーカスされているエリアEについてのエリア音(すなわち所望音)が再生されると共に、エリアE周辺の広範囲音(すなわち背景音)が再生される。そのため、エリアEにおける「これどうですか」といった音声だけでなく、エリアEに隣接するエリアFにおける「こんにちは」という音声も視聴者の耳に入ってくることになり、視聴者があたかもエリアE付近にいるような臨場感を与えることができる。
なお、図1では、収音装置200および撮影装置400が複数配置される例を説明したが、収音装置200および撮影装置400は単数であってもよい。
<1.2.システムの構成>
次に、図2を参照して、本発明の一実施形態に係る情報処理システム1の構成について説明する。図2は、本発明の一実施形態に係る情報処理システム1の概略的な機能構成の例を示すブロック図である。
図2に示したように、情報処理システム1は、情報処理装置100、収音装置200、エリア音生成装置300、撮影装置400およびメディア再生装置500を備える。各装置は、通信を介して接続される。以下、各装置の機能について詳細に説明する。
[情報処理装置]
情報処理装置100は、メディア制御部101および音混合部102を備える。なお、メディア制御部101および音混合部102は、通信部(図示せず。)を介して外部の装置から情報を受信したり、外部の装置へ情報を送信したりする。
メディア制御部101は、メディア再生装置500に再生させる映像および音を制御する。具体的には、メディア制御部101は、撮影装置400を制御することによりメディア再生装置500に再生させる映像を制御する。例えば、メディア制御部101は、撮影有無、制御パラメタおよび配信有無などを示す映像制御情報を生成し、撮影装置400に生成された映像制御情報を提供する。制御パラメタとしては、映像の一部を切り出すデジタルズームまたは映像を拡大もしくは縮小する光学ズームに係るズーム情報およびパンまたはチルトに係る撮影方向情報などがある。以下では、映像制御としてデジタルズームが行われる場合について説明する。
また、メディア制御部101は、撮影装置400から取得される映像情報を用いて、メディア再生装置500に再生させる音を制御する。具体的には、メディア制御部101は、映像情報取得部として、撮影装置400から映像情報を取得し、音出力制御部として、映像情報に係る映像におけるエリアの表示態様に係る情報(以下、エリアクローズアップ指標とも称する。)に応じて、エリア音情報および広範囲音情報に基づく音出力に係る制御情報(以下、音制御情報とも称する。)を生成する。エリアクローズアップ指標としては、エリアの大きさを示す情報がある。また、音制御情報の生成に関わるエリアは、指定操作情報に基づいて特定される指定領域(以下、目的エリアとも称する。)ならびに目的エリアに応じて特定される領域(以下、第1近傍エリアとも称する。)およびエリアクローズアップ指標に応じて特定される領域(以下、第2近傍エリアとも称する。)がある。例えば、メディア制御部101は、目的エリア、第1近傍エリアまたは第2近傍エリアについてのエリア音情報および広範囲音情報に基づく音の混合に係る音制御情報を生成する。生成された音制御情報は、音混合部102に提供される。なお、以下では、第1近傍エリアおよび第2近傍エリアを区別しない場合には、単に近傍エリアとも称する。
さらに、図3〜図5および図6を参照して、音制御処理の例について説明する。図3〜図5は、本発明の一実施形態に係る情報処理システム1において再生される映像の例の各々をそれぞれ説明するための図である。図6は、本発明の一実施形態に係る情報処理システム1における音制御のパターン例を示す図である。
(音制御パターン1)
メディア制御部101はまず、目的エリアの設定を試みる。具体的には、メディア制御部101は、エリアの選択操作または映像情報に係る映像における物体の選択操作に基づいて目的エリアを設定する。例えば、メディア制御部101は、フォーカスのターゲットとなる映像上のエリアまたは物体の選択有無を判定する。図3の例では、ターゲットが未選択であるため、目的エリアは設定されない。なお、エリアまたは物体の選択操作情報は、メディア再生装置500などの装置から提供されてよい。
目的エリアが設定されない場合、メディア制御部101は、第2近傍エリアを設定する。具体的には、メディア制御部101は、映像において面積が閾値以上であるエリアを第2近傍エリアとして設定する。例えば、図3に示したようなエリアHおよびエリアIが第2近傍エリアとして設定される。なお、映像における複数のエリアのうち相対的に面積が大きいエリアが第2近傍エリアとして設定されてもよい。このように、ターゲットが選択されていない場合は、映像についての仮想的な視聴位置(例えば撮影位置)が相対的に近いエリアのエリア音を混合することにより、映像に対する臨場感を視聴者に与えることができる。
そして、メディア制御部101は、目的エリアの設定有無に応じて、エリア音と広範囲音との混合にかかる音制御情報を生成する。音の混合に係る音制御情報としては、音量制御情報がある。例えば、メディア制御部101は、目的エリア(すなわちターゲット)が未選択であるため、図6の上段に示したような音量増幅率で広範囲音および近傍エリア音を音混合部102に混合させるための音制御情報を生成する。ここでは、ターゲットが選択されていないため、広範囲音の音量増幅率が近傍エリア音よりも高く設定される。
なお、図6の例では、いずれかの音の音量が増幅され(音量増幅率が1以上である)、他の音の音量が減衰される(音量増幅率が1未満である)場合について説明したが、音量の相対関係が維持される範囲で全ての音の音量が増幅または減衰されてもよい。例えば、音制御パターン1について、広範囲音の音量増幅率が3.6で、近傍エリア音の音量増幅率が1.0に設定されもよい。また、音制御パターン1について、広範囲音の音量増幅率が0.9で、近傍エリア音の音量増幅率が0.25に設定されてもよい。
(音制御パターン2)
目的エリアが設定される場合、メディア制御部101は、第1近傍エリアを設定する。例えば、エリアEまたはエリアEに位置する人がターゲットとして選択されるため、エリアEが目的エリアとして設定される。そして、メディア制御部101は、目的エリアであるエリアE以外のエリアであって映像における面積が閾値以上のエリアFを第1近傍エリアとして設定する。
そして、メディア制御部101は、目的エリアについてのエリアクローズアップ指標に応じて、エリア音と広範囲音との混合に係る音制御情報を生成する。具体的には、メディア制御部101は、エリアクローズアップ指標に応じて、エリア音および広範囲音の音量の比率を制御する。詳細には、メディア制御部101は、目的エリアについてのエリアクローズアップ指標が小さいほど(すなわちクローズアップの程度が小さいほど)、広範囲音の比率を上げる。例えば、メディア制御部101は、エリアEが目的エリア(すなわちターゲット)として選択されているため、映像におけるエリアEの面積と閾値との関係を判定する。エリアEの面積が閾値未満であると判定されると、メディア制御部101は、図6の中段に示したような音量増幅率で広範囲音、近傍エリア音および目的エリア音を音混合部102に混合させるための音制御情報を生成する。ここでは、広範囲音、近傍エリア音、目的エリア音の順に音量増幅率が低くなるようにそれぞれの音量増幅率が設定される。このため、広範囲音が目的エリア音よりも大きく聴こえるため、視聴者に目的エリアを遠くに感じさせることができる。さらに、第1近傍エリア音が混合されることにより、混合音が層状になり、混合音に対する現実感を向上させることができる。また、第1近傍エリア音が広範囲音よりも小さく目的エリア音よりも大きく聴こえるため、第1近傍エリア音に対する現実感を視聴者に与えることができる。
(音制御パターン3)
また、メディア制御部101は、目的エリアについてのエリアクローズアップ指標が大きいほど(すなわちクローズアップの程度が大きいほど)、目的エリア音の比率を上げる。例えば、目的エリアが設定され、映像における目的エリアの面積が閾値以上であると判定されると、メディア制御部101は、図6の下段に示したような音量増幅率で広範囲音、近傍エリア音および目的エリア音を音混合部102に混合させるための音制御情報を生成する。ここでは、広範囲音、近傍エリア音、目的エリア音の順に音量増幅率が高くなるようにそれぞれの音量増幅率が設定される。このため、目的エリア音が広範囲音および第1近傍エリア音よりも大きく聴こえるため、視聴者に目的エリアを近くに感じさせることができる。また、第1近傍エリア音が目的エリア音よりも小さく広範囲音よりも大きく聴こえるため、第1近傍エリア音に対する現実感を視聴者に与えることができる。
なお、上記では、エリアの面積の閾値との比較結果に応じて音量増幅率が決定される例を説明したが、エリアの面積に係る数値に応じて音量増幅率が決定されてもよい。例えば、メディア制御部101は、エリアの面積の増加に比例して音量増幅率が増加するように制御してよい。
(音制御パターンの切り替え)
メディア制御部101は、状況に応じて音制御のパターンを切り替える。具体的には、メディア制御部101は、目的エリアの特定に応じて音制御情報を生成する。例えば、メディア制御部101は、目的エリアの有無の変化に応じて、図6に示したようなパターンのいずれかに対応する音制御情報を生成し、生成される音制御情報を音混合部102に提供する。これにより、音制御パターンを切り替えることができる。
また、メディア制御部101は、エリアクローズアップ指標の変化に応じて音制御情報を生成してもよい。例えば、メディア制御部101は、映像における目的エリアまたは近傍エリアの面積の変化に応じて、図6に示したようなパターンのいずれかに対応する音制御情報を生成し、生成される音制御情報を音混合部102に提供する。
以上、メディア制御部101の機能について説明した。続いて、音混合部102の機能について説明する。音混合部102は、メディア制御部101の指示に基づいて、広範囲音情報およびエリア音情報の混合処理を行う。具体的には、音混合部102は、メディア制御部101からの音制御御情報により指示される混合処理対象の音情報について指示される音量増幅率で混合処理を行い、混合音情報を生成する。例えば、音混合部102は、音制御情報の示すエリア音情報および広範囲音情報を取得し、取得されたエリア音情報に係る音と広範囲音情報に係る音とが音制御情報の示す音量増幅率に応じて混合させられた音に係る混合音情報を生成する。そして、音混合部102は、生成された混合音情報をメディア再生装置500に提供する。なお、音混合部102は、エリア音または広範囲音をそのままメディア再生装置500に提供してもよい。
[収音装置]
収音装置200は、収音装置200の周辺における音について収音する。具体的には、収音装置200は、収音により音情報を生成する。例えば、収音装置200は、マイクロホンまたはマイクロホンアレーである。
[エリア音生成装置]
エリア音生成装置300は、音情報からエリア音情報を生成する。具体的には、エリア音生成装置300は、収音装置200から得られる広範囲音に基づいてエリア音情報を生成する。例えば、エリア音生成装置300は、広範囲音から特定のエリアにおける音を抽出することによりエリア音情報を生成する。生成されたエリア音情報は、情報処理装置100の音混合部102に提供される。
[撮影装置]
撮影装置400は、撮影装置400の周辺を撮影する。具体的には、撮影装置400は、メディア制御部101の指示に基づいて、撮影および撮影により得られる映像情報の提供を行う。例えば、撮影装置400は、メディア制御部101からの映像制御情報に基づいて、撮影装置400が設置される空間を撮影し、撮影により得られる画像(静止画または動画)などの撮影情報をメディア再生装置500に提供する。
[メディア再生装置]
メディア再生装置500は、映像および音を再生する。具体的には、メディア再生装置500は、撮影装置400から提供される映像情報および情報処理装置100の音混合部102から提供される混合音情報に基づいて映像および音を再生する。例えば、メディア再生装置500は、音出力機能付きの表示装置である。なお、メディア再生装置500は、音出力装置および表示装置などの複数の装置の集合体であってもよく、当該複数の装置の各々が独立して動作してもよい。
また、メディア再生装置500は、入力装置として動作してもよい。具体的には、メディア再生装置500は、ユーザの操作入力を受け付け、入力情報を生成する。例えば、メディア再生装置500は、ユーザによるターゲットを指定する操作を受け付け、上述した指定操作情報を生成する。
<1.3.システムの処理>
次に、本発明の一実施形態に係る情報処理システム1の処理について説明する。ここでは、ターゲット選択および映像の各状況における処理の流れを図7〜図10を参照してそれぞれ説明する。
(ターゲット未選択)
まず、図7を参照して、ターゲットが未選択である場合の処理について説明する。図7は、本発明の一実施形態に係る情報処理システム1におけるターゲットが未選択である場合の処理の例を概念的に示す図である。
収音装置200は、継続的に広範囲音情報を音混合部102およびエリア音生成装置300に送信する(ステップS601)。具体的には、収音装置200は、収音により広範囲音情報を生成する。なお、音情報には、音情報を識別するための音ID(Identifier)が付与される。例えば、広範囲音情報には、audioWという音IDが付与される。
エリア音生成装置300は、広範囲音情報に基づいてエリア音情報を生成し(ステップS602)、生成されたエリア音情報を音混合部102に送信する(ステップS603)。具体的には、エリア音生成装置300は、広範囲音情報からエリアA〜エリアIについてのエリア音情報(音ID:audioA〜auidoI)をそれぞれ生成する。そして、エリア音生成装置300は、生成されたエリア音情報を音混合部102に送信する。なお、エリア音生成装置300は、音混合部102からの要求に応じてエリア音情報を送信してもよい。
メディア制御部101は、映像制御情報としての映像制御メッセージを撮影装置400に送信する(ステップS604)。具体的には、メディア制御部101は、撮影の開始、映像配信の開始、ズーム率の100%(すなわちズームなし)への設定を指示する映像制御メッセージを生成する。そして、メディア制御部101は、生成された映像制御メッセージを撮影装置400に送信する。
撮影装置400は、映像制御メッセージに基づいて動作し、映像情報をメディア制御部101に送信する(ステップS605)。具体的には、撮影装置400は、受信された映像制御メッセージに基づいて、撮影を開始し、撮影により得られた映像情報をメディア制御部101に送信する。なお、この時点ではメディア再生装置500に映像情報が送信されないとしてもよい。
次に、メディア制御部101は、目的エリアを設定する(ステップS606)。具体的には、メディア制御部101は、視聴者により選択されるターゲットに基づいて目的エリアを設定する。ここでは、ターゲットが未選択であるため、目的エリアは設定されない。
また、メディア制御部101は、近傍エリアを設定する(ステップS607)。具体的には、メディア制御部101は、映像情報に基づいて近傍エリアを設定する。ここでは、目的エリアが設定されていないため、映像における面積が閾値以上であるエリアHおよびエリアIが第2近傍エリアとして設定される。
そして、メディア制御部101は、音制御情報としての音制御メッセージを音混合部102に通知する(ステップS608)。具体的には、メディア制御部101は、広範囲音情報および第2近傍エリア音情報の混合音情報を生成させる音制御メッセージを音混合部102に通知する。ここでは、ターゲットが未選択すなわち目的エリアが未設定であるため、音制御パターン1が適用され、audioWの音量増幅率=1.8、audioHおよびauidoIの音量増幅率=0.5を示す音制御メッセージが通知される。
音混合部102は、音制御メッセージに基づいて混合音情報を生成する(ステップS609)。具体的には、音混合部102は、受信された音制御メッセージに基づいて、audioWの音情報を音量増幅率1.8で、audioHおよびaudioIの音情報をそれぞれ音量増幅率0.5で、混合処理し、混合音情報を生成する。
撮影装置400は、映像情報をメディア再生装置500に送信し(ステップS610)、音混合部102は、生成された混合音情報をメディア再生装置500に送信する(ステップS611)。そして、メディア再生装置500は、受信された映像情報および混合音情報に基づいて映像および音を再生する(ステップS612)。
(ターゲット選択)
続いて、図8を参照して、ターゲットが選択された場合の処理について説明する。図8は、本発明の一実施形態に係る情報処理システム1におけるターゲットが選択された場合の処理の例を概念的に示す図である。なお、上述した処理と実質的に同一である処理については説明を省略する。
メディア制御部101は、メディア再生装置500などから指定操作情報を受信する(ステップS621)。具体的には、メディア再生装置500は、ユーザによるターゲットの指定操作を受け付け、指定操作情報を生成する。そして、メディア再生装置500は、生成された指定操作情報をメディア制御部101へ送信する。
次に、メディア制御部101は、目的エリアを設定する(ステップS622)。具体的には、メディア制御部101は、受信された指定操作情報からターゲットを特定する。次に、メディア制御部101は、特定されたターゲットがエリアである場合、当該エリアを目的エリアとして設定する。また、メディア制御部101は、特定されたターゲットが物体である場合、当該物体が位置するエリアを目的エリアとして設定する。ここでは、エリアEが目的エリアとして設定される。
また、メディア制御部101は、近傍エリアを設定する(ステップS623)。具体的には、メディア制御部101は、目的エリアが設定されているため、目的エリア以外のエリアであって、映像における面積が閾値以上であるエリアを第1近傍エリアとして設定する。ここでは、エリアHおよびエリアIが第1近傍エリアとして設定される。
そして、メディア制御部101は、音制御メッセージを音混合部102に通知する(ステップS624)。具体的には、メディア制御部101は、広範囲音情報、第1近傍エリア音情報および目的エリア音情報の混合音情報を生成させる音制御メッセージを音混合部102に通知する。ここでは、映像におけるエリアEの面積が閾値未満であるため、音制御パターン2が適用され、audioWの音量増幅率=1.8、audioHおよびaudioIの音量増幅率=0.5、audioEの音量増幅率0.2を示す音制御メッセージが通知される。
音混合部102は、音制御メッセージに基づいて混合音情報を生成する(ステップS625)。具体的には、音混合部102は、受信された音制御メッセージに基づいて、audioWの音情報を音量増幅率1.8で、audioHおよびaudioIの音情報を音量増幅率0.5で、audioEの音情報を音量増幅率0.2で、混合処理し、混合音情報を生成する。
そして、音混合部102は、生成された混合音情報をメディア再生装置500に送信し(ステップS626)、メディア再生装置500は、受信された映像情報および混合音情報に基づいて映像および音を再生する(ステップS627)。
(映像の切り替え)
続いて、図9を参照して、映像が切り替えられた場合の処理について説明する。図9は、本発明の一実施形態に係る情報処理システム1における映像が切り替えられた場合の処理の例を概念的に示す図である。なお、上述した処理と実質的に同一である処理については説明を省略する。
メディア制御部101は、メディア再生装置500などから映像操作情報を受信する(ステップS641)。具体的には、メディア再生装置500は、ユーザによる映像のズーム操作を受け付け、受け付けられたズーム操作に係る映像操作情報を生成する。そして、メディア再生装置500は、生成された映像操作情報をメディア制御部101へ送信する。
次に、メディア制御部101は、受信された映像操作情報に基づいて映像制御メッセージを撮影装置400へ送信する(ステップS642)。具体的には、メディア制御部101は、映像配信の継続に加えて、受信された映像操作情報に応じてズーム位置およびズーム率150%の設定を指示する映像制御メッセージを生成する。そして、メディア制御部101は、生成された映像制御メッセージを撮影装置400に送信する。
撮影装置400は、受信された映像制御メッセージに基づいて映像情報をメディア制御部101へ送信する(ステップS643)。具体的には、撮影装置400は、受信された映像制御メッセージに基づいて、撮影により得られた映像を指示されたズーム位置を中心に切り出し、切り出された映像を150%のサイズに引き伸ばす。そして、撮影装置400は、このような処理により得られた映像情報をメディア制御部101に送信する。
次に、メディア制御部101は、目的エリアを設定する(ステップS644)。具体的には、メディア制御部101は、受信された映像情報に基づいて目的エリアを更新する。例えば、メディア制御部101は、ズーム率の変更後に得られる映像情報に係る映像におけるターゲットを特定する。次に、メディア制御部101は、特定されたターゲットがエリアである場合、当該エリアを目的エリアとして設定する。また、メディア制御部101は、特定されたターゲットが物体である場合、当該物体が位置するエリアを目的エリアとして設定する。ここでは、エリアEが引き続き目的エリアとして設定される。
また、メディア制御部101は、近傍エリアを設定する(ステップS645)。具体的には、メディア制御部101は、目的エリアが設定されているため、第1近傍エリアを設定する。ここでは、映像のズームインによりエリアHおよびエリアIが第1近傍エリアから外れ、エリアFが新たに第1近傍エリアに設定される。
そして、メディア制御部101は、音制御メッセージを音混合部102に通知する(ステップS646)。具体的には、メディア制御部101は、広範囲音情報、第1近傍エリア音情報および目的エリア音情報の混合音情報を生成させる音制御メッセージを音混合部102に通知する。ここでは、映像のズームインにより映像におけるエリアEの面積が閾値を超過したため、音制御パターン3が適用され、audioWの音量増幅率=0.2、audioFの音量増幅率=0.5、audioEの音量増幅率1.8を示す音制御メッセージが通知される。
音混合部102は、音制御メッセージに基づいて混合音情報を生成する(ステップS647)。具体的には、音混合部102は、受信された音制御メッセージに基づいて、audioWの音情報を音量増幅率0.2で、audioFの音情報を音量増幅率0.5で、audioEの音情報を音量増幅率1.8で、混合処理し、混合音情報を生成する。
そして、撮影装置400は、映像操作情報による制御後に生成された映像情報をメディア再生装置500に送信し(ステップS648)、音混合部102は、生成された混合音情報をメディア再生装置500に送信する(ステップS649)。そして、メディア再生装置500は、受信された映像情報および混合音情報に基づいて映像および音を再生する(ステップS650)。
(更なる映像の切り替え)
続いて、図10を参照して、映像がさらに切り替えられた場合の処理について説明する。図10は、本発明の一実施形態に係る情報処理システム1における映像がさらに切り替えられた場合の処理の例を概念的に示す図である。なお、上述した処理と実質的に同一である処理については説明を省略する。
メディア制御部101は、メディア再生装置500などから映像操作情報を受信し(ステップS661)、受信された映像操作情報に基づいて映像制御メッセージを撮影装置400へ送信する(ステップS662)。具体的には、メディア制御部101は、受信された映像操作情報に応じてズーム位置およびズーム率200%の設定を指示する映像制御メッセージを生成する。そして、メディア制御部101は、生成された映像制御メッセージを撮影装置400に送信する。
撮影装置400は、受信された映像制御メッセージに基づいて映像情報をメディア制御部101へ送信する(ステップS663)。具体的には、撮影装置400は、受信された映像制御メッセージに基づいて、撮影により得られた映像を指示されたズーム位置を中心に切り出し、切り出された映像を200%のサイズに引き伸ばす。そして、撮影装置400は、このような処理により得られた映像情報をメディア制御部101に送信する。
次に、メディア制御部101は、目的エリアを設定する(ステップS664)。具体的には、メディア制御部101は、ズーム率200%の映像におけるターゲットに基づいて目的エリアを設定する。ここでは、エリアEが引き続き目的エリアとして設定される。
また、メディア制御部101は、近傍エリアを設定する(ステップS665)。具体的には、メディア制御部101は、目的エリアが設定されているため、第1近傍エリアの設定を試みる。しかし、ここでは、映像のズームインにより映像における面積が閾値以上であるエリアであって、エリアE以外のエリアが存在しないため、第1近傍エリアは設定されない。
そして、メディア制御部101は、音制御メッセージを音混合部102に通知する(ステップS666)。具体的には、メディア制御部101は、広範囲音情報および目的エリア音情報の混合音情報を生成させる音制御メッセージを音混合部102に通知する。ここでは、映像のズームインにより映像におけるエリアEの面積が閾値を超過したため、音制御パターン3が適用され、audioWの音量増幅率=0.2、audioEの音量増幅率1.8を示す音制御メッセージが通知される。
音混合部102は、音制御メッセージに基づいて混合音情報を生成する(ステップS667)。具体的には、音混合部102は、受信された音制御メッセージに基づいて、audioWの音情報を音量増幅率0.2で、audioEの音情報を音量増幅率1.8で、混合処理し、混合音情報を生成する。
そして、撮影装置400は、映像操作情報による制御後に生成された映像情報をメディア再生装置500に送信し(ステップS668)、音混合部102は、生成された混合音情報をメディア再生装置500に送信する(ステップS669)。そして、メディア再生装置500は、受信された映像情報および混合音情報に基づいて映像および音を再生する(ステップS670)。
<1.4.本発明の一実施形態のまとめ>
このように、本発明の一実施形態によれば、情報処理装置100は、特定の空間に係る映像情報を取得し、当該映像情報に係る映像における当該特定の空間における第1の領域の表示態様に係る情報に応じて、当該第1の領域に係る第1の音情報および当該特定の空間における第1の領域よりも広い範囲に係る第2の音情報に基づく音出力に係る制御情報を生成する。
従来では、特定の領域の音以外の背景雑音を減衰させることにより当該特定の領域の音を明瞭化させる技術が用いられていた。しかし、当該技術では、視聴者には当該特定の領域の音のみが聴こえるため、臨場感を与えることが困難であった。
これに対し、本発明の一実施形態によれば、映像情報における第1の領域(エリア)の表示態様に応じて、第1の音情報(エリア音)と第2の音情報(広範囲音)とに基づく音出力が制御される。このため、局所的なエリア音だけでなくエリアよりも広い範囲における広範囲音を映像に応じて視聴者に提供することができる。それにより、視聴者はエリア音を聴き取りながらエリアよりも広い空間の雰囲気を感じることができる。従って、視聴者に明瞭化された所望の音を提供することと、視聴者に提供する映像および音に対する臨場感を向上させることと、を両立させることが可能となる。
また、上記表示態様に係る情報は、上記第1の領域の大きさを示す情報を含む。このため、映像におけるエリアの大きさに応じてエリア音が制御されることにより、映像と音との関係性を視聴者に提示することができる。従って、映像および音に対する臨場感を向上させることが可能となる。
また、上記音出力に係る制御情報は、上記第1の音情報および上記第2の音情報に基づく音の混合に係る制御情報を含む。このため、エリア音および広範囲音を一体的な音として視聴者に提示することができる。従って、エリア音および広範囲音がそれぞれ独立して提示される場合に比べて臨場感を向上させることが可能となる。なお、上記実施形態のように、複数の第1の音情報(目的エリア音および近傍エリア音)と第2の音情報とが混合処理されてもよい。
また、上記音の混合に係る制御情報は、上記第1の音情報および上記第2の音情報の音量制御情報を含む。このため、映像における特定のエリアの表示態様に応じて、エリア音および広範囲音の混合の程度を制御することができる。従って、例えば映像における目的エリアの面積が大きいほど、エリア音の音量増幅率を上げながら広範囲音の音量増幅率を下げることにより、当該目的エリアに近づいたような臨場感を視聴者に与えることが可能となる。
また、上記第1の領域は、上記表示態様に係る情報に応じて特定される領域を含む。このため、例えば映像における面積が閾値よりも大きいエリアを第2近傍エリアとして設定し、第2近傍エリア音を混合させることができる。従って、目的エリアが設定されていない場合であっても、視聴者に仮想的に近いエリアについてのエリア音が混合され、再生されることにより、映像および音に対する臨場感を向上させることが可能となる。
また、上記第1の領域は、指定操作情報に基づいて特定される指定領域を含む。このため、目的エリアをユーザの操作に基づいて決定することができる。従って、ユーザが視聴を所望するエリアの音をより確実に再生させることが可能となる。
また、上記指定操作情報に係る操作は、上記第1の領域の選択操作または上記映像情報に係る映像における物体の選択操作を含む。このため、ユーザがエリアを認識している場合には、エリアが直接的に選択されることにより目的エリアの設定に齟齬が生じることを抑制できる。また、ユーザが映像上の物体を選択する場合には、ユーザはエリアを予め認識することなく目的エリアのエリア音を明瞭に聴くことができる。
また、上記第1の領域は、上記指定領域に応じて特定される領域を含む。このため、例えば目的エリアの周辺エリアが近傍エリアとして設定されることにより、混合音の臨場感を向上させることが可能となる。
また、上記音出力に係る制御情報は、上記指定領域の特定に応じて生成される。このため、目的エリアの設定に応じて再生される混合音が制御されることにより、ユーザの操作に対する混合音制御の応答性を向上させることができる。従って、ユーザの操作感を向上させることが可能となる。
また、上記音出力に係る制御情報は、上記表示態様に係る情報の変化に応じて生成される。このため、エリアクローズアップ指標の変化に応じて混合音が制御されることにより、映像の切り替わりによる臨場感の低下を抑制することができる。
また、上記第1の音情報は、上記第2の音情報からの抽出により生成される。このため、混合音に対する視聴者の違和感を抑制することができる。
<1.5.変形例>
以上、本発明の一実施形態について説明した。なお、本発明の一実施形態は、上述の例に限定されない。以下に、本発明の一実施形態の第1〜第3の変形例について説明する。
(第1の変形例)
本発明の一実施形態の第1の変形例として、映像におけるエリアの表示態様に係る情報は、エリアの大きさを示す情報以外の他の情報であってもよい。具体的には、エリアクローズアップ指標は、映像情報に係るズーム情報であってもよい。例えば、メディア制御部101は、映像のズーム倍率に応じて音の混合を制御する。さらに、図11を参照して、本変形例の処理について説明する。図11は、本発明の一実施形態の第1の変形例に係る情報処理システム1における音制御のパターン例を示す図である。
(音制御パターン4)
メディア制御部101は、映像のズーム倍率に応じて、エリア音および広範囲音の音量の比率を制御する。具体的には、メディア制御部101は、映像のズーム倍率が低いほど、広範囲音の比率を上げる(またはエリア音の比率を下げる)。例えば、メディア制御部101は、再生されている映像のズーム倍率が閾値未満であるかを判定する。ズーム倍率が閾値未満であると判定されると、メディア制御部101は、図11の中段に示したような音量増幅率で広範囲音、近傍エリア音および目的エリア音を音混合部102に混合させるための音制御情報を生成する。これは、ズーム倍率が低いほど、視聴者は目的エリアを遠くに感じると考えられるためである。
(音制御パターン5)
また、メディア制御部101は、映像のズーム倍率が高いほど、目的エリア音の比率を上げる(または広範囲音の比率を下げる)。例えば、再生されている映像のズーム倍率が閾値以上であると判定されると、メディア制御部101は、図11の下段に示したような音量増幅率で広範囲音、近傍エリア音および目的エリア音を音混合部102に混合させるための音制御情報を生成する。これは、ズーム倍率が高いほど、視聴者は目的エリアを近くに感じると考えられるためである。
また、エリアクローズアップ指標は、映像情報に係る映像についての仮想的な視聴位置と当該映像におけるエリアとの位置関係を示す情報であってもよい。例えば、メディア制御部101は、仮想的な視聴位置と目的エリアとの仮想距離に応じて音の混合を制御する。さらに、図12を参照して、本変形例の別の処理について説明する。図12は、本発明の一実施形態の第1の変形例に係る情報処理システム1における音制御の別のパターン例を示す図である。
(音制御パターン6)
メディア制御部101は、仮想的な視聴位置と目的エリアとの仮想距離に応じて、エリア音および広範囲音の音量の比率を制御する。具体的には、メディア制御部101は、仮想距離が長いほど、広範囲音の比率を上げる。例えば、メディア制御部101はまず、映像の撮影位置と映像における目的エリアとの仮想距離を算出する。次いで、メディア制御部101は、算出された仮想距離が閾値超過であるかを判定する。仮想距離が閾値超過であると判定されると、メディア制御部101は、図12の中段に示したような音量増幅率で広範囲音、近傍エリア音および目的エリア音を音混合部102に混合させるための音制御情報を生成する。これは、仮想距離が長いほど、視聴者が目的エリアを遠くに感じると考えられるためである。
(音制御パターン7)
また、メディア制御部101は、仮想距離が短いほど、目的エリア音の比率を上げる。例えば、算出された仮想距離が閾値以下あると判定されると、メディア制御部101は、図12の下段に示したような音量増幅率で広範囲音、近傍エリア音および目的エリア音を音混合部102に混合させるための音制御情報を生成する。これは、仮想距離が短いほど、視聴者が目的エリアを近くに感じると考えられるためである。
このように、第1の変形例によれば、映像におけるエリアの表示態様に係る情報は、映像情報に係るズーム情報を含む。このため、映像を解析することなく、混合音の制御を行うことができる。従って、音制御処理にかかる処理負荷および処理速度を向上させることが可能となる。
また、映像におけるエリアの表示態様に係る情報は、映像情報に係る映像についての仮想的な視聴位置と映像情報に係る映像におけるエリアとの位置関係を示す情報を含む。このため、映像におけるエリアの大きさよりも正確な混合音の制御を行うことができる。従って、視聴者に与える臨場感をより高めることが可能となる。
(第2の変形例)
本発明の一実施形態の第2の変形例として、エリア音と広範囲音との混合音は、映像情報の変更に応じて制御されてもよい。具体的には、メディア制御部101は、映像情報の提供元の変更に応じてエリア音情報および広範囲音情報に基づく音出力を制御する。例えば、メディア制御部101は、映像情報を配信させる撮影装置400が切り替えられると、切り替え先の撮影装置400から得られる映像情報に基づいて目的エリアまたは近傍エリアを設定する。そして、メディア制御部101は、設定された目的エリアまたは近傍エリアに応じて、エリア音情報および広範囲音情報の混合処理を行う。さらに、図13を参照して、本変形例の処理について説明する。図13は、本発明の一実施形態の第2の変形例に係る情報処理システム1の処理の例を概念的に示す図である。なお、上述した処理と実質的に同一である処理については説明を省略する。
メディア制御部101は、メディア再生装置500などから映像操作情報を受信し(ステップS701)、受信された映像操作情報に基づいて映像制御メッセージを撮影装置400へ送信する(ステップS702、S703)。具体的には、メディア制御部101は、受信された映像操作情報が映像情報を配信する撮影装置400の切り替え操作に係る情報である場合、切り替え元の撮影装置400Aに配信停止を指示する映像制御メッセージを送信する。また、メディア制御部101は、切り替え先の撮影装置400Bに配信開始を指示する映像制御メッセージを送信する。
撮影装置400は、受信された映像制御メッセージに基づいて映像情報をメディア制御部101へ送信する(ステップS704)。具体的には、撮影装置400Bは、受信された映像制御メッセージに基づいて、撮影を開始し、撮影により得られた映像情報をメディア制御部101に送信する。既に撮影を開始している場合には映像の配信のみが開始される。なお、撮影装置400Aは、受信された映像制御メッセージに基づいて映像の配信を停止する。さらに、撮影が停止させられてもよい。
次に、メディア制御部101は、目的エリアを設定する(ステップS705)。具体的には、メディア制御部101は、撮影装置400Bから受信される映像情報と指定操作情報とに基づいて目的エリアを設定し直す。ここでは、エリアEが目的エリアとして設定される。
また、メディア制御部101は、近傍エリアを設定する(ステップS706)。具体的には、メディア制御部101は、目的エリアが設定されているため、撮影装置400Bから受信された映像情報に基づいて第1近傍エリアの設定を試みる。ここでは、面積が閾値以上であるエリアがエリアDであるため、エリアDが第1近傍エリアとして設定される。
そして、メディア制御部101は、音制御メッセージを音混合部102に通知し(ステップS707)、音混合部102は、音制御メッセージに基づいて混合音情報を生成する(ステップS708)。
その後、撮影装置400Aではなく撮影装置400Bから映像情報がメディア再生装置500に送信され(ステップS709)、音混合部102から混合音情報がメディア再生装置500に送信される(ステップS710)。メディア再生装置500は、受信された映像情報および混合音情報に基づいて映像および音を再生する(ステップS711)。
このように、第2の変形例によれば、音制御情報は、映像情報の変更に応じて生成される。このため、再生される映像自体が切り替えられた際にも切り替え後の映像に応じた混合音を視聴者に提示することができる。従って、映像および音に対する臨場感を継続させることが可能となる。
なお、映像が切り替えられた場合に、ターゲットの選択状態は維持されてもよく、リセットされてもよい。
(第3の変形例)
本発明の一実施形態の第3の変形例として、情報処理装置100は、複数の広範囲音情報から選択される広範囲音情報を用いて混合処理を行ってもよい。具体的には、メディア制御部101は、音制御情報の生成に用いられるエリア音情報に応じて複数の広範囲音情報から当該音制御情報の生成に用いられる広範囲音情報を選択する。例えば、メディア制御部101は、目的エリアが設定される場合、目的エリアの近くに配置される収音装置200により生成される広範囲音情報を選択し、選択される広範囲音情報を混合処理に用いる。また、目的エリアが設定されない場合、メディア制御部101は、第2近傍エリアの近くに配置される収音装置200により生成される広範囲音情報を選択する。
このように、第3の変形例によれば、情報処理装置100は、音制御情報の生成に用いられるエリア音情報に応じて複数の広範囲音情報から当該音制御情報の生成に用いられる広範囲音情報を選択する。このため、エリア音に合った広範囲音が選択されることにより、混合音に対する視聴者の違和感を抑制し臨場感を向上させることができる。特に、情報処理システム1が適用される空間が広く複数の収音装置200が設置される場合に、当該構成はより効果的である。
<2.本発明の一実施形態に係る情報処理装置のハードウェア構成>
以上、本発明の実施形態を説明した。上述した情報処理装置100の処理は、ソフトウェアと、以下に説明する情報処理装置100のハードウェアとの協働により実現される。
図14は、本発明の一実施形態に係る情報処理装置100のハードウェア構成を示した説明図である。図14に示したように、情報処理装置100は、CPU(Central Processing Unit)132と、ROM(Read Only Memory)134と、RAM(Random Access Memory)136と、内部バス138と、入出力インターフェース140と、入力装置142と、出力装置144と、HDD(Hard Disk Drive)146と、ネットワークインターフェース148と、外部インターフェース150とを備える。
CPU132は、演算処理装置および制御装置として機能し、各種プログラムと協働して情報処理装置100内のメディア制御部101および音混合部102の動作を実現する。また、CPU132は、マイクロプロセッサであってもよい。ROM134は、CPU132が使用するプログラムまたは演算パラータ等を記憶する。RAM136は、CPU132の実行にいて使用するプログラムまたは実行において適宜変化するパラメタ等を一時記憶する。ROM134およびRAM136により、情報処理装置100内の記憶部の一部が実現される。CPU132、ROM134およびRAM136は、CPUバスなどから構成される内部バス138により相互に接続されている。
入力装置142は、ボタン、マイクロホン、スイッチおよびレバーなど情報を入力するための入力手段と、入力に基づいて入力信号を生成し、CPU132に出力する入力制御回路などから構成されている。入力装置142が操作されることにより、情報処理装置100に対して各種のデータが入力されたり処理動作が指示されたりし得る。
出力装置144は、例えば、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Diode)装置およびランプなどの表示装置への出力を行う。さらに、出力装置144は、スピーカおよびヘッドホンなどの音声出力を行ってもよい。
HDD146は、データ格納用の装置である。HDD146は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置等を含んでもよい。HDD146は、CPU132が実行するプログラムおよび各種データを格納する。
ネットワークインターフェース148は、ネットワークに接続するための通信デバイスで構成され得る。また、ネットワークインターフェース148は、有線による通信を行うワイヤー通信対応デバイスであるが、無線LAN(Local Area Network)対応通信デバイスであっても、3GまたはLTE対応通信デバイスであってもよい。
外部インターフェース150は、例えば、情報処理装置100の外部の装置または周辺機器と接続するためのバスである。また、外部インターフェース150は、USB(Universal Serial Bus)であってもよい。
<3.むすび>
以上、本発明の一実施形態によれば、局所的なエリア音だけでなくエリアよりも広い範囲における広範囲音を映像に応じて視聴者に提供することができる。それにより、視聴者はエリア音を聴き取りながらエリアよりも広い空間の雰囲気を感じることができる。従って、視聴者に明瞭化された所望の音を提供することと、視聴者に提供する映像および音に対する臨場感を向上させることと、を両立させることが可能となる。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
例えば、上記実施形態では、エリアの大きさを示す情報が面積であるとしたが、本発明はかかる例に限定されない。例えば、エリアの大きさを示す情報は、エリアの全長、中心からの端部までの長さ、または半径(円の場合)などの情報であってもよい。
また、上記実施形態では、撮影装置400は、メディア制御部101により制御される例を説明したが、メディア制御部101以外によって制御されてもよい。その場合、メディア制御部101に、撮影装置400の制御パラメタが通知されてもよい。
また、上記実施形態では、エリア音情報および広範囲音情報が混合処理される例を説明したが、エリア音情報および広範囲音情報は独立して配信され、エリア音および広範囲音がそれぞれ別個の音出力装置から出力されてもよい。
また、上記実施形態では、ズーム位置がユーザの操作により決定される例を説明したが、ズーム位置は固定であってもよい。例えば、ズーム位置は映像の中心またはその他の特定の位置に固定されてよい。
また、上記実施形態では、指定操作情報および映像操作情報がユーザの操作に基づいて生成される例を説明したが、指定操作情報および映像操作情報はコンピュータによって生成されてもよい。例えば、指定操作情報または映像操作情報は、再生される映像における予めプログラムされたタイミングで生成され、メディア制御部101へ送信されてよい。
また、上記の実施形態の処理図に示されたステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的にまたは個別的に実行される処理をも含む。また時系列的に処理されるステップでも、場合によっては適宜順序を変更することが可能であることは言うまでもない。
また、情報処理装置100に内蔵されるハードウェアに上述した情報処理装置100の各機能構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、当該コンピュータプログラムが記憶された記憶媒体も提供される。
100 情報処理装置
101 メディア制御部
102 音混合部
200 収音装置
300 エリア音生成装置
400 撮影装置
500 メディア再生装置

Claims (18)

  1. 特定の空間に係る映像情報を取得する映像情報取得部と、
    前記映像情報に係る映像における、前記特定の空間における第1の領域の表示態様に係る情報に応じて、前記第1の領域に係る第1の音情報および前記特定の空間における前記第1の領域よりも広い範囲に係る第2の音情報に基づく音出力に係る制御情報を生成する音出力制御部と、
    を備える情報処理装置。
  2. 前記表示態様に係る情報は、前記第1の領域の大きさを示す情報を含む、
    請求項1に記載の情報処理装置。
  3. 前記表示態様に係る情報は、前記映像情報に係るズーム情報を含む、
    請求項1または2に記載の情報処理装置。
  4. 前記表示態様に係る情報は、前記映像情報に係る映像についての仮想的な視聴位置と前記映像情報に係る映像における前記第1の領域との位置関係を示す情報を含む、
    請求項1〜3のいずれか1項に記載の情報処理装置。
  5. 前記音出力に係る制御情報は、前記第1の音情報および前記第2の音情報に基づく音の混合に係る制御情報を含む、
    請求項1〜4のいずれか1項に記載の情報処理装置。
  6. 前記音の混合に係る制御情報は、前記第1の音情報および前記第2の音情報の音量制御情報を含む、
    請求項5に記載の情報処理装置。
  7. 前記第1の領域は、前記表示態様に係る情報に応じて特定される領域を含む、
    請求項1〜6のいずれか1項に記載の情報処理装置。
  8. 前記第1の領域は、指定操作情報に基づいて特定される指定領域を含む、
    請求項1〜7のいずれか1項に記載の情報処理装置。
  9. 前記指定操作情報に係る操作は、前記第1の領域の選択操作または前記映像情報に係る映像における物体の選択操作を含む、
    請求項8に記載の情報処理装置。
  10. 前記第1の領域は、前記指定領域に応じて特定される領域を含む、
    請求項8または9に記載の情報処理装置。
  11. 前記音出力に係る制御情報は、前記指定領域の特定に応じて生成される、
    請求項8〜10のいずれか1項に記載の情報処理装置。
  12. 前記音出力に係る制御情報は、前記表示態様に係る情報の変化に応じて生成される、
    請求項1〜11のいずれか1項に記載の情報処理装置。
  13. 前記音出力に係る制御情報は、前記映像情報の変更に応じて生成される、
    請求項1〜12のいずれか1項に記載の情報処理装置。
  14. 前記第1の音情報は、前記第2の音情報からの抽出により生成される、
    請求項1〜13のいずれか1項に記載の情報処理装置。
  15. 前記音出力制御部は、前記音出力に係る制御情報の生成に用いられる前記第1の音情報に応じて複数の前記第2の音情報から前記音出力に係る制御情報の生成に用いられる前記第2の音情報を選択する、
    請求項1〜14のいずれか1項に記載の情報処理装置。
  16. 特定の空間における第1の領域に係る第1の音情報と、前記特定の空間における前記第1の領域よりも広い範囲に係る第2の音情報と、を取得する音情報取得部と、
    前記特定の空間に係る映像情報を取得する映像情報取得部と、
    前記映像情報に係る映像における前記第1の領域の表示態様に係る情報に応じて、前記第1の音情報および前記第2の音情報に基づく音出力に係る制御情報を生成する音出力制御部と、
    前記音出力に係る制御情報に基づいて前記第1の音情報および前記第2の音情報に基づく音出力を行う音出力部と、
    を備える情報処理システム。
  17. プロセッサを用いて、
    特定の空間に係る映像情報を取得することと、
    前記映像情報に係る映像における、前記特定の空間における第1の領域の表示態様に係る情報に応じて、前記第1の領域に係る第1の音情報および前記特定の空間における前記第1の領域よりも広い範囲に係る第2の音情報に基づく音出力に係る制御情報を生成することと、
    を含む情報処理方法。
  18. 特定の空間に係る映像情報を取得する映像情報取得機能と、
    前記映像情報に係る映像における、前記特定の空間における第1の領域の表示態様に係る情報に応じて、前記第1の領域に係る第1の音情報および前記特定の空間における前記第1の領域よりも広い範囲に係る第2の音情報に基づく音出力に係る制御情報を生成する音出力制御機能と、
    をコンピュータに実現させるためのプログラム。
JP2016169319A 2016-08-31 2016-08-31 情報処理装置、情報処理システム、情報処理方法及びプログラム Pending JP2018037842A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016169319A JP2018037842A (ja) 2016-08-31 2016-08-31 情報処理装置、情報処理システム、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016169319A JP2018037842A (ja) 2016-08-31 2016-08-31 情報処理装置、情報処理システム、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2018037842A true JP2018037842A (ja) 2018-03-08

Family

ID=61567833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016169319A Pending JP2018037842A (ja) 2016-08-31 2016-08-31 情報処理装置、情報処理システム、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2018037842A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014049885A (ja) * 2012-08-30 2014-03-17 Nippon Telegr & Teleph Corp <Ntt> 音響再生装置とその方法とプログラム
JP2014072661A (ja) * 2012-09-28 2014-04-21 Jvc Kenwood Corp 映像音声記録再生装置
JP2016025469A (ja) * 2014-07-18 2016-02-08 沖電気工業株式会社 収音再生システム、収音再生装置、収音再生方法、収音再生プログラム、収音システム及び再生システム
JP2016039407A (ja) * 2014-08-05 2016-03-22 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014049885A (ja) * 2012-08-30 2014-03-17 Nippon Telegr & Teleph Corp <Ntt> 音響再生装置とその方法とプログラム
JP2014072661A (ja) * 2012-09-28 2014-04-21 Jvc Kenwood Corp 映像音声記録再生装置
JP2016025469A (ja) * 2014-07-18 2016-02-08 沖電気工業株式会社 収音再生システム、収音再生装置、収音再生方法、収音再生プログラム、収音システム及び再生システム
JP2016039407A (ja) * 2014-08-05 2016-03-22 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理方法

Similar Documents

Publication Publication Date Title
JP6069881B2 (ja) 中継装置、表示データ共有システム、データ制御方法およびプログラム
JP4525831B1 (ja) 画像受信装置、および、プログラム
EP2583448A1 (en) Digital camera for sharing digital images
TW201412141A (zh) 行動裝置及其控制方法
JP2007274381A (ja) 撮像装置、電子機器および表示方法ならびにプログラム
JP6149862B2 (ja) 表示制御装置、表示制御システムおよび表示制御方法
EP3929714A1 (en) Information processing device, information processing method, and program
JP2017102218A (ja) 表示装置および表示プログラム
JP2018037842A (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
JP6848517B2 (ja) 情報処理装置、方法、プログラムおよび情報処理システム
US20220095047A1 (en) Apparatus and associated methods for presentation of audio
JP2017054195A (ja) サーバ装置、プログラム、及び通信システム
WO2017163323A1 (ja) 画面共有システム、画面共有方法、および画面共有プログラム
JP2006340062A (ja) 移動通信端末装置
JP2004336430A (ja) 再生装置
RU2743956C1 (ru) Способ создания вертикально ориентированного видео
JP2019033393A (ja) 動画情報処理装置並びにその制御方法及び制御プログラム
JP2019050444A (ja) データ編集のためのインターフェイス装置、キャプチャ装置、画像処理装置、データ編集方法及びデータ編集プログラム
JP7492092B1 (ja) 電子マニュアルの作成を支援するためのコンピュータシステムおよびプログラム
JP2017054197A (ja) プログラム、情報処理方法、及び通信システム
JP2022143296A (ja) 音声再生プログラム、音声再生方法、および音声再生装置
JP2017108287A (ja) 通信装置、制御方法及び制御プログラム
JP3964418B2 (ja) 映像通話用の通信端末及び呼制御中継装置
JP2022117152A (ja) 情報処理方法、情報処理システムおよびプログラム
JP5626426B2 (ja) コミュニケーションプレイバックシステム用端末装置、サーバ、プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190327

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190328

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200803

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210105