JP2022143165A - 再生装置、再生システムおよび再生方法 - Google Patents

再生装置、再生システムおよび再生方法 Download PDF

Info

Publication number
JP2022143165A
JP2022143165A JP2021043542A JP2021043542A JP2022143165A JP 2022143165 A JP2022143165 A JP 2022143165A JP 2021043542 A JP2021043542 A JP 2021043542A JP 2021043542 A JP2021043542 A JP 2021043542A JP 2022143165 A JP2022143165 A JP 2022143165A
Authority
JP
Japan
Prior art keywords
sound source
virtual
speaker
real
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021043542A
Other languages
English (en)
Inventor
庸平 掛江
Yohei Kakee
好州 三木
Yoshikuni Miki
壽成 木村
Hisashige Kimura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP2021043542A priority Critical patent/JP2022143165A/ja
Priority to US17/478,244 priority patent/US11711652B2/en
Publication of JP2022143165A publication Critical patent/JP2022143165A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/007Electronic adaptation of audio signals to reverberation of the listening space for PA
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • H04S7/306For headphones

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】臨場感を高めることができる再生装置、再生システムおよび再生方法を提供すること。【解決手段】実施形態に係る再生装置は、取得部と、決定部と、再生部とを備える。取得部は、音源に関する音源情報を取得する。決定部は、仮想空間に配置された仮想スピーカと、仮想空間に配置された仮想リスナとの位置関係に基づいて、仮想スピーカにおける音源の出力特性を決定する。再生部は、決定部によって決定された出力特性に基づいて、実空間に配置された実スピーカを介して音源を再生する。【選択図】図3

Description

本発明は、再生装置、再生システムおよび再生方法に関する。
従来、例えば、コンサート会場等の現実空間において収録した音声や映像を、VRやAR等の仮想空間において表現することで、遠隔地であってもコンサート会場にいるような臨場感を味わえる技術が提案されている。
特開2021-9647号公報
しかしながら、仮想空間において音声を表現する場合、音源の出力元は、VRデバイスやARデバイスを装着したユーザが実在する空間(例えば、部屋)のスピーカとなるため、臨場感に欠けるおそれがあった。
本発明は、上記に鑑みてなされたものであって、臨場感を高めることができる再生装置、再生システムおよび再生方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明に係る再生装置は、取得部と、決定部と、再生部とを備える。前記取得部は、音源に関する音源情報を取得する。前記決定部は、仮想空間に配置された仮想スピーカと、前記仮想空間に配置された仮想リスナとの位置関係に基づいて、前記仮想スピーカにおける前記音源の出力特性を決定する。前記再生部は、前記決定部によって決定された前記出力特性に基づいて、実空間に配置された実スピーカを介して前記音源を再生する。
本発明によれば、臨場感を高めることができる。
図1Aは、実施形態に係る再生方法の概要を示す図である。 図1Bは、実施形態に係る再生方法の概要を示す図である。 図2は、実施形態に係る再生システムの構成例を示すブロック図である。 図3は、実施形態に係る再生装置の構成例を示す機能ブロック図である。 図4は、傾聴方向の音源を強調再生する例を示す図である。 図5は、疑似サラウンドの処理を示す図である。 図6は、実施形態に係る再生装置によって実行される処理の処理手順を示すフローチャートである。
以下、添付図面を参照して、本願の開示する再生装置、再生システムおよび再生方法の実施形態を詳細に説明する。なお、以下に示す実施形態により本発明が限定されるものではない。
まず、図1Aおよび図1Bを用いて、実施形態に係る再生方法の概要について説明する。図1Aおよび図1Bは、実施形態に係る再生方法の概要を示す図である。実施形態に係る再生方法は、図1Aおよび図1Bに示す再生装置1によって実行される。
図1Aに示すように、本開示では、コンサート会場やライブ会場等の現実空間である音響空間SSにおいて、実際にリスナRL(以下、実リスナRL)が音源や映像を収録し、収録した音源や映像を再生装置1によってVR(Virtual Reality)やAR(Augmented Reality)、MR(Mixed Reality)等の仮想空間VS(図1B参照)で再生することで、実リスナRLとは異なるユーザUが自宅等の実空間RSにいる状態で音響空間SSにいるかのような臨場感を味わえるものである。
具体的には、図1Aに示すように、再生装置1は、実空間RSに配置された実スピーカ200と通信接続され、収録した音源を実スピーカ200を介して再生する。また、再生装置1は、仮想空間VSを表示可能な表示部5(図3参照)を有し、収録した映像を表示部5を介して再生する。なお、図1Aでは、実スピーカ200の配置は、実空間RSの所定位置に固定される場合を示したが、実スピーカ200は、例えば、イヤホン等のユーザUが装着するものであってもよい。
本開示では、実施形態に係る再生装置1が図1Bに示す再生方法を実行することで、実スピーカ200を介して再生される音源により、仮想空間VSでの臨場感を高めることができる。
以下、図1Bを用いて、実施形態に係る再生方法について説明する。なお、図1Bでは、説明の便宜上、仮想空間VSを上面視で示しているが、実際には、ユーザUは、再生装置1を介して仮想リスナVLを視点とした様々な視線方向の映像を見ることができる。
図1Bに示すように、実施形態に係る再生方法では、再生装置1は、まず、収録装置100で収録された音源に関する音源情報を取得する(ステップS1)。なお、再生装置1は、音源情報と併せて、収録装置100で録画された映像情報も取得する。音源情報および映像情報は、収録装置100から直接取得されてもよいし、音源情報および映像情報を保存する不図示のクラウドサーバから取得されてもよい。また、音源情報および映像情報は、CD(Compact Disc)や、DVD(Digital Versatile Disc)、フラッシュメモリ等の記憶媒体を介して取得されてもよい。
つづいて、実施形態に係る再生方法では、仮想空間VSに配置された仮想スピーカ300と、仮想空間VSに配置された仮想リスナVLとの位置関係に基づいて、仮想スピーカ300における音源の出力特性を決定する(ステップS2)。出力特性は、例えば、音源の周波数特性や、位相特性、ゲイン特性(音量特性)等を含む。
具体的には、ステップS2では、まず、再生装置1は、仮想空間VSに仮想スピーカ300および仮想リスナVLを配置する。仮想スピーカ300および仮想リスナVLは、予め定められた位置に配置されてもよく、ユーザUによって指定された位置に配置されてもよい。そして、再生装置1は、配置された仮想スピーカ300および仮想リスナVLの位置関係に基づいて、仮想スピーカ300における音源の出力特性を決定する。
具体的には、再生装置1は、仮想リスナVLに対して仮想スピーカ300が存在する方向や、仮想リスナVLから仮想スピーカ300までの距離に基づいて、ユーザUが現実空間である音響空間SSで実際に音源を聞いているような出力特性を決定する。
つまり、再生装置1は、仮想リスナVLが4つの仮想スピーカ300の中央位置に配置された場合には、4つの仮想スピーカ300から仮想リスナVLへ向かって均等な音量(ゲイン)の音源が出力される出力特性を決定する。
また、図1Bに示すように、再生装置1は、仮想リスナVLが中央位置から紙面における左側に移動した場合には、例えば、紙面における左側の2つの仮想スピーカ300の音量を大きくし、紙面における右側の2つの仮想スピーカ300の音量を小さくする。つまり、仮想リスナVLが左側へ移動した場合には、仮想空間VSに配置されたステージ左側の演者の音が大きく聞こえ、ステージ右側の演者の音が小さく聞こえるような出力特性を決定する。なお、出力特性の決定処理の詳細については後述する。
つづいて、実施形態に係る再生方法では、決定した出力特性に基づいて、実空間RS(図1A参照)に配置された実スピーカ200を介して音源を再生する(ステップS3)。具体的には、再生装置1は、仮想スピーカ300と実スピーカ200との位置関係により実スピーカ200の実出力特性を決定し、決定した実出力特性に基づいて音源を再生する。つまり、再生装置1は、仮想スピーカ300における音源の出力特性となるように、実スピーカ200における音源の実出力特性にする。
これにより、実スピーカ200から再生される音源は、仮想スピーカ300における音源の出力特性となる。換言すれば、実スピーカ200から再生される音源により、ユーザUが現実空間である音響空間SSで実際に音源を聞いているような感覚にさせることができる。すなわち、実施形態に係る再生方法によれば、仮想空間VSにおける臨場感を高めることができる。
次に、図2を用いて、実施形態に係る再生システムの構成例について説明する。図2は、実施形態に係る再生システムSの構成例を示すブロック図である。
図2に示すように、再生システムSは、再生装置1と、収録装置100とを含み、これらはインターネット網などの通信ネットワークNを介して通信可能に接続される。
再生装置1は、実施形態に係る再生方法を実行する装置であり、上述したように、VRやAR等の3次元の仮想空間VSを表示可能な装置である。再生装置1は、例えば、図1Bに示すようなゴーグル型である。また、再生装置1は、例えば、スマートフォンや、タブレット型端末や、ノート型PCや、デスクトップPC等であってもよい。また、再生装置1で表示される仮想空間VSは、3次元に限らず2次元であってもよい。
収録装置100は、音源や映像を収録する装置であり、図2に示すように、音源となる音を録音するためのマイク110および映像を録画するためのカメラ120を備える。収録装置100は、マイク110で録音した音源に関する音源情報およびカメラ120で録画した映像に関する映像情報を再生装置1へ送信する。
なお、図2では、収録装置100から音源情報および映像情報を直接再生装置1へ送信する例を示したが、収録装置100は、音源情報および映像情報を不図示のクラウドサーバへ送信してもよい。かかる場合、再生装置1は、クラウドサーバで保存された音源情報および映像情報を取得することとしてもよい。
次に、図3を用いて、実施形態に係る再生装置1の構成例について説明する。図3は、実施形態に係る再生装置1の構成例を示す機能ブロック図である。なお、図3のブロック図では、本実施形態の特徴を説明するために必要な構成要素のみを機能ブロックで表しており、一般的な構成要素についての記載を省略している。
換言すれば、図3のブロック図に図示される各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。例えば、各機能ブロックの分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することが可能である。
図3に示すように、再生装置1は、通信部2と、制御部3と、記憶部4と、表示部5とを備える。また、再生装置1は、実スピーカ200に接続される。再生装置1と実スピーカ200とは、例えば、Bluetooth(登録商標)等の近距離無線通信により接続される。なお、再生装置1と実スピーカ200とは、有線接続されてもよい。
なお、図3では、再生装置1は、表示部5を備える構成(一体構成)としたが、表示部5が別体で構成されてもよい。また、再生装置1は、実スピーカ200が一体構成されてもよい。
通信部2は、通信ネットワークNに双方向通信可能に接続する通信インターフェイスであり、収録装置100との間で情報の送受信を行う。
制御部3は、取得部31と、受付部32と、決定部33と、再生部34とを備え、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスクドライブ、入出力ポートなどを有するコンピュータや各種の回路を含む。
コンピュータのCPUは、例えば、ROMに記憶されたプログラムを読み出して実行することによって、制御部3の取得部31、受付部32、決定部33および再生部34として機能する。
また、制御部3の取得部31、受付部32、決定部33および再生部34の少なくともいずれか一部または全部をASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等のハードウェアで構成することもできる。
また、記憶部4は、例えば、不揮発性メモリやデータフラッシュ、ハードディスクドライブといった記憶デバイスで構成される記憶部である。かかる記憶部4には、配置情報41および各種プログラムなどが記憶される。
配置情報41は、実スピーカ200の位置情報を含んだ情報である。例えば、実スピーカ200の位置情報は、ユーザUと実スピーカ200との相対位置の情報である。また、実スピーカ200の位置情報は、実空間RSにおける絶対位置を示す座標情報であってもよい。なお、実スピーカ200の位置情報は、ユーザUによって予め登録されてもよく、あるいは、再生装置1が不図示のカメラを備え、カメラの画像により実スピーカ200の位置情報を検出してもよい。
また、再生装置1および実スピーカ200が無線接続される場合には、通信信号の到来方向および信号強度に基づいて実スピーカ200の位置情報を検出してもよい。
表示部5は、仮想空間VSを表示可能なディスプレイである。
次に、制御部3の各機能(取得部31、受付部32、決定部33および再生部34)について説明する。
取得部31は、各種情報を取得する。取得部31は、例えば、収録装置100から音源に関する音源情報を取得する。音源は、音声や、楽器音、デジタル音等の任意の種類の音を含み得る。
また、取得部31は、音源情報と併せて、収録装置100で収録された映像に関する映像情報を取得する。なお、取得部31は、音源情報および映像情報を別々に取得してもよく、音声付動画のような、音源情報および映像情報が一体となった情報を取得してもよい。
また、取得部31は、実空間RSにおける実スピーカ200の位置情報を取得する。実スピーカ200の位置は、ユーザUに対する相対位置(相対方向および相対距離)として表現される。実スピーカ200の位置は、ユーザUによって入力(指定)されてもよく、再生装置1が不図示のカメラを備え、カメラの画像により認識した実スピーカ200の位置として取得されてもよい。
また、取得部31は、現実空間である音響空間SSで音源が録音された場合、かかる音響空間SSにおける音響特性に関する音響情報を取得する。音響情報は、例えば、音響空間SSに存在する反射物(例えば、壁等)における音の反射特性に関する反射特性情報を含む。
例えば、取得部31は、映像情報等の反射物を撮像した撮像画像に基づいて、反射物の材質を推定し、推定した材質に応じた反射特性情報を取得(推定)する。反射特性情報は、例えば、音の反射率等の情報である。なお、反射率は、音全体の反射率であってもよく、音源の周波数帯毎の反射率であってもよい。
また、音響情報は、現実空間である音響空間SSに存在する人に関する情報(人数や存在する位置の情報)を含む。これは、人が多い程、音源が反射しづらくなる等のように、音響空間SSに存在する人の数に応じて音響特性が変化するためである。なお、仮想空間VSに他のユーザがアバターとして存在する場合には、音源情報には、アバターに関する情報(アバターの数や存在する位置の情報)が含まれてもよい。
受付部32は、ユーザUから各種情報を受け付ける。例えば、受付部32は、仮想空間VSにおける仮想リスナVLを起点とした傾聴方向の指定を受け付ける。なお、傾聴方向の詳細については、図4で後述する。
また、受付部32は、仮想リスナVLの位置変更を受け付ける。また、受付部32は、音源および映像の再生指示を受け付ける。
決定部33は、仮想空間VSに配置された仮想スピーカ300と、仮想空間VSに配置された仮想リスナVLとの位置関係に基づいて、仮想スピーカ300における音源の出力特性を決定する。
具体的には、決定部33は、まず、仮想空間VSに仮想スピーカ300および仮想リスナVLを配置する。仮想スピーカ300は、予め定められた位置に配置されてもよく、ユーザUによって指定された位置に配置されてもよい。また、決定部33は、取得部31が取得した映像情報から、音の発信元(演者や、聴衆等)を認識し、かかる発信元に対応する位置に仮想スピーカ300を配置してもよい。あるいは、決定部33は、収録装置100(図1A参照)の位置に対応した位置を仮想スピーカ300の位置としてもよい。
また、仮想リスナVLは、ユーザUが仮想空間VSに入室後(ログイン後)、所定の初期位置に配置され、初期位置に配置された後は、ユーザUの移動操作(マウスやキーボード操作等)によって仮想空間VSを移動可能となる。
仮想リスナVLの初期位置は、予め定めれた位置であってもよく、ユーザUによって任意の位置が選択されてもよい。また、仮想空間VSに複数の仮想リスナVLが入室可能(複数のユーザUがログイン可能)である場合には、例えば、入室順で予め定められた位置に順次配置されてもよい。具体的には、仮想空間VSがコンサート会場等のように座席が配置される場合、入室順で各座席位置に仮想リスナVLを配置したり、ユーザUが事前に指定(チケット購入)した座席位置に配置してもよい。
そして、決定部33は、仮想リスナVLの位置(初期位置または移動後の位置)と、仮想スピーカ300の位置との位置関係に基づいて、仮想スピーカ300における音源の出力特性を決定する。出力特性は、例えば、音源の周波数特性や、位相特性、ゲイン特性、指向特性等である。なお、仮想リスナVLの最終的な位置は、受付部32によって再生指示が受け付けられた際に配置されている位置である。
具体的には、決定部33は、コンサート会場等の現実空間における所定位置を仮想リスナVLの位置として、現実空間における所定位置で実際に聞こえる音源と同じ音源が仮想リスナVLの位置で聞こえるように仮想スピーカ300における音源の出力特性を決定する。
具体的には、決定部33は、仮想リスナVLに対して仮想スピーカ300が存在する方向や、仮想リスナVLから仮想スピーカ300までの距離に基づいて、ユーザUが現実空間である音響空間SSで実際に音源を聞いているような出力特性を決定する。
より具体的には、決定部33は、仮想スピーカ300から仮想リスナVLの方向を音の指向方向(指向特性)として決定し、仮想スピーカ300から仮想リスナVLまでの距離が遠くなるほど音量(ゲイン特性)を小さくするよう決定する。
例えば、決定部33は、音源がオーケストラである場合において、仮想リスナVLの位置が演者グループの左寄りに配置された場合には、演者グループの左側に配置された仮想スピーカ300の音量(ゲイン)を大きくし、右側に配置された仮想スピーカ300の音量(ゲイン)を小さくする。これにより、コンサート会場に参加していないユーザUが仮想空間VSにおいて、実際にコンサート会場にいるかのような音源を聞くことができる。つまり、臨場感を高めることができる。
また、決定部33は、コンサート会場において、前方で演者が演奏し、後方に聴衆が存在する場合において、仮想リスナVLの位置が後方よりであった場合には、前方に配置された仮想スピーカ300の音量を小さくし、後方の仮想スピーカ300の音量を大きくする。すなわち、仮想リスナVLの位置で聞こえる音源は、演者の音が小さく、聴衆の音(ざわつき音)が大きくなる。
また、決定部33は、取得部31によって音響空間SSの音響情報が取得された場合、かかる音響情報を加味して出力特性を決定する。具体的には、決定部33は、音響空間SSにおける壁等の反射物から仮想リスナVLまでの距離と、仮想スピーカ300から反射物までの距離と、反射物における音の反射率(反射特性情報)とに基づいて、仮想スピーカ300から出力される音が反射物で反射して仮想リスナVLに届く反響音を推定する。従って、仮想リスナVLの位置に応じて反射物等の位置や見かけの形状が異なるため、仮想リスナVLの位置により出力特性は変わることになる。そして、決定部33は、仮想スピーカ300から仮想リスナVLに直接届く音源に、推定した反響音を加えた音響音源となるような出力特性を決定する。
具体的には、決定部33は、音源の出力特性と、反響音の出力特性とを合わせることで、音響音源の出力特性を決定する。なお、反響音の出力特性は、音源の出力特性に対して、高周波数成分(減衰が大きい周波数成分)を減らしたり、位相を遅らせたり、ゲイン(音量)を小さくしたりした出力特性である。このように、決定部33は、音響情報を加味して出力特性を決定することで、後段の再生部34によって再生される音源に反響音成分を加えることができるため、音響空間SSで聞いているような音源をユーザUが聞くことができる。
また、決定部33は、音響情報に、現実空間である音響空間SSに存在する人に関する情報(人数や存在する位置の情報)や、仮想空間VSに存在する他のユーザのアバターに関する情報が含まれる場合、それら情報に基づいて音源の出力特性を決定してもよい。
具体的には、決定部33は、現実空間である音響空間SSに存在する聴衆が多い程、または、仮想空間VSに存在するアバターが多い程、音源の減衰量が多くなるように出力特性を決定する。
再生部34は、決定部33によって決定された出力特性に基づいて、実空間RSに配置された実スピーカ200を介して音源を再生する。具体的には、再生部34は、まず、実スピーカ200を仮想空間VSに設定する。
具体的には、再生部34は、ユーザUに対する実スピーカの相対位置と同じになるように、仮想リスナVLに対する実スピーカ200の相対位置を仮想空間VSに設定する。なお、仮想リスナVLが移動した場合には、実スピーカ200も同様に移動する。つまり、仮想リスナVLに対する実スピーカ200の相対位置が常に一定となるようにする。
そして、再生部34は、仮想スピーカ300と実スピーカ200との位置関係に基づいて、実スピーカ200から出力される音源の実出力特性を決定し、決定した実出力特性に基づいて音源を再生する。なお、実出力特性は、周波数特性、位相特性、ゲイン特性、指向特性等である。つまり、仮想スピーカ300からの出力音が仮想リスナVLに到達した時の到達音の特性と、実スピーカ200からの出力音が実リスナ(ユーザU)に到達した時の到達音の特性が同じになるように、音響伝達関数等を用いて音響信号処理を施す。
具体的には、再生部34は、決定部33で決定された出力特性となるように、実スピーカ200から出力される音源の出力特性を補正することで実出力特性を決定する。そして、再生部34は、実スピーカ200から決定した実出力特性の音源を再生する。このように、仮想スピーカ300と実スピーカ200との位置関係に基づいて、実スピーカ200
の実出力特性を決定することで、より臨場感の高い音源を再生することができる。
また、再生部34は、取得部31が取得した映像情報を音源とともに再生する。具体的には、再生部34は、VRデバイスである再生装置1を装着したユーザUの顔の向きを検出し、顔の向きに応じた視線方向(仮想リスナVLを視点とする視線方向)の映像を表示する。なお、視線方向は、ユーザUのボタン操作やジョイスティック等の操作部材による操作として受け付けてもよい。
なお、再生装置1は、音源を再生する場合に、仮想空間VSにおける特定方向(傾聴方向)からの音源をユーザUが聞けるようにしてもよい。かかる点について、図4を用いて説明する。図4は、傾聴方向の音源を強調再生する例を示す図である。
図4に示す例では、仮想リスナVLの視線方向VF(視線範囲)がステージ正面を向いているのに対して、受付部32によって受け付けた傾聴方向がステージ右方向である場合を例に示している。
かかる場合、再生装置1は、視線方向VFに基づくステージ全体を映像表示しつつ、ステージ右側の音源が大きくなるように音源を再生する。具体的には、決定部33は、受け付けた傾聴方向に対応する仮想スピーカ300のゲインを大きくし、傾聴方向から離れた仮想スピーカ300のゲインを小さく(あるいはゼロ)にする。これにより、ユーザUは、ステージ右側、すなわち、傾聴方向の音源を強調して聞くことができる。
なお、図4では、傾聴方向の音源を強調する場合を例に挙げたが、例えば、傾聴方向の音源のみを消去するようにしてもよい。
次に、図5を用いて、疑似的なサラウンドシステムを実現する例について説明する。図5は、疑似サラウンドの処理を示す図である。図5では、仮想空間VSに5つ(例えば、5.1ch)の仮想スピーカ300が配置され、実スピーカ200が4つである例を示している。つまり、再生装置1は、4つの実スピーカ200から出力する音源により、疑似的な5.1chのサラウンド音源を再生する。
具体的には、再生部34は、実スピーカ200から各仮想スピーカ300までの距離や方向(角度)により、実スピーカ200から出力される音源の減衰量や位相を補正することで、実出力特性を決定して音源を再生する。これにより、実スピーカ200と仮想スピーカ300とのチャンネル数が異なる(特に、仮想スピーカ300のチャンネル数の方が多い)場合であっても、仮想スピーカ300のチャンネル数に疑似的に合わせた音源を実スピーカ200から再生できるため、仮想空間VSにおける臨場感を高めることができる。
次に、図6を用いて、実施形態に係る再生装置1において実行される処理の手順について説明する。図6は、実施形態に係る再生装置1によって実行される処理の処理手順を示すフローチャートである。
図6に示すように、まず、取得部31は、例えば、収録装置100によって録音された音源に関する音源情報および収録装置100によって録画された映像情報を取得する(ステップS101)。
つづいて、取得部31は、音響空間SSにおける音響特性に関する音響情報を取得する(ステップS102)。例えば、取得部31は、収録装置100によって録画された映像情報に基づいて、音響空間SSを囲む壁における音の反射特性に関する反射特性情報を推定し、推定した反射特性情報を音響情報として取得する。
つづいて、取得部31は、仮想空間VSにおける仮想スピーカ300の位置情報を取得する(ステップS103)。
つづいて、取得部31は、仮想リスナVLの位置情報を取得する(ステップS104)。
つづいて、決定部33は、仮想スピーカ300と、仮想リスナVLとの位置関係に基づいて、仮想スピーカ300における音源の出力特性を決定する(ステップS105)。
つづいて、取得部31は、実スピーカ200の位置情報を取得する(ステップS106)。
つづいて、再生部34は、決定部33によって決定された出力特性に基づいて、実スピーカ200における音源の実出力特性を決定(補正)する(ステップS107)。
つづいて、再生部34は、決定した実出力特性に基づいて、実スピーカ200を介して音源を再生するとともに、表示部5を介して映像情報を表示し(ステップS108)、処理を終了する。
上述してきたように、実施形態に係る再生装置1は、取得部31と、決定部33と、再生部34とを備える。取得部31は、音源に関する音源情報を取得する。決定部33は、仮想空間VSに配置された仮想スピーカ300と、仮想空間VSに配置された仮想リスナVLとの位置関係に基づいて、仮想スピーカ300における音源の出力特性を決定する。再生部34は、決定部33によって決定された出力特性に基づいて、実空間RSに配置された実スピーカ200を介して音源を再生する。これにより、臨場感を高めることができる。
さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施形態に限定されるものではない。したがって、添付の特許請求の範囲およびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。
1 再生装置
2 通信部
3 制御部
4 記憶部
5 表示部
31 取得部
32 受付部
33 決定部
34 再生部
41 配置情報
100 収録装置
110 マイク
120 カメラ
200 実スピーカ
300 仮想スピーカ
N 通信ネットワーク
RL 実リスナ
RS 実空間
S 再生システム
SS 音響空間
U ユーザ
VF 視線方向
VL 仮想リスナ
VS 仮想空間

Claims (8)

  1. 音源に関する音源情報を取得する取得部と、
    仮想空間に配置された仮想スピーカと、前記仮想空間に配置された仮想リスナとの位置関係に基づいて、前記仮想スピーカにおける前記音源の出力特性を決定する決定部と、
    前記決定部によって決定された前記出力特性に基づいて、実空間に配置された実スピーカを介して前記音源を再生する再生部と
    を備えることを特徴とする再生装置。
  2. 前記音源は、所定の音響空間で録音された音源であって、
    前記取得部は、
    前記音響空間における音響特性に関する音響情報を取得し、
    前記決定部は、
    前記音響情報に基づいて、前記出力特性を決定すること
    を特徴とする請求項1に記載の再生装置。
  3. 前記音響情報は、
    前記音響空間に存在する反射物における音の反射特性に関する反射特性情報を含むこと
    を特徴とする請求項2に記載の再生装置。
  4. 前記取得部は、
    前記反射物を撮像した撮像画像に基づき推定した前記反射特性情報を取得すること
    を特徴とする請求項3に記載の再生装置。
  5. 前記仮想リスナを起点とした傾聴方向の指定を受け付ける受付部をさらに備え、
    前記決定部は、
    前記傾聴方向に基づいて、前記出力特性を決定すること
    を特徴とする請求項1~4のいずれか1つに記載の再生装置。
  6. 前記再生部は、
    前記仮想スピーカと前記実スピーカとの位置関係に基づいて、前記実スピーカから出力される前記音源の実出力特性を決定し、決定した前記実出力特性に基づいて前記音源を再生すること
    を特徴とする請求項1~5のいずれか1つに記載の再生装置。
  7. 請求項1~6のいずれか1つに記載の再生装置と、
    音源が流れる現実空間において収録した当該音源に関する音源情報を前記再生装置へ送信する収録装置と
    を備えることを特徴とする再生システム。
  8. 仮想空間に配置された仮想スピーカと、前記仮想空間に配置された仮想リスナとの位置関係に基づいて、前記仮想スピーカにおける音源の出力特性を決定し、決定した前記出力特性に基づいて、実空間に配置された実スピーカを介して前記音源を再生する工程
    を含むことを特徴とする再生方法。
JP2021043542A 2021-03-17 2021-03-17 再生装置、再生システムおよび再生方法 Pending JP2022143165A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021043542A JP2022143165A (ja) 2021-03-17 2021-03-17 再生装置、再生システムおよび再生方法
US17/478,244 US11711652B2 (en) 2021-03-17 2021-09-17 Reproduction device, reproduction system and reproduction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021043542A JP2022143165A (ja) 2021-03-17 2021-03-17 再生装置、再生システムおよび再生方法

Publications (1)

Publication Number Publication Date
JP2022143165A true JP2022143165A (ja) 2022-10-03

Family

ID=83285300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021043542A Pending JP2022143165A (ja) 2021-03-17 2021-03-17 再生装置、再生システムおよび再生方法

Country Status (2)

Country Link
US (1) US11711652B2 (ja)
JP (1) JP2022143165A (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11179635B2 (en) * 2017-10-11 2021-11-23 Sony Interactive Entertainment LLC Sound localization in an augmented reality view of a live event held in a real-world venue
JP7242448B2 (ja) 2019-07-03 2023-03-20 エヌ・ティ・ティ・コミュニケーションズ株式会社 仮想現実制御装置、仮想現実制御方法およびプログラム

Also Published As

Publication number Publication date
US11711652B2 (en) 2023-07-25
US20220303685A1 (en) 2022-09-22

Similar Documents

Publication Publication Date Title
CN109644314B (zh) 渲染声音程序的方法、音频回放系统和制造制品
US10206055B1 (en) Methods and systems for generating spatialized audio during a virtual experience
US20140328505A1 (en) Sound field adaptation based upon user tracking
KR101777639B1 (ko) 음향 재생을 위한 방법
KR101954849B1 (ko) 입체 음향 재생 방법 및 장치
US20150264502A1 (en) Audio Signal Processing Device, Position Information Acquisition Device, and Audio Signal Processing System
WO2014085006A1 (en) Image generation for collaborative sound systems
TW201246060A (en) Audio spatialization and environment simulation
CN109891503A (zh) 声学场景回放方法和装置
KR20160012204A (ko) 믹싱 데스크, 사운드 신호 생성기, 사운드 신호를 제공하기 위한 방법 및 컴퓨터 프로그램
Postma et al. The influence of visual distance on the room-acoustic experience of auralizations
TWI709131B (zh) 音訊場景處理技術
US20210076152A1 (en) Controlling rendering of a spatial audio scene
JP7536733B2 (ja) オーディオと関連してユーザカスタム型臨場感を実現するためのコンピュータシステムおよびその方法
KR102527336B1 (ko) 가상 공간에서 사용자의 이동에 따른 오디오 신호 재생 방법 및 장치
US20050047619A1 (en) Apparatus, method, and program for creating all-around acoustic field
WO2019193244A1 (en) An apparatus, a method and a computer program for controlling playback of spatial audio
US11711652B2 (en) Reproduction device, reproduction system and reproduction method
CN114816316A (zh) 音频回放的责任的指示
KR101111734B1 (ko) 복수 개의 음원을 구분하여 음향을 출력하는 방법 및 장치
KR20210004250A (ko) 오디오 신호 처리 방법 및 장치
US20230007421A1 (en) Live data distribution method, live data distribution system, and live data distribution apparatus
US20230005464A1 (en) Live data distribution method, live data distribution system, and live data distribution apparatus
WO2023085186A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2022128177A (ja) 音声生成装置、音声再生装置、音声再生方法、及び音声信号処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240827