JP7457893B2 - 制御装置、制御装置の処理方法、および、プログラム - Google Patents

制御装置、制御装置の処理方法、および、プログラム Download PDF

Info

Publication number
JP7457893B2
JP7457893B2 JP2022517626A JP2022517626A JP7457893B2 JP 7457893 B2 JP7457893 B2 JP 7457893B2 JP 2022517626 A JP2022517626 A JP 2022517626A JP 2022517626 A JP2022517626 A JP 2022517626A JP 7457893 B2 JP7457893 B2 JP 7457893B2
Authority
JP
Japan
Prior art keywords
speakers
cursor
control device
user
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022517626A
Other languages
English (en)
Other versions
JPWO2021220821A1 (ja
Inventor
宏正 大橋
直也 田中
亮 廣田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Publication of JPWO2021220821A1 publication Critical patent/JPWO2021220821A1/ja
Application granted granted Critical
Publication of JP7457893B2 publication Critical patent/JP7457893B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/08Cursor circuits
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/37Details of the operation on graphic patterns
    • G09G5/377Details of the operation on graphic patterns for mixing or overlaying two or more graphic patterns
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/74Projection arrangements for image reproduction, e.g. using eidophor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Description

本開示は、制御装置、制御装置の処理方法、および、プログラムに関する。
複数のスピーカにより立体音響を提示するシステムがある。立体音響とは、方向感を持った立体的な音像を視聴者に知覚させるための音響処理全般を指す概念である。
当該システムは、立体音響を提示しながら、ユーザをとりまく比較的広い範囲の映像を提示することで、ユーザに臨場感を感じさせることができる。
このようなシステムでは、空間内に配置された複数のスピーカの位置に基づいて、各スピーカに供給される駆動音源信号が決定される。また、複数のスピーカにより仮想的に構成される仮想スピーカが用いられることもある。
従来、複数の表示装置を用いるシステムにおいて、映像および音を効果的に出力する技術がある(特許文献1参照)。
特開2005-99064号公報
しかし、各スピーカが出力する音(つまり駆動音源信号)の決定に必要である、視聴位置から見た複数のスピーカの位置の情報を取得することが難しい。また、仮想スピーカを構成する場合に、仮想スピーカの位置の指定に必要である、視聴位置から見た仮想スピーカの位置の情報を取得することが難しい。視聴位置が変わると視聴位置から見た複数のスピーカの位置の情報も変わってしまうからである。ここで、視聴位置とは、ユーザが立体音響を視聴すると想定される位置である。このように、立体音響の提示に用いる複数のスピーカに関する位置の取得が難しいという問題がある。
そこで、本開示は、音響の提示に用いる複数のスピーカに関する位置の情報をより容易に取得する制御装置などを提供する。
本開示における制御装置は、空間内に配置される複数のスピーカによってユーザに提示する音響を制御する制御装置である。制御装置は、表示面に表示するための画像データを取得し、前記表示面の形状を示す形状情報を用いた変換処理を用いて、取得した前記画像データから表示用画像データを生成する生成部と、前記生成部が生成した前記表示用画像データを用いて、前記表示面に表示用画像を表示させる表示制御部と、表示された前記表示用画像にカーソルを重畳表示させ、前記カーソルを視認した前記ユーザから、前記表示用画像上での前記複数のスピーカに関する位置の指定を受ける受付部と、前記変換処理に係る変換前の前記画像データと変換後の前記表示用画像データとの対応関係を参照することで、前記ユーザによる前記位置の指定から前記空間内での前記カーソルの位置を算出し、算出した前記カーソルの位置を、前記複数のスピーカに関する位置として特定する特定部とを備える。
本開示の制御装置は、音響の提示に用いる複数のスピーカに関する位置の情報をより容易に取得することができる。
図1は、実施の形態に係る提示システムおよび制御装置を示す模式図である。 図2Aは、実施の形態に係る制御装置の機能構成を示すブロック図である。 図2Bは、実施の形態に係る制御装置の詳細な機能構成を示すブロック図である。 図3は、実施の形態に係る、マイクによる空間の音の取得を示す概念図である。 図4は、実施の形態に係る、スピーカにより出力する音の算出方法を示す概念図である。 図5は、実施の形態に係る制御装置による変換前の画像を示す概念図である。 図6は、実施の形態に係る制御装置による変換後の画像が表示された表示面を視聴位置から見た状態を示す概念図である。 図7は、実施の形態に係る制御装置によるカーソルの表示およびスピーカの位置の取得方法を示す模式図である。 図8は、実施の形態に係る制御装置により表示されるディレイ及びゲインの調整画像を示す模式図である。 図9は、実施の形態に係る制御装置が実行する処理方法を示すフロー図である。 図10は、実施の形態に係るカーソルの空間内での位置を算出する第一の方法を示す説明図である。 図11は、実施の形態に係るカーソルの空間内での位置を算出する第二の方法を示す説明図である。 図12は、実施の形態の変形例に係る仮想スピーカの説明図である。 図13は、実施の形態の変形例に係る制御装置による仮想スピーカの位置の取得方法を示す模式図である。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者らは、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
(実施の形態)
本実施の形態において、音響の提示に用いる複数のスピーカに関する位置の情報をより容易に取得する制御装置などについて説明する。具体的には、本実施の形態の制御装置は、音響の提示に用いる複数のスピーカの位置の情報をより容易に取得する制御装置である。なお、「位置の情報」を、単に「位置」ということもある。
図1は、本実施の形態に係る提示システム1および制御装置10を示す模式図である。
提示システム1は、空間内に音響を提示し、また、空間内(例えば、空間の壁面)に画像を表示させることにより、空間内にいるユーザに、立体音響および立体画像を視聴させるシステムである。
図1に示されるように、提示システム1は、制御装置10と、表示装置20と、複数のスピーカ31~38(複数のスピーカ31等ともいう)とを備える。なお、複数のスピーカ31等を制御装置10の構成に含めてもよい。
制御装置10は、表示装置20による画像の表示と、複数のスピーカ31等による音の出力とを制御する制御装置である。制御装置10は、表示装置20に表示させるための画像データを取得し、取得した画像データに適切な変換を施したうえで表示装置20により表示することで、ユーザに立体画像を提示する。また、制御装置10は、複数のスピーカ31等に供給される駆動音源信号を生成するために使用される入力音源信号を取得し、取得した入力音源信号に適切な変換を施したうえで複数のスピーカ31等に供給することで、ユーザに立体音響を提示する。
また、制御装置10は、複数のスピーカ31等の位置の情報を取得する。これらの処理については後で詳しく説明する。
制御装置10は、表示装置20と通信可能に接続されており、通信を介して表示装置20による画像の表示を制御する。また、制御装置10は、複数のスピーカ31等と接続されており、この接続を介して複数のスピーカ31等が出力すべき音の信号を伝達する。なお、制御装置10と表示装置20との間の接続、および、制御装置10と複数のスピーカ31等との間の接続は、有線であっても無線であってもよい。なお、図1では、制御装置10と複数のスピーカ31との間の接続については、制御装置10とスピーカ34との接続のみを図示し、他の接続の図示を省略している。
表示装置20は、表示面に画像を表示することで、ユーザに画像を視認させる表示装置である。表示装置20が表示する画像は、制御装置10から送られてくる画像データに基づく画像である。制御装置10から送られてくる画像データは、ユーザの周囲の光景としてユーザに認識されるように作成されたものである。ユーザは、自身の周囲に表示された画像を、現実にその方向に見ることによって、自身の周囲の光景として認識することができる。
表示装置20は、例えば、ユーザから見た全方位に亘る画像を表示させる。ユーザから見た全方位に画像が表示されているので、ユーザは、前方向だけでなく、見る方向を変えることで、左右方向、上方向などを含む全方向の画像を視認することができる。
ただし、表示装置20が表示する画像は、必ずしも、ユーザから見た全方位に亘るものでなくてもよい。言い換えれば、表示装置20が表示する画像は、例えば、ユーザから見た複数の方向に表示されるものであってもよく、具体的には、ユーザにとっての前方向および左右方向に表示されるものであってもよい。
表示装置20は、例えば、ユーザが存在する空間の壁面、つまり、ユーザを取り囲む壁面に画像を投影する投影装置(プロジェクタ)であり、この場合を例として説明する。この場合、表示装置20が複数あり、複数の表示装置20によって壁面に画像を投影してもよい。この場合、壁面が表示面に相当する。なお、他の例として、表示装置20は、ユーザを取り囲むように配置された複数の据置型のディスプレイ装置でもよい。この場合、ディスプレイが備える表示パネルが表示面に相当する。
複数のスピーカ31等は、ユーザを取り囲む複数の位置に配置されるスピーカ群である。例えば、スピーカ31は、ユーザが視聴すると想定される位置(視聴位置ともいう)から見て、前方かつ右上方向に配置されている。同様に、スピーカ32、33および34は、視聴位置から見て、それぞれ、前方かつ右下方向、前方かつ左下方向、および、前方かつ左上方向に配置されている。また、スピーカ35、36、37および38は、それぞれ、視聴位置から見て、それぞれ、後方かつ右上方向、後方かつ右下方向、後方かつ左下方向、および、後方かつ左上方向に配置されている。
複数のスピーカ31等が出力する音は、制御装置10から送られてくる駆動音源信号に基づく音である。制御装置10から送られてくる駆動音源信号は、受聴者が立体的な音像を知覚するように作成されたもの、言い換えると、さまざまな位置にある音源から出力されているとユーザに認識されるように作成されたものである。これにより、ユーザは、複数のスピーカ31等が現実に存在している位置から届く音だけでなく、全方位からユーザに届く音を聴取することができる。
ここで、視聴位置から見た複数のスピーカ31等の位置の情報(具体的には方位角及び仰角)を、計測などによって取得することは難しい。複数のスピーカ31等の位置の情報は、設計上定められていることもあるが、視聴位置が変わると視聴位置から見た複数のスピーカ31等の位置の情報も変わってしまうからである。また、スピーカ位置を物理的に変えた場合に方位角または仰角が変わってしまうこと、物理スピーカまたは仮想スピーカが大量にある場合には物理的な測定を行うことが煩雑であること、または、測定したスピーカ位置と視聴位置座標とから求められるXYZ方向それぞれの距離差分から方位角または仰角へ変換する計算が面倒であることも、視聴位置から見た複数のスピーカ31等の位置の情報を計測などによって取得することが難しい理由として存在する。
そこで、制御装置10により、複数のスピーカ31等の位置の情報をより容易に取得する方法を説明する。
以降において、制御装置10の機能について詳細に説明する。
図2Aは、本実施の形態に係る制御装置10の機能構成を示すブロック図である。図2Bは、本実施の形態に係る制御装置10の詳細な機能構成を示すブロック図である。図2Aおよび図2Bを参照しながら、本実施の形態に係る制御装置10の機能構成について説明する。
図2Aに示されるように、制御装置10は、映像入力部5と、音源入力部6と、記憶部11と、生成部12と、表示制御部13と、受付部14と、特定部15と、音制御部16とを備える。制御装置10が備える上記の機能部は、個別に説明する場合を除き、制御装置10が備えるCPU(Central Processing Unit)(不図示)がメモリを用いてプログラムを実行することで実現され得る。
映像入力部5は、表示面に表示するための画像データを取得する機能部である。映像入力部5が取得する画像データは、例えば、全方位画像を取得するカメラ(いわゆる全天球カメラ、又は、360度カメラ)で取得された全方位画像データである。映像入力部5は、取得した画像データを生成部12に提供する。なお、映像入力部5は、生成部12の一機能として実現されてもよい。
音源入力部6は、提示システム1によって出力すべき音響の音データを取得する機能部である。音源入力部6は、取得した音データを音制御部16に提供する。なお、音源入力部6は、音制御部16の一機能として実現されてもよい。
記憶部11は、表示面の形状を示す形状情報を記憶している記憶装置である。形状情報には、視聴位置を示す情報も含まれ得る。形状情報は、表示面の形状を示すジオメトリ情報を含み、具体的には、表示面を構成する面の位置、寸法又は角度を特定し得る情報を含む。
表示面は、例えば、ユーザがいる空間の壁面であり、形状情報は、壁面の形状を示す情報である。例えば、ユーザがいる空間が、図1に示される直方体の空間である場合には、直方体を構成する各面の位置、寸法又は角度を特定する情報を含む。記憶部11は、メモリまたはストレージである。
生成部12は、映像入力部5が取得した画像データに対して、形状情報を用いた変換処理を施して、表示用画像データを生成する機能部である。形状情報を用いた変換処理は、表示面に表示された画像をユーザが視聴位置から見た場合に、上記カメラから周囲を見たときと同じに見えるようにする変換処理であり、具体的には、形状情報を用いたジオメトリ変換を含む。
変換処理の結果、生成部12は、表示装置20に表示させるための表示用画像データを生成する。表示装置20が複数ある場合には、生成部12は、複数の表示装置20それぞれに表示させる表示用画像データを生成する。
表示制御部13は、生成部12が生成した表示用画像データを表示面に表示させる制御をする機能部である。表示制御部13は、生成部12が生成した表示用画像データを取得して、表示装置20に提供する。表示制御部13は、映像伝送用の規格に従って表示装置20と接続されており、この接続を通じて表示用画像データを表示装置20に伝送する。映像伝送用の規格は、例えば、HDMI(登録商標)(High-Definition Multimedia Interface)規格またはVGA(アナログRGB)規格である。
受付部14は、表示された表示用画像にカーソルを重畳表示させ、カーソルを視認したユーザから、表示用画像上での複数のスピーカ31等に関する位置の指定を受ける機能部である。受付部14は、マウスまたはタッチパネルなどのユーザインタフェース装置を介してユーザによる操作を受け付ける。そして、受付部14は、その操作に従って、表示面に表示されている表示用画像にカーソルを重畳して表示させる制御をする。上記制御は、表示制御部13に対する制御であってもよいし、生成部12に対する制御であってもよい。具体的には、受付部14は、表示制御部13に対する制御として、表示制御部13が取得した表示用画像データにカーソルを重畳させる処理を実行させる制御をしてもよい。また、受付部14は、生成部12に対する制御として、生成部12が取得した画像データ、又は、生成部12が変換処理を施した後の表示用画像データにカーソルを重畳させる処理を実行させる制御をしてもよい。
また、受付部14は、カーソルをある方向に移動させる操作をユーザから受け付けると、その操作に従って、操作された方向に対応する方向へ、表示面に重畳表示させているカーソルを移動させる制御をする。なお、カーソルの形状は、どのようなものであってもよく、例えば、円形、矩形、矢印形状、または、他の図形の形状であってもよい。
また、受付部14は、ユーザによる操作に基づいてカーソルが複数のスピーカ31等それぞれに重ねられたときのカーソルの位置を取得することによって、複数のスピーカ31等の位置の指定を受ける。具体的には、受付部14は、表示用画像上でのカーソルの位置を示す座標値(X,Y)の指定を受ける。
特定部15は、複数のスピーカ31等に関する空間内の位置を特定する機能部である。特定部15は、具体的には、変換処理に係る変換前の画像データと変換後の表示用画像データとの位置の対応関係を参照することで、ユーザにより指定された位置からカーソルの空間内での位置を算出し、算出した位置を、複数のスピーカ31等に関する空間内の位置として特定する。全方位画像における位置情報は、一例として、視聴位置からみた場合の方位角および仰角を含む。
特定部15は、受付部14がスピーカの位置の指定を受けた場合には、複数のスピーカ31等に関する空間内の位置として、複数のスピーカ31等の空間内の位置を算出する。
音制御部16は、複数のスピーカ31等による音の出力を制御する機能部である。音制御部16は、音源入力部6が取得した音データを、複数のスピーカ31等の空間内における位置情報を用いて加工することで、複数のスピーカ31等それぞれに供給される駆動音源信号を算出する。
音制御部16は、受付部14がスピーカの位置の指定を受けた場合には、特定部15が特定した複数のスピーカ31等の空間内の位置に基づいて、複数のスピーカ31等によってユーザに音響を提示する場合における、複数のスピーカ31等それぞれに供給される駆動音源信号を算出し、複数のスピーカ31等により出力させる制御をする。なお、音を出力させる、という表現は、出力すべき音の音量がゼロである場合も含む概念である。実際には音が出力されない場合でも、音量がゼロである音を出力していると考えられるからである。なお、音制御部16の上記の機能部分は、第一音制御部に相当する。
音制御部16の詳細な構成の例について図2Bを参照しながら説明する。
図2Bに示されるように、音制御部16は、フォーマット変換部161と、信号処理部162と、駆動音源生成部163とを備える。
フォーマット変換部161は、Aフォーマット信号(後述)からBフォーマット信号(後述)への変換処理を実行する機能部である。フォーマット変換部161は、音源入力部6から入力音源信号としてAフォーマット信号を得る。フォーマット変換部161が得る入力音源信号は、指向性マイク信号であってもよいし、無指向性マイク信号であってもよいし、点音源信号であってもよい。また、オフライン入力であってもよいし、リアルタイム入力であってもよい。
信号処理部162は、ズーム、回転処理などのBフォーマット領域上の信号処理を実行する機能部である。
駆動音源生成部163は、複数のスピーカ31等のうちの一のスピーカSiに供給する駆動音源信号を算出する機能部である。
以降において、複数のスピーカ31等それぞれに供給される駆動音源信号の生成と、複数のスピーカ31等による音の出力とについて説明する。
図3は、本実施の形態に係る、マイクMによる空間の音の取得を示す概念図である。図3に示されるマイクMは、複数の方向から到来する音を収音するアンビソニックマイク(360度マイク、サラウンドマイクとも呼ばれる)である。
マイクMは、具体的には、1次アンビソニックス信号を収録信号から生成する場合は前方かつ左上方向(FLU)、前方かつ右下方向(FRD)、後方かつ右上方向(BRU)、および、後方かつ左下方向(BLD)の4つの方向の音を収音する指向性マイク素子を備えたものであり、これらのマイク素子は、収音した音を示す入力音源信号を表現する。なお、マイクMが収音する方向の数は、4に限られず、2以上であればいくつであってもよい。この場合、その素子数に応じて2次以上のアンビソニックス信号を収録信号から生成することが可能である。また、指向性マイク素子の代わりに無指向性マイクを剛球上に配置したアレイマイクを用いることも可能である。
音制御部16は、マイクMによって収録された入力音源信号をあらかじめ取得している。この入力音源信号は、一般にAフォーマット信号とも呼ばれる。
図4は、本実施の形態に係る、スピーカに供給される駆動音源信号の算出方法を示す概念図である。スピーカに供給される駆動音源信号(図2B参照)は、音制御部16が、予め取得していたAフォーマット信号から変換された中間表現信号であるBフォーマット信号に基づいて、スピーカの位置の情報を用いて算出される。
Aフォーマット信号からBフォーマット信号への変換処理は周知技術によってなされる。この変換処理については、周知技術と同様であるので詳細な説明を省略する。Bフォーマット信号は、1次アンビソニックス信号の場合、W(無指向成分)、X(前後の広がり成分)、Y(左右の広がり成分)、およびZ(上下の広がり成分)の4個のデータで構成される。
次に、1次アンビソニックス信号を表すBフォーマット信号から、複数のスピーカ31等それぞれに供給される駆動音源信号を算出する処理の一例を説明する。
図1に示される複数のスピーカ31等のうちの一のスピーカSiに供給される駆動音源信号Oiは、以下の(式1)により算出される。
Oi=C・W
+cos(θi)・cos(φi)・X
+sin(θi)・cos(φi)・Y
+sin(φi)・Z (式1)
ここで、Cは、Wと、X、YおよびZとの比率を定める定数である。W、X、YおよびZは、Bフォーマット信号の各成分を示している。なお、W、X、YおよびZは、Bフォーマット信号の各成分から、座標軸の回転処理、又は、ズーム処理などのBフォーマット領域上の信号処理が施されたものであってもよい。また、θi及びφiは、それぞれ、図4に示されるように、視聴位置の前方を基準とした場合の方位角、および、仰角である。
つまり、スピーカSiに供給される駆動音源信号Oi(図2B参照)は、スピーカSiの方位角および仰角を用いて算出される。このようにして、音制御部16は、複数のスピーカ31等に供給される駆動音源信号を、当該スピーカの方位角および仰角を用いて算出する。
次に、生成部12が取得する画像データと、生成部12が行う変換処理とについて説明する。
図5は、本実施の形態に係る制御装置10による変換前の画像を示す概念図である。図6は、実施の形態に係る制御装置10による変換後の画像が表示された表示面を視聴位置から見た状態を示す概念図である。図5および図6を参照しながら、生成部12による画像の変換方法を説明する。
図5に示される画像は、生成部12が取得する全方位画像の一例であり、全方位画像をパノラマ展開して示したものである。図5において、横方向が方位角に対応しており、縦方向が仰角に対応している。この画像には、撮影位置の前後左右方向および上下方向が映っている。
図5に示される画像を生成部12が形状情報を用いてジオメトリ変換した画像データを生成し、表示面に投影した様子を視聴位置から見ると、図6に示されるように見える。
図6には、空間の天井面、側面および床面が示されており、破線Bは、空間の壁面の境界を示している。例えば、破線Bは、例えば、天井面と側面との境界、側面同士の境界、および、床面と側面との境界である。
また、図6には、天井面、側面および床面に表示される画像も示されている。天井面、側面および床面に表示される画像は、視聴位置から見た場合に歪がないように表示制御部13による変換処理が施されたものである。なお、このように視聴位置から見て歪みがなくなるのは理想的な場合であり、実際には、視聴位置からの位置ずれ、ジオメトリ情報の誤差、変換誤差などにより、若干の歪みが生じることもある。
図7は、本実施の形態に係る制御装置10によるカーソルの表示およびスピーカの位置の取得方法を示す模式図である。なお、図7において、後方のスピーカ35、36、37および38の図示を省略している。また、図7は、表示装置20が表示用画像を表示している状態を示しているが、表示されている表示用画像の図示は省略されている。
図7に示されるように、受付部14は、表示制御部13による制御により、表示面にカーソル51を重畳表示させる。カーソル51は、表示用画像に重畳表示されている。
受付部14は、ユーザによる操作を受け付けると、受け付けた操作に対応して、表示されているカーソルの位置を移動させる。例えば、ユーザがマウスを下方向に移動させる操作を受け付けると、受付部14は、表示制御部13による制御を介して、表示用画像に重畳表示されたカーソル51を下方向へ移動させる。
ユーザは、カーソルの位置を視認しながら移動させる操作を受付部14に行い、カーソル51をスピーカ32に重ねる。そして、カーソル51をスピーカ32に重ねた状態で、現在のカーソル51の位置を選択する操作(選択操作ともいう)を受付部14に行う。
受付部14は、選択操作がなされたときのカーソル51の表示用画像上での位置(具体的には座標値(X,Y))を取得する。特定部15は、変換処理に係る変換前の画像データと変換後の表示用画像データとの位置の対応関係を参照することで、カーソル51の空間内での位置(具体的には方位角および仰角)を、複数のスピーカ31等の位置であると特定する。このようにして、特定部15は、複数のスピーカ31等の位置(具体的には方位角θ及び仰角φ)を特定する。
なお、制御装置10は、上記と同様にして、複数のスピーカ31等のディレイまたはゲインを含む音響パラメータを設定することもできる。音響パラメータは、スピーカの駆動信号の調整に必要となるパラメータであり、ディレイまたはゲインのほかに、イコライザ、ミュートまたはソロ等も含まれ得る。この場合、受付部14は、複数のスピーカ31等のうちの一のスピーカである対象スピーカの音響パラメータの指定を受けるための調整画像を、表示制御部13により表示用画像に重畳表示させ、調整画像を視認したユーザから、対象スピーカの音響パラメータの指定を受ける。そして、音制御部16は、特定した対象スピーカに供給される駆動音源信号に対して、上記指定にかかる音響パラメータを適用してから駆動音源信号を出力する制御をする。
対象スピーカの音響パラメータの指定を受けるための調整画像の一例は、例えば、図7に示されるディレイまたはゲインの指定を受けるための調整画像52である。
図8は、本実施の形態に係る制御装置10により表示されるディレイ及びゲインの調整画像52を示す模式図である。
図8に示されるように、調整画像52は、ディレイを調整するための画像61と、ゲインを調整するための画像62とを含む。例えば、ユーザによる操作に基づいて画像61内のバーを上方向に操作すると、ディレイが増加し、画像61内のバーを下方向に操作すると、ディレイが減少する。同様に、ユーザによる操作に基づいて画像62内のバーを上方向に操作すると、ゲインが増加し、画像62内のバーを下方向に操作すると、ゲインが減少する。なお、調整画像52は、画像61及び62のうちのいずれか一方のみを含むものであってもよい。
ユーザは、画像61、62を視認しながらディレイとゲインとを調整することができ、ディレイとゲインとの調整結果が、音制御部16が出力する音に適用される。
なお、音響パラメータとしてイコライザを調整する場合には、イコライザ調整パネルの画像63が用いられ得る。例えば、画像63が操作されると、周波数特性を変更するパネルを示す画像が表示される。周波数特性を変更するパネルとしてはグラフィックイコライザのようにあらかじめ決められたバンドごとのゲインを調整するものであってもよいし、またバイクアッドフィルタの各種パラメータ(フィルタ種別、中心周波数、Q値、ゲインなど)を調整するパラメトリックイコライザであってもよい。
また、音響パラメータとしてミュートまたはソロを調整する場合には、ミュートスイッチの画像64、または、ソロスイッチの画像65が用いられ得る。例えば、ミュートスイッチの画像64、または、ソロスイッチの画像65が操作されると、ミュートまたはソロのON/OFFが切り換えられる。
以上のように構成された制御装置10の処理を説明する。
図9は、本実施の形態に係る制御装置10が実行する処理方法を示すフロー図である。この処理方法は、空間内に配置される複数のスピーカ31等によってユーザに提示する音響を制御する制御装置10の処理方法である。
図9に示されるように、ステップS101(生成ステップ)において、表示面に表示するための画像データを取得し、表示面の形状を示す形状情報を用いた変換処理を用いて、取得した画像データから表示用画像データを生成する。
ステップS102(表示制御ステップ)において、生成ステップで生成した表示用画像データを用いて、表示面に表示用画像を表示させる制御をする。
ステップS103(受付ステップ)において、表示された表示用画像にカーソルを重畳表示させ、カーソルを視認したユーザから、表示用画像上での複数のスピーカ31等に関する位置の指定を受ける。
ステップS104(特定ステップ)において、変換処理に係る変換前の画像と変換後の画像との位置の対応関係を参照することで、ユーザにより指定された位置からカーソルの空間内での位置を算出し、算出した位置を、複数のスピーカ31等に関する空間内の位置として特定する。
これにより、制御装置10は、音響の提示に用いる複数のスピーカ31等に関する位置の情報をより容易に取得することができる。
なお、特定部15が変換処理に係る変換前の画像データと変換後の表示用画像データとの位置の対応関係を参照することでユーザにより指定された位置からカーソルの空間内での位置を算出する処理の第一例は、生成部12が実行する変換処理の逆変換にかかる逆変換処理を用いてユーザにより指定された位置からカーソルの空間内での位置を算出する処理である。逆変換処理は、表示用画像データを、形状情報を用いたジオメトリ変換によって、全方位画像データに変換する処理に相当する。この逆変換処理を用いれば、ユーザにより指定された、表示用画像上の位置を示す情報が、全方位画像における位置に変換される。
また、特定部15が変換処理に係る変換前の画像データと変換後の表示用画像データとの位置の対応関係を参照することでユーザにより指定された位置からカーソルの空間内での位置を算出する処理の第二例は、カーソルがスピーカ31等に重ねられたときに、全方位画像におけるカーソルの位置を示す方位角および仰角を取得する処理である。上記逆変換処理が可能である場合には、上記第一例および第二例の両方が利用され得るが、上記逆変換処理が不可能または定義されない場合には、第二例の方法が有効である。第二例の方法について図10を参照しながら説明する。
図10及び図11は、本実施の形態に係るカーソルの空間内での位置を算出する方法を示す説明図である。図10の(a)は、全方位画像を示しており、横軸が方位角を示し、縦軸が仰角を示している。また、カーソル66が表示されている。
図10の(b)は、全方位画像を表示面に表示した状態を示している。カーソル66に対応する表示面上の位置にカーソル66Aが表示されている。
ユーザは、図10の(b)に示される光景を見て、カーソル66Aをスピーカ67に重ねるように操作する。特定部15は、カーソル66Aがスピーカ67に重なっているとき(図10の(b)参照)のカーソル66の位置の方位角および仰角を取得することで、カーソルの空間内での位置を取得する(図10の(a)参照)。
なお、図10の(b)では、カーソル66Aが、ジオメトリ変換により変形されている。具体的には、図10の(a)においてほぼ真円として表現されているカーソル66は、図10の(b)において楕円として表現されている。このようにカーソルの画像が変形されるのを回避するために、カーソル66、66Aの代わりに、全方位画像上での水平線68Aおよび垂直線68Bの交点により位置を指定することもできる(図11の(a)および(b)参照)。このとき、水平線68Aに対応する線は、表示面に線68Cとして表示されており、垂直線68Bに対応する線は、表示面に線68Dとして表示されている。ユーザは、線68Cと線68Dとの交点を用いて位置をしていすることができる。このようにすれば、図10の(b)のように、カーソルの画像が変形されることを回避できる。
(実施の形態の変形例)
本変形例において、音響の提示に用いる複数のスピーカに関する位置の情報をより容易に取得する制御装置などについて説明する。具体的には、本実施の形態の制御装置は、配置されている複数のスピーカによって構成される仮想スピーカの位置をより容易に取得する制御装置である。
なお、本変形例では、実在するスピーカ、つまり、上記実施の形態で単にスピーカと呼んでいたものを物理スピーカといい、物理スピーカによって仮想的に構成されるスピーカを仮想スピーカという。
図12は、物理スピーカによって仮想的に構成される仮想スピーカの説明図である。仮想スピーカの構成の方法の一例として、VBAP(Vector Base Amplitude Panning)を採用し得る。
図12において、ユーザUの周囲に物理スピーカS1、S2、S3が存在している。このとき、物理スピーカS1、S2、S3それぞれのゲインを適切に調整することで、物理スピーカS1、S2、S3によって仮想スピーカVを仮想的に構成することができる。このとき、ユーザUは、仮想スピーカVの位置に音源があると認識し、つまり、仮想スピーカVを仮想音源として認識する。
より具体的には、仮想スピーカVの視聴位置からの方向ベクトルPは、物理スピーカS1、S2、S3それぞれの視聴位置からの方向ベクトルL1、L2、L3、ならびに、ゲインg1、g2、g3を用いて以下の(式2)のように表現される。
P=g1・L1+g2・L2+g3・L3 (式2)
これにより、ゲインg1、g2、g3がそれぞれ適切に設定された物理スピーカS1、S2、S3により、物理スピーカS1、S2、S3が形成する凸包内の任意の位置に仮想スピーカVが仮想的に構成される。なお、仮想スピーカが音を出力するときに、物理スピーカS1、S2、S3も音を出力することができる。この場合、物理スピーカS1、S2、S3それぞれは、当該スピーカが出力すべき音と仮想スピーカに寄与する音とを合成した音を出力する。
このように、仮想スピーカVの構成には、仮想スピーカVの視聴位置からの方向ベクトルP、つまり、仮想スピーカの方位角および仰角が必要である。しかしながら、仮想スピーカの方位角および仰角は、例えばユーザが角度を指定するなどして設定することが難しい。
そこで、制御装置10により、仮想スピーカの位置をより容易に取得する方法を説明する。
本変形例に係る制御装置の構成は、原則、実施の形態に係る制御装置10と同様である。以降では、実施の形態に係る制御装置10における機能と異なる部分を主に説明する。
受付部14は、ユーザによる操作に基づいてカーソルが、複数のスピーカ31等によって仮想的に構成される1以上の仮想スピーカそれぞれの位置に重ねられたときのカーソルの位置を取得することによって、1以上の仮想スピーカの位置の指定を受ける。
特定部15は、受付部14が受けた1以上の仮想スピーカの表示用画像上での位置の指定に基づいて、1以上の仮想スピーカの空間内での位置を算出する。また、特定部15は、複数のスピーカ31等に関する空間内の位置として、1以上の仮想スピーカの位置を特定する。
音制御部16は、特定部15が特定した1以上の仮想スピーカの空間内の位置に基づいて、複数のスピーカ31等および1以上の仮想スピーカによってユーザに音響を提示する場合における、複数のスピーカ31等それぞれに供給される駆動音源信号を算出し、複数のスピーカ31等により出力させる制御をする。なお、音制御部16の上記の機能部分は、第二音制御部に相当する。
図13を参照しながら具体的に説明する。
図13は、本実施の形態に係る制御装置10による仮想スピーカの位置の取得方法を示す模式図である。なお、図13において、後方のスピーカ35、36、37、38の図示は、図7と同様に省略している。
図13に示されるように、受付部14は、表示制御部13による制御により、表示面に表示された表示用画像にカーソル71を重畳表示させる。カーソル71の形状は、どのようなものであってもよいが、例えば、スピーカを模した形状を有する。スピーカを模した形状を有するカーソル71を用いると、ユーザが、仮想スピーカの位置の指定をしていることを直感的に認識できるメリットがある。
受付部14は、ユーザによる操作を受け付けると、受け付けた操作に対応して、表示されているカーソルの位置を移動させる。
ユーザは、カーソル71の位置を視認しながら移動させる操作を受付部14に行い、仮想スピーカを配置したい位置にカーソル71に重ね、現在のカーソルの位置を選択する操作(選択操作ともいう)を受付部14に行う。
受付部14は、選択操作がなされたときのカーソルの表示用画像上での位置を取得する。そして、受付部14は、取得した、カーソルの表示用画像上での位置に対して、変換処理に係る変換前の画像データと変換後の表示用画像データとの位置の対応関係を参照することで、カーソルの空間内での位置(具体的には方位角θおよび仰角φ)を、構成すべき仮想スピーカの位置であると特定する。このようにして、受付部14は、構成すべき仮想スピーカの位置つまり方位角及び仰角を特定する。
なお、制御装置10は、上記実施の形態と同様にして、仮想スピーカのディレイまたはゲインを含む音響パラメータを設定することもできる。この場合、音制御部16は、音響パラメータを設定した仮想スピーカが出力する音に対して、上記指定にかかる音響パラメータを適用したうえで音を出力する。このとき、音響パラメータの指定を受けるための調整画像として、図7に示される調整画像52が用いられ得る。
なお、制御装置10は、仮想スピーカを構成する物理スピーカの指定を受けることもできる。その場合、受付部14は、ユーザによる操作に基づいて、複数のスピーカ31等のうち、1以上の仮想スピーカに含まれる一の仮想スピーカを仮想的に構成する複数のスピーカである複数の指定スピーカそれぞれの位置に、カーソルが重ねられたときのカーソルの位置を取得することによって、複数の指定スピーカの位置の指定を受ける。音制御部16は、受付部14が指定を受けた複数の指定スピーカを用いて1以上の仮想スピーカを仮想的に構成するように、複数のスピーカ31等に供給される駆動音源信号を算出し、算出した駆動音源信号を出力させる。なお、すでに物理スピーカの位置が算出されている場合には、受付部14は、算出されている物理スピーカの位置を示す情報を読み出すことで、複数の指定スピーカの位置の指定を受けることもできる。
これにより、制御装置は、音響の提示に用いる仮想スピーカの位置の情報に加えて、仮想スピーカを構成する物理スピーカの指定を、より容易に受けることができる。
以上のように、本実施の形態および本変形例の制御装置は、空間内に配置される複数のスピーカによってユーザに提示する音響を制御する制御装置である。制御装置は、表示面に表示するための画像データを取得し、表示面の形状を示す形状情報を用いた変換処理を用いて、取得した画像データから表示用画像データを生成する生成部と、生成部が生成した表示用画像データを用いて、表示面に表示用画像を表示させる表示制御部と、表示された表示用画像にカーソルを重畳表示させ、カーソルを視認したユーザから、表示用画像上での複数のスピーカに関する位置の指定を受ける受付部と、変換処理に係る変換前の画像データと変換後の表示用画像データとの対応関係を参照することで、ユーザによる位置の指定から空間内でのカーソルの位置を算出し、算出したカーソルの位置を、複数のスピーカに関する位置として特定する特定部とを備える。
これによれば、制御装置は、変換処理に係る変換前の画像データと変換後の表示用画像データとの位置の対応関係を参照することで、複数のスピーカに関する位置であって、空間内での位置(つまり、空間に対する位置)を取得できる。ここで、制御装置は、視聴位置にいるユーザが、自身から見て直感的に画像上で指定した位置を用いて、複数のスピーカの位置に関する情報(例えば、方位角および仰角)を取得するので、複数のスピーカの位置に関する情報(例えば方位角などを示す数値)の入力をユーザから直接に受ける必要がない。よって、制御装置は、音響の提示に用いる複数のスピーカに関する位置の情報を、より容易に取得することができる。
また、受付部は、位置の指定として、ユーザによる操作に基づいてカーソルが複数のスピーカそれぞれに重ねられたときのカーソルの位置を取得することによって、複数のスピーカの位置の指定を受け、特定部は、複数のスピーカに関する位置として、複数のスピーカの位置を特定し、制御装置は、さらに、特定部が特定した複数のスピーカの位置に基づいて、複数のスピーカによってユーザに音響を提示する場合における、複数のスピーカそれぞれに供給される駆動音源信号を算出し、複数のスピーカの出力を制御する第一音制御部を備えてもよい。
これによれば、制御装置は、ユーザに音響を提示するための複数のスピーカの位置を、ユーザが直感的に画像上で指定した位置を用いて取得する。取得した複数のスピーカの位置は、音響の提示の際に複数のスピーカに供給される駆動音源信号の算出に用いられる。よって、制御装置は、音響の提示に用いる複数のスピーカの位置の情報を、より容易に取得することができる。
また、受付部は、複数のスピーカのうち対象スピーカの音響パラメータの指定を受けるための調整画像を表示用画像に重畳表示させ、調整画像を視認したユーザから、対象スピーカの音響パラメータの指定を受け、第一音制御部は、対象スピーカに供給される駆動音源信号に対して、指定にかかる音響パラメータを適用してから、対象スピーカの出力を制御してもよい。
これによれば、制御装置は、対象スピーカの音響パラメータの指定を、表示面に表示された調整画像を視認したユーザから受けることができる。ここで、ユーザは、表示面に表示された調整画像上で直感的に指定した音響パラメータの指定値を用いて、対象スピーカの音響パラメータを指定するので、音響パラメータの指定値の入力をユーザから直接に受ける必要がない。よって、制御装置は、音響の提示に用いる複数のスピーカに関する位置の情報に加えて、複数のスピーカの音響パラメータを、より容易に取得することができる。
また、受付部は、位置の指定として、ユーザによる操作に基づいて、複数のスピーカによって仮想的に構成される1以上の仮想スピーカそれぞれの位置に、カーソルが重ねられたときのカーソルの位置を取得することによって、1以上の仮想スピーカの位置の指定を受け、特定部は、受付部が受けた1以上の仮想スピーカの位置の指定に基づいて、空間内での1以上の仮想スピーカの位置を算出し、複数のスピーカに関する位置として、1以上の仮想スピーカの位置を特定し、制御装置は、さらに、特定部が特定した1以上の仮想スピーカの位置に基づいて、複数のスピーカおよび1以上の仮想スピーカによってユーザに音響を提示する場合における、複数のスピーカそれぞれに供給される駆動音源信号を算出し、複数のスピーカの出力を制御する第二音制御部を備えてもよい。
これによれば、制御装置は、ユーザに音響を提示するための仮想スピーカの位置を、ユーザが直感的に画像上で指定した位置を用いて取得する。取得した仮想のスピーカの位置は、音響の提示の際に仮想スピーカに供給される駆動音源信号の算出に用いられる。よって、制御装置は、音響の提示に用いる仮想スピーカの位置の情報を、より容易に取得することができる。
また、受付部は、位置の指定として、ユーザによる操作に基づいて、複数のスピーカのうち、1以上の仮想スピーカに含まれる一の仮想スピーカを仮想的に構成する複数の指定スピーカそれぞれの位置に、カーソルが重ねられたときのカーソルの位置を取得することによって、複数の指定スピーカの位置の指定を受け、第二音制御部は、受付部が指定を受けた複数の指定スピーカを用いて1以上の仮想スピーカを仮想的に構成するように、複数のスピーカそれぞれに供給される駆動音源信号を算出してもよい。
これによれば、制御装置は、仮想スピーカを仮想的に構成する物理スピーカの指定を、表示面に表示されたカーソルを用いてユーザから受けることができる。ここで、ユーザは、表示面に表示されたカーソルを移動させて、上記物理スピーカを指定するので、上記物理スピーカを指定する情報を別途ユーザから受ける必要がない。よって、制御装置は、音響の提示に用いる仮想スピーカの位置の情報に加えて、仮想スピーカを構成する物理スピーカの指定を、より容易に受けることができる。
また、複数のスピーカに関する位置は、ユーザの視聴位置から見た場合の複数のスピーカの方位角および仰角を含んでもよい。
これによれば、制御装置は、視聴位置にいるユーザが、自身から見て直感的に画像上で指定した位置を用いて、複数のスピーカの位置に関する情報である方位角および仰角を取得するので、これらの情報の入力をユーザから直接に受ける必要がない。よって、制御装置は、音響の提示に用いる複数のスピーカに関する位置の情報を、より容易に取得することができる。
また、制御装置は、さらに、複数のスピーカを備えてもよい。
これによれば、制御装置は、音響の提示に用いる複数のスピーカに関する位置の情報を、より容易に取得することができ、さらに、複数のスピーカによって音響を提示することができる。
また、本開示における制御装置の処理方法は、空間内に配置される複数のスピーカによってユーザに提示する音響を制御する制御装置の処理方法であって、表示面に表示するための画像データを取得し、表示面の形状を示す形状情報を用いた変換処理を用いて、取得した画像データから表示用画像データを生成する生成ステップと、生成ステップで生成した表示用画像データを用いて、表示面に表示用画像を表示させる表示制御ステップと、表示された表示用画像にカーソルを重畳表示させ、カーソルを視認したユーザから、表示用画像上での複数のスピーカに関する位置の指定を受ける受付ステップと、変換処理に係る変換前の画像データと変換後の表示用画像データとの対応関係を参照することで、ユーザによる位置の指定から空間内でのカーソルの位置を算出し、算出したカーソルの位置を、複数のスピーカに関する位置として特定する特定ステップとを含む。
これによれば、上記制御装置と同様の効果を奏する。
また、本開示におけるプログラムは、上記の情報処理方法をコンピュータに実行させるためのプログラムである。
これによれば、上記制御装置と同様の効果を奏する。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記実装を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
本開示は、複数のスピーカによってユーザに提示する音響を制御する制御装置に適用可能である。
1 提示システム
10 制御装置
11 記憶部
12 生成部
13 表示制御部
14 受付部
15 特定部
16 音制御部
20 表示装置
31、32、33、34、35、36、37、38、67、S1、S2、S3、Si スピーカ
51、66、66A、71 カーソル
52 調整画像
61、62、63、64、65 画像
B 破線
M マイク
U ユーザ
V 仮想スピーカ

Claims (8)

  1. 空間内に配置される複数のスピーカによってユーザに提示する音響を制御する制御装置であって、
    表示面に表示するための画像データを取得し、前記表示面の形状を示す形状情報を用いた変換処理を用いて、取得した前記画像データから表示用画像データを生成する生成部と、前記生成部が生成した前記表示用画像データを用いて、前記表示面に表示用画像を表示させる表示制御部と、
    表示された前記表示用画像にカーソルを重畳表示させ、前記カーソルを視認した前記ユーザから、前記表示用画像上での前記複数のスピーカに関する位置の指定を受ける受付部と、
    前記変換処理に係る変換前の前記画像データと変換後の前記表示用画像データとの対応関係を参照することで、前記ユーザによる前記位置の指定から前記空間内での前記カーソルの位置を算出し、算出した前記カーソルの位置を、前記複数のスピーカに関する位置として特定する特定部とを備え、
    前記受付部は、前記位置の指定として、
    前記ユーザによる操作に基づいて前記カーソルが前記複数のスピーカそれぞれに重ねられたときの前記カーソルの位置を取得することによって、前記複数のスピーカの位置の指定を受け、
    前記特定部は、
    前記複数のスピーカに関する位置として、前記複数のスピーカの位置を特定し、
    前記制御装置は、さらに、
    前記特定部が特定した前記複数のスピーカの位置に基づいて、前記複数のスピーカによって前記ユーザに音響を提示する場合における、前記複数のスピーカそれぞれに供給される駆動音源信号を算出し、前記複数のスピーカの出力を制御する第一音制御部を備える、
    制御装置。
  2. 前記受付部は、前記複数のスピーカのうちの対象スピーカの音響パラメータの指定を受けるための調整画像を前記表示用画像に重畳表示させ、前記調整画像を視認したユーザから、前記対象スピーカの前記音響パラメータの指定を受け、
    前記第一音制御部は、前記対象スピーカに供給される前記駆動音源信号に対して、前記指
    定にかかる前記音響パラメータを適用してから、前記対象スピーカの出力を制御する、
    請求項1に記載の制御装置。
  3. 空間内に配置される複数のスピーカによってユーザに提示する音響を制御する制御装置であって、
    表示面に表示するための画像データを取得し、前記表示面の形状を示す形状情報を用いた変換処理を用いて、取得した前記画像データから表示用画像データを生成する生成部と、前記生成部が生成した前記表示用画像データを用いて、前記表示面に表示用画像を表示させる表示制御部と、
    表示された前記表示用画像にカーソルを重畳表示させ、前記カーソルを視認した前記ユーザから、前記表示用画像上での前記複数のスピーカに関する位置の指定を受ける受付部と、
    前記変換処理に係る変換前の前記画像データと変換後の前記表示用画像データとの対応関係を参照することで、前記ユーザによる前記位置の指定から前記空間内での前記カーソルの位置を算出し、算出した前記カーソルの位置を、前記複数のスピーカに関する位置として特定する特定部とを備え、
    前記受付部は、前記位置の指定として、前記ユーザによる操作に基づいて、前記複数のスピーカによって仮想的に構成される1以上の仮想スピーカそれぞれの位置に、前記カーソルが重ねられたときの前記カーソルの位置を取得することによって、前記1以上の仮想スピーカの位置の指定を受け、
    前記特定部は、
    前記受付部が受けた前記1以上の仮想スピーカの位置の指定に基づいて、前記空間内での前記1以上の仮想スピーカの位置を算出し、前記複数のスピーカに関する位置として、前記1以上の仮想スピーカの位置を特定し、
    前記制御装置は、さらに、
    前記特定部が特定した前記1以上の仮想スピーカの位置に基づいて、前記複数のスピーカおよび前記1以上の仮想スピーカによって前記ユーザに音響を提示する場合における、前記複数のスピーカそれぞれに供給される駆動音源信号を算出し、前記複数のスピーカの出力を制御する第二音制御部を備える、
    制御装置。
  4. 前記受付部は、前記位置の指定として、
    前記ユーザによる操作に基づいて、前記複数のスピーカのうち、前記1以上の仮想スピーカに含まれる一の仮想スピーカを仮想的に構成する複数の指定スピーカそれぞれの位置に、前記カーソルが重ねられたときの前記カーソルの位置を取得することによって、前記複数の指定スピーカの位置の指定を受け、
    前記第二音制御部は、
    前記受付部が指定を受けた前記複数の指定スピーカを用いて前記1以上の仮想スピーカを仮想的に構成するように、前記複数のスピーカそれぞれに供給される駆動音源信号を算出する、
    請求項に記載の制御装置。
  5. 前記複数のスピーカに関する位置は、前記ユーザの視聴位置から見た場合の前記複数のスピーカの方位角および仰角を含む、
    請求項1~のいずれか1項に記載の制御装置。
  6. さらに、前記複数のスピーカを備える、
    請求項1~のいずれか1項に記載の制御装置。
  7. 空間内に配置される複数のスピーカによってユーザに提示する音響を制御する制御装置
    の処理方法であって、
    表示面に表示するための画像データを取得し、前記表示面の形状を示す形状情報を用いた変換処理を用いて、取得した前記画像データから表示用画像データを生成する生成ステップと、
    前記生成ステップで生成した前記表示用画像データを用いて、前記表示面に表示用画像を表示させる表示制御ステップと、
    表示された前記表示用画像にカーソルを重畳表示させ、前記カーソルを視認した前記ユーザから、前記表示用画像上での前記複数のスピーカに関する位置の指定を受ける受付ステップと、
    前記変換処理に係る変換前の前記画像データと変換後の前記表示用画像データとのの対応関係を参照することで、前記ユーザによる前記位置の指定から前記空間内での前記カーソルの位置を算出し、算出した前記カーソルの位置を、前記複数のスピーカに関する位置として特定する特定ステップとを含み、
    前記受付ステップは、前記位置の指定として、
    前記ユーザによる操作に基づいて前記カーソルが前記複数のスピーカそれぞれに重ねられたときの前記カーソルの位置を取得することによって、前記複数のスピーカの位置の指定を受け、
    前記特定ステップは、
    前記複数のスピーカに関する位置として、前記複数のスピーカの位置を特定し、
    前記制御装置の処理方法は、さらに、
    前記特定ステップが特定した前記複数のスピーカの位置に基いて、前記複数のスピーカそれぞれに供給される駆動音源信号を算出し、前記複数のスピーカにより出力させる第一音制御ステップと、を含む、
    制御装置の処理方法。
  8. 請求項に記載の制御装置の処理方法をコンピュータに実行させるためのプログラム。
JP2022517626A 2020-04-28 2021-04-15 制御装置、制御装置の処理方法、および、プログラム Active JP7457893B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020078890 2020-04-28
JP2020078890 2020-04-28
PCT/JP2021/015526 WO2021220821A1 (ja) 2020-04-28 2021-04-15 制御装置、制御装置の処理方法、および、プログラム

Publications (2)

Publication Number Publication Date
JPWO2021220821A1 JPWO2021220821A1 (ja) 2021-11-04
JP7457893B2 true JP7457893B2 (ja) 2024-03-29

Family

ID=78332384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022517626A Active JP7457893B2 (ja) 2020-04-28 2021-04-15 制御装置、制御装置の処理方法、および、プログラム

Country Status (3)

Country Link
US (1) US20230037195A1 (ja)
JP (1) JP7457893B2 (ja)
WO (1) WO2021220821A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276102A (ja) 2007-05-07 2008-11-13 Ohira Giken:Kk 映像投影システム
WO2017110882A1 (ja) 2015-12-21 2017-06-29 シャープ株式会社 スピーカの配置位置提示装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276102A (ja) 2007-05-07 2008-11-13 Ohira Giken:Kk 映像投影システム
WO2017110882A1 (ja) 2015-12-21 2017-06-29 シャープ株式会社 スピーカの配置位置提示装置

Also Published As

Publication number Publication date
US20230037195A1 (en) 2023-02-02
JPWO2021220821A1 (ja) 2021-11-04
WO2021220821A1 (ja) 2021-11-04

Similar Documents

Publication Publication Date Title
US11082662B2 (en) Enhanced audiovisual multiuser communication
JP5611463B2 (ja) 携帯用通信装置および有向音声出力を使用する通信の円滑化
US11055057B2 (en) Apparatus and associated methods in the field of virtual reality
US8571192B2 (en) Method and apparatus for improved matching of auditory space to visual space in video teleconferencing applications using window-based displays
US20150189457A1 (en) Interactive positioning of perceived audio sources in a transformed reproduced sound field including modified reproductions of multiple sound fields
US10681276B2 (en) Virtual reality video processing to compensate for movement of a camera during capture
US20150189455A1 (en) Transformation of multiple sound fields to generate a transformed reproduced sound field including modified reproductions of the multiple sound fields
JP7271695B2 (ja) ハイブリッドスピーカ及びコンバータ
US11122384B2 (en) Devices and methods for binaural spatial processing and projection of audio signals
US20180150275A1 (en) Augmented Reality Mixing for Distributed Audio Capture
US10848890B2 (en) Binaural audio signal processing method and apparatus for determining rendering method according to position of listener and object
JP2022116221A (ja) 空間オーディオに関する方法、装置およびコンピュータプログラム
TW201507493A (zh) 聲音處理裝置及方法、以及程式
JP4498280B2 (ja) 再生位置を決定するための装置及び方法
US10887720B2 (en) Emphasis for audio spatialization
JP7457893B2 (ja) 制御装置、制御装置の処理方法、および、プログラム
JP7231412B2 (ja) 情報処理装置および情報処理方法
JP6431225B1 (ja) 音響処理装置、映像音響処理装置、映像音響配信サーバおよびそれらのプログラム
JP2018157314A (ja) 情報処理システム、情報処理方法及びプログラム
JP2020167471A (ja) 情報処理装置、情報処理方法、及びプログラム
US11706562B2 (en) Transducer steering and configuration systems and methods using a local positioning system
US20240089688A1 (en) Processing of audio data
JP5779140B2 (ja) 映像生成システム及び映像生成方法
WO2023164173A1 (en) Real-time sound field synthesis by modifying produced audio streams

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220830

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20221024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240219

R151 Written notification of patent or utility model registration

Ref document number: 7457893

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151