JP7226436B2 - 情報処理装置および方法、並びにプログラム - Google Patents
情報処理装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JP7226436B2 JP7226436B2 JP2020513201A JP2020513201A JP7226436B2 JP 7226436 B2 JP7226436 B2 JP 7226436B2 JP 2020513201 A JP2020513201 A JP 2020513201A JP 2020513201 A JP2020513201 A JP 2020513201A JP 7226436 B2 JP7226436 B2 JP 7226436B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- position information
- precision
- index
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 43
- 238000000034 method Methods 0.000 title claims description 32
- 238000013139 quantization Methods 0.000 claims description 134
- 238000004891 communication Methods 0.000 claims description 76
- 230000005540 biological transmission Effects 0.000 claims description 67
- 230000008569 process Effects 0.000 claims description 28
- 230000004044 response Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000003672 processing method Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 description 21
- 238000009877 rendering Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000008447 perception Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 101100522111 Oryza sativa subsp. japonica PHT1-11 gene Proteins 0.000 description 3
- 101100522114 Oryza sativa subsp. japonica PHT1-12 gene Proteins 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234318—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into objects, e.g. MPEG-4 objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44012—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving rendering scenes according to scene graphs, e.g. MPEG-4 scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Stereophonic System (AREA)
- Information Transfer Between Computers (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stored Programmes (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本技術は、情報処理装置および方法、並びにプログラムに関し、特に、情報の伝送量を削減しつつ配信側の処理負荷を低減させることができるようにした情報処理装置および方法、並びにプログラムに関する。
従来の固定視点向け3D Audioとして規格化されたMPEG(Moving Picture Experts Group)-H符号化規格は、受聴者の位置を原点とし、その周りの空間内をオーディオオブジェクトが移動するという考え方に基づいている(例えば、非特許文献1参照)。
そのため、固定視点では原点にいる受聴者から見た各々のオーディオオブジェクトの位置情報は、受聴者から各オーディオオブジェクトまでの水平方向の角度、高さ方向の角度、および距離を用いた極座標により記述されている。
このようなMPEG-H符号化規格を利用すれば、固定視点のコンテンツにおいて、空間内の各オーディオオブジェクトの位置に、それらのオーディオオブジェクトの音像を定位させることができ、臨場感の高いオーディオ再生を実現することが可能である。
ISO/IEC 23008-3 Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio
一方で、空間内の任意の位置を受聴者の位置とすることができる自由視点のコンテンツも知られている。自由視点では、空間内においてオーディオオブジェクトが移動することに加え、受聴者も移動可能である。つまり、受聴者が移動可能であるという点において、自由視点は固定視点と異なっている。
このような自由視点においても、固定視点における場合と同様に、受聴者から見たオーディオオブジェクトの位置を示す極座標の位置情報を得ることができれば、MPEG-Hで規格化された極座標系のレンダラによりオーディオ再生を実現することが可能である。すなわち、固定視点における場合と同様のレンダリング処理により自由視点のオーディオ再生を実現することができる。
この場合、例えば各オーディオオブジェクトのオーディオデータと、それらのオーディオオブジェクトの位置を示す位置情報とがサーバから再生側に提供される。そして、再生側において空間内のオーディオオブジェクトの位置に音像を定位させるオーディオ再生のためのレンダリングが行われる。
ところが、MPEG-Hのレンダラにより自由視点のオーディオ再生を実現しようとすると、オーディオオブジェクトや受聴者の位置が変化するたびに、受聴者から見たオーディオオブジェクトの位置の更新やオーディオオブジェクトの位置に関する情報の伝送が必要となる。したがって、情報の伝送量やサーバ等のコンテンツの配信側での処理負荷が増加してしまうおそれがある。さらにサーバに接続する受聴者の数が増えた場合には、その数の倍数分だけ処理負荷が増大することになり、その数が数千、数万となると過大な負荷となってしまう。
本技術は、このような状況に鑑みてなされたものであり、情報の伝送量を削減しつつ配信側の処理負荷を低減させることができるようにするものである。
本技術の第1の側面の情報処理装置は、ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得する取得部と、前記低精度位置情報および前記追加情報に基づいて前記位置情報を求める位置情報算出部とを備える。
本技術の第1の側面の情報処理方法またはプログラムは、ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得し、前記低精度位置情報および前記追加情報に基づいて前記位置情報を求めるステップを含む。
本技術の第1の側面においては、ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報が取得され、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報が取得され、前記低精度位置情報および前記追加情報に基づいて前記位置情報が求められる。
本技術の第2の側面の情報処理装置は、ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信する通信部を備える。
本技術の第2の側面の情報処理方法またはプログラムは、ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信するステップを含む。
本技術の第2の側面においては、ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報が送信され、前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報が送信される。
本技術の第1の側面および第2の側面によれば、情報の伝送量を削減しつつ配信側の処理負荷を低減させることができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。
以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈第1の実施の形態〉
〈コンテンツ再生システムの構成例〉
本技術は、受聴者からオブジェクトまでの距離に応じて、オブジェクトの位置を示す位置情報の量子化精度を切り替えることで、情報の伝送量を削減しつつサーバ等のコンテンツ配信側の処理負荷を低減させることができるようにするものである。
〈コンテンツ再生システムの構成例〉
本技術は、受聴者からオブジェクトまでの距離に応じて、オブジェクトの位置を示す位置情報の量子化精度を切り替えることで、情報の伝送量を削減しつつサーバ等のコンテンツ配信側の処理負荷を低減させることができるようにするものである。
なお、以下では、コンテンツの再生側において、受聴者から見たオーディオオブジェクトの位置を示す情報に基づいてオーディオオブジェクトのオーディオデータのレンダリングを行う場合、具体的にはMPEG-Hのレンダラにより自由視点のオーディオ再生を実現する場合を例として説明する。しかし、その他、受聴者から見たオブジェクトの位置を示す情報に基づいて、オブジェクトを被写体として含むコンテンツ映像を再生する場合などにおいても本技術を適用することが可能である。
なお、以下では、オーディオオブジェクトを単にオブジェクトと称することとする。
例えばMPEG-Hのレンダラにより自由視点のオーディオ再生を行う場合、図1に示すコンテンツ再生システムによりオーディオ再生を実現することが考えられる。
図1に示すコンテンツ再生システムは受聴者位置取得装置11、極座標位置情報エンコーダ12、サーバ13、クライアント14、およびMPEG-Hレンダラ15を有している。
このコンテンツ再生システムでは、コンテンツの制作者等であるサーバ側のユーザU11が、空間内の各オブジェクトについて、それらのオブジェクトの空間内の位置を示すオブジェクト位置情報を極座標位置情報エンコーダ12に入力する。なお、オブジェクト位置情報は、絶対座標とされてもよいし極座標とされてもよい。
また、クライアント14側には、再生されたコンテンツを視聴するユーザ、すなわちコンテンツの音声の受聴者U12がおり、その受聴者U12の空間内における位置を示す受聴者位置情報が受聴者位置取得装置11により取得される。
例えば受聴者位置取得装置11は、受聴者U12の空間内の位置を測定するGPS(Global Positioning System)やジャイロセンサなどの測距デバイス、バーチャル空間内の受聴者U12の仮想的な位置情報を取得する入力装置等からなり、受聴者U12の位置を示す受聴者位置情報を出力する。
ここで、受聴者位置情報は、空間内における受聴者U12の絶対的な位置を示す、3次元直交座標系、すなわちxyz座標系の座標(x座標、y座標、およびz座標)により表される絶対座標情報とされる。以下、xyz座標系の座標により表される、空間内の絶対的な位置を示す情報を絶対座標とも称することとする。
受聴者位置取得装置11により出力された受聴者位置情報は、クライアント14およびサーバ13を介して極座標位置情報エンコーダ12により受信される。
極座標位置情報エンコーダ12は、受聴者位置取得装置11から受信した受聴者位置情報と、ユーザU11により入力されたオブジェクト位置情報とに基づいて、空間内における受聴者U12から見たオブジェクトの位置を示す極座標を極座標位置情報として生成する。
そして、極座標位置情報エンコーダ12は、各オブジェクトについて得られた極座標位置情報を符号化(エンコード)し、符号化された極座標位置情報を、サーバ13を介してクライアント14に送信する。
クライアント14では、そのクライアント14に設けられた極座標位置情報デコーダ21により、極座標位置情報エンコーダ12から受信した極座標位置情報を復号(デコード)し、その結果得られた極座標位置情報をMPEG-Hレンダラ15へと供給する。
MPEG-Hレンダラ15は、クライアント14から各オブジェクトの極座標位置情報の供給を受けるとともに、サーバ13から各オブジェクトのオーディオデータの供給も受ける。このMPEG-Hレンダラ15は、MPEG-Hで規格化された極座標系のレンダラである。
MPEG-Hレンダラ15は、各オブジェクトのオーディオデータおよび極座標位置情報に基づいてレンダリングを行い、空間内の各位置にオブジェクトの音像が定位する再生オーディオデータを生成し、スピーカ等の再生系へと出力する。
例えば空間内にオブジェクトがN個ある場合、コンテンツ再生システムでの処理シーケンスは図2に示すようになる。
図2に示す例では、まずクライアント14は矢印A11に示すように、サーバ13に対して空間内にあるオブジェクトの個数、すなわちオブジェクト数の通知を要求する。
するとサーバ13は、クライアント14の要求に応じて、矢印A12に示すようにクライアント14に対してオブジェクト数を通知する。
また、クライアント14は、受聴者位置取得装置11から受聴者位置情報を取得すると、その受聴者位置情報を矢印A13に示すように、サーバ13を介して極座標位置情報エンコーダ12へと送信する。
極座標位置情報エンコーダ12は、受聴者位置情報を受信すると、その受聴者位置情報と、0番目のオブジェクトのオブジェクト位置情報とに基づいて、受聴者U12から見た0番目のオブジェクトの位置を算出し、その算出結果を示す極座標位置情報を符号化する。すなわち、極座標位置情報が伝送可能なフォーマットに符号化され符号化データとされる。
そして極座標位置情報エンコーダ12は、矢印A14に示すように、0番目のオブジェクトについて得られた、符号化された極座標位置情報、すなわち極座標位置情報の符号化データを、サーバ13を介してクライアント14へと送信する。
クライアント14側では、極座標位置情報デコーダ21によって、受信された0番目のオブジェクトの極座標位置情報の符号化データが復号される。
同様に、極座標位置情報エンコーダ12は、1番目のオブジェクトについて、極座標位置情報の符号化データを生成し、矢印A15に示すように、1番目のオブジェクトの極座標位置情報の符号化データを、サーバ13を介してクライアント14へと送信する。また、クライアント14側では、極座標位置情報デコーダ21が、受信された1番目のオブジェクトの極座標位置情報の符号化データを復号する。
そして、以降においてもN-1番目のオブジェクトまで、極座標位置情報の符号化データの生成および送信と、極座標位置情報の符号化データの復号が順番に行われる。
以上の処理により、0番目からN-1番目までのN個のオブジェクトについて極座標位置情報が得られると、その後、MPEG-Hレンダラ15により各オブジェクトの極座標位置情報とオブジェクトデータに基づいて、レンダリングが行われる。
レンダリング処理により得られた再生オーディオデータに基づいて音を再生すれば、受聴者U12から見て正しい位置にオブジェクトの音像を定位させることができる。
例えば自由視点のコンテンツを再生する場合、MPEG-Hレンダラ15によりレンダリングを行うには、そのMPEG-Hレンダラ15の入力として、受聴者U12から見たオブジェクトの位置を示す極座標表現の極座標位置情報が必要となる。
図1に示したコンテンツ再生システムでは、固定視点向けのMPEG-Hレンダラ15をそのまま自由視点でも使用することができる。また、極座標位置情報エンコーダ12によりリアルタイムで極座標位置情報が生成されて送信されるため、極座標位置情報をサーバ13上に保持しておく必要がないという利点がある。
しかし、自由視点では、空間内でオブジェクトが移動することに加え、受聴者U12も空間内を移動するので、オブジェクトと受聴者U12のどちらかが移動するたびに、極座標位置情報の更新と伝送が必要となる。
特に、図1に示したコンテンツ再生システムでは、受聴者U12が複数いる場合、すなわち複数のクライアント14がサーバ13に接続されている場合には、全ての受聴者U12について、全オブジェクトの極座標位置情報の更新(符号化)を実時間処理することになる。そうすると、コンテンツの配信側である極座標位置情報エンコーダ12の処理負荷が高くなってしまい、場合によってはクライアント14に対して、再生時刻までに必要なオブジェクトの極座標位置情報を供給することができなくなってしまう。
これに対して、サーバ13からクライアント14に対して、絶対座標により表現されたオブジェクトの空間内の位置を示すオブジェクト位置情報を供給し、クライアント14側において極座標位置情報を算出することも考えられる。
しかし、本来、絶対座標は受聴者U12の位置に依存しないものであるので、高い精度で表現しなければならず、オブジェクト位置情報をクライアント14に送信することは伝送量の観点から好ましいとはいえない。すなわち、極座標である極座標位置情報を伝送する場合と比較して、絶対座標であるオブジェクト位置情報を伝送する場合には、情報(オブジェクト位置情報)の伝送量が多くなってしまう。
そこで本技術では、一旦、クライアント側に情報量の少ない低精度のオブジェクトの位置を示す情報を送信しておき、オブジェクトの位置を示す十分な精度の情報が得られるように、低精度の情報とより高い精度の情報との差分の情報を、必要に応じて追加で送信するようにした。これにより、情報の伝送量を削減することができるだけでなく、極座標位置情報エンコーダやサーバといったコンテンツの配信側の処理負荷も低減させることができる。
このような本技術を適用したコンテンツ再生システムは、例えば図3に示すように構成される。なお、図3において図1における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
図3に示すコンテンツ再生システムは絶対座標位置情報エンコーダ51、サーバ52、受聴者位置取得装置53、クライアント54、およびMPEG-Hレンダラ55を有している。このコンテンツ再生システムでは、クライアント54において、受聴者U12から見たオブジェクトの位置を示す極座標表現の極座標位置情報が算出される。
すなわち、コンテンツの配信側ではユーザU11が空間内における各オブジェクトの位置を示す正規化位置情報などを絶対座標位置情報エンコーダ51に入力する。
この正規化位置情報は、3次元直交座標系、すなわちxyz座標系の座標により表される、空間内のオブジェクトの絶対的な位置を示す正規化された絶対座標情報である。
絶対座標位置情報エンコーダ51は、ユーザU11により入力された正規化位置情報等を符号化し、その結果得られた最高精度位置符号化データファイルをサーバ52へと送信する。また、サーバ52は記録部61を有する情報処理装置であり、絶対座標位置情報エンコーダ51から受信した最高精度位置符号化データファイルを記録部61に記録する。
ここで、最高精度位置符号化データファイルには、各オブジェクトについて、正規化位置情報を最も高い精度で量子化して得られた、すなわち小さい量子化ステップ幅で量子化して得られた最高精度量子化位置情報が含まれている。
以下、正規化位置情報から最高精度量子化位置情報を得るときの量子化精度を、最高精度とも称し、最高精度量子化位置情報により示される位置を最高精度絶対位置とも称することとする。
詳細は後述するが最高精度量子化位置情報の一部を抽出することで、最高精度よりも低い量子化精度で正規化位置情報を量子化して得られる量子化位置情報を得ることができる。
以下では、最高精度よりも低い量子化精度で正規化位置情報を量子化して得られる量子化位置情報を低精度量子化位置情報とも称することとし、特に低精度量子化位置情報のうち、最も低い量子化精度の低精度量子化位置情報を最低精度量子化位置情報とも称することとする。また、以下では、低精度量子化位置情報により示される位置を低精度絶対位置とも称し、最低精度量子化位置情報により示される位置を最低精度絶対位置とも称することとする。
さらに、以下では最高精度絶対位置や低精度絶対位置を特に区別する必要のない場合には、単にオブジェクトの絶対位置とも称し、最高精度量子化位置情報や低精度量子化位置情報を特に区別する必要のない場合には、単にオブジェクトの量子化位置情報とも称する。
低精度量子化位置情報は、最高精度量子化位置情報よりも低い精度でオブジェクトの位置を表す絶対座標の情報であるが、最高精度量子化位置情報よりも情報量、すなわちビット数が少ないため、情報の伝送量の削減を図ることができる。
また、クライアント54側では、図1に示した受聴者位置取得装置11に対応する受聴者位置取得装置53により、受聴者U12の位置を示す受聴者位置情報が取得され、クライアント54に供給される。この受聴者位置取得装置53は、例えばGPSやジャイロセンサなどの測距デバイス、バーチャル空間内の受聴者U12の仮想的な位置情報を取得する入力装置等から構成される。
クライアント54は、絶対座標位置情報デコーダ71および座標変換部72を有する情報処理装置であり、サーバ52から最低精度量子化位置情報を取得する。なお、以下ではクライアント54がサーバ52から最低精度量子化位置情報を取得する場合を例として説明を行う。しかし、最低精度量子化位置情報に限らず、最高精度よりも低い量子化精度であれば、どのような量子化精度の低精度量子化位置情報が取得されてもよい。
絶対座標位置情報デコーダ71は、サーバ52から取得された最低精度量子化位置情報を復号するとともに、受聴者位置情報に基づいて、最低精度量子化位置情報により示されるオブジェクトの位置が十分な精度のものであるかを判定する。
このとき、十分な精度のものでないと判定されたオブジェクトについて、クライアント54は、十分な精度の量子化位置情報を得るための追加ビット情報をサーバ52から取得する。追加ビット情報は、十分な精度の量子化位置情報と最低精度量子化位置情報との差分情報であり、追加ビット情報を最低精度量子化位置情報に付加することで、十分な精度の量子化位置情報を得ることができる。なお、場合によっては、十分な精度の量子化位置情報が最高精度量子化位置情報となることもある。
各オブジェクトについて十分な精度の量子化位置情報が得られると、座標変換部72は、それらの量子化位置情報を、空間内における受聴者U12から見た各オブジェクトの相対的な位置を示す極座標に変換し、極座標位置情報とする。
座標変換部72は、各オブジェクトの極座標位置情報をMPEG-Hレンダラ55に供給し、MPEG-Hレンダラ55は、供給された極座標位置情報と、サーバ52から取得した各オブジェクトのオーディオデータとに基づいてレンダリングを行う。
そして、MPEG-Hレンダラ55は、レンダリングにより得られた、空間内の各位置にオブジェクトの音像が定位する再生オーディオデータをスピーカ等の再生系へと出力し、音声を再生させる。なお、MPEG-Hレンダラ55は、図1のMPEG-Hレンダラ15と同様に、MPEG-Hで規格化された極座標系のレンダラである。
以上のようなコンテンツ再生システムでは、サーバ52とクライアント54との間で授受されるオブジェクトの位置を示す情報が、絶対座標である最低精度量子化位置情報とされている。したがって、空間内における受聴者U12の位置を考慮する必要はなく、移動するオブジェクトについてのみ最低精度量子化位置情報を符号化してクライアント54に伝送すればよいという利点がある。
〈サーバの構成例〉
次に、図3に示したサーバ52およびクライアント54のより詳細な構成例について説明する。まず、サーバ52の構成例について説明する。
次に、図3に示したサーバ52およびクライアント54のより詳細な構成例について説明する。まず、サーバ52の構成例について説明する。
サーバ52は、例えば図4に示すように構成される。なお、図4において図3における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
図4に示すサーバ52は、通信部101、制御部102、および記録部61を有している。
通信部101は、制御部102から供給された各種の情報をクライアント54に送信したり、絶対座標位置情報エンコーダ51やクライアント54から送信されてきた各種の情報を受信して制御部102に供給したりする。
制御部102は、サーバ52全体の動作を制御する。制御部102は通信制御部111および送信情報生成部112を有している。
通信制御部111は、通信部101を制御することで、通信部101による絶対座標位置情報エンコーダ51やクライアント54との通信を制御する。送信情報生成部112は、必要に応じて記録部61に記録されている最高精度位置符号化データファイル等の情報を用いて、クライアント54に送信する各種の情報を生成する。
〈クライアントの構成例〉
また、クライアント54は、例えば図5に示すように構成される。なお、図5において図3における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
また、クライアント54は、例えば図5に示すように構成される。なお、図5において図3における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
図5に示すクライアント54は、通信部141、制御部142、および出力部143を有している。
通信部141は、制御部142から供給された各種の情報をサーバ52に送信したり、サーバ52から送信されてきた各種の情報を受信して制御部142に供給したりする。
制御部142は、クライアント54全体の動作を制御する。制御部142は通信制御部151、絶対座標位置情報デコーダ71、および座標変換部72を有している。
通信制御部151は、通信部141を制御することで、通信部141によるサーバ52との通信を制御する。例えば通信制御部151は、通信部141を制御して、サーバ52から最低精度量子化位置情報や追加ビット情報を取得する取得部として機能する。
絶対座標位置情報デコーダ71は、最低精度量子化位置情報や追加ビット情報に基づいてオブジェクトの絶対的な位置を示す情報を算出することで、符号化された正規化位置情報の復号(デコード)を行う位置情報算出部として機能する。
出力部143は、座標変換部72による座標変換により得られた各オブジェクトの極座標位置情報をMPEG-Hレンダラ55に出力する。
〈正規化位置情報の符号化について〉
続いて、各オブジェクトの正規化位置情報の符号化(量子化)について説明する。
続いて、各オブジェクトの正規化位置情報の符号化(量子化)について説明する。
例えばコンテンツの対象となる空間、すなわちユーザである受聴者U12とオブジェクトが存在する空間が立方体形状の空間であるとし、ある時刻では図6に示すように空間内の中心の位置に受聴者U12がいたとする。なお、図6において図3における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
図6は、外側の四角形内部の領域R11が、受聴者U12やオブジェクトの存在する3次元空間をxyz座標系のz軸の正の方向から負の方向へ俯瞰した図となっており、その3次元空間の中心位置がxyz座標系の原点Oとなっている。また、ここでは原点Oの位置に受聴者U12がいる状態となっている。
また、領域R11により表される空間である立方体の一辺の半分の長さ、すなわち原点Oから立方体の端までの実際の長さを絶対距離absoluteDistanceとするものとする。ここで、絶対距離absoluteDistanceの長さの単位は、例えばメートル(m)などとされ、以下では、絶対距離absoluteDistanceを示す情報を絶対距離情報absoluteDistanceとも記すこととする。
人間の聴覚では水平方向については、正面のオブジェクトに対して左右の一定範囲内の角度であれば正面角度と同じ角度と認識されるという知見があり、この角度は知覚限界角度θと呼ばれている。なお、ここでは知覚限界角度θは例えば1.5度であるとする。
したがって、例えば直線L11と直線L12とのなす角度が知覚限界角度θであるとすると、点PT11と点PT12との間の任意の位置に音像を定位させた場合には、その音像位置がどこであっても原点Oにいる受聴者U12には同じ方向から音が聞こえているように知覚される。そのため、この場合には、点PT11と点PT12との間にあるオブジェクトについては、そのオブジェクトの正規化位置情報を、点PT11から点PT12までの距離を量子化ステップ幅として量子化し、そのときの量子化代表値を位置PtQを示す値とすれば、音像位置のずれを感じさせることなく量子化位置情報のビット数を削減することができる。
また、音の到来方向に対する受聴者U12の水平方向の許容誤差は角度情報である知覚限界角度θであることから、同じ左右0.75度以内でも受聴者U12とオブジェクトの距離が近い場合よりも遠い場合の方が、許容誤差の絶対幅は大きくなる。
本技術では人間の知覚限界角度θを利用することで、受聴者U12からオブジェクトまでの距離に応じて量子化位置情報の量子化精度、つまり量子化ステップ幅を変えることで本来の音像方向との知覚差を感じさせないまま情報の伝送量を抑えることができるようにした。
具体的には、絶対座標位置情報エンコーダ51には、ユーザU11によりオブジェクト数nObj、絶対距離情報absoluteDistance、最小距離情報、各オブジェクトの正規化位置情報、および知覚限界角度θが入力される。
ここで、オブジェクト数nObjは、空間内に存在するオブジェクトの個数である。なお、以下では、コンテンツの対象となる空間が立方体形状であり、その立方体の中心位置がxyz座標系の原点Oであるものとする。
最小距離情報は、受聴者U12からオブジェクトまでの距離としてとり得る最小距離MinDistを示す情報である。
最小距離MinDistの単位は、例えば絶対距離absoluteDistanceと同じメートル(m)などとされる。このような最小距離MinDistは、例えば受聴者U12の頭部の大きさが考慮されて、受聴者U12とオブジェクトとが重ならないように定められる。なお、最小距離MinDist=0として受聴者U12の位置にオブジェクトの音像を定位させることも勿論可能である。以下では、最小距離MinDistを示す最小距離情報を、最小距離情報MinDistとも記すこととする。
また、オブジェクトの正規化位置情報は、xyz座標系におけるオブジェクトの絶対的な位置を示すx座標、y座標、およびz座標であるPx(i)、Py(i)、およびPz(i)からなる情報であり、各座標におけるi(但し、0≦i<nObj)はオブジェクトを識別するインデックスである。
さらに、例えば知覚限界角度θは予め定められた角度、すなわち1.5度とされ、この知覚限界角度θはクライアント54側においても既知であるものとする。
ユーザU11により各情報が入力されると、絶対座標位置情報エンコーダ51は入力された各情報を必要に応じて符号化し、出力符号化情報として最高精度位置符号化データファイルを生成する。最高精度位置符号化データファイルには、例えばオブジェクト数nObj、絶対距離情報absoluteDistance、最高精度量子化位置情報、およびべき指数部インデックスexp_index_highが含まれている。
ここでは、例えばオブジェクト数nObjおよび絶対距離情報absoluteDistanceは非圧縮値とされる。また、最高精度量子化位置情報は、xyz座標系における最高精度絶対位置を示すx座標、y座標、およびz座標の各座標の仮数部であるQpx_high(i)、Qpy_high(i)、およびQpz_high(i)と、それらの各座標の正負の符号を示す符号ビット情報であるsign_x(i)、sign_y(i)、およびsign_z(i)とからなる情報である。
なお、これらの最高精度絶対位置の仮数部および符号ビット情報におけるi(但し、0≦i<nObj)はオブジェクトを識別するインデックスである。また、各符号ビット情報は非圧縮値とされ、符号ビット情報の値が0であれば座標が正の値であることを示しており、符号ビット情報の値が1であれば座標が負の値であることを示している。
べき指数部インデックスexp_index_highは、最小距離MinDistである場合、すなわち最も高い量子化精度とした場合における1/2べき指数値インデックス、つまり1/2べき指数部のインデックスである。例えば、べき指数部インデックスexp_index_highは圧縮値とされる。
具体的には、最小距離MinDistでのべき指数部インデックスexp_index_highは、最小距離MinDistに基づいて次式(1)を計算することにより求まるものである。
なお、式(1)においてINT()は引数の整数部を出力するINT関数を示している。
また、i番目のオブジェクトの最高精度量子化位置情報の仮数部Qpx_high(i)、Qpy_high(i)、およびQpz_high(i)は、正規化位置情報のx座標Px(i)、y座標Py(i)、およびz座標Pz(i)と、べき指数部インデックスexp_index_highと、知覚限界角度θとに基づいて次式(2)を計算することで得ることができる。
式(2)においてstep_highは、べき指数部インデックスexp_index_highに対応する量子化ステップ幅を示しており、次式(3)により求まるものである。式(3)ではsqrt()は平方根を表している。
なお、べき指数部インデックスexp_index_highの値を1ずつ小さくしていけば、各量子化精度に対応する低精度量子化位置情報のべき指数部インデックスexp_indexの値となり、べき指数部インデックスexp_indexの値が小さくなるほど量子化精度が低くなる。したがって、最低精度量子化位置情報のべき指数部インデックスexp_indexの値は0となる。
以下では、特に量子化精度を区別しない場合には、べき指数部インデックスexp_index_highも含めて、所定の量子化精度の1/2べき指数部のインデックスを、単にべき指数部インデックスexp_indexとも称することとする。
このように本技術では、最高精度の量子化ステップ幅が1/2のべき乗値、より詳細には1/2のべき乗値に、知覚限界角度θにより定まる定数である2tan(θ/2)/sqrt(3)を乗算したものとされている。このときの1/2のべき乗値の指数がべき指数部インデックスexp_index_highである。こうすることで、最高精度量子化位置情報の仮数部の一部を抽出するだけで、簡単に低精度量子化位置情報の仮数部を得ることができるようになっている。
また、絶対座標位置情報エンコーダ51では、正規化位置情報の符号ビットの符号化は、以下のようにして行われる。
すなわち、x座標Px(i)の値が0以上であればx座標の符号ビット情報sign_x(i)の値は0とされ、x座標Px(i)の値が0未満であればx座標の符号ビット情報sign_x(i)の値は1とされる。
同様にして、y座標Py(i)の値が0以上であればy座標の符号ビット情報sign_y(i)の値は0とされ、y座標Py(i)の値が0未満であればy座標の符号ビット情報sign_y(i)の値は1とされる。また、z座標Pz(i)の値が0以上であればz座標の符号ビット情報sign_z(i)の値は0とされ、z座標Pz(i)の値が0未満であればz座標の符号ビット情報sign_z(i)の値は1とされる。
一方で、クライアント54側では、最高精度量子化位置情報や低精度量子化位置情報の復号が以下のようにして行われる。
すなわち、復号時には予め既知である知覚限界角度θと、サーバ52から受信した絶対距離情報absoluteDistanceと、最終的に確定したべき指数部インデックスexp_index_selとに基づいて次式(4)の計算が行われ、量子化ステップ幅step_decが求められる。
べき指数部インデックスexp_index_selは、べき指数部インデックスexp_indexに対応するものである。
例えば復号しようとする量子化位置情報が最高精度量子化位置情報であれば、べき指数部インデックスexp_index_selの値は、べき指数部インデックスexp_index_highと同じ値とされる。また、復号しようとする量子化位置情報が最低精度量子化位置情報であれば、べき指数部インデックスexp_index_selの値は0とされる。
さらに、符号ビット情報sign_x(i)、sign_y(i)、およびsign_z(i)の復号も行われる。
具体的には、符号ビット情報sign_x(i)の値が0であれば、復号により得られた正規化位置情報のx座標の符号を示す符号ビット情報sign_x_val(i)の値が1とされ、符号ビット情報sign_x(i)の値が1であれば、復号により得られた正規化位置情報のx座標の符号を示す符号ビット情報sign_x_val(i)の値が-1とされる。
同様に、符号ビット情報sign_y(i)の値が0であれば、復号により得られた正規化位置情報のy座標の符号を示す符号ビット情報sign_y_val(i)の値が1とされ、符号ビット情報sign_y(i)の値が1であれば、復号により得られた正規化位置情報のy座標の符号を示す符号ビット情報sign_y_val(i)の値が-1とされる。
符号ビット情報sign_z(i)の値が0であれば、復号により得られた正規化位置情報のz座標の符号を示す符号ビット情報sign_z_val(i)の値が1とされ、符号ビット情報sign_z(i)の値が1であれば、復号により得られた正規化位置情報のz座標の符号を示す符号ビット情報sign_z_val(i)の値が-1とされる。
量子化ステップ幅step_decと、復号後の符号ビット情報sign_x_val(i)、sign_y_val(i)、およびsign_z_val(i)とが得られると、それらの情報と、サーバ52から受信した絶対距離情報absoluteDistanceと、最終的に確定した量子化位置情報の仮数部とに基づいて、次式(5)が計算され、最終的な復号正規化位置情報が求められる。復号正規化位置情報は、符号化された正規化位置情報を復号することで得られる絶対座標情報である。
なお、式(5)においてDpx(i)、Dpy(i)、およびDpz(i)は、符号化されたi番目のオブジェクトの正規化位置情報のx座標Px(i)、y座標Py(i)、およびz座標Pz(i)を、復号することにより得られるx座標、y座標、およびz座標である。また、x座標Dpx(i)、y座標Dpy(i)、およびz座標Dpz(i)からなる位置情報が、復号により得られたxyz座標系におけるオブジェクトの絶対的な位置を示す復号正規化位置情報とされる。
さらに、式(5)においてQpx_sel(i)、Qpy_sel(i)、およびQpz_sel(i)は、最終的に確定したi番目のオブジェクトの量子化位置情報のx座標、y座標、およびz座標の仮数部である。例えば最終的に確定したオブジェクトの量子化位置情報が最高精度量子化位置情報である場合には、仮数部Qpx_sel(i)、Qpy_sel(i)、およびQpz_sel(i)は、それぞれ仮数部Qpx_high(i)、Qpy_high(i)、およびQpz_high(i)となる。
〈符号化処理およびファイル保存処理の説明〉
次に、コンテンツ再生システムにおいて行われる具体的な処理について説明する。
次に、コンテンツ再生システムにおいて行われる具体的な処理について説明する。
まず、図7のフローチャートを参照して、絶対座標位置情報エンコーダ51による符号化処理、およびサーバ52によるファイル保存処理について説明する。
符号化処理が開始されると、絶対座標位置情報エンコーダ51はステップS11において、ユーザU11により入力されたオブジェクト数nObj、絶対距離情報absoluteDistance、最小距離情報MinDist、各オブジェクトの正規化位置情報、および知覚限界角度θを取得する。
ステップS12において絶対座標位置情報エンコーダ51は式(1)を計算し、受聴者U12からオブジェクトまでの距離が最小距離MinDistとなるときのべき指数部インデックスexp_index_highを算出する。
ステップS13において絶対座標位置情報エンコーダ51は、各オブジェクトについて、正規化位置情報、べき指数部インデックスexp_index_high、絶対距離情報absoluteDistance、および知覚限界角度θに基づいて式(2)を計算し、最高精度量子化位置情報の仮数部Qpx_high(i)、Qpy_high(i)、およびQpz_high(i)を算出する。
ステップS14において絶対座標位置情報エンコーダ51は、各オブジェクトの正規化位置情報の符号ビットを符号化し、符号ビット情報sign_x(i)、sign_y(i)、およびsign_z(i)を求める。
以上の処理で最高精度量子化位置情報の仮数部と符号ビット情報を求めることにより、オブジェクトの正規化位置情報が最高精度で符号化(量子化)されたことになる。
ステップS15において絶対座標位置情報エンコーダ51は、各オブジェクトの最高精度量子化位置情報が含まれる最高精度位置符号化データファイルを生成する。
これにより、例えば図8に示すフォーマットの最高精度位置符号化データファイルが生成される。すなわち、図8は、最高精度位置符号化データファイルのシンタックスの一例を示す図である。
この例では、最高精度位置符号化データファイルの先頭には絶対距離情報absoluteDistanceが配置され、その後にべき指数部インデックスexp_index_highが配置されている。また、べき指数部インデックスexp_index_highに続いて、文字「Num_of_Object」により示されるオブジェクト数nObjを示す情報が配置されている。
さらに、オブジェクト数nObjを示す情報の後には、そのオブジェクト数nObjの分だけ、各オブジェクトの最高精度量子化位置情報の符号ビット情報sign_x(i)、sign_y(i)、およびsign_z(i)と、仮数部Qpx_high(i)、Qpy_high(i)、およびQpz_high(i)とが配置されている。
なお、図8の例において、最高精度量子化位置情報の仮数部のビット数を示すceil()は、引数以上の最小の整数値を出力する天井関数を示している。
このようにして絶対距離情報absoluteDistance、べき指数部インデックスexp_index_high、オブジェクト数nObj、各オブジェクトの最高精度量子化位置情報の符号ビット情報、および各オブジェクトの最高精度量子化位置情報の仮数部が含まれる最高精度位置符号化データファイルが得られると、その後、処理は図7のステップS16へと進む。
ステップS16において、絶対座標位置情報エンコーダ51は、生成した最高精度位置符号化データファイルを、無線または有線の通信等によりサーバ52に送信し、符号化処理は終了する。
なお、後述するように最高精度位置符号化データファイルがサーバ52で正しく保存されると、その旨の保存完了通知がサーバ52から送信されてくるので、絶対座標位置情報エンコーダ51は送信されてきた保存完了通知を受信して、適宜、表示させる。
また、最高精度位置符号化データファイルが送信されると、サーバ52では、ファイル保存処理が開始される。
すなわち、ステップS31においてサーバ52の通信部101は、絶対座標位置情報エンコーダ51から送信されてきた最高精度位置符号化データファイルを通信制御部111の制御に従って受信し、制御部102に供給する。
ステップS32において制御部102は、通信部101から供給された最高精度位置符号化データファイルを記録部61に供給し、保存させる。これにより、記録部61に最高精度位置符号化データファイルが保存(記録)された状態となる。
その後、通信制御部111は、通信部101を制御して、最高精度位置符号化データファイルを正しく保存できた旨の保存完了通知を絶対座標位置情報エンコーダ51に送信し、ファイル保存処理は終了する。
以上のようにして絶対座標位置情報エンコーダ51は、最も高い精度でオブジェクトの正規化位置情報を符号化し、その結果得られた最高精度量子化位置情報を含む最高精度位置符号化データファイルをサーバ52に送信する。また、サーバ52は、絶対座標位置情報エンコーダ51から受信した最高精度位置符号化データファイルを保存する。
このようにすることで、サーバ52は、クライアント54の要求に応じて最高精度量子化位置情報から任意の量子化精度の量子化位置情報を生成し、クライアント54に伝送することが可能となる。
これにより、クライアント54において各オブジェクトの極座標位置情報を求めるようにしてサーバ52や絶対座標位置情報エンコーダ51といったコンテンツの配信側の処理負荷を低減させるとともに、最高精度量子化位置情報をそのままクライアント54に伝送する場合と比較して情報の伝送量を削減することができる。
〈位置情報取得処理および位置情報送信処理の説明〉
サーバ52に最高精度位置符号化データファイルが保存されると、クライアント54はサーバ52からコンテンツについての各オブジェクトの量子化位置情報の供給を受けることができるようになる。以下、クライアント54がサーバ52から量子化位置情報を取得するときに行われる処理について説明する。すなわち、以下、図9のフローチャートを参照して、クライアント54による位置情報取得処理、およびサーバ52による位置情報送信処理について説明する。
サーバ52に最高精度位置符号化データファイルが保存されると、クライアント54はサーバ52からコンテンツについての各オブジェクトの量子化位置情報の供給を受けることができるようになる。以下、クライアント54がサーバ52から量子化位置情報を取得するときに行われる処理について説明する。すなわち、以下、図9のフローチャートを参照して、クライアント54による位置情報取得処理、およびサーバ52による位置情報送信処理について説明する。
クライアント54により位置情報取得処理が開始されると、ステップS61において、通信部141は、通信制御部151の制御に従ってオブジェクト数送信要求を、無線または有線の通信等によりサーバ52に送信する。
ここで、オブジェクト数送信要求は、コンテンツを構成するオブジェクトの数、すなわち空間内に存在するオブジェクトの数を示すオブジェクト数通知情報の送信を要求する旨の情報である。
オブジェクト数送信要求が送信されると、サーバ52では位置情報送信処理が開始される。すなわち、ステップS81において通信部101は、クライアント54から送信されてきたオブジェクト数送信要求を通信制御部111の制御に従って受信し、制御部102に供給する。
すると、送信情報生成部112は、記録部61に記録されている最高精度位置符号化データファイルを参照して、オブジェクト数nObjを示すオブジェクト数通知情報を生成し、通信制御部111は、生成されたオブジェクト数通知情報を通信部101に供給する。
ステップS82において通信部101は、通信制御部111の制御に従って、通信制御部111から供給されたオブジェクト数通知情報をクライアント54に送信する。
これに対して、クライアント54では、ステップS62において通信部141は、サーバ52から送信されてきたオブジェクト数通知情報を通信制御部151の制御に従って受信し、制御部142に供給する。
これによりクライアント54では、コンテンツにおけるオブジェクト数nObjを把握することができ、そのオブジェクト数nObjに応じて、これから行われる処理の準備等を行うことができる。
なお、オブジェクト数通知情報は、例えば図10に示すフォーマット(シンタックス)のヘッダ情報を含むフレームなどとすることができる。
図10の例では、ヘッダ情報には、絶対距離情報absoluteDistanceと、文字「Num_of_Object」により示されるオブジェクト数nObjを示す情報とが含まれている。なお、図10に示すヘッダ情報は、サーバ52からクライアント54へと送信される信号全てに付加されてもよいし、初期化時などの適切なタイミングでクライアント54に送信されてもよいし、定期的にクライアント54に送信されてもよい。
オブジェクト数nObjが特定されると、通信制御部151は、サーバ52に対して最低精度量子化位置情報の送信を要求する送信要求を生成し、通信部141に供給する。
なお、ここではクライアント54によりサーバ52から最初に取得される低精度量子化位置情報が最低精度量子化位置情報である例について説明するが、最高精度よりも低い量子化精度であれば、どのような量子化精度の低精度量子化位置情報であってもよい。
ステップS63において、通信部141は、通信制御部151の制御に従って、通信制御部151から供給された最低精度量子化位置情報の送信要求をサーバ52に送信する。
すると、サーバ52では、ステップS83において通信部101は、通信制御部111の制御に従って、クライアント54から送信されてきた最低精度量子化位置情報の送信要求を受信して制御部102に供給する。
ステップS84において、送信情報生成部112は、通信部101から供給された送信要求に応じて、記録部61に記録されている最高精度位置符号化データファイルを参照して、最低精度量子化位置情報の仮数部を生成する。
具体的には、例えば送信情報生成部112は、各オブジェクトについて、最高精度位置符号化データファイルに含まれる最高精度量子化位置情報の仮数部Qpx_high(i)、Qpy_high(i)、およびQpz_high(i)を抽出する。
そして、送信情報生成部112は、べき指数部インデックスexp_index_highと、最も量子化精度が低い最低精度のべき指数部インデックスexp_index=0の差の分だけ、仮数部Qpx_high(i)、Qpy_high(i)、およびQpz_high(i)をシフトさせ、最低精度絶対位置を示すx座標、y座標、およびz座標の各座標の仮数部であるQpx_low(i)、Qpy_low(i)、およびQpz_low(i)とする。
換言すれば、最高精度量子化位置情報の仮数部のMSB(Most Significant Bit)側(最上位ビット側)から、最低精度のべき指数部インデックスexp_indexに応じたビット数分の情報を抽出することで、最低精度量子化位置情報の仮数部を得ることができる。
例えば、べき指数部インデックスexp_index_highの値が9であったとすると、仮数部Qpx_high(i)における下位9ビット分の情報を、仮数部Qpx_high(i)に対するシフト処理により除去して得られた情報が最低精度絶対位置のx座標の仮数部Qpx_low(i)とされる。
また、送信情報生成部112は、最高精度位置符号化データファイルに含まれている最高精度量子化位置情報の符号ビット情報sign_x(i)、sign_y(i)、およびsign_z(i)を、そのまま最低精度量子化位置情報の符号ビット情報とする。これは、量子化精度によらず、符号ビットは同じであるからである。
ステップS85において、送信情報生成部112は、ステップS84の処理で得られた仮数部Qpx_low(i)、Qpy_low(i)、およびQpz_low(i)と、符号ビット情報sign_x(i)、sign_y(i)、およびsign_z(i)とが含まれる最低精度量子化位置情報を生成する。
これにより、例えば図11に示す最低精度量子化位置情報が得られる。より詳細には、図11は、各オブジェクトの最低精度量子化位置情報が含まれるビットストリームのシンタックス例を示している。
この例では、オブジェクト数nObj分の各オブジェクトについて、最低精度量子化位置情報の符号ビット情報sign_x(i)、sign_y(i)、およびsign_z(i)と、最低精度量子化位置情報の各座標の仮数部Qpx_low(i)、Qpy_low(i)、およびQpz_low(i)とがビットストリームに格納されている。
このようにして最低精度量子化位置情報が得られると、通信制御部111は、各オブジェクトの最低精度量子化位置情報を通信部101に供給する。
ステップS86において、通信部101は、通信制御部111から供給された各オブジェクトの最低精度量子化位置情報を通信制御部111の制御に従ってクライアント54に送信し、位置情報送信処理は終了する。
ここで、ある1つのオブジェクトの正規化位置情報の1つの軸の座標を符号化した場合の具体的な例を図12に示す。
図12では、知覚限界角度θは1.5度とされており、知覚限界角度θにより定まる許容誤差角度は0.75度となる。また、絶対距離absoluteDistanceは30mであり、正規化位置情報の座標は0.1となっている。
図12の例では、この座標値0.1の各量子化精度に対応する仮数部の2進数の値等、すなわちバイナリ値等が示されている。
すなわち、「1/2のべき指数」は、べき指数部インデックスexp_indexを示しており、べき指数部インデックスexp_indexの値が大きいほど量子化精度が高くなる。
特にここでは、最も量子化精度が高いべき指数部インデックスexp_index_highの値は「9」となっており、最も量子化精度が低い最低量子化精度のべき指数部インデックスexp_indexの値は「0」となっている。
また、「受聴者からオブジェクトまでの距離」は、べき指数部インデックスexp_indexに対応する量子化精度の量子化ステップ幅だけ離れた2つの位置が、受聴者U12から見て知覚限界角度θだけ離れた位置となるときの受聴者U12からオブジェクトまでの距離を示している。
「量子化ステップ幅」は、べき指数部インデックスexp_indexに対応する量子化ステップ幅を示している。
「実数量子化値」は、べき指数部インデックスexp_indexに対応する量子化ステップ幅により正規化位置情報の座標値「0.1」を量子化したときの実数値である。
また、「量子化ビット数」は、量子化された正規化位置情報の仮数部のビット数を示しており、「2進バイナリ」は量子化された正規化位置情報の仮数部のバイナリ値(2進バイナリ値)を示しており、「整数化量子化値」は仮数部の値(整数値)を示している。つまり、「整数化量子化値」により示される値が量子化された正規化位置情報の仮数部の値であり、その値のバイナリ値が「2進バイナリ」により示される値である。
特に、ここでは、べき指数部インデックスexp_indexの値が9であるものについては、「実数量子化値」により示される値を整数化したものが、量子化された正規化位置情報の仮数部の整数化量子化値とされている。
これに対して、べき指数部インデックスexp_indexの値が8乃至0であるものについては、それらの仮数部は、べき指数部インデックスexp_indexの値が9である仮数部のバイナリ値の一部を抽出して得られたものとなっている。
例えばべき指数部インデックスexp_indexの値が9である仮数部のバイナリ値の上位7ビットを抽出して得られる値が、べき指数部インデックスexp_indexの値が0である仮数部のバイナリ値となっている。
なお、ここでは図を見やすくするため、仮数部のバイナリ値の部分では、MSB側にある「0000」が省略されている。
さらに、「デコード後のPosition」は、量子化された正規化位置情報の仮数部、すなわち「2進バイナリ」により示される値に基づいて復号を行って得られる正規化位置情報の座標値を示している。
この例では、量子化(符号化)される正規化位置情報の座標値は「0.1」であるから、復号後の正規化位置情報の座標値は「0.1」となることが理想的である。しかし、ここではべき指数部インデックスexp_indexが小さくなるほど量子化精度が低くなるので、復号後の座標値も量子化精度が低くなるほど誤差が大きくなっている。
正規化位置情報の符号化(量子化)時には、べき指数部インデックスexp_indexに対して量子化ビット数が定まり、その量子化ビット数の仮数部、すなわち座標値の量子化値の2進バイナリ値が得られる。
各べき指数部インデックスexp_indexにおける仮数部を比較すると、べき指数部インデックスexp_indexの値が大きくなるほど量子化ビット数は増加し、仮数部はLSB(Least Significant Bit)方向、すなわち最下位ビット方向に値が付加されていくことが分かる。
このことは、べき指数部インデックスexp_indexが大きくなるほど仮数部の量子化精度が高くなることを意味している。そして、高い量子化精度の情報、すなわち最高精度量子化位置情報の仮数部だけを保持しておけば、仮数部のLSB側の情報を除去するだけで、新たに量子化の計算を行わなくても低精度量子化位置情報の仮数部を得ることができる。
ここで、べき指数部インデックスexp_indexに対応する量子化ステップ幅stepは、次式(6)に示すものとなる。
また、べき指数部インデックスexp_indexに対応する仮数部の量子化ビット数は、量子化ステップ幅stepを用いて、ceil(log2(1/step+1))を計算することで得ることができる。なお、ceil()は天井関数である。
したがって、例えばべき指数部インデックスexp_indexの値が「0」である場合には、量子化ビット数は7ビットとなる。
いま、例えばべき指数部インデックスexp_index_highの値が「9」であるとする。この場合、最高精度のべき指数部インデックスexp_index_high=9と、最低精度のべき指数部インデックスexp_index=0の差は9となる。
したがって、最低精度量子化位置情報の座標の仮数部は、べき指数部インデックスの差である9ビット分だけ、最高精度量子化位置情報の座標の仮数部「0000110100111011」の下位ビットを除去して得られる7ビットの値「0000110」となる。
換言すれば、最低精度のべき指数部インデックスexp_indexが0である場合には、量子化ビット数が7となるので、最高精度量子化位置情報の座標の仮数部の上位7ビット分を抽出すれば、最低精度量子化位置情報の座標の仮数部が得られることになる。
図9のフローチャートの説明に戻り、サーバ52により最低精度量子化位置情報が送信されると、クライアント54では、ステップS64の処理が行われる。
ステップS64において、通信部141は、サーバ52から送信されてきた最低精度量子化位置情報を通信制御部151の制御に従って受信し、制御部142に供給する。すなわち、通信制御部151は最低精度量子化位置情報を取得する。
最低精度量子化位置情報が受信されると、絶対座標位置情報デコーダ71は、オブジェクト数nObj分の各オブジェクトを1つずつ処理対象のオブジェクトとして選択していき、それらのオブジェクトの最低精度絶対位置を算出する。
すなわち、ステップS65において絶対座標位置情報デコーダ71は、既知である知覚限界角度θと、サーバ52から受信したフレーム等のヘッダ情報に含まれている絶対距離情報absoluteDistanceとに基づいて式(4)と同様の計算を行い、量子化ステップ幅を算出する。ここでは、最低精度のべき指数部インデックスexp_indexの値は0であるから、式(4)において、べき指数部インデックスexp_index_selの値に代えて0を代入することで量子化ステップ幅が算出される。
ステップS66において絶対座標位置情報デコーダ71は、処理対象のオブジェクトについて、ステップS64で受信された最低精度量子化位置情報の符号ビット情報sign_x(i)、sign_y(i)、およびsign_z(i)を復号する。これにより、復号後の符号ビット情報sign_x_val(i)、sign_y_val(i)、およびsign_z_val(i)が得られる。
ステップS67において絶対座標位置情報デコーダ71は、処理対象のオブジェクトについて、ステップS65で得られた量子化ステップ幅と、ステップS66で得られた符号ビット情報sign_x_val(i)、sign_y_val(i)、およびsign_z_val(i)と、ステップS64で受信された最低精度量子化位置情報の仮数部Qpx_low(i)、Qpy_low(i)、およびQpz_low(i)とに基づいて最低精度絶対位置を算出する。
すなわち、絶対座標位置情報デコーダ71は、上述した式(5)と同様の計算を行って、復号された最低精度絶対位置を示すx座標Dtx(i)、y座標Dty(i)、およびz座標Dtz(i)からなる復号最低精度正規化位置情報を求める。
具体的には、式(5)において、量子化ステップ幅step_decに代えてステップS65で得られた量子化ステップ幅が代入され、Qpx_sel(i)、Qpy_sel(i)、およびQpz_sel(i)に代えて仮数部Qpx_low(i)、Qpy_low(i)、およびQpz_low(i)が代入される。また、絶対距離情報absoluteDistanceはサーバ52から受信したものが用いられる。これにより、x座標Dpx(i)、y座標Dpy(i)、およびz座標Dpz(i)に対応するx座標Dtx(i)、y座標Dty(i)、およびz座標Dtz(i)が得られる。
このようにして得られたx座標Dtx(i)、y座標Dty(i)、およびz座標Dtz(i)からなる復号最低精度正規化位置情報は、仮の復号正規化位置情報である。以上のステップS65乃至ステップS67の処理が最低精度量子化位置情報を復号する処理となる。
ステップS68において絶対座標位置情報デコーダ71は、全てのオブジェクトを処理対象のオブジェクトとして処理したか否かを判定する。
ステップS68において、まだ全てのオブジェクトを処理していないと判定された場合、処理はステップS66に戻り、上述した処理が繰り返し行われる。この場合、まだ処理対象とされていないオブジェクトが次の処理対象のオブジェクトとして選択され、復号最低精度正規化位置情報が求められる。
これに対して、ステップS68において全てのオブジェクトを処理したと判定された場合、位置情報取得処理は終了する。
以上のようにしてクライアント54は、サーバ52から最低精度量子化位置情報を受信して復号処理を行い、復号最低精度正規化位置情報を得る。また、サーバ52は、クライアント54の要求に応じて最低精度量子化位置情報を生成し、クライアント54に送信する。
このようにすることで、最高精度量子化位置情報を授受する場合よりも、サーバ52とクライアント54の間で授受される情報の伝送量を削減することができる。
なお、ここでは最高精度量子化位置情報のみが予めサーバ52に記録され、その最高精度量子化位置情報に基づいてクライアント54へと伝送(送信)される最低精度量子化位置情報が生成される例について説明した。しかし、各量子化精度の量子化位置情報が予めサーバ52で保持されるようにし、要求された量子化精度の量子化位置情報が読み出されてクライアント54に送信されるようにしてもよい。
〈追加ビット情報取得処理および追加ビット情報送信処理の説明〉
ところで、図9を参照して説明した位置情報取得処理が行われると、各オブジェクトについて復号最低精度正規化位置情報が得られることになる。
ところで、図9を参照して説明した位置情報取得処理が行われると、各オブジェクトについて復号最低精度正規化位置情報が得られることになる。
空間内のオブジェクトの絶対的な位置を示す量子化位置情報として、最低精度量子化位置情報、つまり復号最低精度正規化位置情報が十分な精度のものであるか否かは、受聴者U12から、正規化位置情報により示される位置までの距離によって特定可能である。
ここで、十分な精度の量子化位置情報とは、受聴者U12から見た正規化位置情報により示される位置の方向と、受聴者U12から見た量子化位置情報により示される位置の方向とのなす角度がθ/2以下となることである。換言すれば、受聴者U12から見て、量子化位置情報により示される位置が、正規化位置情報により示される位置を中心とする知覚限界角度θの範囲内に位置していることである。
復号最低精度正規化位置情報は、正確ではないものの空間内における大よそのオブジェクトの位置を示しているので、復号最低精度正規化位置情報を用いれば、空間内における受聴者U12からオブジェクトまでの大よその距離を得ることができる。
したがって、クライアント54は、GPS等により計測された高精度な受聴者位置情報と、復号最低精度正規化位置情報とに基づいて、各オブジェクトについて最低精度量子化位置情報が十分な量子化精度のものであるか否か、および十分な量子化精度の量子化位置情報を特定することができる。
クライアント54は、最低精度量子化位置情報が十分な量子化精度のものでない場合には、追加ビット情報をサーバ52から取得して、十分な精度の復号正規化位置情報を得る。以下、そのような場合にクライアント54およびサーバ52により行われる処理について説明する。すなわち、以下、図13のフローチャートを参照して、クライアント54による追加ビット情報取得処理、およびサーバ52による追加ビット情報送信処理について説明する。
クライアント54において追加ビット情報取得処理が開始されると、ステップS121において絶対座標位置情報デコーダ71は、各オブジェクトについて、受聴者U12からオブジェクトまでの距離ObjectDistanceを算出する。
具体的には、受聴者位置取得装置53から供給された受聴者位置情報と、復号最低精度正規化位置情報とに基づいて、空間内における受聴者U12からオブジェクトまでのユークリッド距離が距離ObjectDistanceとして算出される。
ステップS122において、絶対座標位置情報デコーダ71は、べき指数部インデックスexp_indexの値を0からより大きい値へと変化させながら、べき指数部インデックスexp_indexに対して定まる距離distanceと、距離ObjectDistanceとを比較する。
すなわち、例えば絶対座標位置情報デコーダ71は、べき指数部インデックスexp_index、および絶対距離情報absoluteDistanceに基づいて次式(7)を計算することにより、べき指数部インデックスexp_indexに対応する距離distanceを算出する。
そして、絶対座標位置情報デコーダ71は、求めた距離distanceと距離ObjectDistanceとを比較し、距離distanceが距離ObjectDistance以下となるか否かを判定する。
絶対座標位置情報デコーダ71は、距離distanceが距離ObjectDistance以下となるまで、べき指数部インデックスexp_indexの値を1ずつ増加させながら、距離distanceが距離ObjectDistance以下となる最も小さいべき指数部インデックスexp_indexを特定する。
なお、以下、距離distanceが距離ObjectDistance以下となる最も小さいべき指数部インデックスexp_indexをべき指数部インデックスexp_index_coverとも称する。
べき指数部インデックスexp_index_coverは、上述した十分な精度の量子化位置情報のべき指数部インデックスexp_indexのうちの最も値が小さいものである。
各オブジェクトについて、べき指数部インデックスexp_index_coverが特定されると、処理はステップS123へと進む。
ステップS123において、絶対座標位置情報デコーダ71は、各オブジェクトについてべき指数部インデックスexp_index_coverと、最低精度量子化位置情報のべき指数部インデックスexp_indexとを比較し、不十分な量子化精度のオブジェクトの洗い出しを行う。
ここで、べき指数部インデックスexp_index_coverは、最低限必要な量子化精度のべき指数部インデックスexp_indexである。したがって、最低精度量子化位置情報のべき指数部インデックスexp_indexがべき指数部インデックスexp_index_cover未満となるオブジェクトは、量子化精度が不十分なものであるとされる。
特に、ここでは最低精度量子化位置情報のべき指数部インデックスexp_indexの値は0であるから、べき指数部インデックスexp_index_coverの値が1以上であるオブジェクトは、量子化精度が不十分であり、追加ビット情報が必要なオブジェクトであるとされる。
このような洗い出しの処理により、量子化精度が不十分であり追加ビット情報が必要となるオブジェクトが特定されるとともに、そのようなオブジェクトについて、予め定められた複数の量子化精度のなかから、必要な量子化精度が決定(特定)されたことになる。ここでいう必要な量子化精度とは、べき指数部インデックスexp_index_coverに対応する量子化精度(量子化ステップ幅)である。
ステップS124において絶対座標位置情報デコーダ71は、べき指数部インデックスexp_indexがべき指数部インデックスexp_index_cover以上となる最低精度量子化位置情報について得られた復号最低精度正規化位置情報を、最終的な復号正規化位置情報とする。
すなわち、べき指数部インデックスexp_indexがべき指数部インデックスexp_index_cover以上となるオブジェクトについては、十分な量子化精度の復号最低精度正規化位置情報が得られたことになる。そのため、復号最低精度正規化位置情報のx座標Dtx(i)、y座標Dty(i)、およびz座標Dtz(i)が、そのまま復号正規化位置情報のx座標Dpx(i)、y座標Dpy(i)、およびz座標Dpz(i)とされる。
ステップS125において通信部141は、べき指数部インデックスexp_indexがべき指数部インデックスexp_index_cover未満となるオブジェクト、つまり追加ビット情報が必要であると特定されたオブジェクトについて、追加ビット情報の送信要求を送信する。
例えば絶対座標位置情報デコーダ71は、追加ビット情報の送信を要求するオブジェクトの数、オブジェクトのインデックスresend_object_index(j)、およびべき指数部インデックスresend_exp_index(j)を含む、追加ビット情報の送信要求を生成する。
ここで、オブジェクトのインデックスresend_object_index(j)は、追加ビット情報の送信を要求するオブジェクト、つまりべき指数部インデックスexp_indexがべき指数部インデックスexp_index_cover未満となるオブジェクトを識別するインデックスiである。
べき指数部インデックスresend_exp_index(j)は、インデックスresend_object_index(j)により示されるオブジェクトについて、最終的に必要となる量子化精度のべき指数部インデックスexp_indexである。この場合、べき指数部インデックスexp_index_coverの値がそのままべき指数部インデックスresend_exp_index(j)の値として用いられる。
これにより、例えば図14に示すフォーマット(シンタックス)の送信要求が得られる。
この例では、送信要求の先頭に文字「num_of_resend_objects」により示される追加ビット情報の送信を要求するオブジェクトの数を示す情報が配置されている。
そして、その後にnum_of_resend_objectsに示される数だけ、オブジェクトのインデックスresend_object_index(j)、およびべき指数部インデックスresend_exp_index(j)が配置されている。
図13の説明に戻り、通信制御部151は、このようにして生成された追加ビット情報の送信要求を通信部141に供給し、サーバ52へと送信させる。
追加ビット情報の送信要求が送信されると、サーバ52では、追加ビット情報送信処理が開始される。
すなわち、ステップS161において通信部101は、クライアント54から送信されてきた追加ビット情報の送信要求を通信制御部111の制御に従って受信し、制御部102に供給する。
ステップS162において、送信情報生成部112は、通信部101から供給された送信要求に応じて、すなわち最低精度量子化位置情報の送信先であるクライアント54からの要求に応じて、送信が要求されたオブジェクトの追加ビット情報を生成する。
具体的には、例えば送信情報生成部112は、インデックスresend_object_index(j)により示されるオブジェクトについて、最高精度位置符号化データファイルに含まれる最高精度量子化位置情報の仮数部Qpx_high(i)、Qpy_high(i)、およびQpz_high(i)を抽出する。
そして送信情報生成部112は、べき指数部インデックスexp_index_highと、べき指数部インデックスresend_exp_index(j)との差の分だけ仮数部Qpx_high(i)、Qpy_high(i)、およびQpz_high(i)をシフトさせる。
これにより、仮数部Qpx_high(i)、Qpy_high(i)、およびQpz_high(i)における下位ビット側のべき指数部インデックスexp_index_highと、べき指数部インデックスresend_exp_index(j)との差の分のビットが除去され、べき指数部インデックスresend_exp_index(j)の量子化位置情報の仮数部が得られることになる。
送信情報生成部112は、得られたべき指数部インデックスresend_exp_index(j)の量子化位置情報の仮数部から、上位ビット側における最低精度量子化位置情報の仮数部のビット数分のビットを除去して追加ビット情報とする。
この追加ビット情報は、べき指数部インデックスresend_exp_index(j)の量子化位置情報と、最低精度量子化位置情報とのx座標、y座標、およびz座標の各座標の仮数部の差分情報である追加ビット情報Qpx_diff(j)、Qpy_diff(j)、およびQpz_diff(j)からなる。
例えば追加ビット情報Qpx_diff(j)は、べき指数部インデックスresend_exp_index(j)の量子化位置情報のx座標の仮数部と、最低精度量子化位置情報のx座標の仮数部Qpx_low(i)との差分である。
例えば図12に示した例において、べき指数部インデックスresend_exp_index(j)の値が7であったとする。
この場合、最高精度量子化位置情報のべき指数部インデックスexp_index_highは9であるから、その9と、べき指数部インデックスresend_exp_index(j)=7との差分は2となる。
また、最高精度量子化位置情報の仮数部である「0000110100111011」から下位2ビット分を除去することで、べき指数部インデックスresend_exp_index(j)=7の低精度量子化位置情報の仮数部「00001101001110」が得られる。
さらに、最低精度量子化位置情報の仮数部のビット数は7ビットであるから、仮数部「00001101001110」から上位7ビットを除去すると、追加ビット情報「1001110」が得られることになる。クライアント54側では、このようにして得られた追加ビット情報「1001110」を、最低精度量子化位置情報の仮数部「0000110」の下位ビット側に付加することで、最終的に必要とされているべき指数部インデックスresend_exp_index(j)=7である低精度量子化位置情報の仮数部「00001101001110」が得られることになる。
以上の処理により、各インデックスresend_object_index(j)により示されるオブジェクトについて追加ビット情報が得られると、送信情報生成部112は、それらの追加ビット情報が含まれる差分データを生成する。
これにより、例えば図15に示されるフォーマット(シンタックス)の差分データが得られる。この例では、差分データには、上述したnum_of_resend_objectsに示される数だけ、オブジェクトの追加ビット情報Qpx_diff(j)、Qpy_diff(j)、およびQpz_diff(j)が含まれている。
なお、図15において、各追加ビット情報のビット数は、resend_exp_index(j)分のビット数となっている。
図13の説明に戻り、通信制御部111は、追加ビット情報が含まれる差分データを通信部101に供給し、クライアント54への送信を制御する。
ステップS163において、通信部101は、通信制御部111の制御に従って、通信制御部111から供給された追加ビット情報が含まれる差分データをクライアント54に送信し、追加ビット情報送信処理は終了する。
また、差分データが送信されると、クライアント54ではステップS126の処理が行われる。
ステップS126において、通信部141は通信制御部151の制御に従って、サーバ52から送信されてきた差分データを受信して制御部142に供給する。すなわち、通信制御部151は、追加ビット情報が含まれる差分データを取得する。
ステップS127において、絶対座標位置情報デコーダ71は各インデックスresend_object_index(j)により示されるオブジェクトについて、べき指数部インデックスresend_exp_index(j)の値を、べき指数部インデックスexp_index_selとして式(4)の計算を行い、量子化ステップ幅step_decを算出する。
ステップS127では、ステップS123で量子化精度が不十分であるとされたオブジェクトごと、つまりインデックスresend_object_index(j)により示されるオブジェクトごとに量子化ステップ幅step_decが算出される。
ステップS128において、絶対座標位置情報デコーダ71は各インデックスresend_object_index(j)により示されるオブジェクトについて、通信部141から供給された差分データに基づいて、べき指数部インデックスresend_exp_index(j)の量子化位置情報の仮数部を生成する。
すなわち、絶対座標位置情報デコーダ71は、最低精度量子化位置情報の仮数部Qpx_low(i)、Qpy_low(i)、およびQpz_low(i)の下位ビット側に、差分データに含まれている追加ビット情報Qpx_diff(j)、Qpy_diff(j)、およびQpz_diff(j)を付加する。
これにより、べき指数部インデックスresend_exp_index(j)の量子化位置情報の各座標の仮数部が得られ、それらの仮数部が最終的に確定した仮数部Qpx_sel(i)、Qpy_sel(i)、およびQpz_sel(i)とされる。
ステップS129において、絶対座標位置情報デコーダ71は各インデックスresend_object_index(j)により示されるオブジェクトについて、オブジェクトの復号正規化位置情報を算出する。
具体的には、ステップS127で得られた量子化ステップ幅step_dec、絶対距離情報absoluteDistance、図9のステップS66で得られた復号後の符号ビット情報、およびステップS128で得られた最終的に確定した仮数部に基づいて式(5)が計算され、復号正規化位置情報が算出される。
以上のステップS127乃至ステップS129の処理は、最低精度量子化位置情報と追加ビット情報とから得られる量子化位置情報を復号する処理となる。また、以上の処理により、オブジェクト数nObj分の全てのオブジェクトについて、復号正規化位置情報が得られたことになる。
ステップS130において、座標変換部72はオブジェクトごとに、復号正規化位置情報と、受聴者位置取得装置53から供給された受聴者位置情報とに基づいて、空間内における受聴者U12から見たオブジェクトの位置を示す極座標位置情報を算出する。
そして、座標変換部72は、得られた極座標位置情報を出力部143に供給し、出力部143は、それらの極座標位置情報をMPEG-Hレンダラ55に出力する。出力部143が全オブジェクトの極座標位置情報をMPEG-Hレンダラ55に出力すると、追加ビット情報取得処理は終了する。
追加ビット情報取得処理が終了するとMPEG-Hレンダラ55ではレンダリングが行われる。すなわち、MPEG-Hレンダラ55は、サーバ52等から取得した各オブジェクトのオーディオデータと、出力部143から供給された極座標位置情報とに基づいてレンダリングを行い、空間内の各位置にオブジェクトの音像が定位する再生オーディオデータを生成し、スピーカ等の再生系へと出力する。
以上のようにしてクライアント54は、量子化精度が不十分なオブジェクトについては、サーバ52から追加ビット情報を取得(受信)して、十分な精度の復号正規化位置情報を算出する。また、サーバ52は、クライアント54の要求に応じて追加ビット情報を生成し、クライアント54へと送信する。
このようにすることで、クライアント54では、最初から最高精度量子化位置情報をサーバ52から取得するよりも少ない情報伝送量で、十分な精度の復号正規化位置情報を得ることができる。
しかも、必要となる量子化精度を求める処理や極座標位置情報を算出する処理は、全てクライアント54で行われるので、サーバ52や絶対座標位置情報エンコーダ51といったコンテンツ配信側の処理負荷を低減させることができる。特に、この処理負荷の低減効果は、サーバ52に接続されるクライアント54の数が多くなるほど大きくなる。
なお、クライアント54では、コンテンツの再生時には空間内におけるオブジェクトや受聴者U12の位置が変化するたびに極座標位置情報が変化する。
そのため、クライアント54は、例えば受聴者U12の受聴者位置情報が変化すると、極座標位置情報を更新することになる。
しかし、空間内においてオブジェクトは移動しておらず、かつ受聴者U12がオブジェクトから遠ざかる方向に移動した場合には、そのオブジェクトについては特に復号正規化位置情報の更新は必要ない。これは、オブジェクトは動いていないことに加えて、オブジェクトと受聴者U12の距離がより離れたときには必要となる精度がより低くなるからである。すなわち、既に十分な精度の復号正規化位置情報があるからである。
そのような場合、例えばクライアント54の通信制御部151は通信部141を制御して、動きのあったオブジェクトと、受聴者U12からの距離が短くなったオブジェクトについてのみ、それらのオブジェクトのインデックスiを含む、最低精度量子化位置情報の送信要求をサーバ52に送信させる。そして、通信部141は、図9のステップS64において、それらのオブジェクトのインデックスiのオブジェクトの最低精度量子化位置情報のみをサーバ52から受信して、クライアント54でそれ以降の処理が行われ、極座標位置情報が更新される。
その他、動きのないオブジェクトで、受聴者U12からの距離が短くなったオブジェクトについては、これまでの処理で得られていた復号正規化位置情報と、新たな受聴者U12の受聴者位置情報とから、必要となる量子化精度を特定可能である。
したがって、この場合、動きがなく、かつ受聴者U12からの距離が短くなったオブジェクトについて、クライアント54が図13の追加ビット情報取得処理を行うようにすれば、新たに最低精度量子化位置情報を取得することなく、十分な精度の復号正規化位置情報を得ることができる。
以上のように、本技術によれば、自由視点の3D Audioにおいて発生するコンテンツ配信側の一方的な処理負荷を回避し、オブジェクトの位置を示す情報を伝送することができる。また、受聴者U12からオブジェクトまでの距離と、人間の知覚限界角度θとに応じて適切な量子化精度を特定するようにしたので、本来の音像方向との差が知覚限界以下となる量子化位置情報を伝送量を抑えながら伝送することが可能となる。
〈コンピュータの構成例〉
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図16は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
バス504には、さらに、入出力インターフェース505が接続されている。入出力インターフェース505には、入力部506、出力部507、記録部508、通信部509、及びドライブ510が接続されている。
入力部506は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記録部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインターフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体511を駆動する。
以上のように構成されるコンピュータでは、CPU501が、例えば、記録部508に記録されているプログラムを、入出力インターフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブル記録媒体511をドライブ510に装着することにより、入出力インターフェース505を介して、記録部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記録部508にインストールすることができる。その他、プログラムは、ROM502や記録部508に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、本技術は、以下の構成とすることも可能である。
(1)
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得する取得部と、
前記低精度位置情報および前記追加情報に基づいて前記位置情報を求める位置情報算出部と
を備える情報処理装置。
(2)
前記位置情報算出部は、前記ユーザの位置を示すユーザ位置情報と、前記低精度位置情報とに基づいて、前記追加情報が必要な前記オブジェクトを特定し、
前記取得部は、1または複数の前記オブジェクトのうち、前記位置情報算出部により特定された前記オブジェクトについて前記追加情報を取得する
(1)に記載の情報処理装置。
(3)
前記位置情報算出部は、前記追加情報が必要な前記オブジェクトごとに、前記ユーザ位置情報と前記低精度位置情報とに基づいて、複数の精度のなかから前記位置情報の前記第2の精度を決定する
(2)に記載の情報処理装置。
(4)
前記低精度位置情報および前記位置情報は、前記空間内における前記オブジェクトの位置の絶対座標を示す情報であり、
前記ユーザ位置情報は、前記空間内における前記ユーザの位置の絶対座標を示す情報である
(2)または(3)に記載の情報処理装置。
(5)
前記位置情報および前記ユーザ位置情報に基づいて、前記位置情報を前記ユーザから見た前記オブジェクトの相対的な位置を示す極座標情報に変換する変換部をさらに備える
(4)に記載の情報処理装置。
(6)
前記追加情報は、前記位置情報と前記低精度位置情報との差分の情報である
(1)乃至(5)の何れか一項に記載の情報処理装置。
(7)
前記オブジェクトはオーディオオブジェクトである
(1)乃至(6)の何れか一項に記載の情報処理装置。
(8)
情報処理装置が、
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、
前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得し、
前記低精度位置情報および前記追加情報に基づいて前記位置情報を求める
情報処理方法。
(9)
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、
前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得し、
前記低精度位置情報および前記追加情報に基づいて前記位置情報を求める
ステップを含む処理をコンピュータに実行させるプログラム。
(10)
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信する通信部を備える
情報処理装置。
(11)
前記低精度位置情報および前記位置情報は、前記空間内における前記オブジェクトの位置の絶対座標を示す情報である
(10)に記載の情報処理装置。
(12)
前記追加情報は、前記位置情報と前記低精度位置情報との差分の情報である
(10)または(11)に記載の情報処理装置。
(13)
前記オブジェクトの位置を示す情報を最も高い精度の量子化ステップ幅で量子化して得られた最高精度位置情報を記録する記録部と、
前記最高精度位置情報の一部を抽出することで前記低精度位置情報または前記追加情報を生成する送信情報生成部と
をさらに備える(12)に記載の情報処理装置。
(14)
前記量子化ステップ幅は、1/2のべき乗値に定数を乗算して得られる値とされる
(13)に記載の情報処理装置。
(15)
前記オブジェクトはオーディオオブジェクトである
(10)乃至(14)の何れか一項に記載の情報処理装置。
(16)
情報処理装置が、
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、
前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信する
情報処理方法。
(17)
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、
前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信する
ステップを含む処理をコンピュータに実行させるプログラム。
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得する取得部と、
前記低精度位置情報および前記追加情報に基づいて前記位置情報を求める位置情報算出部と
を備える情報処理装置。
(2)
前記位置情報算出部は、前記ユーザの位置を示すユーザ位置情報と、前記低精度位置情報とに基づいて、前記追加情報が必要な前記オブジェクトを特定し、
前記取得部は、1または複数の前記オブジェクトのうち、前記位置情報算出部により特定された前記オブジェクトについて前記追加情報を取得する
(1)に記載の情報処理装置。
(3)
前記位置情報算出部は、前記追加情報が必要な前記オブジェクトごとに、前記ユーザ位置情報と前記低精度位置情報とに基づいて、複数の精度のなかから前記位置情報の前記第2の精度を決定する
(2)に記載の情報処理装置。
(4)
前記低精度位置情報および前記位置情報は、前記空間内における前記オブジェクトの位置の絶対座標を示す情報であり、
前記ユーザ位置情報は、前記空間内における前記ユーザの位置の絶対座標を示す情報である
(2)または(3)に記載の情報処理装置。
(5)
前記位置情報および前記ユーザ位置情報に基づいて、前記位置情報を前記ユーザから見た前記オブジェクトの相対的な位置を示す極座標情報に変換する変換部をさらに備える
(4)に記載の情報処理装置。
(6)
前記追加情報は、前記位置情報と前記低精度位置情報との差分の情報である
(1)乃至(5)の何れか一項に記載の情報処理装置。
(7)
前記オブジェクトはオーディオオブジェクトである
(1)乃至(6)の何れか一項に記載の情報処理装置。
(8)
情報処理装置が、
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、
前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得し、
前記低精度位置情報および前記追加情報に基づいて前記位置情報を求める
情報処理方法。
(9)
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、
前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得し、
前記低精度位置情報および前記追加情報に基づいて前記位置情報を求める
ステップを含む処理をコンピュータに実行させるプログラム。
(10)
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信する通信部を備える
情報処理装置。
(11)
前記低精度位置情報および前記位置情報は、前記空間内における前記オブジェクトの位置の絶対座標を示す情報である
(10)に記載の情報処理装置。
(12)
前記追加情報は、前記位置情報と前記低精度位置情報との差分の情報である
(10)または(11)に記載の情報処理装置。
(13)
前記オブジェクトの位置を示す情報を最も高い精度の量子化ステップ幅で量子化して得られた最高精度位置情報を記録する記録部と、
前記最高精度位置情報の一部を抽出することで前記低精度位置情報または前記追加情報を生成する送信情報生成部と
をさらに備える(12)に記載の情報処理装置。
(14)
前記量子化ステップ幅は、1/2のべき乗値に定数を乗算して得られる値とされる
(13)に記載の情報処理装置。
(15)
前記オブジェクトはオーディオオブジェクトである
(10)乃至(14)の何れか一項に記載の情報処理装置。
(16)
情報処理装置が、
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、
前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信する
情報処理方法。
(17)
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、
前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信する
ステップを含む処理をコンピュータに実行させるプログラム。
52 サーバ, 54 クライアント, 61 記録部, 71 絶対座標位置情報デコーダ, 72 座標変換部, 101 通信部, 102 制御部, 141 通信部, 142 制御部
Claims (17)
- ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得する取得部と、
前記低精度位置情報および前記追加情報に基づいて前記位置情報を求める位置情報算出部と
を備える情報処理装置。 - 前記位置情報算出部は、前記ユーザの位置を示すユーザ位置情報と、前記低精度位置情報とに基づいて、前記追加情報が必要な前記オブジェクトを特定し、
前記取得部は、1または複数の前記オブジェクトのうち、前記位置情報算出部により特定された前記オブジェクトについて前記追加情報を取得する
請求項1に記載の情報処理装置。 - 前記位置情報算出部は、前記追加情報が必要な前記オブジェクトごとに、前記ユーザ位置情報と前記低精度位置情報とに基づいて、複数の精度のなかから前記位置情報の前記第2の精度を決定する
請求項2に記載の情報処理装置。 - 前記低精度位置情報および前記位置情報は、前記空間内における前記オブジェクトの位置の絶対座標を示す情報であり、
前記ユーザ位置情報は、前記空間内における前記ユーザの位置の絶対座標を示す情報である
請求項2に記載の情報処理装置。 - 前記位置情報および前記ユーザ位置情報に基づいて、前記位置情報を前記ユーザから見た前記オブジェクトの相対的な位置を示す極座標情報に変換する変換部をさらに備える
請求項4に記載の情報処理装置。 - 前記追加情報は、前記位置情報と前記低精度位置情報との差分の情報である
請求項1に記載の情報処理装置。 - 前記オブジェクトはオーディオオブジェクトである
請求項1に記載の情報処理装置。 - 情報処理装置が、
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、
前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得し、
前記低精度位置情報および前記追加情報に基づいて前記位置情報を求める
情報処理方法。 - ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を取得し、
前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を取得し、
前記低精度位置情報および前記追加情報に基づいて前記位置情報を求める
ステップを含む処理をコンピュータに実行させるプログラム。 - ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信する通信部を備える
情報処理装置。 - 前記低精度位置情報および前記位置情報は、前記空間内における前記オブジェクトの位置の絶対座標を示す情報である
請求項10に記載の情報処理装置。 - 前記追加情報は、前記位置情報と前記低精度位置情報との差分の情報である
請求項10に記載の情報処理装置。 - 前記オブジェクトの位置を示す情報を最も高い精度の量子化ステップ幅で量子化して得られた最高精度位置情報を記録する記録部と、
前記最高精度位置情報の一部を抽出することで前記低精度位置情報または前記追加情報を生成する送信情報生成部と
をさらに備える請求項12に記載の情報処理装置。 - 前記量子化ステップ幅は、1/2のべき乗値に定数を乗算して得られる値とされる
請求項13に記載の情報処理装置。 - 前記オブジェクトはオーディオオブジェクトである
請求項10に記載の情報処理装置。 - 情報処理装置が、
ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、
前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信する
情報処理方法。 - ユーザがいる空間内のオブジェクトの位置を示す第1の精度の低精度位置情報を送信し、
前記低精度位置情報の送信先からの要求に応じて、前記空間内の前記オブジェクトの位置を示す、前記ユーザの位置に応じた前記第1の精度よりも高い第2の精度の位置情報を得るための追加情報を送信する
ステップを含む処理をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023011572A JP7485109B2 (ja) | 2018-04-12 | 2023-01-30 | 情報処理装置および方法、並びにプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018076746 | 2018-04-12 | ||
JP2018076746 | 2018-04-12 | ||
PCT/JP2019/013932 WO2019198540A1 (ja) | 2018-04-12 | 2019-03-29 | 情報処理装置および方法、並びにプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023011572A Division JP7485109B2 (ja) | 2018-04-12 | 2023-01-30 | 情報処理装置および方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019198540A1 JPWO2019198540A1 (ja) | 2021-04-22 |
JP7226436B2 true JP7226436B2 (ja) | 2023-02-21 |
Family
ID=68162934
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020513201A Active JP7226436B2 (ja) | 2018-04-12 | 2019-03-29 | 情報処理装置および方法、並びにプログラム |
JP2023011572A Active JP7485109B2 (ja) | 2018-04-12 | 2023-01-30 | 情報処理装置および方法、並びにプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023011572A Active JP7485109B2 (ja) | 2018-04-12 | 2023-01-30 | 情報処理装置および方法、並びにプログラム |
Country Status (7)
Country | Link |
---|---|
US (1) | US12081962B2 (ja) |
EP (2) | EP4246443A3 (ja) |
JP (2) | JP7226436B2 (ja) |
KR (1) | KR102653185B1 (ja) |
CN (1) | CN111937070B (ja) |
BR (1) | BR112020020404A2 (ja) |
WO (1) | WO2019198540A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116312572A (zh) * | 2019-01-31 | 2023-06-23 | 华为技术有限公司 | 一种音频信号处理方法及装置 |
US11366879B2 (en) * | 2019-07-08 | 2022-06-21 | Microsoft Technology Licensing, Llc | Server-side audio rendering licensing |
CN114787918A (zh) * | 2019-12-17 | 2022-07-22 | 索尼集团公司 | 信号处理装置、方法和程序 |
EP4090051A4 (en) | 2020-01-09 | 2023-08-30 | Sony Group Corporation | INFORMATION PROCESSING DEVICE AND METHOD AND PROGRAM |
AU2021357463A1 (en) | 2020-10-06 | 2023-03-16 | Sony Group Corporation | Information processing device, method, and program |
JPWO2022234698A1 (ja) | 2021-05-07 | 2022-11-10 | ||
TW202325370A (zh) | 2021-11-12 | 2023-07-01 | 日商索尼集團公司 | 資訊處理裝置及方法、以及程式 |
JP2024136723A (ja) * | 2023-03-24 | 2024-10-04 | 日立Astemo株式会社 | 物体検出システム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014192602A1 (ja) | 2013-05-31 | 2014-12-04 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5205761B2 (ja) | 2007-01-10 | 2013-06-05 | 富士通モバイルコミュニケーションズ株式会社 | 情報処理装置 |
JP5668512B2 (ja) | 2011-02-15 | 2015-02-12 | ソニー株式会社 | 情報処理装置、及び、情報処理方法 |
CN102737635B (zh) | 2011-04-08 | 2014-04-30 | 华为终端有限公司 | 一种音频编码方法以及音频编码设备 |
JP5948901B2 (ja) | 2012-01-26 | 2016-07-06 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN108806706B (zh) * | 2013-01-15 | 2022-11-15 | 韩国电子通信研究院 | 处理信道信号的编码/解码装置及方法 |
KR102148217B1 (ko) * | 2013-04-27 | 2020-08-26 | 인텔렉추얼디스커버리 주식회사 | 위치기반 오디오 신호처리 방법 |
TWI634798B (zh) | 2013-05-31 | 2018-09-01 | 新力股份有限公司 | Audio signal output device and method, encoding device and method, decoding device and method, and program |
US20170243403A1 (en) * | 2014-11-11 | 2017-08-24 | Bent Image Lab, Llc | Real-time shared augmented reality experience |
KR102633077B1 (ko) * | 2015-06-24 | 2024-02-05 | 소니그룹주식회사 | 음성 처리 장치 및 방법, 그리고 기록 매체 |
WO2017218973A1 (en) * | 2016-06-17 | 2017-12-21 | Edward Stein | Distance panning using near / far-field rendering |
US10339129B2 (en) | 2016-07-20 | 2019-07-02 | Facebook, Inc. | Accuracy of low confidence matches of user identifying information of an online system |
WO2018029341A1 (en) | 2016-08-12 | 2018-02-15 | Bang & Olufsen A/S | Acoustic environment mapping |
US10492016B2 (en) * | 2016-09-29 | 2019-11-26 | Lg Electronics Inc. | Method for outputting audio signal using user position information in audio decoder and apparatus for outputting audio signal using same |
EP3301951A1 (en) | 2016-09-30 | 2018-04-04 | Koninklijke KPN N.V. | Audio object processing based on spatial listener information |
US10952008B2 (en) * | 2017-01-05 | 2021-03-16 | Noveto Systems Ltd. | Audio communication system and method |
US20200120438A1 (en) * | 2018-10-10 | 2020-04-16 | Qualcomm Incorporated | Recursively defined audio metadata |
-
2019
- 2019-03-29 CN CN201980023775.1A patent/CN111937070B/zh active Active
- 2019-03-29 EP EP23183399.7A patent/EP4246443A3/en active Pending
- 2019-03-29 US US17/045,450 patent/US12081962B2/en active Active
- 2019-03-29 KR KR1020207027271A patent/KR102653185B1/ko active IP Right Grant
- 2019-03-29 BR BR112020020404-8A patent/BR112020020404A2/pt unknown
- 2019-03-29 EP EP19784293.3A patent/EP3779976B1/en active Active
- 2019-03-29 JP JP2020513201A patent/JP7226436B2/ja active Active
- 2019-03-29 WO PCT/JP2019/013932 patent/WO2019198540A1/ja active Application Filing
-
2023
- 2023-01-30 JP JP2023011572A patent/JP7485109B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014192602A1 (ja) | 2013-05-31 | 2014-12-04 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2019198540A1 (ja) | 2021-04-22 |
EP3779976A4 (en) | 2021-09-08 |
BR112020020404A2 (pt) | 2021-01-12 |
EP4246443A2 (en) | 2023-09-20 |
KR20200141989A (ko) | 2020-12-21 |
CN111937070A (zh) | 2020-11-13 |
WO2019198540A1 (ja) | 2019-10-17 |
KR102653185B1 (ko) | 2024-04-02 |
EP3779976B1 (en) | 2023-07-05 |
JP7485109B2 (ja) | 2024-05-16 |
US20210176582A1 (en) | 2021-06-10 |
EP4246443A3 (en) | 2023-11-22 |
JP2023033653A (ja) | 2023-03-10 |
US12081962B2 (en) | 2024-09-03 |
CN111937070B (zh) | 2024-09-27 |
EP3779976A1 (en) | 2021-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7226436B2 (ja) | 情報処理装置および方法、並びにプログラム | |
US10924876B2 (en) | Interpolating audio streams | |
US11429340B2 (en) | Audio capture and rendering for extended reality experiences | |
US11317236B2 (en) | Soundfield adaptation for virtual reality audio | |
US11089428B2 (en) | Selecting audio streams based on motion | |
US20240013795A1 (en) | Information processing device and method, and program | |
EP3695624B1 (en) | Rendering for computer-mediated reality systems | |
US11843932B2 (en) | Six degrees of freedom and three degrees of freedom backward compatibility | |
KR20220043159A (ko) | 공간 오디오 방향 파라미터의 양자화 | |
JP2022137213A (ja) | 信号処理装置および方法、並びにプログラム | |
US20180220255A1 (en) | Game streaming with spatial audio | |
EP4167600A2 (en) | A method and apparatus for low complexity low bitrate 6dof hoa rendering | |
US20220377488A1 (en) | Information processing apparatus and information processing method, and program | |
CN113170270A (zh) | 空间音频增强和再现 | |
WO2024214318A1 (ja) | 情報処理装置および方法、並びにプログラム | |
US11601776B2 (en) | Smart hybrid rendering for augmented reality/virtual reality audio | |
US20240129681A1 (en) | Scaling audio sources in extended reality systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230123 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7226436 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |