JP2019036987A - スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 - Google Patents
スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 Download PDFInfo
- Publication number
- JP2019036987A JP2019036987A JP2018194721A JP2018194721A JP2019036987A JP 2019036987 A JP2019036987 A JP 2019036987A JP 2018194721 A JP2018194721 A JP 2018194721A JP 2018194721 A JP2018194721 A JP 2018194721A JP 2019036987 A JP2019036987 A JP 2019036987A
- Authority
- JP
- Japan
- Prior art keywords
- screen
- audio
- metadata
- audio object
- azimuth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 45
- 238000013507 mapping Methods 0.000 claims description 76
- 238000009877 rendering Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 description 40
- 230000000007 visual effect Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4318—Generation of visual interfaces for content selection or interaction; Content or additional data rendering by altering the content in the rendering process, e.g. blanking, blurring or masking an image region
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
- H04N21/4516—Management of client data or end-user data involving client characteristics, e.g. Set-Top-Box type, software version or amount of memory available
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/15—Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Stereophonic System (AREA)
Abstract
【解決手段】オーディオオブジェクトをリマッピングする装置は、オブジェクトメタデータプロセッサ(110)と、オブジェクトレンダラ(120)とを備える。オブジェクトレンダラ(120)は、オーディオオブジェクトを受信するように構成されている。オブジェクトメタデータプロセッサ(110)は、オーディオオブジェクトがスクリーン関連であるか否かに関する指示を含んだオーディオオブジェクトの第1の位置をさらに含むメタデータを受信する。オブジェクトメタデータプロセッサ(110)は、オーディオオブジェクトがメタデータにおいてスクリーン関連であるとして指示されている場合、オーディオオブジェクトの第1の位置およびスクリーンのサイズに応じて、オーディオオブジェクトの第2の位置を計算する。
【選択図】図1
Description
は方位角スクリーン左端基準を示し、
は方位角スクリーン右端基準を示し、
は仰角スクリーン上端基準を示し、
は仰角スクリーン下端基準を示し、
は前記スクリーンの方位角スクリーン左端を示し、
は前記スクリーンの方位角スクリーン右端を示し、
は前記スクリーンの仰角スクリーン上端を示し、
は前記スクリーンの仰角スクリーン下端を示し、
は前記第1の方位角値を示し、
は第2の方位角値を示し、θは第1の仰角値を示し、θ'は第2の仰角値を示し、第2の方位角値
は、たとえば、以下の式に従って第1の線形マッピング関数による第1の方位角値
の第1のマッピングからもたらすことができ、
第2の仰角値θ'は、たとえば、以下の式に従って第2の線形マッピング関数による第1の仰角値θの第2のマッピングからもたらすことができる。
− オーディオオブジェクトを受信するステップ。
− オーディオオブジェクトがスクリーン関連であるか否かに関する指示を含み、オーディオオブジェクトの第1の位置をさらに含むメタデータを受信するステップ。
− オーディオオブジェクトがメタデータにおいてスクリーン関連であるとして指示されている場合、オーディオオブジェクトの第1の位置およびスクリーンのサイズに応じて、オーディオオブジェクトの第2の位置を計算するステップ。
− オーディオオブジェクトおよび位置情報に応じてスピーカ信号を生成するステップ。
をとるように、オーディオオブジェクトの第1の位置に応じて、かつスクリーンのサイズに応じて、オーディオオブジェクトの第2の位置を計算するように構成されてもよい。
表1:例示的なメタデータ
表2:スクリーン関連レンダリングを制御するためのメタデータおよびそれらの意味:
表3−一実施形態によるObjectMetadataConfig()の構文
hasOnScreenObjects このフラグはスクリーン関連オブジェクトが存在するか否かを指定する。
isScreenRelatedObject このフラグは、オブジェクト位置がスクリーン相対的であるか否かを規定する(位置は、それらのオブジェクト位置がリマッピングされるが、依然としてすべての有効な角度値を含むことができるように、別様にレンダリングされるべきである。
isOnScreenObject このフラグは、対応するオブジェクトが「オンスクリーン(onscreen)」であることを規定する。このフラグが1に等しいオブジェクトは、それらの位置がスクリーン領域上の値のみをとるように、別様にレンダリングされるべきである。代替形態によれば、フラグは使用されず、基準スクリーン角度が規定される。ScreenRelativeObject=1である場合、すべての角度がこの基準角度に対して相対的である。オーディオオブジェクトがスクリーン上にあると分かっている必要がある他の使用事例があり得る。
a)スクリーン相対的オーディオ要素
b)オンスクリーンオーディオ要素
未知のスクリーンサイズ挙動に関して、
再生スクリーンサイズが与えられていない場合、
− デフォルトのスクリーンサイズが仮定されるか、または
― たとえオブジェクトがスクリーン関連またはオンスクリーンとしてマークされている場合であっても、マッピングは適用されない。
プレレンダリング済みオブジェクト:オブジェクト信号は、符号化前に22.2チャネル信号にプレレンダリングおよび混合される。後続のコード化チェーンは、22.2チャネル信号を考慮する。
離散オブジェクト波形:オブジェクトは、モノラル波形としてUSAC符号化器820に供給される。USAC符号化器820は、単一チャネル要素SCEを使用して、チャネル信号に加えてオブジェクトを送信する。復号されたオブジェクトは、受信機側でレンダリングおよび混合される。圧縮オブジェクトメタデータ情報が、受信機/レンダラにともに送信される。
パラメトリックオブジェクト波形:オブジェクト特性およびそれらの互いに対する関連が、SAOCパラメータによって記述される。オブジェクト信号のダウンミックスが、USAC符号化器820によってUSACを用いてコード化される。パラメトリック情報がともに送信される。ダウンミックスチャネルの数は、オブジェクトの数と全体的なデータレートに応じて選択される。圧縮オブジェクトメタデータ情報が、SAOCレンダラに送信される。
を処理することができる。
は、デフォルト値(デフォルトの仮定される標準スクリーンサイズおよびデフォルトの仮定される標準スクリーン位置)として設定されるか、または、それらは、メタデータ内に(たとえば、その後そこで再生/モニタリングスクリーンサイズを与え得る再生者によって)存在し得る。
表4−一実施形態によるObjectMetadataConfig()の構文
hasScreenRelativeObjects このフラグはスクリーン関連オブジェクトが存在するか否かを指定する。
hasScreenSize このフラグは公称スクリーンサイズが定義されるか否かを指定する。この定義は、スクリーン端部に対応する視野角を介して行われる。hasScreenSizeがゼロである場合、以下の値がデフォルトとして使用される。
bsScreenSizeAz このフィールドは、スクリーン左端およびスクリーン右端に対応する方位角を定義する。
bsScreenSizeTopEl このフィールドは、スクリーン上端に対応する仰角を定義する。
bsScreenSizeBottomEl このフィールドは、スクリーン下端に対応する仰角を定義する。
isScreenRelativeObject このフラグは、オブジェクト位置がスクリーン相対的であるか否かを規定する(位置は、それらのオブジェクト位置がリマッピングされるが、依然としてすべての有効な角度値を含むことができるように、別様にレンダリングされるべきである。
表5:一実施形態によるObjectMetadataConfig()の構文
表6−一実施形態によるObjectMetadataConfig()の構文
hasOnScreenObjects このフラグはスクリーン関連オブジェクトが存在するか否かを指定する。
isScreenRelatedObject このフラグは、オブジェクト位置がスクリーン相対的であるか否かを規定する(位置は、それらのオブジェクト位置がリマッピングされるが、依然としてすべての有効な角度値を含むことができるように、別様にレンダリングされるべきである)。
isOnScreenObject このフラグは、対応するオブジェクトが「オンスクリーン」であるか否かを規定する。このフラグが1に等しいオブジェクトは、それらの位置がスクリーン領域上の値のみをとるように、別様にレンダリングされるべきである。
との間の位置が、スクリーン左端
にマッピングされる。右半球および仰角は同じように処理される(図15内の破線でないマッピング関数1510)。
との間の値が、0°と
との間の値にマッピングされる。右半球および仰角は同じように処理される(図15内の破線のマッピング関数1520)。
]ならびに[−180°および
]向けに意図されているすべてのオンスクリーンオブジェクトをスクリーン上に「投影」するためのフラグ)によってシグナリングされ得る。
Claims (15)
- スピーカ信号を生成するための装置であって、
オブジェクトメタデータプロセッサ(110)と、
オブジェクトレンダラ(120)と、を備え、
前記オブジェクトレンダラ(120)は、オーディオオブジェクトを受信するように構成されており、
前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトがスクリーン関連であるか否かに関する指示を含むとともに前記オーディオオブジェクトの第1の位置をさらに含むメタデータを受信するように構成されており、
前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトが前記メタデータにおいてスクリーン関連であるとして指示されている場合、前記オーディオオブジェクトの前記第1の位置に応じて、かつスクリーンのサイズに応じて、前記オーディオオブジェクトの第2の位置を計算するように構成されており、
前記オブジェクトレンダラ(120)は、前記オーディオオブジェクトおよび位置情報に応じて前記スピーカ信号を生成するように構成されており、
前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトが前記メタデータにおいてスクリーン関連でないとして指示されている場合、前記オーディオオブジェクトの前記第1の位置を前記位置情報として前記オブジェクトレンダラ(120)に供給するように構成されており、
前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトが前記メタデータにおいてスクリーン関連であるとして指示されている場合、前記オーディオオブジェクトの前記第2の位置を前記位置情報として前記オブジェクトレンダラ(120)に供給するように構成されている装置。 - 前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトが前記メタデータにおいてスクリーン関連でないとして指示されている場合、前記オーディオオブジェクトの前記第2の位置を計算しないように構成されている請求項1に記載の装置。
- 前記オブジェクトレンダラ(120)は、前記位置情報が前記オーディオオブジェクトの前記第1の位置または前記オーディオオブジェクトの前記第2の位置であるかを決定しないように構成されている請求項1または2に記載の装置。
- 前記オブジェクトレンダラ(120)はさらに再生環境の前記スピーカの数に応じて前記スピーカ信号を生成するように構成されている請求項1から3のいずれか一項に記載の装置。
- 前記オブジェクトレンダラ(120)は、前記再生環境の前記スピーカの各々のスピーカ位置にさらに応じて前記スピーカ信号を生成するように構成されている請求項4に記載の装置。
- 前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトが前記メタデータにおいてスクリーン関連であるとして指示されている場合、前記オーディオオブジェクトの前記第1の位置および前記スクリーンの前記サイズに応じて、前記オーディオオブジェクトの前記第2の位置を計算するように構成され、前記第1の位置は3次元空間内の前記第1の位置を示し、前記第2の位置は前記3次元空間内の前記第2の位置を示す請求項1から5のいずれか一項に記載の装置。
- 前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトが前記メタデータにおいてスクリーン関連であるとして指示されている場合、前記オーディオオブジェクトの前記第1の位置に応じて、かつ前記スクリーンの前記サイズに応じて、前記オーディオオブジェクトの前記第2の位置を計算するように構成され、前記第1の位置は第1の方位角、第1の仰角および第1の距離を示し、前記第2の位置は第2の方位角、第2の仰角および第2の距離を示す請求項6に記載の装置。
- 前記オブジェクトメタデータプロセッサ(110)は、第1の指示として前記オーディオオブジェクトがスクリーン関連であるか否かに関する指示を含み、前記オーディオオブジェクトがスクリーン関連である場合、第2の指示をさらに含む前記メタデータを受信するように構成されており、前記第2の指示は、前記オーディオオブジェクトがオンスクリーンオブジェクトであるか否かを指示し、
前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトがオンスクリーンオブジェクトであることを前記第2の指示が指示する場合、前記第2の位置が前記スクリーンのスクリーン領域上の第1の値をとるように、前記オーディオオブジェクトの前記第1の位置および前記スクリーンの前記サイズに応じて、前記オーディオオブジェクトの前記第2の位置を計算するように構成されている請求項1から7のいずれか一項に記載の装置。 - 前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトが前記オンスクリーンオブジェクトでないことを前記第2の指示が指示する場合、スクリーン領域にあるかないかのいずれかである第2の値を前記第2の位置がとるように、前記オーディオオブジェクトの前記第1の位置に応じてかつ前記スクリーンの前記サイズに応じて、前記オーディオオブジェクトの前記第2の位置を計算するように構成されている、請求項8に記載の装置。
- 前記オブジェクトメタデータプロセッサ(110)は、第1の指示として前記オーディオオブジェクトがスクリーン関連であるか否かに関する指示を含み、前記オーディオオブジェクトがスクリーン関連である場合に、第2の指示をさらに含む、前記メタデータを受信するように構成されており、前記第2の指示は、前記オーディオオブジェクトがオンスクリーンオブジェクトであるか否かを指示し、
前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトがオンスクリーンオブジェクトであることを前記第2の指示が指示する場合、前記オーディオオブジェクトの前記第1の位置、前記スクリーンの前記サイズ、および、マッピング曲線としての第1のマッピング曲線に応じて前記オーディオオブジェクトの前記第2の位置を計算するように構成されており、前記第1のマッピング曲線は、第1の値間隔における元のオブジェクト位置の、第2の値間隔におけるリマッピングされたオブジェクト位置に対するマッピングを定義し、
前記オブジェクトメタデータプロセッサ(110)は、前記オーディオオブジェクトがオンスクリーンオブジェクトでないことを前記第2の指示が指示する場合、前記オーディオオブジェクトの前記第1の位置、前記スクリーンの前記サイズ、および、前記マッピング曲線としての第2のマッピング曲線に応じて前記オーディオオブジェクトの前記第2の位置を計算するように構成されており、前記第2のマッピング曲線は、前記第1の値間隔における元のオブジェクト位置の、第3の値間隔におけるリマッピングされたオブジェクト位置に対するマッピングを定義し、前記第2の値間隔は前記第3の値間隔によって含まれ、前記第2の値間隔は前記第3の値間隔よりも小さい請求項1から7のいずれか一項に記載の装置。 - 前記第1の値間隔、前記第2の値間隔および前記第3の値間隔は、方位角の値間隔であるか、または
前記第1の値間隔、前記第2の値間隔および前記第3の値間隔は仰角の値間隔である請求項10に記載の装置。 - 前記オブジェクトメタデータプロセッサ(110)は、第1の線形マッピング関数および第2の線形マッピング関数の少なくとも1つに応じて前記オーディオオブジェクトの前記第2の位置を計算するように構成されており、
前記第1の線形マッピング関数は、第1の方位角値を第2の方位角値にマッピングするように定義されており、
前記第2の線形マッピング関数は、第1の仰角値を第2の仰角値にマッピングするように定義されており、
は方位角スクリーン左端基準を示し、
は方位角スクリーン右端基準を示し、
は仰角スクリーン上端基準を示し、
は仰角スクリーン下端基準を示し、
は前記スクリーンの方位角スクリーン左端を示し、
は前記スクリーンの方位角スクリーン右端を示し、
は前記スクリーンの仰角スクリーン上端を示し、
は前記スクリーンの仰角スクリーン下端を示し、
は前記第1の方位角値を示し、
は前記第2の方位角値を示し、
θは前記第1の仰角値を示し、
θ'は前記第2の仰角値を示し、
前記第2の方位角値
は、以下の式に従って前記第1の線形マッピング関数による前記第1の方位角値
の第1のマッピングからもたらされ、
前記第2の仰角値θ'は、以下の式に従って前記第2の線形マッピング関数による前記第1の仰角値θの第2のマッピングからもたらされる請求項1から11のいずれか一項に記載の装置。
- 復号器デバイスであって、
1つまたは複数のオーディオ入力チャネルを取得し、1つまたは複数の入力オーディオオブジェクトを取得し、圧縮オブジェクトメタデータを取得し、1つまたは複数のSAOCトランスポートチャネルを取得するためにビットストリームを復号するためのUSAC復号器(910)と、
1つまたは複数のレンダリングされたオーディオオブジェクトから成る第1のグループを取得するために前記1つまたは複数のSAOCトランスポートチャネルを復号するためのSAOC復号器(915)と、
請求項1から12のいずれか一項に記載の装置(917)であって、
請求項1から12のいずれか一項に記載の装置の前記オブジェクトメタデータプロセッサ(110)であり、前記圧縮オブジェクトメタデータを復号して非圧縮メタデータを取得するために実装されるオブジェクトメタデータ復号器(918)、及び
前記非圧縮メタデータに応じて前記1つまたは複数の入力オーディオオブジェクトをレンダリングして、1つまたは複数のレンダリングされたオーディオオブジェクトから成る第2のグループを取得するための、請求項1から12のいずれか一項に記載の装置の前記オブジェクトレンダラ(920;120)を有する装置(917)と、
1つまたは複数の変換済みチャネルを取得するために前記1つまたは複数のオーディオ入力チャネルを変換するためのフォーマット変換器(922)と、
1つまたは複数の復号オーディオチャネルを取得するために、前記1つまたは複数のレンダリングされたオーディオオブジェクトから成る第1のグループの前記1つまたは複数のオーディオオブジェクト、前記1つまたは複数のレンダリングされたオーディオオブジェクトから成る第2のグループの前記1つまたは複数のオーディオオブジェクト、および、1つまたは複数の変換済みオーディオチャネルを混合するための混合器(930)と、
を備えた復号器デバイス。 - スピーカ信号を生成するための方法であって、
オーディオオブジェクトを受信するステップと、
前記オーディオオブジェクトがスクリーン関連であるか否かに関する指示を含み、前記オーディオオブジェクトの第1の位置をさらに含むメタデータを受信するステップと、
前記オーディオオブジェクトが前記メタデータにおいてスクリーン関連であるとして指示されている場合、前記オーディオオブジェクトの前記第1の位置およびスクリーンのサイズに応じて、前記オーディオオブジェクトの第2の位置を計算するステップと、
前記オーディオオブジェクトおよび位置情報に応じて前記スピーカ信号を生成するステップと、を含み、
前記オーディオオブジェクトが前記メタデータにおいてスクリーン関連でないとして指示されている場合、前記位置情報は、前記オーディオオブジェクトの前記第1の位置であり、
前記オーディオオブジェクトが前記メタデータにおいてスクリーン関連であるとして指示されている場合、前記位置情報は、前記オーディオオブジェクトの前記第2の位置である方法。 - コンピュータまたは信号プロセッサ上で実行されるときに請求項14に記載の方法を実施するためのコンピュータプログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14161819 | 2014-03-26 | ||
EP14161819.9 | 2014-03-26 | ||
EP14196769.5A EP2928216A1 (en) | 2014-03-26 | 2014-12-08 | Apparatus and method for screen related audio object remapping |
EP14196769.5 | 2014-12-08 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016559292A Division JP6422995B2 (ja) | 2014-03-26 | 2015-03-25 | スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020118271A Division JP2020182227A (ja) | 2014-03-26 | 2020-07-09 | スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019036987A true JP2019036987A (ja) | 2019-03-07 |
JP6734343B2 JP6734343B2 (ja) | 2020-08-05 |
Family
ID=52015948
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016559292A Active JP6422995B2 (ja) | 2014-03-26 | 2015-03-25 | スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 |
JP2018194721A Active JP6734343B2 (ja) | 2014-03-26 | 2018-10-16 | スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 |
JP2020118271A Pending JP2020182227A (ja) | 2014-03-26 | 2020-07-09 | スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 |
JP2023174101A Pending JP2023175947A (ja) | 2014-03-26 | 2023-10-06 | スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016559292A Active JP6422995B2 (ja) | 2014-03-26 | 2015-03-25 | スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020118271A Pending JP2020182227A (ja) | 2014-03-26 | 2020-07-09 | スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 |
JP2023174101A Pending JP2023175947A (ja) | 2014-03-26 | 2023-10-06 | スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 |
Country Status (19)
Country | Link |
---|---|
US (4) | US10192563B2 (ja) |
EP (4) | EP2928216A1 (ja) |
JP (4) | JP6422995B2 (ja) |
KR (1) | KR101920356B1 (ja) |
CN (2) | CN106463128B (ja) |
AR (1) | AR099835A1 (ja) |
AU (1) | AU2015238354B2 (ja) |
BR (1) | BR112016022045B1 (ja) |
CA (1) | CA2943570C (ja) |
ES (2) | ES2723965T3 (ja) |
FI (1) | FI3487189T3 (ja) |
MX (1) | MX355455B (ja) |
MY (1) | MY184715A (ja) |
PL (2) | PL3123741T3 (ja) |
PT (2) | PT3123741T (ja) |
RU (1) | RU2683380C2 (ja) |
SG (1) | SG11201607953TA (ja) |
TW (1) | TWI595785B (ja) |
WO (1) | WO2015144766A1 (ja) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
EP2928216A1 (en) | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
US9940937B2 (en) * | 2014-10-10 | 2018-04-10 | Qualcomm Incorporated | Screen related adaptation of HOA content |
CN106797499A (zh) | 2014-10-10 | 2017-05-31 | 索尼公司 | 编码装置和方法、再现装置和方法以及程序 |
CN106303897A (zh) * | 2015-06-01 | 2017-01-04 | 杜比实验室特许公司 | 处理基于对象的音频信号 |
CN107615767B (zh) | 2015-06-02 | 2021-05-25 | 索尼公司 | 发送装置、发送方法、媒体处理装置、媒体处理方法以及接收装置 |
CN113055801B (zh) * | 2015-07-16 | 2023-04-07 | 索尼公司 | 信息处理装置、信息处理方法及计算机可读介质 |
DE102015220595A1 (de) * | 2015-10-22 | 2017-04-27 | Robert Bosch Gmbh | Batteriezelle mit teilweise flexibel formbarer Wandung |
WO2017087564A1 (en) * | 2015-11-20 | 2017-05-26 | Dolby Laboratories Licensing Corporation | System and method for rendering an audio program |
US9854375B2 (en) * | 2015-12-01 | 2017-12-26 | Qualcomm Incorporated | Selection of coded next generation audio data for transport |
JP2019518373A (ja) | 2016-05-06 | 2019-06-27 | ディーティーエス・インコーポレイテッドDTS,Inc. | 没入型オーディオ再生システム |
BR112018074203A2 (pt) * | 2016-05-30 | 2019-05-14 | Sony Corporation | dispositivo e método de processamento audiovisual, e, programa |
US10979844B2 (en) | 2017-03-08 | 2021-04-13 | Dts, Inc. | Distributed audio virtualization systems |
US10972859B2 (en) * | 2017-04-13 | 2021-04-06 | Sony Corporation | Signal processing apparatus and method as well as program |
EP3618463A4 (en) * | 2017-04-25 | 2020-04-29 | Sony Corporation | SIGNAL PROCESSING DEVICE, METHOD AND PROGRAM |
US10986457B2 (en) * | 2017-07-09 | 2021-04-20 | Lg Electronics Inc. | Method and device for outputting audio linked with video screen zoom |
CN111133775B (zh) * | 2017-09-28 | 2021-06-08 | 株式会社索思未来 | 音响信号处理装置以及音响信号处理方法 |
WO2019149337A1 (en) | 2018-01-30 | 2019-08-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatuses for converting an object position of an audio object, audio stream provider, audio content production system, audio playback apparatus, methods and computer programs |
CN111801952A (zh) * | 2018-03-08 | 2020-10-20 | 索尼公司 | 信息处理装置、信息处理方法、信息处理系统和程序 |
KR102637876B1 (ko) | 2018-04-10 | 2024-02-20 | 가우디오랩 주식회사 | 메타데이터를 이용하는 오디오 신호 처리 방법 및 장치 |
KR20210030279A (ko) * | 2018-07-04 | 2021-03-17 | 소니 주식회사 | 정보 처리 장치 및 방법, 그리고 프로그램 |
GB2577698A (en) * | 2018-10-02 | 2020-04-08 | Nokia Technologies Oy | Selection of quantisation schemes for spatial audio parameter encoding |
WO2021186104A1 (en) * | 2020-03-16 | 2021-09-23 | Nokia Technologies Oy | Rendering encoded 6dof audio bitstream and late updates |
US11743670B2 (en) * | 2020-12-18 | 2023-08-29 | Qualcomm Incorporated | Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications |
GB202118094D0 (en) * | 2021-12-14 | 2022-01-26 | Nokia Technologies Oy | A method and apparatus for AR scene modification |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009278381A (ja) * | 2008-05-14 | 2009-11-26 | Nippon Hoso Kyokai <Nhk> | 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置 |
JP2013187908A (ja) * | 2012-03-06 | 2013-09-19 | Thomson Licensing | 高次アンビソニックス・オーディオ信号の再生のための方法および装置 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030007648A1 (en) * | 2001-04-27 | 2003-01-09 | Christopher Currell | Virtual audio system and techniques |
DE10154932B4 (de) | 2001-11-08 | 2008-01-03 | Grundig Multimedia B.V. | Verfahren zur Audiocodierung |
DE10305820B4 (de) | 2003-02-12 | 2006-06-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Bestimmen einer Wiedergabeposition |
US7606372B2 (en) * | 2003-02-12 | 2009-10-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Device and method for determining a reproduction position |
US7548657B2 (en) * | 2005-06-25 | 2009-06-16 | General Electric Company | Adaptive video compression of graphical user interfaces using application metadata |
CN102099854B (zh) * | 2008-07-15 | 2012-11-28 | Lg电子株式会社 | 处理音频信号的方法和装置 |
KR101387902B1 (ko) | 2009-06-10 | 2014-04-22 | 한국전자통신연구원 | 다객체 오디오 신호를 부호화하는 방법 및 부호화 장치, 복호화 방법 및 복호화 장치, 그리고 트랜스코딩 방법 및 트랜스코더 |
CN102549655B (zh) * | 2009-08-14 | 2014-09-24 | Dts有限责任公司 | 自适应成流音频对象的系统 |
ES2644520T3 (es) * | 2009-09-29 | 2017-11-29 | Dolby International Ab | Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia |
CN116419138A (zh) * | 2010-03-23 | 2023-07-11 | 杜比实验室特许公司 | 音频再现方法和声音再现系统 |
EP2450880A1 (en) | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
AR088777A1 (es) * | 2011-03-18 | 2014-07-10 | Fraunhofer Ges Forschung | Transmision de longitud de elemento de cuadro en la codificacion de audio |
AU2012279349B2 (en) * | 2011-07-01 | 2016-02-18 | Dolby Laboratories Licensing Corporation | System and tools for enhanced 3D audio authoring and rendering |
HUE054452T2 (hu) * | 2011-07-01 | 2021-09-28 | Dolby Laboratories Licensing Corp | Rendszer és eljárás adaptív hangjel elõállítására, kódolására és renderelésére |
EP2637327A1 (en) | 2012-03-09 | 2013-09-11 | Harman International Industries Ltd. | Audio mixing console with lighting control and method of mixing by means of a mixing console |
US9190065B2 (en) * | 2012-07-15 | 2015-11-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
US9479886B2 (en) * | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
WO2014032709A1 (en) * | 2012-08-29 | 2014-03-06 | Huawei Technologies Co., Ltd. | Audio rendering system |
EP2928216A1 (en) * | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
-
2014
- 2014-12-08 EP EP14196769.5A patent/EP2928216A1/en not_active Withdrawn
-
2015
- 2015-03-16 TW TW104108296A patent/TWI595785B/zh active
- 2015-03-25 BR BR112016022045-5A patent/BR112016022045B1/pt active IP Right Grant
- 2015-03-25 RU RU2016141642A patent/RU2683380C2/ru active
- 2015-03-25 MY MYPI2016001725A patent/MY184715A/en unknown
- 2015-03-25 PL PL15716439T patent/PL3123741T3/pl unknown
- 2015-03-25 ES ES15716439T patent/ES2723965T3/es active Active
- 2015-03-25 KR KR1020167029805A patent/KR101920356B1/ko active IP Right Grant
- 2015-03-25 EP EP18248305.7A patent/EP3487189B1/en active Active
- 2015-03-25 EP EP23167354.2A patent/EP4254988A3/en active Pending
- 2015-03-25 EP EP15716439.3A patent/EP3123741B1/en active Active
- 2015-03-25 AR ARP150100877A patent/AR099835A1/es active IP Right Grant
- 2015-03-25 PT PT15716439T patent/PT3123741T/pt unknown
- 2015-03-25 AU AU2015238354A patent/AU2015238354B2/en active Active
- 2015-03-25 FI FIEP18248305.7T patent/FI3487189T3/fi active
- 2015-03-25 WO PCT/EP2015/056417 patent/WO2015144766A1/en active Application Filing
- 2015-03-25 JP JP2016559292A patent/JP6422995B2/ja active Active
- 2015-03-25 PL PL18248305.7T patent/PL3487189T3/pl unknown
- 2015-03-25 SG SG11201607953TA patent/SG11201607953TA/en unknown
- 2015-03-25 CN CN201580026227.6A patent/CN106463128B/zh active Active
- 2015-03-25 CA CA2943570A patent/CA2943570C/en active Active
- 2015-03-25 MX MX2016012286A patent/MX355455B/es active IP Right Grant
- 2015-03-25 CN CN202010076120.5A patent/CN111276153B/zh active Active
- 2015-03-25 PT PT182483057T patent/PT3487189T/pt unknown
- 2015-03-25 ES ES18248305T patent/ES2953685T3/es active Active
-
2016
- 2016-09-23 US US15/274,310 patent/US10192563B2/en active Active
-
2018
- 2018-10-16 JP JP2018194721A patent/JP6734343B2/ja active Active
- 2018-12-28 US US16/236,079 patent/US10854213B2/en active Active
-
2020
- 2020-07-09 JP JP2020118271A patent/JP2020182227A/ja active Pending
- 2020-11-17 US US16/950,768 patent/US11527254B2/en active Active
-
2022
- 2022-11-18 US US18/057,188 patent/US11900955B2/en active Active
-
2023
- 2023-10-06 JP JP2023174101A patent/JP2023175947A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009278381A (ja) * | 2008-05-14 | 2009-11-26 | Nippon Hoso Kyokai <Nhk> | 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置 |
JP2013187908A (ja) * | 2012-03-06 | 2013-09-19 | Thomson Licensing | 高次アンビソニックス・オーディオ信号の再生のための方法および装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6422995B2 (ja) | スクリーン関連オーディオオブジェクトリマッピングのための装置および方法 | |
JP7116144B2 (ja) | 空間的に拡散したまたは大きなオーディオ・オブジェクトの処理 | |
KR102127955B1 (ko) | 고차 앰비소닉 오디오 신호의 재생 방법 및 장치 | |
JP6045696B2 (ja) | オーディオ信号処理方法および装置 | |
RU2617553C2 (ru) | Система и способ для генерирования, кодирования и представления данных адаптивного звукового сигнала | |
JP6055576B2 (ja) | 任意のスピーカー・レイアウトへのオーディオ・オブジェクトのパン | |
US20170086008A1 (en) | Rendering Virtual Audio Sources Using Loudspeaker Map Deformation | |
JP6622388B2 (ja) | ビデオ画像に関連付けられているオーディオ信号を処理する方法および装置 | |
KR20150111117A (ko) | 오디오 신호 처리 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181114 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190924 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20191216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200609 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200709 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6734343 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |