JPWO2019187437A1 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JPWO2019187437A1 JPWO2019187437A1 JP2020509662A JP2020509662A JPWO2019187437A1 JP WO2019187437 A1 JPWO2019187437 A1 JP WO2019187437A1 JP 2020509662 A JP2020509662 A JP 2020509662A JP 2020509662 A JP2020509662 A JP 2020509662A JP WO2019187437 A1 JPWO2019187437 A1 JP WO2019187437A1
- Authority
- JP
- Japan
- Prior art keywords
- information
- file
- audio data
- angle
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 99
- 238000003672 processing method Methods 0.000 title claims abstract description 8
- 230000000153 supplemental effect Effects 0.000 claims description 55
- 230000006978 adaptation Effects 0.000 claims description 20
- 238000010586 diagram Methods 0.000 abstract description 40
- 230000005540 biological transmission Effects 0.000 abstract description 12
- 238000000034 method Methods 0.000 description 64
- 238000004891 communication Methods 0.000 description 35
- 230000011664 signaling Effects 0.000 description 32
- 230000004048 modification Effects 0.000 description 25
- 238000012986 modification Methods 0.000 description 25
- 230000001755 vocal effect Effects 0.000 description 24
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 21
- 238000007726 management method Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 20
- 230000008859 change Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 17
- 230000007246 mechanism Effects 0.000 description 13
- 238000005520 cutting process Methods 0.000 description 12
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 11
- HMUNWXXNJPVALC-UHFFFAOYSA-N 1-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C(CN1CC2=C(CC1)NN=N2)=O HMUNWXXNJPVALC-UHFFFAOYSA-N 0.000 description 6
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- LDXJRKWFNNFDSA-UHFFFAOYSA-N 2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound C1CN(CC2=NNN=C21)CC(=O)N3CCN(CC3)C4=CN=C(N=C4)NCC5=CC(=CC=C5)OC(F)(F)F LDXJRKWFNNFDSA-UHFFFAOYSA-N 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- OHVLMTFVQDZYHP-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CN1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O OHVLMTFVQDZYHP-UHFFFAOYSA-N 0.000 description 4
- IHCCLXNEEPMSIO-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperidin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 IHCCLXNEEPMSIO-UHFFFAOYSA-N 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 101000634707 Homo sapiens Nucleolar complex protein 3 homolog Proteins 0.000 description 2
- 102100029099 Nucleolar complex protein 3 homolog Human genes 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical compound C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 2
- 230000001151 other effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2353—Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2355—Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/23614—Multiplexing of additional data and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2668—Creating a channel for a dedicated end-user group, e.g. insertion of targeted commercials based on end-user profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
<<1.はじめに>>
<<2.構成例>>
<<3.オブジェクト選択情報の例(実施例1)>>
<<4.表示状態を考慮したファイル化の例(実施例2)>>
<<5.時間変化しない場合のシグナリング例(実施例3)>>
<<6.時間変化する場合のシグナリング例(実施例4)>>
<<7.応用例>>
<<8.ハードウェア構成例>>
<<9.むすび>>
<1−1.背景>
まず、本開示の背景について説明する。
そこで、以下に説明する本開示の一実施形態では、表示状態に応じて利用するオブジェクトオーディオデータを選択して取得する手法(以下、提案手法と呼ぶ)が採用される。例えばサーバが表示状態ごとに必要となるオブジェクトオーディオデータを予め全て記憶しておき、クライアントが表情状態に応じたオブジェクトオーディオデータを選択して取得することにより、かかる提案手法が実現され得る。
<2−1.システム構成例>
まず、図7を参照して、本実施形態にかかる情報処理システムのシステム構成例について説明する。図7は、本実施形態にかかる情報処理システムのシステム構成例を示すブロック図である。
上記では、本実施形態に係る情報処理システムのシステム構成例について説明した。続いて、図8を参照して、サーバ100の機能構成例について説明する。図8は、本実施形態にかかるサーバ100の機能構成例を示すブロック図である。図8に示すように、サーバ100は、生成部110と、制御部120と、通信部130と、記憶部140と、を備える。
上記では、サーバ100の機能構成例について説明した。続いて、図9を参照して、クライアント200の機能構成例について説明する。図9は、本実施形態にかかるクライアント200の機能構成例を示すブロック図である。図9に示すように、クライアント200は、処理部210と、制御部220と、通信部230と、記憶部240と、センサ部250と、表示部260と、スピーカ270と、を備える。
以上、本実施形態の構成例について説明した。続いて、本実施形態において、表示状態に応じて利用されるオブジェクトオーディオデータを選択するためのオブジェクト選択情報、及び当該オブジェクト選択情報を用いたオブジェクトオーディオデータ選択に関し、2つの実施例(実施例1−1、実施例1−2)を説明する。
まず、実施例1−1として、画角を用いたオブジェクト選択情報の例について説明する。上述したように、クライアント200の制御部220は、処理部210から提供された復号画像を表示部260にそのまま表示させてもよいし、切り出し処理により切り出された切り出し画像を表示部260に表示させてもよい。ここで、復号画像がそのまま表示される場合と、切り出された切り出し画像が表示される場合とで、表示状態が異なり、クライアント200が取得すべきオブジェクトオーディオデータが異なり得る。このような切り出し処理による、取得すべきオブジェクトオーディオデータの違いについて、図10を参照して説明を行う。なお、以下の説明では、主に水平画角について説明するが垂直画角についても同様である。
・切り出した画像の方向に関する方向情報
・切り出した画像の画角に関する切り出し画角情報
・表示された画像に対する視聴時の画角に関する視聴画角情報
・利用するオブジェクトオーディオデータに関する利用情報
なお、上記の情報うち、切り出し画角情報、及び視聴画角情報をまとめて単に画角情報と呼ぶ場合もある。
以上、実施例1−1として、画角を用いたオブジェクト選択情報の実施例について説明した。続いて、実施例1−2として、オブジェクト間の角度を用いたオブジェクト選択情報の例について説明する。以下に説明する実施例1−2では、視聴時の2つのオブジェクトの位置とユーザの視聴位置から、当該2つのオブジェクト間の角度を算出し、オブジェクト間の角度に基づいて利用するオブジェクトオーディオデータが選択される。
・角度を算出する2つのオブジェクトの位置情報
・2つのオブジェクト間の角度に関する角度情報
・利用するオブジェクトオーディオデータに関する利用情報
以上、オブジェクト選択情報、及びオブジェクト選択情報を用いたオブジェクトオーディオデータ選択の例として、2つの実施例(実施例1−1、実施例1−2)を説明した。続いて、実施例2として、複数の表示状態を考慮してオブジェクトオーディオデータをファイル化する実施例について説明を行う。なお、以下に説明する実施例2は、上述した実施例と任意に組合せることが可能であり、実施例1−1、実施例1−2のいずれと組み合わされてもよい。
以上、実施例2として、複数の表示状態を考慮してオブジェクトオーディオデータをファイル化する実施例について説明した。続いて、利用するオブジェクトオーディオデータの組合せが時間変化しない場合のオブジェクト選択情報のシグナリング例について説明する。
まず、実施例3−1として、実施例1−1で説明した画角を用いたオブジェクト選択情報をシグナリングする実施例について説明する。本実施例では、実施例1−1で説明した利用情報がファイルレベルでシグナリングされ、MPEG-DASHで実現する場合、利用情報をAdaptationSetレベルでシグナリングすればよい。
・水平方向の角度の情報と垂直方向の角度の情報を含む方向情報
・切り出した画像の水平画角の範囲の情報と、垂直画角の範囲の情報を含む切り出し画角情報
・表示された画像に対する視聴時の水平画角の範囲の情報と、垂直画角の範囲の情報を含む視聴画角情報
・利用するオブジェクトオーディオデータを含むAdaptationSetをすべて示す利用情報
以上、実施例3−1として、画角を用いたオブジェクト選択情報をシグナリングする実施例について説明した。続いて、実施例3−2として、実施例1−2で説明したオブジェクト間の角度を用いたオブジェクト選択情報をシグナリングする実施例について説明する。本実施例では、実施例1−2で説明した利用情報がファイルレベルでシグナリングされ、MPEG-DASHで実現する場合、利用情報をAdaptationSetレベルでシグナリングすればよい。
・角度を算出する2つのオブジェクトの位置情報
・閾値となるオブジェクト間の角度の範囲の情報を含む角度情報
・利用するオブジェクトオーディオデータを含むAdaptationSetをすべて示す利用情報
図25のMPDファイルでは、3行目に示されるようにPreselectionのpreselectionComponentsで既定(default)のAdaptationSetの組合せは”o2 o3”である。また、図25のMPDファイルでは、既定の組合せとは異なる組合せになる2パターンのSupplementalPropertyが4行目〜5行目に示されている。このように、既定のAdaptationSetの組合せを予め決めておくことで、各表示状態で利用するオブジェクトオーディオデータが異なるものについてのみSupplementalPropertyを用意すればよい。
以上、利用するオブジェクトオーディオデータの組合せが時間変化しない場合のオブジェクト選択情報のシグナリング例について説明した。続いて、利用するオブジェクトオーディオデータの組合せが時間変化する場合のオブジェクト選択情報のシグナリング例について説明する。なお、利用するオブジェクトオーディオデータの組合せが時間変化するか否かは、例えばコンテンツの制作者が適宜選択し得る。
まず、実施例4−1として、拡張されたメタデータファイルをセグメントファイル生成部113が生成する例を説明する。
以上、実施例4−1として、拡張されたメタデータファイルについて説明した。続いて、実施例4−2として、オブジェクト選択のための専用のメタデータファイル(以下、オブジェクト選択メタデータファイルと称する)を生成する例について、図34、図35を参照して説明する。本実施例において、オブジェクト選択メタデータファイルは、セグメントファイル生成部113により生成され、オブジェクト選択情報のみを含むファイルであってよい。
続いて、実施例4−3として、実施例1−1で説明した画角を用いたオブジェクト選択情報を上述したメタデータファイルに格納する実施例について説明する。本実施例は、上述した実施例4−1、実施例4−2のいずれと組み合わされてもよい。以下では、本実施例にかかるobjectSelectionMetadataConfigurationBoxとobjectSelectionMetadataについて説明する。
min_direction_azimuth_range、maz_direction_azimuth_rangeは実施例1−1で説明した水平方向の角度の範囲を、min_direction_elevation_range、max_direction_elevation_rangeは実施例1−1で説明した垂直方向の角度の範囲をそれぞれ示す。
max_viewing_magnification_rangeをobjectSelectionMetadataに含めてもよい。ここで、min_clipping_magnification_range、max_clipping_magnification_rangeは実施例1−1で説明した切り出し時の画角の倍率の範囲、min_viewing_magnification_range, max_viewing_magnification_rangeは、実施例1−1で説明した視聴画角の倍率の範囲をそれぞれ示す。
以上、実施例4−3として、画角を用いたオブジェクト選択情報の格納例について説明した。続いて、実施例4−4として、実施例1−2で説明したオブジェクト間の角度を用いたオブジェクト選択情報を上述したメタデータファイルに格納する実施例について説明する。本実施例は、上述した実施例4−1、実施例4−2のいずれと組み合わされてもよい。
続いて、実施例4−5として、実施例4−3、実施例4−4で説明したobjectSelectionMetadataConfigurationBoxにおいて、追加の情報を含めることで様々な構造を実現可能とする例を説明する。例えば、本実施例では、図36を参照して説明したように、オブジェクトオーディオファイルのリストで示すか、図42を参照して説明したようファイル(stream)のリストで示すか、を示す情報をシグナリングすることが可能である。
続いて、実施例4−6として、オブジェクト選択情報を含むISOBMFFファイルをMPDファイルでシグナリングする例について説明する。本実施例で説明されるMPDファイルは、サーバ100のMPDファイル生成部114により生成され得る。また、本実施例において生成されるMPDファイルには、オブジェクト選択情報を含むメタデータファイルへアクセスするためのメタデータファイルアクセス情報が格納される。
続いて、実施例4−7として、クライアント200の処理部210が取得するファイルを選択する方法について説明する。図55は、クライアントが取得するファイルを選択する方法の一例を示すフローチャート図である。なお、図55には、図32〜図33を参照して説明した拡張されたメタデータファイルに、図36〜図39を参照して説明したようにオブジェクト選択情報を格納し、図52を参照して説明したMPDファイルでシグナリングした場合の選択方法の例が示されている。また、図55に示した
以上、本開示の一実施形態について説明した。本開示において上述した技術(本技術)は、様々なコンテンツへ応用することが可能であり、例えば複数視聴位置で視聴可能なMulti Viewコンテンツへ応用することも可能である。以下では、本技術をMulti Viewコンテンツへ応用した場合の応用例について説明する。
以上、本開示の実施形態を説明した。最後に、図60を参照して、本開示の実施形態にかかる情報処理装置のハードウェア構成について説明する。図60は、本開示の実施形態にかかる情報処理装置のハードウェア構成の一例を示すブロック図である。なお、図60に示す情報処理装置900は、例えば、図8、図9にそれぞれ示したサーバ100、クライアント200を実現し得る。本開示の実施形態にかかるサーバ100、クライアント200による情報処理は、ソフトウェアと、以下に説明するハードウェアとの協働により実現される。
以上説明したように、本開示の実施形態によれば、オブジェクトオーディオデータを表示状態に応じて選択することが可能である。例えば、オブジェクトオーディオデータをMPEG-DASHによりストリーミング配信する際に、視聴環境にあったより適切な位置からの音を聞くことができるようになる。また、ズームインやズームアウトしたなど、表示状態が変わった場合に、その時の映像にあわせて、適切な位置からの音が聞こえる体験をすることができるようになる。さらに、サーバが記憶するデータ量と、クライアントが取得するファイル数との両方が抑制されるようにオブジェクトオーディオデータをファイル化することが可能である。そのため、伝送量が低減され、例えばその他の取得するデータのビットレートを上げることも可能となり得る。
(1)
画像の表示状態に応じたオブジェクトオーディオデータを選択するためのオブジェクト選択情報に関する情報を格納する管理ファイルを生成する生成部と、
前記管理ファイルを送信する送信部と、
を備える情報処理装置。
(2)
前記生成部は、前記オブジェクト選択情報に関する情報は、前記オブジェクト選択情報を含む、前記(1)に記載の情報処理装置。
(3)
前記生成部は、前記オブジェクト選択情報を含むメタデータファイルを生成し、
前記オブジェクト選択情報に関する情報は、生成された前記メタデータファイルへアクセスするためのメタデータファイルアクセス情報を含む、前記(1)または(2)に記載の情報処理装置。
(4)
前記管理ファイルは、MPD(Media Presentation Description)ファイルである、前記(1)〜(3)のいずれか一項に記載の情報処理装置。
(5)
前記管理ファイルは、MPD(Media Presentation Description)ファイルであり、
前記メタデータファイルアクセス情報は、前記MPDファイルのAdaptationSetに格納される、前記(3)に記載の情報処理装置。
(6)
前記メタデータファイルアクセス情報は、前記AdaptationSetのSupplementalPropertyに格納される、前記(5)に記載の情報処理装置。
(7)
前記オブジェクト選択情報は、切り出した画像の方向に関する方向情報を含む、前記(1)〜(6)のいずれか一項に記載の情報処理装置。
(8)
前記方向情報は、水平方向の角度の情報と垂直方向の角度の情報とを含む、前記(7)に記載の情報処理装置。
(9)
前記方向情報は、切り出した方向ベクトルからの角度範囲の情報をさらに含む、前記(8)に記載の情報処理装置。
(10)
前記方向情報は、水平方向の角度の範囲の情報と垂直方向の角度の範囲の情報とを含む、前記(7)に記載の情報処理装置。
(11)
前記オブジェクト選択情報は、切り出した画像の画角、または表示された画像に対する視聴時の画角、に関する画角情報を含む、前記(1)〜(10)のいずれか一項に記載の情報処理装置。
(12)
前記画角情報は、水平画角の範囲の情報と垂直画角の範囲の情報とを含む、前記(11)に記載の情報処理装置。
(13)
前記画角情報は、基準画角に対する倍率の範囲の情報を含む、前記(11)に記載の情報処理装置。
(14)
前記オブジェクト選択情報は、角度を算出する2つのオブジェクトの位置情報を含む、前記(1)〜(6)のいずれか一項に記載の情報処理装置。
(15)
前記オブジェクト選択情報は、前記2つのオブジェクト間の角度に関する角度情報をさらに含む、前記(14)に記載の情報処理装置。
(16)
前記オブジェクト選択情報は、利用する前記オブジェクトオーディオデータに関する情報を含む、前記(1)〜(15)のいずれか一項に記載の情報処理装置。
(17)
前記生成部は、前記表示状態に応じた前記オブジェクトオーディオデータの組合せに基づいて、同一のオブジェクトオーディオデータが複数のオーディオファイルに含まれないように前記オーディオファイルを生成する、前記(1)〜(16)のいずれか一項に記載の情報処理装置。
(18)
画像の表示状態に応じたオブジェクトオーディオデータを選択するためのオブジェクト選択情報に関する情報を格納する管理ファイルを生成することと、
前記管理ファイルを送信することと、
を含み、情報処理装置により実行される情報処理方法。
(19)
コンピュータに、
画像の表示状態に応じたオブジェクトオーディオデータを選択するためのオブジェクト選択情報に関する情報を格納する管理ファイルを生成する機能と、
前記管理ファイルを送信する機能と、
を実現させるためのプログラム。
(20)
画像の表示状態に応じたオブジェクトオーディオデータを選択するためのオブジェクト選択情報に関する情報を格納する管理ファイルを受信する受信部を備える情報処理装置。
(21)
前記オブジェクト選択情報に関する情報は、前記オブジェクト選択情報を含む、前記(20)に記載の情報処理装置。
(22)
前記オブジェクト選択情報に関する情報は、前記オブジェクト選択情報を含むメタデータファイルへアクセスするためのメタデータファイルアクセス情報を含む、前記(20)または(21)に記載の情報処理装置。
(23)
前記管理ファイルは、MPD(Media Presentation Description)ファイルである、前記(20)〜(22)のいずれか一項に記載の情報処理装置。。
(24)
前記管理ファイルは、MPD(Media Presentation Description)ファイルであり、
前記メタデータファイルアクセス情報は、前記MPDファイルのAdaptationSetに格納される、前記(22)に記載の情報処理装置。
(25)
前記メタデータファイルアクセス情報は、前記AdaptationSetのSupplementalPropertyに格納される、前記(24)に記載の情報処理装置。
(26)
前記オブジェクト選択情報は、切り出した画像の方向に関する方向情報を含む、前記(20)〜(25)のいずれか一項に記載の情報処理装置。
(27)
前記方向情報は、水平方向の角度の情報と垂直方向の角度の情報とを含む、前記(26)に記載の情報処理装置。
(28)
前記方向情報は、切り出した方向ベクトルからの角度範囲の情報をさらに含む、前記(27)に記載の情報処理装置。
(29)
前記方向情報は、水平方向の角度の範囲の情報と垂直方向の角度の範囲の情報とを含む、前記(26)に記載の情報処理装置。
(30)
前記オブジェクト選択情報は、切り出した画像の画角、または表示された画像に対する視聴時の画角、に関する画角情報を含む、前記(20)〜(29)のいずれか一項に記載の情報処理装置。
(31)
前記画角情報は、水平画角の範囲の情報と垂直画角の範囲の情報とを含む、前記(30)に記載の情報処理装置。
(32)
前記画角情報は、基準画角に対する倍率の範囲の情報を含む、前記(30)に記載の情報処理装置。
(33)
前記オブジェクト選択情報は、角度を算出する2つのオブジェクトの位置情報を含む、前記(20)〜(26)のいずれか一項に記載の情報処理装置。
(34)
前記オブジェクト選択情報は、前記2つのオブジェクト間の角度に関する角度情報をさらに含む、前記(33)に記載の情報処理装置。
(35)
前記オブジェクト選択情報は、利用する前記オブジェクトオーディオデータに関する情報を含む、前記(20)〜(34)のいずれか一項に記載の情報処理装置。
(36)
画像の表示状態に応じたオブジェクトオーディオデータを選択するためのオブジェクト選択情報に関する情報を格納する管理ファイルを受信することを含み、情報処理装置により実行される情報処理方法。
(37)
コンピュータに、
画像の表示状態に応じたオブジェクトオーディオデータを選択するためのオブジェクト選択情報に関する情報を格納する管理ファイルを受信する機能を実現させるためのプログラム。
110 生成部
111 データ取得部
112 符号化処理部
113 セグメントファイル生成部
114 ファイル生成部
120 制御部
130 通信部
140 記憶部
200 クライアント
210 処理部
211 ファイル取得部
212 ファイル処理部
213 セグメントファイル選択部
214 セグメントファイル取得部
215 復号処理部
216 合成処理部
220 制御部
230 通信部
240 記憶部
250 センサ部
260 表示部
270 スピーカ
Claims (19)
- 画像の表示状態に応じたオブジェクトオーディオデータを選択するためのオブジェクト選択情報に関する情報を格納する管理ファイルを生成する生成部と、
前記管理ファイルを送信する送信部と、
を備える情報処理装置。 - 前記生成部は、前記オブジェクト選択情報に関する情報は、前記オブジェクト選択情報を含む、請求項1に記載の情報処理装置。
- 前記生成部は、前記オブジェクト選択情報を含むメタデータファイルを生成し、
前記オブジェクト選択情報に関する情報は、生成された前記メタデータファイルへアクセスするためのメタデータファイルアクセス情報を含む、請求項1に記載の情報処理装置。 - 前記管理ファイルは、MPD(Media Presentation Description)ファイルである、請求項1に記載の情報処理装置。
- 前記管理ファイルは、MPD(Media Presentation Description)ファイルであり、
前記メタデータファイルアクセス情報は、前記MPDファイルのAdaptationSetに格納される、請求項3に記載の情報処理装置。 - 前記メタデータファイルアクセス情報は、前記AdaptationSetのSupplementalPropertyに格納される、請求項5に記載の情報処理装置。
- 前記オブジェクト選択情報は、切り出した画像の方向に関する方向情報を含む、請求項1に記載の情報処理装置。
- 前記方向情報は、水平方向の角度の情報と垂直方向の角度の情報とを含む、請求項7に記載の情報処理装置。
- 前記方向情報は、切り出した方向ベクトルからの角度範囲の情報をさらに含む、請求項8に記載の情報処理装置。
- 前記方向情報は、水平方向の角度の範囲の情報と垂直方向の角度の範囲の情報とを含む、請求項7に記載の情報処理装置。
- 前記オブジェクト選択情報は、切り出した画像の画角、または表示された画像に対する視聴時の画角、に関する画角情報を含む、請求項1に記載の情報処理装置。
- 前記画角情報は、水平画角の範囲の情報と垂直画角の範囲の情報とを含む、請求項11に記載の情報処理装置。
- 前記画角情報は、基準画角に対する倍率の範囲の情報を含む、請求項11に記載の情報処理装置。
- 前記オブジェクト選択情報は、角度を算出する2つのオブジェクトの位置情報を含む、請求項1に記載の情報処理装置。
- 前記オブジェクト選択情報は、前記2つのオブジェクト間の角度に関する角度情報をさらに含む、請求項14に記載の情報処理装置。
- 前記オブジェクト選択情報は、利用する前記オブジェクトオーディオデータに関する情報を含む、請求項1に記載の情報処理装置。
- 前記生成部は、前記表示状態に応じた前記オブジェクトオーディオデータの組合せに基づいて、同一のオブジェクトオーディオデータが複数のオーディオファイルに含まれないように前記オーディオファイルを生成する、請求項1に記載の情報処理装置。
- 画像の表示状態に応じたオブジェクトオーディオデータを選択するためのオブジェクト選択情報に関する情報を格納する管理ファイルを生成することと、
前記管理ファイルを送信することと、
を含み、情報処理装置により実行される情報処理方法。 - コンピュータに、
画像の表示状態に応じたオブジェクトオーディオデータを選択するためのオブジェクト選択情報に関する情報を格納する管理ファイルを生成する機能と、
前記管理ファイルを送信する機能と、
を実現させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018065012 | 2018-03-29 | ||
JP2018065012 | 2018-03-29 | ||
PCT/JP2018/047835 WO2019187437A1 (ja) | 2018-03-29 | 2018-12-26 | 情報処理装置、情報処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019187437A1 true JPWO2019187437A1 (ja) | 2021-04-01 |
JP7396267B2 JP7396267B2 (ja) | 2023-12-12 |
Family
ID=68059782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020509662A Active JP7396267B2 (ja) | 2018-03-29 | 2018-12-26 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (7)
Country | Link |
---|---|
US (2) | US11323757B2 (ja) |
EP (1) | EP3780628A1 (ja) |
JP (1) | JP7396267B2 (ja) |
KR (1) | KR20200136393A (ja) |
CN (1) | CN111903135A (ja) |
TW (1) | TW201942821A (ja) |
WO (1) | WO2019187437A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11616822B2 (en) * | 2019-09-30 | 2023-03-28 | Tencent America LLC | Session-based information for dynamic adaptive streaming over HTTP |
CN114731459A (zh) * | 2019-11-20 | 2022-07-08 | 杜比国际公司 | 用于个性化音频内容的方法和设备 |
US11451602B2 (en) * | 2021-01-06 | 2022-09-20 | Tencent America LLC | Methods and apparatuses for dynamic adaptive streaming over HTTP |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015182491A1 (ja) * | 2014-05-30 | 2015-12-03 | ソニー株式会社 | 情報処理装置および情報処理方法 |
WO2016084592A1 (ja) * | 2014-11-28 | 2016-06-02 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7613727B2 (en) * | 2002-02-25 | 2009-11-03 | Sont Corporation | Method and apparatus for supporting advanced coding formats in media files |
US20050198193A1 (en) * | 2004-02-12 | 2005-09-08 | Jaakko Halme | System, method, and apparatus for creating metadata enhanced media files from broadcast media |
JP4304108B2 (ja) * | 2004-03-31 | 2009-07-29 | 株式会社東芝 | メタデータ配信装置、動画再生装置および動画再生システム |
JP5230096B2 (ja) * | 2006-12-27 | 2013-07-10 | キヤノン株式会社 | 映像音声出力装置及び映像音声出力方法 |
US8625607B2 (en) * | 2007-07-24 | 2014-01-07 | Time Warner Cable Enterprises Llc | Generation, distribution and use of content metadata in a network |
KR101596504B1 (ko) * | 2008-04-23 | 2016-02-23 | 한국전자통신연구원 | 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체 |
US9007524B2 (en) * | 2012-09-25 | 2015-04-14 | Intel Corporation | Techniques and apparatus for audio isolation in video processing |
TWI530941B (zh) * | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
RU2630754C2 (ru) * | 2013-05-24 | 2017-09-12 | Долби Интернешнл Аб | Эффективное кодирование звуковых сцен, содержащих звуковые объекты |
EP3013064B1 (en) * | 2013-07-19 | 2019-03-13 | Sony Corporation | Information processing device and method |
EP2830049A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
EP2830045A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
KR102327504B1 (ko) * | 2013-07-31 | 2021-11-17 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 공간적으로 분산된 또는 큰 오디오 오브젝트들의 프로세싱 |
KR20150068112A (ko) * | 2013-12-11 | 2015-06-19 | 삼성전자주식회사 | 오디오를 추적하기 위한 방법 및 전자 장치 |
US20170127073A1 (en) * | 2014-06-30 | 2017-05-04 | Sony Corporation | Information processing device and method |
EP3163570A4 (en) * | 2014-06-30 | 2018-02-14 | Sony Corporation | Information processor and information-processing method |
CN106797499A (zh) * | 2014-10-10 | 2017-05-31 | 索尼公司 | 编码装置和方法、再现装置和方法以及程序 |
KR20160093404A (ko) * | 2015-01-29 | 2016-08-08 | 한국전자통신연구원 | 캐릭터 선택적 오디오 줌인을 제공하는 멀티미디어 콘텐츠 서비스 방법 및 장치 |
WO2016182371A1 (ko) * | 2015-05-12 | 2016-11-17 | 엘지전자 주식회사 | 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법 |
JP6673346B2 (ja) * | 2015-05-18 | 2020-03-25 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US10693936B2 (en) * | 2015-08-25 | 2020-06-23 | Qualcomm Incorporated | Transporting coded audio data |
CN114189793B (zh) * | 2016-02-04 | 2024-03-19 | 奇跃公司 | 增强现实系统中定向音频的技术 |
WO2017140948A1 (en) * | 2016-02-17 | 2017-08-24 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
KR101798321B1 (ko) | 2016-02-19 | 2017-11-15 | 서울과학기술대학교 산학협력단 | 자유 시점 방송의 송수신 장치 및 방법 |
KR20170106063A (ko) * | 2016-03-11 | 2017-09-20 | 가우디오디오랩 주식회사 | 오디오 신호 처리 방법 및 장치 |
EP3301951A1 (en) * | 2016-09-30 | 2018-04-04 | Koninklijke KPN N.V. | Audio object processing based on spatial listener information |
GB201800918D0 (en) * | 2018-01-19 | 2018-03-07 | Nokia Technologies Oy | Associated spatial audio playback |
CN112205005B (zh) * | 2018-05-23 | 2022-06-24 | 皇家Kpn公司 | 使声学渲染适应基于图像的对象 |
GB2593117A (en) * | 2018-07-24 | 2021-09-22 | Nokia Technologies Oy | Apparatus, methods and computer programs for controlling band limited audio objects |
KR20220062621A (ko) * | 2019-09-17 | 2022-05-17 | 노키아 테크놀로지스 오와이 | 공간적 오디오 파라미터 인코딩 및 관련 디코딩 |
DE112020005550T5 (de) * | 2019-11-13 | 2022-09-01 | Sony Group Corporation | Signalverarbeitungsvorrichtung, verfahren und programm |
US11570378B2 (en) * | 2020-07-21 | 2023-01-31 | Gopro, Inc. | Methods and apparatus for metadata-based processing of media content |
US11115625B1 (en) * | 2020-12-14 | 2021-09-07 | Cisco Technology, Inc. | Positional audio metadata generation |
GB2602148A (en) * | 2020-12-21 | 2022-06-22 | Nokia Technologies Oy | Audio rendering with spatial metadata interpolation and source position information |
-
2018
- 2018-12-26 EP EP18912755.8A patent/EP3780628A1/en not_active Withdrawn
- 2018-12-26 KR KR1020207026804A patent/KR20200136393A/ko not_active Application Discontinuation
- 2018-12-26 US US17/040,312 patent/US11323757B2/en active Active
- 2018-12-26 JP JP2020509662A patent/JP7396267B2/ja active Active
- 2018-12-26 WO PCT/JP2018/047835 patent/WO2019187437A1/ja active Application Filing
- 2018-12-26 CN CN201880091635.3A patent/CN111903135A/zh active Pending
-
2019
- 2019-03-19 TW TW108109216A patent/TW201942821A/zh unknown
-
2022
- 2022-03-24 US US17/703,424 patent/US11743520B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015182491A1 (ja) * | 2014-05-30 | 2015-12-03 | ソニー株式会社 | 情報処理装置および情報処理方法 |
WO2016084592A1 (ja) * | 2014-11-28 | 2016-06-02 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3780628A4 (en) | 2021-02-17 |
US20210021880A1 (en) | 2021-01-21 |
US11323757B2 (en) | 2022-05-03 |
CN111903135A (zh) | 2020-11-06 |
US20220232264A1 (en) | 2022-07-21 |
TW201942821A (zh) | 2019-11-01 |
US11743520B2 (en) | 2023-08-29 |
KR20200136393A (ko) | 2020-12-07 |
WO2019187437A1 (ja) | 2019-10-03 |
EP3780628A1 (en) | 2021-02-17 |
JP7396267B2 (ja) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10257638B2 (en) | Audio object processing based on spatial listener information | |
JP7409362B2 (ja) | 再生装置および方法、並びにプログラム | |
US11743520B2 (en) | Information processing apparatus, information processing method, and program | |
JP6860485B2 (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
WO2015198725A1 (ja) | 通信装置、通信方法、及びプログラム | |
JPWO2016002496A1 (ja) | 情報処理装置および方法 | |
US11272224B2 (en) | Information processing device and method | |
JP7314929B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
WO2019187442A1 (ja) | 情報処理装置、方法、及びプログラム | |
US20220150552A1 (en) | Information processing apparatus, information processing method, reproduction processing device, and reproduction processing method | |
WO2021002338A1 (ja) | 情報処理装置、情報処理方法、再生処理装置及び再生処理方法 | |
EP4167600A2 (en) | A method and apparatus for low complexity low bitrate 6dof hoa rendering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230613 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230802 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231113 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7396267 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |