WO2020137876A1 - 生成装置、3次元データ送信装置、及び3次元データ再生装置 - Google Patents

生成装置、3次元データ送信装置、及び3次元データ再生装置 Download PDF

Info

Publication number
WO2020137876A1
WO2020137876A1 PCT/JP2019/050083 JP2019050083W WO2020137876A1 WO 2020137876 A1 WO2020137876 A1 WO 2020137876A1 JP 2019050083 W JP2019050083 W JP 2019050083W WO 2020137876 A1 WO2020137876 A1 WO 2020137876A1
Authority
WO
WIPO (PCT)
Prior art keywords
image data
type image
data
dimensional data
dimensional
Prior art date
Application number
PCT/JP2019/050083
Other languages
English (en)
French (fr)
Inventor
徳毛 靖昭
山本 智幸
恭平 池田
敦稔 〆野
高橋 真毅
Original Assignee
シャープ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャープ株式会社 filed Critical シャープ株式会社
Publication of WO2020137876A1 publication Critical patent/WO2020137876A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving MPEG packets from an IP network

Definitions

  • One aspect of the present invention relates to a generation device that generates meta information, a three-dimensional data transmission device, and a three-dimensional data reproduction device.
  • the present application claims priority based on Japanese Patent Application No. 2018-243372 filed in Japan on Dec. 26, 2018, the contents of which are incorporated herein by reference.
  • DASH Dynamic Adaptive Streaming over HTTP
  • MPEG Motion Picture Experts Group
  • MPD Media Presentation Description
  • One aspect of the present invention has been made in view of the above problems, and generates meta information for reducing the amount of communication and processing related to communication while suppressing deterioration of image quality during three-dimensional data reproduction. It is an object of the present invention to realize a generating device that
  • a generation device is a generation device that generates meta information about three-dimensional data, and includes one or a plurality of first-type elements that configure the three-dimensional data.
  • Image data which is one or a plurality of first-type image data including images corresponding to a plurality of viewpoint directions, and a plurality of second-type image data forming the three-dimensional data
  • a plurality of second type image data including images corresponding to a plurality of viewpoint directions is provided with a meta information generation unit that generates meta information indicating a reference destination, and the plurality of second type image data are An image having a resolution higher than that of the image included in the first-type image data is included in at least one of the viewpoint directions.
  • a generation device that generates meta information for reducing the amount of communication and processing related to communication while suppressing deterioration of image quality during reproduction of three-dimensional data.
  • FIG. 3 is a functional block diagram of the three-dimensional data transmission device according to the first embodiment.
  • FIG. 3 is a functional block diagram of the three-dimensional data reproducing device according to the first embodiment. It is a figure which shows each viewpoint direction with respect to a three-dimensional model, and a figure which shows the outline of MPD. It is a figure which shows the outline
  • generates and which contains the depth image corresponding to each viewpoint direction. It is a figure which shows the example of description of MPD. 6 is a flowchart showing a flow of processing according to the first embodiment.
  • a three-dimensional data reproducing device which will be described later, refers to MPD (Media Presentation Description) which is a kind of meta information, acquires segment data indicating three-dimensional data by a single stream, and reproduces the segment data.
  • MPD Media Presentation Description
  • the three-dimensional data is data that indicates a three-dimensional three-dimensional model represented by a point cloud or a mesh.
  • the segment data is a transmission unit of HTTP transmission in which three-dimensional data is time-divided (for example, data based on ISOBMFF (ISO Base Media File Format)).
  • the MPD will be described below as an example of the meta information indicating the reference destination of the three-dimensional data, but the present invention is not limited to this, and may be, for example, XML (eXtensible Markup Language) conforming to the MPD.
  • XML eXtensible Markup Language
  • the following steps (1) to (4) are executed as main steps in each device according to the present embodiment.
  • the three-dimensional data transmission device refers to the acquired three-dimensional model to generate segment data indicating three-dimensional data and MPD indicating a reference destination of the segment data.
  • the three-dimensional data reproducing device acquires the MPD and the viewpoint position and the viewpoint direction at the time of reproducing the three-dimensional data. In this specification, the viewpoint position and the viewpoint direction may be simply referred to as the viewpoint direction.
  • the three-dimensional data reproducing device refers to the MPD and acquires the segment data corresponding to the viewpoint direction by a single stream. (4) The three-dimensional data reproducing device reproduces the three-dimensional data with reference to the segment data.
  • the present invention is not limited to this and may be a still image. Further, in the present embodiment, the three-dimensional model will be described as a mesh model.
  • FIG. 1 is a functional block diagram of a three-dimensional data transmission device 100 according to this embodiment.
  • the three-dimensional data transmission device 100 includes a control unit 110, a storage unit 120, and a communication unit 130.
  • the control unit 110 is a control device that controls the entire three-dimensional data transmission device 100, and also functions as the viewpoint reception unit 111, the depth image generation unit 112, the meta information generation unit 113, and the encoding unit 114.
  • the viewpoint receiving unit 111 acquires or sets a virtual viewpoint that is each viewpoint position and viewpoint direction with respect to the three-dimensional model.
  • the depth image generation unit 112 generates a depth image targeting the input three-dimensional model.
  • the depth image is an image in which a depth value is assigned to each pixel. Further, the depth value here is assigned a value based on the viewpoint position input from the viewpoint receiving unit 111.
  • the meta information generation unit 113 generates an MPD indicating the reference destination of segment data indicating three-dimensional data from the viewpoint position input from the viewpoint reception unit 111 and the depth image generated by the depth image generation unit 112. Details of the MPD will be described later.
  • the encoding unit 114 encodes the depth image input from the depth image generation unit 112.
  • the control unit 110 also functions as a communication control unit that controls the communication processing performed by the communication unit 130.
  • the storage unit 120 is a storage device that stores various data, and also functions as the meta information storage unit 121 and the segment data storage unit 122.
  • the meta information storage unit 121 stores information indicating MPD.
  • the segment data storage unit 122 also stores segment data.
  • the communication unit 130 is an interface that performs communication processing with an external device such as the three-dimensional data reproduction device 200, and serves as a meta information transmission unit (first transmission unit) 131 and a segment data transmission unit (second transmission unit) 132. Also works.
  • the meta information transmission unit 131 transmits information indicating the MPD.
  • the segment data transmission unit 132 transmits segment data.
  • FIG. 2 is a functional block diagram of the three-dimensional data reproducing device 200 according to this embodiment.
  • the three-dimensional data reproducing apparatus 200 includes a control unit 210, a communication unit 230, a display unit 240, and a storage unit (memory) (not shown) that temporarily stores information indicating the MPD and the like.
  • the control unit 210 is a control device that controls the entire three-dimensional data reproduction device 200, and also functions as a viewpoint reception unit (second acquisition unit) 211, a selection unit 212, and a reproduction unit 213.
  • the viewpoint accepting unit 211 acquires the viewpoint direction when reproducing three-dimensional data.
  • the selection unit 212 selects the segment data corresponding to the viewpoint direction acquired by the viewpoint reception unit 211 among the segment data whose reference destination is described in the MPD acquired by the meta information acquisition unit 231 described later.
  • the reproduction unit 213 is a member that reproduces three-dimensional data by referring to the input segment data, and also functions as the decoding unit 214, the three-dimensional model generation unit 215, and the viewpoint image synthesis unit 216.
  • the decryption unit 214 decrypts the input segment data.
  • the 3D model generation unit 215 refers to the decoded segment data and generates a 3D model.
  • the viewpoint image synthesizing unit 216 synthesizes an image showing a three-dimensional model viewed from the viewpoint position with reference to the viewpoint position in reproducing the three-dimensional data.
  • the control unit 210 also functions as a communication control unit that controls the communication process by the communication unit 230 and a display control unit that controls the display process by the display unit 240.
  • the communication unit 230 is an interface that performs communication processing with an external device such as the three-dimensional data transmission device 100, and serves as a meta information acquisition unit (first acquisition unit) 231 and a segment data acquisition unit (third acquisition unit) 232. Also works.
  • the meta information acquisition unit 231 acquires information indicating MPD.
  • the segment data acquisition unit 232 acquires the segment data selected by the selection unit 212.
  • the display unit 240 is a display panel that can display a moving image.
  • FIG. 3A is a diagram showing each viewpoint direction with respect to the three-dimensional model in the three-dimensional space.
  • FIG. 3B is a diagram showing an outline of MPD.
  • four viewpoint directions shown in v1 to v4 of FIG. 3A will be described as the viewpoint directions with respect to the three-dimensional model or the three-dimensional space, but the number of viewpoint directions is, for example, 2 or 3. It may be present or may be 5 or more.
  • the MPD AdaptationSets (a) to (e) shown in FIG. 3B each include a reference destination of the segment data of the depth image showing the three-dimensional model viewed from the viewpoint directions v1 to v4.
  • the MPD has a tree structure including an MPD element, a Period element, an AdaptationSet element, a Representation element, a SegmentList element, and a SegmentURL element in order from the upper hierarchy element, and in FIG. The element of is omitted. Further, the SegmentURL element corresponds to the reference destination of the segment data described above.
  • AdaptationSet(a) indicates a reference destination of segment data obtained by encoding the entire three-dimensional model with a uniform resolution. Further, AdaptationSet (b) to (e) indicate the reference destinations of the segment data whose resolution is higher than that of (a) for any viewpoint direction and lower than that of (a) for other viewpoint directions. There is.
  • FIG. 4 is a diagram showing an outline of three-dimensional data when a three-dimensional model that is a mesh model is viewed from above.
  • FIG. 5 is a diagram showing image data generated by the depth image generation unit 112, including image data corresponding to each viewpoint direction. The image data itself is also a depth image.
  • the image data shown in FIG. 5A corresponds to an example of the first type image data.
  • the image data shown in FIG. 5B and not shown in FIGS. 5C to 5E corresponds to the second type image data.
  • FIG. 6 is a diagram showing an example of MPD description.
  • (a) to (e) in FIGS. 4 to 6 correspond to AdaptationSet (a) to (e) in FIG. 3B.
  • (a) corresponds to an example of the first-type image data in which the XGA images having uniform video quality in each viewpoint direction are packed.
  • the FHD image having a higher resolution than the XGA image in any viewpoint direction and the VGA image having a lower resolution than the XGA image in the viewpoint directions other than the viewpoint direction are packed. This corresponds to an example of two types of image data.
  • the AdaptationSet (a) has the same video quality in each viewpoint direction, that is, the resolution of the packed image is uniform, and the ViewPointQuality tag is not added.
  • the image quality is not uniform in each viewpoint direction, and the ViewPointQuality tag is added.
  • (x1, y1, z1) in the relevant viewpoint indicates the viewpoint position.
  • (p1,q1,r1) indicates the viewpoint direction with respect to the three-dimensional model from the viewpoint position.
  • other AdaptationSets and viewpoints are similarly described.
  • each of one or a plurality of Representations included in each AdaptationSet is segment data corresponding to images of different bit rates, and refers to segment data indicating image data in which images of respective resolutions are similarly packed.
  • the destination is included.
  • the attribute bandwidth included in the Representation tag indicates the network bandwidth required to receive/reproduce the segment data corresponding to the Representation.
  • the higher the bit rate of the corresponding segment data the larger the value of bandwidth.
  • the generation device that generates meta information about three-dimensional data is realized by the generation device including the meta information generation unit 113 that generates meta information or by the meta information generation unit 113 itself. That is, the generation device that generates meta information about three-dimensional data according to the present embodiment is one or a plurality of first-type image data forming the three-dimensional data, and each image corresponding to a plurality of viewpoint directions.
  • a plurality of second type image data including one or a plurality of first type image data and three or more second type image data forming three-dimensional data, and including a plurality of images corresponding to one or a plurality of viewpoint directions.
  • the image data of the second type includes a meta information generation unit 113 that generates meta information indicating a reference destination with respect to the image data.
  • the configuration may include an image higher than the image included in the image data. According to the above configuration, it is possible to realize a generation device that generates meta information for reducing the amount of communication and processing related to communication while suppressing deterioration of image quality during reproduction of three-dimensional data.
  • the generation device that generates meta information may generate, as meta information, an MPD that includes a ViewPointQuality tag that identifies the resolution of each image corresponding to each viewpoint direction. Accordingly, it is possible to realize a generation device that generates an MPD whose resolution can be identified by the ViewPointQuality tag.
  • FIG. 7 is a flowchart showing the flow of processing according to this embodiment.
  • steps S101 to S103 are processes in the three-dimensional data transmitting device 100
  • steps S104 to S114 are processes in the three-dimensional data reproducing device 200.
  • step S101 the depth image generation unit 112 refers to the input three-dimensional model and the virtual viewpoint input from the viewpoint reception unit 111 and generates a depth image based on the virtual viewpoint.
  • step S102 the meta information generation unit 113 generates an MPD by referring to the depth image generated by the depth image generation unit 112 and the virtual viewpoint.
  • the control unit 110 also stores the generated MPD in the meta information storage unit 121.
  • step S103 the encoding unit 114 encodes the depth image generated by the depth image generating unit 112.
  • the control unit 110 also stores the encoded depth image in the segment data storage unit 122 as segment data.
  • the control unit 110 also matches the reference destination of the segment data indicated by the generated MPD and the storage destination stored in the segment data storage unit 122 via the URL.
  • step S104 The processing after step S104 is processing in the three-dimensional data reproducing device 200.
  • the meta information acquisition unit 231 acquires the MPD from the three-dimensional data transmission device 100.
  • step S105 the selection unit 212 extracts the AdaptationSet to which the ViewPointQuality tag is added for the MPD acquired by the meta information acquisition unit 231. Further, the AdaptationSet corresponds to the AdaptationSet of (b) to (e) in the example of FIG.
  • step S107 the selection unit 212 determines whether or not the difference is less than Th which is a predetermined threshold value.
  • Th a predetermined threshold value.
  • the process of step S108 is subsequently performed, and when the difference is greater than or equal to TH, the process of step S109 is subsequently performed. Executed.
  • step S108 the selection unit 212 determines the AdaptationSet extracted in step S106 as a reference source of the segment data acquired by the segment data acquisition unit 232.
  • the segment data corresponds to the second type image data.
  • step S109 the selection unit 212 determines the AdaptationSet to which the ViewPointQuality tag is not added as the reference source of the segment data acquired by the segment data acquisition unit 232.
  • the segment data corresponds to the first type image data.
  • the AdaptationSet corresponds to the AdaptationSet of (a) in the example of FIG.
  • the three-dimensional data reproducing device 200 can acquire suitable image data according to the viewpoint direction.
  • the selection unit 212 selects Representation corresponding to the bit rate when reproducing three-dimensional data from the AdaptationSet determined in step S108 or step S109. Moreover, when selecting Representation, the selection unit 212 may refer to the value of the attribute bandwidth included in each Representation tag and select a suitable bit rate.
  • the segment data acquisition unit 232 acquires the segment data transmitted by the segment data transmission unit 132 from the reference destination indicated by the Representation.
  • the bit rate for reproducing the three-dimensional data may be determined according to the line speed between the three-dimensional data transmitting apparatus 100 and the three-dimensional data reproducing apparatus 200, or the user may select the three-dimensional data reproducing apparatus 200. It may be specified by operating.
  • step S111 the decryption unit 214 decrypts the segment data acquired by the segment data acquisition unit 232.
  • step S112 the three-dimensional model generation unit 215 refers to the decrypted segment data and generates a three-dimensional model.
  • step S113 the viewpoint image synthesizing unit 216 synthesizes an image showing the three-dimensional model viewed from the viewpoint position input from the viewpoint receiving unit 211.
  • step S114 the reproduction unit 213 causes the display unit 240 to display the image.
  • the three-dimensional data transmission device 100 is the three-dimensional data transmission device 100 that transmits three-dimensional data, and includes the meta information generation device (meta information generation unit) 113 and the meta information generation.
  • a first transmission unit (meta information transmission unit) 131 that transmits the meta information generated by the device to an external device, and the first type image data and the second type image in response to a request from the external device.
  • the second transmission unit (segment data transmission unit) 132 that transmits at least one of the data to the external device is configured. According to the above configuration, it is possible to realize the three-dimensional data transmission device 100 capable of transmitting the meta information and at least one of the first type image data and the second type image data to the external device.
  • the three-dimensional data reproducing apparatus 200 is the three-dimensional data reproducing apparatus 200 that reproduces three-dimensional data, and includes one or a plurality of first-type data constituting three-dimensional data.
  • the image data is one or more first type image data including each image corresponding to a plurality of viewpoint directions, and one or more second type image data forming three-dimensional data.
  • a first acquisition unit (meta information acquisition unit) 231 that acquires meta information indicating a reference destination of a plurality of second type image data including each image corresponding to the viewpoint direction of
  • the second acquisition unit (viewpoint reception unit) 211 that acquires the viewpoint direction of the object indicated by the three-dimensional data, and the reference destination corresponding to the viewpoint direction, which is the reference destination indicated by the meta information
  • a third acquisition unit (segment data acquisition unit) 232 that acquires at least one of the first-type image data and the second-type image data required for reproduction, and the first-type acquired by the third acquisition unit Image data and at least one of the second type image data
  • a reproducing unit 213 that reproduces the three-dimensional data, and the plurality of second type image data are at least one of In this viewpoint direction, the resolution is higher than that of the image included in the first-type image data.
  • FIG. 8 is a diagram showing an outline of three-dimensional data when a three-dimensional model that is a point cloud is viewed from above. Further, FIG. 8 corresponds to FIG. 4 in the first embodiment.
  • the depth image generation unit 112 reduces the depth image indicating a point group that is 1 ⁇ 2 subsampled, that is, the number of points to 1 ⁇ 2 from the original 3D model for each viewpoint direction.
  • First-type image data including a thinned depth image, a depth image showing a point group obtained by sampling the number of points in a predetermined viewpoint direction from the original three-dimensional model, and a viewpoint other than the viewpoint direction.
  • Second-type image data including a depth image showing a point group that is 1 ⁇ 4 subsampled in the direction, that is, a depth image in which the number of points is decimated to 1 ⁇ 4 from the original three-dimensional model is generated.
  • the first type image data corresponds to FIG. 8A
  • the second type image data corresponds to FIGS. 8B to 8E.
  • the meta information generation unit 113 can generate the MPD similar to that of the first embodiment and use it for the subsequent processing.
  • FIGS. 1, 2 and 9 to 13 A second embodiment of the present invention will be described with reference to FIGS. 1, 2 and 9 to 13.
  • members having the same functions as the members described in the above embodiment will be designated by the same reference numerals, and the description thereof will not be repeated.
  • the present embodiment an example of a process in which the three-dimensional data reproducing device acquires segment data indicating three-dimensional data by a plurality of different streams with reference to the MPD and reproduces the segment data will be described.
  • the number of streams will be described as being two, but the number of streams is not limited to this, and the processing described in the present embodiment may be realized by using three or more streams.
  • the following steps (1) to (4) are executed as main steps in each device according to the present embodiment.
  • the three-dimensional data transmission device refers to the acquired three-dimensional model to generate segment data indicating three-dimensional data and MPD indicating a reference destination of the segment data.
  • the three-dimensional data reproduction device acquires the viewpoint direction during MPD and three-dimensional data reproduction.
  • the three-dimensional data reproducing device refers to the MPD and acquires segment data showing an outline of the entire three-dimensional model and segment data corresponding to the viewpoint direction by two streams.
  • the three-dimensional data reproducing device reproduces the three-dimensional data by referring to each segment data.
  • the configuration of the three-dimensional data transmitting apparatus 100 shown in FIG. 1 is used.
  • the segment data transmission unit 132 has a function of transmitting two pieces of segment data in parallel by two streams to an external device.
  • FIG. 9A is a diagram showing each viewpoint direction with respect to the three-dimensional model in the three-dimensional space.
  • FIG. 9(A) is the same as FIG. 3(A), and in the present embodiment also, four viewpoint directions shown by v1 to v4 will be described as an example.
  • FIG. 9(B) shows an outline of MPD, which is different from the configuration of FIG. 3(B).
  • AdaptationSet(a) shows segment data obtained by encoding the entire three-dimensional model with a uniform resolution, as in the configuration of FIG. 3(B).
  • the AdaptationSets (b) to (e) include the reference destination of the segment data indicating the second type image data including the depth image having the higher resolution than that of (a) for any of the viewpoint directions.
  • the second-type image data does not include depth images in other viewpoint directions, as shown in FIGS. 10(b) to 10(e) and FIG. 11(b).
  • FIG. 10 is a diagram showing an outline of three-dimensional data when a three-dimensional model that is a mesh model is viewed from above.
  • FIG. 11 is a diagram illustrating image data generated by the depth image generation unit 112, including image data corresponding to each viewpoint direction.
  • FIG. 12 is a diagram showing a description example of MPD.
  • (a) to (e) in FIGS. 10 to 12 correspond to AdaptationSet (a) to (e) in FIG. 9B.
  • (a) corresponds to an example of the first type image data in which VGA images having uniform video quality in each viewpoint direction are packed.
  • (b) to (e) correspond to an example of the second type image data including the FHD image having a higher resolution than the VGA image and the XGA image in any viewpoint direction.
  • FIG. 13 is a flowchart showing the flow of processing according to this embodiment.
  • step S101 to step S106 the same processing as that of the first embodiment is performed.
  • the MPD that is generated by the meta information generation unit 113 in step S102 and is the processing target is the MPD illustrated in FIG. 12.
  • the process of step S207 is subsequently executed.
  • the selection unit 212 may refer to the value of the attribute bandwidth included in each Representation tag and select a suitable bit rate.
  • the segment data acquisition unit 232 acquires the segment data transmitted by the segment data transmission unit 132 from the reference destination indicated by the Representation. The segment data corresponds to the first type image data.
  • the segment data acquisition unit 232 acquires the segment data transmitted by the segment data transmission unit 132 from the reference destination indicated by the Representation.
  • the segment data corresponds to the second type image data.
  • the processing of the segment data acquisition unit 232 in steps S207 and S208 may be performed in parallel. That is, the segment data transmission unit 132 uses one of the two streams to transmit the segment data corresponding to the first-type image data in step S207, while using the other stream in step S208.
  • the segment data acquisition unit 232 may acquire the respective image data in parallel by transmitting the segment data corresponding to the second type image data in.
  • step S111 is subsequently executed.
  • steps S111 to S114 the same processing as that of the first embodiment is executed.
  • step S112 when the three-dimensional model generation unit 215 generates a three-dimensional model corresponding to each frame of the video, only the segment data corresponding to the second type image data is referred to, and the first type It does not mean that the segment data corresponding to the image data is not referenced.
  • FIG. 14 is a diagram showing an outline of three-dimensional data when a three-dimensional model that is a point cloud is viewed from above. Further, FIG. 14 corresponds to FIG. 10 in the second embodiment.
  • the depth image generation unit 112 reduces the depth image indicating a point group that is 1 ⁇ 4 subsampled, that is, the number of points to 1 ⁇ 4 from the original 3D model, for each viewpoint direction.
  • First-type image data including the thinned-out depth image, and a point group obtained by 3/4 sub-sampling in a predetermined viewpoint direction, the original three-dimensional model and the depth image included in the first-type image data.
  • the second type image data including the depth image indicating the point group that is the difference from the point group indicated by is generated.
  • the first type image data corresponds to FIG. 14A
  • the second type image data corresponds to FIGS. 14B to 14E.
  • the meta information generation unit 113 can generate the same MPD as that of the second embodiment and use it for the subsequent processing.
  • the segment data transmission unit 132 reproduces the three-dimensional data of the segment data corresponding to the first type image data and the second type image data by the plurality of layers in the single stream. It may be configured to transmit to the device 200. Further, the plurality of layers may be, for example, two layers including a base layer and an enhancement layer.
  • the segment data acquisition unit 232 uses the single stream to concurrently execute the segment data corresponding to the first type image data and the segment data corresponding to the second type image data in parallel. You can get it.
  • the configuration of the present modification can be applied to the first modification of the second embodiment.
  • the control block of the three-dimensional data transmission device 100 (in particular, the viewpoint reception unit 111, the depth image generation unit 112, the meta information generation unit 113, and the encoding unit 114), and the control block of the three-dimensional data reproduction device 200 (in particular, the viewpoint reception unit 211).
  • the selection unit 212 and the reproduction unit 213 may be realized by a logic circuit (hardware) formed in an integrated circuit (IC chip) or the like, or may be realized by software.
  • the three-dimensional data transmitting apparatus 100 and the three-dimensional data reproducing apparatus 200 are equipped with a computer that executes the instructions of a program that is software that realizes each function.
  • This computer includes, for example, at least one processor (control device) and at least one computer-readable recording medium that stores the program. Then, in the computer, the processor reads the program from the recording medium and executes the program to achieve the object of the present invention.
  • the processor for example, a CPU (Central Processing Unit) can be used.
  • the recording medium a "non-transitory tangible medium" such as a ROM (Read Only Memory), a tape, a disk, a card, a semiconductor memory, a programmable logic circuit, or the like can be used.
  • a RAM Random Access Memory
  • the program may be supplied to the computer via any transmission medium (communication network, broadcast wave, etc.) capable of transmitting the program.
  • any transmission medium communication network, broadcast wave, etc.
  • one aspect of the present invention can also be realized in the form of a data signal embedded in a carrier wave, in which the program is embodied by electronic transmission.
  • a generation device is a generation device that generates meta information about three-dimensional data, and is one or a plurality of first-type image data forming the three-dimensional data, and a plurality of viewpoints.
  • One or more first type image data including each image corresponding to a direction, and a plurality of second type image data forming the three-dimensional data, each image corresponding to one or more viewpoint directions
  • a plurality of second-type image data including a meta-information generating unit that generates meta-information indicating a reference destination, and the plurality of second-type image data has a resolution in at least one of the viewpoint directions.
  • the meta information generation unit generates, as the meta information, an MPD including a ViewPointQuality tag that identifies the resolution of each image corresponding to each viewpoint direction. May be. According to the above configuration, it is possible to realize a generation device that generates an MPD whose resolution can be identified by the ViewPointQuality tag.
  • a three-dimensional data transmitting apparatus is a three-dimensional data transmitting apparatus for transmitting three-dimensional data, wherein the generating apparatus according to Aspect 1 or 2 above and the meta information are transmitted to an external apparatus. 1 transmission unit, and a second transmission unit that transmits at least one of the first type image data and the second type image data to the external device in response to a request from the external device, May be provided. According to the above configuration, it is possible to realize a three-dimensional data transmission device capable of transmitting meta information and at least one of the first type image data and the second type image data to an external device.
  • the second transmitting unit may output the first type image data and the second type image data in different streams. It may be configured to transmit by. According to the above configuration, it is possible to realize a three-dimensional data transmission device capable of transmitting the first type image data and the second type image data by separate streams.
  • the second transmission unit may combine the first type image data and the second type image data in a single stream. It may be configured to transmit using a plurality of layers. According to the above configuration, it is possible to realize a three-dimensional data transmission device capable of transmitting the first type image data and the second type image data by a single stream.
  • a three-dimensional data reproducing apparatus is a three-dimensional data reproducing apparatus for reproducing three-dimensional data, and is one or a plurality of first-type image data constituting the three-dimensional data, One or a plurality of first type image data including each image corresponding to a plurality of viewpoint directions, and a plurality of second type image data forming the three-dimensional data, which correspond to one or a plurality of viewpoint directions.
  • a first acquisition unit that acquires meta information indicating a reference destination of a plurality of second type image data including each image to be reproduced, and a viewpoint direction with respect to the object indicated by the three-dimensional data when the three-dimensional data is reproduced.
  • a third acquisition unit that acquires at least one of the three-dimensional image data, and at least one of the first-type image data and the second-type image data acquired by the third acquisition unit.
  • a reproduction unit that reproduces data, wherein the plurality of second-type image data have an image resolution higher than that of the image included in the first-type image data in at least one of the viewpoint directions. It is a configuration including. According to the above configuration, it is possible to realize a three-dimensional data reproducing device capable of reproducing image data by acquiring image data with reference to the above-mentioned meta information.
  • the first acquisition unit includes, as the meta information, an MPD including a ViewPointQuality tag that identifies a resolution of each image corresponding to each viewpoint direction.
  • the third acquisition unit may acquire image data in which the AdaptationSet determined by referring to the ViewPointQuality tag indicates a reference destination. According to the above configuration, it is possible to realize the three-dimensional data reproducing device that acquires the image data determined by referring to the ViewPointQuality tag.
  • the third acquisition unit may have a vector indicated by the viewpoint direction acquired by the second acquisition unit, and the image of the second type. If the difference between the vector included in the data and the vector indicated by the viewpoint direction corresponding to the image having a higher resolution than the image included in the image data of the first type is less than the threshold value, at least the image data of the second type is acquired. When it is equal to or more than the threshold value, the first type image data may be acquired without acquiring the second type image data. According to the above configuration, it is possible to realize a three-dimensional data reproducing device capable of acquiring suitable image data according to the viewpoint direction and reproducing three-dimensional data.
  • the third acquisition unit outputs the first type image data and the second type image data.
  • the configuration may be such that a plurality of different streams are used for acquisition. According to the above configuration, it is possible to realize a three-dimensional data reproducing device capable of acquiring the first type image data and the second type image data by separate streams.
  • the third acquisition unit outputs the first type image data and the second type image data.
  • the configuration may be such that it is acquired by a plurality of layers in a single stream. According to the above configuration, it is possible to realize a three-dimensional data reproducing device capable of acquiring the first type image data and the second type image data by a single stream.
  • the generation device, the three-dimensional data transmission device, and the three-dimensional data reproduction device according to each aspect of the present invention may be realized by a computer.
  • the computer is used as each unit (software element) included in each device.
  • a control program of each of the above-described devices that causes each of the above-described devices to be realized by a computer by operating the computer, and a computer-readable recording medium that records the program are also included in the scope of the present invention.

Abstract

画像品位の低下を抑制し、通信量および通信に係る処理を軽減させる。生成装置であって、複数の視点方向に対応する各画像を含む第1種の画像データと、1又は複数の視点方向に対応する各画像を含む第2種の画像データとの参照先を示すメタ情報を生成するメタ情報生成部を備え、第2種の画像データは、何れかの視点方向について、解像度が第1種の画像データに含まれる画像よりも高い画像を含む。

Description

生成装置、3次元データ送信装置、及び3次元データ再生装置
 本発明の一態様は、メタ情報を生成する生成装置、3次元データ送信装置、及び3次元データ再生装置に関する。
 本願は、2018年12月26日に日本で出願された特願2018-243372号に基づき優先権を主張し、その内容をここに援用する。
 近年、映像を配信するための様々な技術が開発されている。映像を配信するための技術としては、MPEG(Moving Picture Experts Group)にて現在標準化作業が進められているDASH(Dynamic Adaptive Streaming over HTTP)が挙げられる(非特許文献1)。DASHでは、MPD(Media Presentation Description)データ等のメタデータのフォーマットが規定されている。
ISO/IEC 23009-1 Second edition 2014-05-15
 しかしながら、上述のような従来技術においては、3次元データを再生する場合に、再生時の視点方向からでは見えない部分についても不必要に高精細な画像を取得しており、通信量および通信に係る処理が増大するという問題がある。
 本発明の一態様は、上記の課題に鑑みてなされたものであり、3次元データ再生時における画像品位の低下を抑制しつつ、通信量および通信に係る処理を軽減させるためのメタ情報を生成する生成装置を実現することを目的とする。
 上記の課題を解決するために、本発明の一態様に係る生成装置は、3次元データに関するメタ情報を生成する生成装置であって、前記3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、前記3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データとの参照先を示すメタ情報を生成するメタ情報生成部を備えており、前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む。
 本発明の一態様によれば、3次元データ再生時における画像品位の低下を抑制しつつ、通信量および通信に係る処理を軽減させるためのメタ情報を生成する生成装置を実現できる。
実施形態1に係る3次元データ送信装置の機能ブロック図である。 実施形態1に係る3次元データ再生装置の機能ブロック図である。 3次元モデルに対する各視点方向を示す図およびMPDの概要を示す図である。 メッシュモデルである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。 デプス画像生成部が生成する画像データであって、各視点方向に対応するデプス画像を含む画像データを示す図である。 MPDの記述例を示す図である。 実施形態1に係る処理の流れを示すフローチャートである。 ポイントクラウドである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。 3次元モデルに対する各視点方向を示す図およびMPDの概要を示す図である。 メッシュモデルである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。 デプス画像生成部が生成する画像データであって、各視点方向に対応するデプス画像を含む画像データを示す図である。 MPDの記述例を示す図である。 実施形態2に係る処理の流れを示すフローチャートである。 ポイントクラウドである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。
 以下、本発明の実施形態について、詳細に説明する。ただし、本実施形態に記載されている構成は、特に特定的な記載がない限り、この発明の範囲をそれのみに限定する趣旨ではなく、単なる説明例に過ぎない。
 〔実施形態1〕
 本発明の第1の実施形態について図1~図7を参照して説明する。本実施形態においては、後述する3次元データ再生装置が、メタ情報の一種であるMPD(Media Presentation Description)を参照して単一のストリームによって3次元データを示すセグメントデータを取得し、再生する工程の一例について説明する。ここで、3次元データとは、点群やメッシュによって表現される立体的な3次元モデルを示すデータである。また、セグメントデータとは、3次元データを時分割したHTTP伝送の伝送単位(例えば、ISOBMFF(ISO Base Media File Format)をベースにしたデータ)である。
 以下、3次元データの参照先を示すメタ情報としてMPDを例に挙げて説明するが、これに限定されず、例えば、MPDに準ずるXML(eXtensible Markup Language)等であってもよい。
 本実施形態に係る各装置における主な工程として、以下の(1)~(4)が実行される。
(1)3次元データ送信装置が、取得した3次元モデルを参照して3次元データを示すセグメントデータと、当該セグメントデータの参照先を示すMPDとを生成する。
(2)3次元データ再生装置が、MPDと3次元データ再生時における視点位置および視点方向とを取得する。なお、本明細書においては、視点位置および視点方向を、単に視点方向と呼称することもある。
(3)3次元データ再生装置が、MPDを参照して当該視点方向に応じたセグメントデータを単一のストリームによって取得する。
(4)3次元データ再生装置が、当該セグメントデータを参照して3次元データを再生する。
 以下、3次元データ再生装置においては、3次元モデルを対象とした映像、即ち動画が再生されるものとして説明するが、これに限定されず単に静止画であってもよい。また、本実施形態において、3次元モデルは、メッシュモデルであるものとして説明する。
 〔1.3次元データ送信装置100の構成〕
 図1は、本実施形態に係る3次元データ送信装置100の機能ブロック図である。図1に示す通り、3次元データ送信装置100は、制御部110、記憶部120、及び通信部130を備えている。
 制御部110は、3次元データ送信装置100全体を統括する制御装置であって、視点受付部111、デプス画像生成部112、メタ情報生成部113、および符号化部114としても機能する。
 視点受付部111は、3次元モデルに対する各視点位置及び視点方向となる仮想視点を取得または設定する。デプス画像生成部112は、入力された3次元モデルを対象とするデプス画像を生成する。ここで、デプス画像とは、各画素にデプス値が割り当てられた画像である。また、ここでのデプス値は、視点受付部111から入力された視点位置を基準とした値が割り当てられる。
 メタ情報生成部113は、視点受付部111から入力された視点位置と、デプス画像生成部112が生成したデプス画像とから、3次元データを示すセグメントデータの参照先を示すMPDを生成する。当該MPDの詳細については後述する。符号化部114は、デプス画像生成部112から入力されたデプス画像を符号化する。また、制御部110は、通信部130による通信処理に関する制御を行う通信制御部としても機能する。
 記憶部120は、各種データを格納する記憶装置であって、メタ情報記憶部121およびセグメントデータ記憶部122としても機能する。メタ情報記憶部121は、MPDを示す情報を格納する。また、セグメントデータ記憶部122は、セグメントデータを格納する。
 通信部130は、3次元データ再生装置200等の外部装置との通信処理を行うインターフェースであって、メタ情報送信部(第1送信部)131およびセグメントデータ送信部(第2送信部)132としても機能する。メタ情報送信部131は、MPDを示す情報を送信する。また、セグメントデータ送信部132は、セグメントデータを送信する。
 〔2.3次元データ再生装置200の構成〕
 図2は、本実施形態に係る3次元データ再生装置200の機能ブロック図である。図2に示す通り、3次元データ再生装置200は、制御部210、通信部230、表示部240、及びMPDを示す情報等を少なくとも一時的に格納する、図示しない記憶部(メモリ)を備える。
 制御部210は、3次元データ再生装置200全体を統括する制御装置であって、視点受付部(第2取得部)211、選択部212、及び再生部213としても機能する。
 視点受付部211は、3次元データを再生する場合における視点方向を取得する。選択部212は、後述するメタ情報取得部231が取得したMPDに参照先が記述されたセグメントデータについて、視点受付部211が取得した視点方向に対応するセグメントデータを選択する。
 再生部213は、入力されたセグメントデータを参照して3次元データを再生する部材であって、復号部214、3次元モデル生成部215および視点画像合成部216としても機能する。
 復号部214は、入力されたセグメントデータを復号する。3次元モデル生成部215は、復号されたセグメントデータを参照して3次元モデルを生成する。視点画像合成部216は、3次元データを再生する場合における視点位置を参照して当該視点位置から見た3次元モデルを示す画像を合成する。
 また、制御部210は、通信部230による通信処理に関する制御を行う通信制御部、及び表示部240による表示処理に関する制御を行う表示制御部としても機能する。
 通信部230は、3次元データ送信装置100等の外部装置との通信処理を行うインターフェースであって、メタ情報取得部(第1取得部)231およびセグメントデータ取得部(第3取得部)232としても機能する。メタ情報取得部231は、MPDを示す情報を取得する。セグメントデータ取得部232は、選択部212が選択したセグメントデータを取得する。また、表示部240は、動画像を表示可能な表示パネルである。
 〔3.MPDについて〕
 本実施形態における3次元データの概要、及びメタ情報生成部113が生成するMPDの一例について説明する。図3(A)は、3次元空間上における3次元モデルに対する各視点方向を示す図である。また、図3(B)は、MPDの概要を示す図である。以下、3次元モデルまたは3次元空間に対する視点方向として、図3(A)のv1~v4に示す4つの視点方向を例に挙げて説明するが、当該視点方向の数は、例えば2又は3であってもよいし、5以上であってもよい。
 図3(B)に示すMPDのAdaptationSet(a)~(e)は、何れも視点方向v1~v4から見た3次元モデルを示すデプス画像のセグメントデータの参照先を内包している。なお、MPDは、上位の階層要素から順に、MPD要素、Period要素、AdaptationSet要素、Representation要素、SegmentList要素、及び、SegmentURL要素を含む木構造となっており、後述する図6等においては、一部の要素が省略されている。また、SegmentURL要素が、上述したセグメントデータの参照先に相当する。
 図3(B)において、AdaptationSet(a)は、3次元モデル全体を一様な解像度でエンコードしたセグメントデータの参照先を示している。また、AdaptationSet(b)~(e)は、何れかの視点方向について、(a)よりも解像度が高く、他の視点方向については(a)よりも解像度が低いセグメントデータの参照先を示している。
 図4は、メッシュモデルである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。また、図5は、デプス画像生成部112が生成する画像データであって、各視点方向に対応するデプス画像を含む画像データを示す図である。また、前記画像データ自体もデプス画像である。ここで、図5(a)に示す画像データは、第1種の画像データの一例に相当する。また、図5(b)および図示しない図5(c)~(e)に示す画像データは、第2種の画像データに相当する。
 また、図6は、MPDの記述例を示す図である。ここで、図4~図6における(a)~(e)は、図3(B)におけるAdaptationSet(a)~(e)に対応する。また、図4~図6に示す例において、(a)は、各視点方向について一様な映像品質であるXGA画像がパッキングされた第1種の画像データの一例に対応する。また、(b)~(e)は何れかの視点方向についてXGA画像よりも解像度が高いFHD画像と、当該視点方向以外の視点方向についてXGA画像よりも解像度が低いVGA画像とがパッキングされた第2種の画像データの一例に対応する。
 図6に例示するMPDにおいて、AdaptationSet(a)は、上述したように各視点方向について映像品質、即ちパッキングされた画像の解像度が一様であり、ViewPointQualityタグが付加されていない。一方で、AdaptationSet(b)~(e)は、各視点方向について映像品質が一様でなく、ViewPointQualityタグが付加されている。また、例えば(b)に含まれるViewPointQualityタグにおいては、quality=”high”の値を有するviewpointが、視点方向v1に対応する。また、例えば、当該viewpointにおける、(x1,y1,z1)は、視点位置を示している。また、(p1,q1,r1)は、当該視点位置からの、3次元モデルに対する視点方向を示している。また、他のAdaptationSetおよびviewpointについても同様に説明される。
 また、各AdaptationSetが内包する1又は複数のRepresentationのそれぞれには、互いに異なるビットレートの映像に対応するセグメントデータであって、各解像度の画像が同様にパッキングされた画像データを示すセグメントデータの参照先が含まれている。
 ここで、Representationタグに含まれる属性bandwidthは、当該Representationに対応するセグメントデータを受信・再生するために必要なネットワーク帯域を示している。また、同一のAdaptationSetに含まれる各Representationにおいては、対応するセグメントデータのビットレートが高い程、bandwidthの値は大きい値となる。
 また、3次元データに関するメタ情報を生成する生成装置は、当該生成装置が、メタ情報を生成するメタ情報生成部113を備えるか、メタ情報生成部113自体であることによって実現される。即ち、本実施形態に係る、3次元データに関するメタ情報を生成する生成装置は、3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データとの参照先を示すメタ情報を生成するメタ情報生成部113を備えており、前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む構成であってもよい。上記の構成によれば、3次元データ再生時における画像品位の低下を抑制しつつ、通信量および通信に係る処理を軽減させるためのメタ情報を生成する生成装置を実現できる。
 また、メタ情報を生成する生成装置は、図6に例示するように、メタ情報として、各視点方向に対応する各画像の解像度を識別するViewPointQualityタグを含むMPDを生成してもよい。これにより、ViewPointQualityタグによって解像度を識別可能なMPDを生成する生成装置を実現できる。
 〔4.3次元データ再生に係る処理の流れ〕
 本実施形態に係る3次元データ送信装置100および3次元データ再生装置200による3次元データの生成および再生に係る処理の流れについて図7を参照して説明する。図7は、本実施形態に係る処理の流れを示すフローチャートである。
 また、以下の各ステップにおいて、ステップS101~S103は、3次元データ送信装置100における処理であり、ステップS104~S114は、3次元データ再生装置200における処理である。
 ステップS101において、デプス画像生成部112は、入力された3次元モデルと、視点受付部111から入力された仮想視点と参照して、仮想視点を基準としたデプス画像を生成する。
 ステップS102において、メタ情報生成部113は、デプス画像生成部112が生成したデプス画像と当該仮想視点とを参照してMPDを生成する。また、制御部110は、生成したMPDをメタ情報記憶部121に格納する。
 ステップS103において、符号化部114は、デプス画像生成部112が生成したデプス画像を符号化する。また、制御部110は、符号化したデプス画像を、セグメントデータとして、セグメントデータ記憶部122に格納する。また、制御部110は、生成したMPDが示すセグメントデータの参照先と、セグメントデータ記憶部122に格納する格納先とをURLを介して整合させる。
 ステップS104以降の処理は、3次元データ再生装置200における処理である。ステップS104において、メタ情報取得部231は、3次元データ送信装置100からMPDを取得する。
 ステップS105において、選択部212は、メタ情報取得部231が取得したMPDについて、ViewPointQualityタグが付加されたAdaptationSetを抽出する。また、当該AdaptationSetは、図6の例における(b)~(e)のAdaptationSetに相当する。
 ステップS106において、選択部212は、抽出されたAdaptationSetのViewPointQualityタグについて、quality=“high”の値を有するviewpointが示す視線ベクトルと、視点受付部211が取得した視点方向が示す視点ベクトルとの差分の最も小さいAdaptationSetを抽出する。
 ステップS107において、選択部212は、当該差分が所定の閾値であるTh未満であるか否かを判定する。選択部212が、当該差分がTh未満であると判定した場合には、続いてステップS108の処理が実行され、当該差分がTH以上であると判定した場合には、続いてステップS109の処理が実行される。
 ステップS108において、選択部212は、ステップS106で抽出したAdaptationSetを、セグメントデータ取得部232が取得するセグメントデータの参照元として決定する。また、当該セグメントデータは、第2種の画像データに対応する。
 ステップS109において、選択部212は、ViewPointQualityタグが付加されていないAdaptationSetを、セグメントデータ取得部232が取得するセグメントデータの参照元として決定する。また、当該セグメントデータは、第1種の画像データに対応する。また、上述したように、当該AdaptationSetは、図6の例における(a)のAdaptationSetに相当する。ステップS106からステップS109において上述した工程によれば、3次元データ再生装置200は、視点方向に応じた好適な画像データを取得できる。
 ステップS110において、選択部212は、ステップS108またはステップS109において決定したAdaptationSetから、3次元データを再生する場合におけるビットレートに対応するRepresentationを選択する。また、選択部212は、Representationを選択する場合に、各Representationタグに含まれる属性bandwidthの値を参照して好適なビットレートを選択してもよい。また、セグメントデータ取得部232は、当該Representationが示す参照先から、セグメントデータ送信部132によって送信されたセグメントデータを取得する。なお、3次元データを再生する場合におけるビットレートは、3次元データ送信装置100、3次元データ再生装置200間における回線速度に応じて決定されてもよいし、ユーザが3次元データ再生装置200を操作することによって指定可能であってもよい。
 ステップS111において、復号部214は、セグメントデータ取得部232が取得したセグメントデータを復号する。
 ステップS112において、3次元モデル生成部215は、復号されたセグメントデータを参照して3次元モデルを生成する。
 ステップS113において、視点画像合成部216は、視点受付部211から入力された視点位置から見た3次元モデルを示す画像を合成する。
 ステップS114において、再生部213は、当該画像を表示部240に表示させる。
 上述したように、本実施形態に係る3次元データ送信装置100は、3次元データを送信する3次元データ送信装置100であって、メタ情報生成装置(メタ情報生成部)113と、メタ情報生成装置が生成したメタ情報を外部装置に送信する第1送信部(メタ情報送信部)131と、前記外部装置からの要求に応答して、前記第1種の画像データおよび前記第2種の画像データの少なくとも何れかを、前記外部装置に送信する第2送信部(セグメントデータ送信部)132と、を備えている構成である。上記の構成によれば、メタ情報、並びに第1種の画像データおよび第2種の画像データの少なくとも何れかを外部装置に送信可能な3次元データ送信装置100を実現できる。
 また、上述したように、本実施形態に係る3次元データ再生装置200は、3次元データを再生する3次元データ再生装置200であって、3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データとの参照先を示すメタ情報を取得する第1取得部(メタ情報取得部)231と、3次元データを再生する場合における、3次元データが示すオブジェクトに対する視点方向を取得する第2取得部(視点受付部)211と、当該視点方向に対応する参照先であって、前記メタ情報が示す参照先から、3次元データの再生に要する、前記第1種の画像データおよび前記第2種の画像データの少なくとも何れかを取得する第3取得部(セグメントデータ取得部)232と、前記第3取得部が取得した第1種の画像データおよび前記第2種の画像データの少なくとも何れかを参照して、前記3次元データを再生する再生部213と、を備えており、前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む構成である。上記の構成によれば、上述したメタ情報を参照して画像データを取得し、3次元データを再生可能な3次元データ再生装置200を実現できる。
 〔実施形態1の変形例〕
 本変形例においては、3次元モデルがメッシュモデルではなく、ポイントクラウド(点群)である場合について図8を参照して説明する。なお、説明の便宜上、上記実施形態にて説明した事項についての重複する説明を繰り返さない。
 図8は、ポイントクラウドである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。また、図8は、実施形態1における図4に対応する。
 3次元モデルがポイントクラウドである場合、デプス画像生成部112は、各視点方向について、1/2サブサンプルした点群を示すデプス画像、即ち点の数を元の3次元モデルから1/2に間引いたデプス画像を含む第1種の画像データ、及び、所定の視点方向について点の数を元の3次元モデルから間引かずにサンプリングした点群を示すデプス画像と、当該視点方向以外の視点方向について、1/4サブサンプルした点群を示すデプス画像、即ち点の数を元の3次元モデルから1/4に間引いたデプス画像とを含む第2種の画像データを生成する。ここで、第1種の画像データは、図8(a)に対応し、第2種の画像データは、図8(b)~(e)に対応する。本変形例の構成においてもメタ情報生成部113は、実施形態1と同様のMPDを生成し、以降の処理に使用することができる。
 〔実施形態2〕
 本発明の第2の実施形態について、図1、2、及び図9~図13を参照して説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。本実施形態においては、3次元データ再生装置が、MPDを参照して互いに異なる複数のストリームによって3次元データを示すセグメントデータを取得し、再生する工程の一例について説明する。以下、当該ストリームの数は2つであるものとして説明するが、これに限定されず、3以上のストリームが使用されることによって、本実施形態で説明する処理が実現されてもよい。
 本実施形態に係る各装置における主な工程として、以下の(1)~(4)が実行される。
(1)3次元データ送信装置が、取得した3次元モデルを参照して3次元データを示すセグメントデータと、当該セグメントデータの参照先を示すMPDとを生成する。
(2)3次元データ再生装置が、MPDと3次元データ再生時における視点方向を取得する。
(3)3次元データ再生装置が、MPDを参照して、3次元モデル全体の概要を示すセグメントデータと当該視点方向に応じたセグメントデータとを2つのストリームによって取得する。
(4)3次元データ再生装置が、各セグメントデータを参照して3次元データを再生する。
 〔1.3次元データ送信装置100の構成〕
 本実施形態においても図1に示す3次元データ送信装置100の構成を用いる。ただし、セグメントデータ送信部132は、2つのセグメントデータを2つのストリームによって並行して外部の装置に送信する機能を有する。
 〔2.3次元データ再生装置200の構成〕
 本実施形態においても図2に示す3次元データ再生装置200の構成を用いる。ただし、セグメントデータ取得部232は、セグメントデータを2つのストリームによって並行して外部の装置から取得する機能を有する。
 〔3.MPDについて〕
 本実施形態における3次元データの概要、及びメタ情報生成部113が生成するMPDの一例について説明する。図9(A)は、3次元空間上における3次元モデルに対する各視点方向を示す図である。図9(A)は、図3(A)と同一であり、本実施形態においてもv1~v4に示す4つの視点方向を例に挙げて説明する。
 図9(B)は、MPDの概要を示しており、図3(B)の構成とは互いに異なる。図9(B)において、AdaptationSet(a)は、図3(B)の構成と同様に、3次元モデル全体を一様な解像度でエンコードしたセグメントデータを示している。一方で、AdaptationSet(b)~(e)は、何れかの視点方向について(a)よりも解像度が高いデプス画像を含む第2種の画像データを示すセグメントデータの参照先を内包しているが、各第2種の画像データは、図10(b)~(e)および図11(b)に示すように、他の視点方向についてのデプス画像を含んでいない。
 ここで、図10は、メッシュモデルである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。また、図11は、デプス画像生成部112が生成する画像データであって、各視点方向に対応するデプス画像を含む画像データを示す図である。
 また、図12は、MPDの記述例を示す図である。ここで、図10~図12における(a)~(e)は、図9(B)におけるAdaptationSet(a)~(e)に対応する。
 また、図10~図12に示す例において、(a)は、各視点方向について一様な映像品質であるVGA画像がパッキングされた第1種の画像データの一例に対応する。また、(b)~(e)は何れかの視点方向についてVGA画像およびXGA画像よりも解像度が高いFHD画像を含む第2種の画像データの一例に対応する。
 図12に例示するMPDにおいては。各AdaptationSetがgroupの属性を有し、0または1の値を有している。これは、3次元データ再生装置200が3次元データを再生する場合に、group=0の値を有するAdaptationSetに由来するセグメントデータと、group=1の値を有するAdaptationSetに由来するセグメントデータとが、少なくとも1つずつ必要なことが規定されていることを示している。
 〔4.3次元データ再生に係る処理の流れ〕
 本実施形態に係る3次元データ送信装置100および3次元データ再生装置200による3次元データの生成および再生に係る処理の流れについて図13を参照して説明する。図13は、本実施形態に係る処理の流れを示すフローチャートである。
 ステップS101からステップS106までは、実施形態1と同様の処理が行われる。ただし、ステップS102でメタ情報生成部113が生成し、処理対象となるMPDは、図12に例示したMPDである。ステップS106の処理が実行されたのち、続いてステップS207の処理が実行される。
 ステップS207において、選択部212は、ステップS104で取得部が取得したMPDについて、group=0の値を有するAdaptationSetから、3次元データを再生する場合におけるビットレートに対応するRepresentationを選択する。ここで、group=0の値を有するAdaptationSetとは、図12の例における(a)のAdaptationSetに相当する。また、選択部212は、本ステップS207および後述するステップS208においてRepresentationを選択する場合に、各Representationタグに含まれる属性bandwidthの値を参照して好適なビットレートを選択してもよい。また、セグメントデータ取得部232は、当該Representationが示す参照先から、セグメントデータ送信部132によって送信されたセグメントデータを取得する。また、当該セグメントデータは、第1種の画像データに対応する。
 ステップS208において、選択部212は、ステップS105で選択した、group=1の値を有するAdaptationSetから、3次元データを再生する場合におけるビットレートに対応するRepresentationを選択する。ここで、group=1の値を有するAdaptationSetとは、図12の例における(b)~(e)のAdaptationSetに相当する。また、セグメントデータ取得部232は、当該Representationが示す参照先から、セグメントデータ送信部132によって送信されたセグメントデータを取得する。また、当該セグメントデータは、第2種の画像データに対応する。
 また、ステップS207とステップS208とにおけるセグメントデータ取得部232の処理は並行してなされてもよい。即ち、セグメントデータ送信部132は、2つのストリームのうち一方のストリームを使用してステップS207における第1種の画像データに対応するセグメントデータを送信しつつ、もう一方のストリームを使用してステップS208における第2種の画像データに対応するセグメントデータを送信し、セグメントデータ取得部232が各画像データを並行して取得してもよい。
 ステップS207の処理およびステップS208の処理が実行されたのち、続いてステップS111の処理が実行される。
 ステップS111からステップS114においては、実施形態1と同様の処理が実行させる。なお、ステップS112において、3次元モデル生成部215が映像の各フレームに対応する3次元モデルを生成する場合には、第2種の画像データに対応するセグメントデータのみを参照し、第1種の画像データに対応するセグメントデータを参照しない、ということは行われない。
 〔実施形態2の変形例1〕
 本変形例においては、3次元モデルがメッシュモデルではなく、ポイントクラウド(点群)である場合について図14を参照して説明する。なお、説明の便宜上、上記実施形態にて説明した事項についての重複する説明を繰り返さない。
 図14は、ポイントクラウドである3次元モデルを上方向から見た場合における3次元データの概要を示す図である。また、図14は、実施形態2における図10に対応する。
 3次元モデルがポイントクラウドである場合、デプス画像生成部112は、各視点方向について、1/4サブサンプルした点群を示すデプス画像、即ち点の数を元の3次元モデルから1/4に間引いたデプス画像を含む第1種の画像データ、及び、所定の視点方向について3/4サブサンプルした点群であって、元の3次元モデルと、第1種の画像データに含まれるデプス画像が示す点群との差分となる点群を示すデプス画像を含む第2種の画像データを生成する。ここで、第1種の画像データは、図14(a)に対応し、第2種の画像データは、図14(b)~(e)に対応する。
 本変形例の構成においてもメタ情報生成部113は、実施形態2と同様のMPDを生成し、以降の処理に使用することができる。
 〔実施形態2の変形例2〕
 実施形態2の第2の変形例について説明する。なお、説明の便宜上、上記実施形態にて説明した事項についての重複する説明を繰り返さない。
 ステップS207およびステップS208において、セグメントデータ送信部132は、単一のストリームにおける複数のレイヤーによって、第1種の画像データに対応するセグメントデータと、第2種の画像データとを、3次元データ再生装置200に送信する構成でもよい。また、複数のレイヤーとは、例えばベースレイヤーとエンハンスメントレイヤーとの2つのレイヤーであってもよい。
 本変形例の構成によれば、セグメントデータ取得部232は、単一のストリームによって、第1種の画像データに対応するセグメントデータと第2種の画像データに対応するセグメントデータとを並行して取得できる。なお、本変形例の構成は、実施形態2の変形例1に対しても適用可能である。
 〔ソフトウェアによる実現例〕
 3次元データ送信装置100の制御ブロック(特に視点受付部111、デプス画像生成部112、メタ情報生成部113および符号化部114)、並びに3次元データ再生装置200の制御ブロック(特に視点受付部211、選択部212、再生部213)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
 後者の場合、3次元データ送信装置100および3次元データ再生装置200は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも1つのプロセッサ(制御装置)を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも1つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
 〔まとめ〕
 本発明の態様1に係る生成装置は、3次元データに関するメタ情報を生成する生成装置であって、前記3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、前記3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データとの参照先を示すメタ情報を生成するメタ情報生成部を備えており、前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む構成である。上記の構成によれば、3次元データ再生時における画像品位の低下を抑制しつつ、通信量および通信に係る処理を軽減させるためのメタ情報を生成する生成装置を実現できる。
 本発明の態様2に係る生成装置は、上記の態様1において、前記メタ情報生成部は、前記メタ情報として、各視点方向に対応する各画像の解像度を識別するViewPointQualityタグを含むMPDを生成してもよい。上記の構成によれば、ViewPointQualityタグによって解像度を識別可能なMPDを生成する生成装置を実現できる。
 本発明の態様3に係る3次元データ送信装置は、3次元データを送信する3次元データ送信装置であって、上記の態様1又は2における生成装置と、前記メタ情報を外部装置に送信する第1送信部と、前記外部装置からの要求に応答して、前記第1種の画像データ、及び前記第2種の画像データの少なくとも何れかを、前記外部装置に送信する第2送信部と、を備える構成としてもよい。上記の構成によれば、メタ情報、並びに第1種の画像データおよび第2種の画像データの少なくとも何れかを外部装置に送信可能な3次元データ送信装置を実現できる。
 本発明の態様4に係る3次元データ送信装置は、上記の態様3において、前記第2送信部は、前記第1種の画像データと前記第2種の画像データとを、互いに異なる複数のストリームによって送信する構成としてもよい。上記の構成によれば、第1種の画像データと第2種の画像データとを別々のストリームによって送信可能な3次元データ送信装置を実現できる。
 本発明の態様5に係る3次元データ送信装置は、上記の態様3において、前記第2送信部は、前記第1種の画像データと前記第2種の画像データとを、単一のストリームにおける複数のレイヤーによって送信する構成としてもよい。上記の構成によれば、第1種の画像データと第2種の画像データとを単一のストリームによって送信可能な3次元データ送信装置を実現できる。
 本発明の態様6に係る3次元データ再生装置は、3次元データを再生する3次元データ再生装置であって、前記3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、前記3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データとの参照先を示すメタ情報を取得する第1取得部と、前記3次元データを再生する場合における、前記3次元データが示すオブジェクトに対する視点方向を取得する第2取得部と、当該視点方向に対応する参照先であって、前記メタ情報が示す参照先から、3次元データの再生に要する、前記第1種の画像データおよび前記第2種の画像データの少なくとも何れかを取得する第3取得部と、前記第3取得部が取得した第1種の画像データおよび前記第2種の画像データの少なくとも何れかを参照して、前記3次元データを再生する再生部と、を備えており、前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む構成である。上記の構成によれば、上述したメタ情報を参照して画像データを取得し、3次元データを再生可能な3次元データ再生装置を実現できる。
 本発明の態様7に係る3次元データ再生装置は、上記の態様6において、前記第1取得部は、前記メタ情報として、各視点方向に対応する各画像の解像度を識別するViewPointQualityタグを含むMPDを取得し、前記第3取得部は、前記ViewPointQualityタグを参照して決定されたAdaptationSetが参照先を示す画像データを取得してもよい。上記の構成によれば、ViewPointQualityタグを参照して決定された画像データを取得する3次元データ再生装置を実現できる。
 本発明の態様8に係る3次元データ再生装置は、上記の態様6又は7において、前記第3取得部は、前記第2取得部が取得した視点方向が示すベクトルと、前記第2種の画像データに含まれる、解像度が第1種の画像データに含まれる画像よりも高い画像に対応する視点方向が示すベクトルとの差分が閾値未満である場合、少なくとも前記第2種の画像データを取得し、当該閾値以上である場合、前記第2種の画像データを取得せず、前記第1種の画像データを取得する構成としてもよい。上記の構成によれば、視点方向に応じた好適な画像データを取得して3次元データを再生可能な3次元データ再生装置を実現できる。
 本発明の態様9に係る3次元データ再生装置は、上記の態様6から8までの何れかにおいて、前記第3取得部は、前記第1種の画像データと前記第2種の画像データとを、互いに異なる複数のストリームによって取得する構成としてもよい。上記の構成によれば、第1種の画像データと第2種の画像データとを別々のストリームによって取得可能な3次元データ再生装置を実現できる。
 本発明の態様10に係る3次元データ再生装置は、上記の態様6から8までの何れかにおいて、前記第3取得部は、前記第1種の画像データと前記第2種の画像データとを、単一のストリームにおける複数のレイヤーによって取得する構成としてもよい。上記の構成によれば、第1種の画像データと第2種の画像データとを単一のストリームによって取得可能な3次元データ再生装置を実現できる。
 本発明の各態様に係る生成装置、3次元データ送信装置、および3次元データ再生装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各装置が備える各部(ソフトウェア要素)として動作させることにより上記各装置をコンピュータにて実現させる上記各装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
 本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

 

Claims (10)

  1.  3次元データに関するメタ情報を生成する生成装置であって、
      前記3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、
      前記3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データと
    の参照先を示すメタ情報を生成するメタ情報生成部を備えており、
     前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む
    ことを特徴とする生成装置。
  2.  前記メタ情報生成部は、
      前記メタ情報として、各視点方向に対応する各画像の解像度を識別するViewPointQualityタグを含むMPDを生成する
    ことを特徴とする請求項1に記載の生成装置。
  3.  3次元データを送信する3次元データ送信装置であって、
     請求項1又は2に記載の生成装置と、
     前記メタ情報を外部装置に送信する第1送信部と、
     前記外部装置からの要求に応答して、前記第1種の画像データおよび前記第2種の画像データの少なくとも何れかを、前記外部装置に送信する第2送信部と、
    を備えることを特徴とする3次元データ送信装置。
  4.  前記第2送信部は、前記第1種の画像データと前記第2種の画像データとを、互いに異なる複数のストリームによって送信する
    ことを特徴とする請求項3に記載の3次元データ送信装置。
  5.  前記第2送信部は、前記第1種の画像データと前記第2種の画像データとを、単一のストリームにおける複数のレイヤーによって送信する
    ことを特徴とする請求項3に記載の3次元データ送信装置。
  6.  3次元データを再生する3次元データ再生装置であって、
      前記3次元データを構成する1又は複数の第1種の画像データであって、複数の視点方向に対応する各画像を含む1又は複数の第1種の画像データと、
      前記3次元データを構成する複数の第2種の画像データであって、1又は複数の視点方向に対応する各画像を含む複数の第2種の画像データと
    の参照先を示すメタ情報を取得する第1取得部と、
     前記3次元データを再生する場合における、前記3次元データが示すオブジェクトに対する視点方向を取得する第2取得部と、
     当該視点方向に対応する参照先であって、前記メタ情報が示す参照先から、3次元データの再生に要する、前記第1種の画像データおよび前記第2種の画像データの少なくとも何れかを取得する第3取得部と、
     前記第3取得部が取得した第1種の画像データおよび前記第2種の画像データの少なくとも何れかを参照して、前記3次元データを再生する再生部と、
    を備えており、
     前記複数の第2種の画像データは、少なくとも何れかの視点方向について、解像度が前記第1種の画像データに含まれる画像よりも高い画像を含む
    ことを特徴とする3次元データ再生装置。
  7.  前記第1取得部は、
      前記メタ情報として、各視点方向に対応する各画像の解像度を識別するViewPointQualityタグを含むMPDを取得し、
     前記第3取得部は、
      前記ViewPointQualityタグを参照して決定されたAdaptationSetが参照先を示す画像データを取得する
    ことを特徴とする請求項6に記載の3次元データ再生装置。
  8.  前記第3取得部は、
      前記第2取得部が取得した視点方向が示すベクトルと、前記第2種の画像データに含まれる、解像度が第1種の画像データに含まれる画像よりも高い画像に対応する視点方向が示すベクトルとの差分が閾値未満である場合、少なくとも前記第2種の画像データを取得し、当該閾値以上である場合、前記第2種の画像データを取得せず、前記第1種の画像データを取得する
    ことを特徴とする請求項6又は7に記載の3次元データ再生装置。
  9.  前記第3取得部は、前記第1種の画像データと前記第2種の画像データとを、互いに異なる複数のストリームによって取得する
    ことを特徴とする請求項6から8までの何れか1項に記載の3次元データ再生装置。
  10.  前記第3取得部は、前記第1種の画像データと前記第2種の画像データとを、単一のストリームにおける複数のレイヤーによって取得する
    ことを特徴とする請求項6から8までの何れ1項に記載の3次元データ再生装置。
PCT/JP2019/050083 2018-12-26 2019-12-20 生成装置、3次元データ送信装置、及び3次元データ再生装置 WO2020137876A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-243372 2018-12-26
JP2018243372A JP2022049708A (ja) 2018-12-26 2018-12-26 生成装置、3次元データ送信装置、及び3次元データ再生装置

Publications (1)

Publication Number Publication Date
WO2020137876A1 true WO2020137876A1 (ja) 2020-07-02

Family

ID=71128670

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/050083 WO2020137876A1 (ja) 2018-12-26 2019-12-20 生成装置、3次元データ送信装置、及び3次元データ再生装置

Country Status (2)

Country Link
JP (1) JP2022049708A (ja)
WO (1) WO2020137876A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022149189A1 (ja) * 2021-01-05 2022-07-14 日本電信電話株式会社 配信制御装置、配信制御システム、配信制御方法、及びプログラム
WO2022230186A1 (ja) * 2021-04-30 2022-11-03 日本電信電話株式会社 配信制御システム、配信制御装置、配信制御方法、及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018147089A1 (ja) * 2017-02-10 2018-08-16 ソニー株式会社 情報処理装置および方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018147089A1 (ja) * 2017-02-10 2018-08-16 ソニー株式会社 情報処理装置および方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SODAGAR, IRAJ: "White paper on MPEG-DASH's New Features", JTC 1/SC 29/WG1 N16708, ISO/IEC JTC 1/SC 29/WG11, January 2017 (2017-01-01) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022149189A1 (ja) * 2021-01-05 2022-07-14 日本電信電話株式会社 配信制御装置、配信制御システム、配信制御方法、及びプログラム
WO2022230186A1 (ja) * 2021-04-30 2022-11-03 日本電信電話株式会社 配信制御システム、配信制御装置、配信制御方法、及びプログラム

Also Published As

Publication number Publication date
JP2022049708A (ja) 2022-03-30

Similar Documents

Publication Publication Date Title
US11537562B2 (en) Auxiliary manifest file to provide timed metadata
JP6979035B2 (ja) 仮想現実メディアコンテンツのストリーミングを向上させる方法、デバイス及びコンピュータプログラム
RU2711591C1 (ru) Способ, устройство и компьютерная программа для адаптивной потоковой передачи мультимедийного контента виртуальной реальности
US11509878B2 (en) Methods and apparatus for using track derivations for network based media processing
WO2019202207A1 (en) Processing video patches for three-dimensional content
US11095936B2 (en) Streaming media transmission method and client applied to virtual reality technology
WO2014111423A1 (en) Method of displaying a region of interest in a video stream
US11252397B2 (en) File generation apparatus and file generation method as well as reproduction apparatus and reproduction method
CN109644296A (zh) 一种视频流传输方法、相关设备及系统
US11348307B2 (en) Method and device for processing content
WO2017022363A1 (ja) 情報処理装置、および情報処理方法、並びにプログラム
US10945000B2 (en) File generation apparatus and file generation method as well as reproduction apparatus and reproduction method
CN114450966A (zh) 用于异构沉浸式媒体的表示和流式传输的数据模型
WO2020137876A1 (ja) 生成装置、3次元データ送信装置、及び3次元データ再生装置
CN116233493A (zh) 沉浸媒体的数据处理方法、装置、设备及可读存储介质
CN114521332A (zh) 信息处理装置、再现处理装置和信息处理方法
JP5941000B2 (ja) 映像配信装置及び映像配信方法
KR101944601B1 (ko) 기간들에 걸쳐 오브젝트들을 식별하기 위한 방법 및 이에 대응하는 디바이스
WO2019187437A1 (ja) 情報処理装置、情報処理方法、及びプログラム
JPWO2019031306A1 (ja) 生成装置、再生装置、生成方法、再生方法、制御プログラム、記録媒体
US20180109585A1 (en) Information processing apparatus and information processing method
WO2019187434A1 (ja) 情報処理装置、情報処理方法、及びプログラム
WO2021100524A1 (ja) データ処理装置およびその制御方法、プログラム
US20230156257A1 (en) Information processing apparatus, information processing method, and storage medium
US20230043591A1 (en) Information processing apparatus and method

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19904539

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19904539

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP