WO2021100524A1 - データ処理装置およびその制御方法、プログラム - Google Patents

データ処理装置およびその制御方法、プログラム Download PDF

Info

Publication number
WO2021100524A1
WO2021100524A1 PCT/JP2020/041753 JP2020041753W WO2021100524A1 WO 2021100524 A1 WO2021100524 A1 WO 2021100524A1 JP 2020041753 W JP2020041753 W JP 2020041753W WO 2021100524 A1 WO2021100524 A1 WO 2021100524A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
images
data processing
contents
information
Prior art date
Application number
PCT/JP2020/041753
Other languages
English (en)
French (fr)
Inventor
亨 強矢
Original Assignee
キヤノン株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by キヤノン株式会社 filed Critical キヤノン株式会社
Priority to EP20890470.6A priority Critical patent/EP4064061A4/en
Priority to CN202080081055.3A priority patent/CN114731463A/zh
Publication of WO2021100524A1 publication Critical patent/WO2021100524A1/ja
Priority to US17/747,756 priority patent/US20220279030A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/764Media network packet handling at the destination 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring

Definitions

  • the present invention relates to a data processing device, a control method thereof, and a program.
  • MPEG-DASH Dynamic Adaptive Streaming over Http
  • HTTP Hypertext Transfer Protocol
  • the transmitting device divides the video data into segments having a predetermined time length, and describes a URL (Uniform Resource Locator) for acquiring the segments in a file called a playlist.
  • the receiving device first acquires this playlist, and requests and acquires a desired segment from the transmitting device using the information described in the playlist.
  • a desired segment is selected from a plurality of segments generated by temporally and spatially dividing an image included in the video data. The configuration that the receiving device selects and receives is disclosed.
  • Patent Document 1 distributes a segment obtained by time-dividing one moving image file and spatially dividing it, but distributes a file that can include a plurality of images in one file, for example, a HEIF file. In addition, it does not make individual images deliverable.
  • HEIF is an abbreviation for High Efficiency Image File Format.
  • image is a general term for moving images and still images.
  • the receiving device stores the HEIF file. There was the issue of having to download the entire file.
  • the transmitter has the following configuration. That is, An acquisition means for analyzing a file having a predetermined format including a plurality of contents and acquiring relationship information indicating the relationship between the plurality of contents and the plurality of contents. A storage means for storing the plurality of contents acquired by the acquisition means, and a storage means for storing the plurality of contents. An acquisition means for individually acquiring the plurality of contents from the storage means, a generation means for generating a playlist in which the relational information is described, and a generation means for generating the playlist. A communication means for transmitting the playlist to the external device and transmitting the content requested by the external device using the acquired information included in the playlist to the external device.
  • FIG. 1 is a diagram showing a configuration of a communication system according to an embodiment.
  • FIG. 2 is a block diagram showing a functional configuration example of the transmission device according to the embodiment.
  • FIG. 3 is a flowchart showing an example of HEIF file analysis processing in the embodiment.
  • FIG. 4 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 5 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 6 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 7 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 8 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 1 is a diagram showing a configuration of a communication system according to an embodiment.
  • FIG. 2 is a block diagram showing a functional configuration example of the transmission device according to the embodiment.
  • FIG. 3 is a flowchart showing an example of HEIF file analysis
  • FIG. 9 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 10A is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 10B is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 11 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 12 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 13 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 14 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 15 is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 16A is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 16B is a diagram showing an example of a playlist generated by the transmitting device.
  • FIG. 17 is a block diagram showing a functional configuration example of the receiving device according to the embodiment.
  • FIG. 18 is a flowchart showing an example of reception processing by the receiving device.
  • FIG. 19 is a block diagram showing a hardware configuration example of the transmission device according to the embodiment.
  • FIG. 1 shows an example of the overall configuration of the communication system according to the first embodiment.
  • the transmission device 100 is an example of a data processing device that delivers a file in a predetermined format, and is connected to the reception device 200 via a network 150.
  • the transmission device 100 streams and distributes the image data by the HTTP protocol.
  • the transmission device 100 can stream-deliver a desired image from a plurality of images contained in one file.
  • a plurality of transmitting devices 100 and a plurality of receiving devices 200 may exist.
  • Specific examples of the transmission device 100 include a camera device, a video camera device, a smartphone, a mobile phone, a PC device, a cloud server device, and the like.
  • the transmission device 100 is not limited to these examples as long as it satisfies the functional configuration described later.
  • the receiving device 200 is a data processing device having a content reproduction / display function, a communication function, and a function of receiving input from a user. Specific examples of the receiving device 200 include smartphones, mobile phones, PC devices, televisions, and the like. However, the receiving device 200 is not limited to these as long as it has the functions described later.
  • the network 150 connects the transmitting device 100 and the receiving device 200 so as to be communicable.
  • Examples of the network 150 include a wired LAN (Local Area Network) and a wireless LAN (Wireless LAN).
  • the network 150 is not limited to these, and may be, for example, the Internet, WAN (Wide Area Network) such as 3G / 4G / LTE / 5G, ad hoc network, Bluetooth, or the like.
  • FIG. 2 is a block diagram showing a functional configuration example of the transmission device 100 according to the first embodiment.
  • the file analysis unit 101 and the coded data extraction unit 102 analyze a file in a predetermined format including a plurality of contents, and acquire a plurality of contents and relationship information indicating the relationship between the plurality of contents.
  • the file of the predetermined format is, for example, a HEIF (High Efficiency Image File Format) file.
  • the relationship information includes a relationship between a still image and a thumbnail image, a relationship between a derivative image and an image constituting the derivative image, and the like.
  • the file analysis unit 101 acquires the HEIF file and analyzes its structure.
  • the coded data extraction unit 102 extracts the coded data of the content stored in the HEIF file based on the analysis result of the HEIF file.
  • the segment generation unit 103 converts the coded data extracted by the coded data extraction unit 102 into a time length and a bit rate suitable for communication, if necessary, and generates a segment in which the coded data is stored.
  • the coded data conversion unit 104 converts the extracted coded data into a different coded format as needed.
  • the segment generation unit 103 also has a function of generating a segment in which the coded data generated by the coded data conversion unit 104 is stored.
  • the distribution data storage unit 105 stores the plurality of contents acquired as described above so that the external device (the receiving device 200 in the example of the present embodiment) can individually acquire the plurality of contents. More specifically, the distribution data storage unit 105 stores the data generated by the segment generation unit 103 and the coded data conversion unit 104.
  • the playlist generation unit 106 creates a playlist in which acquisition information (URL (Uniform Resource Locator) in this embodiment) for individually acquiring a plurality of contents from the distribution data storage unit 105 and the above-mentioned related information are described. Generate. More specifically, the playlist generation unit 106 generates a playlist in which a URL that enables access to the data stored in the distribution data storage unit 105 is described based on the analysis result of the HEIF file. Details of the related information will be described later.
  • the communication unit 107 transmits the generated playlist, distribution data, and the like to the receiving device 200 via the network 150 in response to a request from the receiving device 200, which is an external device.
  • Each of the above functional units can be realized by executing and controlling a predetermined program stored in one or a plurality of memories by one or a plurality of CPUs.
  • a part or all of each of the said functional parts may be realized by the dedicated hardware.
  • the transmission device 100 includes a CPU 121, a ROM 122, a RAM 123, an auxiliary storage device 124, a display unit 125, an operation unit 126, a communication I / F 127, and a bus 128.
  • the CPU 121 realizes each function of the transmission device 100 shown in FIG. 2 by controlling the entire transmission device 100 using computer programs and data stored in the ROM 122 and the RAM 123.
  • the transmission device 100 may have one or more dedicated hardware different from the CPU 121, and the dedicated hardware may execute at least a part of the processing by the CPU 121. Examples of dedicated hardware include ASICs (application specific integrated circuits), FPGAs (field programmable gate arrays), and DSPs (digital signal processors).
  • the ROM 122 stores a program or the like that does not need to be changed.
  • the RAM 123 temporarily stores programs and data supplied from the auxiliary storage device 124, data supplied from the outside via the communication I / F 127, and the like.
  • the auxiliary storage device 124 is composed of, for example, a hard disk drive or the like, and stores various data (files) to be transmitted to the receiving device 200, such as image data and audio data.
  • the display unit 125 is composed of, for example, a liquid crystal display, an LED, or the like, and displays a GUI (Graphical User Interface) or the like for the user to operate the transmission device 100.
  • the operation unit 126 is composed of, for example, a keyboard, a mouse, a joystick, a touch panel, and the like, and inputs various instructions to the CPU 121 in response to an operation by the user.
  • the CPU 121 operates as a display control unit that controls the display unit 125 and an operation control unit that controls the operation unit 126.
  • the communication I / F 127 is used for communication between the transmitting device 100 and an external device (for example, the receiving device 200).
  • the communication I / F 127 is an interface that connects to the network 150.
  • a communication cable is connected to the communication I / F 127.
  • the communication I / F 127 includes an antenna.
  • the bus 128 connects each part of the transmission device 100 to transmit information.
  • auxiliary storage device 124, the display unit 125, and the operation unit 126 exist inside the transmission device 100, but at least one of these exists as another device outside the transmission device 100. It may be omitted or it may be omitted.
  • FIG. 3 is a flowchart showing an example of HEIF file analysis processing by the file analysis unit 101.
  • step S301 the file analysis unit 101 acquires the HEIF file to be distributed.
  • step S302 the file analysis unit 101 confirms whether the handler type pict exists in the meta header of the HEIF file. If it is determined that the pict handler does not exist (NO in step S302), the file analysis unit 101 ends this process without performing further analysis. On the other hand, if it is determined that the pict handler exists (YES in step S302), in step S303, the file analysis unit 101 acquires the number and types of items stored in the HEIF file. In the HEIF file, stored images, contents such as metadata related to the images are called items.
  • the file analysis unit 101 acquires reference information between items.
  • the HEIF file stores reference information indicating the relationship between a still image and its thumbnail image.
  • the HEIF file can store an image for generating one image by combining a plurality of images.
  • One image generated by combining a plurality of images is called a derivative image.
  • reference information indicating the relationship between the derived image and a plurality of images constituting the derived image is stored in the HEIF file. Further, in order to generate a derivative image, information on the position for arranging a plurality of images is required.
  • step S306 is skipped. The handling of the derived image will be described in detail with reference to the second embodiment.
  • step S307 the file analysis unit 101 acquires alternative information for the item from the HEIF file.
  • alternative information for example, when a derivative image cannot be displayed, there is a case where an image to be displayed is specified instead.
  • the alternative image will be described in more detail in the second embodiment.
  • step S308 the file analysis unit 101 specifies the property associated with each item. Specific examples of the property include item encoding information and rectangle size information. Therefore, in the next step S309, the file analysis unit 101 acquires the coding information and the rectangle size information of the image from the specified property.
  • step S310 the file analysis unit 101 acquires the position and size information of the item in the HEIF file.
  • the coded data extraction unit 102 extracts an item from the HEIF file based on the position and size information of the item acquired by the file analysis unit 101 as described above.
  • the coded data conversion unit 104 converts the extracted coded data into a different coded format as needed. For example, when the coding format before data conversion is HEVC, the coded data conversion unit 104 converts it to JPEG as necessary.
  • the acquired information may include a URL that can be acquired after being converted into a different encoding format.
  • the segment generation unit 103 generates a segment from the coded data extracted by the coded data extraction unit 102 and the coded data converted by the coded data conversion unit 104, and stores the segment in the distribution data storage unit 105.
  • the playlist generation unit 106 uses the reference information, coding information, image size information, and the like acquired by the file analysis unit 101 to allow the receiving device 200 to access the segment stored in the distribution data storage unit 105. To generate.
  • FIG. 4 is an example of a playlist generated by the transmission device according to the embodiment of the present invention, and is a description example that enables distribution of a HEIF file in which a plurality of images are stored.
  • the playlist of FIG. 4 includes URLs of four still images and four thumbnail images as acquired information, and includes information indicating the correspondence between the still images and thumbnail images as related information.
  • the playlist shown in FIG. 4 shows a part of MPD (Media Presentation Description) used for distribution in MPEG-DASH.
  • the playlist shows that four images and thumbnail images of each image can be acquired.
  • each image is described as a Representation
  • a thumbnail image is described as each SubRepresentation.
  • the type attribute 401 the type "thmb" indicating that it is a thumbnail image is described.
  • image is described as a type attribute.
  • the relationship between the image and the thumbnail image is represented by the relationship between Representation and SubRepresentation.
  • the mimetype 402 (mimeType) shows the mimetypes of the four images below the Representation and the thumbnail image.
  • the mime type 402 is shown to be a HEIF file containing an image encoded by HEVC (image / heic). That is, when a plurality of images are stored in the HEIF file to be distributed, the transmission device 100 generates a HEIF file that stores only one of each image again. The re-encapsulation into the HEIF file is performed by the segment generation unit 103, and the generated HEIF file is stored in the distribution data storage unit 105.
  • primary attributes 403 to 406 are described as attributes of Representation.
  • the primary attribute is information indicating the priority between a plurality of items (images), and is an example of relationship information.
  • the value of the primary attribute 403 is set to "1"
  • the values of the other primary attributes 404, 405, and 406 are set to "0" so that the image in which the value of the primary attribute "1" is set is the primary image. It shows that.
  • one item identifier is specified as information indicating the primary item, so to express it in MPD, it can be realized by setting the value of any one of the primary attributes to "1" as described above. Is. It should be noted that, instead of the two levels of "0" or “1", for example, if “0" is set as the highest priority and the priority is lowered as the value increases to "1" and "2", 3 is easily achieved. It is possible to express the priority of one or more levels.
  • FIG. 5 shows a case where re-encapsulation is not performed.
  • the encoded data obtained by encoding the contents and the decoding information required for decoding the encoded data are separately stored for each of the plurality of contents (in this example, a plurality of images). Will be done.
  • the acquisition information for acquiring these includes information for acquiring encoded data from the distribution data storage unit 105 and information for acquiring decoding information from the distribution data storage unit 105.
  • FIG. 5 is an example of a playlist generated by the transmission device 100 of the first embodiment, and is another description example capable of delivering a HEIF file in which a plurality of images are stored.
  • the initialization information 501 is an example of decoding information necessary for decoding the first HEVC-encoded image
  • the image data 502 shows the HEVC-encoded data of the first image. ..
  • the initialization information and encoding information extracted from the input HEIF file can be acquired as they are without encapsulation.
  • the initialization information 503 and the image data 504 are initialization information and encoding information of the thumbnail image of the first image.
  • the mime type 505 in FIG. 5 is described as "image / H265". "H265" as an image subtype is not approved by IANA (Internet Assigned Number Authority). However, if re-encapsulation is not required as shown in FIG. 5, the data extracted from the input HEIF file can be used as it is, so that the processing in the transmission device 100 can be simplified. That is, in the description example of FIG. 5, the segment generation unit 103 does not have to re-encapsulate the extracted image item as a HEIF file.
  • FIG. 6 is an example of a playlist generated by the transmission device 100 of the first embodiment, and is a description example of a playlist in which a HEIF file in which a plurality of images are stored can be distributed.
  • the type attribute 601 of Representation is a thumbnail.
  • this thumbnail can indicate that the thumbnail of the image whose Representation identifier is "0".
  • the reference identifier 602 is an example of the relationship information representing the relationship between the images.
  • thumbnail images are described as Representations for each of the four images.
  • FIG. 7 is an example of a playlist generated by the transmission device 100 of the first embodiment, and is a description example of a playlist in which a HEIF file in which a plurality of images are stored can be distributed.
  • thumbnail image is described as a SubRepresentation of Representation different from the base image.
  • the MPD description examples described so far describe a plurality of images and each thumbnail image, but the description amount can be reduced by describing the same attribute values together.
  • the case will be described with reference to FIG. Reducing the amount of playlist description reduces the time required to send and receive playlists.
  • FIG. 8 is an example of a playlist generated by the transmission device 100 according to the first embodiment, and particularly when a HEIF file in which a plurality of images and each thumbnail image are stored can be distributed, the amount of MPD described is This is a description example that can reduce.
  • the type attribute 801 indicates that the thumbnail image is a thumbnail image. Further, by describing the identifier 803 of the base image by the reference identifier 802 of each segment indicating the thumbnail image, the thumbnail image and the original image can be linked. Further, by describing the primary attribute 804 for each segment representing the image as shown in FIG. 8, the primary item can also be identified.
  • FIG. 9 is an example of a playlist generated by the transmission device 100 according to the first embodiment, and in particular, is a description example of a playlist when metadata such as EXIF is described in MPD.
  • the items described in MPD are XMP (Extensible Metadata Platform) and EXIF, and the mime type 901 shows that the data format of these metadata is XML.
  • the first Representation in FIG. 9 indicates that it is XMP with the type attribute 902, and the reference identifier 903 describes the identifier of the image associated with this XMP.
  • Yet another Representation shows that it is EXIF with the type attribute 904, but in the example of FIG. 9, it shows that it is possible to obtain the EXIF information converted into XML format, and the reference identifier 905. Indicates the identifier of the image associated with this EXIF.
  • a playlist in which a HEIF file containing a plurality of images can be distributed has been described.
  • a derivative image of HEIF and a substitute image are described in MPD.
  • the configuration and operation of the communication system according to the second embodiment and the transmission device 100 as a data processing device are the same as those of the first embodiment (FIGS. 1, 2, and 3).
  • the description relating to the derivative image acquired in step S306 of FIG. 3 is illustrated.
  • FIG. 10A is a diagram showing a configuration example of a derivative image.
  • FIG. 10B is an example of a playlist generated by the transmission device 100 according to the second embodiment, and is a description example in which a derivative image for generating one image by combining a plurality of images is described in MPD.
  • the derivative image and the four images constituting the derivative image are described as Representations in the playlist of FIG. 10B.
  • the type attribute 1001 is described as "dimg” which is a type indicating the derived image.
  • "grid” indicating a grid image which is a detailed type of the derived image is described.
  • "4" which is the number of images constituting the grid image, is described in the count attribute 1003.
  • coordinate information indicating a position where the segment is displayed is described as information indicating the arrangement of each segment. In FIG. 10B, the coordinates of the upper left are described as the coordinate information, but the information indicating the coordinates may be the coordinates of the lower right or the center as long as the display position of each image in the grid image can be specified.
  • the overlay image can be expressed by the same description method as the grid image.
  • layer information indicating the order for superimposing them is required.
  • the layer information can be described as, for example, one of the attribute information of each segment described in the segment information 1004.
  • the order of the segments described in the segment information 1004 may indicate the order of the layers.
  • FIG. 11 is another example of the playlist generated by the transmission device 100 according to the second embodiment, and in particular, when it is possible to distribute a derivative image that generates one image by combining a plurality of images, the MPD This is a description example that reduces the amount of description.
  • the description regarding the derivative image is the same as in the examples of FIGS. 10A and 10B. That is, it is identified by the Representation type attribute ("dimg"), and the SubRepresentation type attribute ("grid") and count attribute ("4") indicate the detailed type of the derived image and the number of segments that make up the derived image. ..
  • the amount of description is reduced by combining the constituent images having the same attribute information into one Representation, as in the playlist of FIG. 8 described in the first embodiment. ..
  • the identifier of the representation referenced by the segment information of the derived image becomes the same between the constituent images.
  • the reference identifier 1101 described in the segment constituting the derived image is described by combining the identifier 1102 of the representation that summarizes the constituent images and the auxiliary identifier 1103 of the segment that is the constituent image.
  • the two identifiers are described in a format in which they are connected by a hyphen.
  • FIG. 12 is an example of a playlist generated by the transmission device 100 according to the second embodiment, and is a description example showing an alternative image by setting a priority for the image to be displayed.
  • the derivative image is generated from four constituent images and one SEI (Supplemental Enhancement Information: alpha plane).
  • SEI Supplemental Enhancement Information: alpha plane.
  • the display of the derivative image is given the highest priority, but when the receiving device 200 cannot display the derivative image, one of the images constituting the derivative image is displayed as an alternative image instead of the derivative image. Used.
  • the primary attribute of the derived image is set to the highest priority, and the next priority is set to the image used as the substitute image. It is assumed that the value of the primary attribute is "0" as the highest priority, and the priority decreases as the number increases.
  • the value of the primary attribute 1201 of the derived image is set to "0".
  • the value of the primary attribute 1202 of the first constituent image is set to "1" as the second point, and the value of the primary attribute 1203 of the second constituent image and the primary attribute 1204 of the third constituent image are further set as the second runner.
  • the values of are both set to "2". If the values of the primary attributes are equal, either one may be selected.
  • FIG. 13 is an example of a playlist generated by the transmission device 100 according to the second embodiment, and is a description example of setting an alternative group for an image.
  • the plurality of contents included in the HEIF file include a group of images to be substituted with each other as an alternative group, and the relational information indicates which alternative group each of the plurality of images belongs to.
  • images 1 to 6 describe alternative group attributes 1301 to 1306, and those having the same value of alternative group attributes represent groups that can be substituted.
  • the values of the alternative group attributes 1301 to 1303 are described as "1"
  • the values of the alternative group attributes 1304 to 1306 are described as "2". Therefore, the receiving device 200 can select and use one from the images 1 to 3 and similarly one from the images 4 to 6.
  • the playlist example of FIG. 13 two alternative groups containing a plurality of images of different sizes are described.
  • FIG. 13 shows an example in which a plurality of images having different sizes belong to the alternative group, but the present invention is not limited to this.
  • a plurality of images encoded by different encoding methods may belong to the alternative group. In this way, the receiving device 200 can flexibly select an image according to the coded data to which it corresponds.
  • FIG. 14 is an example of a playlist generated by the transmission device 100 according to the second embodiment, and is a description example in which a derivative image can be acquired by generating a derivative image on the transmission device 100 side in advance.
  • the derivative image 1401 is generated from four constituent images in the same manner as the description of the derivative image in FIGS. 10A and 10B.
  • the derivative image 1402 is a HEVC recoded version of the derivative image 1401 as one image.
  • the derivative image 1403 is a JPEG recoded version of the derivative image 1401 as one image.
  • the derivative images 1402 and 1403 can be substitute images for the derivative image 1401. Therefore, the receiving device 200, which cannot generate a derivative image from the four constituent images, acquires either the derivative image 1402 (HEIF) or the derivative image 1403 (JPEG), which is a derivative image already generated as one image. Can be used.
  • the related information regarding the derivative image and the alternative image has been illustrated.
  • the description method of the derivative image for displaying one image by combining a plurality of still images has been mainly described, but if the method described in the present embodiment is used, the still image and the moving image can be obtained. Needless to say, it is easy to describe a combined derivative image.
  • a third embodiment a case where the image to be displayed is changed according to the playback time as in a slide show will be described.
  • the configuration and processing of the communication system according to the third embodiment and the transmission device are the same as those of the first embodiment (FIGS. 1, 2, and 3).
  • FIG. 15 is an example of a playlist generated by the transmission device according to the third embodiment, and is a description example in which an image that can be acquired is changed with the lapse of playback time.
  • there are three periods of 10 seconds (duration "PTIM10.0S"), and different images can be acquired in each period. Therefore, the receiving device 200 can acquire and display different images in each period.
  • each image is displayed for 10 seconds in the order of image1.heic ⁇ image2.heic ⁇ image3.heic.
  • 16A and 16B are examples of playlists generated by the transmission device 100 according to the third embodiment, and in particular, are description examples of changing an image to be displayed with the passage of playback time.
  • FIGS. 16A and 16B the information is different for each period. Describe the information together.
  • the priority element 1602. The method of describing the priority element is not limited to this.
  • the priority element 1604 described in the period information 1603 shown in FIG. 16B the Representation identifiers may be described in descending order of priority for each period.
  • the receiving device 200 that has received the example of MPD shown in FIG. 16A or FIG. 16B is expected to display the image having the highest priority among the images that can be displayed in each period.
  • the HEIF file can be distributed by MPEG-DASH. Therefore, for example, only a desired still image can be acquired from the HEIF file, or every predetermined time. It is possible to set a still image that can be acquired in.
  • the receiving device 200 that receives the playlist from the transmitting device 100 described in the first to third embodiments and acquires the content (image) from the transmitting device 100 using the received playlist. explain.
  • FIG. 17 is a block diagram showing a hardware configuration example of the receiving device 200.
  • the communication unit 1701 connects to the network 150 and communicates with the transmitting device 100.
  • the one or more memories 1702 stores various programs executed by the one or more CPUs 1703. Further, the memory 1702 provides a working memory when the CPU 1703 executes various processes.
  • the memory 1702 is a ROM, RAM, a hard disk, or a combination thereof.
  • the CPU 1703 executes a program stored in the memory 1702 to execute various controls. For example, the CPU 1703 receives a playlist from the transmission device 100, holds it in the memory 1702, acquires an image from the transmission device 100 using the playlist, and displays the image on the display 1704.
  • FIG. 18 is a flowchart illustrating an acquisition process in which the receiving device 200 acquires the content (image) from the transmitting device 100.
  • the CPU 1703 requests a playlist from the transmitting device 100.
  • the CPU 1703 receives a playlist from the transmission device 100. The received playlist is held in the memory 1702.
  • step S1803 the CPU 1703 selects a desired segment from the segments in which the playlist storage destination is described.
  • the segment selection may be made, for example, based on user interaction with the receiver 200 or based on instructions from a running application.
  • step S1804 the CPU 1703 acquires the data of the segment selected in step S1803 from the transmission device 100. That is, the CPU 1703 requests the data of the segment selected in step S1803 from the transmission device 100 via the communication unit 1701, and the segment data (for example, a still image, a thumbnail) from the transmission device 100 via the communication unit 1701. Receive images, etc.).
  • the CPU 1703 can acquire the segment from the transmission device 100 by using the URL described in the segment in the playlist.
  • step S1805 the CPU 1703 reproduces the data acquired in step S1804. For example, the CPU 1703 displays the received still image on the display 1704.
  • the CPU 1703 acquires a plurality of thumbnail images from the transmission device 100 by requesting segments of the plurality of thumbnail images and displays them on the display 1704. After that, for example, in response to the user's operation of selecting a thumbnail image, the CPU 1703 requests the transmission device 100 for a segment of the still image corresponding to the selected thumbnail image, acquires the still image which is the segment data, and displays the display 1704. indicate.
  • the CPU 1703 receives the playlist of FIG. 10B under the setting of displaying the image of the highest priority
  • the image of the highest priority is a derivative image (grid image). Therefore, the CPU 1703 receives the four images by requesting the necessary image segments according to the description of the derived image, generates a grid image, and displays it on the display 1704. Further, by using the playlists shown in FIGS. 15, 16A, and 16B of the third embodiment, the receiving device 200 sequentially displays a plurality of files included in the HEIF file like a slide show. Can be done.
  • the receiving device that has received the playlists of the first to third embodiments does not receive the entire HEIF file containing the plurality of items, but has a plurality of items included in the HEIF file. You can selectively receive the required items in.
  • the present invention can take embodiments as, for example, a system, an apparatus, a method, a program, a recording medium (storage medium), or the like. Specifically, it may be applied to a system composed of a plurality of devices (for example, a host computer, an interface device, an imaging device, a web application, etc.), or it may be applied to a device composed of one device. good.
  • the present invention supplies a program that realizes one or more functions of the above-described embodiment to a system or device via a network or storage medium, and one or more processors in the computer of the system or device reads and executes the program. It can also be realized by the processing to be performed. It can also be realized by a circuit (for example, ASIC) that realizes one or more functions.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

データ処理装置は、複数のコンテンツを含む所定のフォーマットのファイルを解析して複数のコンテンツおよび複数のコンテンツの関係を示す関係情報を取得し、取得された複数のコンテンツを格納し、格納された複数のコンテンツを個別に取得するための取得情報と、それらの関係情報とを記述したプレイリストを生成し、プレイリストを外部装置に送信して、外部装置がプレイリストに含まれる取得情報を用いて要求したコンテンツを外部装置に送信する。

Description

データ処理装置およびその制御方法、プログラム
 本発明は、データ処理装置およびその制御方法、プログラムに関する。
 近年、映像データをHTTP(Hypertext Transfer Protocol)でストリーミング配信する技術としてISOで標準化されたMPEG-DASH(Dynamic Adaptive Streaming over Http)が普及している。具体的には、送信装置が、映像データを所定の時間長のセグメントに分割し、セグメントを取得するためのURL(Uniform Resource Locator)をプレイリストと呼ばれるファイルに記述する。受信装置は初めにこのプレイリストを取得して、プレイリストに記述されている情報を用いて所望のセグメントを送信装置に要求して取得する。また、特許文献1では、MPEG-DASHを用いて映像データを取得する構成において、映像データに含まれる画像を時間的かつ空間的に分割して生成される複数のセグメントのうち、所望のセグメントを受信装置が選択して受信する構成が開示されている。
特開2016-9925号公報
 しかしながら、MPEG-DASHでは、符号化データとして動画(映像データ)を配信することしか想定されておらず、静止画を配信することは想定されていない。特許文献1は、1つの動画ファイルを時分割し、且つ、空間的に分割して得られたセグメントを配信するが、1つのファイルに複数の画像を含み得るファイル、例えばHEIFファイルを配信する場合に、個々の画像を配信可能にするものではない。なお、HEIFとは、High Efficiency Image File Formatの略である。また、本明細書において、画像とは動画と静止画を総称する用語である。従って、例えばコンテンツサーバに保持されたHEIFファイルに複数の静止画が格納され、受信装置がそのHEIFファイル中の一部の静止画のみを必要とするような場合でも、受信装置は当該HEIFファイルをまるごとダウンロードしなければならないという課題があった。
 本発明の一態様では、1つのファイルに格納された複数の画像から所望の画像を配信可能とする技術が提供される。
 本発明の一態様による送信装置は以下の構成を備える。すなわち、
 複数のコンテンツを含む所定のフォーマットのファイルを解析して前記複数のコンテンツおよび前記複数のコンテンツの関係を示す関係情報を取得する取得手段と、
 前記取得手段により取得された前記複数のコンテンツを格納する格納手段と、
 前記格納手段から前記複数のコンテンツを個別に取得するための取得情報と、前記関係情報とを記述したプレイリストを生成する生成手段と、
 前記プレイリストを外部装置に送信し、前記外部装置が前記プレイリストに含まれる前記取得情報を用いて要求したコンテンツを前記外部装置に送信する通信手段と、を備える。
 本発明によれば、1つのファイルに格納された複数の静止画から所望の静止画を配信可能とする技術が提供される。
 本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。
図1は、実施形態による通信システムの構成を示す図である。 図2は、実施形態による送信装置の機能構成例を示すブロック図である。 図3は、実施形態におけるHEIFファイル解析処理の一例を示すフローチャートである。 図4は、送信装置において生成されるプレイリストの一例を示す図である。 図5は、送信装置において生成されるプレイリストの一例を示す図である。 図6は、送信装置において生成されるプレイリストの一例を示す図である。 図7は、送信装置において生成されるプレイリストの一例を示す図である。 図8は、送信装置において生成されるプレイリストの一例を示す図である。 図9は、送信装置において生成されるプレイリストの一例を示す図である。 図10Aは、送信装置において生成されるプレイリストの一例を示す図である。 図10Bは、送信装置において生成されるプレイリストの一例を示す図である。 図11は、送信装置において生成されるプレイリストの一例を示す図である。 図12は、送信装置において生成されるプレイリストの一例を示す図である。 図13は、送信装置において生成されるプレイリストの一例を示す図である。 図14は、送信装置において生成されるプレイリストの一例を示す図である。 図15は、送信装置において生成されるプレイリストの一例を示す図である。 図16Aは、送信装置において生成されるプレイリストの一例を示す図である。 図16Bは、送信装置において生成されるプレイリストの一例を示す図である。 図17は、実施形態による受信装置の機能構成例を示すブロック図である。 図18は、受信装置による受信処理の例を示すフローチャートである。 図19は、実施形態による送信装置のハードウエア構成例を示すブロック図である。
 以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
 <第1実施形態>
 図1に第1実施形態における通信システムの全体構成例を示す。送信装置100は、所定のフォーマットのファイルを配信するデータ処理装置の一例であり、ネットワーク150を介して、受信装置200と接続される。送信装置100は、画像データをHTTPプロトコルでストリーミング配信する。送信装置100は、後述のように、1つのファイルに含まれている複数の画像から所望の画像をストリーミング配信することができる。なお、送信装置100、受信装置200はそれぞれ複数存在しても良い。送信装置100の具体的な例としては、カメラ装置、ビデオカメラ装置、スマートフォン、携帯電話、PC装置、クラウドサーバ装置などが挙げられる。但し、後述の機能構成を満たすものであれば、送信装置100はこれらの例に限定されるものではない。受信装置200は、コンテンツの再生・表示機能、通信機能、及びユーザからの入力を受け付ける機能を備えるデータ処理装置である。受信装置200の具体例は、スマートフォン、携帯電話、PC装置、テレビなどが挙げられる。但し、後述の機能を備えるものであれば、受信装置200はこれらに限定されるものではない。
 ネットワーク150は、送信装置100と受信装置200を通信可能に接続する。ネットワーク150の例としては、有線LAN(Local Area Network)や無線LAN(Wireless LAN)が挙げられる。但し、ネットワーク150は、これらに限られるものではなく、例えば、インターネットや3G/4G/LTE/5GなどのWAN(Wide Area Network)、アドホックネットワーク、Bluetoothなどでもよい。
 次に、第1実施形態における送信装置100の機能構成について、図2を用いて説明する。図2は、第1実施形態による送信装置100の機能構成例を示すブロック図である。
 ファイル解析部101と符号化データ抽出部102では、複数のコンテンツを含む所定のフォーマットのファイルを解析して、複数のコンテンツおよびそれら複数のコンテンツの関係を示す関係情報を取得する。本実施形態において、所定のフォーマットのファイルとは、例えばHEIF(High Efficiency Image File Format)ファイルである。また、関係情報とは、静止画とサムネイル画像の関係、派生画像とそれを構成する画像の関係などがあげられる。ファイル解析部101はHEIFファイルを取得し、その構造を解析する。符号化データ抽出部102は、HEIFファイルの解析結果を基にHEIFファイルに格納されたコンテンツの符号化データを抽出する。セグメント生成部103は、符号化データ抽出部102が抽出した符号化データを、必要に応じて通信に適した時間長やビットレートに変換し、符号化データを格納したセグメントを生成する。符号化データ変換部104は、抽出された符号化データを必要に応じて異なる符号化形式に変換する。尚、セグメント生成部103は、符号化データ変換部104により生成された符号化データを格納したセグメントを生成する機能も有する。
 配信データ格納部105は、以上のようにして取得された複数のコンテンツを、外部装置(本実施形態の例では受信装置200)が個別に取得することができるように格納する。より具体的には、配信データ格納部105は、セグメント生成部103および符号化データ変換部104で生成されたデータを格納する。プレイリスト生成部106は、配信データ格納部105から複数のコンテンツを個別に取得するための取得情報(本実施形態ではURL(Uniform Resource Locator))と、上述した関係情報とを記述したプレイリストを生成する。より具体的には、プレイリスト生成部106は、HEIFファイルの解析結果を基に配信データ格納部105に格納されたデータへのアクセスを可能とするURLを記述したプレイリストを生成する。関係情報の詳細については後述する。通信部107は外部装置である受信装置200からの要求に応じて、生成されたプレイリスト、配信データなどを、ネットワーク150を介して受信装置200に送信する。
 以上のような各機能部は、一つ又は複数のCPUが一つ又は複数のメモリに格納された所定のプログラムを実行し、制御することにより実現され得る。なお、上記機能部の各々の一部或いはすべてが専用のハードウエアによって実現されてもよい。
 ここで、図19のブロック図を参照して、実施形態による送信装置100のハードウエア構成について説明する。送信装置100は、CPU121、ROM122、RAM123、補助記憶装置124、表示部125、操作部126、通信I/F127、及びバス128を有する。
 CPU121は、ROM122やRAM123に格納されているコンピュータプログラムやデータを用いて送信装置100の全体を制御することで、図2に示す送信装置100の各機能を実現する。なお、送信装置100がCPU121とは異なる1又は複数の専用のハードウエアを有し、CPU121による処理の少なくとも一部を専用のハードウエアが実行してもよい。専用のハードウエアの例としては、ASIC(特定用途向け集積回路)、FPGA(フィールドプログラマブルゲートアレイ)、およびDSP(デジタルシグナルプロセッサ)などがある。ROM122は、変更を必要としないプログラムなどを格納する。RAM123は、補助記憶装置124から供給されるプログラムやデータ、及び通信I/F127を介して外部から供給されるデータなどを一時記憶する。補助記憶装置124は、例えばハードディスクドライブ等で構成され、画像データや音声データなどの、受信装置200への送信対象となる種々のデータ(ファイル)を記憶する。
 表示部125は、例えば液晶ディスプレイやLED等で構成され、ユーザが送信装置100を操作するためのGUI(Graphical User Interface)などを表示する。操作部126は、例えばキーボードやマウス、ジョイスティック、タッチパネル等で構成され、ユーザによる操作を受けて各種の指示をCPU121に入力する。CPU121は、表示部125を制御する表示制御部、及び操作部126を制御する操作制御部として動作する。
 通信I/F127は、送信装置100と外部の装置(例えば受信装置200)との通信に用いられる。本実施形態では、通信I/F127はネットワーク150と接続するインターフェイスである。送信装置100がネットワーク150と有線で接続される場合には、通信用のケーブルが通信I/F127に接続される。送信装置100がネットワーク150と無線で接続される場合には、通信I/F127はアンテナを備える。バス128は、送信装置100の各部をつないで情報を伝達する。
 なお、本実施形態では補助記憶装置124、表示部125、操作部126が送信装置100の内部に存在するものとするが、これらの少なくとも一つが送信装置100の外部に別の装置として存在していてもよいし、省略されてもよい。
 次に、本実施形態における送信装置100においてHEIFファイルを解析する処理の流れについて図3を用いて説明する。図3は、ファイル解析部101によるHEIFファイルの解析処理の一例を示すフローチャートである。
 まず、ステップS301において、ファイル解析部101は、配信対象となるHEIFファイルを取得する。次に、ステップS302において、ファイル解析部101は、HEIFファイルのmetaヘッダ内にハンドラタイプpictが存在するかを確認する。pictハンドラが存在しないと判定された場合(ステップS302でNO)は、ファイル解析部101は、これ以上の解析を行わずに本処理を終了する。一方、pictハンドラが存在すると判定された場合(ステップS302でYES)、ステップS303において、ファイル解析部101は、HEIFファイルに格納されているアイテムの数と種類を取得する。尚、HEIFファイルでは、格納されている画像、画像に関連するメタデータなどのコンテンツをアイテムと呼ぶ。
 次に、ステップS304において、ファイル解析部101は、アイテム間の参照情報を取得する。例えば、HEIFファイルには、静止画とそのサムネイル画像の関係を示す参照情報が格納されている。また、HEIFファイルは、複数の画像を組み合わせて1つの画像を生成するための画像を格納することができる。複数の画像を組み合わせて生成される1つの画像を派生画像と呼ぶ。HEIFにおいて、派生画像がアイテムとして含まれている場合は、派生画像とその派生画像を構成する複数の画像との関係を示す参照情報がHEIFファイルに格納されている。また、派生画像を生成するためには、複数の画像を配置するための位置の情報が必要となる。そこで、ファイル解析部101は、HEIFファイルのアイテムに派生画像が含まれている場合(S305でYES)には、ステップS306において、派生画像を生成する為の座標情報を取得する。なお、HEIFファイルのアイテムに派生画像が含まれていない場合(S305でNO)は、ステップS306はスキップされる。派生画像の扱いについては、第2実施形態により詳述する。
 ステップS307において、ファイル解析部101は、HEIFファイルからアイテムの代替情報を取得する。代替情報が設定されている具体的なケースとしては、例えば派生画像を表示する事が出来ない場合に、代わりに表示する画像を指定するケースがある。代替画像に関しては、第2実施形態でより詳しく述べる。次にステップS308において、ファイル解析部101は、各アイテムに紐づくプロパティを特定する。プロパティの具体例としては、アイテムの符号化情報、矩形サイズ情報などがあげられる。そこで次のステップS309において、ファイル解析部101は、特定したプロパティから符号化情報と画像の矩形サイズ情報を取得する。次に、ステップS310において、ファイル解析部101は、HEIFファイル内におけるアイテムの位置とサイズ情報を取得する。
 符号化データ抽出部102は、以上のようにしてファイル解析部101が取得したアイテムの位置とサイズ情報を基に、HEIFファイルからアイテムを抽出する。符号化データ変換部104は、抽出された符号化データを必要に応じて異なる符号化形式に変換する。例えば、符号化データ変換部104は、データの変換前の符号化形式がHEVCであった場合に、必要応じてこれをJPEGに変換する。取得情報は、異なる符号化形式に変換したものを取得可能なURLを含み得る。セグメント生成部103は、符号化データ抽出部102により抽出された符号化データおよび符号化データ変換部104により変換された符号化データからセグメントを生成し、配信データ格納部105に格納する。プレイリスト生成部106は、ファイル解析部101が取得した参照情報、符号化情報、画像サイズ情報などを用いて、受信装置200が配信データ格納部105に格納されたセグメントにアクセスするためのプレイリストを生成する。
 次に、第1実施形態における送信装置100において生成されるプレイリストの例について、図4~図9を用いて説明する。図4は、本発明の一実施形態である送信装置において生成するプレイリストの一例であり、複数の画像が格納されたHEIFファイルを配信可能とする記述例である。図4のプレイリストは、取得情報として4つの静止画と4つのサムネイル画像のURLを含み、関係情報として静止画とサムネイル画像の対応を示す情報を含む。
 図4に示すプレイリストは、MPEG-DASHにおける配信に用いられるMPD(Media Presentation Description)の一部を示している。図4において、プレイリストは4つの画像と各々の画像のサムネイル画像が取得可能である事を示している。図4では、画像を各々Representationとして記述し、各々のSubRepresentationとしてサムネイル画像を記述している。サムネイル画像に関しては、タイプ属性401に示す様に、サムネイル画像である事を示すタイプ"thmb"が記述されている。なお、画像については、タイプ属性として"image"が記述されている。画像とサムネイル画像の関係は、RepresentationとSubRepresentationの関係により表される。
 また、図4においてマイムタイプ402(mimeType)は、Representation以下の4つの画像およびサムネイル画像のマイムタイプを示している。図4の例では、マイムタイプ402は、HEVCで符号化された画像を格納したHEIFファイルである事を示している(image/heic)。つまり、送信装置100は、配信するHEIFファイルに複数の画像が格納されていた場合、改めて各々の画像を1つだけ格納するHEIFファイルを生成する。このHEIFファイルへの再カプセル化は、セグメント生成部103で行われ、生成されたHEIFファイルは配信データ格納部105に格納される。
 また、図4においてRepresentationの属性としてプライマリ属性403~406を記述している。プライマリ属性は、複数のアイテム(画像)間の優先度を示す情報であり、関係情報の一例である。HEIFファイルでは、複数の画像が格納されている場合に、優先的に表示や印刷を行うアイテムを指定する事が出来る。図4の例ではプライマリ属性403の値を"1"、その他のプライマリ属性404、405、406の値を"0"とする事で、プライマリ属性の値"1"を設定された画像がプライマリ画像である事を示している。
 尚、HEIFファイルではプライマリアイテムを示す情報として、アイテムの識別子を1つ指定する為、MPDで表現するには、上記の様にどれか1つのプライマリ属性の値を"1"とすれば実現可能である。なお、"0"か"1"の2レベルではなく、例えば"0"を最高優先度として、"1"、"2"と値が大きくなるに従い優先度を下げる様にすれば、容易に3つ以上のレベルの優先度を表現する事ができる。
 次に、プレイリストの他の例について図5を用いて説明する。図4の例では、送信装置100が、入力されたHEIFファイルに格納されていた複数の画像のそれぞれを、画像を1つだけ格納したHEIFファイルとして再カプセル化するケースを説明した。これに対して、図5は、再カプセル化をしないケースを示している。再カプセル化しない場合、複数のコンテンツ(本例では、複数の画像)のそれぞれについて、コンテンツを符号化して得られる符号化データと、その符号化データの復号に必要な復号情報とが別々に格納される。これらを取得するための取得情報は、符号化データを配信データ格納部105から取得するための情報と、復号情報を配信データ格納部105から取得するための情報と、を含む。図5は、第1実施形態の送信装置100において生成されるプレイリストの一例であり、特に複数の画像が格納されたHEIFファイルを配信可能とするもう1つの記述例である。
 図5において、初期化情報501はHEVCで符号化された1つ目の画像を復号する為に必要な復号情報の一例であり、画像データ502は1つ目の画像のHEVC符号化データを示す。つまり、入力されたHEIFファイルから抽出した初期化情報と符号化情報をカプセル化することなくそのまま取得可能としている。同様に、初期化情報503と画像データ504は、1つ目の画像のサムネイル画像の初期化情報と符号化情報である。
 なお、図5のマイムタイプ505は"image/H265"と記述されている。画像のサブタイプとして"H265"はIANA(Internet Assigned Number Authority)で承認されていない。しかし、図5の様に再カプセル化が不要であれば、入力されたHEIFファイルから抽出したデータをそのまま利用する事が出来る為、送信装置100での処理を簡略化する事ができる。つまり、図5の記述例では、セグメント生成部103において、抽出した画像アイテムを改めてHEIFファイルとしてカプセル化しなくても良い。
 以上、図4、図5では、サムネイル画像を、画像のRepresentation内におけるSubRepresentationとして記述することで、画像とサムネイル画像の関係を表した。すなわち、RepresentationとSubRepresentationの関係が、画像間の関係情報に相当する例である。次に、サムネイル画像をRepresentationとして記述するケースについて図6を用いて説明する。図6は、第1実施形態の送信装置100において生成されるプレイリストの一例であり、特に複数の画像が格納されたHEIFファイルを配信可能とするプレイリストの記述例である。
 図6において、Representationのタイプ属性601はサムネイルである事を示す。Representationの参照識別子602に当該サムネイルの基画像のRepresentationの識別子603の値である"0"を記述する事で、このサムネイルはRepresentationの識別子が"0"の画像のサムネイルである事を示すことが出来る。すなわち、参照識別子602は、画像間の関係を表す関係情報の例である。図6では、同様に4つの画像の各々についてサムネイル画像をRepresentationとして記述している。
 また、複数の画像と各々のサムネイル画像の組合せについてのプレイリストの記述例について、図7を用いて説明する。図7は、第1実施形態の送信装置100において生成されるプレイリストの一例であり、特に複数の画像が格納されたHEIFファイルを配信可能とするプレイリストの記述例である。
 図7において、サムネイル画像は、基となる画像とは異なるRepresentationのSubRepresentationとして記述されている。SubRepresentationのタイプ属性701(type=thmb)でサムネイル画像である事を示し、参照識別子702で基となる画像のRepresentationの識別子703の値を記述している。
 第1実施形態において、ここまでに説明したMPDの記述例は、何れも複数の画像と各々のサムネイル画像を記述したものであるが、同じ属性値をまとめて記述する事で記述量を削減するケースについて、図8を用いて説明する。プレイリストの記述量の削減は、プレイリストの送受信に要する時間を削減する。図8は、第1実施形態による送信装置100において生成されるプレイリストの一例であり、特に複数の画像と各々のサムネイル画像が格納されたHEIFファイルを配信可能とする際に、MPDの記述量を削減することができる記述例である。
 図8において、同じ属性情報を持つ4つの画像が1つのRepresentationの異なるセグメントとして記述される。同様に、同じ属性情報を持つ4つのサムネイル画像も1つのRepresentationの異なるセグメントとして記述される。サムネイル画像を記述したRepresentationでは、タイプ属性801でサムネイル画像である事が示されている。また、サムネイル画像を示す各セグメントの参照識別子802により基となる画像の識別子803を記述する事で、サムネイル画像と元となる画像を紐付ける事ができる。更に図8の様にプライマリ属性804を、画像を表すセグメント毎に記述することで、プライマリアイテムも識別する事ができる。
 次に、画像以外のアイテムとして、EXIFなどのメタデータをMPDに記述するケースについて図9を用いて説明する。図9は、第1実施形態による送信装置100において生成されるプレイリストの一例であり、特にEXIFなどのメタデータをMPDに記述する場合のプレイリストの記述例である。
 図9において、MPDに記述するアイテムはXMP(Extensible Metadata Platform)とEXIFであり、マイムタイプ901はこれらメタデータのデータ形式がXMLである事を示している。図9の1つ目のRepresentationはタイプ属性902でXMPである事を示しており、参照識別子903はこのXMPが付随する画像の識別子を記述する。更にもう1つのRepresentationはタイプ属性904でEXIFである事を示しているが、図9の例では、EXIFの情報をXML形式に変換したものを取得可能である事を示しており、参照識別子905は、このEXIFが付随する画像の識別子を示す。
 以上のように、第1実施形態によれば、1つのHEIFファイルに格納された複数の画像から所望の画像を配信可能とすることが可能になる。
 <第2実施形態>
 第1実施形態では、複数の画像が格納されたHEIFファイルを配信可能とするプレイリストについて説明した。第2実施形態では、HEIFの派生画像、代替画像をMPDに記述するケースについて説明する。なお、第2実施形態による通信システムをおよびデータ処理装置としての送信装置100の構成、動作は第1実施形態(図1、図2、図3)と同様である。第2実施形態では、特に図3のステップS306で取得される派生画像に関する記述を例示する。
 図10Aは、派生画像の構成例を示す図である。また、図10Bは、第2実施形態による送信装置100において生成されるプレイリストの一例であり、特に複数の画像を組み合わせて1つの画像を生成する派生画像をMPDに記述する記述例である。
 図10Aに示されるように、本実施形態で例示される派生画像は、4つの画像(id=1~id=4の画像)を縦横に2つ並べて生成したグリッド画像である。派生画像と派生画像を構成する4つの画像は図10BのプレイリストにおいてRepresentationとして記述されている。派生画像のRepresentationにおいて、タイプ属性1001は派生画像を示すタイプである"dimg"が記述される。また、派生画像のRepresentationに含まれているSubRepresentationのタイプ属性1002に、派生画像の詳細タイプであるグリッド画像を示す"grid"が記述される。さらに、カウント属性1003に当該グリッド画像を構成する画像の数である"4"が記述される。
 更に、SubRepresentation以下のセグメントとして、派生画像(グリッド画像)を構成する4つのセグメント情報1004が記述される。セグメント情報1004の各セグメントは、参照識別子として構成画像(=セグメント)を含むRepresentationの識別子を記述することで、派生画像がどの画像によって構成されるのかを明示する。また、セグメント情報1004には、各セグメントの配置を示す情報として、セグメントを表示する位置を示す座標情報が記述されている。尚、図10Bでは座標情報として左上の座標を記述しているが、座標を示す情報はグリッド画像における各画像の表示位置を特定出来れば良いので、右下や中心の座標などでも良い。
 ところで、HEIFの派生画像にはグリッド以外にも種類があり、その中でもオーバーレイ画像はグリッド画像と同様の記述方法で表現する事ができる。派生画像としてオーバーレイ画像を生成、表示するには、派生画像を構成する画像の座標情報以外に、それらを重ねるための順番を示すレイヤー情報が必要となる。レイヤー情報は、例えば、セグメント情報1004に記述された各セグメントの属性情報の1つとして記述され得る。あるいは、セグメント情報1004に記述されるセグメントの順番がレイヤーの順序を示すものとしても良い。
 次に、図10Bで説明した派生画像の記述量を削減するプレイリストについて図11を用いて説明する。図11は、第2実施形態による送信装置100において生成されるプレイリストの他の例であり、特に複数の画像を組み合わせて1つの画像を生成する派生画像を配信可能とする際に、MPDの記述量を削減する記述例である。
 図11において、派生画像に関する記述は図10A,Bの例と同様である。すなわち、Representationのタイプ属性("dimg")で識別し、SubRepresentationのタイプ属性("grid")とカウント属性("4")で派生画像の詳細タイプと派生画像を構成するセグメントの数が示される。一方、派生画像を構成する構成画像については、第1実施形態で説明した図8のプレイリストと同様に、同じ属性情報を持つ構成画像を1つのRepresentationにまとめることで記述量を削減している。ところが、構成画像を1つのRepresentationにまとめると、派生画像のセグメント情報が参照するRepresentationの識別子が、構成画像間で同一になってしまう。そこで、本実施形態では、派生画像を構成するセグメントに記述される参照識別子1101は、構成画像をまとめたRepresentationの識別子1102と構成画像であるセグメントの補助識別子1103を組合せて記述する。図11では、2つの識別子をハイフンでつなげる形式で記述している。
 次に、図3のステップS307で、アイテムの代替情報が取得された場合について説明する。例えば、受信装置200の能力によっては、プレイリストに記載された派生画像を表示できない場合がある。その様な場合に、派生画像の代わりに表示する画像を記述したプレイリストについて図12を用いて説明する。図12は、第2実施形態による送信装置100において生成されるプレイリストの一例であり、表示する画像に優先度を設定する事で代替画像を示す記述例である。
 図12において、派生画像は4つの構成画像と1つのSEI(Supplemental Enhancement Information:アルファプレーン)から生成される。ここで、派生画像の表示を最優先とするが、受信装置200が派生画像を表示できない場合には、その派生画像を構成する画像のうちの1つが派生画像に替えて表示される代替画像として用いられる。この場合、派生画像のプライマリ属性を最高優先度とし、代替画像として用いる画像にはその次の優先度を設定する。プライマリ属性の値が"0"を最高優先度とし、数が大きくなる毎に優先度が低くなるものとする。図12では派生画像のプライマリ属性1201の値を"0"としている。また、次点として1つ目の構成画像のプライマリ属性1202の値を"1"として、更に次点として2つ目の構成画像のプライマリ属性1203の値と3つ目の構成画像のプライマリ属性1204の値を共に"2"としている。プライマリ属性の値が等しい場合は、どちらを選択しても良いものとする。
 次に、代替画像を示す方法として、優先度ではなく代替グループを設定するケースについて、図13を用いて説明する。図13は、第2実施形態による送信装置100において生成されるプレイリストの一例であり、画像に代替グループを設定する記述例である。図13では、HEIFファイルに含まれている複数のコンテンツは、相互に代替する画像のグループを代替グループとして含み、関係情報は、複数の画像のそれぞれがどの代替グループに属するかを表す。
 図13において、画像1~6は代替グループ属性1301~1306が記述されており、代替グループ属性の値が等しいものが代替可能なグループを表す。図13では、代替グループ属性1301~1303の値が"1"、代替グループ属性1304~1306の値が"2"と記述されている。よって、受信装置200は、画像1~3の中から1つ、同様に画像4~6の中から1つを選択して使用する事ができる。図13のプレイリストの例では、サイズの異なる複数の画像を含む2つの代替グループが記述されている。なお、図13では、サイズが異なる複数の画像が代替グループに属している例を示したがこれに限られるものではない。例えば、異なる符号化方法で符号化された複数の画像が代替グループに属してもよい。このようにすれば、受信装置200は、自身が対応している符号化データに対応して、柔軟に画像を選択することができる。
 次に、受信装置200において派生画像を表示できない場合を考慮して、生成済みの派生画像を用意するケースについて、図14を用いて説明する。図14は、第2実施形態による送信装置100において生成されるプレイリストの一例であり、予め送信装置100側で派生画像を生成することで派生画像を取得可能にする記述例である。
 図14のプレイリストにおいて、派生画像1401は、図10A、Bにおける派生画像の記述と同様に4つの構成画像から生成される。派生画像1402は、派生画像1401を1つの画像としてHEVCで再符号化したものである。また、派生画像1403は、派生画像1401を1つの画像としてJPEGで再符号化したものである。派生画像1402,1403は、符号化データ変換部104で生成される。また、3つの派生画像は同じ代替グループに設定されている(alt="1")。派生画像1402,1403は、派生画像1401の代替画像となり得る。従って、4つの構成画像から派生画像を生成する事ができない受信装置200は、1つの画像として生成済みの派生画像である派生画像1402(HEIF)か派生画像1403(JPEG)のどちらかを取得して利用することができる。
 以上、第2実施形態では、派生画像、代替画像に関する関係情報を例示した。なお、第2実施形態では、複数の静止画を組み合わせて1つの画像を表示する派生画像の記述方法を中心に説明してきたが、本実施形態で説明した方法を用いれば、静止画と動画を組み合わせた派生画像を記述する事も容易になし得る事は言うまでもない。
 <第3実施形態>
 次に、第3実施形態として、スライドショーの様に再生時間に応じて表示する画像を変更させるケースについて説明する。なお、第3実施形態による通信システムをおよび送信装置の構成、処理は第1実施形態(図1、図2、図3)と同様である。
 図15は、第3実施形態である送信装置において生成するプレイリストの一例であり、特に再生時刻の経過と共に取得可能な画像を変更する記述例である。図15では、10秒間のピリオド(duration="PTIM10.0S")が3つ存在し、各々のピリオドで異なる画像が取得可能となっている。したがって、受信装置200は各々のピリオドにおいて、異なる画像を取得して表示する事ができる。図15のプレイリストの例では、image1.heic→image2.heic→image3.heicの順に、各画像が10秒ずつ表示される。
 次に、図15を用いて説明した、再生時間に応じて表示する画像を変更するケースに対応したMPDの記述量を削減する方法について図16A,図16Bを用いて説明する。図16A,図16Bは、第3実施形態による送信装置100において生成されるプレイリストの一例であり、特に再生時刻の経過と共に表示すべき画像を変更する記述例である。
 配信可能な画像が複数のピリオドで共通な場合、同じ画像に関する情報(属性情報や取得用URLなど)をピリオド毎に記述するのは冗長である為、図16A,図16Bでは、ピリオド毎に異なる情報をまとめて記述する。図16Aにおいて、ピリオド情報1601には、ピリオド毎に異なる情報のみを記載するものとし、優先度要素1602としてピリオド毎に最優先となるRepresentationの識別子を記述する。尚、優先度要素の記述方法はこれに限られるものではない。例えば、図16Bに示されるピリオド情報1603に記述されている優先度要素1604の様に、ピリオド毎に優先度が高い(或いは低い)順にRepresentationの識別子が記述されても良い。ここで、図16Aまたは図16Bに示すMPDの例を受信した受信装置200は、各ピリオドにおいて、表示可能な画像の中で最も優先度が高い画像を表示する事が期待される。
 以上のように、第1~第3実施形態によれば、HEIFファイルをMPEG-DASHで配信することが出来るので、例えばHEIFファイルの中から所望の静止画のみを取得したり、所定の時間毎に取得可能な静止画を設定したりすること、などが可能となる。
 <第4実施形態>
 第4実施形態では、第1実施形態~第3実施形態で説明した送信装置100からプレイリストを受信し、受信したプレイリストを用いて送信装置100からコンテンツ(画像)を取得する受信装置200を説明する。
 図17は、受信装置200のハードウエア構成例を示すブロック図である。受信装置200において、通信部1701は、ネットワーク150と接続して送信装置100との通信を行う。一つ又は複数のメモリ1702は、一つ又は複数のCPU1703により実行される各種プログラムを格納する。また、メモリ1702は、CPU1703が各種処理を実行する際の作業メモリを提供する。メモリ1702は、ROM、RAM、ハードディスクなど、またはそれらの組み合わせである。CPU1703は、メモリ1702に格納されたプログラムを実行して、各種の制御を実行する。例えば、CPU1703は、送信装置100からプレイリストを受信してメモリ1702に保持し、プレイリストを用いて送信装置100から画像を取得し、ディスプレイ1704に画像を表示する。
 図18は、受信装置200が送信装置100からコンテンツ(画像)を取得する取得処理を説明するフローチャートである。ステップS1801において、CPU1703は、送信装置100にプレイリストを要求する。ステップS1802において、CPU1703は、送信装置100からプレイリストを受信する。受信したプレイリストは、メモリ1702に保持される。
 次に、CPU1703は、ステップS1803において、プレイリストの格納先が記載されたセグメントのうち、所望のセグメントを選択する。セグメントの選択は、例えば、受信装置200に対するユーザ操作に基づいてなされてよいし、実行中のアプリケーションからの指示に基づいてなされてもよい。次に、ステップS1804において、CPU1703は、ステップS1803で選択したセグメントのデータを送信装置100から取得する。すなわち、CPU1703は、ステップS1803で選択されたセグメントのデータを送信装置100に対して通信部1701を介して要求し、通信部1701を介して送信装置100からセグメントのデータ(例えば、静止画、サムネイル画像など)を受信する。なお、CPU1703は、プレイリスト中のセグメントに記述されたURLを用いて、送信装置100からセグメントを取得することができる。ステップS1805において、CPU1703は、ステップS1804で取得したデータを再生する。例えば、CPU1703は、受信した静止画をディスプレイ1704に表示する。
 以上のような受信装置200によれば、例えば、以下のような処理が実現される。CPU1703は、図4のプレイリストを受信した場合に、複数のサムネイル画像のセグメントを要求することにより複数のサムネイル画像を送信装置100から取得してディスプレイ1704に表示する。その後、例えばユーザによるサムネイル画像の選択操作に応じて、CPU1703は選択されたサムネイル画像に対応する静止画のセグメントを送信装置100に要求し、そのセグメントデータである静止画を取得してディスプレイ1704に表示する。
 また、CPU1703は、最高優先度の画像を表示する設定の下で図10Bのプレイリスト受信した場合に、最高優先度の画像は派生画像(グリッド画像)である。したがって、CPU1703は、派生画像の記述に従って、必要な画像のセグメントを要求することにより4枚の画像を受信し、グリッド画像を生成し、ディスプレイ1704に表示する。また、第3実施形態の図15、図16A、図16Bに示したプレイリストを用いれば、受信装置200は、HEIFファイルに含まれている複数のファイルを順次に、スライドショーのように表示させることができる。
 以上のように、第1実施形態~第3実施形態のプレイリストを受信した受信装置は、複数のアイテムを含むHEIFファイルの全体を受信することなく、そのHEIFファイルに含まれている複数のアイテムの中の必要なアイテムを選択的に受信することができる。
 <その他の実施形態>
 以上、実施形態例を詳述したが、本発明は例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インターフェイス機器、撮像装置、webアプリケーション等)から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
 本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
 本発明は上記実施の形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために以下の請求項を添付する。
 本願は、2019年11月22日提出の日本国特許出願特願2019-211706を基礎として優先権を主張するものであり、その記載内容の全てを、ここに援用する。

Claims (20)

  1.  複数のコンテンツを含む所定のフォーマットのファイルを解析して前記複数のコンテンツおよび前記複数のコンテンツの関係を示す関係情報を取得する取得手段と、
     前記取得手段により取得された前記複数のコンテンツを格納する格納手段と、
     前記格納手段から前記複数のコンテンツを個別に取得するための取得情報と、前記関係情報とを記述したプレイリストを生成する生成手段と、
     前記プレイリストを外部装置に送信し、前記外部装置が前記プレイリストに含まれる前記取得情報を用いて要求したコンテンツを前記外部装置に送信する通信手段と、を備えることを特徴とするデータ処理装置。
  2.  前記格納手段は、前記複数のコンテンツのそれぞれを、符号化データと前記符号化データの復号に必要な復号情報とを有する1つのファイルとして格納し、
     前記取得情報は、前記格納手段から前記1つのファイルを取得するための情報であることを特徴とする請求項1に記載のデータ処理装置。
  3.  前記格納手段は、前記複数のコンテンツのそれぞれについて、コンテンツを符号化して得られる符号化データと前記符号化データの復号に必要な復号情報を別々に格納し、
     前記取得情報は、前記符号化データを取得するための情報を前記格納手段から取得するための情報と、前記復号情報を前記格納手段から取得するための情報と、を含むことを特徴とする請求項1または2に記載のデータ処理装置。
  4.  前記複数のコンテンツは、静止画と前記静止画に対応するサムネイル画像とを含み、
     前記関係情報は、前記静止画と前記サムネイル画像の対応を示す情報を含む、ことを特徴とする請求項1乃至3のいずれか1項に記載のデータ処理装置。
  5.  前記複数のコンテンツは複数の静止画を含み、
     前記関係情報は、前記複数の静止画の優先度を表す情報を含む、ことを特徴とする請求項1乃至4のいずれか1項に記載のデータ処理装置。
  6.  前記複数のコンテンツは、画像と、前記画像に関連するメタデータとを含み、
     前記関係情報は、前記画像と前記メタデータとの対応を示す情報を含む、ことを特徴とする請求項1乃至5のいずれか1項に記載のデータ処理装置。
  7.  前記複数のコンテンツは複数の画像を含み、
     前記関係情報は、前記複数の画像から派生する派生画像を表す、ことを特徴とする請求項1乃至6のいずれか1項に記載のデータ処理装置。
  8.  前記派生画像は、前記複数の画像を並べて表示するグリッド画像であることを特徴とする請求項7に記載のデータ処理装置。
  9.  前記派生画像は、前記複数の画像を重ね合わせて表示するオーバーレイ画像であることを特徴とする請求項7に記載のデータ処理装置。
  10.  前記複数のコンテンツは、前記派生画像の生成に用いられる前記複数の画像の少なくとも1つに関連するアルファプレーンを含むことを特徴とする請求項7乃至9のいずれか1項に記載のデータ処理装置。
  11.  前記関係情報は、前記派生画像と前記複数の画像について優先度を指定する情報を含むことを特徴とする請求項7乃至10のいずれか1項に記載のデータ処理装置。
  12.  前記派生画像を1つの画像として生成する生成手段をさらに備え、
     前記格納手段は、前記生成手段により生成された画像を前記外部装置から取得できるように格納し、
     前記取得情報は、前記生成手段により生成された画像を取得するための情報を含み、
     前記関係情報は、前記生成手段により生成された画像が前記派生画像の代替画像であることを示すことを特徴とする請求項7乃至11のいずれか1項に記載のデータ処理装置。
  13.  前記複数のコンテンツは複数の画像を含み、
     前記関係情報は、前記複数の画像のそれぞれが属する代替グループを表すことを特徴とする請求項1乃至6のいずれか1項に記載のデータ処理装置。
  14.  前記複数のコンテンツは、複数の画像を含み、
     前記関係情報は、前記複数の画像の各々の取得可能な時間を示すことを特徴とする請求項1に記載のデータ処理装置。
  15.  前記関係情報は、取得可能な時間のそれぞれにおいて取得可能な複数の画像が存在することと、それぞれの時間における画像の優先度とを示すことを特徴とする請求項14に記載のデータ処理装置。
  16.  前記所定のフォーマットはHEIF(High Efficiency Image File Format)であることを特徴とする請求項1乃至15のいずれか1項に記載のデータ処理装置。
  17.  請求項1乃至16のいずれか1項に記載されたデータ処理装置の前記通信手段により送信された前記プレイリストを受信する受信手段と、
     前記プレイリストに記述された前記取得情報と前記関係情報とを用いて、必要なコンテンツの送信を前記データ処理装置に要求する要求手段と、
     前記要求手段の要求に応じて前記データ処理装置から送信されるコンテンツを受信し、処理する処理手段と、を備えることを特徴とするデータ処理装置。
  18.  複数のコンテンツを含む所定のフォーマットのファイルを解析して前記複数のコンテンツおよび前記複数のコンテンツの関係を示す関係情報を取得する取得工程と、
     前記取得工程により取得された前記複数のコンテンツを格納手段に格納する格納工程と、
     前記格納手段から前記複数のコンテンツを個別に取得するための取得情報と、前記関係情報とを記述したプレイリストを生成する生成工程と、
     前記プレイリストを外部装置に送信し、前記外部装置が前記プレイリストに含まれる前記取得情報を用いて要求したコンテンツを前記外部装置に送信する通信工程と、を備えることを特徴とするデータ処理装置の制御方法。
  19.  請求項18に記載されたデータ処理装置の制御方法の実行により送信された前記プレイリストを受信する受信工程と、
     前記プレイリストに記述された前記取得情報と前記関係情報とを用いて、必要なコンテンツの送信を前記データ処理装置に要求する要求工程と、
     前記要求工程の要求に応じて前記データ処理装置から送信されるコンテンツを受信し、処理する処理工程と、を備えることを特徴とするデータ処理装置の制御方法。
  20.  コンピュータを、請求項1乃至17のいずれか1項に記載のデータ処理装置の各手段として機能させるためのプログラム。
PCT/JP2020/041753 2019-11-22 2020-11-09 データ処理装置およびその制御方法、プログラム WO2021100524A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP20890470.6A EP4064061A4 (en) 2019-11-22 2020-11-09 DATA PROCESSING DEVICE, CONTROL METHOD THEREOF AND PROGRAM
CN202080081055.3A CN114731463A (zh) 2019-11-22 2020-11-09 数据处理设备及其控制方法和程序
US17/747,756 US20220279030A1 (en) 2019-11-22 2022-05-18 Data processing apparatus, data receiving apparatus and methods of controlling them, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019211706A JP7442302B2 (ja) 2019-11-22 2019-11-22 データ処理装置およびその制御方法、プログラム
JP2019-211706 2019-11-22

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/747,756 Continuation US20220279030A1 (en) 2019-11-22 2022-05-18 Data processing apparatus, data receiving apparatus and methods of controlling them, and storage medium

Publications (1)

Publication Number Publication Date
WO2021100524A1 true WO2021100524A1 (ja) 2021-05-27

Family

ID=75966360

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/041753 WO2021100524A1 (ja) 2019-11-22 2020-11-09 データ処理装置およびその制御方法、プログラム

Country Status (5)

Country Link
US (1) US20220279030A1 (ja)
EP (1) EP4064061A4 (ja)
JP (1) JP7442302B2 (ja)
CN (1) CN114731463A (ja)
WO (1) WO2021100524A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113422955B (zh) * 2021-06-16 2023-04-21 三星电子(中国)研发中心 Heif图像编码方法和解码方法以及编码装置和解码装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016009925A (ja) 2014-06-23 2016-01-18 キヤノン株式会社 データ処理装置、データ処理方法、及びプログラム
US20190052937A1 (en) * 2016-02-16 2019-02-14 Nokia Technologies Oy Media encapsulating and decapsulating
WO2019121963A1 (en) * 2017-12-22 2019-06-27 Canon Kabushiki Kaisha Prioritized transmission of predetermined portions of encapsulated media content
JP2019211706A (ja) 2018-06-07 2019-12-12 浩 田嶋 コード構成音学習機

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1935183A4 (en) * 2005-10-11 2010-04-14 Samsung Electronics Co Ltd METHOD AND DEVICE FOR CODING MULTIMEDIA CONTENT AND METHOD AND SYSTEM FOR USING CODED MULTIMEDIA CONTENT
KR100775898B1 (ko) * 2006-06-22 2007-11-13 삼성전자주식회사 이동통신단말의 콘텐츠 파일 플레이 리스트 설정방법
GB2538997A (en) * 2015-06-03 2016-12-07 Nokia Technologies Oy A method, an apparatus, a computer program for video coding
GB2539461B (en) * 2015-06-16 2020-01-08 Canon Kk Image data encapsulation
JP6624958B2 (ja) * 2016-02-03 2019-12-25 キヤノン株式会社 通信装置、通信システム、通信制御方法およびコンピュータプログラム
JP6669403B2 (ja) * 2016-06-03 2020-03-18 キヤノン株式会社 通信装置、通信制御方法および通信システム
US10560726B2 (en) * 2017-07-26 2020-02-11 CodeShop BV System and method for delivery and caching of personalized media streaming content
JP7100493B2 (ja) * 2018-05-16 2022-07-13 キヤノン株式会社 表示制御装置及びその制御方法及びプログラム
CN110248116B (zh) * 2019-06-10 2021-10-26 腾讯科技(深圳)有限公司 图片处理方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016009925A (ja) 2014-06-23 2016-01-18 キヤノン株式会社 データ処理装置、データ処理方法、及びプログラム
US20190052937A1 (en) * 2016-02-16 2019-02-14 Nokia Technologies Oy Media encapsulating and decapsulating
WO2019121963A1 (en) * 2017-12-22 2019-06-27 Canon Kabushiki Kaisha Prioritized transmission of predetermined portions of encapsulated media content
JP2019211706A (ja) 2018-06-07 2019-12-12 浩 田嶋 コード構成音学習機

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP4064061A4

Also Published As

Publication number Publication date
EP4064061A4 (en) 2023-11-15
CN114731463A (zh) 2022-07-08
JP7442302B2 (ja) 2024-03-04
EP4064061A1 (en) 2022-09-28
JP2021083057A (ja) 2021-05-27
US20220279030A1 (en) 2022-09-01

Similar Documents

Publication Publication Date Title
US11537562B2 (en) Auxiliary manifest file to provide timed metadata
KR102027410B1 (ko) 계층화된 신호 품질 계층에서의 재구성 데이터의 송신
US11350184B2 (en) Providing advanced playback and control functionality to video client
US9894391B2 (en) Distribution management apparatus, distribution method, and program
CN113330751B (zh) 用于媒体片段大小和优先级排名的存储和信令的方法和装置
JP2017139628A (ja) 通信装置、通信システム、通信制御方法およびコンピュータプログラム
WO2015198725A1 (ja) 通信装置、通信方法、及びプログラム
US9596435B2 (en) Distribution control apparatus, distribution control method, and computer program product
US20180109585A1 (en) Information processing apparatus and information processing method
JP2022049708A (ja) 生成装置、3次元データ送信装置、及び3次元データ再生装置
US8151310B2 (en) Video delivery of oilfield data
WO2021100524A1 (ja) データ処理装置およびその制御方法、プログラム
KR101944601B1 (ko) 기간들에 걸쳐 오브젝트들을 식별하기 위한 방법 및 이에 대응하는 디바이스
WO2019187437A1 (ja) 情報処理装置、情報処理方法、及びプログラム
WO2021065605A1 (ja) 情報処理装置および情報処理方法
JP7314929B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP6063952B2 (ja) マルチメディア資産を表示する方法、関連するシステム、メディアクライアント、および関連するメディアサーバ
JP2009049528A (ja) 画像配信システム、画像配信方法、及びコンピュータプログラム
JP6489413B2 (ja) 管理装置及び画像処理システム
US20230156257A1 (en) Information processing apparatus, information processing method, and storage medium
WO2021140956A1 (ja) 情報処理装置および方法
JP2017212644A (ja) 通信装置、システム、情報処理方法及びプログラム
JP2023056348A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2015080164A (ja) コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム
JP2015080163A (ja) コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20890470

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020890470

Country of ref document: EP

Effective date: 20220622