WO2019131200A1 - Decoder, decoding method, and program - Google Patents

Decoder, decoding method, and program Download PDF

Info

Publication number
WO2019131200A1
WO2019131200A1 PCT/JP2018/046020 JP2018046020W WO2019131200A1 WO 2019131200 A1 WO2019131200 A1 WO 2019131200A1 JP 2018046020 W JP2018046020 W JP 2018046020W WO 2019131200 A1 WO2019131200 A1 WO 2019131200A1
Authority
WO
WIPO (PCT)
Prior art keywords
web resource
web
media segment
metabox
segment
Prior art date
Application number
PCT/JP2018/046020
Other languages
French (fr)
Japanese (ja)
Inventor
五十嵐 卓也
高林 和彦
山岸 靖明
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Publication of WO2019131200A1 publication Critical patent/WO2019131200A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments

Definitions

  • the present disclosure relates to a decrypting device, a decrypting method, and a program, and more particularly, to a decrypting device and a decrypting method capable of improving convenience when streaming distribution content using MPEG-DASH, MPEG-CMAF or the like. , And the program.
  • MPEG-DASH Moving Picture Experts Group-Dynamic Adaptive Streaming over HTTP
  • MPEG-CMAF Moving Picture Experts Group-Common Media Application Format for Segmented Media
  • a metabox of ISO Base Media File Format (ISOBMFF) is used to configure a Web application such as HTML5 (HyperText Markup Language 5) or JavaScript (registered trademark).
  • ISOBMFF's MetaBox is disclosed in Non-Patent Document 1
  • MPEG-CMAF is formulated in Non-Patent Document 2.
  • Part 12 ISO base media file format (ISO / IEC 14496-12: 2015) Information technology-Multimedia application forma .
  • Part 19 Common media application format for segmented media (ISO / IEC 23000-19: 2018)
  • the present disclosure has been made in view of such a situation, and is intended to improve convenience when streaming distribution content using MPEG-DASH, MPEG-CMAF, or the like.
  • the decryption apparatus refers to the Item Information Entry stored in the MetaBox of the initialization segment in which the Web Resource of the delivery content is distributed and disposed in a plurality of media segments and used in the delivery content. And an access unit for accessing the Web Resource stored in the identified media segment to be accessed.
  • the decryption device is configured such that the Web Resource of the delivery content is distributed and disposed in a plurality of media segments, and Item Information stored in MetaBox of the initialization segment used in the delivery content Referencing the Entry, and accessing the Web Resource stored in the identified media segment to be accessed.
  • the program according to one aspect of the present disclosure is an item in which the Web Resource of the distribution content is distributed to a plurality of media segments and arranged in the computer of the decryption apparatus, and stored in the MetaBox of the initialization segment used in the distribution content.
  • Information decryption is performed by referring to Information Entry and accessing the Web Resource stored in the identified media segment to be accessed.
  • the Web Resource of the distribution content is distributed and disposed in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to and accessed.
  • the Web Resource stored in the specified media segment to be targeted is accessed.
  • FIG. 6 is a diagram showing an example of a web application that changes the display in accordance with the playback time of A / V content. It is a figure which shows the example of a display of "index. html.” It is a figure explaining an ISOBMFF file. It is a figure which shows the structure of the media segment file which is PT0S. It is a figure which shows the structure of the media segment file which is PT60S. It is a figure explaining an initialization segment.
  • FIG. 1 is a block diagram illustrating a configuration example of an embodiment of a delivery system to which the present technology is applied.
  • FIG. 16 is a first flowchart illustrating a process of randomly accessing Web Resource.
  • FIG. It is a flowchart explaining an Extent read-in process.
  • It is a 2nd flow chart explaining processing to access Web Resource at random.
  • It is the 3rd flowchart which explains the processing which randomizes to Web Resource.
  • Fig. 21 is a block diagram illustrating a configuration example of an embodiment of a computer to which the present technology is applied.
  • FIG. 1 shows an example of the configuration of an ISOBMFF file and a client terminal.
  • FIG. 1 shows an example of an ISOBMFF file in which two Web Resources of “index.htm” and “image1.jpg” and “image2.jpg” are recorded in MetaBox.
  • DataReferenceEntryURL instead of LocationInformationBox ('iloc') in MetaBox of the ISOBMFF file, it is also possible to reference Web Resource placed on a server of the Internet from Item Information Entry ('infe').
  • an ISOBMFF file containing both A / V content and a web application is distributed via, for example, the Internet, storage media, and the like.
  • the client terminal 11 is configured to include a web engine 12, an A / V player 13, an image superimposing unit 14, an audio mixing unit 15, a display 16, and a speaker 17.
  • the client terminal 11 is configured by mounting the web engine 12 and the A / V player 13 on a smartphone, a television receiver, or the like.
  • the client terminal 11 After an image obtained by processing the ISOBMFF file by the web engine 12 and the A / V player 13 is supplied to the image superimposing unit 14, and the respective images are superimposed in the image superimposing unit 14, It is displayed on the display 16. Similarly, in the client terminal 11, the audio obtained by processing the ISOBMFF file by the web engine 12 and the A / V player 13 is supplied to the audio mixing unit 15, and the respective sounds are mixed by the audio mixing unit 15. After that, it is outputted from the speaker 17.
  • index. Html is recorded as a Primary Resource indicated by a Primary Item Box ('pitm), and an entry of a Web application started at the start of A / V content playback. Indicates that it is Page.
  • ISOBMFF files obtained by fragmenting ISOBMFF files are often used as MPEG-DASH contents.
  • MPEG-DASH treats a group of fragments consisting of one or more MovieFragmentBox (moof) and MediaDataBox (mdat) pairs (pairs) as a media segment, and encodes a media segment encoded at multiple bit rates described by MPD. By preparing it, bandwidth adaptive streaming is realized.
  • FIG. 2 shows an example in which Web Resources recorded in MovieFragmentBox (moof) of each media segment are distributed and arranged.
  • “index.html” and “image1.jpg” are delivered when the first playback start time (0 second), which is the beginning of A / V content, is started, and the web engine 12 Display “and“ image1.jpg ”on the display 16. After that, the second playback start time (60 seconds) is reached, and “image2.jpg” is delivered at the timing when “image2.jpg” is used, and the web engine 12 replaces “image1.jpg” with “image2 “. jpg” is displayed on the display 16. Then, the web engine 12 hides “image2.jpg” at the timing when the third reproduction start time (90 seconds) is reached.
  • the ISOBMFF file is assumed to be used in such a web application.
  • FIG. 2 An example of the web application which changes a display according to the reproduction time of A / V content as shown in FIG. 2 is shown by FIG. 2, and FIG. 4 shows the web engine 12 of such a web application.
  • the example of display of "index. Html” by processing is shown. That is, as shown in FIG. 4, when “image1.jpg” is displayed from the reproduction time 0 on the display 16 when it is superimposed on file.mp4 processed by the A / V player 13 and the reproduction time is 60 seconds. It is changed from "image1.jpg” to "image2.jpg” and “image2.jpg” is displayed up to 90 seconds.
  • processing can be efficiently performed when performing streaming reproduction continuously from the first reproduction start time (0 second) which is the head of A / V content.
  • playback is performed from the second playback start time (for example, 60 seconds) other than the head of the A / V content or the third playback start time (for example, 90 seconds)
  • the second playback start time for example, 60 seconds
  • the third playback start time for example, 90 seconds
  • the Web Resource update date and expiration date were not known.
  • the client terminal 11 could not efficiently perform caching of Web Resources. In other words, there is a need for the client terminal 11 to use the cached Web Resource without receiving the Web Resource that has not been updated or expired. Therefore, it is required to be able to determine whether the Web Resource recorded in the ISOBMFF file is updated or expired.
  • the configuration example of the ISOBMFF file described below enables random access, achieves uniform bit rates, and does not waste bandwidth in carousel transmission.
  • the purpose is to realize quick start-up and enable determination of update and expiration of Web Resource recorded in the ISOBMFF file.
  • FIG. 5 shows an example of the configuration of an ISOBMFF file that enables random access.
  • the ISOBMFF file shown in FIG. 5 is distributed to each media segment of the ISOBMFF file used for the MPEG-DASH content, and Web Resources are arranged in “Just In Time Delivery”. Then, in the ISOBMFF file, the recording of the MetaBox is performed in the ItemLocatoinBox ('iloc') of the DataReferenceBox ('dref') corresponding thereto.
  • a URL (Uniform Resource Locator) in the DataReferenceBox ('dref') of MetaBox directly refers to the Web Resource of each media segment, or an Item in the media segment at the file level as follows: Indirect reference is performed using Information Entry.
  • the ISOBMFF file is configured such that the Web Resource of each media segment can be accessed from the Item Information Entry of the file level MetaBox.
  • the DataReferenceBox is used to directly refer to the Web Resource of each media segment in the URL, or an indirect reference using the MetaBox of the moof of each media segment is used. To be done.
  • a method of recording Web Resource in a media segment will be described by taking MPEG-DASH content in which the media segment includes moof and mdat as an example.
  • FIG. 6 shows the structure of a media segment file whose Earliest Presentation Time is PT0S when the ISOBMFF file is divided into a plurality of media segment files, that is, the structure of the media segment file at the beginning of the A / V content. It is done.
  • a MetaBox is arranged in moof, and the MetaBox records a Handler Box (hdlr), a Primary Item Box (pitm), an Information Location Box (iloc), and an Item Information Box (iinf) in addition to an Audio track.
  • hdlr Handler Box
  • pitm Primary Item Box
  • iloc Information Location Box
  • iinf Item Information Box
  • data_reference_index 0 it is indicated that the Extent of this Item is recorded in the same file.
  • the base-data-offset-present of moof Track Fragment Header Boxes 0
  • set default-base_is_moof 1
  • set moof and It is offset by the relative position within the segment consisting of mdat pairs.
  • the byte offset B0 from the beginning of the media segment file to index.html actually recorded in mdat is specified in the extent_offset of the extent of index.html.
  • L0 which is a file size of index. Html is recorded in extent_length.
  • the byte offset B1 is specified in extent_offset of extent of image1.jpg
  • L1 which is the file size of image1.jpg is recorded in extent_length.
  • an Item to be loaded first in the HTML web application is specified.
  • the web engine 12 loads index.html first.
  • FIG. 7 shows the structure of the media segment file whose Earliest Presentation Time is PT60S, that is, the structure of the media segment to be played back after 60 seconds when playback is started from the beginning of the A / V content.
  • the Web Resource can be recorded in each media segment by MetaBox that can be realized by the ISOBMFF standard. Then, in the present embodiment, as described below, the MetaBox is recorded in the initialization segment (header). This enables random access to the web resource of the media segment.
  • the iBox of MetaBox arranged in moov and the item of Web Resource placed in each media segment are recorded in a total of three Item Information Box Entries, and item_name is index.html, image1.jpg , Image2.jpg.
  • item_name is index.html, image1.jpg , Image2.jpg.
  • the storage location of each Item is recorded in iloc, and other than 0 is specified in data reference, which arranges dinf (DataInformationBox) so that other files can be referred to indirectly by URL. Make it
  • This is a URL meaning that it refers indirectly to an Item called index.html in which Earliest Presentation Time of the media segment of the ISOBMFF file is in Track_1 of PT0S.
  • This is a URL that means that Earliest Presentation Time of the media segment of the ISOBMFF file directly refers to the segment file of PT0S.
  • a non-zero value is specified in extent_offset described in iloc of the Item of the corresponding Item of the MetaBox of the reference source initialization segment It will be
  • the web engine 12 will Random access to Web Resources included in the segment is possible.
  • the method of referring to the Web Resource recorded in MetaBox of the media segment shown in FIG. 8 by the URL is the playback time of the playback time such as Timed text tracks and Timed metadata track specified in ISO / IEC 14496-30. It is also available as a Web Resource (called "Timed Web Assets”) with timing information.
  • Extent of Image2.jpg is substantially equally divided into three partial extents (division data).
  • the file size of the first portion Extent is B2-1 bytes, and Earliest Presentation Time is stored in a media segment of 60 seconds.
  • the file size of the second portion Extent is B2-2 bytes, and is stored in a media segment whose Earliest Presentation Time is 61 seconds.
  • the file size of the third portion Extent is B2-3 bytes, and the Earliest Presentation Time is stored in the media segment of 62 seconds.
  • FIG. 12 shows an example of the MetaBox of the initialization segment in a configuration in which Extents of Web Resource are arranged in a plurality of media segments.
  • the web engine 12 of FIG. 1 obtains image2.jpg by acquiring extents of items including item2.name from item_name from three segments whose Earliest presentation times are 60S, 61S, and 62S. can do.
  • MPEG-DASH Live Profile is used, and each media segment will be transmitted as a separate file. Although it is possible to record the Web resource of the Web application in this media segment, random access can not be performed because of one-way transmission.
  • the unit of aggregation of index. Html, image1.jpg, image2.jpg is repeatedly transmitted.
  • the index. Html of the interactive Web application linked to the broadcast service. Can be launched.
  • the client terminal 11 waits until receiving the media segment including the index.html, which causes a delay in activation of the Web application.
  • Bundle Item Information Box extended Item Information Box is provided, and it is possible to explicitly indicate that items stored in the subsequent media segment are to be used collectively. Let's do it.
  • FIG. 14 shows the format of the Bundle Information Box.
  • the Bundle Information Box is placed in the MetaBox together with the Item Information Box. And when using this Item Information Box, it is to be used together when the Web Resource indicated by item_name written in Bundle ItemInfoEntry is received by Item in Item Information Item of the subsequent media segment. It shows.
  • FIG. 15 shows an example of a media segment including a bundle information box.
  • a segment file with an Earliest presentation time of 0 seconds has a Primary Item Box, and an Item of index.html is shown in the Primary Item Box.
  • the item of image1.jpg is shown in BundleInformationBox (binf). Therefore, the web engine 12 of the client terminal 11 loads index.html after receiving image1.jpg contained in the next one-second segment file to start index.html.
  • a media segment file of MPEG-DASH is applied to a target advertisement of broadcasting.
  • a target advertisement of broadcasting For example, when they are stored as a Web Resource in an ISOBMFF file, they have a Bundle Information Box together with Item Information including the top segment file of the segment file group corresponding to the advertisement period. Then, by listing other segment files in the item as a Bundle Information Entry, it is possible to replace the advertisement only when all segment files of the advertisement period have been received.
  • the Web application displays an advertisement while all segment files can not be received, it is assumed that a significant problem occurs because the advertisement can not be displayed correctly. On the other hand, occurrence of such a problem can be avoided by using the media segment including the Bundle Information Box as described above.
  • FIG. 16 shows an example of ItemInfoEntry expanded to indicate that the Web Resource stored in the ISOBMFF file has been updated if it has been updated.
  • ItemInfoEntry is extended to be able to record values equivalent to the Last_Modified and RFC-7243 Expires headers specified in RFC 7232 of the IETF.
  • FIG. 17 shows an example of a media segment in which the Information Box (iinf) is expanded.
  • the URL (Reference URL) of dinf is specified as https: //example/log/image2.jpg.
  • the web engine 12 when the web engine 12 is connected to the Internet, it is updated by specifying Last_modifed recorded in item entry info in the "If Modifed-Since" header in the HTTP GET request to the URL. You can only get files provided by other devices on the Internet. It is also possible to invalidate the cached file by notifying the web engine 12 of Expires of item entry info, and replace the cached data with a new file.
  • the client terminal 11 which is a DASH player may or may not reproduce Web Resource by the Web engine 12 when reproducing the A / V content of this MPD.
  • it is an EssentialProperty, it indicates that the Web Resource must be played back to play the Period.
  • DASH players that do not support web engine 12 need to either skip Period playback or play their entire MPD.
  • the Web Resource specified in the Primary Item Box in the MetaBox of the ISOBMFF initialization file is loaded by the Web engine 12 as an Entry Page.
  • the first Period indicates an example of SupplementalProperty.
  • this EssentialProperty can optionally have an attribute called value, and the value shows that Web Resources other than Primary Item written in Meta Box of the initialization segment are loaded as Entry Page ing.
  • the Web resource named index2.html recorded in the media segment whose Earliest Presentation Time in the media segment of Period is 60 seconds is entered It shows that it starts. For example, if a Supplemental Property of url: mpeg: EmbeddedEntrypageURL "is placed in the Adaptation Set, it is possible to change the Entry Page for each language of the Adaptation Set.
  • the third Period has a ScehemeIdUrl of url: mpeg: EntrypageURL "as a SupplementalProperty, which is stored in ISOBMFF and not provided by Web Resource, but is provided from an Internet Web server and is defined as Web Resource as Entry page. Even in DASH content that does not include Web Resource, Web Application can be played simultaneously with A / V content.
  • the network distribution system 21 is configured by connecting the client terminal 11 to the server device 23 via the network 22. Then, in the network distribution system 21, the distribution data generated by the distribution data generation device 24 is distributed to the client terminal 11 by the server device 23.
  • the client terminal 11 includes a decryption unit 31 that decrypts MPEG-DASH content.
  • the decryption unit 31 includes the media segment identification unit 32 and the Web Resource in addition to the web engine 12 and the A / V player 13 shown in FIG. It comprises the access part 33 and is comprised.
  • the media segment specifying unit 32 is a media segment requested according to the playback time of the MPEG-DASH content by the web engine 12 (for example, a media segment in which a web resource to be subjected to random access by the web resource access unit 33 is arranged) Identify).
  • the Web Resource access unit 33 accesses the Web Resource disposed in the media segment identified by the media segment identification unit 32 (for example, the media segment identified with reference to Item Information Entry stored in the MetaBox). .
  • the processing performed by the media segment identification unit 32 and the Web Resource access unit 33 will be described with reference to the flowcharts of FIGS.
  • the server device 23 is configured to distribute the corresponding Web Resource at the timing when the Web engine 12 of the client terminal 11 uses the Web Resource.
  • the delivery data generation device 24 includes an encoding unit 41 that encodes MPEG-DASH content, and the encoding unit 41 includes a segment file generation unit 42 and a media segment processing unit 43.
  • the segment file generation unit 42 generates a segment file as described above, and the media segment processing unit 43 divides the Web Resource into, for example, a predetermined number of divided data substantially equally, and the predetermined Earliest Presentation Time is continuous. Perform processing such as arranging in a number of media segments.
  • the distribution data generation device 24 uploads the MPEG-DASH content, for which the segment file generation unit 42 has generated a segment file and the media segment processing unit 43 has processed the media segment, to the server device 23 and distributes it. .
  • the initialization segment and the media segment are stored in one ISOBMFF file, and the segment index is used at the ISOBMFF file level.
  • Web resource random access is performed when the decryption unit 31 in FIG. 19 indirectly refers to the Item referred to by the MetaBox of the initialization segment from the Item referred to by the MetaBox of the segment file. The process to be performed will be described.
  • the decryption unit 31 starts processing when the Web engine 12 requests a Web Resource designated by a URL (for example, image2.jpg or the like) indicating item_name. Then, in step S11, the media segment identification unit 32 recognizes a URL indicating item_name of the Web Resource.
  • a URL for example, image2.jpg or the like
  • step S12 the media segment identification unit 32 reads the MetaBox from the ISOBMFF file or the moof of the ISOBMFF file.
  • step S13 the media segment identification unit 32 searches for items that match the URL recognized in step S11 from the item information entry (infe) recorded in the item information box (iinf) in the MetaBox read out in step S12. Do.
  • step S14 the media segment identification unit 32 determines whether or not infe matching the URL recognized in step S11 has been detected as a result of the search in step S13.
  • step S14 when the media segment identification unit 32 determines that the infe that matches the URL recognized in step S11 can not be detected, the process proceeds to step S15. Then, in step S15, the media segment identification unit 32 returns an error response code (for example, 404 Not Found) indicating no detection to the web engine 12, and the process is ended.
  • error response code for example, 404 Not Found
  • step S14 determines in step S14 that the infe matching the URL recognized in step S11 has been detected.
  • step S16 the Web Resource access unit 33 performs an extent reading process (see FIG. 21) for reading the extent based on the infe detected by the media segment identification unit 32 in step S13.
  • step S17 the Web Resource access unit 33 causes the web engine 12 to read the data read in the Extent read process of step S16 together with the normal response code (for example, OK 200 etc.), ie, the web resource specified by the web engine 12. After returning, the process ends.
  • the normal response code for example, OK 200 etc.
  • FIG. 21 is a flowchart for explaining the Extent reading process performed in step S16 of FIG.
  • step S21 the Web Resource access unit 33 searches the item location box in the MetaBox for an item having an item_id that matches the Item Information Entry (infe) identified by the media segment identification unit 32.
  • step S22 as a result of the search in step S21, the Web Resource access unit 33 determines whether or not an item having an item_id that matches the infe identified by the media segment identification unit 32 has been detected.
  • step S22 the Web Resource access unit 33 determines that the item having the item_id that matches the infe specified by the media segment specification unit 32 can not be detected, the process proceeds to step S15 of FIG. Is done.
  • step S22 when the Web Resource access unit 33 determines that the item having the item_id that matches the detected infe has been detected, the processing proceeds to step S23.
  • step S23 the Web Resource access unit 33 determines whether the data_reference_index of the detected item is 0 or not.
  • step S23 when the Web Resource access unit 33 determines that the data_reference_index of the detected item is 0, the process proceeds to step S24.
  • step S24 the Web Resource access unit 33 reads data for extent_length from the byte position of the extent_offset of the file, and after setting it as extent, the process proceeds to step S17 in FIG. 20 and the above-described process is performed.
  • step S23 when the Web Resource access unit 33 determines that the data_reference_index of the detected item is not 0, the processing proceeds to step S31 in FIG.
  • the media segment identification unit 32 reads the URL of the DataReference immediately preceding data_reference_index (data_reference_index-1) from DataInformationBox (dinf) in the MetaBox.
  • step S32 the media segment identification unit 32 determines whether the URL of the DataReference read in step S31 is a reference URL including # presentation Time.
  • step S32 when the media segment specifying unit 32 determines that the URL of DataReference is not a reference URL including # presentation Time, the process proceeds to step S33.
  • step S33 the Web Resource access unit 33 reads the file of the DataReference URL identified by the media segment identification unit 32 from the Internet using HTTPS (Hypertext Transfer Protocol Secure). Then, the media segment identification unit 32 sets the read file as the corresponding Web Resource.
  • HTTPS Hypertext Transfer Protocol Secure
  • step S34 the Web Resource access unit 33 determines whether the reading of the file in step S33 has succeeded.
  • step S34 when the Web Resource access unit 33 determines that reading of the file in step S33 is successful, the process proceeds to step S17 in FIG. 20, and the above-described process is performed.
  • step S34 determines in step S34 that the reading of the file in step S33 has not succeeded (failed)
  • the process proceeds to step S35.
  • step S35 after the media segment identification unit 32 returns an HTTP error code to the web engine 12, the process is terminated.
  • step S32 when the media segment specifying unit 32 determines that the URL of the DataReference is a reference URL including #presentationTime in step S32, the process proceeds to step S41 of FIG.
  • the media segment identification unit 32 refers to the segment index of the ISOBMFF file and sets it as the media segment target of the range specified by # presentation_item and duration (range information).
  • step S42 the media segment identification unit 32 reads the MetaBox of the target media segment from the ISOBMFF file.
  • step S43 the media segment identification unit 32 searches the Item Information Entry ('infe') of the Information Box (iinf) in the MetaBox for a item whose item_name matches the URL. At this time, the media segment identification unit 32 ignores the symbol after the # symbol of item_name.
  • step S44 the media segment specifying unit 32 determines whether or not infe in which item_name matches the URL has been detected as a result of the search in step S43.
  • step S44 when the media segment specifying unit 32 determines that the item in which item_name matches the URL can not be detected, the process proceeds to step S15 in FIG. 20, and the above-described process is performed.
  • step S44 determines in step S44 that the infe in which the item_name matches the URL has been detected.
  • step S45 the Web Resource access unit 33 performs the same extent read processing as described above with reference to FIG. 21, and sets the corresponding web resource as a partial extent.
  • step S46 the media segment identification unit 32 determines whether all target media segments have been processed.
  • step S46 If it is determined in step S46 that the media segment identification unit 32 does not process all target media segments, the process returns to step S42, and the same process is repeated.
  • step S46 determines in step S46 that all the target media segments have been processed
  • step S47 the Web Resource access unit 33 combines the partial extents read by repeating the processing from step S42 to step S45, and after acquiring the entire extent of the Web Resource, the process proceeds to step S17 of FIG. The process proceeds as described above.
  • the decryption unit 31 The process of will be described.
  • step S12 of FIG. 20 and the process of step S41 of FIG. are performed similarly.
  • step S12 of FIG. 20 processing for reading the MetaBox from the ISOBMFF file or the moof of the ISOBMFF file is performed.
  • step S12 of FIG. 20 processing for reading the MetaBox from the ISOBMFF file or the moof of the ISOBMFF file is performed.
  • step S12 of FIG. 20 processing for reading the MetaBox from the ISOBMFF file or the moof of the ISOBMFF file is performed.
  • step S12 of FIG. 20 processing for reading the MetaBox from the ISOBMFF file or the moof of the ISOBMFF file is performed.
  • the Live Profile processing is performed to read out the MetaBox of the Initization Segment file indicated by the MPD of MPEG-DASH.
  • step S41 of FIG. 23 processing is performed for media segments in the range designated by # presentation_item and duration with reference to Segment Index of the ISOBMFF file.
  • the MPD of the MPEG-DASH is referred to, the URL of the media segment file in the range designated by # presentation_item and the duration is specified, and the processing targeting these media segments is performed.
  • the series of processes (decoding method) described above can be performed by hardware or software.
  • the various functions are executed by installing a computer in which a program constituting the software is incorporated in dedicated hardware or various programs.
  • the program can be installed, for example, on a general-purpose personal computer from a program recording medium on which the program is recorded.
  • FIG. 24 is a block diagram showing an example of a hardware configuration of a computer that executes the series of processes described above according to a program.
  • a central processing unit (CPU) 101 a read only memory (ROM) 102, and a random access memory (RAM) 103 are mutually connected by a bus 104.
  • CPU central processing unit
  • ROM read only memory
  • RAM random access memory
  • the input / output interface 105 is connected to the bus 104.
  • the input / output interface 105 includes an input unit 106 including a keyboard, a mouse and a microphone, an output unit 107 including a display and a speaker, a storage unit 108 including a hard disk and a non-volatile memory, and a communication unit 109 including a network interface.
  • a drive 110 for driving a removable medium 111 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is connected.
  • the CPU 101 loads the program stored in the storage unit 108 into the RAM 103 via the input / output interface 105 and the bus 104 and executes the program. Processing is performed.
  • the program executed by the computer (CPU 101) is, for example, a magnetic disk (including a flexible disk), an optical disk (CD-ROM (Compact Disc-Read Only Memory), DVD (Digital Versatile Disc), etc.), a magneto-optical disk, or a semiconductor It is recorded on a removable medium 111 which is a package medium including a memory or the like, or is provided via a wired or wireless transmission medium such as a local area network, the Internet, and digital satellite broadcasting.
  • the program can be installed in the storage unit 108 via the input / output interface 105 by mounting the removable media 111 in the drive 110.
  • the program can be received by the communication unit 109 via a wired or wireless transmission medium and installed in the storage unit 108.
  • the program can be installed in advance in the ROM 102 or the storage unit 108.
  • the present technology can also have the following configurations.
  • the Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed
  • a decryption apparatus comprising: an access unit for accessing the Web Resource stored in a media segment.
  • the delivery content is an MP4 file format, and The decryption apparatus according to (1), wherein the Item Information Entry is stored in an Information Box in the Meta Box.
  • the decryption apparatus includes information for indirectly referring to Item Information Entry in the MetaBox of the plurality of media segments used for the delivery content.
  • the decryption apparatus according to any one of (1) to (3), further comprising: a media segment identification unit that identifies the media segment in which the Web Resource to be accessed is arranged.
  • the decryption apparatus according to (4), wherein the access unit randomly accesses the Web Resource identified by the media segment identification unit.
  • the media on which the Web Resource is arranged so that the Item Information Entry stored in the MetaBox of the media segment of the reference destination can be accessed Information indicating the Earliest Presentation Time applicable to the segment is described,
  • the decryption apparatus according to any one of (1) to (5), wherein the access unit accesses the Web Resource using information indicating the Earliest Presentation Time.
  • the information indicating the Earliest Presentation Time is recorded as a URL (Uniform Resource Locator) of the DataReferenceBox in the MetaBox of the reference source, The decryption apparatus according to (6), wherein the access unit accesses the Web Resource using the URL.
  • a media segment identification unit that identifies the media segment to be accessed based on the Earliest Presentation Time described in the URL and information on the delivery content
  • the decryption apparatus accesses the Web Resource from a MetaBox stored in the media segment identified by the media segment identification unit.
  • the Web Resource is divided substantially equally into a predetermined number of divided data, and each of the divided data is arranged in a predetermined number of the media segments in which Earliest Presentation Time is continuous,
  • the decryption apparatus according to any one of (1) to (8), wherein the access unit acquires the entire Web Resource by collecting and combining the divided data.
  • the MetaBox indicating the byte offset and byte size in the media segment is recorded,
  • (13) When the Web Resource used when launching a Web Application and the Web Resource not used when launching are recorded and transmitted in separate Media Segments, In the Primary Item Box of the MetaBox, the Web Resource to be activated first is specified, and in the Meta Box, information indicating the other Web Resources necessary at the time of activation is listed.
  • the decryption unit according to any one of (1) to (12), wherein the access unit activates the Web Application after acquiring all of the plurality of Web Resources required at startup from the corresponding media segment.
  • Information indicating that the Web Resource has been updated or revoked is recorded in the Item Information Entry,
  • the decryption apparatus according to any one of (1) to (13), wherein the access unit accesses the Web Resource based on the information recorded in the Item Information Entry.
  • the decryption device according to (14), wherein the information indicating that the Web Resource has been updated or revoked is information corresponding to “Last Modified” and “Expires” headers defined by HTTP (Hypertext Transfer Protocol).
  • the access unit accesses the Web Resource provided from another device on the Internet indicated by the Reference URL corresponding to the Item Information Entry, when the Web Resource is updated or expired.
  • Decoding device 17.
  • the decryption device The Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed
  • a decryption method comprising: accessing the Web Resource stored in a media segment.
  • the Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed
  • a media segment processing unit that distributes and arranges web resources of distribution content into a plurality of media segments;
  • a segment file generation unit which stores Item Information Entry stored in the MetaBox of an initialization segment used in the distribution content in the media segment to be specified as an access target.
  • the delivery content is an MP4 file format
  • the encoding apparatus according to (20) wherein the segment file generation unit stores the Item Information Entry in an Information Box in the Meta Box.
  • the Web resource so that the segment file generation unit can access the Item Information Entry stored in the MetaBox of the media segment to be referred to in the Item Information Entry of the reference source stored in the initialization segment.
  • the coding apparatus according to any one of the above (20) to (22), which describes information indicating Earliest Presentation Time that corresponds to the media segment in which is placed.
  • the encoding apparatus (23), wherein the segment file generation unit records the information indicating the Earliest Presentation Time as a URL (Uniform Resource Locator) of a DataReferenceBox in the MetaBox of the reference source.
  • the media segment processing unit arranges each of the divided data in a predetermined number of media segments in which Earliest Presentation Time is continuous such that the Web Resource is divided substantially equally into the predetermined number of divided data.
  • the encoding apparatus as described in (20).
  • the segment file generation unit is configured to associate the Earliest of each of the media segments in which a predetermined number of divided data pieces into which the Web Resource is divided is arranged in the URL for the Item Information Entry of the MetaBox referred to by the initialization segment.
  • the encoding device including range information of Presentation Time.
  • the segment file generation unit records the divided data in the Web Resource in each of the predetermined number of media segments when one of the Web Resources is divided into the predetermined number of divided data and arranged in the media segment.
  • the encoding apparatus which records the MetaBox indicating a byte offset and a byte size in the media segment in the range.
  • the segment file generation unit is configured to indicate, in the MetaBox, a byte offset of the divided data in the Web Resource and an entire byte of the Web Resource to indicate which part of the Web Resource divided into a predetermined number.
  • the encoding device which records the size.
  • the segment file generation unit designates, in the Primary Item Box of the MetaBox, the Web Resource to be activated first, and enumerates, in the Meta Box, information indicating the other Web Resources necessary for activation.
  • the encoding device as described in 2.).
  • the information indicating that the Web Resource has been updated or revoked is the information corresponding to the "Last Modified" and "Expires" headers defined in HTTP (Hypertext Transfer Protocol).
  • the encoding apparatus according to (30) above .
  • (32) The Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed
  • the delivery content is an MP4 file format, and The server apparatus according to (32), wherein the Item Information Entry is stored in an Information Box in the Meta Box.
  • (34) Delivering the Web Resource specified with reference to the Item Information Entry including information for indirectly referencing Item Information Entry in the MetaBox of a plurality of media segments used for the delivery content described in (32) above Server device.
  • the server apparatus which distributes the Web Resource that is identified and accessed based on the Earliest Presentation Time described in the URL and information related to the distribution content.
  • the web resource is divided substantially equally into a predetermined number of divided data, and each of the divided data is arranged in a predetermined number of the media segments in which Earliest Presentation Time is continuous.
  • Server device In the URL for the Item Information Entry of the MetaBox referred to by the initialization segment, range information of the Earliest Presentation Time of each of the media segments in which a predetermined number of divided data pieces into which the Web Resource is divided is arranged Included,
  • the server apparatus according to (38), which distributes the Web Resource accessed to the media segment corresponding to the range information.
  • each of the predetermined number of media segments is within the range in which the divided data in the Web Resource is recorded.
  • the MetaBox indicating the byte offset and byte size in the media segment is recorded,
  • the server apparatus according to (39) which delivers the Web Resource accessed using the MetaBox.
  • a byte offset of the divided data in the Web Resource and an entire byte size of the Web Resource are recorded to indicate which part of the Web Resource divided into a predetermined number is configured.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

The present disclosure pertains to a decoder, a decoding method, and a program with which it is possible to improve convenience when streaming delivery content. A web resource of delivery content isdistributed among a plurality of media segments, an item information entry stored in a metabox of an initialize segment that is used in the delivery content is referred to, and an object to be accessed is specified. The web resource stored in the specified media segment is accessed at random. The present technology can be applied, for example, to a service for streaming delivery content on the Internet using MPEG-DASH, MPEG-CMAF, etc.

Description

復号装置、復号方法、およびプログラムDecryption device, decryption method, and program
 本開示は、復号装置、復号方法、およびプログラムに関し、特に、MPEG-DASHやMPEG-CMAFなどを用いて配信コンテンツをストリーミングする際の利便性を向上させることができるようにした復号装置、復号方法、およびプログラムに関する。 The present disclosure relates to a decrypting device, a decrypting method, and a program, and more particularly, to a decrypting device and a decrypting method capable of improving convenience when streaming distribution content using MPEG-DASH, MPEG-CMAF or the like. , And the program.
 近年、インターネット上のストリーミングサービスの基盤技術として、MPEG-DASH(Moving Picture Experts Group - Dynamic Adaptive Streaming over HTTP)や、MPEG-CMAF(Moving Picture Experts Group -Common Media Application Format for Segmented Media)などが普及し始めている。 In recent years, MPEG-DASH (Moving Picture Experts Group-Dynamic Adaptive Streaming over HTTP) and MPEG-CMAF (Moving Picture Experts Group-Common Media Application Format for Segmented Media) have become popular as basic technologies for streaming services on the Internet. I'm starting.
 また、MPEG-DASHまたはMPEG-CMAFを用いたストリーミングでは、例えば、ISOBMFF(ISO Base Media File Format)のMetaBoxを利用し、HTML5(HyperText Markup Language 5)やJavaScript(登録商標)などのWebアプリケーションを構成する複数ファイル(Web Resources)を、ISOBMFF内に記録して配信する技術が用いられている。ここで、ISOBMFFのMetaBoxについては、非特許文献1において開示されており、MPEG-CMAFについては、非特許文献2において策定されている。 Also, in streaming using MPEG-DASH or MPEG-CMAF, for example, a metabox of ISO Base Media File Format (ISOBMFF) is used to configure a Web application such as HTML5 (HyperText Markup Language 5) or JavaScript (registered trademark). A technology is used that records and distributes multiple files (Web Resources) to be stored in ISOBMFF. Here, ISOBMFF's MetaBox is disclosed in Non-Patent Document 1, and MPEG-CMAF is formulated in Non-Patent Document 2.
 ところで、従来のISOBMFFのMetaBoxをそのまま利用した場合には、例えば、必要とするWeb Resourceにランダムアクセスすることが困難であったり、アプリケーションの起動が遅くなったり、帯域適応型ストリーミングでは利用することが困難であったり、Web Resourceの更新および失効を判断することが困難であったりした。そのため、MPEG-DASHやMPEG-CMAFなどを用いて配信コンテンツをストリーミングする際の利便性が低下することになっていた。 By the way, when the conventional ISOBMFF MetaBox is used as it is, for example, it is difficult to make random access to the required Web Resource, or the start of the application is delayed, or it may be used for bandwidth adaptive streaming. It was difficult, and it was difficult to determine the update and revocation of Web Resources. Therefore, the convenience in streaming delivery content using MPEG-DASH, MPEG-CMAF, etc. has been reduced.
 本開示は、このような状況に鑑みてなされたものであり、MPEG-DASHやMPEG-CMAFなどを用いて配信コンテンツをストリーミングする際の利便性を向上させることができるようにするものである。 The present disclosure has been made in view of such a situation, and is intended to improve convenience when streaming distribution content using MPEG-DASH, MPEG-CMAF, or the like.
 本開示の一側面の復号装置は、配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定された前記メディアセグメントに格納された前記Web Resourceにアクセスするアクセス部を備える。 The decryption apparatus according to an aspect of the present disclosure refers to the Item Information Entry stored in the MetaBox of the initialization segment in which the Web Resource of the delivery content is distributed and disposed in a plurality of media segments and used in the delivery content. And an access unit for accessing the Web Resource stored in the identified media segment to be accessed.
 本開示の一側面の復号方法は、復号装置が、配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定された前記メディアセグメントに格納された前記Web Resourceにアクセスすることを含む。 In the decryption method according to one aspect of the present disclosure, the decryption device is configured such that the Web Resource of the delivery content is distributed and disposed in a plurality of media segments, and Item Information stored in MetaBox of the initialization segment used in the delivery content Referencing the Entry, and accessing the Web Resource stored in the identified media segment to be accessed.
 本開示の一側面のプログラムは、復号装置のコンピュータに、配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定された前記メディアセグメントに格納された前記Web Resourceにアクセスすることを含む復号処理を実行させる。 The program according to one aspect of the present disclosure is an item in which the Web Resource of the distribution content is distributed to a plurality of media segments and arranged in the computer of the decryption apparatus, and stored in the MetaBox of the initialization segment used in the distribution content. Information decryption is performed by referring to Information Entry and accessing the Web Resource stored in the identified media segment to be accessed.
 本開示の一側面においては、配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定されたメディアセグメントに格納されたWeb Resourceにアクセスされる。 In one aspect of the present disclosure, the Web Resource of the distribution content is distributed and disposed in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to and accessed. The Web Resource stored in the specified media segment to be targeted is accessed.
 本開示の一側面によれば、MPEG-DASHやMPEG-CMAFなどを用いて配信コンテンツをストリーミングする際の利便性の向上を図ることができる。 According to one aspect of the present disclosure, it is possible to improve the convenience when streaming distribution content using MPEG-DASH or MPEG-CMAF.
 なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。 In addition, the effect described here is not necessarily limited, and may be any effect described in the present disclosure.
ISOBMFFファイルおよびクライアント端末の構成例を示す図である。It is a figure which shows the structural example of an ISOBMFF file and a client terminal. 各moofに記録されたWeb Resourceが分散して配置されている例を示す図である。It is a figure which shows the example in which the Web Resource recorded on each moof is disperse | distributed and arrange | positioned. A/Vコンテンツの再生時間に合わせて表示を変更するWebアプリケーションの一例を示す図である。FIG. 6 is a diagram showing an example of a web application that changes the display in accordance with the playback time of A / V content. "index.html"の表示例を示す図である。It is a figure which shows the example of a display of "index. html." ISOBMFFファイルについて説明する図である。It is a figure explaining an ISOBMFF file. PT0Sであるメディアセグメントファイルの構造を示す図である。It is a figure which shows the structure of the media segment file which is PT0S. PT60Sであるメディアセグメントファイルの構造を示す図である。It is a figure which shows the structure of the media segment file which is PT60S. イニシャライズセグメントについて説明する図である。It is a figure explaining an initialization segment. Timed Text Trackのサンプルとして記録されたHTMLファイルの一例を示す図である。It is a figure which shows an example of the HTML file recorded as a sample of Timed Text Track. Web Resourceのextentを複数のメディアセグメントに配置したメディアセグメントファイルの構造を示す図である。It is a figure which shows the structure of the media segment file which arrange | positioned the extent of Web Resource to several media segments. 拡張されたItem Location Boxの一例を示す図である。It is a figure which shows an example of the expanded Item Location Box. Web Resourceのextentを複数のメディアセグメントに配置した構成におけるイニシャライズセグメントのMetaBoxの一例を示す図である。It is a figure which shows an example of MetaBox of the initialization segment in the structure which arrange | positioned the extent of Web Resource to several media segments. カルーセル伝送について説明する図である。It is a figure explaining a carousel transmission. Bundle Information Boxの形式の一例を示す図である。It is a figure which shows an example of the format of a Bundle Information Box. Bundle Information Boxを含むメディアセグメントの一例を示す図である。It is a figure which shows an example of the media segment containing Bundle Information Box. 拡張されたItemInfoEntryの一例を示す図である。Fig. 18 is a diagram showing an example of an expanded ItemInfoEntry. Information Boxが拡張されたメディアセグメントの一例を示す図である。It is a figure which shows an example of the media segment which Information Box was expanded. MPEG-DASHのMPDの拡張について説明する図である。It is a figure explaining extension of MPD of MPEG-DASH. 本技術を適用した配信システムの一実施の形態の構成例を示すブロック図である。BRIEF DESCRIPTION OF DRAWINGS FIG. 1 is a block diagram illustrating a configuration example of an embodiment of a delivery system to which the present technology is applied. Web Resourceヘランダムアクセスする処理を説明する第1のフローチャートである。FIG. 16 is a first flowchart illustrating a process of randomly accessing Web Resource. FIG. Extent読み込み処理を説明するフローチャートである。It is a flowchart explaining an Extent read-in process. Web Resourceヘランダムアクセスする処理を説明する第2のフローチャートである。It is a 2nd flow chart explaining processing to access Web Resource at random. Web Resourceヘランダムアクセスする処理を説明する第3のフローチャートである。It is the 3rd flowchart which explains the processing which randomizes to Web Resource. 本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。Fig. 21 is a block diagram illustrating a configuration example of an embodiment of a computer to which the present technology is applied.
 以下、本技術を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。 Hereinafter, specific embodiments to which the present technology is applied will be described in detail with reference to the drawings.
 <ISOBMFFファイルについて>
 まず、図1乃至4を参照して、ISOBMFF規格において、Web ResourceをISOBMFFファイル内に記録し、A/V(Audio/Visual)コンテンツおよびWebアプリケーションを一つのISOBMFFファイルとして配信する技術について説明する。このような配信は、例えば、ISOBMFFファイルのMetaBoxのItem Information Box(iinf)にItem Information Entry('infe')を記録し、それに対応するDataReferenceBox('dref')のLocationInformationBox('iloc')でISOBMFFファイルに記録されたWeb Resourceを示すことで実現される。なお、明細書中において、MP4ファイルフォーマットとは、ISO BMFFで規格定義されるファイルフォーマットを意味する。
<About the ISOBMFF file>
First, with reference to FIGS. 1 to 4, a technique will be described in which Web Resource is recorded in an ISOBMFF file in the ISOBMFF standard, and A / V (Audio / Visual) content and Web application are distributed as one ISOBMFF file. For such delivery, for example, Item Information Entry ('infe') is recorded in Item Information Box (iinf) of MetaBox of ISOBMFF file, and ISOBMFF is indicated by LocationInformationBox ('iloc') of DataReferenceBox ('dref') corresponding to that. It is realized by showing Web Resource recorded in the file. In the specification, the MP4 file format means a file format defined in accordance with ISO BMFF.
 図1には、ISOBMFFファイルおよびクライアント端末の構成例が示されている。 FIG. 1 shows an example of the configuration of an ISOBMFF file and a client terminal.
 図1では、"index.htm"と、"image1.jpg"および"image2.jpg"との2つのWeb ResourceがMetaBoxに記録されているISOBMFFファイルの一例が示されている。なお、ISOBMFFファイルのMetaBoxにおいて、LocationInformationBox('iloc')の替わりにDataReferenceEntryURLを利用することで、Item Information Entry('infe')からインターネットのサーバにおかれたWeb Resourceを参照することもできる。このように、A/VコンテンツおよびWebアプリケーションの両方を含んだISOBMFFファイルは、例えば、インターネットやストレージメディアなどを経由して配信される。 FIG. 1 shows an example of an ISOBMFF file in which two Web Resources of “index.htm” and “image1.jpg” and “image2.jpg” are recorded in MetaBox. Note that, by using DataReferenceEntryURL instead of LocationInformationBox ('iloc') in MetaBox of the ISOBMFF file, it is also possible to reference Web Resource placed on a server of the Internet from Item Information Entry ('infe'). Thus, an ISOBMFF file containing both A / V content and a web application is distributed via, for example, the Internet, storage media, and the like.
 また、図1に示すように、クライアント端末11は、ウェブエンジン12、A/Vプレイヤ13、画像重畳部14、音声混成部15、ディスプレイ16、およびスピーカ17を備えて構成される。例えば、クライアント端末11は、スマートホンやテレビジョン受像機などにウェブエンジン12およびA/Vプレイヤ13を実装することで構成される。 Further, as shown in FIG. 1, the client terminal 11 is configured to include a web engine 12, an A / V player 13, an image superimposing unit 14, an audio mixing unit 15, a display 16, and a speaker 17. For example, the client terminal 11 is configured by mounting the web engine 12 and the A / V player 13 on a smartphone, a television receiver, or the like.
 そして、クライアント端末11では、ウェブエンジン12およびA/Vプレイヤ13がISOBMFFファイルを処理することにより得られる画像が画像重畳部14に供給され、それぞれの画像が画像重畳部14において重畳された後、ディスプレイ16に表示される。同様に、クライアント端末11では、ウェブエンジン12およびA/Vプレイヤ13がISOBMFFファイルを処理することにより得られる音声が音声混成部15に供給されて、それぞれの音声が音声混成部15により混成された後、スピーカ17から出力される。 Then, in the client terminal 11, after an image obtained by processing the ISOBMFF file by the web engine 12 and the A / V player 13 is supplied to the image superimposing unit 14, and the respective images are superimposed in the image superimposing unit 14, It is displayed on the display 16. Similarly, in the client terminal 11, the audio obtained by processing the ISOBMFF file by the web engine 12 and the A / V player 13 is supplied to the audio mixing unit 15, and the respective sounds are mixed by the audio mixing unit 15. After that, it is outputted from the speaker 17.
 なお、図1に示すISOBMFFファイルのMetaBoxでは、"index.html"はPrimary Item Box('pitm)により示されるPrimary Resourceとして記録され、A/Vコンテンツ再生の開始の時に起動されるWebアプリケーションのEntry Pageであることを示す。 In the MetaBox of the ISOBMFF file shown in FIG. 1, "index. Html" is recorded as a Primary Resource indicated by a Primary Item Box ('pitm), and an entry of a Web application started at the start of A / V content playback. Indicates that it is Page.
 一方で、ISOBMFFファイルをフラグメント化したISOBMFFファイルが、MPEG-DASHコンテンツとして用いられることが多くなっている。MPEG-DASHは、1つまたは複数のMovieFragmentBox(moof)とMediaDataBox(mdat)の組(対)からなるフラグメントのまとまりをメディアセグメントとして扱い、MPDによって記述された複数ビットレートでエンコードされたメディアセグメントを用意することで、帯域適応型のストリーミングを実現している。 On the other hand, ISOBMFF files obtained by fragmenting ISOBMFF files are often used as MPEG-DASH contents. MPEG-DASH treats a group of fragments consisting of one or more MovieFragmentBox (moof) and MediaDataBox (mdat) pairs (pairs) as a media segment, and encodes a media segment encoded at multiple bit rates described by MPD. By preparing it, bandwidth adaptive streaming is realized.
 図2には、各メディアセグメントのMovieFragmentBox(moof)に記録されたWeb Resourceが分散して配置されている例が示されている。 FIG. 2 shows an example in which Web Resources recorded in MovieFragmentBox (moof) of each media segment are distributed and arranged.
 ISOBMFF規格によれば、図2に示すように、各moofに記録されたWeb Resourceを分散して配置する方法により"Just In Time Delivery"を実現すること、即ち、ウェブエンジン12がWeb Resourceを使用するタイミングで、そのWeb Resourceを配信することができる。 According to the ISOBMFF standard, as shown in FIG. 2, to realize "Just In Time Delivery" by distributing and arranging Web Resources recorded in each moof, that is, Web engine 12 uses Web Resources. You can distribute the Web Resource at the same time.
 例えば、A/Vコンテンツの先頭である第1の再生開始時間(0秒)を再生開始するときに"index.html"および"image1.jpg"が配信され、ウェブエンジン12は、"index.html"および"image1.jpg"をディスプレイ16に表示させる。その後、第2の再生開始時間(60秒)となって"image2.jpg"が使用されるタイミングで"image2.jpg"が配信され、ウェブエンジン12は、"image1.jpg"に替えて"image2.jpg"をディスプレイ16に表示させる。そして、第3の再生開始時間(90秒)となったタイミングで、ウェブエンジン12は、"image2.jpg"を非表示とする。ISOBMFFファイルは、このようなWebアプリケーションでの利用が想定されている。 For example, "index.html" and "image1.jpg" are delivered when the first playback start time (0 second), which is the beginning of A / V content, is started, and the web engine 12 Display “and“ image1.jpg ”on the display 16. After that, the second playback start time (60 seconds) is reached, and "image2.jpg" is delivered at the timing when "image2.jpg" is used, and the web engine 12 replaces "image1.jpg" with "image2 “. jpg” is displayed on the display 16. Then, the web engine 12 hides “image2.jpg” at the timing when the third reproduction start time (90 seconds) is reached. The ISOBMFF file is assumed to be used in such a web application.
 これにより、ストリーミング再生開始時にすべてのWeb ResourceをISOBMFFファイルの先頭にまとめて配信する必要がなくたるため、A/Vコンテンツの再生開始を高速にすることが可能となる。 As a result, it is not necessary to collectively distribute all Web Resources at the beginning of the ISOBMFF file at the start of streaming reproduction, so it is possible to speed up the start of reproduction of A / V content.
 図3には、図2に示すようにA/Vコンテンツの再生時間に合わせて表示を変更するWebアプリケーションの一例が示されており、図4には、このようなWebアプリケーションをウェブエンジン12が処理することによる"index.html"の表示例が示されている。即ち、図4に示すように、ディスプレイ16には、A/Vプレイヤ13により処理されるfile.mp4に重畳して、再生時間0から"image1.jpg"が表示され、再生時間60秒になると"image1.jpg"から"image2.jpg"に変更されて、90秒まで"image2.jpg"が表示される。 An example of the web application which changes a display according to the reproduction time of A / V content as shown in FIG. 2 is shown by FIG. 2, and FIG. 4 shows the web engine 12 of such a web application. The example of display of "index. Html" by processing is shown. That is, as shown in FIG. 4, when “image1.jpg” is displayed from the reproduction time 0 on the display 16 when it is superimposed on file.mp4 processed by the A / V player 13 and the reproduction time is 60 seconds. It is changed from "image1.jpg" to "image2.jpg" and "image2.jpg" is displayed up to 90 seconds.
 ところで、上述したような方法では、常に、A/Vコンテンツの先頭である第1の再生開始時間(0秒)から連続してストリーミング再生するときには効率的に処理を行うことができる。これに対し、ビデオ・オン・デマンドのサービスなどにおいて、A/Vコンテンツの先頭以外の第2の再生開始時間(例えば、60秒)や第3の再生開始時間(例えば、90秒)などから再生を開始するケースについて検討する。この場合、各メディアセグメントに配置されたWeb Resourceは先頭からA/Vコンテンツ再生に伴って順次アクセスされるのを前提としているため、それぞれの時点で必要とするWeb Resourceにランダムアクセスすることは極めて効率が悪く、高速にWebアプリケーションを起動し、A/Vコンテンツの表示を行うことが困難となっていた。従って、高速にWebアプリケーションを起動することができるように、それぞれの時点で必要とするWeb Resourceにランダムアクセスすることを可能とすることが求められている。 By the way, according to the method as described above, processing can be efficiently performed when performing streaming reproduction continuously from the first reproduction start time (0 second) which is the head of A / V content. On the other hand, in video-on-demand services, etc., playback is performed from the second playback start time (for example, 60 seconds) other than the head of the A / V content or the third playback start time (for example, 90 seconds) Consider the case of starting In this case, since it is assumed that Web Resources placed in each media segment are sequentially accessed from the beginning along with A / V content playback, it is extremely difficult to randomly access the required Web Resources at each time. It was inefficient and it was difficult to launch Web applications at high speed and display A / V content. Therefore, in order to be able to launch a Web application at high speed, it is required to enable random access to the required Web Resource at each point in time.
 また、MPEG-DASHストリーミングのように限られたネットワークの帯域幅でA/Vコンテンツを再生する際に、例えば、特定のメディアセグメントにデータサイズが大きい静止画、ビデオ、またはオーディオのファイルが記録されているケースについて検討する。この場合、メディアセグメントのデータ量にばらつきが生じているため、コンテンツビットレートが局所的に変化してしまい、帯域適応型ストリーミングでは利用することが困難となる。従って、帯域適応型ストリーミングにおいて容易にすることができるように、できるだけビットレートを均一化することが求められている。 In addition, when playing back A / V content with limited network bandwidth such as MPEG-DASH streaming, for example, files of still images, videos, or audio with large data size are recorded in a specific media segment. Consider the cases in which In this case, since the data amount of the media segment varies, the content bit rate changes locally, which makes it difficult to use in band adaptive streaming. Therefore, there is a need to make the bit rate as uniform as possible so that it can be facilitated in bandwidth adaptive streaming.
 また、ATSC3.0規格でみられるように、放送やIPマルチキャストなどのような片方向伝送において、MPEG-DASHやMPEG-CMAFなどを用いてWebアプリケーションを含んだコンテンツを配信するケースについて検討する。この場合も、できるだけビットレートを均一にすることが求められるが、さらなる課題としてはA/Vコンテンツはメディアセグメントとして分割されているために、クライアント端末11が選局を開始時の途中からでも再生可能であるが、Webアプリケーションも直ちに起動できるように、同一のWeb Resourceを数秒単位で繰り返してカルーセル伝送を行うことが考えられる。ただし、この場合、Webアプリケーションのデータサイズが大きくなるとWebアプリケーションの起動が遅くなるか、もしくは、短い繰り返しのカルーセル伝送ための無駄な伝送帯域も多く必要とし、A/Vコンテンツのビットレートを下げる必要とかでてきて好ましくない。従って、カルーセル伝送で帯域幅を無駄にすることなくWeb Resourceを配信しつつ、かつ、Webアプリケーションの起動を速くすることが求められている。 In addition, as seen in ATSC 3.0 standard, in uni-directional transmission such as broadcast and IP multicast, consider the case of delivering content including Web application using MPEG-DASH or MPEG-CMAF. Also in this case, it is required to make the bit rate as uniform as possible, but as a further problem, since the A / V content is divided as a media segment, the client terminal 11 plays back even during the start of channel selection. Although it is possible, it is conceivable to carry out carousel transmission by repeating the same Web Resource every few seconds so that the Web application can also be launched immediately. However, in this case, if the data size of the Web application becomes large, the start of the Web application will be delayed, or a lot of unnecessary transmission bandwidth for carousel transmission of short repetitions will be required, and the bit rate of A / V content needs to be lowered. It is not preferable because it is easy. Therefore, there is a need to accelerate Web application startup while delivering Web Resources without wasting bandwidth in carousel transmission.
 また、ISOBMFFファイルにWeb Resourceを記録して、A/VコンテンツおよびWebアプリケーションを一括して配信するケースについて検討する。この場合、例えばWebアプリケーションのバグ、GUIデザインの改良、機能追加などを行いたいとき、LocationInformationBoxから示されるISOBMFFファイルに記録されたWeb Resourceの代りに、インターネットのサーバに置かれた最新のWeb Resourceでウェブエンジン12が使用したいというニーズがあった。一方、DataReferenceEntryURLではインターネットのWeb Resourceは参照することはできるが、ISOBMFFファイルで配信されたWeb Resourceの作成日時や失効日時などの情報がないために、ウェブエンジン12は、どちらのWeb Resourceを使えば良いかを判断できなかった。 In addition, we will consider the case of recording Web Resource in ISOBMFF file and distributing A / V content and Web application collectively. In this case, for example, when you want to make a bug in the web application, improve the GUI design, add functions, etc., instead of the web resource recorded in the ISOBMFF file indicated from LocationInformationBox, with the latest web resource placed on the Internet server. There was a need for the web engine 12 to use. On the other hand, DataReferenceEntryURL can refer to the Web Resource of the Internet, but since there is no information such as creation date and expiration date of Web Resource distributed as ISOBMFF file, Web Engine 12 can use either Web Resource I could not judge whether it was good.
 また、放送やIPマルチキャストなどのような片方向伝送にて、MPEG-DASHやMPEG-CMAFなどを用いてWebアプリケーションを含んだコンテンツを配信する場合、Web Resourceの更新日時や失効日時がわからなかったためクライアント端末11はWeb Resourceのキャッシングを効率良く行うことができなかった。つまり、クライアント端末11は更新、失効していないWeb Resourceは受信せずに、キャッシングしたWeb Resourceを使えるようにしたいというニーズがあった。従って、ISOBMFFファイルに記録されたWeb Resourceの更新および失効の判断を可能とすることが求められている。 In addition, when distributing content including Web applications using MPEG-DASH or MPEG-CMAF, etc. in one-way transmission such as broadcasting or IP multicasting, the Web Resource update date and expiration date were not known. The client terminal 11 could not efficiently perform caching of Web Resources. In other words, there is a need for the client terminal 11 to use the cached Web Resource without receiving the Web Resource that has not been updated or expired. Therefore, it is required to be able to determine whether the Web Resource recorded in the ISOBMFF file is updated or expired.
 そこで、以下で説明するISOBMFFファイルの構成例は、上述したように、ランダムアクセスを可能とすることや、ビットレートの均一化を図ること、カルーセル伝送で帯域幅を無駄にすることなくWebアプリケーションの起動を速くすること、ISOBMFFファイルに記録されたWeb Resourceの更新および失効の判断を可能とすることなどを実現することを目的としている。 Therefore, the configuration example of the ISOBMFF file described below, as described above, enables random access, achieves uniform bit rates, and does not waste bandwidth in carousel transmission. The purpose is to realize quick start-up and enable determination of update and expiration of Web Resource recorded in the ISOBMFF file.
 <ランダムアクセスを可能とするISOBMFFファイルの構成例>
 図5乃至図9を参照して、ランダムアクセスを可能とするISOBMFFファイルの構成例について説明する。
<Example of configuration of ISOBMFF file that enables random access>
A configuration example of an ISOBMFF file that enables random access will be described with reference to FIGS. 5 to 9.
 図5には、ランダムアクセスを可能とするISOBMFFファイルの構成例が示されている。 FIG. 5 shows an example of the configuration of an ISOBMFF file that enables random access.
 例えば、図5に示すISOBMFFファイルは、MPEG-DASHコンテンツで利用されるISOBMFFファイルの各メディアセグメントに分散して" Just In Time Delivery "でWeb Resourceが配置された構成となっている。そして、ISOBMFFファイルでは、そのMetaBoxの記録が、それに対応するDataReferenceBox('dref')のItemLocatoinBox('iloc')で行われている。 For example, the ISOBMFF file shown in FIG. 5 is distributed to each media segment of the ISOBMFF file used for the MPEG-DASH content, and Web Resources are arranged in “Just In Time Delivery”. Then, in the ISOBMFF file, the recording of the MetaBox is performed in the ItemLocatoinBox ('iloc') of the DataReferenceBox ('dref') corresponding thereto.
 さらに、ISOBMFFファイルでは、以下のようにファイルレベルにて、MetaBoxのDataReferenceBox('dref')内のURL(Uniform Resource Locator)が、各メディアセグメントのWeb Resourceを直接参照、または、メディアセグメント内のItem Information Entryを用いて間接参照が行われる。これにより、ISOBMFFファイルは、ファイルレベルのMetaBoxのItem Information Entryから各メディアセグメントのWeb Resourceがアクセスできるような構成となっている。 Furthermore, in the ISOBMFF file, a URL (Uniform Resource Locator) in the DataReferenceBox ('dref') of MetaBox directly refers to the Web Resource of each media segment, or an Item in the media segment at the file level as follows: Indirect reference is performed using Information Entry. As a result, the ISOBMFF file is configured such that the Web Resource of each media segment can be accessed from the Item Information Entry of the file level MetaBox.
 例えば、ISOBMFF規格によればItem Location を利用することで別ファイルのExtentを参照可能であるが、MPEG-DASHやMPEG-CMAFなどの配信コンテンツのフラグメント化されたISOBMFFファイルでは、メディアセグメントが別々のファイルに分割されて扱うことになるため、バイトオフセットでは扱い難かった。また、メディアセグセグメントが生成済でないと参照するItem Location Entryを作れないという不都合がある。 For example, according to the ISOBMFF standard, it is possible to refer to Extent of another file by using Item Location, but in a fragmented ISOBMFF file of delivery contents such as MPEG-DASH and MPEG-CMAF, media segments are different. Because it was divided into files and handled, it was difficult to handle with byte offsets. In addition, there is a disadvantage that it is not possible to create an Item Location Entry to which reference is made unless the media segment is generated.
 これに対し、以下で説明するようにISOBMFFファイルでは、DataReferenceBoxを使用して、URLで各メディアセグメントのWeb Resourceを直接参照するか、または、それぞれのメディアセグメントのmoofのMetaBoxを利用した間接参照が行われる。 On the other hand, in the ISOBMFF file, as described below, the DataReferenceBox is used to directly refer to the Web Resource of each media segment in the URL, or an indirect reference using the MetaBox of the moof of each media segment is used. To be done.
 例えば、図6および図7を参照して、メディアセグメントがmoofおよびmdatを各々含む構造になっているMPEG-DASHコンテンツを例に、Web Resourceをメディアセグメントに記録する方法について説明する。 For example, with reference to FIGS. 6 and 7, a method of recording Web Resource in a media segment will be described by taking MPEG-DASH content in which the media segment includes moof and mdat as an example.
 図6には、ISOBMFFファイルが複数のメディアセグメントファイルに分割されているときに、Earliest Presentation TimeがPT0Sであるメディアセグメントファイルの構造、即ち、A/Vコンテンツの先頭のメディアセグメントファイルの構造が示されている。 FIG. 6 shows the structure of a media segment file whose Earliest Presentation Time is PT0S when the ISOBMFF file is divided into a plurality of media segment files, that is, the structure of the media segment file at the beginning of the A / V content. It is done.
 例えば、moofにはMetaBoxが配置され、そのMetaBoxは、Audioのtrackの他、Handler Box(hdlr),Primary Item Box(pitm),Information Location Box(iloc),Item Information Box(iinf)を記録する。 For example, a MetaBox is arranged in moof, and the MetaBox records a Handler Box (hdlr), a Primary Item Box (pitm), an Information Location Box (iloc), and an Item Information Box (iinf) in addition to an Audio track.
 また、iinf BoxにはItem Information Entryが記録され、図6に示す例では、Entry_count=2となっており、2つのItemが記録されていることが示されている。そして、1番目のItem Information Entryはitem_id=0であり、item_name=index.htmlよりItemのファイル名を知ることができる。また、2番目のItem Information EntryはItem_id=1であり、item_name=image1.jpgである。 Further, Item Information Entry is recorded in the iinf Box, and in the example shown in FIG. 6, Entry_count = 2, which indicates that two Items are recorded. The first Item Information Entry is item_id = 0, and the file name of Item can be known from item_name = index.html. The second Item Information Entry is Item_id = 1 and item_name = image1.jpg.
 また、iloc Boxには、それぞれのItem_IDで特定されるItemのファイルの中身(Extent)の保存場所が記録され、図6に示す例では、item_count=2となっており、2つのitemのロケーションが記録されていることが示されている。そして、1番目のItem Location Entryではitem_id=0であることより、index.htmlに相当することが示されている。また、data_reference_index=0であることより、同一のファイル内にこのItemのExtentが記録されているということが示されている。 In addition, the storage location of the content (Extent) of the file of Item specified by each Item_ID is recorded in iloc Box, and in the example shown in FIG. 6, item_count = 2, and the locations of two items are It is shown that it is recorded. The first Item Location Entry indicates that it corresponds to index.html because item_id = 0. Also, as data_reference_index = 0, it is indicated that the Extent of this Item is recorded in the same file.
 例えば、MPEG-DASHコンテンツでは、セグメントファイルが別々のファイルに分割されるのを想定し、moofのTrack Fragment Header Boxesのbase‐data‐offset‐present を0にし、default-base_is_moofを1にしてmoofおよびmdatの対からなるセグメント内の相対位置でオフセットしている。図6に示す例では、index.htmlのextentのextent_offsetでは、メディアセグメントファイルの先頭から実際にmdatに記録されたindex.htmlまでのバイトオフセットB0が指定される。また、extent_lengthには、index.htmlのファイルサイズであるL0が記録される。同様に、image1.jpgのextentのextent_offsetでは、バイトオフセットB1が指定され、extent_lengthには、image1.jpgのファイルサイズであるL1が記録される。 For example, in the MPEG-DASH content, assuming that segment files are divided into separate files, set the base-data-offset-present of moof Track Fragment Header Boxes to 0, set default-base_is_moof to 1, and set moof and It is offset by the relative position within the segment consisting of mdat pairs. In the example shown in FIG. 6, the byte offset B0 from the beginning of the media segment file to index.html actually recorded in mdat is specified in the extent_offset of the extent of index.html. Moreover, L0 which is a file size of index. Html is recorded in extent_length. Similarly, the byte offset B1 is specified in extent_offset of extent of image1.jpg, and L1 which is the file size of image1.jpg is recorded in extent_length.
 また、pitmには、HTMLによるWebアプリケーションにおいて最初にロードされるItemが指定される。図6に示す例では、pitmのitem_id=0であることから、ウェブエンジン12は、index.htmlを最初にロードすることになる。 Also, in pitm, an Item to be loaded first in the HTML web application is specified. In the example shown in FIG. 6, since the item_id = 0 of pitm, the web engine 12 loads index.html first.
 図7には、Earliest Presentation TimeがPT60Sであるメディアセグメントファイルの構造、即ち、A/Vコンテンツの先頭から再生を開始した場合に、60秒後に再生されるメディアセグメントの構造が示されている。 FIG. 7 shows the structure of the media segment file whose Earliest Presentation Time is PT60S, that is, the structure of the media segment to be played back after 60 seconds when playback is started from the beginning of the A / V content.
 図7に示すメディアセグメントでは、iinf BoxのItem Information EntryにおいてEntry_count=1となっていることより、1つのItemが記録されていることが示されている。そして、iinf Boxにはitem_name=image2.jpgと示され、iloc Boxにはextent_offset= B2およびextent_length= L2と示されており、image2.jpgがメディアセグメントファイルの先頭からB2バイトでファイルサイズL2にて記録されていることを表している。なお、ウェブエンジン12が、PT0Sのメディアセグメントファイルに記録されていたindex.htmlを既に処理している想定であることより、PT60Sであるメディアセグメントファイルには、pitmは記録されない。 In the media segment shown in FIG. 7, entry_count = 1 in Item Information Entry of iinf Box indicates that one Item is recorded. Then, iinf Box indicates item_name = image2.jpg, iloc Box indicates extent_offset = B2 and extent_length = L2, and image2.jpg is B2 bytes from the beginning of the media segment file and file size L2 It represents that it is recorded. Since web engine 12 has already processed index.html recorded in the media segment file of PT0S, no pitm is recorded in the media segment file of PT60S.
 ここまで説明したように、ISOBMFF規格で実現できるMetaBoxよってWeb Resourceを各メディアセグメントに記録することができる。そして、本実施の形態では、以下で説明するように、イニシャライズセグメント(ヘッダー)にMetaBoxを記録する。これにより、メディアセグメントのWeb Resourceにランダムアクセスを行うことを可能とする。 As described above, the Web Resource can be recorded in each media segment by MetaBox that can be realized by the ISOBMFF standard. Then, in the present embodiment, as described below, the MetaBox is recorded in the initialization segment (header). This enables random access to the web resource of the media segment.
 図8に示すイニシャライズセグメントは、moovに配置されたMetaBoxのiinf、各メディアセグメントにおかれたWeb ResourceのItemが、合計3つのItem Information Box Entryに記録され、item_nameはindex.html, image1.jpg, image2.jpgである。また、ilocには、それぞれのItemの保存場所が記録されており、data referenceに0以外が指定され、これはdinf(DataInformationBox)を配置し、他のファイルをURLにて間接的に参照できるようにする。 In the initialization segment shown in FIG. 8, the iBox of MetaBox arranged in moov and the item of Web Resource placed in each media segment are recorded in a total of three Item Information Box Entries, and item_name is index.html, image1.jpg , Image2.jpg. In addition, the storage location of each Item is recorded in iloc, and other than 0 is specified in data reference, which arranges dinf (DataInformationBox) so that other files can be referred to indirectly by URL. Make it
 そして、メディアセグメントのMetaBoxのItemに間接参照する場合には、図8のイニシャライズセグメントは、dinfに記載されるURLの形式に特徴があり、#presentationTime= PT0S,track_id=1,item_name=indexのような形式が、URLに新たに定義されている。これは、ISOBMFFファイルのメディアセグメントのEarliest Presentation TimeがPT0SのTrack_1にある、index.htmlというItemを間接的に参照するという意味のURLである。 And when referring indirectly to the item of MetaBox of the media segment, the initialize segment in FIG. 8 is characterized by the form of URL described in dinf, such as # presentationTime = PT0S, track_id = 1, item_name = index Format is newly defined in the URL. This is a URL meaning that it refers indirectly to an Item called index.html in which Earliest Presentation Time of the media segment of the ISOBMFF file is in Track_1 of PT0S.
 そして、メディアセグメントに配置されたWeb Resourceを直接参照する場合には、図8のイニシャライズセグメントは、dinfに記載されるURLの形式に特徴があり、#presentationTime=PT0Sのような形式が、URLに新たに定義されている。これは、ISOBMFFファイルのメディアセグメントのEarliest Presentation TimeがPT0Sのセグメントファイルを直接的に参照するという意味のURLである。直接参照の場合は、セグメントファイル内に配置されたWeb ResourceのExtentの範囲を特定するために、参照元のイニシャライズセグメントのMetaBoxの該当のItemのilocに記載されたextent_offsetには0以外が指定されることになる。 Then, when referring directly to the Web Resource placed in the media segment, the initialize segment in FIG. 8 is characterized by the form of the URL described in dinf, and the form such as # presentationTime = PT0S is in the form of URL It is newly defined. This is a URL that means that Earliest Presentation Time of the media segment of the ISOBMFF file directly refers to the segment file of PT0S. In the case of direct reference, in order to specify the Extent range of the Web Resource placed in the segment file, a non-zero value is specified in extent_offset described in iloc of the Item of the corresponding Item of the MetaBox of the reference source initialization segment It will be
 このように、URLの形式を新たに定義することで、ウェブエンジン12は、各メディアセグメントに含まれたWeb Resourceへのランダムアクセスが可能となる。例えば、MPEG-DASHコンテンツが、On Demand ProfileのようにSegment Indexを使っていた場合には、該当のmoofを含むメディアセグメント特定することができる。また、例えば、MPEG-DASHコンテンツが、Live Profileのようにメディアセグメントが別のファイルになっていた場合には、MPDより、該当のmoofを含むメディアセグメントファイルを特定することができる。なお、MPEG-CMAFファイルにおいてはManifest Fileより、該当のmoofを含むメディアセグメントファイルを特定することができる。これにより、ウェブエンジン12は、該当メディアセグメントを取得し、そのメディアセグメントのmoofには、図8に示すようなMetaBoxが記録されているので、track_id=1,item_name=1に該当するWeb ResourceのExtentをmdatから取り出すことができる。 Thus, by newly defining the format of the URL, the web engine 12 can randomly access the web resource included in each media segment. For example, when the MPEG-DASH content uses Segment Index as in the On Demand Profile, it is possible to specify the media segment including the moof. Also, for example, when the MPEG-DASH content is such that the media segment is a separate file as in Live Profile, it is possible to identify the media segment file including the moof from the MPD. In the MPEG-CMAF file, the media segment file including the moof can be specified from the Manifest File. As a result, the web engine 12 acquires the corresponding media segment, and because the MetaBox as shown in FIG. 8 is recorded in the moof of the media segment, the web resource corresponding to track_id = 1, item_name = 1 is stored. Extents can be extracted from mdat.
 このように、MPEG-DASHコンテンツが、On Demand ProfileのようにSegment Indexを使っていた場合でも、Live Profileのようにメディアセグメントが別のファイルになっていた場合でも、ウェブエンジン12は、各メディアセグメントに含まれたWeb Resourceへのランダムアクセスが可能となる。 Thus, even if the MPEG-DASH content uses the Segment Index like On Demand Profile, or if the media segment is a separate file like Live Profile, the web engine 12 will Random access to Web Resources included in the segment is possible.
 ここで、図8に示したメディアセグメントのMetaBoxで記録されたWeb ResourceをURLで参照する方法は、ISO/IEC 14496-30に規定されるTimed text tracksやTimed metadata trackなどのように再生時間のタイミング情報を持ったWeb Resource("Timed Web Assets"と呼ばれる)でも利用可能である。 Here, the method of referring to the Web Resource recorded in MetaBox of the media segment shown in FIG. 8 by the URL is the playback time of the playback time such as Timed text tracks and Timed metadata track specified in ISO / IEC 14496-30. It is also available as a Web Resource (called "Timed Web Assets") with timing information.
 例えば、図9に示すように、Timed Text Trackのサンプルとして記録されたHTMLファイルから、図8を参照して説明したようなURLを利用して、MetaBoxで記録されたResourceを参照することが可能となる。 For example, as shown in FIG. 9, from an HTML file recorded as a sample of Timed Text Track, it is possible to refer to a Resource recorded in MetaBox using a URL as described with reference to FIG. It becomes.
 <ビットレートの均一化を図るISOBMFFファイル>
 図10乃至図12を参照して、ビットレートの均一化を図るISOBMFFファイルについて説明する。
<ISOBMFF file for uniform bit rate>
An ISOBMFF file for achieving uniform bit rates will be described with reference to FIGS. 10 to 12.
 上述したように、DASHコンテンツのメディアセグメントにWeb Resourceを記録する際に、Web Resourceのファイルサイズが大きくなると、そのメディアセグメントのみファイルサイズが大きくなり、DASHコンテンツのビットレートが均一でなくなってしまう。例えば、DASHコンテンツの8MBpsのコンスタントビットレートでエンコードされ、Segment Durationが1秒の場合、メディアセグメントは1Mバイトである。これに対し、WebアプリケーションのJPEGやPNGのファイルなどは2k, 4Kの解像度になると1Mバイトを超える場合あり、Webアプリケーションを記録したメディアセグメントのみファイルサイズが大きくなってしまう。 As described above, when Web Resource is recorded in the media segment of DASH content, if the file size of Web Resource is increased, the file size of only that media segment is increased, and the bit rate of DASH content is not uniform. For example, when encoded at a constant bit rate of 8 MBps for DASH content and the Segment Duration is 1 second, the media segment is 1 Mbyte. On the other hand, JPEG and PNG files for Web applications may exceed 1 Mbyte for 2k and 4K resolutions, and the file size of the media segment recorded with Web applications will be large.
 図10に示すメディアセグメントでは、Image2.jpgのExtentが、3つの部分Extent(分割データ)に略均等に分割された例が示されている。例えば、1番目の部分ExtentのファイルサイズはB2-1バイトであり、Earliest Presentation Timeが60秒のメディアセグメントに保存されている。また、2番目の部分ExtentのファイルサイズはB2-2バイトであり、Earliest Presentation Timeが61秒であるメディアセグメントに保存されている。同様に、3番目の部分ExtentのファイルサイズはB2-3バイトであり、Earliest Presentation Timeが62秒のメディアセグメントに保存されている。 In the media segment shown in FIG. 10, an example is shown in which Extent of Image2.jpg is substantially equally divided into three partial extents (division data). For example, the file size of the first portion Extent is B2-1 bytes, and Earliest Presentation Time is stored in a media segment of 60 seconds. In addition, the file size of the second portion Extent is B2-2 bytes, and is stored in a media segment whose Earliest Presentation Time is 61 seconds. Similarly, the file size of the third portion Extent is B2-3 bytes, and the Earliest Presentation Time is stored in the media segment of 62 seconds.
 また、図10では、それぞれのitem information entryが部分Extentで相当することを示すように"image2.jpg"に#記号と1から始まる番号が付けられてitem_nameとなっている。つまり、1番目の部分Extentはitem_name= image2.jpg#1となっており、2番目の部分Extentはitem_name= image2.jpg#2となっており、3番目の部分Extentはitem_name= image2.jpg#3となっている。 Further, in FIG. 10, “image2.jpg” is numbered with a # sign and a number starting with 1 so as to indicate that each item information entry corresponds to the partial extent, and becomes item_name. That is, the first part Extent is item_name = image2.jpg # 1, the second part Extent is item_name = image2.jpg # 2, and the third part Extent is item_name = image2.jpg # It is three.
 このようなメディアセグメントでは、図11に示すように、Item Location BoxのitemのentryにはExtent_position(バイトオフセット)とtotal_Size(全体バイトサイズ)の2つの拡張パラメータが追加され、各部分ExtentがWeb ResourceのExtentのどの位置に相当するかが示されている。これにより、例えば、2番目の部分Extent(PT61S)を取得した後に、全体のExtentを取得するには、前後のEarliest Presentatin Timeのメディアセグメントを取得する必要があることと判断される。 In such a media segment, as shown in FIG. 11, two extended parameters of Extent_position (byte offset) and total_Size (total byte size) are added to the item entry of Item Location Box, and each Extent is a Web Resource It shows which position of Extent corresponds to. Thus, for example, after acquiring the second portion Extent (PT 61 S), it is determined that it is necessary to acquire the media segment of the previous and following Earliest Presentatin Time in order to acquire the entire Extent.
 図12には、Web ResourceのExtentを複数のメディアセグメントに配置した構成におけるイニシャライズセグメントのMetaBoxの一例が示されている。 FIG. 12 shows an example of the MetaBox of the initialization segment in a configuration in which Extents of Web Resource are arranged in a plurality of media segments.
 図12に示すように、image2.jpgのdinfのdrefのURLは、#presentationTime= PT60S,duration=PT3S,track_id=1,item_name=image2.jpgとなり、"duration=PT3S"というパラメータが追加されている。これは、PT60Sから3秒間のメディアセグメントにimage2.jpgの部分Extentが記録されていることを示している。 As shown in FIG. 12, the dref URL of dinf of image2.jpg is # presentationTime = PT60S, duration = PT3S, track_id = 1, item_name = image2.jpg, and the parameter “duration = PT3S” is added. . This indicates that a partial Extent of image2.jpg is recorded in the media segment of 3 seconds from PT60S.
 従って、図1のウェブエンジン12は、Earliest presentation timeが60S,61S,62Sである3つのセグメントからitem_nameがimage2.jpgを含むitemのextentを取得し、それらを合成することでimage2.jpgを取得することができる。 Therefore, the web engine 12 of FIG. 1 obtains image2.jpg by acquiring extents of items including item2.name from item_name from three segments whose Earliest presentation times are 60S, 61S, and 62S. can do.
 <Webアプリケーションの起動の高速化を図るISOBMFFファイルの構成例>
 図13乃至図15を参照して、Webアプリケーション起動の高速化を図るISOBMFFファイルの構成例について説明する。
<Example of ISOBMFF file configuration to speed up startup of Web application>
An example of the configuration of an ISOBMFF file for speeding up the startup of a web application will be described with reference to FIGS. 13 to 15.
 まず、Webアプリケーションの起動の遅れについて説明する。 First, the delay in launching a web application will be described.
 例えば、ATSC 3.0のように、MPEG-DASHコンテンツを放送やIPマルチキャストなどのような片方向伝送にてクライアント端末11にブロードキャストするといった用途について考える。この場合、MPEG-DASHのLive Profileが使用され、各メディアセグメントは別々のファイルとして伝送されることになる。このメディアセグメントにWebアプリケーションのWeb Resourceを記録することはできるが、片方向伝送のためランダムアクセスすることができない。 For example, as in ATSC 3.0, consider an application where MPEG-DASH content is broadcast to the client terminal 11 by one-way transmission such as broadcast or IP multicast. In this case, MPEG-DASH Live Profile is used, and each media segment will be transmitted as a separate file. Although it is possible to record the Web resource of the Web application in this media segment, random access can not be performed because of one-way transmission.
 そこで、図13に示すように、同一のWeb Resourceを一定期間で繰り返す、所謂、カルーセル伝送が行われることになる。 Therefore, as shown in FIG. 13, so-called carousel transmission is performed in which the same Web Resource is repeated in a fixed period.
 図13に示す例では、index.html,image1.jpg,image2.jpgのまとまりの単位が、繰り返し伝送されている。これにより、図1のクライアント端末11は、第1から第3までの再生開始時間のいずれの時間で放送サービスを受信した場合であっても、放送サービスに連動したインタラクティブなWebアプリケーションのindex.htmlを起動することができる。なお、例えば、クライアント端末11が、第2の再生開始時間から受信を開始した場合には、index.htmlを含むメディアセグメントを受信するまで待機して起動することになり、Webアプリケーションの起動の遅れてしまう。 In the example shown in FIG. 13, the unit of aggregation of index. Html, image1.jpg, image2.jpg is repeatedly transmitted. Thus, even if the client terminal 11 of FIG. 1 receives the broadcast service at any of the first to third playback start times, the index. Html of the interactive Web application linked to the broadcast service. Can be launched. In addition, for example, when the client terminal 11 starts reception from the second reproduction start time, the client terminal 11 waits until receiving the media segment including the index.html, which causes a delay in activation of the Web application. It will
 ところで、従来のISOBMFF規格では、Primary Item Box(pitm)で示される最初にウェブエンジン12にロードされ起動時に使用されるWeb Resource(例えば、image1.jpg)と、起動後に必要はWeb Resource(例えば、image2.jpg)とを区別する仕組みがない。このため、image2.jpgがindex.htmlから使用されるかの判断がつかないため、第1の再生開始時間にてindex.htmlおよびimage1.jpgを受信した場合、ただちにindex.htmlを起動すればいいのか、image2.jpgの受信を待ってからindex.htmlを起動すればいいのかを判断することができない。仮に、index.htmlの起動時にimage1.jpgおよびimage2.jpgの両方が必要な場合には、image2.jpgが正しく表示されなくなってしまう。 By the way, according to the conventional ISOBMFF standard, a Web Resource (for example, image1.jpg) which is first loaded to the Web engine 12 and used at start-up indicated by Primary Item Box (pitm) and necessary after start-up is Web Resource (for example, There is no mechanism to distinguish it from image2.jpg). For this reason, since it can not be determined whether image2.jpg is used from index.html, if index.html and image1.jpg are received at the first reproduction start time, start index.html immediately. It can not be determined whether it is ok to wait until the image2.jpg is received and then start index.html. If both image1.jpg and image2.jpg are needed when launching index.html, image2.jpg will not be displayed correctly.
 そこで、Webアプリケーション起動の高速化を図るために、Item InformationBoxを拡張したBundle Item Information Boxを設け、後続のメディアセグメントに保存されているがItemをまとめて使用するものであることを明示的に示せるようにする。 Therefore, in order to accelerate Web application startup, a Bundle Item Information Box extended Item Information Box is provided, and it is possible to explicitly indicate that items stored in the subsequent media segment are to be used collectively. Let's do it.
 図14には、Bundle Information Boxの形式が示されている。 FIG. 14 shows the format of the Bundle Information Box.
 図14に示すように、Bundle Information Boxは、MetaBox内にItem InformationBoxと一緒に配置される。そして、このItem Information Boxを使用する場合は、Bundle ItemInfoEntryに書かれたitem_nameで示されるWeb Resourceが後続のメディアセグメントのItem Information Item内のItemに受信されたときに、一緒に使用されることを示している。 As shown in FIG. 14, the Bundle Information Box is placed in the MetaBox together with the Item Information Box. And when using this Item Information Box, it is to be used together when the Web Resource indicated by item_name written in Bundle ItemInfoEntry is received by Item in Item Information Item of the subsequent media segment. It shows.
 図15には、Bundle Information Boxを含むメディアセグメントの一例が示されている。 FIG. 15 shows an example of a media segment including a bundle information box.
 図15に示すように、Earliest presentation timeが0秒であるセグメントファイルはPrimary Item Boxを持ち、Primary Item Boxには、index.htmlのItemが示されている。一方、BundleInformationBox(binf)には、image1.jpgのitemが示されている。従って、クライアント端末11のウェブエンジン12は、index.htmlを起動するのは、次の1秒のセグメントファイルに含まれるimage1.jpgを受信してから、index.htmlをロードする。 As shown in FIG. 15, a segment file with an Earliest presentation time of 0 seconds has a Primary Item Box, and an Item of index.html is shown in the Primary Item Box. On the other hand, the item of image1.jpg is shown in BundleInformationBox (binf). Therefore, the web engine 12 of the client terminal 11 loads index.html after receiving image1.jpg contained in the next one-second segment file to start index.html.
 その他の利用としては、例えば、MPEG-DASHのメディアセグメントファイルが放送のターゲット広告などに応用することが考えられる。例えば、それらがWeb ResourceとしてISOBMFFファイルに保存される場合に、広告期間に相当するセグメントファイル群の先頭のセグメントファイルを含むItem InformationとともにBundle Information Boxを持つ。そして、そのitemに他のセグメントファイルをBundle Information Entryとして列挙することで、広告期間のすべてのセグメントファイルが受信できている場合のみ、広告の置き換えを行うことができる。 As another use, for example, it is conceivable that a media segment file of MPEG-DASH is applied to a target advertisement of broadcasting. For example, when they are stored as a Web Resource in an ISOBMFF file, they have a Bundle Information Box together with Item Information including the top segment file of the segment file group corresponding to the advertisement period. Then, by listing other segment files in the item as a Bundle Information Entry, it is possible to replace the advertisement only when all segment files of the advertisement period have been received.
 なお、仮に、すべてのセグメントファイルが受信できていない状態にてWebアプリケーションが広告表示を行った場合、正しく広告が表示できないために著しい問題が発生すると想定される。これに対し、上述したようなBundle Information Boxを含むメディアセグメントを利用することで、そのような問題の発生を回避することができる。 If the Web application displays an advertisement while all segment files can not be received, it is assumed that a significant problem occurs because the advertisement can not be displayed correctly. On the other hand, occurrence of such a problem can be avoided by using the media segment including the Bundle Information Box as described above.
 <Web Resourceの更新および失効の判断を可能とするISOBMFFファイルの構成例>
 図16および図17を参照して、Web Resourceの更新および失効の判断を可能とするISOBMFFファイルの構成例について説明する。
<Example of configuration of ISOBMFF file that enables determination of Web Resource update and revocation>
With reference to FIGS. 16 and 17, an example of the configuration of an ISOBMFF file that enables the determination of Web Resource update and revocation will be described.
 図16には、ISOBMFFファイルに保存していたWeb Resourceが更新されていた場合に、失効していることが示せるように拡張されたItemInfoEntryの一例が示されている。例えば、ItemInfoEntryが、IETFのRFC 7232で規定するLast_ModifiedおよびRFC-7243 Expiresのヘッダーと同等の値を記録することができるように拡張する。 FIG. 16 shows an example of ItemInfoEntry expanded to indicate that the Web Resource stored in the ISOBMFF file has been updated if it has been updated. For example, ItemInfoEntry is extended to be able to record values equivalent to the Last_Modified and RFC-7243 Expires headers specified in RFC 7232 of the IETF.
 図17には、Information Box(iinf)が拡張されたメディアセグメントの一例が示されている。 FIG. 17 shows an example of a media segment in which the Information Box (iinf) is expanded.
 図17に示すメディアセグメントでは、iinfにおいて、image2.jpgに対してlast-Modifedおよびexpiresが指定される。また、ilocにおいて、ファイルに記録されたExtentが示される他、item entryと、dinfのURLを示すitem_entryが示されている。 In the media segment shown in FIG. 17, in iinf, last-Modifed and expires are specified for image2.jpg. Also, in iloc, in addition to Extent recorded in the file, item entry and item_entry indicating the URL of dinf are shown.
 ここで、図17に示す例では、dinfのURL(ReferenceURL)は、https://example/log/image2.jpgと指定されている。このとき、例えば、ウェブエンジン12がインターネットに接続されている場合、そのURLへのHTTP GETのリクエストに"If Modifed-Since"ヘッダーにitem entry infoに記録されたLast_modifedを指定することで、更新された場合のみ、インターネット上の他の装置から提供されるファイルを取得することができる。また、item entry infoのExpiresをウェブエンジン12に通知することでキャッシュされたファイルを失効させ、新たなファイルでキャッシュデータを置き換える事も可能である。 Here, in the example illustrated in FIG. 17, the URL (Reference URL) of dinf is specified as https: //example/log/image2.jpg. At this time, for example, when the web engine 12 is connected to the Internet, it is updated by specifying Last_modifed recorded in item entry info in the "If Modifed-Since" header in the HTTP GET request to the URL. You can only get files provided by other devices on the Internet. It is also possible to invalidate the cached file by notifying the web engine 12 of Expires of item entry info, and replace the cached data with a new file.
 以上のように、MPEG-DASHで使用されるメディアセグメントにWeb Resourceを保存して配信する際に、ランダムアクセスを可能とすることや、ビットレートの均一化を図ること、カルーセル伝送で帯域幅を無駄にすることなくWebアプリケーションの起動を速くすること、ISOBMFFファイルに記録されたWeb Resourceの更新および失効の判断を可能とすることができるISOBMFF規格の拡張について説明した。 As described above, when Web Resource is stored and delivered to the media segment used in MPEG-DASH, enabling random access, achieving equalization of bit rate, bandwidth by carousel transmission, etc. The extension of the ISOBMFF standard has been described, which makes it possible to speed up the startup of a web application without wasting it, and to make it possible to judge the update and expiration of the Web Resource recorded in the ISOBMFF file.
 なお、MPEG-DASHのメディアセグメントやMPEG-CMAFのセグメントにWeb Resourceを配置する際に、前述したMetaBoxを用いる方法以外に、Event Message Box(emsg)を用いる方法がある。その場合、Web Resourceもemsgボックス内に配置することもできるし、前述と同様にmdat内に配置することもできる。例えば、どちらの場合にも前述のイニシャライズセグメントおよびメディアセグメントのMetaBoxに記載した内容に相当するWeb Resourceにアクセスするための情報をEvent Message Box 内に記載することによって、同様の効果を得ることができる。さらに、以下では、MPEG-DASHのMPDにて、そのように拡張されたISOBMFFファイルを利用する際の実施の形態について説明する。 Note that when placing a Web resource in a media segment of MPEG-DASH or a segment of MPEG-CMAF, there is a method of using Event Message Box (emsg) in addition to the method of using MetaBox described above. In that case, the Web Resource can also be placed in the emsg box, or can be placed in the mdat as described above. For example, in either case, similar effects can be obtained by writing information for accessing Web Resources corresponding to the contents described in the above-mentioned initialization segment and media segment MetaBox in the Event Message Box. . Furthermore, in the following, an embodiment will be described in which the ISOBMFF file thus expanded is used in MPD of MPEG-DASH.
 即ち、MPEG-DASHのMPDを拡張し、EssentialPropertyまたはSupplementalPropertyとして"urn:mpegEmbeddedEntryPageURL"というSchemeIdUriを定義し、Period, AdaptationSet, Representationの何れかに追加できるようにする。 That is, the MPD of MPEG-DASH is extended, and a SchemeIdUri of "urn: mpegEmbeddedEntryPageURL" is defined as EssentialProperty or SupplementalProperty so that it can be added to either Period, AdaptationSet, or Representation.
 例えば、SupplementalPropertyの場合は、該当のPeriodのいずれかのTrackにはISOBMFFファイルにはWeb Resourceが保存されていることを示している。従って、DASHプレイヤであるクライアント端末11は、このMPDのA/Vコンテンツを再生する時にWeb Resourceをウェブエンジン12で再生しても再生しなくてもよい。一方、EssentialPropertyであった場合は、そのPeriodの再生にはWeb Resourceを再生しなければならないことを示している。従って、ウェブエンジン12がサポートされていないDASHプレイヤは、Period再生をスキップするか、そのMPD全体を再生する必要がある。 For example, in the case of supplemental property, it is indicated that the Web resource is stored in the ISOBMFF file in any of the tracks of the corresponding period. Therefore, the client terminal 11 which is a DASH player may or may not reproduce Web Resource by the Web engine 12 when reproducing the A / V content of this MPD. On the other hand, if it is an EssentialProperty, it indicates that the Web Resource must be played back to play the Period. Thus, DASH players that do not support web engine 12 need to either skip Period playback or play their entire MPD.
 これにより、例えば、A/Vコンテンツの再生時に必ずWebアプリを起動させ、広告バナーを再生させるなどのことが可能である。また、ISOBMFFのイニシャライゼーションファイルのMetaBox内のPrimary Item Boxで指定されたWeb ResourceをEntry Pageとしてウェブエンジン12でロードすることになる。 Thus, for example, it is possible to always start the web application and reproduce the advertising banner when reproducing the A / V content. Also, the Web Resource specified in the Primary Item Box in the MetaBox of the ISOBMFF initialization file is loaded by the Web engine 12 as an Entry Page.
 図18を参照して、MPEG-DASHのMPDの拡張について説明する。 The extension of the MPD of MPEG-DASH will be described with reference to FIG.
 図18に示すMPEG-DASHのMPDにおいて、1番目のPeriodは、SupplementalPropertyの例を示している。 In the MPEG-DASH MPD shown in FIG. 18, the first Period indicates an example of SupplementalProperty.
 また、2番目のPeriodは、このEssentialPropertyにはvalueというアトリビュートをオプショナルで持たすことができ、valueにはイニシャライズセグメントのMeta Boxで書かれたPrimary Item以外のWeb ResourceをEntry Pageとしてロードすることを示している。また、"#presentation_time=PT60S,track_id=1,item_name=index2.html"では、Periodのメディアセグメント内のEarliest Presentation Timeが60秒に該当するメディアセグメントに記録されたindex2.htmlというWeb ResourceをEntry Pageとして起動することを示している。例えば、Adaptation Setにurl:mpeg:EmbeddedEntrypageURL"のSupplementalPropertyを配置した場合は、Adaptation Setの言語ごとにEntry Pageを変更したりすることが可能である。 Also, in the second Period, this EssentialProperty can optionally have an attribute called value, and the value shows that Web Resources other than Primary Item written in Meta Box of the initialization segment are loaded as Entry Page ing. In addition, in "# presentation_time = PT60S, track_id = 1, item_name = index2.html", the Web resource named index2.html recorded in the media segment whose Earliest Presentation Time in the media segment of Period is 60 seconds is entered It shows that it starts. For example, if a Supplemental Property of url: mpeg: EmbeddedEntrypageURL "is placed in the Adaptation Set, it is possible to change the Entry Page for each language of the Adaptation Set.
 また、3番目のPeriodでは、SupplementalPropertyとしてurl:mpeg:EntrypageURL"というScehemeIdUrlを持ち、これはISOBMFFに保存されてWeb Resourceではなく、インターネットのWeb サーバから提供されWeb ResourceをEntry pageとしている。これにより、Web Resourceを含まないDASHコンテンツにおいてもWeb ApplicationをA/Vコンテンツと同時に再生することができる。 In addition, the third Period has a ScehemeIdUrl of url: mpeg: EntrypageURL "as a SupplementalProperty, which is stored in ISOBMFF and not provided by Web Resource, but is provided from an Internet Web server and is defined as Web Resource as Entry page. Even in DASH content that does not include Web Resource, Web Application can be played simultaneously with A / V content.
 <ネットワーク配信システムの構成例>
 図19乃至図23を参照して、上述したようにISOBMFFファイルを利用し、ネットワークを介してMPEG-DASHコンテンツを配信するネットワーク配信システムの構成例、および、クライアント端末11において行われる処理について説明する。
<Configuration Example of Network Delivery System>
An example of the configuration of a network distribution system that distributes MPEG-DASH content via a network using the ISOBMFF file as described above and the process performed in the client terminal 11 will be described with reference to FIGS. 19 to 23. .
 図19に示すように、ネットワーク配信システム21は、クライアント端末11がネットワーク22を介してサーバ装置23に接続されて構成される。そして、ネットワーク配信システム21では、配信データ生成装置24において生成された配信データが、サーバ装置23によりクライアント端末11に配信される。 As shown in FIG. 19, the network distribution system 21 is configured by connecting the client terminal 11 to the server device 23 via the network 22. Then, in the network distribution system 21, the distribution data generated by the distribution data generation device 24 is distributed to the client terminal 11 by the server device 23.
 クライアント端末11は、MPEG-DASHコンテンツを復号する復号部31を備えており、復号部31は、図1に示したウェブエンジン12およびA/Vプレイヤ13の他、メディアセグメント特定部32およびWeb Resourceアクセス部33を有して構成される。 The client terminal 11 includes a decryption unit 31 that decrypts MPEG-DASH content. The decryption unit 31 includes the media segment identification unit 32 and the Web Resource in addition to the web engine 12 and the A / V player 13 shown in FIG. It comprises the access part 33 and is comprised.
 メディアセグメント特定部32は、ウェブエンジン12によるMPEG-DASHコンテンツの再生時間に応じて要求されるメディアセグメント(例えば、Web Resourceアクセス部33によるランダムアクセスの対象となるWeb Resourceが配置されているメディアセグメント)を特定する。Web Resourceアクセス部33は、メディアセグメント特定部32により特定されたメディアセグメント(例えば、MetaBox内に格納されたItem Information Entryを参照して特定されるメディアセグメント)に配置されているWeb Resourceにアクセスする。なお、メディアセグメント特定部32およびWeb Resourceアクセス部33が行う処理については、図20乃至図23のフローチャートを参照して説明する。 The media segment specifying unit 32 is a media segment requested according to the playback time of the MPEG-DASH content by the web engine 12 (for example, a media segment in which a web resource to be subjected to random access by the web resource access unit 33 is arranged) Identify). The Web Resource access unit 33 accesses the Web Resource disposed in the media segment identified by the media segment identification unit 32 (for example, the media segment identified with reference to Item Information Entry stored in the MetaBox). . The processing performed by the media segment identification unit 32 and the Web Resource access unit 33 will be described with reference to the flowcharts of FIGS.
 サーバ装置23は、クライアント端末11のウェブエンジン12がWeb Resourceを使用するタイミングで、該当のWeb Resourceを配信するように構成される。 The server device 23 is configured to distribute the corresponding Web Resource at the timing when the Web engine 12 of the client terminal 11 uses the Web Resource.
 配信データ生成装置24は、MPEG-DASHコンテンツを符号化する符号化部41を備えており、符号化部41は、セグメントファイル生成部42およびメディアセグメント処理部43を有して構成される。セグメントファイル生成部42は、上述したようなセグメントファイルを生成し、メディアセグメント処理部43は、例えば、Web Resourceを、所定数の分割データに略均等に分割して、Earliest Presentation Timeが連続した所定数のメディアセグメントに配置する処理などを行う。 The delivery data generation device 24 includes an encoding unit 41 that encodes MPEG-DASH content, and the encoding unit 41 includes a segment file generation unit 42 and a media segment processing unit 43. The segment file generation unit 42 generates a segment file as described above, and the media segment processing unit 43 divides the Web Resource into, for example, a predetermined number of divided data substantially equally, and the predetermined Earliest Presentation Time is continuous. Perform processing such as arranging in a number of media segments.
 そして、配信データ生成装置24は、セグメントファイル生成部42によりセグメントファイルが生成され、メディアセグメント処理部43によりメディアセグメントに対する処理が行われたMPEG-DASHコンテンツを、サーバ装置23にアップロードして配信させる。 Then, the distribution data generation device 24 uploads the MPEG-DASH content, for which the segment file generation unit 42 has generated a segment file and the media segment processing unit 43 has processed the media segment, to the server device 23 and distributes it. .
 図20乃至図23のフローチャートを参照して、MPEG-DASHコンテンツのOn Demandプロファイルの場合であって、かつ、1つのISOBMFFファイルの中にイニシャライズセグメントとメディアセグメントが保存され、ISOBMFFファイルレベルにSegmentIndexにより各々のメディアセグメントが参照されている場合において、図19の復号部31が、イニシャライズセグメントのMetaBoxの参照元のItemからセグメントファイルのMetaBoxの参照先のItemに間接参照する場合においてWeb Resourceヘランダムアクセスする処理について説明する。 Referring to the flowcharts of FIGS. 20 to 23, in the case of the On Demand profile of MPEG-DASH content, the initialization segment and the media segment are stored in one ISOBMFF file, and the segment index is used at the ISOBMFF file level. When each media segment is referred to, Web resource random access is performed when the decryption unit 31 in FIG. 19 indirectly refers to the Item referred to by the MetaBox of the initialization segment from the Item referred to by the MetaBox of the segment file. The process to be performed will be described.
 例えば、復号部31は、ウェブエンジン12によりitem_nameを示すURL(例えば、image2.jpgなど)で指定されたWeb Resourceが要求されると処理を開始する。そして、ステップS11において、メディアセグメント特定部32は、そのWeb Resourceのitem_nameを示すURLを認識する。 For example, the decryption unit 31 starts processing when the Web engine 12 requests a Web Resource designated by a URL (for example, image2.jpg or the like) indicating item_name. Then, in step S11, the media segment identification unit 32 recognizes a URL indicating item_name of the Web Resource.
 ステップS12において、メディアセグメント特定部32は、ISOBMFFファイル、または、そのISOBMFFファイルのmoofからMetaBoxを読み出す。 In step S12, the media segment identification unit 32 reads the MetaBox from the ISOBMFF file or the moof of the ISOBMFF file.
 ステップS13において、メディアセグメント特定部32は、ステップS12で読み出したMetaBox内のItem Information Box(iinf)に記録されているItem Information Entry(infe)から、ステップS11で認識したURLに一致するものの検索を行う。 In step S13, the media segment identification unit 32 searches for items that match the URL recognized in step S11 from the item information entry (infe) recorded in the item information box (iinf) in the MetaBox read out in step S12. Do.
 ステップS14において、メディアセグメント特定部32は、ステップS13における検索の結果、ステップS11で認識したURLに一致するinfeを検出することができたか否かを判定する。 In step S14, the media segment identification unit 32 determines whether or not infe matching the URL recognized in step S11 has been detected as a result of the search in step S13.
 ステップS14において、メディアセグメント特定部32が、ステップS11で認識したURLに一致するinfeを検出することができなかったと判定した場合、処理はステップS15に進む。そして、ステップS15において、メディアセグメント特定部32は、未検出を示すエラー応答コード(例えば、404 Not Found)をウェブエンジン12に返した後、処理は終了される。 In step S14, when the media segment identification unit 32 determines that the infe that matches the URL recognized in step S11 can not be detected, the process proceeds to step S15. Then, in step S15, the media segment identification unit 32 returns an error response code (for example, 404 Not Found) indicating no detection to the web engine 12, and the process is ended.
 一方、ステップS14において、メディアセグメント特定部32が、ステップS11で認識したURLに一致するinfeを検出することができたと判定した場合、処理はステップS16に進む。 On the other hand, if the media segment identification unit 32 determines in step S14 that the infe matching the URL recognized in step S11 has been detected, the process proceeds to step S16.
 ステップS16において、Web Resourceアクセス部33は、ステップS13でメディアセグメント特定部32により検出されたinfeに基づいて、Extentを読み込むExtent読み込み処理(図21参照)を行う。 In step S16, the Web Resource access unit 33 performs an extent reading process (see FIG. 21) for reading the extent based on the infe detected by the media segment identification unit 32 in step S13.
 ステップS17において、Web Resourceアクセス部33は、ウェブエンジン12に、通常応答コード(例えば、OK 200など)とともに、ステップS16のExtent読み込み処理で読み込んだデータ、即ち、ウェブエンジン12により指定されたWeb Resourceを返した後、処理は終了される。 In step S17, the Web Resource access unit 33 causes the web engine 12 to read the data read in the Extent read process of step S16 together with the normal response code (for example, OK 200 etc.), ie, the web resource specified by the web engine 12. After returning, the process ends.
 図21は、図20のステップS16で行われるExtent読み込み処理を説明するフローチャートである。 FIG. 21 is a flowchart for explaining the Extent reading process performed in step S16 of FIG.
 ステップS21において、Web Resourceアクセス部33は、MetaBox内のItem Location Boxから、メディアセグメント特定部32により特定されたItem Information Entry(infe)に一致するitem_idを持つitemの検索を行う。 In step S21, the Web Resource access unit 33 searches the item location box in the MetaBox for an item having an item_id that matches the Item Information Entry (infe) identified by the media segment identification unit 32.
 ステップS22において、Web Resourceアクセス部33は、ステップS21における検索の結果、メディアセグメント特定部32により特定されたinfeに一致するitem_idを持つitemを検出できたか否かを判定する。 In step S22, as a result of the search in step S21, the Web Resource access unit 33 determines whether or not an item having an item_id that matches the infe identified by the media segment identification unit 32 has been detected.
 ステップS22において、Web Resourceアクセス部33が、メディアセグメント特定部32により特定されたinfeに一致するitem_idを持つitemを検出できなかったと判定した場合、処理は図20のステップS15に進み、上述した処理が行われる。 If, in step S22, the Web Resource access unit 33 determines that the item having the item_id that matches the infe specified by the media segment specification unit 32 can not be detected, the process proceeds to step S15 of FIG. Is done.
 一方、ステップS22において、Web Resourceアクセス部33が、検出されたinfeに一致するitem_idを持つitemを検出できたと判定した場合、処理はステップS23に進む。 On the other hand, in step S22, when the Web Resource access unit 33 determines that the item having the item_id that matches the detected infe has been detected, the processing proceeds to step S23.
 ステップS23において、Web Resourceアクセス部33は、検出したitemのdata_reference_indexが0であるか否かを判定する。 In step S23, the Web Resource access unit 33 determines whether the data_reference_index of the detected item is 0 or not.
 ステップS23において、Web Resourceアクセス部33が、検出したitemのdata_reference_indexが0であると判定した場合、処理はステップS24に進む。 In step S23, when the Web Resource access unit 33 determines that the data_reference_index of the detected item is 0, the process proceeds to step S24.
 ステップS24において、Web Resourceアクセス部33は、ファイルのextent_offsetのバイト位置からextent_length分のデータを読み、Extentとした後、処理は図20のステップS17に進み、上述した処理が行われる。 In step S24, the Web Resource access unit 33 reads data for extent_length from the byte position of the extent_offset of the file, and after setting it as extent, the process proceeds to step S17 in FIG. 20 and the above-described process is performed.
 一方、ステップS23において、Web Resourceアクセス部33が、検出したitemのdata_reference_indexが0でないと判定した場合、処理は図22のステップS31に進む。 On the other hand, in step S23, when the Web Resource access unit 33 determines that the data_reference_index of the detected item is not 0, the processing proceeds to step S31 in FIG.
 図22に示すように、ステップS31において、メディアセグメント特定部32は、MetaBox内のDataInformationBox(dinf)から、data_reference_indexの1つ前(data_reference_index-1番目)のDataReferenceのURLを読み取る。 As shown in FIG. 22, in step S31, the media segment identification unit 32 reads the URL of the DataReference immediately preceding data_reference_index (data_reference_index-1) from DataInformationBox (dinf) in the MetaBox.
 ステップS32において、メディアセグメント特定部32は、ステップS31で読み取ったDataReferenceのURLは、#presentationTimeを含む参照URLであるか否かを判定する。 In step S32, the media segment identification unit 32 determines whether the URL of the DataReference read in step S31 is a reference URL including # presentation Time.
 ステップS32において、メディアセグメント特定部32が、DataReferenceのURLは、#presentationTimeを含む参照URLでないと判定した場合、処理はステップS33に進む。 In step S32, when the media segment specifying unit 32 determines that the URL of DataReference is not a reference URL including # presentation Time, the process proceeds to step S33.
 ステップS33において、Web Resourceアクセス部33は、メディアセグメント特定部32により特定されたDataReferenceのURLのファイルをインターネットからHTTPS(Hypertext Transfer Protocol Secure)で読み込む。そして、メディアセグメント特定部32は、その読み込んだファイルを、該当のWeb Resourceとする。 In step S33, the Web Resource access unit 33 reads the file of the DataReference URL identified by the media segment identification unit 32 from the Internet using HTTPS (Hypertext Transfer Protocol Secure). Then, the media segment identification unit 32 sets the read file as the corresponding Web Resource.
 ステップS34において、Web Resourceアクセス部33は、ステップS33でのファイルの読み込みに成功したか否かを判定する。 In step S34, the Web Resource access unit 33 determines whether the reading of the file in step S33 has succeeded.
 ステップS34において、Web Resourceアクセス部33が、ステップS33でのファイルの読み込みに成功したと判定した場合、処理は図20のステップS17に進み、上述した処理が行われる。 In step S34, when the Web Resource access unit 33 determines that reading of the file in step S33 is successful, the process proceeds to step S17 in FIG. 20, and the above-described process is performed.
 一方、ステップS34において、Web Resourceアクセス部33が、ステップS33でのファイルの読み込みに成功していない(失敗した)と判定した場合、処理はステップS35に進む。 On the other hand, if the Web Resource access unit 33 determines in step S34 that the reading of the file in step S33 has not succeeded (failed), the process proceeds to step S35.
 ステップS35において、メディアセグメント特定部32は、HTTPのエラーコードをウェブエンジン12に返した後、処理は終了される。 In step S35, after the media segment identification unit 32 returns an HTTP error code to the web engine 12, the process is terminated.
 一方、ステップS32において、メディアセグメント特定部32が、DataReferenceのURLは、#presentationTimeを含む参照URLであると判定した場合、処理は図23のステップS41に進む。 On the other hand, when the media segment specifying unit 32 determines that the URL of the DataReference is a reference URL including #presentationTime in step S32, the process proceeds to step S41 of FIG.
 図23に示すように、ステップS41において、メディアセグメント特定部32は、ISOBMFFファイルのSegment Indexを参照し、#presentation_itemとduration(範囲情報)で指定される範囲のメディアセグメント対象とする。 As shown in FIG. 23, in step S41, the media segment identification unit 32 refers to the segment index of the ISOBMFF file and sets it as the media segment target of the range specified by # presentation_item and duration (range information).
 ステップS42において、メディアセグメント特定部32は、対象のメディアセグメントのMetaBoxをISOBMFFファイルから読み込む。 In step S42, the media segment identification unit 32 reads the MetaBox of the target media segment from the ISOBMFF file.
 ステップS43において、メディアセグメント特定部32は、MetaBox内のInformation Box(iinf)のItem Information Entry('infe')から、item_nameがURLと一致するものを検索する。このとき、メディアセグメント特定部32は、item_nameの#記号以降は無視する。 In step S43, the media segment identification unit 32 searches the Item Information Entry ('infe') of the Information Box (iinf) in the MetaBox for a item whose item_name matches the URL. At this time, the media segment identification unit 32 ignores the symbol after the # symbol of item_name.
 ステップS44において、メディアセグメント特定部32は、ステップS43における検索の結果、item_nameがURLと一致するinfeを検出することができたか否かを判定する。 In step S44, the media segment specifying unit 32 determines whether or not infe in which item_name matches the URL has been detected as a result of the search in step S43.
 ステップS44において、メディアセグメント特定部32が、item_nameがURLと一致するinfeを検出することができなかったと判定した場合、処理は図20のステップS15に進み、上述した処理が行われる。 In step S44, when the media segment specifying unit 32 determines that the item in which item_name matches the URL can not be detected, the process proceeds to step S15 in FIG. 20, and the above-described process is performed.
 一方、ステップS44において、メディアセグメント特定部32が、item_nameがURLと一致するinfeを検出することができたと判定した場合、処理はステップS45に進む。 On the other hand, if the media segment identification unit 32 determines in step S44 that the infe in which the item_name matches the URL has been detected, the process proceeds to step S45.
 ステップS45において、Web Resourceアクセス部33は、図21を参照して上述したのと同様のExtent読み込み処理を行い、該当のWeb Resourceを部分Extentとする。 In step S45, the Web Resource access unit 33 performs the same extent read processing as described above with reference to FIG. 21, and sets the corresponding web resource as a partial extent.
 ステップS46において、メディアセグメント特定部32は、対象の全てのメディアセグメントを処理したか否かを判定する。 In step S46, the media segment identification unit 32 determines whether all target media segments have been processed.
 ステップS46において、メディアセグメント特定部32が、対象の全てのメディアセグメントを処理していないと判定した場合、処理はステップS42に戻り、以下、同様の処理が繰り返される。 If it is determined in step S46 that the media segment identification unit 32 does not process all target media segments, the process returns to step S42, and the same process is repeated.
 一方、ステップS46において、メディアセグメント特定部32が、対象の全てのメディアセグメントを処理したと判定した場合、処理はステップS47に進む。 On the other hand, when the media segment specifying unit 32 determines in step S46 that all the target media segments have been processed, the process proceeds to step S47.
 ステップS47において、Web Resourceアクセス部33は、ステップS42からステップS45までの処理を繰り返すことにより読み出した部分Extentを合成して、Web Resourceの全体のExtentを取得した後、処理は図20のステップS17進み、上述した処理が行われる。 In step S47, the Web Resource access unit 33 combines the partial extents read by repeating the processing from step S42 to step S45, and after acquiring the entire extent of the Web Resource, the process proceeds to step S17 of FIG. The process proceeds as described above.
 ここで、MPEG-DASHコンテンツのLive Profileプロファイルの場合であって、かつ、イニシャライズセグメントとメディアセグメントとが別々に保存されて配信され、それらファイルのURLはMPDに記述されている場合における復号部31の処理について説明する。 Here, in the case of a Live Profile profile of MPEG-DASH content, and the initialization segment and the media segment are separately stored and delivered, and the URLs of those files are described in the MPD, the decryption unit 31 The process of will be described.
 例えば、図20乃至図23を参照して説明したようなOn Demand Profileの場合と比較して、Live Profileの場合には、図20のステップS12の処理、および、図23のステップS41の処理が異なり、その他の処理は同様に行われる。 For example, compared with the case of On Demand Profile as described with reference to FIGS. 20 to 23, in the case of Live Profile, the process of step S12 of FIG. 20 and the process of step S41 of FIG. Differently, other processing is performed similarly.
 即ち、On Demand Profileの場合には、図20のステップS12では、ISOBMFFファイル、または、そのISOBMFFファイルのmoofからMetaBoxを読み出す処理が行われる。これに対し、Live Profileの場合には、MPEG-DASHのMPDで示されるInitilization SegmentファイルのMetaBoxを読み出す処理が行われる。 That is, in the case of the On Demand Profile, in step S12 of FIG. 20, processing for reading the MetaBox from the ISOBMFF file or the moof of the ISOBMFF file is performed. On the other hand, in the case of the Live Profile, processing is performed to read out the MetaBox of the Initization Segment file indicated by the MPD of MPEG-DASH.
 また、On Demand Profileの場合には、図23のステップS41では、ISOBMFFファイルのSegment Indexを参照し、#presentation_itemとdurationで指定さる範囲のメディアセグメントを対象とする処理が行われる。これに対し、Live Profileの場合には、MPEG-DASHのMPDを参照し、#presentation_itemとdurationで指定さる範囲のメディアセグメントファイルのURLを特定し、それらメディアセグメントを対象とする処理が行われる。 Further, in the case of On Demand Profile, in step S41 of FIG. 23, processing is performed for media segments in the range designated by # presentation_item and duration with reference to Segment Index of the ISOBMFF file. On the other hand, in the case of the Live Profile, the MPD of the MPEG-DASH is referred to, the URL of the media segment file in the range designated by # presentation_item and the duration is specified, and the processing targeting these media segments is performed.
 以上のように、MPEG-DASHコンテンツにおけるOn Demand ProfileおよびLive Profileの両方において、メディアセグメントに分散配置("Just In Time Delivery ")された場合に、必要なWeb Resourceへのランダムアクセスを可能とすることができる。 As described above, in both On Demand Profile and Live Profile for MPEG-DASH content, random access to necessary Web Resources is enabled when distributed to media segments ("Just In Time Delivery"). be able to.
 <コンピュータの構成例>
 なお、上述のフローチャートを参照して説明した各処理は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むものである。また、プログラムは、1のCPUにより処理されるものであっても良いし、複数のCPUによって分散処理されるものであっても良い。
<Example of computer configuration>
Note that the processes described with reference to the above-described flowchart do not necessarily have to be processed in chronological order according to the order described as the flowchart, and processes performed in parallel or individually (for example, parallel processes or objects Processing) is also included. The program may be processed by one CPU or may be distributed and processed by a plurality of CPUs.
 また、上述した一連の処理(復号方法)は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラムが記録されたプログラム記録媒体からインストールされる。 Also, the series of processes (decoding method) described above can be performed by hardware or software. When a series of processes are executed by software, the various functions are executed by installing a computer in which a program constituting the software is incorporated in dedicated hardware or various programs. The program can be installed, for example, on a general-purpose personal computer from a program recording medium on which the program is recorded.
 図24は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。 FIG. 24 is a block diagram showing an example of a hardware configuration of a computer that executes the series of processes described above according to a program.
 コンピュータにおいて、CPU(Central Processing Unit)101,ROM(Read Only Memory)102,RAM(Random Access Memory)103は、バス104により相互に接続されている。 In the computer, a central processing unit (CPU) 101, a read only memory (ROM) 102, and a random access memory (RAM) 103 are mutually connected by a bus 104.
 バス104には、さらに、入出力インタフェース105が接続されている。入出力インタフェース105には、キーボード、マウス、マイクロホンなどよりなる入力部106、ディスプレイ、スピーカなどよりなる出力部107、ハードディスクや不揮発性のメモリなどよりなる記憶部108、ネットワークインタフェースなどよりなる通信部109、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111を駆動するドライブ110が接続されている。 Further, an input / output interface 105 is connected to the bus 104. The input / output interface 105 includes an input unit 106 including a keyboard, a mouse and a microphone, an output unit 107 including a display and a speaker, a storage unit 108 including a hard disk and a non-volatile memory, and a communication unit 109 including a network interface. A drive 110 for driving a removable medium 111 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is connected.
 以上のように構成されるコンピュータでは、CPU101が、例えば、記憶部108に記憶されているプログラムを、入出力インタフェース105及びバス104を介して、RAM103にロードして実行することにより、上述した一連の処理が行われる。 In the computer configured as described above, for example, the CPU 101 loads the program stored in the storage unit 108 into the RAM 103 via the input / output interface 105 and the bus 104 and executes the program. Processing is performed.
 コンピュータ(CPU101)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア111に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。 The program executed by the computer (CPU 101) is, for example, a magnetic disk (including a flexible disk), an optical disk (CD-ROM (Compact Disc-Read Only Memory), DVD (Digital Versatile Disc), etc.), a magneto-optical disk, or a semiconductor It is recorded on a removable medium 111 which is a package medium including a memory or the like, or is provided via a wired or wireless transmission medium such as a local area network, the Internet, and digital satellite broadcasting.
 そして、プログラムは、リムーバブルメディア111をドライブ110に装着することにより、入出力インタフェース105を介して、記憶部108にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部109で受信し、記憶部108にインストールすることができる。その他、プログラムは、ROM102や記憶部108に、あらかじめインストールしておくことができる。 The program can be installed in the storage unit 108 via the input / output interface 105 by mounting the removable media 111 in the drive 110. The program can be received by the communication unit 109 via a wired or wireless transmission medium and installed in the storage unit 108. In addition, the program can be installed in advance in the ROM 102 or the storage unit 108.
 <構成の組み合わせ例>
 なお、本技術は以下のような構成も取ることができる。
(1)
 配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定された前記メディアセグメントに格納された前記Web Resourceにアクセスするアクセス部
 を備える復号装置。
(2)
 前記配信コンテンツは、MP4ファイルフォーマットであって、
 前記Item Information Entryは、前記Meta BoxにおけるInformation Boxに格納される
 上記(1)に記載の復号装置。
(3)
 前記Item Information Entryは、前記配信コンテンツに用いられる複数の前記メディアセグメントのMetaBox内のItem Information Entryを間接参照するための情報を含む
 上記(1)または(2)に記載の復号装置。
(4)
 アクセスの対象となる前記Web Resourceが配置されている前記メディアセグメントを特定するメディアセグメント特定部
 をさらに備える上記(1)から(3)までのいずれかに記載の復号装置。
(5)
 前記アクセス部は、前記メディアセグメント特定部により特定された前記Web Resourceにランダムアクセスする
 上記(4)に記載の復号装置。
(6)
 前記イニシャライズセグメントに格納された参照元の前記Item Information Entryには、参照先の前記メディアセグメントのMetaBox内に格納されている前記Item Information Entryにアクセスできるように、前記Web Resourceが配置された前記メディアセグメントに該当するEarliest Presentation Timeを示す情報が記述されており、
 前記アクセス部は、前記Earliest Presentation Timeを示す情報を利用して前記Web Resourceにアクセスする
 上記(1)から(5)までのいずれかに記載の復号装置。
(7)
 前記Earliest Presentation Timeを示す情報は、前記参照元のMetaBox内のDataReferenceBoxのURL(Uniform Resource Locator)として記録されており、
 前記アクセス部は、前記URLを利用して前記Web Resourceにアクセスする
 上記(6)に記載の復号装置。
(8)
 前記URLに記載されている前記Earliest Presentation Time、および、前記配信コンテンツに関する情報に基づいて、アクセスの対象となる前記メディアセグメントを特定するメディアセグメント特定部
 をさらに備え、
 前記アクセス部は、前記メディアセグメント特定部により特定された前記メディアセグメントに格納されたMetaBoxから前記Web Resourceにアクセスする
 上記(7)に記載の復号装置。
(9)
 前記Web Resourceが、所定数の分割データに略均等に分割されて、それぞれの前記分割データが、Earliest Presentation Timeが連続した所定数の前記メディアセグメントに配置されており、
 前記アクセス部は、前記分割データを集めて合成することにより、前記Web Resourceの全体を取得する
 上記(1)から(8)までのいずれかに記載の復号装置。
(10)
 前記イニシャライズセグメントの参照先の前記MetaBoxの前記Item Information Entryに対する前記URLには、前記Web Resourceが分割された所定数の前記分割データが配置された前記メディアセグメントそれぞれの前記Earliest Presentation Timeの範囲情報が含まれており、
 前記アクセス部は、前記範囲情報に該当する前記メディアセグメントにアクセスし、所定数の前記分割データを集めて合成することにより、前記Web Resourceの全体を取得する
 上記(9)に記載の復号装置。
(11)
 1つの前記Web Resourceが所定数の前記分割データに分割されて前記メディアセグメントに配置される場合、所定数の前記メディアセグメントそれぞれには、前記Web Resourceにおける前記分割データが記録されている範囲の前記メディアセグメントにおけるバイトオフセットおよびバイトサイズを示す前記MetaBoxが記録されており、
 前記アクセス部は、前記MetaBoxを利用して前記Web Resourceにアクセスする
 上記(10)に記載の復号装置。
(12)
 前記MetaBoxには、所定数に分割された前記Web Resourceのどの部分を構成するかを示すための、前記Web Resourceにおける前記分割データのバイトオフセットと、前記Web Resourceの全体バイトサイズとが記録される
 上記(11)に記載の復号装置。
(13)
 Web Applicationの起動時に使用される前記Web Resourceと起動時に使用されない前記Web Resourceとが別々の前記メディアセグメントに記録されて伝送される場合に、
 前記MetaBoxのPrimary Item Boxには、最初に起動される前記Web Resourceが指定されるとともに、前記MetaBoxには起動時に必要な他の前記Web Resourceを示す情報が列挙され、
 前記アクセス部は、該当のメディアセグメントから起動時に必要な複数の前記Web Resourceをすべて取得した後に、前記Web Applicationを起動する
 上記(1)から(12)までのいずれかに記載の復号装置。
(14)
 前記Web Resourceの更新または失効されたことを示す情報が、前記Item Information Entryに記録されており、
 前記アクセス部は、前記Item Information Entryに記録されている前記情報に基づいて前記Web Resourceにアクセスする
 上記(1)から(13)までのいずれかに記載の復号装置。
(15)
 前記Web Resourceの更新または失効されたことを示す情報は、HTTP(Hypertext Transfer Protocol)で規定される"Last Modified"および"Expires"ヘッダーに対応する情報である
 上記(14)に記載の復号装置。
(16)
 前記アクセス部は、前記Web Resourceの更新または失効があった場合、前記Item Information Entryに対応するReferenceURLより示されるインターネット上の他の装置から提供されるWeb Resourceにアクセスする
 上記(14)に記載の復号装置。
(17)
 前記アクセス部は、前記Web Resourceの更新または失効があった場合、新たなファイルで前記Web Resourceのキャッシュデータを置き換える
 上記(14)に記載の復号装置。
(18)
 復号装置が、
 配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定された前記メディアセグメントに格納された前記Web Resourceにアクセスすること
 を含む復号方法。
(19)
 復号装置のコンピュータに、
 配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定された前記メディアセグメントに格納された前記Web Resourceにアクセスすること
 を含む復号処理を実行させるためのプログラム。
(20)
 配信コンテンツのWeb Resourceを複数のメディアセグメントに分散して配置するメディアセグメント処理部と、
 前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを、アクセスの対象として特定すべき前記メディアセグメントに格納するセグメントファイル生成部と
 を備える符号化装置。
(21)
 前記配信コンテンツは、MP4ファイルフォーマットであって、
 前記セグメントファイル生成部は、前記Item Information Entryを、前記Meta BoxにおけるInformation Boxに格納する
 上記(20)に記載の符号化装置。
(22)
 前記Item Information Entryは、前記配信コンテンツに用いられる複数のメディアセグメントのMetaBox内のItem Information Entryを間接参照するための情報を含む
 上記(20)または(21)に記載の符号化装置。
(23)
 前記セグメントファイル生成部は、前記イニシャライズセグメントに格納された参照元の前記Item Information Entryに、参照先の前記メディアセグメントのMetaBox内に格納されている前記Item Information Entryにアクセスできるように、前記Web Resourceが配置された前記メディアセグメントに該当するEarliest Presentation Timeを示す情報を記述する
 上記(20)から(22)までのいずれかに記載の符号化装置。
(24)
 前記セグメントファイル生成部は、前記Earliest Presentation Timeを示す情報を、前記参照元のMetaBox内のDataReferenceBoxのURL(Uniform Resource Locator)として記録する
 上記(23)に記載の符号化装置。
(25)
 前記メディアセグメント処理部は、前記Web Resourceが、所定数の分割データに略均等に分割されるように、それぞれの前記分割データが、Earliest Presentation Timeが連続した所定数の前記メディアセグメントに配置する
 上記(20)に記載の符号化装置。
(26)
 前記セグメントファイル生成部は、前記イニシャライズセグメントの参照先の前記MetaBoxの前記Item Information Entryに対する前記URLに、前記Web Resourceが分割された所定数の前記分割データが配置された前記メディアセグメントそれぞれの前記Earliest Presentation Timeの範囲情報を含める
 上記(25)に記載の符号化装置。
(27)
 前記セグメントファイル生成部は、1つの前記Web Resourceが所定数の前記分割データに分割されて前記メディアセグメントに配置される場合、所定数の前記メディアセグメントそれぞれに、前記Web Resourceにおける前記分割データが記録されている範囲の前記メディアセグメントにおけるバイトオフセットおよびバイトサイズを示す前記MetaBoxを記録する
 上記(26)に記載の符号化装置。
(28)
 前記セグメントファイル生成部は、前記MetaBoxに、所定数に分割された前記Web Resourceのどの部分を構成するかを示すための、前記Web Resourceにおける前記分割データのバイトオフセットと、前記Web Resourceの全体バイトサイズとを記録する
 上記(27)に記載の符号化装置。
(29)
 Web Applicationの起動時に使用される前記Web Resourceと起動時に使用されない前記Web Resourceとが別々の前記メディアセグメントに記録されて伝送される場合に、
 前記セグメントファイル生成部は、前記MetaBoxのPrimary Item Boxに、最初に起動される前記Web Resourceを指定するとともに、前記MetaBoxには起動時に必要な他の前記Web Resourceを示す情報を列挙する
 上記(20)に記載の符号化装置。
(30)
 前記セグメントファイル生成部は、前記Web Resourceの更新または失効されたことを示す情報を、前記Item Information Entryに記録する
 上記(20)に記載の符号化装置。
(31)
 前記Web Resourceの更新または失効されたことを示す情報は、HTTP(Hypertext Transfer Protocol)で規定される"Last Modified"および"Expires"ヘッダーに対応する情報である
 上記(30)に記載の符号化装置。
(32)
 配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定された前記メディアセグメントに格納された前記Web Resourceを配信する
 サーバ装置。
(33)
 前記配信コンテンツは、MP4ファイルフォーマットであって、
 前記Item Information Entryは、前記Meta BoxにおけるInformation Boxに格納される
 上記(32)に記載のサーバ装置。
(34)
 前記配信コンテンツに用いられる複数のメディアセグメントのMetaBox内のItem Information Entryを間接参照するための情報を含む前記Item Information Entryを参照して特定される前記Web Resourceを配信する
 上記(32)に記載のサーバ装置。
(35)
 前記イニシャライズセグメントに格納された参照元の前記Item Information Entryには、参照先の前記メディアセグメントのMetaBox内に格納されている前記Item Information Entryにアクセスできるように、前記Web Resourceが配置された前記メディアセグメントに該当するEarliest Presentation Timeを示す情報が記述されており、
 前記Item Information Entryを参照して特定され、アクセスされる前記Web Resourceを配信する
 上記(32)に記載のサーバ装置。
(36)
 前記Earliest Presentation Timeを示す情報は、前記参照元のMetaBox内のDataReferenceBoxのURL(Uniform Resource Locator)として記録されており、
 前記URLを利用してアクセスされる前記Web Resourceを配信する
 上記(35)に記載のサーバ装置。
(37)
 前記URLに記載されている前記Earliest Presentation Time、および、前記配信コンテンツに関する情報に基づいて特定され、アクセスされる前記Web Resourceを配信する
 上記(36)に記載のサーバ装置。
(38)
 所定数の分割データに略均等に分割されて、それぞれの前記分割データが、Earliest Presentation Timeが連続した所定数の前記メディアセグメントに配置されている前記Web Resourceを配信する
 上記(32)に記載のサーバ装置。
(39)
 前記イニシャライズセグメントの参照先の前記MetaBoxの前記Item Information Entryに対する前記URLには、前記Web Resourceが分割された所定数の前記分割データが配置された前記メディアセグメントそれぞれの前記Earliest Presentation Timeの範囲情報が含まれており、
 前記範囲情報に該当する前記メディアセグメントにアクセスされる前記Web Resourceを配信する
 上記(38)に記載のサーバ装置。
(40)
 1つの前記Web Resourceが所定数の前記分割データに分割されて前記メディアセグメントに配置される場合、所定数の前記メディアセグメントそれぞれには、前記Web Resourceにおける前記分割データが記録されている範囲の前記メディアセグメントにおけるバイトオフセットおよびバイトサイズを示す前記MetaBoxが記録されており、
 前記MetaBoxを利用してアクセスされる前記Web Resourceを配信する
 上記(39)に記載のサーバ装置。
(41)
 前記MetaBoxには、所定数に分割された前記Web Resourceのどの部分を構成するかを示すための、前記Web Resourceにおける前記分割データのバイトオフセットと、前記Web Resourceの全体バイトサイズとが記録される
 上記(39)に記載のサーバ装置。
(42)
 Web Applicationの起動時に使用される前記Web Resourceと起動時に使用されない前記Web Resourceとが別々の前記メディアセグメントに記録されて伝送される場合に、
 前記MetaBoxのPrimary Item Boxには、最初に起動される前記Web Resourceが指定されるとともに、前記MetaBoxには起動時に必要な他の前記Web Resourceを示す情報が列挙され、
 該当のメディアセグメントから起動時に必要な複数の前記Web Resourceを配信する
 上記(32)に記載のサーバ装置。
(43)
 前記Web Resourceの更新または失効されたことを示す情報が、前記Item Information Entryに記録されており、
 前記Item Information Entryに記録されている前記情報に基づいてアクセスされる前記Web Resourceを配信する
 上記(42)に記載のサーバ装置。
(44)
 前記Web Resourceの更新または失効されたことを示す情報は、HTTP(Hypertext Transfer Protocol)で規定される"Last Modified"および"Expires"ヘッダーに対応する情報である
 上記(43)に記載のサーバ装置。
<Example of combination of configurations>
Note that the present technology can also have the following configurations.
(1)
The Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed A decryption apparatus comprising: an access unit for accessing the Web Resource stored in a media segment.
(2)
The delivery content is an MP4 file format, and
The decryption apparatus according to (1), wherein the Item Information Entry is stored in an Information Box in the Meta Box.
(3)
The decryption apparatus according to (1) or (2), wherein the Item Information Entry includes information for indirectly referring to Item Information Entry in the MetaBox of the plurality of media segments used for the delivery content.
(4)
The decryption apparatus according to any one of (1) to (3), further comprising: a media segment identification unit that identifies the media segment in which the Web Resource to be accessed is arranged.
(5)
The decryption apparatus according to (4), wherein the access unit randomly accesses the Web Resource identified by the media segment identification unit.
(6)
In the Item Information Entry of the reference source stored in the initialization segment, the media on which the Web Resource is arranged so that the Item Information Entry stored in the MetaBox of the media segment of the reference destination can be accessed Information indicating the Earliest Presentation Time applicable to the segment is described,
The decryption apparatus according to any one of (1) to (5), wherein the access unit accesses the Web Resource using information indicating the Earliest Presentation Time.
(7)
The information indicating the Earliest Presentation Time is recorded as a URL (Uniform Resource Locator) of the DataReferenceBox in the MetaBox of the reference source,
The decryption apparatus according to (6), wherein the access unit accesses the Web Resource using the URL.
(8)
A media segment identification unit that identifies the media segment to be accessed based on the Earliest Presentation Time described in the URL and information on the delivery content,
The decryption apparatus according to (7), wherein the access unit accesses the Web Resource from a MetaBox stored in the media segment identified by the media segment identification unit.
(9)
The Web Resource is divided substantially equally into a predetermined number of divided data, and each of the divided data is arranged in a predetermined number of the media segments in which Earliest Presentation Time is continuous,
The decryption apparatus according to any one of (1) to (8), wherein the access unit acquires the entire Web Resource by collecting and combining the divided data.
(10)
In the URL for the Item Information Entry of the MetaBox referred to by the initialization segment, range information of the Earliest Presentation Time of each of the media segments in which a predetermined number of divided data pieces into which the Web Resource is divided is arranged Included,
The decoding apparatus according to (9), wherein the access unit acquires the entire Web Resource by accessing the media segment corresponding to the range information, collecting a predetermined number of pieces of divided data, and combining them.
(11)
In the case where one Web Resource is divided into a predetermined number of divided data and arranged in the media segment, each of the predetermined number of media segments is within the range in which the divided data in the Web Resource is recorded. The MetaBox indicating the byte offset and byte size in the media segment is recorded,
The decryption apparatus according to (10), wherein the access unit accesses the Web Resource using the MetaBox.
(12)
In the MetaBox, a byte offset of the divided data in the Web Resource and an entire byte size of the Web Resource are recorded to indicate which part of the Web Resource divided into a predetermined number is configured. The decoding device according to (11) above.
(13)
When the Web Resource used when launching a Web Application and the Web Resource not used when launching are recorded and transmitted in separate Media Segments,
In the Primary Item Box of the MetaBox, the Web Resource to be activated first is specified, and in the Meta Box, information indicating the other Web Resources necessary at the time of activation is listed.
The decryption unit according to any one of (1) to (12), wherein the access unit activates the Web Application after acquiring all of the plurality of Web Resources required at startup from the corresponding media segment.
(14)
Information indicating that the Web Resource has been updated or revoked is recorded in the Item Information Entry,
The decryption apparatus according to any one of (1) to (13), wherein the access unit accesses the Web Resource based on the information recorded in the Item Information Entry.
(15)
The decryption device according to (14), wherein the information indicating that the Web Resource has been updated or revoked is information corresponding to “Last Modified” and “Expires” headers defined by HTTP (Hypertext Transfer Protocol).
(16)
The access unit accesses the Web Resource provided from another device on the Internet indicated by the Reference URL corresponding to the Item Information Entry, when the Web Resource is updated or expired. Decoding device.
(17)
The decryption apparatus according to (14), wherein the access unit replaces cache data of the Web Resource with a new file when there is an update or revocation of the Web Resource.
(18)
The decryption device
The Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed A decryption method comprising: accessing the Web Resource stored in a media segment.
(19)
To the computer of the decryption device
The Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed A program for executing decryption processing including accessing the Web Resource stored in a media segment.
(20)
A media segment processing unit that distributes and arranges web resources of distribution content into a plurality of media segments;
A segment file generation unit which stores Item Information Entry stored in the MetaBox of an initialization segment used in the distribution content in the media segment to be specified as an access target.
(21)
The delivery content is an MP4 file format, and
The encoding apparatus according to (20), wherein the segment file generation unit stores the Item Information Entry in an Information Box in the Meta Box.
(22)
The encoding apparatus according to (20) or (21), wherein the Item Information Entry includes information for indirectly referring to Item Information Entry in a MetaBox of a plurality of media segments used for the delivery content.
(23)
The Web resource so that the segment file generation unit can access the Item Information Entry stored in the MetaBox of the media segment to be referred to in the Item Information Entry of the reference source stored in the initialization segment. The coding apparatus according to any one of the above (20) to (22), which describes information indicating Earliest Presentation Time that corresponds to the media segment in which is placed.
(24)
The encoding apparatus according to (23), wherein the segment file generation unit records the information indicating the Earliest Presentation Time as a URL (Uniform Resource Locator) of a DataReferenceBox in the MetaBox of the reference source.
(25)
The media segment processing unit arranges each of the divided data in a predetermined number of media segments in which Earliest Presentation Time is continuous such that the Web Resource is divided substantially equally into the predetermined number of divided data. The encoding apparatus as described in (20).
(26)
The segment file generation unit is configured to associate the Earliest of each of the media segments in which a predetermined number of divided data pieces into which the Web Resource is divided is arranged in the URL for the Item Information Entry of the MetaBox referred to by the initialization segment. The encoding device according to (25), including range information of Presentation Time.
(27)
The segment file generation unit records the divided data in the Web Resource in each of the predetermined number of media segments when one of the Web Resources is divided into the predetermined number of divided data and arranged in the media segment. The encoding apparatus according to (26), which records the MetaBox indicating a byte offset and a byte size in the media segment in the range.
(28)
The segment file generation unit is configured to indicate, in the MetaBox, a byte offset of the divided data in the Web Resource and an entire byte of the Web Resource to indicate which part of the Web Resource divided into a predetermined number. The encoding device according to (27), which records the size.
(29)
When the Web Resource used when launching a Web Application and the Web Resource not used when launching are recorded and transmitted in separate Media Segments,
The segment file generation unit designates, in the Primary Item Box of the MetaBox, the Web Resource to be activated first, and enumerates, in the Meta Box, information indicating the other Web Resources necessary for activation. The encoding device as described in 2.).
(30)
The encoding apparatus according to (20), wherein the segment file generation unit records, in the Item Information Entry, information indicating that the Web Resource has been updated or revoked.
(31)
The information indicating that the Web Resource has been updated or revoked is the information corresponding to the "Last Modified" and "Expires" headers defined in HTTP (Hypertext Transfer Protocol). The encoding apparatus according to (30) above .
(32)
The Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed A server apparatus for distributing the Web Resource stored in a media segment.
(33)
The delivery content is an MP4 file format, and
The server apparatus according to (32), wherein the Item Information Entry is stored in an Information Box in the Meta Box.
(34)
Delivering the Web Resource specified with reference to the Item Information Entry including information for indirectly referencing Item Information Entry in the MetaBox of a plurality of media segments used for the delivery content described in (32) above Server device.
(35)
In the Item Information Entry of the reference source stored in the initialization segment, the media on which the Web Resource is arranged so that the Item Information Entry stored in the MetaBox of the media segment of the reference destination can be accessed Information indicating the Earliest Presentation Time applicable to the segment is described,
The server apparatus according to (32), which delivers the Web Resource specified and accessed with reference to the Item Information Entry.
(36)
The information indicating the Earliest Presentation Time is recorded as a URL (Uniform Resource Locator) of the DataReferenceBox in the MetaBox of the reference source,
The server apparatus according to (35), which delivers the Web Resource accessed using the URL.
(37)
The server apparatus according to (36), which distributes the Web Resource that is identified and accessed based on the Earliest Presentation Time described in the URL and information related to the distribution content.
(38)
The web resource is divided substantially equally into a predetermined number of divided data, and each of the divided data is arranged in a predetermined number of the media segments in which Earliest Presentation Time is continuous. Server device.
(39)
In the URL for the Item Information Entry of the MetaBox referred to by the initialization segment, range information of the Earliest Presentation Time of each of the media segments in which a predetermined number of divided data pieces into which the Web Resource is divided is arranged Included,
The server apparatus according to (38), which distributes the Web Resource accessed to the media segment corresponding to the range information.
(40)
In the case where one Web Resource is divided into a predetermined number of divided data and arranged in the media segment, each of the predetermined number of media segments is within the range in which the divided data in the Web Resource is recorded. The MetaBox indicating the byte offset and byte size in the media segment is recorded,
The server apparatus according to (39), which delivers the Web Resource accessed using the MetaBox.
(41)
In the MetaBox, a byte offset of the divided data in the Web Resource and an entire byte size of the Web Resource are recorded to indicate which part of the Web Resource divided into a predetermined number is configured. The server apparatus according to (39).
(42)
When the Web Resource used when launching a Web Application and the Web Resource not used when launching are recorded and transmitted in separate Media Segments,
In the Primary Item Box of the MetaBox, the Web Resource to be activated first is specified, and in the Meta Box, information indicating the other Web Resources necessary at the time of activation is listed.
The server apparatus according to (32), which distributes the plurality of Web Resources required at the time of startup from the corresponding media segment.
(43)
Information indicating that the Web Resource has been updated or revoked is recorded in the Item Information Entry,
The server apparatus according to (42), which distributes the Web Resource accessed based on the information recorded in the Item Information Entry.
(44)
The server device according to (43), wherein the information indicating that the Web Resource has been updated or revoked is information corresponding to “Last Modified” and “Expires” headers defined by HTTP (Hypertext Transfer Protocol).
 なお、本実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。 The present embodiment is not limited to the above-described embodiment, and various modifications can be made without departing from the scope of the present disclosure. Further, the effects described in the present specification are merely examples and are not limited, and other effects may be present.
 11 クライアント端末, 12 ウェブエンジン, 13 A/Vプレイヤ, 14 画像重畳部, 15 音声混成部, 16 ディスプレイ, 17 スピーカ, 21 ネットワーク配信システム, 22 ネットワーク, 23 サーバ装置, 24 配信データ生成装置, 31 復号部, 32 メディアセグメント特定部, 33 Web Resourceアクセス部, 41 符号化部, 42 セグメントファイル生成部, 43 メディアセグメント処理部 DESCRIPTION OF SYMBOLS 11 Client terminal, 12 web engine, 13 A / V player, 14 image superimposition part, 15 audio hybrid part, 16 display, 17 speaker, 21 network delivery system, 22 network, 23 server apparatus, 24 delivery data generation apparatus, 31 decoding Part, 32 Media segment identification part, 33 Web Resource access part, 41 Encoding part, 42 Segment file generator, 43 Media segment processing part

Claims (19)

  1.  配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定された前記メディアセグメントに格納された前記Web Resourceにアクセスするアクセス部
     を備える復号装置。
    The Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed A decryption apparatus comprising: an access unit for accessing the Web Resource stored in a media segment.
  2.  前記Item Information Entryは、前記Meta BoxにおけるInformation Boxに格納される
     請求項1に記載の復号装置。
    The decoding device according to claim 1, wherein the Item Information Entry is stored in an Information Box in the Meta Box.
  3.  前記Item Information Entryは、前記配信コンテンツに用いられる複数の前記メディアセグメントのMetaBox内のItem Information Entryを間接参照するための情報を含む
     請求項1に記載の復号装置。
    The decryption apparatus according to claim 1, wherein the Item Information Entry includes information for indirectly referring to Item Information Entry in the MetaBox of the plurality of media segments used for the delivery content.
  4.  アクセスの対象となる前記Web Resourceが配置されている前記メディアセグメントを特定するメディアセグメント特定部
     をさらに備える請求項1に記載の復号装置。
    The decoding apparatus according to claim 1, further comprising: a media segment identification unit that identifies the media segment in which the Web resource to be accessed is arranged.
  5.  前記アクセス部は、前記メディアセグメント特定部により特定された前記Web Resourceにランダムアクセスする
     請求項4に記載の復号装置。
    The decoding device according to claim 4, wherein the access unit randomly accesses the Web Resource identified by the media segment identification unit.
  6.  前記イニシャライズセグメントに格納された参照元の前記Item Information Entryには、参照先の前記メディアセグメントのMetaBox内に格納されている前記Item Information Entryにアクセスできるように、前記Web Resourceが配置された前記メディアセグメントに該当するEarliest Presentation Timeを示す情報が記述されており、
     前記アクセス部は、前記Earliest Presentation Timeを示す情報を利用して前記Web Resourceにアクセスする
     請求項1に記載の復号装置。
    In the Item Information Entry of the reference source stored in the initialization segment, the media on which the Web Resource is arranged so that the Item Information Entry stored in the MetaBox of the media segment of the reference destination can be accessed Information indicating the Earliest Presentation Time applicable to the segment is described,
    The decryption apparatus according to claim 1, wherein the access unit accesses the Web resource using information indicating the Earliest Presentation Time.
  7.  前記Earliest Presentation Timeを示す情報は、前記参照元のMetaBox内のDataReferenceBoxのURL(Uniform Resource Locator)として記録されており、
     前記アクセス部は、前記URLを利用して前記Web Resourceにアクセスする
     請求項6に記載の復号装置。
    The information indicating the Earliest Presentation Time is recorded as a URL (Uniform Resource Locator) of the DataReferenceBox in the MetaBox of the reference source,
    The decryption apparatus according to claim 6, wherein the access unit accesses the Web Resource using the URL.
  8.  前記URLに記載されている前記Earliest Presentation Time、および、前記配信コンテンツに関する情報に基づいて、アクセスの対象となる前記メディアセグメントを特定するメディアセグメント特定部
     をさらに備え、
     前記アクセス部は、前記メディアセグメント特定部により特定された前記メディアセグメントに格納されたMetaBoxから前記Web Resourceにアクセスする
     請求項7に記載の復号装置。
    A media segment identification unit that identifies the media segment to be accessed based on the Earliest Presentation Time described in the URL and information on the delivery content,
    The decryption apparatus according to claim 7, wherein the access unit accesses the Web Resource from a MetaBox stored in the media segment identified by the media segment identification unit.
  9.  前記Web Resourceが、所定数の分割データに略均等に分割されて、それぞれの前記分割データが、Earliest Presentation Timeが連続した所定数の前記メディアセグメントに配置されており、
     前記アクセス部は、前記分割データを集めて合成することにより、前記Web Resourceの全体を取得する
     請求項1に記載の復号装置。
    The Web Resource is divided substantially equally into a predetermined number of divided data, and each of the divided data is arranged in a predetermined number of the media segments in which Earliest Presentation Time is continuous,
    The decoding apparatus according to claim 1, wherein the access unit acquires the entire Web Resource by collecting and combining the divided data.
  10.  前記イニシャライズセグメントの参照先の前記MetaBoxの前記Item Information Entryに対する前記URLには、前記Web Resourceが分割された所定数の前記分割データが配置された前記メディアセグメントそれぞれの前記Earliest Presentation Timeの範囲情報が含まれており、
     前記アクセス部は、前記範囲情報に該当する前記メディアセグメントにアクセスし、所定数の前記分割データを集めて合成することにより、前記Web Resourceの全体を取得する
     請求項9に記載の復号装置。
    In the URL for the Item Information Entry of the MetaBox referred to by the initialization segment, range information of the Earliest Presentation Time of each of the media segments in which a predetermined number of divided data pieces into which the Web Resource is divided is arranged Included,
    The decryption apparatus according to claim 9, wherein the access unit acquires the entire Web Resource by accessing the media segment corresponding to the range information and collecting and combining a predetermined number of the divided data.
  11.  1つの前記Web Resourceが所定数の前記分割データに分割されて前記メディアセグメントに配置される場合、所定数の前記メディアセグメントそれぞれには、前記Web Resourceにおける前記分割データが記録されている範囲の前記メディアセグメントにおけるバイトオフセットおよびバイトサイズを示す前記MetaBoxが記録されており、
     前記アクセス部は、前記MetaBoxを利用して前記Web Resourceにアクセスする
     請求項10に記載の復号装置。
    In the case where one Web Resource is divided into a predetermined number of divided data and arranged in the media segment, each of the predetermined number of media segments is within the range in which the divided data in the Web Resource is recorded. The MetaBox indicating the byte offset and byte size in the media segment is recorded,
    The decryption apparatus according to claim 10, wherein the access unit accesses the Web Resource using the MetaBox.
  12.  前記MetaBoxには、所定数に分割された前記Web Resourceのどの部分を構成するかを示すための、前記Web Resourceにおける前記分割データのバイトオフセットと、前記Web Resourceの全体バイトサイズとが記録される
     請求項11に記載の復号装置。
    In the MetaBox, a byte offset of the divided data in the Web Resource and an entire byte size of the Web Resource are recorded to indicate which part of the Web Resource divided into a predetermined number is configured. The decoding device according to claim 11.
  13.  Web Applicationの起動時に使用される前記Web Resourceと起動時に使用されない前記Web Resourceとが別々の前記メディアセグメントに記録されて伝送される場合に、
     前記MetaBoxのPrimary Item Boxには、最初に起動される前記Web Resourceが指定されるとともに、前記MetaBoxには起動時に必要な他の前記Web Resourceを示す情報が列挙され、
     前記アクセス部は、該当のメディアセグメントから起動時に必要な複数の前記Web Resourceをすべて取得した後に、前記Web Applicationを起動する
     請求項1に記載の復号装置。
    When the Web Resource used when launching a Web Application and the Web Resource not used when launching are recorded and transmitted in separate Media Segments,
    In the Primary Item Box of the MetaBox, the Web Resource to be activated first is specified, and in the Meta Box, information indicating the other Web Resources necessary at the time of activation is listed.
    The decryption apparatus according to claim 1, wherein the access unit activates the Web Application after acquiring all of the plurality of Web Resources required at startup from the corresponding media segment.
  14.  前記Web Resourceの更新または失効されたことを示す情報が、前記Item Information Entryに記録されており、
     前記アクセス部は、前記Item Information Entryに記録されている前記情報に基づいて前記Web Resourceにアクセスする
     請求項1に記載の復号装置。
    Information indicating that the Web Resource has been updated or revoked is recorded in the Item Information Entry,
    The decryption apparatus according to claim 1, wherein the access unit accesses the Web Resource based on the information recorded in the Item Information Entry.
  15.  前記Web Resourceの更新または失効されたことを示す情報は、HTTP(Hypertext Transfer Protocol)で規定される"Last Modified"および"Expires"ヘッダーに対応する情報である
     請求項14に記載の復号装置。
    The decryption apparatus according to claim 14, wherein the information indicating that the Web Resource has been updated or revoked is information corresponding to “Last Modified” and “Expires” headers defined by HTTP (Hypertext Transfer Protocol).
  16.  前記アクセス部は、前記Web Resourceの更新または失効があった場合、前記Item Information Entryに対応するReferenceURLより示されるインターネット上の他の装置から提供されるWeb Resourceにアクセスする
     請求項14に記載の復号装置。
    15. The decryption according to claim 14, wherein the access unit accesses the Web Resource provided from another device on the Internet indicated by the Reference URL corresponding to the Item Information Entry when there is an update or revocation of the Web Resource. apparatus.
  17.  前記アクセス部は、前記Web Resourceの更新または失効があった場合、新たなファイルで前記Web Resourceのキャッシュデータを置き換える
     請求項14に記載の復号装置。
    The decryption apparatus according to claim 14, wherein the access unit replaces the cache data of the Web Resource with a new file when there is an update or revocation of the Web Resource.
  18.  復号装置が、
     配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定された前記メディアセグメントに格納された前記Web Resourceにアクセスすること
     を含む復号方法。
    The decryption device
    The Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed A decryption method comprising: accessing the Web Resource stored in a media segment.
  19.  復号装置のコンピュータに、
     配信コンテンツのWeb Resourceが複数のメディアセグメントに分散して配置されていて、前記配信コンテンツで用いられるイニシャライズセグメントのMetaBox内に格納されたItem Information Entryを参照し、アクセスの対象となる特定された前記メディアセグメントに格納された前記Web Resourceにアクセスすること
     を含む復号処理を実行させるためのプログラム。
    To the computer of the decryption device
    The Web Resource of the distribution content is distributed and arranged in a plurality of media segments, and the Item Information Entry stored in the MetaBox of the initialization segment used in the distribution content is referred to, and the identified target to be accessed A program for executing decryption processing including accessing the Web Resource stored in a media segment.
PCT/JP2018/046020 2017-12-28 2018-12-14 Decoder, decoding method, and program WO2019131200A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-254899 2017-12-28
JP2017254899 2017-12-28

Publications (1)

Publication Number Publication Date
WO2019131200A1 true WO2019131200A1 (en) 2019-07-04

Family

ID=67067241

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/046020 WO2019131200A1 (en) 2017-12-28 2018-12-14 Decoder, decoding method, and program

Country Status (2)

Country Link
TW (1) TW201937938A (en)
WO (1) WO2019131200A1 (en)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
QUALCOMM INCORPORATED: "Serlnter: Status of MPEG Interactivity Track", 3GPP TSG-SA4 MEETING #95 S4-170789, 9 October 2017 (2017-10-09), XP051348627, Retrieved from the Internet <URL:http://www.3gpp.org/ftp/TSG_SA/WG4_CODEC/TSGS4_95/Docs/S4-170789.zip(S4-170789.doc> [retrieved on 20190125] *

Also Published As

Publication number Publication date
TW201937938A (en) 2019-09-16

Similar Documents

Publication Publication Date Title
US10523726B2 (en) Real-time or near real-time streaming
US10244272B2 (en) Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
JP5748765B2 (en) Streaming method and apparatus that operates by inserting other contents into main contents
US9426543B1 (en) Server-based video stitching
US8887215B2 (en) Targeted high-value content in HTTP streaming video on demand
US20170171094A1 (en) Playlists for real-time or near real-time streaming
KR101955363B1 (en) Systems and methods for automatically generating top level index files
KR101535366B1 (en) Playlists for real-time or near real-time streaming
ES2528406T3 (en) Method, terminal and server for fast playback called trickplay
JP6088439B2 (en) Apparatus and method for storing and playing back content in multimedia streaming system
US20170195744A1 (en) Live-stream video advertisement system
WO2012096372A1 (en) Content reproduction device, content reproduction method, delivery system, content reproduction program, recording medium, and data structure
KR20140019449A (en) Playlists for real-time or near real-time streaming
TW201123795A (en) System, method and apparatus for dynamic media file streaming
JP2013511201A (en) Data transmission method and apparatus
CN105657443A (en) Live broadcast and time shifting playing method and system
KR102499231B1 (en) Receiving device, sending device and data processing method
US20090024925A1 (en) System and method for creating and distributing derivative media work
KR102085192B1 (en) Rendering time control
WO2017185601A1 (en) Method and device for providing and downloading video
CN104410901A (en) Play method and play device of M3U8 format live stream
JP2022019932A (en) Information processing apparatus and information processing method
CN105992022A (en) On-line recording and downloading method and system
JP2017069636A (en) Information processing device, distribution method and program
US20170180774A1 (en) Methods and Apparatus for Naming Video Content Chunks

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18893538

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18893538

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP