WO2017169727A1 - 情報処理装置および情報処理方法、並びに情報処理システム - Google Patents

情報処理装置および情報処理方法、並びに情報処理システム Download PDF

Info

Publication number
WO2017169727A1
WO2017169727A1 PCT/JP2017/010111 JP2017010111W WO2017169727A1 WO 2017169727 A1 WO2017169727 A1 WO 2017169727A1 JP 2017010111 W JP2017010111 W JP 2017010111W WO 2017169727 A1 WO2017169727 A1 WO 2017169727A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio stream
information processing
premium
file
distribution
Prior art date
Application number
PCT/JP2017/010111
Other languages
English (en)
French (fr)
Inventor
平林 光浩
徹 知念
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to CN201780019077.5A priority Critical patent/CN108886626B/zh
Priority to US16/086,663 priority patent/US10735794B2/en
Priority to JP2018508963A priority patent/JP6977711B2/ja
Publication of WO2017169727A1 publication Critical patent/WO2017169727A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2407Monitoring of transmitted content, e.g. distribution time, number of downloads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26208Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints
    • H04N21/26225Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints involving billing parameters, e.g. priority for subscribers of premium services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error

Definitions

  • the present disclosure relates to an information processing apparatus, an information processing method, and an information processing system, and in particular, an information processing apparatus capable of appropriately scaling a distribution apparatus that distributes an audio stream encoded by a lossless compression method. And an information processing method and an information processing system.
  • the server prepares moving image data groups with different bit rates for one moving image content, and the client requests the moving image data groups of the optimal bit rate according to the situation of the network bandwidth. Streaming delivery is realized.
  • a coding method of moving picture content a coding method in which a bit rate can be predicted in advance is assumed. Specifically, underflow or overflow does not occur in a fixed-size buffer for an audio digital signal A / D (Analog / Digital) converted by PCM (Pulse Code Modulation) as an audio stream encoding method.
  • a non-reversible compression scheme to be encoded into the based on the predicted bit rate, scaling of the server delivering the moving picture content is performed.
  • the DSD method is a method adopted as a recording and reproducing method of Super Audio CD (SA-CD), and is a method based on 1-bit digital sigma modulation. Specifically, in the DSD method, information of an audio analog signal is represented by the density of change points of “1” and “0” using a time axis. Therefore, high resolution recording and reproduction independent of the number of bits can be realized.
  • the patterns of “1” and “0” of the audio digital signal change according to the waveform of the audio analog signal. Therefore, in lossless DSD, which losslessly compresses and encodes an audio digital signal that has been A / D-converted by the DSD method based on the “1” and “0” patterns, the audio after encoding according to the waveform of the audio analog signal The bit generation amount of the digital signal fluctuates. Therefore, it is difficult to predict the bit rate in advance.
  • MPEG-DASH Dynamic Adaptive Streaming over HTTP
  • URL http://mpeg.chiariglione.org/standards/mpeg-dash/media-presentation-description-and-segment-formats/text-isoiec-23009-12012-dam -1)
  • the present disclosure has been made in view of such a situation, and enables appropriate scaling of a distribution apparatus that distributes an audio stream encoded by a lossless compression scheme.
  • the information processing apparatus performs other information processing on the audio stream based on bit rate information including an average value of a predetermined period of a bit rate of the audio stream encoded by the lossless compression method. It is an information processing apparatus provided with the scaling part which performs the scaling of the delivery apparatus delivered to an apparatus.
  • An information processing method corresponds to the information processing apparatus according to the first aspect of the present disclosure.
  • the audio stream is distributed to another information processing apparatus based on bit rate information including an average value of a predetermined period of the bit rate of the audio stream encoded by the lossless compression method.
  • the distribution device is scaled.
  • An information processing system includes a first information processing apparatus, a second information processing apparatus, and a distribution apparatus, and the first information processing apparatus is encoded by a lossless compression method. Configured to perform scaling of the distribution apparatus for distributing the audio stream to the second information processing apparatus, based on bit rate information including an average value of predetermined bit rates of the audio stream for a predetermined period It is a processing system.
  • a first information processing apparatus, a second information processing apparatus, and a distribution apparatus are provided, and are encoded by the first information processing apparatus in a lossless compression system. Scaling of the distribution apparatus for distributing the audio stream to the second information processing apparatus is performed based on bit rate information including an average value of a predetermined period of bit rates of the audio stream.
  • the information processing apparatus can be realized by causing a computer to execute a program.
  • a program to be executed by a computer can be provided by transmitting via a transmission medium or recording on a recording medium.
  • FIG. 1 is a block diagram showing a configuration example of a first embodiment of an information processing system to which the present disclosure is applied. It is a figure explaining a DSD method. It is a block diagram which shows the structural example of the file production
  • FIG. 1 is a block diagram showing a configuration example of a first embodiment of an information processing system to which the present disclosure is applied.
  • the information processing system 10 of FIG. 1 includes a file generation device 11, a management server 12, an original distribution server 13 (information processing device), premium servers 14-1 to 14-L (distribution devices), and semi premium servers 15-1 to 15 -M (distribution apparatus), on-demand servers 16-1 to 16-N (distribution apparatus), premium clients 17-1 to 17-P (information processing apparatus), quasi-premium clients 18-1 to 18-Q (information processing Devices), on-demand clients 19-1 to 19-R (information processing devices), web server 20, and charging server 21.
  • L to N and P to R are integers of 2 or more, but may be 1. Further, hereinafter, when it is not necessary to distinguish each of the premium servers 14-1 to 14-L in particular, they are collectively referred to as the premium server 14. Similarly, semi-premium servers 15-1 to 15-M, on-demand servers 16-1 to 16-N, premium clients 17-1 to 17-P, quasi-premium clients 18-1 to 18-Q, on-demand client 19 The -1 to 19-R are collectively referred to as a quasi-premium server 15, an on-demand server 16, a premium client 17, a quasi-premium client 18, and an on-demand client 19.
  • the file of the moving image content generated by the file generation device 11 is distributed to the premium client 17 by the premium service, distributed to the quasi-premium client 18 by the quasi-premium service, and on-demand client 19 by the on-demand service. Delivered to
  • the premium service is a service that permits the start of delivery of a file of moving image content from the acquisition start time (event occurrence time) of the moving image content to the acquisition end time. This premium service allows the viewer to view live video content live.
  • the semi-premium service is a service that permits distribution of a file of moving image content after a predetermined time has elapsed from the acquisition start time of the moving image content.
  • this quasi-premium service the viewer can view live video content live after a predetermined time has elapsed from the acquisition start time of the video content.
  • the on-demand service is a service that permits distribution of files of stored moving image content after acquisition of moving image content is completed. With this on-demand service, the viewer can view the moving image content after the acquisition of the moving image content is completed.
  • the file generation device 11 of the information processing system 10 A / D converts a video analog signal and an audio analog signal of moving image content to generate a video digital signal and an audio digital signal. Then, the file generation device 11 encodes a signal such as a video digital signal or an audio digital signal of moving image content at a plurality of bit rates according to a predetermined encoding method to generate an encoded stream.
  • the encoding method of the audio digital signal is a lossless DSD method or an MPEG-4 (Moving Picture Experts Group phase 4) method.
  • the MPEG-4 system is a system that irreversibly compresses an audio digital signal A / D converted by the PCM system so that underflow or overflow does not occur in a fixed-size buffer.
  • the file generator 11 files the generated encoded stream in units of time, which is called a segment, for several seconds to 10 seconds, for each bit rate.
  • the file generation device 11 uploads the segment file generated as a result to the management server 12.
  • the file generation device 11 also generates an MPD (Media Presentation Description) file (management file) for managing moving image content, and uploads the file to the management server 12.
  • MPD Media Presentation Description
  • management file management file
  • the management server 12 stores the MPD file and the segment file uploaded by the file generation device 11.
  • the management server 12 extracts the bit rate information and the maximum bit rate contained in the MPD file.
  • the bit rate information is information representing an actual bit rate of an audio stream which is a coded stream of an audio digital signal stored in a segment file, and includes an average value of a predetermined period of the bit rate.
  • the maximum bit rate is the maximum value that can be taken as the bit rate of the audio stream.
  • the management server 12 acquires the number of distribution clients and the distribution start time from the web server 20.
  • the number of distribution clients is the number of premium clients 17, quasi-premium clients 18, and on-demand clients 19 that have requested the start of distribution.
  • the delivery start time is the time when the delivery start of each premium client 17, each quasi-premium client 18, and each on-demand client 19 is requested.
  • the management server 12 transmits the bit rate information, the maximum bit rate, the number of distribution clients, and the distribution start time to the original distribution server 13 as an HTTP (HyperText Transfer Protocol) header or a URL (Uniform Resource Locator) query parameter.
  • the management server 12 also transmits the stored MPD file and segment file to the original distribution server 13.
  • the original distribution server 13 stores the MPD file and the segment file transmitted from the management server 12.
  • the original distribution server 13 determines the maximum bit rate transmitted from the management server 12 as the expected bandwidth of the premium service.
  • the original distribution server 13 uses L premium servers necessary to guarantee the communication of the audio stream in the assumed bandwidth to the allowed number of premium clients 17 based on the allowed number of premium clients 17 and the estimated bandwidth.
  • the original distribution server 13 has a bit rate smaller than the maximum bit rate based on the maximum bit rate and predetermined bit rate information from the acquisition start time of the moving image content to the time when distribution by the quasi-premium service is permitted.
  • the expected bandwidth of the quasi-premium service Based on the allowable number of quasi-premium clients 18 and the expected bandwidth, the original distribution server 13 uses M pieces of M necessary to guarantee the communication of audio streams in the expected bandwidth to the allowable number of quasi-premium clients 18. Prepare the semi-premium server 15.
  • the original distribution server 13 determines the average value of the actual bit rates represented by the predetermined bit rate information as the expected bandwidth of the on demand service.
  • the original distribution server 13 prepares N on demand servers 16 necessary for guaranteeing the communication of the audio stream in the assumed bandwidth to a predetermined number of on demand clients 19.
  • the original distribution server 13 (scaling unit) performs scaling of the premium server 14 based on bit rate information, the number of distribution clients of the premium service (the number of premium clients 17 requesting the start of distribution), and the distribution start time. Do.
  • the original distribution server 13 transmits the stored MPD file and segment file to the scaled premium server 14, that is, the premium server 14 to be used among the L premium servers 14.
  • the original distribution server 13 performs scaling of the semi-premium server 15 based on bit rate information, the number of distribution clients of the quasi-premium service (the number of quasi-premium clients 18 requesting the start of distribution), and the distribution start time. .
  • the original distribution server 13 transmits the stored MPD file and segment file to the scaled quasi-premium server 15, that is, the quasi-premium server 15 used among the M quasi-premium servers 15.
  • the original distribution server 13 performs scaling of the on-demand server 16 based on the number of distribution clients of the on-demand service (the number of on-demand clients 19 that have requested distribution start) and the distribution start time.
  • the original distribution server 13 transmits the stored MPD file and segment file to the on demand server 16 after scaling, that is, the on demand server 16 used among the N on demand servers 16.
  • the scaled premium server 14 stores the MPD file and segment file transmitted from the original distribution server 13 and functions as a DASH server.
  • the scaled premium server 14 delivers the stored MPD file and segment file to the premium client 17 by the premium service.
  • the premium server 14 after the scaling acquires the premium license which is the license of the premium service at the start of acquisition of the moving image content, that is, at the start of generation of the MPD file and segment file of the moving image content. Allow delivery of MPD files and segment files to
  • the right information necessary for acquiring and reproducing moving image content is described as a license.
  • the license acquires moving image content such as information used for user authentication, information used for user account and device authentication, information used for acquiring a token generated by server-side device authentication protocol or user authentication protocol, etc. It shall be the necessary rights information.
  • the license may be rights information necessary for reproducing moving image content such as a combination key for reproducing moving image content protected by DRM (Digital Rights Management) and usage. Then, if there is a request from the premium client 17 between the acquisition start time of the moving image content and the acquisition end time, the premium server 14 after scaling premiums the stored MPD file and segment file via the Internet Deliver to the client 17.
  • the quasi-premium server 15 after scaling stores the MPD file and segment file transmitted from the original distribution server 13 and functions as a DASH server.
  • the scaled semi-premium server 15 delivers the stored MPD file and segment file to the semi-premium client 18 with the semi-premium service.
  • a predetermined time elapses after the acquisition of moving image content is started, that is, after a predetermined time elapses after generation of an MPD file or segment file of moving image content is started.
  • the quasi-premium server 15 after scaling receives a request from the quasi-premium client 18 between a predetermined time after the acquisition start time of the moving image content and the acquisition end time, the stored MPD file and segment file are stored. Are delivered to the semi-premium client 18 via the Internet.
  • the on-demand server 16 after scaling stores the MPD file and segment file transmitted from the original distribution server 13 and functions as a DASH server.
  • the scaled on-demand server 16 delivers the stored MPD file and segment file to the on-demand client 19 by the on-demand service.
  • the on-demand server 16 after scaling acquires the on-demand license which is a license of the on-demand service after the acquisition of the moving image content is completed, that is, after the generation of the MPD file or segment file of the moving image content is completed. Allow delivery of MPD files and segment files to the on-demand client 19. Then, the on-demand server 16 after scaling distributes the stored MPD file and segment file to the on-demand client 19 via the Internet when there is a request from the on-demand client 19 after the acquisition of the moving image content is completed. .
  • the premium client 17 is a DASH client that requests the web server 20 to deliver a premium service.
  • the premium client 17 acquires premium server information and a premium license specifying the premium server 14 transmitted from the web server 20 in response to the request.
  • the premium client 17 requests the web server 20 to start distribution of the moving image content, and requests the premium server 14 to distribute the MPD file based on the premium server information and the premium license.
  • the premium client 17 receives the MPD file delivered from the premium server 14 in response to the request, and delivers the segment file to the premium server 14 based on the MPD file, premium server information, and premium license. To request. Then, the premium client 17 receives the segment file distributed from the premium server 14 in response to the request.
  • the premium client 17 reproduces the received segment file. Specifically, the premium client 17 decodes the encoded stream stored in the received segment file. The premium client 17 displays an image on a display device such as a display (not shown) based on a video digital signal obtained as a result of decoding. Further, the premium client 17 D / A converts the audio digital signal obtained as a result of the decoding, and based on the audio analog signal obtained as a result, outputs an audio to an output unit such as a speaker (not shown).
  • the semi-premium client 18 is a DASH client that requests the web server 20 to deliver a semi-premium service.
  • the semi-premium client 18 acquires quasi-premium server information for identifying the quasi-premium server 15 and the quasi-premium license transmitted from the web server 20 in response to the request.
  • the semi-premium client 18 requests the web server 20 to start distribution of the moving image content, and requests the quasi-premium server 15 to distribute the MPD file based on the semi-premium server information and the quasi-premium license.
  • the semi premium client 18 receives the MPD file delivered from the quasi premium server 15 in response to the request, and based on the MPD file, the quasi premium server information, and the quasi premium license, to the quasi premium server 15 Request delivery of segment files. Then, the semi-premium client 18 receives the segment file delivered from the quasi-premium server 15 in response to the request, and reproduces the segment file in the same manner as the premium client 17.
  • the on-demand client 19 is a DASH client that requests the web server 20 to deliver on-demand services.
  • the on-demand client 19 acquires on-demand server information and an on-demand license that specify the on-demand server 16 in response to the request.
  • the on-demand client 19 requests the web server 20 to start distributing the moving image content, and requests the on-demand server 16 to distribute the MPD file based on the on-demand server information and the on-demand license. Also, the on-demand client 19 receives the MPD file distributed from the on-demand server 16 in response to the request, and the on-demand server 16 receives the MPD file, the on-demand server information, and the on-demand license. Request delivery of segment files. Then, the on-demand client 19 receives the segment file delivered from the on-demand server 16 in response to the request, and reproduces the segment file in the same manner as the premium client 17.
  • the web server 20 In response to the request from the premium client 17, the web server 20 requests the charging server 21 to charge the premium client 17 for the premium service charge.
  • the web server 20 generates premium server information and a premium license in response to the notification of completion of the charging process supplied from the charging server 21, and transmits the premium server information and the premium license to the premium client 17.
  • the web server 20 requests the charging server 21 to charge the fee for the quasi-premium service to the quasi-premium client 18 in response to the request from the quasi-premium client 18.
  • the web server 20 In response to the notification of the completion of the charging process supplied from the charging server 21, the web server 20 generates the quasi-premium server information and the quasi-premium license, and transmits the information to the quasi-premium client 18.
  • the web server 20 requests the charging server 21 to charge the on-demand client 19 for the charge of the on-demand service.
  • the web server 20 generates the on-demand server information and the on-demand license in response to the notification of the completion of the charging process supplied from the charging server 21, and transmits the on-demand server information and the on-demand license to the on-demand client 19.
  • the web server 20 supplies, to the management server 12, the number of premium clients 17 that have requested the start of distribution of the moving image content and the distribution start time from the acquisition start time of the moving image content to the acquisition end time.
  • the web server 20 manages the number of quasi-premium clients 18 that have requested the start of distribution of the video content and the distribution start time from a predetermined time after the acquisition start time of the video content to the acquisition finish time. Supply to 12.
  • the web server 20 supplies, to the management server 12, the number of on-demand clients 19 that have requested the start of distribution of moving image content after acquisition of moving image content is completed, and the distribution start time.
  • the charging server 21 (charging processing device) performs charging processing of the premium service charge for the premium client 17. Further, the charging server 21 performs charging processing of the fee for the quasi-premium service to the quasi-premium client 18 in response to the request supplied from the web server 20. Furthermore, in response to the request supplied from the web server 20, the charging server 21 charges the on-demand client 19 for the charge of the on-demand service. Charges for charging processing are higher in the order of premium service, quasi-premium service, and on-demand service. When the charging process is completed, the charging server 21 notifies the web server 20 of the completion of the charging process.
  • Communication in the information processing system 10 may be performed wirelessly or in a wired manner.
  • FIG. 2 is a diagram for explaining the DSD method.
  • the horizontal axis of FIG. 2 represents time, and the vertical axis represents the value of each signal.
  • the waveform of the audio analog signal is a sine wave.
  • the value of the audio analog signal at each sampling time is converted to an audio digital signal of fixed number of bits according to the value Be done.
  • the value of the audio analog signal at each sampling time is the audio of the density of the change point of “0” and “1” according to the value It is converted to a digital signal.
  • the greater the value of the audio analog signal the higher the density of change points of the audio digital signal, and the smaller the value of the audio analog signal, the lower the density of change points of the audio digital signal. That is, the patterns of "0" and "1" of the audio digital signal change according to the value of the audio analog signal.
  • the bit generation amount of the audio stream obtained by encoding this audio digital signal according to the lossless DSD method for lossless compression encoding based on the pattern of “0” and “1” varies according to the waveform of the audio analog signal Do. Therefore, it is difficult to predict the bit rate in advance.
  • FIG. 3 is a block diagram showing a configuration example of the file generation device of FIG.
  • the file generation apparatus 11 of FIG. 3 includes an acquisition unit 31, an encoding unit 32, a segment file generation unit 33, an MPD file generation unit 34, and an upload unit 35.
  • the acquisition unit 31 of the file generation device 11 acquires a video analog signal and an audio analog signal of moving image content and performs A / D conversion.
  • the acquisition unit 31 supplies a signal such as a video digital signal or an audio digital signal obtained as a result of A / D conversion, or a signal of moving image content acquired to another to the encoding unit 32.
  • the encoding unit 32 encodes the signals of the moving image content supplied from the acquisition unit 31 at a plurality of bit rates to generate an encoded stream.
  • the encoding unit 32 supplies the generated encoded stream to the segment file generation unit 33.
  • the segment file generation unit 33 files the encoded stream supplied from the encoding unit 32 in units of segments for each bit rate.
  • the segment file generation unit 33 supplies the segment file generated as a result to the upload unit 35.
  • the MPD file generation unit 34 calculates the average value from the integration value of the actual bit rates of the audio stream encoded in the lossless DSD system by the encoding unit 32 for each reference period, thereby increasing the reference period by a predetermined amount. Calculate the average of the actual bit rates of the audio stream of the period.
  • the MPD file generation unit 34 generates, for each reference period, the calculated average value and a predetermined period corresponding to the average value as bit rate information.
  • the MPD file generation unit 34 generates an MPD file including bit rate information, information indicating an encoding method of an audio stream, a maximum bit rate of an audio stream, a bit rate of a video stream which is an encoded stream of a video digital signal, and the like. .
  • the MPD file generation unit 34 supplies the MPD file to the upload unit 35.
  • the upload unit 35 uploads the segment file supplied from the segment file generator 33 and the MPD file supplied from the MPD file generator 34 to the management server 12 shown in FIG.
  • FIG. 4 is a diagram showing a first description example of the MPD file.
  • FIG. 4 for convenience of explanation, among the descriptions of the MPD file, only the descriptions for managing the segment file of the audio stream are illustrated. The same applies to FIGS. 5, 20, and 21 described later.
  • information such as the encoding method and bit rate of moving image content, the size of an image, and the language of audio is hierarchically described and described in an XML format.
  • the MPD file hierarchically includes elements such as Period, Adaptation Set, Adaptation Set, Representation, and Segment Info.
  • moving image content managed by the user is divided by a predetermined time range (for example, a unit such as a program or CM (Commercial)).
  • the period element is described for each divided moving image content.
  • the period element has information such as playback start time of the moving image content, URL (Uniform Resource Locator) of the management server 12 storing the segment file of the moving image content, and MinBuffer Time as information common to the corresponding moving image content.
  • MinBufferTime is information indicating the buffer time of the virtual buffer, and is set to 0 in the example of FIG.
  • the adaptation set element is included in the period element, and groups the presentation elements corresponding to the segment file group of the same encoded stream of the moving image content corresponding to the period element.
  • the presentation elements are grouped, for example, according to the data type of the corresponding segment file group.
  • three representation elements corresponding to each of segment files of three types of audio streams having different bit rates are grouped by one adaptation set element.
  • the adaptation set element has media type, language, application such as subtitles or dubbing, maxBandwidth which is a maximum value of bit rates, MinBandwidth which is a minimum value, and the like as information common to groups of corresponding segment files.
  • a descriptor that indicates whether the audio stream encoding method is a method (hereinafter referred to as a fixed method) that is encoded such that underflow or overflow does not occur in a fixed-size buffer such as the MPEG-4 method.
  • a fixed method a method that is encoded such that underflow or overflow does not occur in a fixed-size buffer such as the MPEG-4 method.
  • the adaptation set element has a SegmentTemplate indicating a rule of segment length and file name of segment file.
  • SegmentTemplate timescale, duration, initialization, and media are described.
  • Timescale is a value representing 1 second
  • duration is a value of segment length when timescale is 1 second.
  • timescale is 44100 and duration is 88200.
  • the segment length is 2 seconds.
  • the initialization is information indicating the rule of the name of the initialization segment file among the segment files of the audio stream.
  • the initialization is "$ Bandwidth $ init.mp4". Therefore, the name of the initialization segment file of the audio stream is obtained by adding init to the Bandwidth of the representation element.
  • “media” is information indicating the rule of the name of the media segment file among the segment files of the audio stream.
  • media is "$ Bandwidth $-$ Number $ .mp4". Therefore, the name of the media segment file of the audio stream is obtained by appending “-” to the Bandwidth of the representation element and sequentially appending the number.
  • the representation element is included in an adaptation set element that groups it, and is described for each segment file group of the same encoded stream of moving image content corresponding to the period element of the upper layer.
  • the representation element has, as information common to the corresponding segment files, Bandwidth indicating the bit rate, AveBandwidth, DurationForAveBandwidth, the size of the image, and the like.
  • the maximum bit rate of the audio stream is described as the bit rate common to the corresponding segment files.
  • the maximum bit rates of the three audio streams are 2.8 Mbps, 5.6 Mbps, and 11.2 Mbps. Accordingly, the bandwidths of the three representation elements are 2800000, 5600000 and 1 1200000, respectively. Also, the MinBandwidth of the adaptation set element is 280,000 and the maxBandwidth is 112,000.
  • AveBandwidth is information indicating an average value of bit rate information of an audio stream corresponding to a representation element
  • DurationForAveBandwidth is information indicating a predetermined period.
  • the MPD file generation unit 34 calculates the average value of the actual bit rates of the audio stream for 600 seconds from the beginning. Therefore, DurationForAveBandwidth which three representation elements have is PT600S which shows 600 seconds.
  • the average value of the actual bit rates for 600 seconds from the beginning of the lossless DSD audio stream having a maximum bit rate of 2.8 Mbps corresponding to the first representation element is 2 Mbps. Therefore, the AveBandwidth of the first representation element is 2000000.
  • the average value of the actual bit rates for 600 seconds from the beginning of the lossless DSD audio stream having a maximum bit rate of 5.6 Mbps corresponding to the second representation element is 4 Mbps. Therefore, the AveBandwidth of the second representation element is 4000000.
  • the average value of actual bit rates for 600 seconds from the beginning of the lossless DSD audio stream having a maximum bit rate of 11.2 Mbps corresponding to the third representation element is 8 Mbps. Therefore, the AveBandwidth of the third representation element is 8000000.
  • the segment info element is included in the representation element and has information on each segment file of the segment file group corresponding to the representation element.
  • FIG. 5 is a diagram showing a second description example of the MPD file.
  • the encoding method of two types of audio streams among three types of audio streams having different bit rates is lossless DSD, and the encoding of one type of audio stream is MPEG-4. .
  • mpeg: DASH: audio: cbr: 2015 AveBandwidth and DurationForAveBandwidth can be described.
  • the MPD files of FIG. 4 and FIG. 5 are compatible with MPD files for which a non-fixed system is not assumed as an audio stream coding system.
  • the MPD files of FIG. 4 and FIG. 5 include minimumUpdatePeriod indicating a reference period as an update interval of the MPD file. Then, the premium client 17, the semi-premium client 18, and the on-demand client 19 update the MPD file at an update interval indicated by the minimumUpdatePeriod. Therefore, the MPD file generation unit 34 can easily change the update interval of the MPD file only by changing the minimumUpdatePeriod described in the MPD file.
  • the time of the moving image content may be described as DurationForAveBandwidth, or the description of DurationForAveBandwidth May be omitted.
  • AveBandwidth and DurationForAveBandwidth in FIG. 4 and FIG. 5 may be described as a SupplementalProperty descriptor rather than described as a parameter of the representation element.
  • the integrated value of the actual bit rate of the audio stream of a predetermined period may be described.
  • FIG. 6 is a block diagram showing a configuration example of the premium client 17 of FIG.
  • the premium client 17 includes a license acquisition unit 60, an MPD acquisition unit 61, an MPD processing unit 62, a segment file acquisition unit 63, a buffer 65, a decryption unit 66, and an output control unit 67.
  • the license acquisition unit 60 of the premium client 17 requests the web server 20 of FIG. 1 to deliver the premium service.
  • the license acquisition unit 60 acquires premium server information and premium license transmitted from the web server 20 in response to the request.
  • the premium client 17 supplies the acquired premium server information and premium license to the MPD acquisition unit 61 and the segment file acquisition unit 63.
  • the MPD acquisition unit 61 requests the web server 20 to start distributing the moving image content. Further, the MPD acquisition unit 61 requests the premium server 14 to distribute the MPD file based on the premium server information and the premium license supplied from the license acquisition unit 60, and acquires the MPD file. The MPD acquisition unit 61 supplies the acquired MPD file to the MPD processing unit 62.
  • the MPD processing unit 62 analyzes the MPD file supplied from the MPD acquisition unit 61. Specifically, the MPD processing unit 62 acquires an update interval indicated by minimumUpdatePeriod from the MPD file. Also, the MPD processing unit 62 acquires acquired information such as the bandwidth of each encoded stream, the URL of a segment file storing each encoded stream, and the file name.
  • the MPD processing unit 62 acquires AveBandwidth of the audio stream and sets it as a selection bit rate.
  • the MPD processing unit 62 sets the bandwidth of the audio stream as the selection bit rate.
  • the MPD processing unit 62 supplies the bandwidth and acquisition information of each video stream, the selection bit rate of each audio stream, the acquisition information, and the encoding method information to the segment file acquisition unit 63.
  • the segment file acquisition unit 63 selects the bandwidth of the video stream and the selection bit rate of the audio stream based on the network bandwidth with the premium server 14, the bandwidth of each video stream, and the selection bit rate of each audio stream. Do.
  • the segment file acquisition unit 63 obtains the segment file based on the premium server information, the premium license, and the segment file acquisition information of the playback time of the selected Bandwidth video stream and audio bit stream for selection. Request delivery.
  • the segment file acquisition unit 63 acquires, in units of segments, segment files transmitted from the premium server 14 in response to the request.
  • the segment file acquisition unit 63 supplies the encoded stream stored in the acquired segment file to the buffer 65 so as to be held.
  • the buffer 65 temporarily holds the encoded stream supplied from the segment file acquisition unit 63.
  • the decoding unit 66 reads out the encoded stream from the buffer 65 and decodes it to generate a video digital signal and an audio digital signal of moving image content.
  • the decoding unit 66 supplies the generated video digital signal and audio digital signal to the output control unit 67.
  • the output control unit 67 displays an image on a display unit such as a display (not shown) based on the video digital signal supplied from the decoding unit 66.
  • the output control unit 67 also performs D / A (Digital / Analog) conversion on the audio digital signal supplied from the decoding unit 66.
  • the output control unit 67 outputs sound to an output unit such as a speaker (not shown) based on an audio analog signal obtained as a result of D / A conversion.
  • the configuration of the quasi-premium client 18 is the same as that of the premium client 17 of FIG. 6 except that the premium service is replaced with the quasi-premium service and the delivery source is the quasi-premium server 15, The description is omitted.
  • the configuration of the on-demand client 19 is the same as the configuration of the premium client 17 of FIG. 6 except that the premium service is replaced by the on-demand service and the delivery source is the on-demand server 16. The description is omitted.
  • FIG. 7 is a flowchart for explaining the premium service purchase process of the information processing system 10 of FIG.
  • step S11 of FIG. 7 the license acquisition unit 60 (FIG. 6) of the premium client 17 transmits a purchase request for requesting delivery of the premium service to the web server 20 of FIG.
  • step S21 the web server 20 receives the purchase request transmitted from the premium client 17.
  • step S22 the web server 20 determines whether the number of premium clients 17 that have already sent premium licenses is smaller than the allowable number, and the current date and time is within the sales period of the premium service.
  • step S22 If it is determined in step S22 that the number of premium clients 17 that have already transmitted the premium license is smaller than the allowable number and the current date and time is within the sales period of the premium service, the process proceeds to step S23.
  • step S23 the web server 20 transmits to the charging server 21 a charging request for requesting the premium client 17 to charge the premium service for charging.
  • step S31 the charging server 21 receives the charging request transmitted from the web server 20.
  • step S32 the charging server 21 performs charging processing of the premium service charge to the premium client 17.
  • step S33 the notification of completion of the charging process is transmitted to the web server 20.
  • step S24 the web server 20 receives the completion notification transmitted from the charging server 21.
  • step S ⁇ b> 25 the web server 20 generates premium server information and premium license, and transmits the premium server information and premium license to the premium client 17.
  • step S12 the license acquisition unit 60 (FIG. 6) of the premium client 17 receives the premium server information and the premium license transmitted from the web server 20, and supplies them to the MPD acquisition unit 61 and the segment file acquisition unit 63. Then, the process ends.
  • step S23 if it is determined in step S23 that the number of premium clients 17 that have already sent premium licenses is not smaller than the allowable number, or if it is determined that the current date is not within the sales period of premium services, the process ends. .
  • the quasi-premium service purchase process in which the quasi-premium client 18 receives the quasi-premium server information and the premium license is similar to the premium service purchase process of FIG. 7 except that the premium service replaces the quasi-premium service.
  • the on-demand service purchase process in which the on-demand client 19 receives the on-demand server information and the on-demand license transmits the on-demand license in the determination process of step S22 and the point that the premium service replaces the on-demand service. It is similar to the premium service purchase process except that the condition that the number of on demand clients 19 being smaller is smaller than the allowable number is deleted.
  • the billing system for premium service, quasi-premium service, and on-demand service may be a pay-per-view system that charges for each moving image content, or a subscription service system that charges for the viewing period. It may be
  • the premium license, semi-premium license, and on-demand license are licenses that enable acquisition and playback of predetermined moving image content when the charging method is the pay-per-view method, but when the subscription service method is the predetermined period. It is a license that only allows the acquisition and playback of any video content.
  • FIG. 8 is a flow chart for explaining the file generation process of the file generation apparatus 11 of FIG. This file generation process is performed when at least one of the encoding methods of the audio stream is a lossless DSD method.
  • step S40 of FIG. 8 the MPD file generation unit 34 of the file generation device 11 generates an MPD file.
  • the same value as Bandwidth is described in AveBandwidth of the MPD file, and PT0S indicating 0 seconds is shown in DurationForAveBandwidth. Described. Further, for example, a reference period ⁇ T is set in the minimumUpdatePeriod of the MPD file.
  • the MPD file generation unit 34 supplies the generated MPD file to the upload unit 35.
  • step S41 the upload unit 35 uploads the MPD file supplied from the MPD file generation unit 34 to the management server 12.
  • the MPD file uploaded to the management server 12 is transmitted to the original distribution server 13 and stored.
  • step S42 the acquisition unit 31 acquires a video analog signal and an audio analog signal of moving image content in segment units and performs A / D conversion.
  • the acquisition unit 31 supplies a signal such as a video digital signal and an audio analog signal obtained as a result of A / D conversion, and other segment unit moving image content signals to the encoding unit 32.
  • step S43 the encoding unit 32 encodes the signal of the moving image content supplied from the acquisition unit 31 at a plurality of bit rates according to a predetermined encoding scheme, and generates an encoded stream.
  • the encoding unit 32 supplies the generated encoded stream to the segment file generation unit 33.
  • step S44 the segment file generating unit 33 files the encoded stream supplied from the encoding unit 32 for each bit rate, and generates a segment file.
  • the segment file generation unit 33 supplies the generated segment file to the upload unit 35.
  • the segment file uploaded to the management server 12 is sent to the original distribution server 13 and stored.
  • step S45 the upload unit 35 uploads the segment file supplied from the segment file generation unit 33 to the management server 12.
  • the segment file uploaded to the management server 12 is sent to the original distribution server 13 and stored.
  • step S46 the MPD file generator 34 integrates the actual bit rate of the audio stream with the held integration value, and holds the resultant integration value.
  • step S47 the MPD file generation unit 34 determines whether or not the actual bit rate of the audio stream of the reproduction time one second before the update time of the MPD file has been accumulated by the process of step S46.
  • the time until the MPD file whose integrated value has been updated is actually uploaded to the management server 12 is one second, so the MPD file generation unit 34 performs reproduction one second before the update time. It is determined whether the actual bit rate of the audio stream of time has been accumulated.
  • that time is, of course, not limited to one second, and if it is other than one second, it is determined whether that time has been accumulated up to the actual bit rate of the audio stream of the reproduction time earlier than the update time. Ru.
  • the update time of the MPD file in the process of the first step S47 is from 0 seconds to the reference period ⁇ T
  • the update time of the MPD file in the process of the next step S47 is from 0 seconds to twice of the reference period ⁇ T. It is.
  • the update time of the MPD file is increased by the reference period ⁇ T.
  • step S47 If it is determined in step S47 that the processing has been performed up to the actual bit rate of the audio stream of the reproduction time one second before the update time of the MPD file, the process proceeds to step S48.
  • step S48 the MPD file generator 34 calculates an average value by dividing the held integrated value by the period of the audio stream corresponding to the integrated bit rate.
  • step S49 the MPD file generation unit 34 updates AveBandwidth and DurationForAveBandwidth of the MPD file to information indicating the average value calculated in step S47 and information indicating a period corresponding to the average value. Then, the MPD file generation unit 34 supplies the updated MPD file to the upload unit 35, and causes the pre-update MPD file stored in the management server 12 to be updated to the updated MPD file. The management server 12 supplies the updated MPD file to the original distribution server 13, and updates the pre-updated MPD file stored in the original distribution server 13 with the updated MPD file. Then, the process proceeds to step S50.
  • step S47 if it is determined in step S47 that the process has not accumulated up to the actual bit rate of the audio stream of the playback time one second before the update time of the MPD file, the process proceeds to step S50.
  • step S50 the acquisition unit 31 determines whether to end the file generation process. Specifically, when a signal of moving image content in segment units is newly supplied, the obtaining unit 31 determines that the file generation process is not ended. Then, the process returns to step S42, and the processes of steps S42 to S50 are repeated until it is determined that the file generation process is ended.
  • the acquiring unit 31 determines that the file generation processing is to be ended in step S50. Then, the process ends.
  • FIG. 9 is a flowchart for explaining premium distribution preparation processing of the information processing system 10.
  • the premium service distribution preparation process is performed after the original distribution server 13 prepares L pieces of premium servers 14 between the acquisition start time of the moving image content and the acquisition end time.
  • step S61 of FIG. 9 the premium client 17 transmits, to the web server 20, a distribution request for requesting start of distribution of moving image content.
  • step S71 the web server 20 receives the distribution request transmitted from the premium client 17.
  • step S72 the web server 20 determines whether the transmission source of the distribution request is the premium client 17 that has transmitted the premium license in step S25 of FIG. If it is determined in step S72 that the transmission source of the distribution request is the premium client 17 that has transmitted the premium license, the process proceeds to step S73.
  • step S73 the web server 20 increments the held distribution client number by one and holds the current time as the distribution start time of the premium client 17 that has transmitted the distribution request.
  • the web server 20 transmits the held distribution client number and the distribution start time of several distribution clients to the management server 12.
  • step S81 the management server 12 receives the number of distribution clients and the distribution start time transmitted from the management server 12.
  • step S 82 the management server 12 transmits the received number of distribution clients and the distribution start time to the original distribution server 13.
  • step S 91 the original distribution server 13 receives the number of distribution clients and the distribution start time transmitted from the management server 12.
  • step S 83 the management server 12 extracts bit rate information from the stored MPD file and transmits the bit rate information to the original distribution server 13.
  • step S 92 the original distribution server 13 receives the bit rate information transmitted from the management server 12.
  • step S93 the original distribution server 13 performs scaling of the L premium servers 14 based on the number of distribution clients, the distribution start time, and the bit rate information.
  • the network bandwidths of the premium client 17 and the premium server 14 that have requested the start of distribution become bandwidths capable of distributing the audio stream of the average value indicated by the maximum bit rate information of Bandwidth. As such, scaling of L premium servers 14 is performed.
  • step S94 the original distribution server 13 transmits the stored MPD file and segment file to (the cache server of) the premium server 14 after scaling.
  • step S101 the scaled premium server 14 receives and stores the MPD file and the segment file transmitted from the original distribution server 13.
  • step S84 the management server 12 determines whether the number of distribution clients and the distribution start time have been newly transmitted from the web server 20, that is, a new premium distribution preparation process is performed by transmitting a distribution request from the new premium client 17. Determine if has been started.
  • step S84 If it is determined in step S84 that the number of distribution clients and the distribution start time have not been newly transmitted from the web server 20, the process proceeds to step S85.
  • step S85 the original distribution server 13 determines whether the stored MPD file has been updated. If it is determined in step S85 that the stored MPD file is updated, the process returns to step S83, and the subsequent processes are repeated.
  • step S85 when it is determined in step S85 that the stored MPD file is not updated, the process returns to step S84, and the subsequent processes are repeated. If it is determined in step S84 that the number of distribution clients and the distribution start time have been newly transmitted from the web server 20, the process ends.
  • step S72 If it is determined in step S72 that the transmission source of the distribution request is not the premium client 17 that has transmitted the premium license, the process ends.
  • Quasi-premium distribution preparation processing for scaling the quasi-premium server 15 is performed after M quasi-premium servers 15 are prepared between a predetermined time after the acquisition start time of the moving image content and the acquisition end time, Similar to the premium delivery preparation process, except that the premium service replaces the quasi-premium service and the scaling method.
  • the network bandwidths of the quasi-premium client 18 and the quasi-premium server 15, which have requested the start of delivery become bandwidths capable of delivering an audio stream of an average value indicated by predetermined Bandwidth bit rate information
  • scaling of the M quasi-premium servers 15 is performed.
  • the on-demand delivery preparation process for scaling the on-demand service is performed after the N on-demand servers 16 are prepared after the acquisition of the moving image content is completed, and the processes of steps S83, S85, and S92 are not performed. Similar to the premium distribution preparation processing, except that the original distribution server 13 performs scaling based on the number of distribution clients and the distribution start time, and that the premium service replaces the on-demand service.
  • the assumed bandwidth of the premium service is the maximum bit rate. Therefore, regardless of the number of distribution clients and the distribution start time, the original distribution server 13 is an audio of the average value indicated by the maximum bandwidth bit rate information of the network bandwidth of the premium client 17 and the premium server 14 which requested the start of distribution.
  • the scaling can be performed so that the stream can be delivered in a bandwidth.
  • the assumed bandwidth of the quasi-premium service is smaller than the maximum bit rate. Therefore, if the assumed bandwidth is not sufficiently larger than the average value indicated by predetermined bit rate information of Bandwidth, the M quasi-premium servers 15 request the start of distribution according to the number of distribution clients and the distribution start time.
  • the network bandwidth which can deliver the audio stream of the average value which the bit rate information of predetermined Bandwidth shows between 18 and 18 can not be ensured.
  • the assumed bandwidth of the on-demand service is an average value indicated by bit rate information of a predetermined bandwidth
  • the number M of on-demand servers 16 is not an allowable number but assumed bandwidth for a predetermined number of on-demand clients 19
  • the number required to guarantee the communication of the audio stream in Therefore, depending on the number of distribution clients and the distribution start time, the N on-demand servers 16 transmit an audio stream of an average value indicated by predetermined Bandwidth bit rate information with the on-demand client 19 that has requested distribution start. It may not be possible to secure a distributable network bandwidth.
  • the management server 12 extracts the bit rate information and the maximum bit rate from the MPD file and supplies the extracted information to the original distribution server 13. Therefore, the original distribution server 13 can perform the scaling of the premium server 14 and the quasi-premium server 15 based on the bit rate information. As a result, appropriate scaling can be performed as compared to the case where scaling is performed based on the maximum bit rate.
  • FIG. 10 is a flowchart for explaining the MPD file update process of the premium client 17 of FIG. This MPD file update process is performed when the minimum update period is described in the MPD file after the premium distribution preparation process of FIG.
  • step S111 of FIG. 10 the MPD acquisition unit 61 of the premium client 17 requests the premium server 14 to distribute the MPD file based on the premium server information and the premium license supplied from the license acquisition unit 60, and the MPD file To get Then, the MPD acquisition unit 61 supplies the acquired MPD file to the MPD processing unit 62.
  • step S112 the MPD processing unit 62 analyzes the MPD file supplied from the MPD acquisition unit 61 to acquire an update interval indicated by minimumUpdatePeriod from the MPD file.
  • the MPD processing unit 62 analyzes the MPD file to obtain the bandwidth of the encoded stream, the acquired information, the encoding method information, and the like. Furthermore, when the encoding method information indicates that the encoding method information is not a fixed method by analyzing the MPD file, the MPD processing unit 62 acquires AveBandwidth of the audio stream, and sets it as a selection bit rate. When the encoding method information indicates that the method is a fixed method, the MPD processing unit 62 sets the bandwidth of the audio stream as the selection bit rate.
  • the MPD processing unit 62 supplies the bandwidth and acquisition information of each video stream, the selection bit rate of each audio stream, the acquisition information, and the encoding method information to the segment file acquisition unit 63.
  • step S113 the MPD acquisition unit 61 determines whether the update interval has elapsed from the acquisition of the MPD file in the previous process of step S111. If it is determined in step S113 that the update interval has not elapsed, the MPD acquisition unit 61 stands by until the update interval elapses.
  • step S113 If it is determined in step S113 that the update interval has elapsed, the process proceeds to step S114.
  • step S114 the premium client 17 determines whether to end the reproduction processing of FIG. 11 described later. If it is determined in step S114 that the reproduction processing is not ended, the processing returns to step S111, and the processing of steps S111 to S114 is repeated until the reproduction processing is ended.
  • step S114 when it is determined in step S114 that the reproduction processing is to be ended, the processing is ended.
  • the file generation device 11 calculates the average value of the actual bit rates of the generated audio stream for each reference period, and describes the average value in the MPD file. Therefore, the premium client 17 needs to periodically acquire and update the MPD file.
  • FIG. 11 is a flow chart for explaining the reproduction process of the premium client 17 of FIG. This reproduction process is performed in parallel with the MPD file update process of FIG.
  • step S121 of FIG. 11 the segment file acquisition unit 63 selects the smallest one of each of the bandwidth of the video stream supplied from the MPD processing unit 62 and the selection bit rate of the audio stream.
  • step S122 the segment file acquisition unit 63 acquires segment file acquisition information of a predetermined time length from the playback start time among the segment video files of the Bandwidth video stream and audio bit stream for selection selected in step S121.
  • the premium server information, and the premium license, the segment file is acquired from the premium server 14 in units of segments.
  • the predetermined time length is a time length of a coded stream which is preferably held in the buffer 65 before the start of decoding for detection of a network band between the premium server 14 and the premium client 17.
  • this predetermined time length is 25% of the time length (for example, about 30 seconds to 60 seconds) of the encoded stream that can be held in the buffer 65 (hereinafter referred to as the maximum time length).
  • the segment file acquisition unit 63 supplies the acquired segment file to the buffer 65 to hold it.
  • step S125 the segment file acquisition unit 63 determines the bandwidth of the video stream and the audio stream based on the network bandwidth between the premium server 14 and the premium client 17 and the bandwidth of the video stream and the selection bit rate of the audio stream. Select the selection bit rate.
  • the segment file acquisition unit 63 sets the bandwidth of the video stream and the selection bit of the audio stream so that the sum of the bandwidth of the selected video stream and the selection bit rate of the audio stream is equal to or less than the network band. Choose a rate.
  • step S126 the segment file acquisition unit 63 determines a predetermined time from the next time of the segment file acquired in step S122 among the segment video files of the Bandwidth video stream and the selection bit rate audio stream selected in step S125.
  • the acquisition information of the segment file of time length is transmitted to the premium server 14 in segment units, and the segment file is acquired in segment units.
  • the segment file acquisition unit 63 supplies the acquired segment file to the buffer 65 to hold it.
  • the AveBandwidth is an average value of the actual bit rates of the audio stream
  • the actual bit rate may exceed the AveBandwidth. Therefore, the predetermined time length in step S126 is made shorter than the reference period ⁇ T. As a result, when the actual bit rate exceeds AveBandwidth, the network bandwidth is reduced, and an audio stream with a lower selection bit rate is obtained. As a result, overflow of the buffer 65 can be prevented.
  • step S127 the segment file acquisition unit 63 determines whether the buffer 65 has a free space. If it is determined in step S127 that there is no space in the buffer 65, the segment file acquisition unit 63 waits until there is space in the buffer 65.
  • step S127 when it is determined in step S127 that the buffer 65 has a free space, the premium client 17 determines in step S128 whether or not to end the reproduction. If it is determined in step S128 that the reproduction is not ended, the process returns to step S124, and the processes of steps S124 to S128 are repeated until the reproduction is ended.
  • step S129 the decoding unit 66 ends the decoding after ending the decoding of all the encoded streams stored in the buffer 65. Then, the process ends.
  • the original distribution server 13 does not depend on the number of distribution clients or the distribution start time, but the network bandwidth of the premium client 17 and the premium server 14 that requested the start of distribution has the largest bit rate information of Bandwidth.
  • the scaling can be performed so that the audio stream of the average value shown can be delivered in a band. Therefore, the playback process of FIG. 11 allows the premium client 17 to continue acquiring audio streams having the same Bandwidth.
  • the MPD file update processing and reproduction processing of the quasi-premium client 18 are basically the same as the MPD file update processing of FIG. 10 and the reproduction processing of FIG.
  • M quasi-premium servers 15 start the delivery according to the number of delivery clients and the delivery start time. It is not possible to secure a network bandwidth capable of delivering an audio stream of an average value indicated by predetermined Bandwidth bit rate information with the requested quasi-premium client 18. Therefore, in this case, the semi-premium client 18 keeps acquiring the audio stream having the same maximum bit rate by changing the time length of the encoded stream to be held in the buffer 65 according to the network bandwidth.
  • the on-demand client 19 acquires the MPD file after the acquisition of the moving image content is completed. Therefore, the acquired MPD file already contains the average value of the whole period of the moving image content. Therefore, the on-demand client 19 does not perform the MPD file update process.
  • the reproduction process of the on-demand client 19 is basically the same as the reproduction process of FIG.
  • the N on-demand servers 16 transmit an audio stream of an average value indicated by predetermined Bandwidth bit rate information with the on-demand client 19 that has requested distribution start. It may not be possible to secure a distributable network bandwidth. Therefore, in this case, the on-demand client 19 changes the Bandwidth corresponding to the audio stream to be acquired by the reproduction process. Even in this case, the on-demand client 19 keeps acquiring the audio stream having the same Bandwidth by changing the time length of the encoded stream to be held in the buffer 65 according to the network bandwidth. May be
  • the file generation device 11 generates the average value of the actual bit rates of the lossless DSD encoded audio stream. Therefore, the premium client 17, the semi-premium client 18, and the on-demand client 19 actually select the bandwidth of the audio stream to be acquired by selecting the bandwidth of the video stream to be acquired based on the average value of the actual bit rates of the audio stream.
  • the video stream can be allocated at least a portion of the surplus bandwidth that is the difference from the bit rate of. As a result, based on the bandwidth of the audio stream, it is possible to obtain a video stream of an optimal bit rate as compared to the case of selecting the Bandwidth of the video stream to be obtained.
  • the file generation device 11 updates the AveBandwidth of the MPD file every reference period
  • the premium client 17, the semi-premium client 18, and the on-demand client 19 acquire the latest MPD file at the distribution start time. You can get the latest AveBandwidth.
  • FIG. 12 is a diagram for explaining the above-described premium service, quasi-premium service, and on-demand service.
  • the assumed bandwidth of the premium service is the maximum bit rate.
  • L premium servers 14 necessary for guaranteeing the assumed bandwidth to the permissible number of premium clients 17 are prepared. Therefore, the delivery cost per premium client 17 is the highest. Also, the allowable number of premium clients 17 depends on the number of available premium servers 14 and is generally small.
  • the premium client 17 for reproducing moving image content distributed by the premium service is an audio stream of bit rates with the same bandwidth from the reproduction start time to the reproduction end time. It can be played back.
  • playback can be started at the same time as the acquisition start time of the video content, and since there is no need to change the bandwidth of the audio stream to be played back during playback, the video content is most valuable.
  • the price is the highest because the value of video content is high and the delivery cost is high.
  • the distribution of the moving image content is permitted only between the acquisition start time of the moving image content and the acquisition end time, and the distribution by the on-demand service can not be performed.
  • the expected bandwidth of the semi-premium service is determined based on the maximum bit rate and the predetermined bit rate information of the bandwidth from the acquisition start time of the moving image content to the time when delivery by the quasi-premium service is permitted It is a bit rate smaller than the rate. Also, in the quasi-premium service, M quasi-premium servers 15 necessary for guaranteeing the assumed bandwidth to the permissible number of quasi-premium clients 18 are prepared.
  • the delivery cost per semi-premium client 18 is lower than the premium service. Also, as the time from the acquisition start time of the moving image content to the time when distribution by the quasi-premium service is permitted is longer, the guaranteed network bandwidth approaches the actual bit rate of the audio stream.
  • the quasi-premium service can play the audio stream having the same Bandwidth from the playback start time to the playback end time
  • the premium client 18 needs to change the time length of the encoded stream to be held in the buffer 65 according to the network bandwidth.
  • the allowable number of quasi-premium clients 18 is equal to the number of ready-to-be-prepared quasi-premium servers 15. Depends, generally not many. Also, when the quasi-premium client 18 changes the time length of the encoded stream to be held in the buffer 65 according to the network bandwidth, the allowable number of the quasi-premium client 18 depends on the processing capacity of the quasi-premium client 18, Not a few.
  • the reproduction can not be started until a predetermined time has elapsed from the acquisition start time of the moving picture content, so the value of the moving picture content is lower than that of the premium service.
  • the charge is lower than the premium service because the value of the video content and the delivery cost are lower than the premium service.
  • the distribution of moving image content is permitted only between a predetermined time after the acquisition start time of the moving image content and the acquisition end time, and the distribution by the on-demand service can not be performed.
  • the assumed bandwidth of the on-demand service is an average value of actual bit rates indicated by predetermined Bandwidth bit rate information.
  • the assumed bandwidth of the on-demand service may be a predetermined fixed value smaller than the maximum bit rate.
  • N on-demand servers 16 necessary for guaranteeing the assumed bandwidth for a predetermined number of on-demand clients 19 are prepared. Therefore, the delivery cost per on-demand client 19 is the lowest.
  • the quasi-premium client 18 reproduces an audio stream having the same Bandwidth by changing the time length of the encoded stream to be held in the buffer 65 according to the network bandwidth, or an audio stream to be reproduced. Change the Bandwidth of. Therefore, the allowable number of on demand clients 19 depends on the processing power of the on demand clients 19 and is generally large.
  • the original distribution server 13 may perform the scaling of the on-demand server 16 by a normal scaling method of the cache server. In this case, no bandwidth guarantee is made.
  • the second embodiment of the information processing system to which the present disclosure is applied mainly stores update notification information for notifying the update time of the MPD file in the media segment file of the audio stream, instead of describing the minimumUpdatePeriod in the MPD file. Is different from the first embodiment. Therefore, hereinafter, only the segment file of the audio stream, the file generation process, the MPD file update process, and the reproduction process will be described.
  • FIG. 13 is a diagram showing a configuration example of a media segment file including update notification information of an audio stream in the second embodiment.
  • the media segment file (Media Segment) of FIG. 13 is configured of a styp box, a sidx box, an emsg box (Event Message Box), and one or more Movie fragments.
  • the styp box is a box for storing information indicating the format of the media segment file.
  • msdh indicating that the format of the media segment file is the MPEG-DASH format is stored in the styp box.
  • the sidx box is a box storing index information of subsegments consisting of one or more movie fragments.
  • the emsg box is a box for storing update notification information using MPD validity expiration.
  • Movie fragment consists of moof box and mdat box.
  • the moof box is a box for storing metadata of an audio stream
  • the mdat box is a box for storing an audio stream. Movie fragments that make up a Media Segment are divided into one or more subsegments.
  • FIG. 14 is a diagram showing an example of description of the emsg box of FIG.
  • the string value is a value defining an event corresponding to this emsg box, and in the case of FIG. 14, is 1 indicating update of the MPD file.
  • Presentation_time_delta is the time from the playback time of the media segment file in which this emsg box is placed to the playback time when the event is performed. Therefore, in the case of FIG. 14, presentation_time_delta is a time from the reproduction time of the media segment file in which the emsg box is arranged to the reproduction time when the update of the MPD file is performed, and is update notification information. In the second embodiment, presentation_time_delta is five. Therefore, the MPD file is updated 5 seconds after the playback time of the media segment file in which the emsg box is placed.
  • the event_duration is the duration of the event corresponding to this emsg box, and in the case of FIG. 14, is “0xFFFF” indicating that the duration is unknown.
  • id is an ID unique to this emsg box.
  • message_data is data related to an event corresponding to the emsg box, and is XML (Extensible Markup Language) data of the update time of the MPD file in the case of FIG.
  • the file generation device 11 includes the emsg box of FIG. 14 for storing presentation_time_delta in the media segment file of the audio stream, as necessary.
  • the file generation device 11 can notify the downstream device such as the management server 12 as to how many seconds after the playback time of the media segment file that the MPD file is to be updated.
  • the file generation device 11 can easily change the update frequency of the MPD file only by changing the frequency of arranging the emsg box in the media segment file.
  • FIG. 15 is a flow chart for explaining the file generation process of the file generation apparatus 11 in the second embodiment. This file generation process is performed when at least one of the encoding methods of the audio stream is a lossless DSD method.
  • step S130 of FIG. 15 the MPD file generation unit 34 of the file generation device 11 generates an MPD file.
  • This MPD file differs from the MPD file in the first embodiment in that minimumUpdatePeriod is not described and that “urn: mpeg: dash: profile: is-off-ext-live: 2014” is described. “Urn: mpeg: dash: profile: is-off-ext-live: 2014” is a profile indicating that the emsg box of FIG. 14 is placed in the media segment file.
  • the MPD file generation unit 34 supplies the generated MPD file to the upload unit 35.
  • steps S131 to S133 are the same as the processes of steps S41 to S43 of FIG.
  • step S134 the segment file generation unit 33 of the file generation device 11 determines whether the reproduction time of the audio digital signal encoded in step S133 is five seconds before the update time of the MPD file. Note that, in the example of FIG. 15, the segment file generation unit 33 determines whether or not it is five seconds before the update time of the MPD file in order to notify the device of the subsequent stage of the update of the MPD file five seconds ago. However, of course, notification to the subsequent device may be made earlier than 5 seconds, and if it is made earlier than 5 seconds, it will be earlier than the MPD file update time by that time. Is determined.
  • the update time of the MPD file in the process of the first step S134 is from 0 seconds to the reference period ⁇ T
  • the update time of the MPD file in the process of the next step S134 is from 0 seconds to twice the reference period ⁇ T It is.
  • the update time of the MPD file is increased by the reference period ⁇ T.
  • step S134 If it is determined in step S134 that the time is 5 seconds before the update time of the MPD file, the process proceeds to step S135.
  • step S135 the segment file generator 33 generates a segment file of the audio stream supplied from the encoder 32, which includes the emsg box of FIG.
  • the segment file generation unit 33 generates a segment file of the video stream supplied from the encoding unit 32. Then, the segment file generation unit 33 supplies the generated segment file to the upload unit 35, and the process proceeds to step S137.
  • step S136 the segment file generator 33 generates a segment file of the audio stream supplied from the encoder 32, which does not include the emsg box of FIG.
  • the segment file generation unit 33 generates a segment file of the video stream supplied from the encoding unit 32. Then, the segment file generation unit 33 supplies the generated segment file to the upload unit 35, and the process proceeds to step S137.
  • steps S137 to S142 are the same as the processes of steps S45 to S50 of FIG.
  • the MPD file update process of the premium client 17 in the second embodiment is 5 seconds when the media segment file acquired by the segment file acquisition unit 63 includes the emsg box of FIG.
  • the MPD acquisition unit 61 later acquires the MPD file.
  • presentation_time_delta is 5, but of course it is not limited to this.
  • the reproduction process of the premium client 17 in the second embodiment is the same as the reproduction process of FIG. 11 and is performed in parallel with the MPD file update process.
  • the relation between the MPD file update process and reproduction process of the premium client 17 and the MPD file update process and reproduction process of the quasi-premium client 18 and the relation between the reproduction process of the premium client 17 and the reproduction process of the on demand client 19 are It is the same as the relationship in the first embodiment.
  • the on-demand client 19 performs the MPD file update processing as the premium client 17 does, but the MPD file does not change before and after the update.
  • the management server 12 may extract the bit rate information included in the MPD file only when acquiring the media segment file including the emsg box.
  • the premium client 17, the semi-premium client 18, and the on-demand client 19 may obtain the MPD file only when obtaining the media segment file including the emsg box. Therefore, it is possible to suppress an increase in HTTP overhead other than acquisition of a coded stream.
  • the third embodiment of the information processing system to which the present disclosure is applied mainly stores the updated values of AveBandwidth and DurationForAveBandwidth as update information (difference information before and after update) of the MPD file instead of updating the MPD file.
  • the second embodiment differs from the second embodiment in that the emsg box is arranged in the segment file of the audio stream, and the management server 12 extracts the bit rate information contained in the MPD file and the emsg box.
  • the initial values of AveBandwidth and DurationForAveBandwidth are included in the MPD file, and the updated values of AveBandwidth and DurationForAveBandwidth are included in the segment file of the audio stream. Therefore, in the following, only the emsg box for storing updated values of AveBandwidth and DurationForAveBandwidth, file generation processing, MPD file update processing, and reproduction processing will be described.
  • FIG. 16 is a diagram showing a description example of an emsg box for storing updated values of AveBandwidth and DurationForAveBandwidth in the third embodiment.
  • string value is 2 indicating transmission of update information of the MPD file.
  • presentation_time_delta 0 is set as a time from the playback time of the media segment file in which the emsg box is arranged to the playback time when the update information of the MPD file is transmitted.
  • message_data is XML data of updated values of AveBandwidth and DurationForAveBandwidth, which are update information of the MPD file.
  • FIG. 17 is a flowchart for explaining the file generation process of the file generation apparatus 11 in the third embodiment. This file generation process is performed when at least one of the encoding methods of the audio stream is a lossless DSD method.
  • step S160 of FIG. 17 the MPD file generation unit 34 of the file generation device 11 generates an MPD file.
  • This MPD file is the same as the MPD file in the second embodiment except that the profile is replaced with the profile indicating that the emsg box of FIG. 14 or 16 is placed in the media segment file.
  • the MPD file generation unit 34 supplies the generated MPD file to the upload unit 35.
  • steps S161 to S164 are the same as the processes of steps S131 to S134 of FIG.
  • step S164 If it is determined in step S164 that the time is not 5 seconds before the MPD file update time, the process proceeds to step S165.
  • steps S165 to S167 are the same as the processes of steps S138 to S140 of FIG.
  • the segment file generation unit 33 includes the emsg box in FIG. 16 including the average value calculated in step S167 as the updated value of AveBandwidth and including the period corresponding to the average value as the updated value of DurationForAveBandwidth.
  • the segment file of the audio stream supplied from the converting unit 32 is generated.
  • the segment file generation unit 33 generates a segment file of the video stream supplied from the encoding unit 32. Then, the segment file generation unit 33 supplies the generated segment file to the upload unit 35, and the process proceeds to step S172.
  • step S166 determines whether the actual bit rate of the audio stream at the playback time one second before the update time of the MPD file is not integrated yet. If it is determined in step S166 that the actual bit rate of the audio stream at the playback time one second before the update time of the MPD file is not integrated yet, the process proceeds to step S169.
  • step S169 the segment file generation unit 33 generates a segment file of the audio stream supplied from the encoding unit 32, which does not include the emsg box of FIG. 14 and the emsg box of FIG. In addition, the segment file generation unit 33 generates a segment file of the video stream supplied from the encoding unit 32. Then, the segment file generation unit 33 supplies the generated segment file to the upload unit 35, and the process proceeds to step S172.
  • step S170 the segment file generation unit 33 supplies from the encoding unit 32 including the emsg box storing the update notification information of FIG. Generate segment files of the audio stream to be In addition, the segment file generation unit 33 generates a segment file of the video stream supplied from the encoding unit 32. Then, the segment file generation unit 33 supplies the generated segment file to the upload unit 35.
  • step S171 the MPD file generation unit 34 integrates the actual bit rate of the audio stream with the held integration value, holds the resultant integration value, and advances the process to step S172.
  • step S172 the upload unit 35 uploads the segment file supplied from the segment file generation unit 33 to the management server 12.
  • step S173 Since the process of step S173 is the same as the process of step S142 of FIG. 15, the description will be omitted.
  • the MPD file update process of the premium client 17 in the third embodiment is 5 seconds when the media segment file acquired by the segment file acquisition unit 63 includes the emsg box of FIG.
  • the updated values of AveBandwidth and DurationForAveBandwidth are acquired from the emsg box of FIG. 16 of the later media segment file, and the MPD file is updated.
  • reproduction process of the premium client 17 in the third embodiment is the same as the reproduction process of FIG. 11, and is performed in parallel with the MPD file update process.
  • the relation between the MPD file update process and reproduction process of the premium client 17 and the MPD file update process and reproduction process of the quasi-premium client 18 and the on-demand client 19 is the same as the relation in the first embodiment.
  • the third embodiment only the updated values of AveBandwidth and DurationForAveBandwidth are transmitted to the subsequent device. Therefore, it is possible to reduce the amount of transmission required to update AveBandwidth and DurationForAveBandwidth.
  • the management server 12 and the MPD processing unit 62 need only analyze the descriptions regarding AveBandwidth and DurationForAveBandwidth for the updated MPD file, the analysis load is reduced.
  • updated values of AveBandwidth and DurationForAveBandwidth are stored in the audio stream segment file. Therefore, the premium client 17, the semi-premium client 18, and the on-demand client 19 do not need to acquire the MPD file each time the MPD file is updated. Therefore, it is possible to suppress an increase in HTTP overhead other than acquisition of a coded stream.
  • Fourth Embodiment (Example of emsg box description)
  • the initial values of AveBandwidth and DurationForAveBandwidth are not described in the MPD file, and the emsg box storing update notification information is not arranged in the segment file of the audio stream
  • the second embodiment differs from the third embodiment in that the management server 12 extracts bit rate information included in the emsg box. Therefore, in the following, only an emsg box storing AveBandwidth and DurationForAveBandwidth, file generation processing, updating processing of AveBandwidth and DurationForAveBandwidth, and reproduction processing will be described.
  • FIG. 18 is a diagram showing a description example of an emsg box storing AveBandwidth and DurationForAveBandwidth in the fourth embodiment.
  • string value is 3 indicating transmission of AveBandwidth and DurationForAveBandwidth.
  • presentation_time_delta 0 is set as the time from the playback time of the media segment file in which the emsg box is arranged to the playback time at which transmission of AveBandwidth and DurationForAveBandwidth is performed. This allows the downstream apparatus to recognize that AveBandwidth and DurationForAveBandwidth are placed in the media segment file in which the emsg box is placed.
  • message_data is XML data of AveBandwidth and DurationForAveBandwidth.
  • the file generation device 11 can easily change the update frequency of AveBandwidth and DurationForAveBandwidth simply by changing the arrangement frequency of the emsg box of FIG. 18 to the media segment file of the audio stream.
  • AveBandwidth and DurationForAveBandwidth are not described in the MPD file in the fourth embodiment.
  • the profile described in the MPD file is a profile indicating that the emsg in FIG. 18 is placed in the segment file, and is, for example, "urn: mpeg: dash: profile: isoff-dynamic-bandwidth: 2015" .
  • the updating process of AveBandwidth and DurationForAveBandwidth of the premium client 17 in the fourth embodiment is performed instead of the MPD file updating process in the third embodiment.
  • the update processing of AveBandwidth and DurationForAveBandwidth acquires AveBandwidth and DurationForAveBandwidth from the emsg box, and updates AveBandwidth and DurationForAveBandwidth It is.
  • the segment file acquisition unit 63 itself updates the AveBandwidth of the selection bit rates in step S121 instead of being supplied from the MPD processing unit 62.
  • the reproduction process of FIG. 11 is the same as that of FIG. This reproduction process is performed in parallel with the update process of AveBandwidth and DurationForAveBandwidth.
  • the relationship between the update processing and playback processing of AveBandwidth and DurationForAveBandwidth of the premium client 17 and the update processing and playback processing of AveBandwidth and DurationForAveBandwidth of the semi-premium client 18 and the on-demand client 19 is the same as the relationship in the first embodiment.
  • AveBandwidth and DurationForAveBandwidth are arranged in the emsg box. Therefore, the management server 12 and the MPD processing unit 62 do not have to analyze the MPD file for AveBandwidth and DurationForAveBandwidth.
  • AveBandwidth and DurationForAveBandwidth may not be stored in the emsg box, but may be periodically transmitted in accordance with other standards such as HTTP 2.0 and WebSocket. Also in this case, the same effect as that of the fourth embodiment can be obtained.
  • an emsg box storing update notification information may be arranged in the segment file.
  • the fifth embodiment of the information processing system to which the present disclosure is applied is mainly that XML data of AveBandwidth and DurationForAveBandwidth are arranged in a segment file different from a segment file of an audio stream, and the management server 12 is a segment
  • the point of extracting bit rate information included in the file is different from the fourth embodiment. Therefore, in the following, only segment files storing AveBandwidth and DurationForAveBandwidth (hereinafter referred to as band segment files), file generation processing, update processing of AveBandwidth and DurationForAveBandwidth, and reproduction processing will be described.
  • FIG. 19 is a diagram showing an example of description of the MPD file in the fifth embodiment.
  • the update interval and the file URL that is the base of the band segment file name are set.
  • the update interval is set to the reference period ⁇ T
  • the file URL is set to “$ Bandwidth $ bandwidth.info”. Therefore, the base of the band segment file name is obtained by adding “bandwidth” to the Bandwidth of the representation element.
  • the maximum bit rates of the three types of audio streams corresponding to the band segment file are 2.8 Mbps, 5.6 Mbps, and 11.2 Mbps.
  • the three representations have bandwidths of 2800000, 5600000 and 1 1200000, respectively.
  • the base of the band segment file name is 2800000 bandwidth.info, 5600000 bandwidth.info, and 11200000 bandwidth.info.
  • the segment info element included in the representation element has information on each band segment file of the band segment file group corresponding to the representation.
  • the update interval is described in the MPD file. Therefore, it is possible to easily change the update frequency of AveBandwidth and DurationForAveBandwidth simply by changing the update interval described in the MPD file and the update interval of the band segment file.
  • the MPD file generated in step S40 is the MPD file shown in FIG. 19 and the MPD file is generated in step S49.
  • the processing is the same as the file generation processing of FIG. 8 except that a band segment file is generated by the segment file generation unit 33 without being updated and uploaded to the management server 12 via the upload unit 35.
  • the segment file acquisition unit 63 acquires band segment files between step S93 and step S94 and updates AveBandwidth and DurationForAveBandwidth, and If it is determined that the process does not end in step S94, the process is the same as the MPD file update process of FIG. 10 except that the process returns to step S93.
  • the AveBandwidth of the selection bit rates in step S121 is not supplied from the MPD processing unit 62, but the segment file acquisition unit 63 updates itself.
  • the reproduction process of FIG. 11 is the same as that of FIG. This reproduction process is performed in parallel with the update process of AveBandwidth and DurationForAveBandwidth.
  • the relationship between the update processing and playback processing of AveBandwidth and DurationForAveBandwidth of the premium client 17 and the update processing and playback processing of AveBandwidth and DurationForAveBandwidth of the semi-premium client 18 and the on-demand client 19 is the same as the relationship in the first embodiment.
  • AveBandwidth and DurationForAveBandwidth are arranged in the band segment file. Therefore, the management server 12 and the MPD processing unit 62 do not have to analyze the MPD file for AveBandwidth and DurationForAveBandwidth.
  • the segment length of the audio stream is made variable so that the configuration of the MPD file and the actual bit rate of the segment file of the audio stream fall within a predetermined range. Is different from the first embodiment. Therefore, in the following, only the configuration of the MPD file and the segment file will be described.
  • FIG. 20 is a diagram showing a first description example of the MPD file in the sixth embodiment.
  • the description of the MPD file of FIG. 20 differs from the configuration of FIG. 4 in that the adaptation set element of the segment file of the audio stream has ConsecutiveSegmentInformation indicating the segment length of each segment file.
  • the segment length changes at a positive multiple of the fixed segment length as the reference time.
  • the segment file is configured by linking one or more segment files of a fixed segment length.
  • MaxConsecutiveNumber is described as the value (Value) of ConsecutiveSegmentInformation, and then FirstSegmentNumber and ConsecutiveNumbers are repeatedly described in order.
  • MaxConsecutiveNumber is information indicating the maximum connection number of segment files of a fixed segment length.
  • the fixed segment length is set based on the timescale and the duration of the Segment Template that the adaptation set element of the segment file of the audio stream has. In the example of FIG. 20, since timescale is 44100 and duration is 88200, the fixed segment length is 2 seconds.
  • FirstSegmentNumber is the number from the beginning of the first segment of consecutive segment groups having the same length, that is, the number included in the name of the first segment file of consecutive segment file groups having the same segment length. is there.
  • ConsecutiveNumbers is information indicating how many times the segment length of the segment group corresponding to the previous FirstSegmentNumber is a fixed segment length.
  • the value of ConsecutiveSegmentInformation is 2, 1, 1, 1, 121, 31.
  • the maximum number of concatenations for a fixed segment length is two.
  • the first media segment file having a maximum bit rate of 2.8 Mbps and a file name of “2800000-1.mp4” corresponding to a representation element having a bandwidth of 2800000 has a file name of “2800000.”
  • the second to tenth media segment files having the file names "2800000-2.mp4" to "2800000-10.mp4" also have the file names "2800000-2.mp4" to "2800000,” respectively.
  • This is a concatenation of one media segment file of fixed segment length which is “ ⁇ 10.mp4”, and the segment length is 2 seconds.
  • the 11th media segment file from the top whose file name is “2800000-11.mp4” has two fixed segment lengths whose file names are “2800000-11.mp4” and “2800000-12.mp4”.
  • Media segment files are concatenated. Therefore, the segment length of the media segment file whose file name is “2800000-11.mp4” is 4 seconds which is twice the fixed segment length.
  • the file name “2800000-12.mp4” of the media segment file linked to the media segment file having the file name “2800000-11.mp4” is a missing number.
  • the 12th to 19th media segment files from the top whose file names are “2800000-13.mp4”, “2800000-15.mp4”,..., “2800000-29.mp4” also have a fixed segment length. Is a concatenation of two media segment files, and the segment length is 4 seconds.
  • the 20th media segment file from the top having the file name "2800000-31.mp4" is a concatenation of one fixed segment length media segment file having the file name "2800000-31.mp4". is there. Therefore, the segment length of the media segment file whose file name is “2800000-31.mp4” is two seconds which is one time the fixed segment length.
  • the configuration of a media segment file having a maximum bit rate of 5.6 Mbps and 11.2 Mbps corresponding to a representation element having a bandwidth of 5600000 and 11200000 is similar to the configuration of a media segment file having a maximum bit rate of 2.8 Mbps. The description is omitted.
  • FIG. 21 is a diagram showing a second description example of the MPD file in the sixth embodiment.
  • the configuration of the MPD file in FIG. 21 differs from the configuration in FIG. 4 in that timescale and duration are not described in Segment Template, and that the adaptation set element of the segment file of the audio stream has Segment Duration.
  • the segment length changes at an arbitrary time. Therefore, timescale and duration are described as SegmentDuration.
  • the timescale is a value representing one second, and 44100 is set in the example of FIG.
  • FirstSegmentNumber and SegmentDuration are repeatedly described in order.
  • FirstSegmentNumber is identical to FirstSegmentNumber in FIG.
  • SegmentDuration is the value of the segment length of the segment group corresponding to the previous FirstSegmentNumber, where timescale is 1 second.
  • segment length of the first to twelfth media segment files whose file names are “2800000-12.mp4” to “2800000-14.mp4” is also one second.
  • the configuration of a media segment file having a maximum bit rate of 5.6 Mbps and 11.2 Mbps corresponding to a representation element having a bandwidth of 5600000 and 11200000 is the same as the configuration of a media segment file having a bandwidth of 2.8 Mbps, so the description will be omitted. .
  • the segment file generator 33 sets the segment length so that the bit rate falls within a predetermined range based on the actual bit rate of the audio stream or the average value of the actual bit rates. decide. Therefore, the segment length changes with the generation of the audio stream. Therefore, the premium client 17, the semi-premium client 18, and the on-demand client 19 need to acquire and update the MPD file each time the segment length is changed.
  • the change timing of the segment length is the same as the calculation timing of the average value of the actual bit rates of the audio stream, but may be different.
  • information indicating the segment length update interval and update time is transmitted to the premium client 17, the semi premium client 18, and the on demand client 19, and the premium client 17, the semi premium client 18, and the on demand client 19 updates the MPD file based on the information.
  • FIG. 22 is a diagram showing a configuration example of a media segment file of the lossless DSD audio stream according to the sixth embodiment.
  • the configuration of the media segment file shown in A of FIG. 22 is different from the configuration of FIG. 13 in that the Movie fragment does not have a fixed segment length but has a variable segment length, and that an emsg box is not provided.
  • the media segment file is configured by linking one or more media segment files of a fixed segment length as in the example of FIG. 20, the media segment file is as shown in B of FIG. It may be configured by simply concatenating media segment files of one or more fixed segment lengths. In this case, there are as many styp boxes and sidx boxes as the number of media segment files to be concatenated.
  • the segment length of the audio stream is made variable so that the actual bit rate of the segment file of the audio stream falls within the predetermined range. Therefore, even if the actual bit rate of the audio stream is small, the premium client 17, the semi-premium client 18, and the on-demand client 19 can obtain bits in a predetermined range by acquiring segment files in units of segments. It is possible to obtain an audio stream at a rate.
  • the information indicating the segment length of each segment file is transmitted to the premium client 17, the semi-premium client 18, and the on-demand client 19 similarly to AveBandwidth and DurationForAveBandwidth in the third to fifth embodiments. It is also good. Also, a file indicating the segment length of each segment file may be generated separately from the MPD file, and may be transmitted to the premium client 17, the semi-premium client 18, and the on-demand client 19.
  • segment length may be made variable as in the sixth embodiment.
  • FIG. 23 is a block diagram showing a configuration example of a lossless compression encoding unit of the acquisition unit 31 and the encoding unit 32 of FIG. 3 that A / D converts an audio analog signal and encodes it by the lossless DSD method.
  • the lossless compression encoding unit 100 in FIG. 23 includes an input unit 111, an ADC 112, an input buffer 113, a control unit 114, an encoding unit 115, an encoded data buffer 116, a data amount comparison unit 117, a data transmission unit 118, and an output unit 119. It consists of The lossless compression encoding unit 100 converts an audio analog signal into an audio digital signal by the DSD method, and lossless compression encodes and outputs the converted audio digital signal.
  • an audio analog signal of moving image content is input from the input unit 111 and supplied to the ADC 112.
  • the ADC 112 includes an adder 121, an integrator 122, a comparator 123, a one-sample delay circuit 124, and a one-bit DAC 125, and converts an audio analog signal into an audio digital signal by the DSD method.
  • the audio analog signal supplied from the input unit 111 is supplied to the adder 121.
  • the adder 121 adds the audio analog signal one sampling period before supplied from the one-bit DAC 125 and the audio analog signal from the input unit 111 and outputs the added signal to the integrator 122.
  • the integrator 122 integrates the audio analog signal from the adder 121 and outputs it to the comparator 123.
  • the comparator 123 performs 1-bit quantization by comparing the integral value of the audio analog signal supplied from the integrator 122 with the midpoint potential every one sample period.
  • the comparator 123 performs 1-bit quantization, 2-bit quantization, 4-bit quantization, or the like may be performed. Also, as the frequency of the sample period (sampling frequency), for example, a frequency that is 64 or 128 times as high as 48 kHz or 44.1 kHz is used.
  • the comparator 123 outputs the 1-bit audio digital signal obtained by the 1-bit quantization to the input buffer 113 and supplies the 1-sample audio digital signal to the 1-sample delay circuit 124.
  • the one-sample delay circuit 124 delays the one-bit audio digital signal from the comparator 123 by one sample period and outputs it to the one-bit DAC 125.
  • the 1-bit DAC 125 converts the audio digital signal from the 1-sample delay circuit 124 into an audio analog signal and outputs the audio analog signal to the adder 121.
  • the input buffer 113 temporarily accumulates a 1-bit audio digital signal supplied from the ADC 112 and supplies the audio digital signal to the control unit 114, the encoding unit 115, and the data amount comparison unit 117 in units of one frame.
  • one frame is a unit for dividing an audio digital signal into a predetermined time (period) and considering it as one unit.
  • the control unit 114 controls the overall operation of the lossless compression coding unit 100. Further, the control unit 114 has a function of creating a conversion table table 1 required for the encoding unit 115 to perform lossless compression encoding, and supplying the conversion table table 1 to the encoding unit 115.
  • the control unit 114 uses the audio digital signal of one frame supplied from the input buffer 113, the control unit 114 creates a data generation count table pre_table in frame units, and further converts the conversion table table1 from the data generation count table pre_table. create.
  • the control unit 114 supplies the conversion table table1 created in frame units to the encoding unit 115 and the data transmission unit 118.
  • the encoding unit 115 uses the conversion table table 1 supplied from the control unit 114 to perform lossless compression encoding on the audio digital signal supplied from the input buffer 113 in units of 4 bits. Therefore, the audio digital signal is supplied to the encoding unit 115 from the input buffer 113 at the same time as the timing supplied to the control unit 114. However, the encoding unit 115 performs processing until the conversion table table1 is supplied from the control unit 114. I will wait.
  • the encoding unit 115 losslessly encodes a 4-bit audio digital signal into a 2-bit audio digital signal, or a lossless compression code into a 6-bit audio digital signal. And output to the encoded data buffer 116.
  • the encoded data buffer 116 temporarily buffers the audio digital signal generated as a result of the lossless compression encoding by the encoding unit 115, and supplies the audio digital signal to the data amount comparison unit 117 and the data transmission unit 118.
  • the data amount comparison unit 117 sets the data amount of the lossless compression encoded audio digital signal supplied from the input buffer 113 and the data amount of the lossless compression encoded audio digital signal supplied from the encoded data buffer 116 Compare by unit.
  • the encoding unit 115 since the encoding unit 115 performs the lossless compression encoding of the 4-bit audio digital signal into the 2-bit audio digital signal or the 6-bit audio digital signal, an algorithmic lossless compression encoding is performed.
  • the amount of data of the subsequent audio digital signal may exceed the amount of data of the audio digital signal before the lossless compression encoding. Therefore, the data amount comparison unit 117 compares the data amounts of the audio digital signal after lossless compression coding and the audio digital signal before lossless compression coding.
  • the data amount comparison unit 117 selects one with a smaller data amount, and supplies selection control data indicating which one is selected to the data transmission unit 118.
  • the data amount comparison unit 117 supplies selection control data indicating that the audio digital signal before lossless compression encoding has been selected to the data transmission unit 118
  • the audio digital signal before lossless compression encoding is also data
  • the data is supplied to the transmission unit 118.
  • the data transmission unit 118 is an audio digital signal supplied from the encoded data buffer 116 or an audio digital signal supplied from the data amount comparison unit 117 based on the selection control data supplied from the data amount comparison unit 117. Choose one.
  • the data transmission unit 118 selects the lossless compression encoded audio digital signal supplied from the encoded data buffer 116, the audio digital signal, the selection control data, and the conversion table table 1 supplied from the control unit 114 are selected. Generate an audio stream.
  • the data transmission unit 118 selects an audio digital signal that is not lossless compression encoded and supplied from the data amount comparison unit 117, the data transmission unit 118 generates an audio stream from the audio digital signal and the selection control data.
  • the data transmission unit 118 outputs the generated audio stream via the output unit 119.
  • the data transmission unit 118 can also generate an audio stream by adding a synchronization signal and an error correction code (ECC) to an audio digital signal for each predetermined number of samples.
  • ECC error correction code
  • FIG. 24 is a diagram showing an example of a data generation count table generated by the control unit 114 of FIG.
  • the control unit 114 divides the audio digital signal in units of frames supplied from the input buffer 113 into units of 4 bits.
  • an i-th (i is an integer greater than 1) 4-bit audio digital signal from the beginning of the divided head is referred to as D4 data D4 [i].
  • the control unit 114 sequentially sets the nth (n> 3) D4 data D4 [n] from the head as the processing target D4 data for each frame.
  • the control unit 114 performs processing target for each pattern of the last three pieces of D4 data D4 [n-3], D4 [n-2], D4 [n-1] of the immediate past D4 data D4 [n] to be processed.
  • the number of occurrences of the D4 data D4 [n] is counted, and a data occurrence count table pre_table [4096] [16] shown in FIG. 24 is created.
  • [4096] and [16] of the data occurrence count table pre_table [4096] [16] indicate that the data occurrence count table is a 4096-row 16-column table (matrix), [0] to [4095] Each row of [] corresponds to the values that can be taken of the past three D4 data D4 [n-3], D4 [n-2], D4 [n-1], and each column of [0] to [15] is , Corresponding to possible values of the D4 data D4 [n] to be processed.
  • pre_table [0] [0] to [0] [15] which is the first row of the data occurrence count table pre_table, includes the past three D4 data D4 [n-3] and D4 [n-2].
  • pre_table [1] [0] to [1] [15] are ⁇ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 ⁇ .
  • the past three D4 data D4 [n-3], D4 [n-2], D4 [n-1] are "117"
  • the D4 data D4 [n] to be processed is "17".
  • pre_table [117] [0] to [117] [15] are ⁇ 0, 1, 10, 18, 20, 31, 11, 10, 4, 12, 5, 0, 0, 0, 0 ⁇ .
  • FIG. 25 is a diagram showing an example of the conversion table table1 generated by the control unit 114 of FIG.
  • the control unit 114 creates the conversion table table1 [4096] [3] of 4096 rows and 3 columns based on the data generation count table pre_table created earlier.
  • the respective rows [0] to [4095] of the conversion table table1 [4096] [3] the past three D4 data D4 [n-3], D4 [n-2], D4 [n-1]
  • the (first) value having the highest occurrence frequency is stored, and in the second column [1], the second occurrence frequency. Is stored, and in the third column [2], the third value of the occurrence frequency is stored.
  • control unit 114 when control unit 114 generates conversion table table1 [4096] [3] based on data generation count table pre_table in FIG. 24, as shown in FIG. 25, conversion table table1 [4096] [3] is generated.
  • Table 1 [117] [0] to [117] [2] which is the 118th line of] becomes ⁇ 05, 04, 03 ⁇ . That is, in the pre_tables [117] [0] to [117] [15] of the 118th row of the data occurrence count table pre_table of FIG. 24, the (first) value having the highest occurrence frequency is 31 occurrences "5 And the second value of the occurrence frequency is “4” which is generated 20 times, and the third value of the occurrence frequency is “3” which is generated 18 times.
  • ⁇ 05 ⁇ is stored in the 118th row first column table1 [117] [0] of the conversion table table1 [4096] [3], and the 118th row second column table1 [117] [1] , ⁇ 04 ⁇ are stored, and ⁇ 03 ⁇ is stored in the 118th row third column table1 [117] [2].
  • tables 1 [0] [0] to [0] [2] of the first line of conversion table table1 [4096] [3] are pre_table [0] of the first line of data occurrence count table pre_table of FIG. It is generated based on [0] to [0] [15]. That is, in the first row pre_table [0] [0] to [0] [15] of the data occurrence count table pre_table in FIG. 24, the (first) value with the highest occurrence frequency is 369a (HEX notation) times It is generated "0" and no other value is generated.
  • ⁇ 00 ⁇ is stored in the first row and first column table1 [0] [0] of the conversion table table1 [4096] [3], and the first row and second column table1 [0] [1] In the 1st row, third column table1 [0] [2], ⁇ ff ⁇ indicating that there is no data is stored.
  • the value indicating that there is no data is not limited to ⁇ ff ⁇ , and can be determined as appropriate.
  • the value stored in each element of the conversion table table 1 can be expressed by 4 bits because it is any of “0” to “15”, but is expressed by 8 bits for ease of computer processing. It is done.
  • the encoding unit 115 divides the audio digital signal in units of frames supplied from the input buffer 113 into units of 4 bits.
  • the control unit 114 converts the last three D4 data D4 [n-3] of the last three conversion tables table1 [4096] [3], The three values in the row corresponding to D4 [n-2] and D4 [n-1] are retrieved.
  • the encoding unit 115 uses lossless compression encoding target D4 data D4 [n] as the last three D4 data D4 [n ⁇ 3], D4 [n ⁇ 2 of the latest three of the conversion table table 1 [4096] [3].
  • the 2-bit value "01b" is generated as the result of lossless compression encoding of D4 data D4 [n].
  • the encoding unit 115 determines that the D4 data D4 [n] to be subjected to lossless compression encoding is the last three D4 data D4 [n ⁇ 3], D4 [n] of the conversion table table1 [4096] [3].
  • the encoding unit 115 is a row corresponding to the last three D4 data D4 [n-3], D4 [n-2], D4 [n-1] of the conversion table table1 [4096] [3]. If the same value as the D4 data D4 [n] to be losslessly compressed is not present in the three values of, the D4 data D4 [n] is preceded by "00b” and the 6-bit value "00b +" D4 [n] ′ ′ is generated as a result of lossless compression coding of D4 data D4 [n].
  • b in "01b”, "10b”, “11b”, and "00b + D4 [n]" represents binary notation.
  • the encoding unit 115 converts the 4-bit DSD data D4 [n] into the 2-bit value “01b”, “10b”, or “11b” using the conversion table table1, Alternatively, it is converted into a 6-bit value "00b + D4 [n]" to be a lossless compression coding result.
  • the encoding unit 115 outputs the lossless compression encoding result to the encoded data buffer 116 as a lossless compression encoded audio digital signal.
  • FIG. 26 is a block diagram showing a configuration example of a lossless compression decoding unit of the decoding unit 66 and the output control unit 67 of FIG. 6 that decodes the audio stream by the lossless DSD method and performs D / A conversion.
  • the lossless compression / decoding unit 170 in FIG. 26 includes an input unit 171, a data receiving unit 172, a coded data buffer 173, a decoding unit 174, a table storage unit 175, an output buffer 176, an analog filter 177, and an output unit 178. .
  • the lossless compression decoding unit 170 losslessly compresses and decodes the audio stream according to the lossless DSD method, converts the resultant audio digital signal into an audio analog signal according to the DSD method, and outputs the audio analog signal.
  • the audio stream supplied from the buffer 65 of FIG. 6 is input from the input unit 171 and supplied to the data receiving unit 172.
  • the data receiving unit 172 determines whether or not the audio digital signal is lossless compression encoded based on selection control data indicating whether the audio digital signal included in the audio stream is lossless compression encoded or not. Then, when it is determined that the audio digital signal is lossless compression encoded, the data receiving unit 172 converts the audio digital signal included in the audio stream into the lossless compression encoded audio digital signal, the encoded data buffer Supply to 173. Further, the data receiving unit 172 supplies the conversion table table 1 included in the audio stream to the table storage unit 175.
  • the data receiving unit 172 outputs the audio digital signal included in the audio stream to the output buffer 176 as an audio digital signal not lossless compression encoded. Supply.
  • the table storage unit 175 stores the conversion table table1 supplied from the data receiving unit 172, and supplies the conversion table table1 to the decoding unit 174.
  • the encoded data buffer 173 temporarily accumulates the lossless compression encoded audio digital signal supplied from the data receiving unit 172 in frame units.
  • the encoded data buffer 173 supplies the stored audio digital signal in units of frames to the subsequent decoding unit 174 at successive two bits at a predetermined timing.
  • the decoding unit 174 includes a 2-bit register 191, a 12-bit register 192, a conversion table processing unit 193, a 4-bit register 194, and a selector 195.
  • the decoding unit 174 performs lossless compression decoding on the lossless compression encoded audio digital signal to generate an audio digital signal before lossless compression encoding.
  • the register 191 stores the 2-bit audio digital signal supplied from the encoded data buffer 173.
  • the register 191 supplies the stored 2-bit audio digital signal to the conversion table processing unit 193 and the selector 195 at a predetermined timing.
  • the 12-bit register 192 stores 12 bits of the 4-bit audio digital signal, which is the lossless compression / decoding result supplied from the selector 195, in a first-in first-out (FIFO) manner.
  • the register 192 stores D4 data which is the last three lossless compression decoding results of the lossless compression decoding result of the audio digital signal including the 2-bit audio digital signal stored in the register 191. .
  • the conversion table processing unit 193 ignores the audio digital signal because the audio digital signal is not registered in the conversion table table 1 [4096] [3]. . In addition, the conversion table processing unit 193 ignores a total of two 4-bit audio digital signals supplied immediately after the currently supplied 2-bit audio digital signal.
  • the conversion table processing unit 193 uses the three D4 data (12 bits) stored in the register 192. Read out D4 data of The conversion table processing unit 193 registers the three read D4 data of the conversion table table 1 from the table storage unit 175 as D4 [n-3], D4 [n-2], D4 [n-1]. The D4 data stored in the column indicated by the supplied 2-bit audio digital signal of the current row is read. The conversion table processing unit 193 supplies the read D4 data to the register 194.
  • the register 194 stores 4-bit D4 data supplied from the conversion table processing unit 193.
  • the register 194 supplies the stored 4-bit D4 data to the input terminal 196b of the selector 195 at a predetermined timing.
  • the selector 195 selects the input terminal 196a when the 2-bit audio digital signal supplied from the register 191 is "00b". Then, the selector 195 outputs the 4-bit audio digital signal input after “00b” to the input terminal 196 a from the output terminal 197 to the register 192 and the output buffer 176 as a result of the lossless compression decoding.
  • the selector 195 selects the input terminal 196b. Then, the selector 195 outputs the 4-bit audio digital signal input to the input terminal 196 b from the output terminal 197 to the register 192 and the output buffer 176 as a lossless compression / decoding result.
  • the output buffer 176 stores an audio digital signal which is not lossless compression encoded and supplied from the data receiving unit 172 or an audio digital signal which is a lossless compression decoding result supplied from the decoding unit 174, and outputs the analog digital signal to the analog filter 177. Supply.
  • the analog filter 177 performs predetermined filtering such as a low pass filter and a band pass filter on the audio digital signal supplied from the output buffer 176, and outputs the result via the output unit 178.
  • the conversion table table 1 may be compressed by the lossless compression coding unit 100 and supplied to the lossless compression decoding unit 170.
  • the conversion table table 1 may be set in advance and stored in the lossless compression encoding unit 100 and the lossless compression decoding unit 170.
  • the number of conversion tables table1 may be more than one.
  • the j-th (j is an integer greater than or equal to 0) conversion table table 1 includes 3 (j-1), 3 (j-1) +1, 3 (j-1) +2, D4 data is stored in each row.
  • the number of past D4 data corresponding to each row is not limited to three.
  • the lossless compression encoding method is not limited to the above-described method, and may be, for example, the method described in JP-A-9-74358.
  • the above-described series of processes may be performed by hardware or software.
  • a program that configures the software is installed on a computer.
  • the computer includes, for example, a general-purpose personal computer that can execute various functions by installing a computer incorporated in dedicated hardware and various programs.
  • FIG. 27 is a block diagram showing an example of a hardware configuration of a computer that executes the series of processes described above according to a program.
  • a central processing unit (CPU) 201 a read only memory (ROM) 202, and a random access memory (RAM) 203 are mutually connected by a bus 204.
  • CPU central processing unit
  • ROM read only memory
  • RAM random access memory
  • an input / output interface 205 is connected to the bus 204.
  • An input unit 206, an output unit 207, a storage unit 208, a communication unit 209, and a drive 210 are connected to the input / output interface 205.
  • the input unit 206 includes a keyboard, a mouse, a microphone and the like.
  • the output unit 207 includes a display, a speaker, and the like.
  • the storage unit 208 includes a hard disk, a non-volatile memory, and the like.
  • the communication unit 209 is configured of a network interface or the like.
  • the drive 210 drives removable media 211 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.
  • the CPU 201 loads the program stored in the storage unit 208 into the RAM 203 via the input / output interface 205 and the bus 204 and executes the program. A series of processing is performed.
  • the program executed by the computer 200 can be provided by being recorded on, for example, a removable medium 211 as a package medium or the like. Also, the program can be provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting.
  • the program can be installed in the storage unit 208 via the input / output interface 205 by attaching the removable media 211 to the drive 210.
  • the program can be received by the communication unit 209 via a wired or wireless transmission medium and installed in the storage unit 208.
  • the program can be installed in advance in the ROM 202 or the storage unit 208.
  • the program executed by the computer 200 may be a program that performs processing in chronological order according to the order described in this specification, or in parallel, or when necessary, such as when a call is made. It may be a program in which processing is performed.
  • a system means a set of a plurality of components (devices, modules (parts), etc.), and it does not matter whether all the components are in the same case. Therefore, a plurality of devices housed in separate housings and connected via a network, and one device housing a plurality of modules in one housing are all systems. .
  • scaling may be performed not only on the premium server 14, the semi-premium server 15, and the on-demand server 16 but also on the management server 12 or the original distribution server 13.
  • the original distribution server 13 analyzes the MPD file or segment file transmitted from the management server 12, not the bit rate information or maximum bit rate transmitted from the management server 12 separately from the MPD file or segment file. , Scaling may be performed.
  • the lossless DSD method in the first to seventh embodiments may be a lossless DSD method as long as it is a lossless compression method in which the bit generation amount by lossless compression coding can not be predicted.
  • the lossless DSD method in the first to seventh embodiments may be a FLAC (Free Lossless Audio Codec) method, an ALAC (Apple lossless Audio Codec) method, or the like.
  • FLAC Free Lossless Audio Codec
  • ALAC Apple lossless Audio Codec
  • the bit generation amount fluctuates according to the waveform of the audio analog signal.
  • the ratio to change changes with methods.
  • a segment file of a fixed segment length may be generated at the time of generation of a segment file.
  • the premium server 14, the semi-premium server 15, and the on-demand server 16 generate segment files of variable segment length by concatenating segment files of that fixed segment length based on AveBandwidth at the time of distribution. And deliver.
  • AveBandwidth and DurationForAveBandwidth are arranged in the segment file. Therefore, the semi-premium client 18 and the on-demand client 19 can not obtain the latest AveBandwidth and DurationForAveBandwidth at the start of playback. Therefore, the latest AveBandwidth and DurationForAveBandwidth may be stored again when transmitting a segment file that stores AveBandwidth and DurationForAveBandwidth (updated values of). In this case, the semi-premium client 18 and the on-demand client 19 can recognize the latest AveBandwidth and DurationForAveBandwidth at the start of reproduction.
  • AveBandwidth and DurationForAveBandwidth are described in the MPD file or segment file, but AveBandwidth and DurationForAveBandwidth may be listed every arbitrary time.
  • the premium client 17, the semi-premium client 18, and the on-demand client 19 can perform fine band control. If an arbitrary time is a fixed time, only one DurationForAveBandwidth may be described.
  • the present disclosure can also have the following configurations.
  • a scaling unit that performs scaling of a distribution apparatus that distributes the audio stream to another information processing apparatus based on bit rate information including an average value of a predetermined period of a bit rate of the audio stream encoded by the lossless compression method Information processing apparatus provided.
  • the scaling unit is configured to perform the scaling based on the number of the other information processing apparatuses that request the distribution of the audio stream and the distribution start time of the audio stream to the other information processing apparatus.
  • the information processing apparatus according to (1).
  • the distribution device is configured to allow the distribution of the audio stream at the start of the generation of the audio stream according to a charge for charging processing to the other information processing device.
  • the distribution device is configured to allow the distribution of the audio stream after a predetermined time has elapsed since the generation of the audio stream is started according to a charge for charging processing to the other information processing device.
  • An information processing apparatus according to any one of 1) to (3).
  • the distribution device is configured to allow the distribution of the audio stream after the generation of the audio stream is completed according to a charge for charging processing to the other information processing device. Any of the above (1) to (4) Information processing apparatus described in. (6) The information processing apparatus according to any one of (1) to (5), wherein the bit rate information is configured to include the predetermined period.
  • the predetermined period is increased by the reference period every reference period, The information processing apparatus according to any one of (1) to (6), wherein the bit rate information is configured to be updated for each of the reference periods.
  • the information processing apparatus according to (7), wherein the bit rate information is configured to be included in a management file that manages the audio stream.
  • the management file includes information indicating the reference period.
  • the initial value of the bit rate information is included in a management file that manages the audio stream,
  • the information processing apparatus according to (7), wherein the update value of the bit rate information is configured to be included in a file storing the audio stream.
  • the information processing apparatus configured to be included in a file storing the audio stream.
  • the bit rate information is included in a file different from a file storing the audio stream, and is managed by a management file managing the audio stream.
  • the lossless compression method is any of lossless DSD (Direct Stream Digital) method, FLAC (Free Lossless Audio Codec) method, or ALAC (Apple lossless Audio Codec) method.
  • the information processing apparatus according to claim 1.
  • the information processing apparatus A scaling step of scaling a distribution apparatus for distributing the audio stream to another information processing apparatus based on bit rate information including an average value of a predetermined period of a bit rate of the audio stream encoded by the lossless compression method; Information processing method including. (15) A first information processing apparatus, A second information processing apparatus, And a delivery device, The first information processing apparatus transmits the audio stream to the second information processing apparatus based on bit rate information including an average value of a predetermined period of bit rates of the audio stream encoded by the lossless compression method.
  • An information processing system configured to perform scaling of the distribution device for distribution.
  • the system further comprises a charge processing device that performs charge processing on the second information processing device,
  • the distribution device is configured to allow the distribution of the audio stream after a predetermined time has elapsed since the generation of the audio stream is started according to the charge of the charging process.
  • (16) or (17) The information processing system described in. (19) The information processing apparatus according to any one of (16) to (18), wherein the distribution device is configured to allow the distribution of the audio stream after the generation of the audio stream is finished according to a charge of the charging process. system.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)

Abstract

本開示は、可逆圧縮方式で符号化されたオーディオストリームを配信する配信装置のスケーリングを適切に行うことができるようにする情報処理装置および情報処理方法、並びに情報処理システムに関する。 オリジナル配信サーバは、losslessDSD方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、オーディオストリームをプレミアムクライアントに配信するプレミアムサーバのスケーリングを行う。本開示は、例えば、オリジナル配信サーバ等に適用することができる。

Description

情報処理装置および情報処理方法、並びに情報処理システム
 本開示は、情報処理装置および情報処理方法、並びに情報処理システムに関し、特に、可逆圧縮方式で符号化されたオーディオストリームを配信する配信装置のスケーリングを適切に行うことができるようにした情報処理装置および情報処理方法、並びに情報処理システムに関する。
  近年、インターネット上のストリーミングサービスの主流がOTT-V(Over The Top Video)となっている。この基盤技術として普及し始めているのがMPEG-DASH(Moving Picture Experts Group phase - Dynamic Adaptive Streaming over HTTP)である(例えば、非特許文献1参照)。
 MPEG-DASHでは、サーバが1本の動画コンテンツ用にビットレートが異なる動画データ群を用意し、クライアントがネットワーク帯域の状況に応じて最適なビットレートの動画データ群を要求することにより、適応型のストリーミング配信が実現される。
 また、現状のMPEG-DASHでは、動画コンテンツの符号化方式として、事前にビットレートが予測可能な符号化方式が想定されている。具体的には、オーディオストリームの符号化方式として、PCM(Pulse Code Modulation)方式でA/D(Analog/Digital)変換されたオーディオデジタル信号を、固定サイズのバッファでアンダーフローやオーバーフローが発生しないように符号化される非可逆圧縮方式などが想定されている。従って、予測ビットレートに基づいて、動画コンテンツを配信するサーバのスケーリングが行われる。
 また、近年、CD(Compact Disc)の音源より高音質のハイレゾオーディオが注目されている。ハイレゾオーディオのA/D変換方式としては、DSD(Direct Stream Digital)方式などがある。DSD方式は、Super Audio CD (SA-CD)の記録再生方式として採用された方式であり、1ビットデジタルシグマ変調を基礎とした方式である。具体的には、DSD方式では、時間軸を利用して「1」と「0」の変化点の密度でオーディオアナログ信号の情報が表現される。従って、ビット数に依存しない高分解能の記録再生を実現することができる。
 しかしながら、DSD方式では、オーディオアナログ信号の波形に応じてオーディオデジタル信号の「1」と「0」のパターンが変化する。従って、DSD方式でA/D変換されたオーディオデジタル信号を「1」と「0」のパターンに基づいて可逆圧縮符号化するlosslessDSD方式等では、オーディオアナログ信号の波形に応じて符号化後のオーディオデジタル信号のビット発生量が変動する。よって、事前にビットレートを予測することは困難である。
MPEG-DASH(Dynamic Adaptive Streaming over HTTP)(URL:http://mpeg.chiariglione.org/standards/mpeg-dash/media-presentation-description-and-segment-formats/text-isoiec-23009-12012-dam-1)
 以上により、現状のMPEG-DASHでは、losslessDSD方式などの可逆圧縮方式で符号化された、ビットレートの予測が不可能なオーディオストリームを配信する配信サーバのスケーリングを適切に行うことは困難である。
 本開示は、このような状況に鑑みてなされたものであり、可逆圧縮方式で符号化されたオーディオストリームを配信する配信装置のスケーリングを適切に行うことができるようにするものである。
 本開示の第1の側面の情報処理装置は、可逆圧縮方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、前記オーディオストリームを他の情報処理装置に配信する配信装置のスケーリングを行うスケーリング部を備える情報処理装置である。
 本開示の第1の側面の情報処理方法は、本開示の第1の側面の情報処理装置に対応する。
 本開示の第1の側面においては、可逆圧縮方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、前記オーディオストリームを他の情報処理装置に配信する配信装置のスケーリングが行われる。
 本開示の第2の側面の情報処理システムは、第1の情報処理装置と、第2の情報処理装置と、配信装置とを備え、前記第1の情報処理装置は、可逆圧縮方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、前記オーディオストリームを前記第2の情報処理装置に配信する前記配信装置のスケーリングを行うように構成された情報処理システムである。
 本開示の第2の側面においては、第1の情報処理装置と、第2の情報処理装置と、配信装置とが備えられ、前記第1の情報処理装置により、可逆圧縮方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、前記オーディオストリームを前記第2の情報処理装置に配信する前記配信装置のスケーリングが行われる。
 なお、第1の側面の情報処理装置は、コンピュータにプログラムを実行させることにより実現することができる。
 また、第1の側面の情報処理装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
 本開示の第1および第2の側面によれば、可逆圧縮方式で符号化されたオーディオストリームを配信する配信装置のスケーリングを適切に行うことができる。
 なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本開示を適用した情報処理システムの第1実施の形態の構成例を示すブロック図である。 DSD方式を説明する図である。 図1のファイル生成装置の構成例を示すブロック図である。 第1実施の形態におけるMPDファイルの第1の記述例を示す図である。 第1実施の形態におけるMPDファイルの第2の記述例を示す図である。 プレミアムクライアントの構成例を示すブロック図である。 プレミアムサービス購入処理を説明するフローチャートである。 第1実施の形態におけるファイル生成処理を説明するフローチャートである。 プレミアム配信準備処理を説明するフローチャートである。 第1実施の形態におけるMPDファイル更新処理を説明するフローチャートである。 第1実施の形態における再生処理を説明するフローチャートである。 プレミアムサービス、準プレミアムサービス、およびオンデマンドサービスを説明する図である。 第2実施の形態におけるメディアセグメントファイルの構成例を示す図である。 図13のemsgボックスの記述例を示す図である。 第2実施の形態におけるファイル生成処理を説明するフローチャートである。 第3実施の形態におけるemsgボックスの記述例を示す図である。 第3実施の形態におけるファイル生成処理を説明するフローチャートである。 第4実施の形態におけるemsgボックスの記述例を示す図である。 第5実施の形態におけるMPDファイルの記述例を示す図である。 第6実施の形態におけるMPDファイルの第1の記述例を示す図である。 第6実施の形態におけるMPDファイルの第2の記述例を示す図である。 第6実施の形態におけるメディアセグメントファイルの構成例を示す図である。 可逆圧縮符号化部の構成例を示すブロック図である。 データ発生カウントテーブルの例を示す図である。 変換テーブルtable1の例を示す図である。 可逆圧縮復号部の構成例を示すブロック図である。 コンピュータのハードウエアの構成例を示すブロック図である。
 以下、本開示を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
 1.第1実施の形態:情報処理システム(図1乃至図12)
 2.第2実施の形態:情報処理システム(図13乃至図15)
 3.第3実施の形態:情報処理システム(図16および図17)
 4.第4実施の形態:情報処理システム(図18)
 5.第5実施の形態:情報処理システム(図19)
 6.第6実施の形態:情報処理システム(図20乃至図22)
 7.losslessDSD方式の説明(図23乃至図26)
 8.第7実施の形態:コンピュータ(図27)
 <第1実施の形態>
 (情報処理システムの第1実施の形態の構成例)
 図1は、本開示を適用した情報処理システムの第1実施の形態の構成例を示すブロック図である。
 図1の情報処理システム10は、ファイル生成装置11、管理サーバ12、オリジナル配信サーバ13(情報処理装置)、プレミアムサーバ14-1乃至14-L(配信装置)、準プレミアムサーバ15-1乃至15-M(配信装置)、オンデマンドサーバ16-1乃至16-N(配信装置)、プレミアムクライアント17-1乃至17-P(情報処理装置)、準プレミアムクライアント18-1乃至18-Q(情報処理装置)、オンデマンドクライアント19-1乃至19-R(情報処理装置)、ウェブサーバ20、および課金サーバ21により構成される。
 図1の例では、L乃至NおよびP乃至Rは、2以上の整数であるものとするが、1であってもよい。また、以下では、プレミアムサーバ14-1乃至14-Lのそれぞれを特に区別する必要がない場合、それらをまとめてプレミアムサーバ14という。同様に、準プレミアムサーバ15-1乃至15-M、オンデマンドサーバ16-1乃至16-N、プレミアムクライアント17-1乃至17-P、準プレミアムクライアント18-1乃至18-Q、オンデマンドクライアント19-1乃至19-Rをまとめて、準プレミアムサーバ15、オンデマンドサーバ16、プレミアムクライアント17、準プレミアムクライアント18、オンデマンドクライアント19という。
 情報処理システム10では、ファイル生成装置11により生成された動画コンテンツのファイルが、プレミアムサービスでプレミアムクライアント17に配信され、準プレミアムサービスで準プレミアムクライアント18に配信され、オンデマンドサービスでオンデマンドクライアント19に配信される。
 なお、プレミアムサービスとは、動画コンテンツの取得開始時刻(イベント発生時刻)から取得終了時刻までの間、動画コンテンツのファイルの配信の開始を許可するサービスである。このプレミアムサービスにより、視聴者は、動画コンテンツのライブ視聴を行うことができる。
 また、準プレミアムサービスとは、動画コンテンツの取得開始時刻から所定の時間経過後に動画コンテンツのファイルの配信を許可するサービスである。この準プレミアムサービスにより、視聴者は、動画コンテンツの取得開始時刻から所定の時間が経過した後、動画コンテンツをライブ視聴することができる。
 オンデマンドサービスとは、動画コンテンツの取得終了後に、記憶されている動画コンテンツのファイルの配信を許可するサービスである。このオンデマンドサービスにより、視聴者は、動画コンテンツの取得終了後に動画コンテンツを視聴することができる。
 情報処理システム10のファイル生成装置11は、動画コンテンツのビデオアナログ信号とオーディオアナログ信号をA/D変換し、ビデオデジタル信号とオーディオデジタル信号を生成する。そして、ファイル生成装置11は、動画コンテンツのビデオデジタル信号やオーディオデジタル信号等の信号を、所定の符号化方式で、複数のビットレートで符号化し、符号化ストリームを生成する。ここでは、オーディオデジタル信号の符号化方式は、losslessDSD方式またはMPEG-4(Moving Picture Experts Group phase 4)方式であるものとする。MPEG-4方式は、PCM方式でA/D変換されたオーディオデジタル信号を、固定サイズのバッファでアンダーフローやオーバーフローが発生しないように非可逆圧縮する方式である。
 ファイル生成装置11は、ビットレートごとに、生成された符号化ストリームを、セグメントと呼ばれる数秒から10秒程度の時間単位でファイル化する。ファイル生成装置11は、その結果生成されたセグメントファイルを管理サーバ12にアップロードする。
 ファイル生成装置11はまた、動画コンテンツを管理するMPD(Media Presentation Description)ファイル(管理ファイル)を生成し、管理サーバ12にアップロードする。
 管理サーバ12は、ファイル生成装置11によりアップロードされたMPDファイルとセグメントファイルを記憶する。管理サーバ12は、MPDファイルに含まれるビットレート情報と最大ビットレートを抽出する。ビットレート情報は、セグメントファイルに格納されるオーディオデジタル信号の符号化ストリームであるオーディオストリームの実際のビットレートを表す情報であり、そのビットレートの所定の期間の平均値を含む。また、最大ビットレートは、オーディオストリームのビットレートとしてとり得る値の最大値である。
 また、管理サーバ12は、ウェブサーバ20から配信クライアント数と配信開始時刻を取得する。配信クライアント数とは、配信の開始を要求したプレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19の数である。また、配信開始時刻とは、各プレミアムクライアント17、各準プレミアムクライアント18、および各オンデマンドクライアント19の配信の開始を要求した時刻である。
 管理サーバ12は、ビットレート情報、最大ビットレート、配信クライアント数、および配信開始時刻を、HTTP(HyperText Transfer Protocol) headerやURL(Uniform Resource Locator) query parameterとして、オリジナル配信サーバ13に送信する。また、管理サーバ12は、記憶しているMPDファイルとセグメントファイルを、オリジナル配信サーバ13に送信する。
 オリジナル配信サーバ13は、管理サーバ12から送信されてくるMPDファイルとセグメントファイルを記憶する。オリジナル配信サーバ13は、管理サーバ12から送信されてくる最大ビットレートを、プレミアムサービスの想定帯域に決定する。オリジナル配信サーバ13は、プレミアムクライアント17の許容数と想定帯域とに基づいて、その許容数のプレミアムクライアント17に対して想定帯域でのオーディオストリームの通信を保証するために必要なL個のプレミアムサーバ14を用意する。
 また、オリジナル配信サーバ13は、最大ビットレートと、動画コンテンツの取得開始時刻から準プレミアムサービスでの配信が許可される時刻までの所定のビットレート情報とに基づいて、最大ビットレートより小さいビットレートを、準プレミアムサービスの想定帯域に決定する。オリジナル配信サーバ13は、準プレミアムクライアント18の許容数と想定帯域とに基づいて、その許容数の準プレミアムクライアント18に対して想定帯域でのオーディオストリームの通信を保証するために必要なM個の準プレミアムサーバ15を用意する。
 さらに、オリジナル配信サーバ13は、所定のビットレート情報が表す実際のビットレートの平均値をオンデマンドサービスの想定帯域に決定する。オリジナル配信サーバ13は、所定数のオンデマンドクライアント19に対して想定帯域でのオーディオストリームの通信を保証するために必要なN個のオンデマンドサーバ16を用意する。
 また、オリジナル配信サーバ13(スケーリング部)は、ビットレート情報、プレミアムサービスの配信クライアント数(配信の開始を要求したプレミアムクライアント17の数)、および配信開始時刻に基づいて、プレミアムサーバ14のスケーリングを行う。オリジナル配信サーバ13は、スケーリング後のプレミアムサーバ14、即ちL個のプレミアムサーバ14のうちの使用するプレミアムサーバ14に、記憶しているMPDファイルとセグメントファイルを送信する。
 さらに、オリジナル配信サーバ13は、ビットレート情報、準プレミアムサービスの配信クライアント数(配信の開始を要求した準プレミアムクライアント18の数)、および配信開始時刻に基づいて、準プレミアムサーバ15のスケーリングを行う。オリジナル配信サーバ13は、スケーリング後の準プレミアムサーバ15、即ちM個の準プレミアムサーバ15のうちの使用する準プレミアムサーバ15に、記憶しているMPDファイルとセグメントファイルを送信する。
 また、オリジナル配信サーバ13は、オンデマンドサービスの配信クライアント数(配信の開始を要求したオンデマンドクライアント19の数)と配信開始時刻に基づいて、オンデマンドサーバ16のスケーリングを行う。オリジナル配信サーバ13は、スケーリング後のオンデマンドサーバ16、即ちN個のオンデマンドサーバ16のうちの使用するオンデマンドサーバ16に、記憶しているMPDファイルとセグメントファイルを送信する。
 スケーリング後のプレミアムサーバ14は、オリジナル配信サーバ13から送信されてくるMPDファイルとセグメントファイルを記憶し、DASHサーバとして機能する。スケーリング後のプレミアムサーバ14は、プレミアムサービスで、記憶しているMPDファイルやセグメントファイルをプレミアムクライアント17に配信する。
 具体的には、スケーリング後のプレミアムサーバ14は、動画コンテンツの取得開始時、即ち動画コンテンツのMPDファイルやセグメントファイルの生成開始時に、プレミアムサービスのライセンスであるプレミアムライセンスを取得しているプレミアムクライアント17へのMPDファイルやセグメントファイルの配信を許可する。なお、本明細書では、動画コンテンツを取得して再生する際に必要な権利情報をライセンスと記述する。ここでは、ライセンスが、ユーザ認証に用いられる情報、ユーザアカウントと機器認証に用いられる情報、サーバ側の機器認証プロトコルまたはユーザ認証プロトコルにより発生するトークンの取得に用いられる情報などの動画コンテンツを取得する際に必要な権利情報であるものとする。なお、ライセンスは、DRM(Digital Rights Management)で保護されている動画コンテンツを再生するための合鍵とユーセージなどの動画コンテンツを再生する際に必要な権利情報であってもよい。そして、スケーリング後のプレミアムサーバ14は、動画コンテンツの取得開始時刻から取得終了時刻までの間にプレミアムクライアント17から要求があった場合、記憶しているMPDファイルやセグメントファイルを、インターネットを介してプレミアムクライアント17に配信する。
 また、スケーリング後の準プレミアムサーバ15は、オリジナル配信サーバ13から送信されてくるMPDファイルとセグメントファイルを記憶し、DASHサーバとして機能する。スケーリング後の準プレミアムサーバ15は、準プレミアムサービスで、記憶しているMPDファイルやセグメントファイルを準プレミアムクライアント18に配信する。
 具体的には、スケーリング後の準プレミアムサーバ15は、動画コンテンツの取得が開始されてから所定の時間経過後、即ち動画コンテンツのMPDファイルやセグメントファイルの生成が開始されてから所定の時間経過後に、準プレミアムサービスのライセンスである準プレミアムライセンスを取得している準プレミアムクライアント18へのMPDファイルやセグメントファイルの配信を許可する。そして、スケーリング後の準プレミアムサーバ15は、動画コンテンツの取得開始時刻の所定の時間後から取得終了時刻までの間に準プレミアムクライアント18から要求があった場合、記憶しているMPDファイルやセグメントファイルを、インターネットを介して準プレミアムクライアント18に配信する。
 さらに、スケーリング後のオンデマンドサーバ16は、オリジナル配信サーバ13から送信されてくるMPDファイルとセグメントファイルを記憶し、DASHサーバとして機能する。スケーリング後のオンデマンドサーバ16は、オンデマンドサービスで、記憶しているMPDファイルやセグメントファイルをオンデマンドクライアント19に配信する。
 具体的には、スケーリング後のオンデマンドサーバ16は、動画コンテンツの取得終了後、即ち動画コンテンツのMPDファイルやセグメントファイルの生成終了後に、オンデマンドサービスのライセンスであるオンデマンドライセンスを取得しているオンデマンドクライアント19へのMPDファイルやセグメントファイルの配信を許可する。そして、スケーリング後のオンデマンドサーバ16は、動画コンテンツの取得終了後にオンデマンドクライアント19から要求があった場合、記憶しているMPDファイルやセグメントファイルを、インターネットを介してオンデマンドクライアント19に配信する。
 プレミアムクライアント17は、プレミアムサービスでの配信をウェブサーバ20に要求するDASHクライアントである。プレミアムクライアント17は、その要求に応じてウェブサーバ20から送信されてくる、プレミアムサーバ14を特定するプレミアムサーバ情報とプレミアムライセンスを取得する。
 また、プレミアムクライアント17は、ウェブサーバ20に動画コンテンツの配信の開始を要求するとともに、プレミアムサーバ情報とプレミアムライセンスとに基づいて、プレミアムサーバ14にMPDファイルの配信を要求する。また、プレミアムクライアント17は、その要求に応じてプレミアムサーバ14から配信されてくるMPDファイルを受信し、そのMPDファイル、プレミアムサーバ情報、およびプレミアムライセンスに基づいて、プレミアムサーバ14にセグメントファイルの配信を要求する。そして、プレミアムクライアント17は、その要求に応じてプレミアムサーバ14から配信されてくるセグメントファイルを受信する。
 プレミアムクライアント17は、受信されたセグメントファイルを再生する。具体的には、プレミアムクライアント17は、受信されたセグメントファイルに格納される符号化ストリームを復号する。プレミアムクライアント17は、復号の結果得られるビデオデジタル信号に基づいて、図示せぬディスプレイ等の表示装置に画像を表示させる。また、プレミアムクライアント17は、復号の結果得られるオーディオデジタル信号をD/A変換し、その結果得られるオーディオアナログ信号に基づいて、図示せぬスピーカ等の出力部に音声を出力させる。
 準プレミアムクライアント18は、準プレミアムサービスでの配信をウェブサーバ20に要求するDASHクライアントである。準プレミアムクライアント18は、その要求に応じてウェブサーバ20から送信されてくる、準プレミアムサーバ15を特定する準プレミアムサーバ情報と準プレミアムライセンスとを取得する。
 また、準プレミアムクライアント18は、ウェブサーバ20に動画コンテンツの配信の開始を要求するとともに、準プレミアムサーバ情報と準プレミアムライセンスとに基づいて、準プレミアムサーバ15にMPDファイルの配信を要求する。また、準プレミアムクライアント18は、その要求に応じて準プレミアムサーバ15から配信されてくるMPDファイルを受信し、そのMPDファイル、準プレミアムサーバ情報、および準プレミアムライセンスに基づいて、準プレミアムサーバ15にセグメントファイルの配信を要求する。そして、準プレミアムクライアント18は、その要求に応じて準プレミアムサーバ15から配信されてくるセグメントファイルを受信し、そのセグメントファイルをプレミアムクライアント17と同様に再生する。
 オンデマンドクライアント19は、オンデマンドサービスでの配信をウェブサーバ20に要求するDASHクライアントである。オンデマンドクライアント19は、その要求に応じてオンデマンドサーバ16を特定するオンデマンドサーバ情報とオンデマンドライセンスとを取得する。
 また、オンデマンドクライアント19は、ウェブサーバ20に動画コンテンツの配信の開始を要求するとともに、オンデマンドサーバ情報とオンデマンドライセンスとに基づいて、オンデマンドサーバ16にMPDファイルの配信を要求する。また、オンデマンドクライアント19は、その要求に応じてオンデマンドサーバ16から配信されてくるMPDファイルを受信し、そのMPDファイル、オンデマンドサーバ情報、およびオンデマンドライセンスに基づいて、オンデマンドサーバ16にセグメントファイルの配信を要求する。そして、オンデマンドクライアント19は、その要求に応じてオンデマンドサーバ16から配信されてくるセグメントファイルを受信し、そのセグメントファイルをプレミアムクライアント17と同様に再生する。
 ウェブサーバ20は、プレミアムクライアント17からの要求に応じて、プレミアムクライアント17に対するプレミアムサービスの料金の課金処理を課金サーバ21に要求する。ウェブサーバ20は、課金サーバ21から供給される課金処理の完了の通知に応じて、プレミアムサーバ情報とプレミアムライセンスとを生成し、プレミアムクライアント17に送信する。
 同様に、ウェブサーバ20は、準プレミアムクライアント18からの要求に応じて、準プレミアムクライアント18に対する準プレミアムサービスの料金の課金処理を課金サーバ21に要求する。ウェブサーバ20は、課金サーバ21から供給される課金処理の完了の通知に応じて、準プレミアムサーバ情報と準プレミアムライセンスとを生成し、準プレミアムクライアント18に送信する。
 また、ウェブサーバ20は、オンデマンドクライアント19からの要求に応じて、オンデマンドクライアント19に対するオンデマンドサービスの料金の課金処理を課金サーバ21に要求する。ウェブサーバ20は、課金サーバ21から供給される課金処理の完了の通知に応じて、オンデマンドサーバ情報とオンデマンドライセンスとを生成し、オンデマンドクライアント19に送信する。
 さらに、ウェブサーバ20は、動画コンテンツの取得開始時刻から取得終了時刻までの間に、動画コンテンツの配信の開始を要求したプレミアムクライアント17の数、および、配信開始時刻を管理サーバ12に供給する。また、ウェブサーバ20は、動画コンテンツの取得開始時刻の所定の時間後から取得終了時刻までの間、動画コンテンツの配信の開始を要求した準プレミアムクライアント18の数、および、配信開始時刻を管理サーバ12に供給する。さらに、ウェブサーバ20は、動画コンテンツの取得終了後に動画コンテンツの配信の開始を要求したオンデマンドクライアント19の数、および、配信開始時刻を管理サーバ12に供給する。
 課金サーバ21(課金処理装置)は、ウェブサーバ20から供給される要求に応じて、プレミアムクライアント17に対するプレミアムサービスの料金の課金処理を行う。また、課金サーバ21は、ウェブサーバ20から供給される要求に応じて、準プレミアムクライアント18に対する準プレミアムサービスの料金の課金処理を行う。さらに、課金サーバ21は、ウェブサーバ20から供給される要求に応じて、オンデマンドクライアント19に対するオンデマンドサービスの料金の課金処理を行う。なお、課金処理の料金は、プレミアムサービス、準プレミアムサービス、オンデマンドサービスの順に高い。課金サーバ21は、課金処理が完了したとき、課金処理の完了をウェブサーバ20に通知する。
 なお、情報処理システム10における通信は、無線で行われても有線で行われてもよい。
 (DSD方式の説明)
 図2は、DSD方式を説明する図である。
 図2の横軸は、時刻を表し、縦軸は、各信号の値を表す。
 図2の例では、オーディオアナログ信号の波形が正弦波となっている。このようなオーディオアナログ信号がPCM方式でA/D変換される場合、図2に示すように、各サンプリング時刻のオーディオアナログ信号の値が、その値に応じた固定数ビットのオーディオデジタル信号に変換される。
 これに対して、オーディオアナログ信号がDSD方式でA/D変換される場合、各サンプリング時刻のオーディオアナログ信号の値は、その値に応じた「0」と「1」の変化点の密度のオーディオデジタル信号に変換される。具体的には、オーディオアナログ信号の値が大きいほどオーディオデジタル信号の変化点の密度が高く、オーディオアナログ信号の値が小さいほどオーディオデジタル信号の変化点の密度が低い。即ち、オーディオアナログ信号の値に応じてオーディオデジタル信号の「0」と「1」のパターンが変化する。
 従って、このオーディオデジタル信号を、「0」と「1」のパターンに基づいて可逆圧縮符号化するlosslessDSD方式で符号化して得られるオーディオストリームのビット発生量は、オーディオアナログ信号の波形に応じて変動する。よって、事前にビットレートを予測することは困難である。
 (ファイル生成装置の構成例)
 図3は、図1のファイル生成装置の構成例を示すブロック図である。
 図3のファイル生成装置11は、取得部31、符号化部32、セグメントファイル生成部33、MPDファイル生成部34、およびアップロード部35により構成される。
 ファイル生成装置11の取得部31は、動画コンテンツのビデオアナログ信号やオーディオアナログ信号を取得してA/D変換を行う。取得部31は、A/D変換の結果得られるビデオデジタル信号やオーディオデジタル信号、その他に取得された動画コンテンツの信号等の信号を、符号化部32に供給する。符号化部32は、取得部31から供給される動画コンテンツの信号を、それぞれ、複数のビットレートで符号化し、符号化ストリームを生成する。符号化部32は、生成された符号化ストリームをセグメントファイル生成部33に供給する。
 セグメントファイル生成部33は、符号化部32から供給される符号化ストリームを、ビットレートごとに、セグメント単位でファイル化する。セグメントファイル生成部33は、その結果生成されたセグメントファイルをアップロード部35に供給する。
 MPDファイル生成部34は、基準期間ごとに、符号化部32によりlosslessDSD方式で符号化されたオーディオストリームの実際のビットレートの積算値から平均値を算出することにより、基準期間だけ増加した所定の期間のオーディオストリームの実際のビットレートの平均値を算出する。
 そして、MPDファイル生成部34は、基準期間ごとに、算出された平均値と、その平均値に対応する所定の期間とを、ビットレート情報として生成する。MPDファイル生成部34は、ビットレート情報、オーディオストリームの符号化方式を示す情報、オーディオストリームの最大ビットレート、ビデオデジタル信号の符号化ストリームであるビデオストリームのビットレートなどを含むMPDファイルを生成する。MPDファイル生成部34は、MPDファイルをアップロード部35に供給する。
 アップロード部35は、セグメントファイル生成部33から供給されるセグメントファイルと、MPDファイル生成部34から供給されるMPDファイルとを、図1の管理サーバ12にアップロードする。
 (MPDファイルの第1の記述例)
 図4は、MPDファイルの第1の記述例を示す図である。
 なお、図4では、説明の便宜上、MPDファイルの記述のうちの、オーディオストリームのセグメントファイルを管理する記述のみを図示している。このことは、後述する図5、図20、および図21においても同様である。
 MPDファイルには、動画コンテンツの符号化方式やビットレート、画像のサイズ、音声の言語などの情報が階層化されて、XML形式で記述される。
 図4に示すように、MPDファイルには、ピリオド(Period)、アダプテーションセット(AdaptationSet)、リプレゼンテーション(Representation)、セグメントインフォ(Segment)等の要素が階層的に含まれている。
 MPDファイルでは、自分が管理する動画コンテンツが所定の時間範囲(例えば、番組、CM(Commercial)などの単位)で分割される。ピリオド要素は、分割された動画コンテンツごとに記述される。ピリオド要素は、対応する動画コンテンツに共通の情報として、動画コンテンツの再生開始時刻、動画コンテンツのセグメントファイルを格納する管理サーバ12のURL(Uniform Resource Locator),MinBufferTimeなどの情報を有する。MinBufferTimeは、仮想バッファのバッファ時間を示す情報であり、図4の例では、0に設定される。
 アダプテーションセット要素は、ピリオド要素に含まれ、そのピリオド要素に対応する動画コンテンツの同一の符号化ストリームのセグメントファイル群に対応するリプレゼンテーション要素をグルーピングする。リプレゼンテーション要素は、例えば、対応するセグメントファイル群のデータの種類によってグルーピングされる。図4の例では、ビットレートの異なる3種類のオーディオストリームのセグメントファイルのそれぞれに対応する3つのリプレゼンテーション要素が、1つのアダプテーションセット要素によりグルーピングされている。
 アダプテーションセット要素は、対応するセグメントファイル群のグループに共通の情報として、メディア種別、言語、字幕または吹き替えなどの用途、ビットレートの最大値であるmaxBandwidthおよび最小値であるMinBandwidthなどを有する。
 なお、図4の例では、ビットレートの異なる3種類のオーディオストリームの符号化方式が全てlosslessDSD方式である。従って、オーディオストリームのセグメントファイルのアダプテーションセット要素は、グループに共通の情報として、オーディオストリームの符号化方式がlosslessDSD方式であることを示す<codecs=”dsd1”>も有する。
 また、オーディオストリームの符号化方式が、MPEG-4方式などの固定サイズのバッファでアンダーフローやオーバーフローが発生しないように符号化される方式(以下、固定方式という)であるかどうかを示すディスクリプタである<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”>も有する。
 <SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”>の値(value)は、オーディオストリームの符号化方式が固定方式であることを示す場合trueに設定され、固定方式ではないこと示す場合、falseに設定される。従って、図4の例では、<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”>の値はfalseである。
 また、アダプテーションセット要素は、セグメントの長さおよびセグメントファイルのファイル名のルールを示すSegmentTemplateを有する。SegmentTemplateには、timescale, duration, initialization、およびmediaが記述される。
 timescaleは、1秒を表す値であり、durationは、timescaleを1秒としたときのセグメント長の値である。図4の例では、timescaleは44100であり、durationは88200である。従って、セグメント長は2秒である。
 initializationは、オーディオストリームのセグメントファイルのうちの初期化セグメントファイルの名前のルールを示す情報である。図4の例では、initializationは「$Bandwidth$init.mp4」である。従って、オーディオストリームの初期化セグメントファイルの名前は、リプレゼンテーション要素が有するBandwidthにinitを付加したものである。
 また、mediaは、オーディオストリームのセグメントファイルのうちのメディアセグメントファイルの名前のルールを示す情報である。図4の例では、mediaは「$Bandwidth$-$Number$.mp4」である。従って、オーディオストリームのメディアセグメントファイルの名前は、リプレゼンテーション要素が有するBandwidthに「-」を付加し、順次番号が付加されたものである。
 リプレゼンテーション要素は、それをグルーピングするアダプテーションセット要素に含まれ、上位層のピリオド要素に対応する動画コンテンツの同一の符号化ストリームのセグメントファイル群ごとに記述される。リプレゼンテーション要素は、対応するセグメントファイル群に共通の情報として、ビットレートを示すBandwidth、AveBandwidth,DurationForAveBandwidth、画像のサイズなどを有する。
 なお、符号化方式がlosslessDSD方式である場合、オーディオストリームの実際のビットレートは予測不可能である。従って、オーディオストリームに対応するリプレゼンテーション要素には、対応するセグメントファイル群に共通のビットレートとして、オーディオストリームの最大ビットレートが記述される。
 図4の例では、3種類のオーディオストリームの最大ビットレートは、2.8Mbps,5.6Mbps、および11.2Mbpsである。従って、3つのリプレゼンテーション要素のBandwidthは、それぞれ、2800000,5600000,11200000をBandwidthである。また、アダプテーションセット要素のMinBandwidthは2800000であり、maxBandwidthは11200000である。
 AveBandwidthは、リプレゼンテーション要素に対応するオーディオストリームのビットレート情報のうちの平均値を示す情報であり、DurationForAveBandwidthは、所定の期間を示す情報である。
 図4の例では、MPDファイル生成部34は、先頭から600秒間のオーディオストリームの実際のビットレートの平均値を算出している。従って、3つのリプレゼンテーション要素が有するDurationForAveBandwidthは、600秒を示すPT600Sである。
 また、1つ目のリプレゼンテーション要素に対応する最大ビットレートが2.8MbpsであるlosslessDSD方式のオーディオストリームの先頭から600秒間の実際のビットレートの平均値は、2Mbpsである。従って、1つ目のリプレゼンテーション要素が有するAveBandwidthは2000000である。
 2つ目のリプレゼンテーション要素に対応する最大ビットレートが5.6MbpsであるlosslessDSD方式のオーディオストリームの先頭から600秒間の実際のビットレートの平均値は、4Mbpsである。従って、2つ目のリプレゼンテーション要素が有するAveBandwidthは4000000である。
 3つ目のリプレゼンテーション要素に対応する最大ビットレートが11.2MbpsであるlosslessDSD方式のオーディオストリームの先頭から600秒間の実際のビットレートの平均値は、8Mbpsである。従って、3つ目のリプレゼンテーション要素が有するAveBandwidthは8000000である。
 セグメントインフォ要素は、リプレゼンテーション要素に含まれ、そのリプレゼンテーション要素に対応するセグメントファイル群の各セグメントファイルに関する情報を有する。
 なお、図4の例では、アダプテーションセット要素に、<codecs=”dsd1”>と<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”value=”false”>が記述されたが、各リプレゼンテーション要素に記述されるようにしてもよい。
 (MPDファイルの第2の記述例)
 図5は、MPDファイルの第2の記述例を示す図である。
 図5の例では、ビットレートの異なる3種類のオーディオストリームのうちの2種類のオーディオストリームの符号化方式がlosslessDSD方式であり、1種類のオーディオストリームの符号化方式が、MPEG-4方式である。
 従って、図5のMPDファイルでは、アダプテーションセット要素が、<codecs=”dsd1”>と<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”value=”false”>を有さない。その代わりに、リプレゼンテーションセット要素が、オーディオストリームの符号化方式を示す情報、および、<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”>を有する。
 具体的には、図5の例では、1つ目のリプレゼンテーションセット要素に対応するオーディオストリームの符号化方式がlosslessDSD方式であり、最大ビットレートが2.8Mbpsである。また、1つ目のリプレゼンテーション要素に対応するビットストリーム情報のうちの平均値は2Mbpsであり、所定の期間は600秒である。従って、1つ目のリプレゼンテーションセット要素は、<codecs=”dsd1”>、<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”value=”false”>、Bandwidthとしての2800000、AveBandwidthとしての2000000、DurationForAveBandwidthとしてのPT600Sを有する。
 また、図5の例では、2つ目のリプレゼンテーションセット要素に対応するオーディオストリームの符号化方式がlosslessDSD方式であり、最大ビットレートが5.6Mbpsである。また、2つ目のリプレゼンテーション要素に対応するビットストリーム情報のうちの平均値は4Mbpsであり、所定の期間は600秒である。従って、2つ目のリプレゼンテーションセット要素は、<codecs=”dsd1”>、<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”value=”false”>、Bandwidthとしての5600000、AveBandwidthとしての4000000、DurationForAveBandwidthとしてのPT600Sを有する。
 さらに、3つ目のリプレゼンテーションセット要素に対応するオーディオストリームの符号化方式がMPEG-4方式であり、実際のビットレートが128kbpsである。従って、1つ目のリプレゼンテーションセット要素は、<codecs=”mp4a”>、<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”value=”true”>、およびBandwidth としての128000を有する。なお、<codecs=”mp4a”>は、オーディオストリームの符号化方式がMPEG-4方式であることを示す情報である。
 以上のように、図4や図5のMPDファイルは、オーディオストリームの符号化方式として固定方式ではない方式が想定されていないMPDファイルに対して、<codecs=”dsd1”>と<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”>のほか、AveBandwidthとDurationForAveBandwidthを記述可能にしたものである。
 従って、図4や図5のMPDファイルは、オーディオストリームの符号化方式として固定方式ではない方式が想定されていないMPDファイルと互換性を有する。また、管理サーバ12、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19は、MPDファイルに記述された<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015”value=”false”>に基づいて、オーディオストリームの符号化方式が固定方式ではないことを認識することができる。
 また、図示は省略するが、図4や図5のMPDファイルには、MPDファイルの更新間隔として基準期間を示すminimumUpdatePeriodが含まれる。そして、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19は、minimumUpdatePeriodが示す更新間隔でMPDファイルを更新する。従って、MPDファイル生成部34は、MPDファイルに記述するminimumUpdatePeriodを変更するだけで、MPDファイルの更新間隔を容易に変更することができる。
 なお、MPDファイル生成部34は、動画コンテンツの最後のオーディオストリームのビットレートまで積算された積算値から平均値を算出する場合、DurationForAveBandwidthとして動画コンテンツの時間を記述してもよいし、DurationForAveBandwidthの記述を省略してもよい。
 また、図4や図5のAveBandwidthとDurationForAveBandwidthは、リプレゼンテーション要素のパラメータとして記述するのではなく、SupplementalProperty descriptorとして記述するようにしてもよい。
 さらに、図4や図5のAveBandwidthの代わりに、所定の期間のオーディオストリームの実際のビットレートの積算値を記述するようにしてもよい。
 (プレミアムクライアントの構成例)
 図6は、図1のプレミアムクライアント17の構成例を示すブロック図である。
 プレミアムクライアント17は、ライセンス取得部60、MPD取得部61、MPD処理部62、セグメントファイル取得部63、バッファ65、復号部66、および出力制御部67により構成される。
 プレミアムクライアント17のライセンス取得部60は、プレミアムサービスでの配信を図1のウェブサーバ20に要求する。ライセンス取得部60は、その要求に応じてウェブサーバ20から送信されてくるプレミアムサーバ情報とプレミアムライセンスを取得する。プレミアムクライアント17は、取得されたプレミアムサーバ情報とプレミアムライセンスをMPD取得部61とセグメントファイル取得部63に供給する。
 MPD取得部61は、ウェブサーバ20に動画コンテンツの配信の開始を要求する。また、MPD取得部61は、ライセンス取得部60から供給されるプレミアムサーバ情報とプレミアムライセンスとに基づいて、プレミアムサーバ14にMPDファイルの配信を要求し、取得する。MPD取得部61は、取得されたMPDファイルをMPD処理部62に供給する。
 MPD処理部62は、MPD取得部61から供給されるMPDファイルを解析する。具体的には、MPD処理部62は、MPDファイルからminimumUpdatePeriodが示す更新間隔を取得する。また、MPD処理部62は、各符号化ストリームのBandwidth、各符号化ストリームを格納するセグメントファイルのURLやファイル名等の取得情報を取得する。
 また、符号化ストリームがオーディオストリームである場合、MPD処理部62は、<SupplementalProperty schemeIdUri=”urn:mpeg:DASH:audio:cbr:2015” >の値に基づいて、その値に対応するオーディオストリームの符号化方式が固定方式であるかどうかを認識する。そして、MPD処理部62は、各オーディオストリームの符号化方式が固定方式であるかどうかを示す符号化方式情報を生成する。
 MPD処理部62は、符号化方式情報が固定方式ではないことを示す場合、オーディオストリームのAveBandwidthを取得し、選択用ビットレートとする。また、符号化方式情報が固定方式であることを示す場合、MPD処理部62は、オーディオストリームのBandwidthを選択用ビットレートとする。
 MPD処理部62は、各ビデオストリームのBandwidthおよび取得情報、並びに、各オーディオストリームの選択用ビットレート、取得情報、および符号化方式情報をセグメントファイル取得部63に供給する。
 セグメントファイル取得部63は、プレミアムサーバ14との間のネットワーク帯域、各ビデオストリームのBandwidth、および各オーディオストリームの選択用ビットレートに基づいて、ビデオストリームのBandwidthとオーディオストリームの選択用ビットレートを選択する。
 そして、セグメントファイル取得部63は、プレミアムサーバ情報、プレミアムライセンス、並びに、選択されたBandwidthのビデオストリームおよび選択用ビットレートのオーディオストリームの再生時刻のセグメントファイルの取得情報に基づいて、そのセグメントファイルの配信を要求する。セグメントファイル取得部63は、その要求に応じてプレミアムサーバ14から送信されてくるセグメントファイルをセグメント単位で取得する。セグメントファイル取得部63は、取得されたセグメントファイルに格納される符号化ストリームをバッファ65に供給して保持させる。
 バッファ65は、セグメントファイル取得部63から供給される符号化ストリームを一時的に保持する。
 復号部66は、バッファ65から符号化ストリームを読み出して復号し、動画コンテンツのビデオデジタル信号やオーディオデジタル信号を生成する。復号部66は、生成されたビデオデジタル信号やオーディオデジタル信号を出力制御部67に供給する。
 出力制御部67は、復号部66から供給されるビデオデジタル信号に基づいて、図示せぬディスプレイ等の表示部に画像を表示させる。また、出力制御部67は、復号部66から供給されるオーディオデジタル信号に対してD/A(Digital/Analog)変換を行う。出力制御部67は、D/A変換の結果得られるオーディオアナログ信号に基づいて、図示せぬスピーカ等の出力部に音声を出力させる。
 なお、準プレミアムクライアント18の構成は、プレミアムサービスが準プレミアムサービスに代わる点、および、配信元が準プレミアムサーバ15である点を除いて、図6のプレミアムクライアント17の構成と同一であるので、説明は省略する。また、オンデマンドクライアント19の構成は、プレミアムサービスがオンデマンドサービスに代わる点、および、配信元がオンデマンドサーバ16である点を除いて、図6のプレミアムクライアント17の構成と同一であるので、説明は省略する。
 (情報処理システムの処理の説明)
 図7は、図1の情報処理システム10のプレミアムサービス購入処理を説明するフローチャートである。
 図7のステップS11において、プレミアムクライアント17のライセンス取得部60(図6)は、プレミアムサービスでの配信を要求する購入リクエストを図1のウェブサーバ20に送信する。
 ステップS21において、ウェブサーバ20は、プレミアムクライアント17から送信されてくる購入リクエストを受信する。ステップS22において、ウェブサーバ20は、既にプレミアムライセンスを送信しているプレミアムクライアント17の数が許容数より小さく、かつ、現在の日時がプレミアムサービスの販売期間内であるかどうかを判定する。
 ステップS22で既にプレミアムライセンスを送信しているプレミアムクライアント17の数が許容数より小さく、かつ、現在の日時がプレミアムサービスの販売期間内であると判定された場合、処理はステップS23に進む。ステップS23において、ウェブサーバ20は、プレミアムクライアント17に対するプレミアムサービスの料金の課金処理を要求する課金リクエストを課金サーバ21に送信する。
 ステップS31において、課金サーバ21は、ウェブサーバ20から送信されてくる課金リクエストを受信する。ステップS32において、課金サーバ21は、プレミアムクライアント17に対するプレミアムサービスの料金の課金処理を行う。ステップS33において、課金処理の完了通知をウェブサーバ20に送信する。
 ステップS24において、ウェブサーバ20は、課金サーバ21から送信されてくる完了通知を受信する。ステップS25において、ウェブサーバ20は、プレミアムサーバ情報とプレミアムライセンスとを生成し、プレミアムクライアント17に送信する。
 ステップS12において、プレミアムクライアント17のライセンス取得部60(図6)は、ウェブサーバ20から送信されてくるプレミアムサーバ情報とプレミアムライセンスを受信し、MPD取得部61とセグメントファイル取得部63に供給する。そして、処理は終了する。
 一方、ステップS23で既にプレミアムライセンスを送信しているプレミアムクライアント17の数が許容数より小さくはない、または、現在の日時がプレミアムサービスの販売期間内ではないと判定された場合、処理は終了する。
 準プレミアムクライアント18が準プレミアムサーバ情報とプレミアムライセンスを受信する準プレミアムサービス購入処理は、プレミアムサービスが準プレミアムサービスに代わる点を除いて、図7のプレミアムサービス購入処理と同様である。
 また、オンデマンドクライアント19がオンデマンドサーバ情報とオンデマンドライセンスを受信するオンデマンドサービス購入処理は、プレミアムサービスがオンデマンドサービスに代わる点、および、ステップS22の判定処理において既にオンデマンドライセンスを送信しているオンデマンドクライアント19の数が許容数より小さいという条件が削除される点を除いて、プレミアムサービス購入処理と同様である。
 なお、プレミアムサービス、準プレミアムサービス、およびオンデマンドサービスの課金方式は、各動画コンテンツに対して課金処理を行うペイパービュー方式であってもよいし、視聴期間に対して課金処理を行うサブスクリプションサービス方式であってもよい。プレミアムライセンス、準プレミアムライセンス、およびオンデマンドライセンスは、課金方式がペイパービュー方式である場合、所定の動画コンテンツの取得および再生を可能にするライセンスであるが、サブスクリプションサービス方式である場合、所定の期間だけ任意の動画コンテンツの取得および再生を可能にするライセンスである。
 図8は、図1のファイル生成装置11のファイル生成処理を説明するフローチャートである。このファイル生成処理は、オーディオストリームの符号化方式の少なくとも1つがlosslessDSD方式である場合に行われる。
 図8のステップS40において、ファイル生成装置11のMPDファイル生成部34は、MPDファイルを生成する。このとき、まだ、オーディオストリームの実際のビットレートの平均値は算出されていないので、例えば、MPDファイルのAveBandwidthには、Bandwidthと同一の値が記述され、DurationForAveBandwidthには、0秒を示すPT0Sが記述される。また、MPDファイルのminimumUpdatePeriodには、例えば基準期間ΔTが設定される。MPDファイル生成部34は、生成されたMPDファイルをアップロード部35に供給する。
 ステップS41において、アップロード部35は、MPDファイル生成部34から供給されるMPDファイルを、管理サーバ12にアップロードする。管理サーバ12にアップロードされたMPDファイルは、オリジナル配信サーバ13に送信され、記憶される。
 ステップS42において、取得部31は、セグメント単位の動画コンテンツのビデオアナログ信号およびオーディオアナログ信号を取得してA/D変換を行う。取得部31は、A/D変換の結果得られるビデオデジタル信号およびオーディオアナログ信号、並びに、その他のセグメント単位の動画コンテンツの信号等の信号を符号化部32に供給する。
 ステップS43において、符号化部32は、複数のビットレートで、取得部31から供給される動画コンテンツの信号を、所定の符号化方式で符号化し、符号化ストリームを生成する。符号化部32は、生成された符号化ストリームをセグメントファイル生成部33に供給する。
 ステップS44において、セグメントファイル生成部33は、符号化部32から供給される符号化ストリームを、ビットレートごとにファイル化し、セグメントファイルを生成する。セグメントファイル生成部33は、生成されたセグメントファイルをアップロード部35に供給する。管理サーバ12にアップロードされたセグメントファイルは、オリジナル配信サーバ13に送信され、記憶される。
 ステップS45において、アップロード部35は、セグメントファイル生成部33から供給されるセグメントファイルを、管理サーバ12にアップロードする。管理サーバ12にアップロードされたセグメントファイルは、オリジナル配信サーバ13に送信され、記憶される。
 ステップS46において、MPDファイル生成部34は、オーディオストリームの実際のビットレートを、保持されている積算値に積算し、その結果得られる積算値を保持する。
 ステップS47において、MPDファイル生成部34は、ステップS46の処理によりMPDファイルの更新時刻の1秒前の再生時刻のオーディオストリームの実際のビットレートまで積算されたかどうかを判定する。なお、図8の例では、積算値を更新したMPDファイルが実際に管理サーバ12にアップロードされるまでの時間が1秒であるため、MPDファイル生成部34は、更新時刻の1秒前の再生時刻のオーディオストリームの実際のビットレートまで積算されたかどうかを判定する。しかしながら、その時間は、勿論、1秒に限定されず、1秒以外である場合には、その時間だけ更新時刻より前の再生時刻のオーディオストリームの実際のビットレートまで積算されたかどうかが判定される。また、最初のステップS47の処理におけるMPDファイルの更新時刻は、0秒から基準期間ΔT後であり、次のステップS47の処理におけるMPDファイルの更新時刻は、0秒から基準期間ΔTの2倍後である。以降も同様に、MPDファイルの更新時刻は基準期間ΔTずつ増加する。
 ステップS47で、ステップS46の処理によりMPDファイルの更新時刻の1秒前の再生時刻のオーディオストリームの実際のビットレートまで積算されたと判定された場合、処理はステップS48に進む。ステップS48において、MPDファイル生成部34は、保持している積算値を、積算されたビットレートに対応するオーディオストリームの期間で除算することにより平均値を算出する。
 ステップS49において、MPDファイル生成部34は、MPDファイルのAveBandwidthとDurationForAveBandwidthを、それぞれ、ステップS47で算出された平均値を示す情報、その平均値に対応する期間を示す情報に更新する。そして、MPDファイル生成部34は、更新後のMPDファイルをアップロード部35に供給し、管理サーバ12に記憶されている更新前のMPDファイルを更新後のMPDファイルに更新させる。管理サーバ12は、更新後のMPDファイルをオリジナル配信サーバ13に供給し、オリジナル配信サーバ13に記憶されている更新前のMPDファイルを更新後のMPDファイルに更新させる。そして、処理はステップS50に進む。
 一方、ステップS47で、まだステップS46の処理によりMPDファイルの更新時刻の1秒前の再生時刻のオーディオストリームの実際のビットレートまで積算されていないと判定された場合、処理はステップS50に進む。
 ステップS50において、取得部31は、ファイル生成処理を終了するかどうかを判定する。具体的には、取得部31は、新たにセグメント単位の動画コンテンツの信号が供給される場合、ファイル生成処理を終了しないと判定する。そして、処理はステップS42に戻り、ファイル生成処理を終了すると判定されるまで、ステップS42乃至S50の処理が繰り返される。
 一方、取得部31は、新たにセグメント単位の動画コンテンツの信号が供給されない場合、ステップS50でファイル生成処理を終了すると判定する。そして、処理は終了する。
 図9は、情報処理システム10のプレミアム配信準備処理を説明するフローチャートである。このプレミアムサービス配信準備処理は、動画コンテンツの取得開始時刻から取得終了時刻までの間に、オリジナル配信サーバ13がL個のプレミアムサーバ14を用意した後行われる。
 図9のステップS61において、プレミアムクライアント17は、動画コンテンツの配信の開始を要求する配信リクエストをウェブサーバ20に送信する。
 ステップS71において、ウェブサーバ20は、プレミアムクライアント17から送信されてくる配信リクエストを受信する。ステップS72において、ウェブサーバ20は、配信リクエストの送信元が、図7のステップS25でプレミアムライセンスを送信したプレミアムクライアント17であるかどうかを判定する。ステップS72で、配信リクエストの送信元が、プレミアムライセンスを送信したプレミアムクライアント17であると判定された場合、処理はステップS73に進む。
 ステップS73において、ウェブサーバ20は、保持している配信クライアント数を1だけインクリメントし、現在の時刻を、配信リクエストを送信してきたプレミアムクライアント17の配信開始時刻として、保持する。ウェブサーバ20は、保持している配信クライアント数と配信クライアント数個の配信開始時刻を管理サーバ12に送信する。
 ステップS81において、管理サーバ12は、管理サーバ12から送信されてくる配信クライアント数と配信開始時刻を受信する。ステップS82において、管理サーバ12は、受信された配信クライアント数と配信開始時刻をオリジナル配信サーバ13に送信する。
 ステップS91において、オリジナル配信サーバ13は、管理サーバ12から送信されてくる配信クライアント数と配信開始時刻を受信する。
 ステップS83において、管理サーバ12は、記憶しているMPDファイルからビットレート情報を抽出し、オリジナル配信サーバ13に送信する。
 ステップS92において、オリジナル配信サーバ13は、管理サーバ12から送信されてくるビットレート情報を受信する。ステップS93において、オリジナル配信サーバ13は、配信クライアント数、配信開始時刻、およびビットレート情報に基づいて、L個のプレミアムサーバ14のスケーリングを行う。
 具体的には、オリジナル配信サーバ13は、配信の開始を要求したプレミアムクライアント17とプレミアムサーバ14のネットワーク帯域が、最大のBandwidthのビットレート情報が示す平均値のオーディオストリームを配信可能な帯域になるように、L個のプレミアムサーバ14のスケーリングを行う。
 ステップS94において、オリジナル配信サーバ13は、記憶しているMPDファイルとセグメントファイルを、スケーリング後のプレミアムサーバ14(のキャッシュサーバ)に送信する。
 ステップS101において、スケーリング後のプレミアムサーバ14は、オリジナル配信サーバ13から送信されてくるMPDファイルとセグメントファイルを受信して記憶する。
 ステップS84において、管理サーバ12は、ウェブサーバ20から新たに配信クライアント数と配信開始時刻が送信されてきたかどうか、即ち新たなプレミアムクライアント17から配信リクエストが送信されることにより新たなプレミアム配信準備処理が開始されたかどうかを判定する。
 ステップS84でウェブサーバ20から新たに配信クライアント数と配信開始時刻が送信されてきていないと判定された場合、処理はステップS85に進む。ステップS85において、オリジナル配信サーバ13は、記憶しているMPDファイルが更新されたかどうかを判定する。ステップS85で記憶しているMPDファイルが更新されたと判定された場合、処理はステップS83に戻り、以降の処理が繰り返される。
 一方、ステップS85で記憶しているMPDファイルが更新されていないと判定された場合、処理はステップS84に戻り、以降の処理が繰り返される。また、ステップS84でウェブサーバ20から新たに配信クライアント数と配信開始時刻が送信されてきたと判定された場合、処理は終了する。
 また、ステップS72で、配信リクエストの送信元が、プレミアムライセンスを送信したプレミアムクライアント17ではないと判定された場合、処理は終了する。
 準プレミアムサーバ15のスケーリングを行う準プレミアム配信準備処理は、動画コンテンツの取得開始時刻の所定時間後から取得終了時刻までの間に、M個の準プレミアムサーバ15が用意された後行われる点、プレミアムサービスが準プレミアムサービスに代わる点、およびスケーリング方法を除いて、プレミアム配信準備処理と同様である。準プレミアム配信準備処理では、例えば、配信の開始を要求した準プレミアムクライアント18と準プレミアムサーバ15のネットワーク帯域が、所定のBandwidthのビットレート情報が示す平均値のオーディオストリームを配信可能な帯域になるように、M個の準プレミアムサーバ15のスケーリングを行う。
 オンデマンドサービスのスケーリングを行うオンデマンド配信準備処理は、動画コンテンツの取得終了後に、N個のオンデマンドサーバ16が用意された後行われる点、ステップS83,S85、およびS92の処理が行われず、オリジナル配信サーバ13が配信クライアント数と配信開始時刻に基づいてスケーリングを行う点、およびプレミアムサービスがオンデマンドサービスに代わる点を除いて、プレミアム配信準備処理と同様である。
 なお、プレミアムサービスの想定帯域は最大ビットレートである。従って、配信クライアント数や配信開始時刻によらず、オリジナル配信サーバ13は、配信の開始を要求したプレミアムクライアント17とプレミアムサーバ14のネットワーク帯域が、最大のBandwidthのビットレート情報が示す平均値のオーディオストリームを配信可能な帯域になるように、スケーリングを行うことができる。
 しかしながら、準プレミアムサービスの想定帯域は、最大ビットレートより小さい。従って、想定帯域が所定のBandwidthのビットレート情報が示す平均値より十分に大きくない場合、配信クライアント数や配信開始時刻によって、M個の準プレミアムサーバ15では、配信の開始を要求した準プレミアムクライアント18との間で、所定のBandwidthのビットレート情報が示す平均値のオーディオストリームを配信可能なネットワーク帯域を確保できない。
 また、オンデマンドサービスの想定帯域は、所定のBandwidthのビットレート情報が示す平均値であり、オンデマンドサーバ16の数Mは、許容数ではなく、所定数のオンデマンドクライアント19に対して想定帯域でのオーディオストリームの通信を保証するために必要な数である。従って、配信クライアント数や配信開始時刻によって、N個のオンデマンドサーバ16では、配信の開始を要求したオンデマンドクライアント19との間で、所定のBandwidthのビットレート情報が示す平均値のオーディオストリームを配信可能なネットワーク帯域を確保できない場合がある。
 以上のように、管理サーバ12は、MPDファイルからビットレート情報および最大ビットレートを抽出してオリジナル配信サーバ13に供給する。従って、オリジナル配信サーバ13は、ビットレート情報に基づいて、プレミアムサーバ14および準プレミアムサーバ15のスケーリングを行うことができる。その結果、最大ビットレートに基づいてスケーリングが行われる場合に比べて、適切なスケーリングを行うことができる。
 図10は、図6のプレミアムクライアント17のMPDファイル更新処理を説明するフローチャートである。このMPDファイル更新処理は、図9のプレミアム配信準備処理後、MPDファイルにminimumUpdatePeriodが記述されている場合に行われる。
 図10のステップS111において、プレミアムクライアント17のMPD取得部61は、ライセンス取得部60から供給されるプレミアムサーバ情報とプレミアムライセンスとに基づいて、プレミアムサーバ14にMPDファイルの配信を要求し、MPDファイルを取得する。そして、MPD取得部61は、取得されたMPDファイルをMPD処理部62に供給する。
 ステップS112において、MPD処理部62は、MPD取得部61から供給されるMPDファイルを解析することにより、MPDファイルからminimumUpdatePeriodが示す更新間隔を取得する。
 また、MPD処理部62は、MPDファイルを解析することにより、符号化ストリームのBandwidth、取得情報、符号化方式情報等を得る。さらに、MPD処理部62は、MPDファイルを解析することにより、符号化方式情報が固定方式ではないことを示す場合、オーディオストリームのAveBandwidthを取得し、選択用ビットレートとする。また、符号化方式情報が固定方式であることを示す場合、MPD処理部62は、オーディオストリームのBandwidthを選択用ビットレートとする。
 MPD処理部62は、各ビデオストリームのBandwidthおよび取得情報、並びに、各オーディオストリームの選択用ビットレート、取得情報、および符号化方式情報をセグメントファイル取得部63に供給する。
 ステップS113において、MPD取得部61は、前回のステップS111の処理によるMPDファイルの取得から更新間隔が経過したかどうかを判定する。ステップS113で更新間隔が経過していないと判定された場合、MPD取得部61は、更新間隔が経過するまで待機する。
 ステップS113で更新間隔が経過したと判定された場合、処理はステップS114に進む。ステップS114において、プレミアムクライアント17は、後述する図11の再生処理を終了するかどうかを判定する。ステップS114で再生処理を終了しないと判定された場合、処理はステップS111に戻り、再生処理を終了するまで、ステップS111乃至S114の処理が繰り返される。
 一方、ステップS114で再生処理を終了すると判定された場合、処理は終了する。
 以上のように、ファイル生成装置11は、オーディオストリームを生成後に、生成されたオーディオストリームの実際のビットレートの平均値を基準期間ごとに算出し、MPDファイルに記述する。従って、プレミアムクライアント17は、MPDファイルを定期的に取得して更新する必要がある。
 図11は、図6のプレミアムクライアント17の再生処理を説明するフローチャートである。この再生処理は、図10のMPDファイル更新処理と並列して行われる。
 図11のステップS121において、セグメントファイル取得部63は、MPD処理部62から供給されるビデオストリームのBandwidthとオーディオストリームの選択用ビットレートそれぞれの最も小さいものを選択する。
 ステップS122において、セグメントファイル取得部63は、ステップS121で選択されたBandwidthのビデオストリームと選択用ビットレートのオーディオストリームのセグメントファイルのうちの、再生開始時刻から所定の時間長のセグメントファイルの取得情報、プレミアムサーバ情報、およびプレミアムライセンスに基づいて、プレミアムサーバ14から、そのセグメントファイルをセグメント単位で取得する。
 この所定の時間長は、プレミアムサーバ14とプレミアムクライアント17間のネットワーク帯域の検出用に復号開始までにバッファ65に保持することが望ましい符号化ストリームの時間長である。例えば、この所定の時間長は、バッファ65に保持可能な符号化ストリームの時間長(例えば、30秒から60秒程度)(以下、最大時間長という)の25パーセントである。セグメントファイル取得部63は、取得されたセグメントファイルをバッファ65に供給して保持させる。
 ステップS125において、セグメントファイル取得部63は、プレミアムサーバ14とプレミアムクライアント17の間のネットワーク帯域と、ビデオストリームのBandwidthおよびオーディオストリームの選択用ビットレートとに基づいて、ビデオストリームのBandwidthとオーディオストリームの選択用ビットレートを選択する。
 具体的には、セグメントファイル取得部63は、選択されたビデオストリームのBandwidthとオーディオストリームの選択用ビットレートの和が、ネットワーク帯域以下となるように、ビデオストリームのBandwidthとオーディオストリームの選択用ビットレートを選択する。
 ステップS126において、セグメントファイル取得部63は、ステップS125で選択されたBandwidthのビデオストリームと選択用ビットレートのオーディオストリームのセグメントファイルのうちの、ステップS122で取得されたセグメントファイルの次の時刻から所定の時間長のセグメントファイルの取得情報をセグメント単位でプレミアムサーバ14に送信し、そのセグメントファイルをセグメント単位で取得する。セグメントファイル取得部63は、取得されたセグメントファイルをバッファ65に供給して保持させる。
 なお、AveBandwidthは、オーディオストリームの実際のビットレートの平均値であるため、実際のビットレートはAveBandwidthを超える場合がある。従って、ステップS126における所定の時間長は、基準期間ΔTより短い時間長にされる。これにより、実際のビットレートがAveBandwidthを超える場合、ネットワーク帯域が小さくなり、より低い選択用ビットレートのオーディオストリームが取得されるようになる。その結果、バッファ65のオーバーフローを防止することができる。
 ステップS127において、セグメントファイル取得部63は、バッファ65に空きがあるかどうかを判定する。ステップS127でバッファ65に空きがないと判定された場合、セグメントファイル取得部63は、バッファ65に空きができるまで待機する。
 一方、ステップS127でバッファ65に空きがあると判定された場合、ステップS128において、プレミアムクライアント17は、再生を終了するかどうかを判定する。ステップS128で再生を終了しないと判定された場合、処理はステップS124に戻り、再生を終了するまで、ステップS124乃至S128の処理が繰り返される。
 一方、ステップS128で再生を終了すると判定された場合、ステップS129において、復号部66は、バッファ65に記憶されている全ての符号化ストリームの復号を終了した後、復号を終了する。そして、処理は終了する。
 なお、上述したように、オリジナル配信サーバ13は、配信クライアント数や配信開始時刻によらず、配信の開始を要求したプレミアムクライアント17とプレミアムサーバ14のネットワーク帯域が、最大のBandwidthのビットレート情報が示す平均値のオーディオストリームを配信可能な帯域になるように、スケーリングを行うことができる。従って、図11の再生処理により、プレミアムクライアント17は、Bandwidthが同一であるオーディオストリームを取得し続けることができる。
 また、説明は省略するが、準プレミアムクライアント18のMPDファイル更新処理および再生処理は、図10のMPDファイル更新処理および図11の再生処理と基本的に同一である。
 但し、上述したように、想定帯域が所定のBandwidthのビットレート情報が示す平均値より十分に大きくない場合、配信クライアント数や配信開始時刻によって、M個の準プレミアムサーバ15では、配信の開始を要求した準プレミアムクライアント18との間で、所定のBandwidthのビットレート情報が示す平均値のオーディオストリームを配信可能なネットワーク帯域を確保できない。従って、この場合、準プレミアムクライアント18は、ネットワーク帯域に応じてバッファ65に保持させる符号化ストリームの時間長を変更することにより、最大ビットレートが同一であるオーディオストリームを取得し続ける。
 また、オンデマンドクライアント19は、動画コンテンツの取得終了後にMPDファイルを取得する。従って、取得されるMPDファイルには、既に動画コンテンツの全期間の平均値が含まれている。よって、オンデマンドクライアント19は、MPDファイル更新処理を行わない。オンデマンドクライアント19の再生処理は、図11の再生処理と基本的に同一である。
 但し、配信クライアント数や配信開始時刻によって、N個のオンデマンドサーバ16では、配信の開始を要求したオンデマンドクライアント19との間で、所定のBandwidthのビットレート情報が示す平均値のオーディオストリームを配信可能なネットワーク帯域を確保できない場合がある。従って、この場合、オンデマンドクライアント19は、再生処理により、取得するオーディオストリームに対応するBandwidthを変更する。なお、この場合であっても、オンデマンドクライアント19は、ネットワーク帯域に応じてバッファ65に保持させる符号化ストリームの時間長を変更することにより、Bandwidthが同一であるオーディオストリームを取得し続けるようにしてもよい。
 以上のように、ファイル生成装置11は、losslessDSD方式で符号化されたオーディオストリームの実際のビットレートの平均値を生成する。従って、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19は、オーディオストリームの実際のビットレートの平均値に基づいて、取得するビデオストリームのBandwidthを選択することにより、オーディオストリームのBandwidthと実際のビットレートとの差分である余剰帯域の少なくとも一部をビデオストリームに割り当てることができる。その結果、オーディオストリームのBandwidthに基づいて、取得するビデオストリームのBandwidthを選択する場合に比べて、最適なビットレートのビデオストリームを取得することができる。
 また、ファイル生成装置11が、基準期間ごとにMPDファイルのAveBandwidthを更新するので、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19は、配信開始時刻において最新のMPDファイルを取得することにより、最新のAveBandwidthを取得することができる。
 (サービスの説明)
 図12は、上述したプレミアムサービス、準プレミアムサービス、およびオンデマンドサービスを説明する図である。
 図12に示すように、プレミアムサービスの想定帯域は、最大ビットレートである。また、プレミアムサービスでは、許容数のプレミアムクライアント17に対して想定帯域を保証するために必要なL個のプレミアムサーバ14が用意される。従って、プレミアムクライアント17あたりの配信コストが最も高い。また、プレミアムクライアント17の許容数は、用意可能なプレミアムサーバ14の数に依存し、一般的に少ない。
 また、L個のプレミアムサーバ14を用意することにより、プレミアムサービスで配信された動画コンテンツを再生するプレミアムクライアント17では、再生開始時刻から再生終了時刻まで、Bandwidthが同一であるビットレートのオーディオストリームを再生することができる。
 さらに、プレミアムサービスでは、動画コンテンツの取得開始時刻と同時に再生を開始することができ、また、再生中に再生対象のオーディオストリームのBandwidthを変更する必要がないため、動画コンテンツの価値は最も高い。以上のように、プレミアムサービスでは、動画コンテンツの価値が高く、配信コストも高いため、料金は最も高い。
 また、プレミアムサービスでは、動画コンテンツの取得開始時刻から取得終了時刻までの間のみ、動画コンテンツの配信が許可され、オンデマンドサービスによる配信は行うことができない。
 一方、準プレミアムサービスの想定帯域は、動画コンテンツの取得開始時刻から準プレミアムサービスによる配信が許可される時刻までの所定のBandwidthのビットレート情報と、最大ビットレートに基づいて決定される、最大ビットレートより小さいビットレートである。また、準プレミアムサービスでは、許容数の準プレミアムクライアント18に対して想定帯域を保証するために必要なM個の準プレミアムサーバ15が用意される。
 従って、準プレミアムクライアント18あたりの配信コストは、プレミアムサービスより低い。また、動画コンテンツの取得開始時刻から準プレミアムサービスによる配信が許可される時刻までの時間が長いほど、保証されるネットワーク帯域が、オーディオストリームの実際のビットレートに近づく。
 また、準プレミアムサービスでは、想定帯域が所定のBandwidthのビットレート情報が示す平均値より十分に大きくない場合、再生開始時刻から再生終了時刻までBandwidthが同一であるオーディオストリームを再生するために、準プレミアムクライアント18は、ネットワーク帯域に応じてバッファ65に保持させる符号化ストリームの時間長を変更する必要がある。
 従って、オリジナル配信サーバ13が、所定のBandwidthのビットレート情報が示す平均値に比べて想定帯域を比較的大きくする場合、準プレミアムクライアント18の許容数は、用意可能な準プレミアムサーバ15の数に依存し、一般的に多くはない。また、準プレミアムクライアント18がネットワーク帯域に応じてバッファ65に保持させる符号化ストリームの時間長を変更する場合、準プレミアムクライアント18の許容数は、準プレミアムクライアント18の処理能力に依存し、一般的に少なくはない。
 また、準プレミアムサービスでは、動画コンテンツの取得開始時刻から所定時間経過後まで再生を開始することができないため、動画コンテンツの価値は、プレミアムサービスより低い。以上のように、準プレミアムサービスでは、動画コンテンツの価値および配信コストがプレミアムサービスより低いため、料金は、プレミアムサービスより低い。
 準プレミアムサービスでは、動画コンテンツの取得開始時刻の所定時間後から取得終了時刻までの間のみ、動画コンテンツの配信が許可され、オンデマンドサービスによる配信は行うことができない。
 オンデマンドサービスの想定帯域は、所定のBandwidthのビットレート情報が示す実際のビットレートの平均値である。なお、オンデマンドサービスの想定帯域は、予め決められた、最大ビットレートより小さい固定値であってもよい。また、オンデマンドサービスでは、所定数のオンデマンドクライアント19に対して想定帯域を保証するために必要なN個のオンデマンドサーバ16が用意される。従って、オンデマンドクライアント19あたりの配信コストは最も低い。
 また、オンデマンドサービスでは、再生開始時刻から再生終了時刻までの間に、再生対象のオーディオストリームのBandwidthを変更する必要がある場合がある。この場合、準プレミアムクライアント18は、ネットワーク帯域に応じてバッファ65に保持させる符号化ストリームの時間長を変更することにより、Bandwidthが同一であるオーディオストリームを再生するか、または、再生対象のオーディオストリームのBandwidthを変更する。従って、オンデマンドクライアント19の許容数は、オンデマンドクライアント19の処理能力に依存し、一般的に多い。
 さらに、オンデマンドサービスでは、動画コンテンツの取得が終了するまで再生を開始することができず、また、再生中に再生対象のオーディオストリームのBandwidthを変更する必要がある場合があるため、動画コンテンツの価値は、最も低い。以上のように、オンデマンドサービスでは、動画コンテンツの価値および配信コストが最も低いため、料金は、最も低い。
 なお、オリジナル配信サーバ13は、通常のキャッシュサーバのスケーリング方法で、オンデマンドサーバ16のスケーリングを行うようにしてもよい。この場合、帯域保証はされない。
 <第2実施の形態>
 (オーディオストリームのメディアセグメントファイルの構成例)
 本開示を適用した情報処理システムの第2実施の形態は、主に、MPDファイルにminimumUpdatePeriodを記述するのではなく、オーディオストリームのメディアセグメントファイルにMPDファイルの更新時刻を通知する更新通知情報を格納する点が、第1実施の形態と異なる。従って、以下では、オーディオストリームのセグメントファイル、ファイル生成処理、MPDファイル更新処理、再生処理についてのみ説明する。
 図13は、第2実施の形態におけるオーディオストリームの更新通知情報を含むメディアセグメントファイルの構成例を示す図である。
 図13のメディアセグメントファイル(Media Segment)は、stypボックス、sidxボックス、emsgボックス(Event Message Box)、および1以上のMovie fragmentにより構成される。
 stypボックスは、メディアセグメントファイルの形式を示す情報を格納するボックスである。図13の例では、メディアセグメントファイルの形式がMPEG-DASHの形式であることを示すmsdhが、stypボックスに格納されている。sidxボックスは、1以上のMovie fragmentからなるサブセグメントのインデックス情報を格納するボックスである。
 emsgボックスは、MPD validity expirationを用いて更新通知情報を格納するボックスである。Movie fragmentは、moofボックスとmdatボックスにより構成される。moofボックスは、オーディオストリームのメタデータを格納するボックスであり、mdatボックスは、オーディオストリームを格納するボックスである。Media Segmentを構成するMovie fragmentは、1以上のサブセグメントに分割される。
 (emsgボックスの記述例)
 図14は、図13のemsgボックスの記述例を示す図である。
 図14に示すように、emsgボックスには、string value,presentation_time_delta,event_duration,id,message_dataなどが記述される。
 string valueは、このemsgボックスに対応するイベントを定義する値であり、図14の場合、MPDファイルの更新を示す1である。
 presentation_time_deltaは、このemsgボックスが配置されるメディアセグメントファイルの再生時刻から、イベントが行われる再生時刻までの時間である。従って、図14の場合、presentation_time_deltaは、このemsgボックスが配置されるメディアセグメントファイルの再生時刻から、MPDファイルの更新が行われる再生時刻までの時間であり、更新通知情報である。第2実施の形態では、presentation_time_deltaは5である。従って、このemsgボックスが配置されるメディアセグメントファイルの再生時刻から5秒後にMPDファイルが更新される。
 event_durationは、このemsgボックスに対応するイベントの期間であり、図14の場合、期間が不明であることを示す「0xFFFF」である。idは、このemsgボックスに固有のIDである。また、message_dataは、このemsgボックスに対応するイベントに関するデータであり、図14の場合MPDファイルの更新時刻のXML(ExtensibleMarkupLanguage)データである。
 以上のように、ファイル生成装置11は、必要に応じて、オーディオストリームのメディアセグメントファイルに、presentation_time_deltaを格納する図14のemsgボックスを含める。これにより、ファイル生成装置11は、このメディアセグメントファイルの再生時刻から何秒後にMPDファイルが更新されるかを、管理サーバ12等の後段の装置に通知することができる。
 また、ファイル生成装置11は、emsgボックスをメディアセグメントファイルに配置させる頻度を変更するだけで、MPDファイルの更新頻度を容易に変更することができる。
 (ファイル生成装置の処理の説明)
 図15は、第2実施の形態におけるファイル生成装置11のファイル生成処理を説明するフローチャートである。このファイル生成処理は、オーディオストリームの符号化方式の少なくとも1つがlosslessDSD方式である場合に行われる。
 図15のステップS130において、ファイル生成装置11のMPDファイル生成部34は、MPDファイルを生成する。このMPDファイルは、minimumUpdatePeriodが記述されない点、および、「urn:mpeg:dash:profile:is-off-ext-live:2014」が記述される点が、第1実施の形態におけるMPDファイルと異なる。「urn:mpeg:dash:profile:is-off-ext-live:2014」は、メディアセグメントファイルに図14のemsgボックスが配置されることを示すプロファイルである。MPDファイル生成部34は、生成されたMPDファイルをアップロード部35に供給する。
 ステップS131乃至S133の処理は、図8のステップS41乃至S43の処理と同様であるので、説明は省略する。
 ステップS134において、ファイル生成装置11のセグメントファイル生成部33は、ステップS133で符号化されたオーディオデジタル信号の再生時刻が、MPDファイルの更新時刻の5秒前であるかどうかを判定する。なお、図15の例では、後段の装置にMPDファイルの更新を5秒前に通知するため、セグメントファイル生成部33は、MPDファイルの更新時刻の5秒前であるかどうかを判定する。しかしながら、後段の装置への通知は、勿論、5秒以外の時間だけ前に行われてもよく、5秒以外の時間だけ前に行われる場合には、その時間だけMPDファイルの更新時刻より前であるかどうかが判定される。また、最初のステップS134の処理におけるMPDファイルの更新時刻は、0秒から基準期間ΔT後であり、次のステップS134の処理におけるMPDファイルの更新時刻は、0秒から基準期間ΔTの2倍後である。以降も同様に、MPDファイルの更新時刻は基準期間ΔTずつ増加する。
 ステップS134でMPDファイルの更新時刻の5秒前であると判定された場合、処理はステップS135に進む。ステップS135において、セグメントファイル生成部33は、図14のemsgボックスを含む、符号化部32から供給されるオーディオストリームのセグメントファイルを生成する。また、セグメントファイル生成部33は、符号化部32から供給されるビデオストリームのセグメントファイルを生成する。そして、セグメントファイル生成部33は、生成されたセグメントファイルをアップロード部35に供給し、処理をステップS137に進める。
 一方、ステップS134でMPDファイルの更新時刻の5秒前ではないと判定された場合、処理はステップS136に進む。ステップS136において、セグメントファイル生成部33は、図14のemsgボックスを含まない、符号化部32から供給されるオーディオストリームのセグメントファイルを生成する。また、セグメントファイル生成部33は、符号化部32から供給されるビデオストリームのセグメントファイルを生成する。そして、セグメントファイル生成部33は、生成されたセグメントファイルをアップロード部35に供給し、処理をステップS137に進める。
 ステップS137乃至S142の処理は、図8のステップS45乃至S50の処理と同一であるので、説明は省略する。
 なお、図示は省略するが、第2実施の形態におけるプレミアムクライアント17のMPDファイル更新処理は、セグメントファイル取得部63が取得したメディアセグメントファイルに図14のemsgボックスが含まれているとき、5秒後に、MPD取得部61がMPDファイルを取得する処理である。第2実施の形態では、presentation_time_deltaは5であるが、勿論、これに限定されない。
 また、第2実施の形態におけるプレミアムクライアント17の再生処理は、図11の再生処理と同一であり、MPDファイル更新処理と並列して行われる。プレミアムクライアント17のMPDファイル更新処理および再生処理と、準プレミアムクライアント18のMPDファイル更新処理および再生処理との関係、並びに、プレミアムクライアント17の再生処理とオンデマンドクライアント19の再生処理との関係は、第1実施の形態における関係と同一である。また、第2実施の形態では、オンデマンドクライアント19が、プレミアムクライアント17と同様にMPDファイル更新処理を行うが、更新前後でMPDファイルは変化しない。
 以上のように、第2実施の形態では、更新通知情報を格納するemsgボックスがメディアセグメントファイルに配置される。従って、管理サーバ12は、そのemsgボックスを含むメディアセグメントファイルを取得した場合にのみ、MPDファイルに含まれるビットレート情報を抽出すればよい。
 また、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19は、emsgボックスを含むメディアセグメントファイルを取得した場合にのみ、MPDファイルを取得すればよい。従って、符号化ストリームの取得以外のHTTPオーバーヘッドの増加を抑制することができる。
 <第3実施の形態>
 (emsgボックスの記述例)
 本開示を適用した情報処理システムの第3実施の形態は、主に、MPDファイルを更新するのではなく、MPDファイルの更新情報(更新前後の差分情報)としてAveBandwidthとDurationForAveBandwidthの更新値を格納するemsgボックスをオーディオストリームのセグメントファイルに配置する点、および、管理サーバ12が、MPDファイルとemsgボックスに含まれるビットレート情報を抽出する点が、第2実施の形態と異なる。
 即ち、第3実施の形態では、AveBandwidthとDurationForAveBandwidthの初期値がMPDファイルに含まれ、AveBandwidthとDurationForAveBandwidthの更新値は、オーディオストリームのセグメントファイルに含まれる。従って、以下では、AveBandwidthとDurationForAveBandwidthの更新値を格納するemsgボックス、ファイル生成処理、MPDファイル更新処理、再生処理についてのみ説明する。
 図16は、第3実施の形態におけるAveBandwidthとDurationForAveBandwidthの更新値を格納するemsgボックスの記述例を示す図である。
 図16のemsgボックスでは、string valueは、MPDファイルの更新情報の送信を示す2である。また、presentation_time_deltaには、このemsgボックスが配置されるメディアセグメントファイルの再生時刻から、MPDファイルの更新情報の送信が行われる再生時刻までの時間として0が設定される。これにより、後段の装置は、このemsgボックスが配置されるメディアセグメントファイルにMPDファイルの更新情報が配置されることを認識することができる。
 event_durationは、図14の場合と同様に「0xFFFF」である。また、message_dataは、MPDファイルの更新情報であるAveBandwidthとDurationForAveBandwidthの更新値のXMLデータである。
 (ファイル生成装置の処理の説明)
 図17は、第3実施の形態におけるファイル生成装置11のファイル生成処理を説明するフローチャートである。このファイル生成処理は、オーディオストリームの符号化方式の少なくとも1つがlosslessDSD方式である場合に行われる。
 図17のステップS160において、ファイル生成装置11のMPDファイル生成部34は、MPDファイルを生成する。このMPDファイルは、プロファイルが、メディアセグメントファイルに図14や図16のemsgボックスが配置されることを示すプロファイルに代わる点を除いて、第2実施の形態におけるMPDファイルと同一である。MPDファイル生成部34は、生成されたMPDファイルをアップロード部35に供給する。
 ステップS161乃至S164の処理は、図15のステップS131乃至S134の処理と同様であるので、説明は省略する。
 ステップS164でMPDファイルの更新時刻の5秒前ではないと判定された場合、処理はステップS165に進む。ステップS165乃至S167の処理は、図15のステップS138乃至S140の処理と同様であるので、説明は省略する。
 ステップS168において、セグメントファイル生成部33は、ステップS167で算出された平均値をAveBandwidthの更新値として含み、その平均値に対応する期間をDurationForAveBandwidthの更新値として含む図16のemsgボックスを含む、符号化部32から供給されるオーディオストリームのセグメントファイルを生成する。また、セグメントファイル生成部33は、符号化部32から供給されるビデオストリームのセグメントファイルを生成する。そして、セグメントファイル生成部33は、生成されたセグメントファイルをアップロード部35に供給し、処理をステップS172に進める。
 一方、ステップS166でまだMPDファイルの更新時刻の1秒前の再生時刻のオーディオストリームの実際のビットレートまで積算されていないと判定された場合、処理はステップS169に進む。
 ステップS169において、セグメントファイル生成部33は、図14のemsgボックスと図16のemsgボックスを含まない、符号化部32から供給されるオーディオストリームのセグメントファイルを生成する。また、セグメントファイル生成部33は、符号化部32から供給されるビデオストリームのセグメントファイルを生成する。そして、セグメントファイル生成部33は、生成されたセグメントファイルをアップロード部35に供給し、処理をステップS172に進める。
 一方、ステップS164で更新時刻の5秒前であると判定された場合、ステップS170において、セグメントファイル生成部33は、図14の更新通知情報を格納するemsgボックスを含む、符号化部32から供給されるオーディオストリームのセグメントファイルを生成する。また、セグメントファイル生成部33は、符号化部32から供給されるビデオストリームのセグメントファイルを生成する。そして、セグメントファイル生成部33は、生成されたセグメントファイルをアップロード部35に供給する。
 ステップS171において、MPDファイル生成部34は、オーディオストリームの実際のビットレートを、保持されている積算値に積算し、その結果得られる積算値を保持し、処理をステップS172に進める。
 ステップS172において、アップロード部35は、セグメントファイル生成部33から供給されるセグメントファイルを、管理サーバ12にアップロードする。
 ステップS173の処理は、図15のステップS142の処理と同様であるので、説明は省略する。
 なお、図示は省略するが、第3実施の形態におけるプレミアムクライアント17のMPDファイル更新処理は、セグメントファイル取得部63が取得したメディアセグメントファイルに図14のemsgボックスが含まれているとき、5秒後のメディアセグメントファイルの図16のemsgボックスからAveBandwidthとDurationForAveBandwidthの更新値を取得し、MPDファイルを更新する処理である。
 また、第3実施の形態におけるプレミアムクライアント17の再生処理は、図11の再生処理と同一であり、MPDファイル更新処理と並列して行われる。プレミアムクライアント17のMPDファイル更新処理および再生処理と、準プレミアムクライアント18およびオンデマンドクライアント19のMPDファイル更新処理および再生処理の関係は、第1実施の形態における関係と同一である。
 以上のように、第3実施の形態では、AveBandwidthとDurationForAveBandwidthの更新値のみが後段の装置に伝送される。従って、AveBandwidthとDurationForAveBandwidthを更新するために必要な伝送量を削減することができる。また、管理サーバ12およびMPD処理部62は、更新後のMPDファイルについてはAveBandwidthとDurationForAveBandwidthに関する記述のみを解析すればよいため、解析負荷が軽減される。
 また、第3実施の形態では、AveBandwidthとDurationForAveBandwidthの更新値がオーディオストリームのセグメントファイルに格納される。従って、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19は、MPDファイルが更新されるたびにMPDファイルを取得する必要がない。よって、符号化ストリームの取得以外のHTTPオーバーヘッドの増加を抑制することができる。
 <第4実施の形態>
 (emsgボックスの記述例)
 本開示を適用した情報処理システムの第4実施の形態は、主に、AveBandwidthとDurationForAveBandwidthの初期値がMPDファイルに記述されない点、更新通知情報を格納するemsgボックスがオーディオストリームのセグメントファイルに配置されない点、および、管理サーバ12がemsgボックスに含まれるビットレート情報を抽出する点が、第3実施の形態と異なる。従って、以下では、AveBandwidthとDurationForAveBandwidthを格納するemsgボックス、ファイル生成処理、AveBandwidthとDurationForAveBandwidthの更新処理、再生処理についてのみ説明する。
 図18は、第4実施の形態におけるAveBandwidthとDurationForAveBandwidthを格納するemsgボックスの記述例を示す図である。
 図18のemsgボックスでは、string valueは、AveBandwidthとDurationForAveBandwidthの送信を示す3である。また、presentation_time_deltaには、このemsgボックスが配置されるメディアセグメントファイルの再生時刻から、AveBandwidthとDurationForAveBandwidthの送信が行われる再生時刻までの時間として0が設定される。これにより、後段の装置は、このemsgボックスが配置されるメディアセグメントファイルにAveBandwidthとDurationForAveBandwidthが配置されることを認識することができる。
 event_durationは、図14の場合と同様に「0xFFFF」である。また、message_dataは、AveBandwidthとDurationForAveBandwidthのXMLデータである。
 ファイル生成装置11は、オーディオストリームのメディアセグメントファイルへの図18のemsgボックスの配置頻度を変更するだけで、AveBandwidthとDurationForAveBandwidthの更新頻度を容易に変更することができる。
 なお、図示は省略するが、第4実施の形態におけるファイル生成装置11のファイル生成処理は、主に、ステップS164,S170、およびS171の処理が行われない点、および、図16のemsgボックスが図18のemsgボックスに代わる点を除いて、図17のファイル生成処理と同様である。
 但し、第4実施の形態におけるMPDファイルにはAveBandwidthとDurationForAveBandwidthが記述されない。また、MPDファイルに記述されるプロファイルは、セグメントファイルに図18のemsgが配置されることを示すプロファイルであり、例えば、「urn:mpeg:dash:profile:isoff-dynamic-bandwidth:2015」である。
 また、図示は省略するが、第4実施の形態におけるプレミアムクライアント17のAveBandwidthとDurationForAveBandwidthの更新処理は、第3実施の形態におけるMPDファイル更新処理の代わりに行われる。AveBandwidthとDurationForAveBandwidthの更新処理は、セグメントファイル取得部63が取得したメディアセグメントファイルに図18のemsgボックスが含まれているとき、そのemsgボックスからAveBandwidthとDurationForAveBandwidthを取得し、AveBandwidthとDurationForAveBandwidthを更新する処理である。
 また、第4実施の形態におけるプレミアムクライアント17の再生処理は、ステップS121における選択用ビットレートのうちのAveBandwidthが、MPD処理部62から供給されるのではなく、セグメントファイル取得部63自らが更新したものである点を除いて、図11の再生処理と同一である。この再生処理は、AveBandwidthとDurationForAveBandwidthの更新処理と並列して行われる。
 プレミアムクライアント17のAveBandwidthとDurationForAveBandwidthの更新処理および再生処理と、準プレミアムクライアント18およびオンデマンドクライアント19のAveBandwidthとDurationForAveBandwidthの更新処理および再生処理の関係は、第1実施の形態における関係と同一である。
 以上のように、第4実施の形態では、AveBandwidthとDurationForAveBandwidthがemsgボックスに配置される。従って、管理サーバ12およびMPD処理部62は、AveBandwidthとDurationForAveBandwidthについてMPDファイルを解析する必要がない。
 なお、AveBandwidthとDurationForAveBandwidthは、emsgボックスに格納するのではなく、HTTP2.0やWebSocketなどの他の規格に準拠して定期的に送信されるようにしてもよい。この場合も、第4実施の形態と同様の効果が得られる。
 また、第4実施の形態において、第2実施の形態のように、更新通知情報を格納するemsgボックスがセグメントファイルに配置されてもよい。
 <第5実施の形態>
 (MPDファイルの記述例)
 本開示を適用した情報処理システムの第5実施の形態は、主に、AveBandwidthとDurationForAveBandwidthのXMLデータが、オーディオストリームのセグメントファイルとは異なるセグメントファイルに配置される点、および、管理サーバ12がセグメントファイルに含まれるビットレート情報を抽出する点が、第4実施の形態と異なる。従って、以下では、AveBandwidthとDurationForAveBandwidthを格納するセグメントファイル(以下、帯域セグメントファイルという)、ファイル生成処理、AveBandwidthとDurationForAveBandwidthの更新処理、再生処理についてのみ説明する。
 図19は、第5実施の形態におけるMPDファイルの記述例を示す図である。
 なお、図19では、説明の便宜上、MPDファイルの記述のうちの、帯域セグメントファイルを管理する記述のみを図示している。
 図19に示すように、帯域セグメントファイルのアダプテーションセット要素は、<SupplementalProperty schemeIdUri="urn:mpeg:dash:bandwidth:2015">を有する点が、図4のオーディオストリームのアダプテーションセット要素と異なっている。
 <SupplementalProperty schemeIdUri="urn:mpeg:dash:bandwidth:2015">は、帯域セグメントファイルの更新間隔を示すディスクリプタである。<SupplementalProperty schemeIdUri="urn:mpeg:dash:bandwidth:2015">の値(value)としては、更新間隔と、帯域セグメントファイルの名前のベースであるfile URLが設定される。図19の例では、更新間隔が基準期間ΔTとされ、file URLが「$Bandwidth$bandwidth.info」とされる。従って、帯域セグメントファイルの名前のベースは、リプレゼンテーション要素が有するBandwidthに「bandwidth」を付加したものである。
 また、図19の例では、帯域セグメントファイルに対応する3種類のオーディオストリームの最大ビットレートは、2.8Mbps,5.6Mbps、および11.2Mbpsである。従って、3つのリプレゼンテーション要素は、それぞれ、2800000,5600000,11200000をBandwidthとして有する。従って、図19の例では、帯域セグメントファイルの名前のベースが、2800000bandwidth.info,5600000bandwidth.info、および11200000 bandwidth.infoである。
 リプレゼンテーション要素に含まれるセグメントインフォ要素は、そのリプレゼンテーションに対応する帯域セグメントファイル群の各帯域セグメントファイルに関する情報を有する。
 以上のように、第5実施の形態では、MPDファイルに更新間隔が記述される。従って、MPDファイルに記述される更新間隔と、帯域セグメントファイルの更新間隔を変更するだけで、AveBandwidthとDurationForAveBandwidthの更新頻度を容易に変更することができる。
 なお、図示は省略するが、第5実施の形態におけるファイル生成装置11のファイル生成処理は、ステップS40で生成されるMPDファイルが図19のMPDファイルである点、および、ステップS49でMPDファイルが更新されずにセグメントファイル生成部33により帯域セグメントファイルが生成され、アップロード部35を介して管理サーバ12にアップロードされる点を除いて、図8のファイル生成処理と同様である。
 また、第5実施の形態におけるプレミアムクライアント17におけるAveBandwidthとDurationForAveBandwidthの更新処理は、ステップS93とステップS94の間でセグメントファイル取得部63が帯域セグメントファイルを取得してAveBandwidthとDurationForAveBandwidthを更新する点、および、ステップS94で終了しないと判定された場合処理はステップS93に戻る点を除いて、図10のMPDファイル更新処理と同様である。
 さらに、第5実施の形態のプレミアムクライアント17の再生処理は、ステップS121における選択用ビットレートのうちのAveBandwidthが、MPD処理部62から供給されるのではなく、セグメントファイル取得部63が自ら更新したものである点を除いて、図11の再生処理と同一である。この再生処理は、AveBandwidthとDurationForAveBandwidthの更新処理と並列して行われる。
 プレミアムクライアント17のAveBandwidthとDurationForAveBandwidthの更新処理および再生処理と、準プレミアムクライアント18およびオンデマンドクライアント19のAveBandwidthとDurationForAveBandwidthの更新処理および再生処理の関係は、第1実施の形態における関係と同一である。
 以上のように、第5実施の形態では、AveBandwidthとDurationForAveBandwidthが帯域セグメントファイルに配置される。従って、管理サーバ12およびMPD処理部62は、AveBandwidthとDurationForAveBandwidthについてMPDファイルを解析する必要がない。
 <第6実施の形態>
 (MPDファイルの第1の記述例)
 本開示を適用した情報処理システムの第6実施の形態は、MPDファイルの構成、およびオーディオストリームのセグメントファイルの実際のビットレートが所定の範囲内になるように、オーディオストリームのセグメント長が可変にされる点が、第1実施の形態と異なる。従って、以下では、MPDファイルの構成およびセグメントファイルについてのみ説明する。
 図20は、第6実施の形態におけるMPDファイルの第1の記述例を示す図である。
 図20のMPDファイルの記述は、オーディオストリームのセグメントファイルのアダプテーションセット要素が、各セグメントファイルのセグメント長を示すConsecutiveSegmentInformationを有する点が、図4の構成と異なる。
 図20の例では、セグメント長が基準の時間としての固定のセグメント長の正の倍数で変化する。具体的には、セグメントファイルは、固定のセグメント長の1以上のセグメントファイルが連結されることにより構成される。
 従って、ConsecutiveSegmentInformationの値(Value)として、MaxConsecutiveNumberが記述され、その後、FirstSegmentNumberとConsecutiveNumbersが順に繰り返し記述される。
 MaxConsecutiveNumberは、固定のセグメント長のセグメントファイルの最大の連結数を示す情報である。固定のセグメント長は、オーディオストリームのセグメントファイルのアダプテーションセット要素が有するSegment Templateのtimescaleとdurationに基づいて設定される。図20の例では、timescaleが44100であり、durationが88200であるので、固定のセグメント長は2秒である。
 FirstSegmentNumberは、長さが同一である連続するセグメント群の先頭のセグメントの先頭からの数、即ち、セグメントの長さが同一である連続するセグメントファイル群の先頭のセグメントファイルの名前に含まれる番号である。ConsecutiveNumbersは、直前のFirstSegmentNumberに対応するセグメント群のセグメント長が固定のセグメント長の何倍であるかを示す情報である。
 図20の例では、ConsecutiveSegmentInformationの値が、2,1,1,11,2,31,1である。従って、固定のセグメント長の最大の連結数は2である。また、Bandwidthが2800000であるリプレゼンテーション要素に対応する、最大ビットレートが2.8Mbpsであり、ファイル名が「2800000-1.mp4」である先頭から1番目のメディアセグメントファイルは、ファイル名が「2800000-1.mp4」である固定セグメント長のメディアセグメントファイルが1つ連結したものである。従って、ファイル名が「2800000-1.mp4」であるメディアセグメントファイルのセグメント長は、固定セグメント長の1倍である2秒である。
 同様に、ファイル名が「2800000-2.mp4」乃至「2800000-10.mp4」である先頭から2乃至10番目のメディアセグメントファイルも、それぞれ、ファイル名が「2800000-2.mp4」乃至「2800000-10.mp4」である固定セグメント長のメディアセグメントファイルが1つ連結したものであり、セグメント長は2秒である。
 また、ファイル名が「2800000-11.mp4」である先頭から11番目のメディアセグメントファイルは、ファイル名が「2800000-11.mp4」および「2800000-12.mp4」である2つの固定セグメント長のメディアセグメントファイルが連結したものである。従って、ファイル名が「2800000-11.mp4」であるメディアセグメントファイルのセグメント長は、固定セグメント長の2倍である4秒である。また、ファイル名が「2800000-11.mp4」であるメディアセグメントファイルに連結されたメディアセグメントファイルのファイル名「2800000-12.mp4」は欠番とされる。
 同様に、ファイル名が「2800000-13.mp4」,「2800000-15.mp4」,...,「2800000-29.mp4」である先頭から12乃至19番目のメディアセグメントファイルも、固定セグメント長のメディアセグメントファイルが2つ連結したものであり、セグメント長は4秒である。
 さらに、ファイル名が「2800000-31.mp4」である先頭から20番目のメディアセグメントファイルは、ファイル名が「2800000-31.mp4」である1つの固定セグメント長のメディアセグメントファイルが連結したものである。従って、ファイル名が「2800000-31.mp4」であるメディアセグメントファイルのセグメント長は、固定セグメント長の1倍である2秒である。
 Bandwidthが5600000,11200000であるリプレゼンテーション要素に対応する最大ビットレートが5.6Mbps,11.2Mbpsであるメディアセグメントファイルの構成は、最大ビットレートが2.8Mbpsであるメディアセグメントファイルの構成と同様であるので、説明は省略する。
 (MPDファイルの第2の記述例)
 図21は、第6実施の形態におけるMPDファイルの第2の記述例を示す図である。
 図21のMPDファイルの構成は、Segment Templateにtimescaleとdurationが記述されない点、および、オーディオストリームのセグメントファイルのアダプテーションセット要素がSegmentDurationを有する点が、図4の構成と異なる。
 図21の例では、セグメント長が任意の時間に変化する。従って、SegmentDurationとして、timescaleとdurationが記述される。timescaleは、1秒を表す値であり、図21の例では、44100が設定される。
 また、durationとしては、FirstSegmentNumberとSegmentDurationが順に繰り返し記述される。FirstSegmentNumberは、図20のFirstSegmentNumberと同一である。SegmentDurationは、timescaleを1秒としたときの、直前のFirstSegmentNumberに対応するセグメント群のセグメント長の値である。
 図21の例では、SegmentDurationの値が、1,88200,11,44100,15,88200である。従って、Bandwidthが2800000であるリプレゼンテーション要素に対応する、最大ビットレートが2.8Mbpsであり、ファイル名が「2800000-1.mp4」である先頭から1番目のメディアセグメントファイルのセグメント長は、2秒(=88200/44100)である。同様に、ファイル名が「2800000-2.mp4」乃至「2800000-10.mp4」である先頭から2乃至10番目のメディアセグメントファイルのセグメント長も2秒である。
 また、ファイル名が「2800000-11.mp4」である先頭から11番目のメディアセグメントファイルのセグメント長は、1秒(=44100/44100)である。同様に、ファイル名が「2800000-12.mp4」乃至「2800000-14.mp4」である先頭から12乃至14番目のメディアセグメントファイルのセグメント長も1秒である。
 さらに、ファイル名が「2800000-15.mp4」である先頭から15番目のメディアセグメントファイルのセグメント長は、2秒(=88200/44100)である。
 Bandwidthが5600000,11200000であるリプレゼンテーション要素に対応する最大ビットレートが5.6Mbps,11.2Mbpsであるメディアセグメントファイルの構成は、2.8Mbpsであるメディアセグメントファイルの構成と同様であるので、説明は省略する。
 以上のように、図21の例では、オーディオストリームのメディアセグメントファイルのファイル名の欠番はない。
 なお、第6実施の形態では、セグメントファイル生成部33は、オーディオストリームの実際のビットレートまたは実際のビットレートの平均値に基づいて、そのビットレートが所定の範囲内になるようにセグメント長を決定する。従って、オーディオストリームの生成とともにセグメント長は変化する。よって、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19は、セグメント長が変更されるたびにMPDファイルを取得して更新する必要がある。
 第6実施の形態では、セグメント長の変更タイミングは、オーディオストリームの実際のビットレートの平均値の算出タイミングと同一であるものとするが、異なるようにしてもよい。両方のタイミングが異なる場合、セグメント長の更新間隔や更新時刻を示す情報がプレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19に伝送され、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19は、その情報に基づいてMPDファイルを更新する。
 (セグメントファイルの構成例)
 図22は、第6実施の形態におけるlosslessDSD方式のオーディオストリームのメディアセグメントファイルの構成例を示す図である。
 図22のAのメディアセグメントファイルの構成は、Movie fragmentが、固定のセグメント長ではなく、可変のセグメント長分存在する点、および、emsgボックスが設けられない点が、図13の構成と異なる。
 なお、図20の例のように、メディアセグメントファイルが、固定のセグメント長の1以上のメディアセグメントファイルが連結されることにより構成される場合、メディアセグメントファイルは、図22のBに示すように、1以上の固定のセグメント長のメディアセグメントファイルを単に連結することにより構成されるようにしてもよい。この場合、stypボックスとsidxボックスは、連結するメディアセグメントファイルの数だけ存在する。
 以上のように、第6実施の形態では、オーディオストリームのセグメントファイルの実際のビットレートが所定の範囲内になるように、オーディオストリームのセグメント長が可変にされる。従って、オーディオストリームの実際のビットレートが小さい場合であっても、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19は、セグメント単位でセグメントファイルを取得することにより、所定の範囲内のビットレートでオーディオストリームを取得することができる。
 これに対して、セグメント長が固定である場合、オーディオストリームの実際のビットレートが小さいと、1回のセグメント単位のセグメントファイルの取得で取得されるオーディオストリームのビット量が少なくなる。その結果、ビット量あたりのHTTPオーバーヘッドが増加する。
 なお、各セグメントファイルのセグメント長を示す情報は、第3乃至第5実施の形態におけるAveBandwidthおよびDurationForAveBandwidthと同様に、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19に送信されるようにしてもよい。また、各セグメントファイルのセグメント長を示すファイルがMPDファイルとは別に生成され、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19に送信されるようにしてもよい。
 さらに、第3乃至第5実施の形態においても、第6実施の形態と同様にセグメント長が可変にされるようにしてもよい。
 <losslessDSD方式の説明>
 (可逆圧縮符号化部の構成例)
 図23は、図3の取得部31と符号化部32のうちの、オーディオアナログ信号をA/D変換し、losslessDSD方式で符号化する可逆圧縮符号化部の構成例を示すブロック図である。
 図23の可逆圧縮符号化部100は、入力部111、ADC112、入力バッファ113、制御部114、エンコード部115、符号化データバッファ116、データ量比較部117、データ送信部118、および出力部119により構成される。可逆圧縮符号化部100は、オーディオアナログ信号をDSD方式でオーディオデジタル信号に変換し、変換後のオーディオデジタル信号を可逆圧縮符号化して出力する。
 具体的には、動画コンテンツのオーディオアナログ信号は、入力部111から入力されて、ADC112へ供給される。
 ADC112は、加算器121、積分器122、比較器123、1サンプル遅延回路124、および1ビットDAC125により構成され、オーディオアナログ信号をDSD方式でオーディオデジタル信号に変換する。
 即ち、入力部111から供給されたオーディオアナログ信号は、加算器121に供給される。加算器121は、1ビットDAC125から供給された1サンプル期間前のオーディオアナログ信号と、入力部111からのオーディオアナログ信号を加算して、積分器122に出力する。
 積分器122は、加算器121からのオーディオアナログ信号を積分して比較器123に出力する。比較器123は、1サンプル期間ごとに、積分器122から供給されるオーディオアナログ信号の積分値と中点電位とを比較することにより、1ビット量子化を行う。
 なお、ここでは、比較器123が、1ビット量子化を行うものとするが、2ビット量子化や4ビット量子化などを行うようにしてもよい。また、サンプル期間の周波数(サンプリング周波数)としては、例えば、48kHz、44.1kHzの64倍や128倍の周波数が用いられる。比較器123は、1ビット量子化により得られた1ビットのオーディオデジタル信号を、入力バッファ113に出力するとともに、1サンプル遅延回路124に供給する。
 1サンプル遅延回路124は、比較器123からの1ビットのオーディオデジタル信号を1サンプル期間分遅延させて1ビットDAC125に出力する。1ビットDAC125は、1サンプル遅延回路124からのオーディオデジタル信号をオーディオアナログ信号に変換して加算器121に出力する。
 入力バッファ113は、ADC112から供給される1ビットのオーディオデジタル信号を一時蓄積し、1フレーム単位で、制御部114、エンコード部115、およびデータ量比較部117に供給する。ここで、1フレームとは、オーディオデジタル信号を所定の時間(期間)に区切って1まとまりとみなす単位である。
 制御部114は、可逆圧縮符号化部100全体の動作を制御する。また、制御部114は、エンコード部115が可逆圧縮符号化を行うために必要となる変換テーブルtable1を作成して、エンコード部115に供給する機能を有する。
 具体的には、制御部114は、入力バッファ113から供給される1フレームのオーディオデジタル信号を用いて、フレーム単位でデータ発生カウントテーブルpre_tableを作成し、データ発生カウントテーブルpre_tableからさらに変換テーブルtable1を作成する。制御部114は、フレーム単位で作成した変換テーブルtable1を、エンコード部115とデータ送信部118に供給する。
 エンコード部115は、制御部114から供給された変換テーブルtable1を用いて、入力バッファ113から供給されるオーディオデジタル信号を、4ビット単位で可逆圧縮符号化する。従って、エンコード部115には入力バッファ113から、制御部114に供給されるタイミングと同時にオーディオデジタル信号が供給されるが、エンコード部115では、制御部114から変換テーブルtable1が供給されるまで処理は待機される。
 可逆圧縮符号化の詳細は後述するが、エンコード部115は、4ビットのオーディオデジタル信号を、2ビットのオーディオデジタル信号に可逆圧縮符号化するか、または、6ビットのオーディオデジタル信号に可逆圧縮符号化して、符号化データバッファ116に出力する。
 符号化データバッファ116は、エンコード部115で可逆圧縮符号化の結果生成されたオーディオデジタル信号を一時的にバッファリングし、データ量比較部117とデータ送信部118に供給する。
 データ量比較部117は、入力バッファ113から供給される可逆圧縮符号化されていないオーディオデジタル信号と、符号化データバッファ116から供給される可逆圧縮符号化されたオーディオデジタル信号のデータ量を、フレーム単位で比較する。
 即ち、エンコード部115は、上述したように、4ビットのオーディオデジタル信号を、2ビットのオーディオデジタル信号か、または6ビットのオーディオデジタル信号に可逆圧縮符号化するため、アルゴリズム上、可逆圧縮符号化後のオーディオデジタル信号のデータ量が、可逆圧縮符号化前のオーディオデジタル信号のデータ量を超えてしまう場合がある。そこで、データ量比較部117は、可逆圧縮符号化後のオーディオデジタル信号と可逆圧縮符号化前のオーディオデジタル信号のデータ量を比較する。
 そして、データ量比較部117は、データ量の少ない方を選択し、どちらを選択したかを示す選択制御データをデータ送信部118に供給する。なお、データ量比較部117は、可逆圧縮符号化前のオーディオデジタル信号を選択したことを示す選択制御データをデータ送信部118に供給する場合には、可逆圧縮符号化前のオーディオデジタル信号もデータ送信部118に供給する。
 データ送信部118は、データ量比較部117から供給される選択制御データに基づいて、符号化データバッファ116から供給されるオーディオデジタル信号か、または、データ量比較部117から供給されるオーディオデジタル信号のどちらかを選択する。データ送信部118は、符号化データバッファ116から供給される可逆圧縮符号化されたオーディオデジタル信号を選択した場合、そのオーディオデジタル信号、選択制御データ、および制御部114から供給される変換テーブルtable1からオーディオストリームを生成する。一方、データ送信部118は、データ量比較部117から供給される可逆圧縮符号化されていないオーディオデジタル信号を選択した場合、そのオーディオデジタル信号と選択制御データから、オーディオストリームを生成する。そして、データ送信部118は、生成されたオーディオストリームを、出力部119を介して出力する。なお、データ送信部118は、所定数のサンプルごとのオーディオデジタル信号に同期信号と誤り訂正符号(ECC)を付加してオーディオストリームを生成することもできる。
 (データ発生カウントテーブルの例)
 図24は、図23の制御部114により生成されるデータ発生カウントテーブルの例を示す図である。
 制御部114は、入力バッファ113から供給されるフレーム単位のオーディオデジタル信号を4ビット単位で分割する。以下では、分割された先頭からi番目(iは1より大きい整数)の4ビット単位のオーディオデジタル信号をD4データD4[i]という。
 制御部114は、フレームごとに、先頭からn番目(n>3)のD4データD4[n]を順に処理対象のD4データとする。制御部114は、処理対象のD4データD4[n]の直近の過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]のパターンごとに、処理対象のD4データD4[n]の発生回数をカウントし、図24に示すデータ発生カウントテーブルpre_table[4096][16]を作成する。ここで、データ発生カウントテーブルpre_table[4096][16]の[4096]と[16]は、データ発生カウントテーブルが4096行16列のテーブル(行列)であることを表し、[0]乃至[4095]の各行は、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]がとり得る値に対応し、[0]乃至[15]の各列は、処理対象のD4データD4[n]がとり得る値に対応する。
 具体的には、データ発生カウントテーブルpre_tableの1行目であるpre_table[0][0]乃至[0][15]は、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]が“0”={0000,0000,0000}だった時の処理対象のD4データD4[n]の発生回数を示している。図24の例では、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]が“0”であり、処理対象のD4データD4[n]が“0”であった回数が369a(HEX表記)であり、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]が“0”であり、処理対象のD4データD4[n]が“0”以外であった回数が0である。従って、pre_table[0][0]乃至[0][15]は、{369a,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0}である。
 データ発生カウントテーブルpre_tableの2行目であるpre_table[1][0]乃至[1][15]は、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]が“1”={0000,0000,0001}だった時の処理対象のD4データD4[n]の発生回数を示している。図24の例では、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]が“1”となるパターンは1フレーム内に存在しない。従って、pre_table[1][0]乃至[1][15]は、{0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0}である。
 また、データ発生カウントテーブルpre_tableの118行目であるpre_table[117][0]乃至[117][15]は、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]が“117”={0000,0111,0101}だった時の処理対象のD4データD4[n]の発生回数を示している。図24の例では、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]が“117”であり、処理対象のD4データD4[n]が“0”であった回数が0回であり、“1”であった回数が1回であり、“2”であった回数が10回であり、“3”であった回数が18回であり、“4”であった回数が20回であり、“5”であった回数が31回であり、“6”であった回数が11回であり、“7”であった回数が0回であり、“8”であった回数が4回であり、“9”であった回数が12回であり、“10”であった回数が5回であり、“11”乃至“15”であった回数が0回であったことを示している。従って、pre_table[117][0]乃至[117][15]は、{0,1,10,18,20,31,11,0,4,12,5,0,0,0,0,0}である。
 (変換テーブルの例)
 図25は、図23の制御部114により生成される変換テーブルtable1の例を示す図である。
 制御部114は、先に作成したデータ発生カウントテーブルpre_tableに基づいて、4096行3列の変換テーブルtable1[4096][3]を作成する。ここで、変換テーブルtable1[4096][3]の各行[0]乃至[4095]は、過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]がとり得る値に対応し、各列[0]乃至[2]には、処理対象のD4データD4[n]がとり得る16個の値のうち、発生頻度が大きかった3つの値が格納される。変換テーブルtable1[4096][3]の第1列[0]には、発生頻度が最も大きい(1番目の)値が格納され、第2列[1]には、発生頻度が2番目の値が格納され、第3列[2]には、発生頻度が3番目の値が格納される。
 具体的には、制御部114が、図24のデータ発生カウントテーブルpre_tableに基づいて変換テーブルtable1[4096][3]を生成する場合、図25に示すように、変換テーブルtable1[4096][3]の118行目であるtable1[117][0]乃至[117][2]は、{05,04,03}となる。即ち、図24のデータ発生カウントテーブルpre_tableの118行目のpre_table[117][0]乃至[117][15]では、発生頻度が最も大きい(1番目の)値は、31回発生した“5”であり、発生頻度が2番目の値は、20回発生した“4”であり、発生頻度が3番目の値は、18回発生した“3”である。従って、変換テーブルtable1[4096][3]の第118行第1列table1[117][0]には、{05}が格納され、第118行第2列table1[117][1]には、{04}が格納され、第118行第3列table1[117][2]には、{03}が格納される。
 同様に、変換テーブルtable1[4096][3]の1行目のtable1[0][0]乃至[0][2]は、図24のデータ発生カウントテーブルpre_tableの1行目のpre_table[0][0]乃至[0][15]に基づいて生成される。即ち、図24のデータ発生カウントテーブルpre_tableの1行目のpre_table[0][0]乃至[0][15]では、発生頻度が最も大きい(1番目の)値は、369a(HEX表記)回発生した“0”であり、それ以外の値は発生していない。そこで、変換テーブルtable1[4096][3]の第1行第1列table1[0][0]には、{00}が格納され、第1行第2列table1[0][1]と第1行第3列table1[0][2]には、データが存在しないことを表す{ff}が格納される。データが存在しないことを表す値は、{ff}に限られず、適宜決定することができる。変換テーブルtable1の各要素に格納される値は、“0”から“15”までのいずれかであるので、4ビットで表現できるが、コンピュータ処理上、扱いを容易にするために8ビットで表現されている。
 (可逆圧縮符号化の説明)
 次に、図23のエンコード部115による、変換テーブルtable1を用いた圧縮符号化方法について説明する。
 エンコード部115は、制御部114と同様に、入力バッファ113から供給されるフレーム単位のオーディオデジタル信号を4ビット単位で分割する。制御部114は、先頭からn番目のD4データD4[n]を可逆圧縮符号化する場合、変換テーブルtable1[4096][3]の、直近の過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]に対応する行の3つの値を検索する。エンコード部115は、可逆圧縮符号化対象のD4データD4[n]が、変換テーブルtable1[4096][3]の、直近の過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]に対応する行の1列目の値と同一である場合、2ビットの値“01b”をD4データD4[n]の可逆圧縮符号化結果として生成する。また、エンコード部115は、可逆圧縮符号化対象のD4データD4[n]が、変換テーブルtable1[4096][3]の、直近の過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]に対応する行の2列目の値と同一である場合、2ビットの値“10b”をD4データD4[n]の可逆圧縮符号化結果として生成し、3列目の値と同一である場合、2ビットの値“11b”をD4データD4[n]の可逆圧縮符号化結果として生成する。
 一方、エンコード部115は、変換テーブルtable1[4096][3]の、直近の過去の3つのD4データD4[n-3],D4[n-2],D4[n-1]に対応する行の3つの値の中に可逆圧縮符号化対象のD4データD4[n]と同一の値が存在しない場合、そのD4データD4[n]の前に“00b”をつけた6ビットの値“00b+ D4[n]”をD4データD4[n]の可逆圧縮符号化結果として生成する。ここで、“01b”、“10b”、“11b”、“00b+ D4[n]”のbは、2進表記であることを表す。
 以上のようにして、エンコード部115は、変換テーブルtable1を用いて、4ビットのDSDデータD4[n]を、2ビットの値“01b”、“10b”、もしくは“11b”に変換するか、または、6ビットの値“00b+D4[n]”に変換し、可逆圧縮符号化結果とする。エンコード部115は、可逆圧縮符号化結果を、可逆圧縮符号化されたオーディオデジタル信号として、符号化データバッファ116に出力する。
 (可逆圧縮復号部の構成例>
 図26は、図6の復号部66と出力制御部67のうちの、オーディオストリームをlosslessDSD方式で復号し、D/A変換する可逆圧縮復号部の構成例を示すブロック図である。
 図26の可逆圧縮復号部170は、入力部171、データ受信部172、符号化データバッファ173、デコード部174、テーブル記憶部175、出力バッファ176、アナログフィルタ177、および出力部178により構成される。可逆圧縮復号部170は、オーディオストリームをlosslessDSD方式で可逆圧縮復号し、その結果得られるオーディオデジタル信号をDSD方式でオーディオアナログ信号に変換して出力する。
 具体的には、図6のバッファ65から供給されるオーディオストリームは、入力部171から入力されて、データ受信部172に供給される。
 データ受信部172は、オーディオストリームに含まれるオーディオデジタル信号が可逆圧縮符号化されているか否かを示す選択制御データに基づいて、オーディオデジタル信号が可逆圧縮符号化されているか否かを判定する。そして、オーディオデジタル信号が可逆圧縮符号化されていると判定された場合、データ受信部172は、オーディオストリームに含まれるオーディオデジタル信号を、可逆圧縮符号化されたオーディオデジタル信号として、符号化データバッファ173に供給する。また、データ受信部172は、オーディオストリームに含まれる、変換テーブルtable1をテーブル記憶部175に供給する。
 一方、オーディオ信号が可逆圧縮符号化されていないと判定された場合、データ受信部172は、オーディオストリームに含まれるオーディオデジタル信号を、可逆圧縮符号化されていないオーディオデジタル信号として、出力バッファ176に供給する。
 テーブル記憶部175は、データ受信部172から供給された変換テーブルtable1を記憶し、デコード部174に供給する。
 符号化データバッファ173は、データ受信部172から供給される可逆圧縮符号化されたオーディオデジタル信号をフレーム単位で一時蓄積する。符号化データバッファ173は、蓄積しているフレーム単位のオーディオデジタル信号を、所定のタイミングで連続する2ビットずつ後段のデコード部174に供給する。
 デコード部174は、2ビットのレジスタ191、12ビットのレジスタ192、変換テーブル処理部193、4ビットのレジスタ194、およびセレクタ195により構成される。デコード部174は、可逆圧縮符号化されたオーディオデジタル信号を可逆圧縮復号して、可逆圧縮符号化前のオーディオデジタル信号を生成する。
 具体的には、レジスタ191は、符号化データバッファ173から供給された2ビットのオーディオデジタル信号を記憶する。レジスタ191は、記憶している2ビットのオーディオデジタル信号を、所定のタイミングで変換テーブル処理部193とセレクタ195に供給する。
 12ビットのレジスタ192は、セレクタ195から供給される、可逆圧縮復号結果である4ビットのオーディオデジタル信号を、FIFO(First-In First-Out)で12ビット分記憶する。これにより、レジスタ192には、レジスタ191に記憶されている2ビットのオーディオデジタル信号を含むオーディオデジタル信号の可逆圧縮復号結果の直近の過去の3つの可逆圧縮復号結果であるD4データが格納される。
 変換テーブル処理部193は、レジスタ191から供給される2ビットのオーディオデジタル信号が“00b”である場合、そのオーディオデジタル信号は変換テーブルtable1[4096][3]に登録されていないので、無視する。また、変換テーブル処理部193は、いま供給された2ビットのオーディオデジタル信号の直後に供給される2回分の合計4ビットのオーディオデジタル信号を無視する。
 一方、供給された2ビットのオーディオデジタル信号が、“01b”、“10b”、または“11b”である場合、変換テーブル処理部193は、レジスタ192に記憶されている3つのD4データ(12ビットのD4データ)を読み出す。変換テーブル処理部193は、テーブル記憶部175から、変換テーブルtable1の、読み出された3つのD4データがD4[n-3],D4[n-2],D4[n-1]として登録されている行の、供給された2ビットのオーディオデジタル信号が示す列に格納されるD4データを読み出す。変換テーブル処理部193は、読み出されたD4データをレジスタ194に供給する。
 レジスタ194は、変換テーブル処理部193から供給される4ビットのD4データを記憶する。レジスタ194は、記憶している4ビットのD4データを所定のタイミングでセレクタ195の入力端子196bに供給する。
 セレクタ195は、レジスタ191から供給される2ビットのオーディオデジタル信号が“00b”である場合、入力端子196aを選択する。そして、セレクタ195は、入力端子196aに“00b”の後に入力された4ビットのオーディオデジタル信号を可逆圧縮復号結果として、出力端子197からレジスタ192および出力バッファ176に出力する。
 一方、レジスタ194から入力端子196bに4ビットのオーディオデジタル信号が入力された場合、セレクタ195は、入力端子196bを選択する。そして、セレクタ195は、入力端子196bに入力された4ビットのオーディオデジタル信号を可逆圧縮復号結果として、出力端子197からレジスタ192および出力バッファ176に出力する。
 出力バッファ176は、データ受信部172から供給された可逆圧縮符号化されていないオーディオデジタル信号、または、デコード部174から供給された可逆圧縮復号結果であるオーディオデジタル信号を記憶し、アナログフィルタ177に供給する。
 アナログフィルタ177は、出力バッファ176から供給されたオーディオデジタル信号に対して、ローパスフィルタ、バンドパスフィルタ等の所定のフィルタ処理を実行し、出力部178を介して出力する。
 なお、変換テーブルtable1は、可逆圧縮符号化部100により圧縮されて可逆圧縮復号部170に供給されるようにしてもよい。また、変換テーブルtable1は、予め設定され、可逆圧縮符号化部100と可逆圧縮復号部170に記憶されるようにしてもよい。さらに、変換テーブルtable1の数は複数であってもよい。この場合、j番目(jは0以上の整数)の変換テーブルtable1には、発生頻度の大きい方から3(j-1),3(j-1)+1,3(j-1)+2番目のD4データが各行に格納される。また、各行に対応する過去のD4データの数は、3つに限定されない。
 また、可逆圧縮符号化方法は、上述した方法に限定されず、例えば、特開平9-74358号公報に記載の方法であってもよい。
 <第7実施の形態>
 (本開示を適用したコンピュータの説明)
 上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
 図27は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
 コンピュータ200において、CPU(Central Processing Unit)201,ROM(Read Only Memory)202,RAM(Random Access Memory)203は、バス204により相互に接続されている。
 バス204には、さらに、入出力インタフェース205が接続されている。入出力インタフェース205には、入力部206、出力部207、記憶部208、通信部209、及びドライブ210が接続されている。
 入力部206は、キーボード、マウス、マイクロフォンなどよりなる。出力部207は、ディスプレイ、スピーカなどよりなる。記憶部208は、ハードディスクや不揮発性のメモリなどよりなる。通信部209は、ネットワークインタフェースなどよりなる。ドライブ210は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア211を駆動する。
 以上のように構成されるコンピュータ200では、CPU201が、例えば、記憶部208に記憶されているプログラムを、入出力インタフェース205及びバス204を介して、RAM203にロードして実行することにより、上述した一連の処理が行われる。
 コンピュータ200(CPU201)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア211に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
 コンピュータ200では、プログラムは、リムーバブルメディア211をドライブ210に装着することにより、入出力インタフェース205を介して、記憶部208にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部209で受信し、記憶部208にインストールすることができる。その他、プログラムは、ROM202や記憶部208に、あらかじめインストールしておくことができる。
 なお、コンピュータ200が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
 また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
 さらに、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
 また、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、スケーリングは、プレミアムサーバ14、準プレミアムサーバ15、オンデマンドサーバ16に対してだけでなく、管理サーバ12やオリジナル配信サーバ13に対して行われるようにしてもよい。また、オリジナル配信サーバ13は、MPDファイルやセグメントファイルとは別に管理サーバ12から送信されてくるビットレート情報や最大ビットレートではなく、管理サーバ12から送信されてくるMPDファイルやセグメントファイルを解析し、スケーリングを行うようにしてもよい。
 また、第1乃至第7実施の形態におけるlosslessDSD方式は、可逆圧縮符号化によるビット発生量が予測できない可逆圧縮方式であれば、losslessDSD方式以外であってもよい。例えば、第1乃至第7実施の形態におけるlosslessDSD方式は、FLAC(Free Lossless Audio Codec)方式やALAC(Apple lossless Audio Codec)方式などであってもよい。FLAC方式やALAC方式においても、losslessDSD方式と同様に、オーディオアナログ信号の波形に応じてビットの発生量が変動する。なお、変動する比率は方式によって異なる。
 さらに、第6実施の形態において、セグメントファイルの生成時には固定のセグメント長のセグメントファイルを生成しておくようにしてもよい。この場合、プレミアムサーバ14、準プレミアムサーバ15、およびオンデマンドサーバ16は、配信時のAveBandwidthに基づいて、その固定のセグメント長のセグメントファイルを連結することにより、可変のセグメント長のセグメントファイルを生成し、配信する。
 また、第3乃至第5実施の形態では、AveBandwidthとDurationForAveBandwidth(の更新値)がセグメントファイルに配置される。従って、準プレミアムクライアント18およびオンデマンドクライアント19は、再生開始時に最新のAveBandwidthとDurationForAveBandwidthを取得することはできない。よって、AveBandwidthとDurationForAveBandwidth(の更新値)を格納するセグメントファイルの送信時に、最新のAveBandwidthとDurationForAveBandwidthを格納し直すようにしてもよい。この場合、準プレミアムクライアント18およびオンデマンドクライアント19は、再生開始時に最新のAveBandwidthとDurationForAveBandwidthを認識することができる。
 また、第1乃至第7実施の形態では、最新のAveBandwidthとDurationForAveBandwidthのみがMPDファイルまたはセグメントファイルに記述されたが、任意の時間ごとのAveBandwidthとDurationForAveBandwidthが列挙されるようにしてもよい。この場合、プレミアムクライアント17、準プレミアムクライアント18、およびオンデマンドクライアント19は、きめ細かい帯域制御を行うことが可能になる。なお、任意の時間が一定の時間である場合には、DurationForAveBandwidthは1つだけ記述されるようにしてもよい。
 なお、本開示は、以下のような構成もとることができる。
 (1)
 可逆圧縮方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、前記オーディオストリームを他の情報処理装置に配信する配信装置のスケーリングを行うスケーリング部
 を備える情報処理装置。
 (2)
 前記スケーリング部は、前記オーディオストリームの配信を要求する前記他の情報処理装置の数、および、前記他の情報処理装置に対する前記オーディオストリームの配信開始時刻に基づいて、前記スケーリングを行う
 ように構成された
 前記(1)に記載の情報処理装置。
 (3)
 前記配信装置は、前記他の情報処理装置に対する課金処理の料金に応じて、前記オーディオストリームの生成開始時に前記オーディオストリームの配信を許可する
 ように構成された
 前記(1)または(2)に記載の情報処理装置。
 (4)
 前記配信装置は、前記他の情報処理装置に対する課金処理の料金に応じて、前記オーディオストリームの生成が開始されてから所定の時間経過後に前記オーディオストリームの配信を許可する
 ように構成された
 前記(1)乃至(3)のいずれかに記載の情報処理装置。
 (5)
 前記配信装置は、前記他の情報処理装置に対する課金処理の料金に応じて、前記オーディオストリームの生成終了後に前記オーディオストリームの配信を許可する
 ように構成された
 前記(1)乃至(4)のいずれかに記載の情報処理装置。
 (6)
 前記ビットレート情報は、前記所定の期間を含む
 ように構成された
 前記(1)乃至(5)のいずれかに記載の情報処理装置。
 (7)
 前記所定の期間は、基準期間ごとに、前記基準期間だけ増加し、
 前記ビットレート情報は、前記基準期間ごとに更新される
 ように構成された
 前記(1)乃至(6)のいずれかに記載の情報処理装置。
 (8)
 前記ビットレート情報は、前記オーディオストリームを管理する管理ファイルに含まれる
 ように構成された
 前記(7)に記載の情報処理装置。
 (9)
 前記管理ファイルには、前記基準期間を示す情報が含まれる
 ように構成された
 前記(8)に記載の情報処理装置。
 (10)
 前記ビットレート情報の初期値は、前記オーディオストリームを管理する管理ファイルに含まれ、
 前記ビットレート情報の更新値は、前記オーディオストリームを格納するファイルに含まれる
 ように構成された
 前記(7)に記載の情報処理装置。
 (11)
 前記ビットレート情報は、前記オーディオストリームを格納するファイルに含まれる
 ように構成された
 前記(7)に記載の情報処理装置。
 (12)
 前記ビットレート情報は、前記オーディオストリームを格納するファイルとは異なるファイルに含まれ、前記オーディオストリームを管理する管理ファイルに管理される
 ように構成された
 前記(7)に記載の情報処理装置。
 (13)
 前記可逆圧縮方式は、losslessDSD(Direct Stream Digital)方式、FLAC(Free Lossless Audio Codec)方式、またはALAC(Apple lossless Audio Codec)方式である
 ように構成された
 前記(1)乃至(12)のいずれかに記載の情報処理装置。
 (14)
 情報処理装置が、
 可逆圧縮方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、前記オーディオストリームを他の情報処理装置に配信する配信装置のスケーリングを行うスケーリングステップ
 を含む情報処理方法。
 (15)
 第1の情報処理装置と、
 第2の情報処理装置と、
 配信装置と
 を備え、
 前記第1の情報処理装置は、可逆圧縮方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、前記オーディオストリームを前記第2の情報処理装置に配信する前記配信装置のスケーリングを行う
 ように構成された
 情報処理システム。
 (16)
 前記第2の情報処理装置に対する課金処理を行う課金処理装置
 をさらに備え、
 前記配信装置は、前記課金処理装置による前記課金処理の料金に応じて、前記オーディオストリームを配信する
 ように構成された
 前記(15)に記載の情報処理システム。
 (17)
 前記配信装置は、前記課金処理の料金に応じて、前記オーディオストリームの生成開始時に前記オーディオストリームの配信を許可する
 ように構成された
 前記(16)に記載の情報処理システム。
 (18)
 前記配信装置は、前記課金処理の料金に応じて、前記オーディオストリームの生成が開始されてから所定の時間経過後に前記オーディオストリームの配信を許可する
 ように構成された
 前記(16)または(17)に記載の情報処理システム。
 (19)
 前記配信装置は、前記課金処理の料金に応じて、前記オーディオストリームの生成終了後に前記オーディオストリームの配信を許可する
 ように構成された
 前記(16)乃至(18)のいずれかに記載の情報処理システム。
 10 情報処理システム, 13 オリジナル配信サーバ, 14 プレミアムサーバ, 15 準プレミアムサーバ, 17 プレミアムクライアント, 18 準プレミアムクライアント, 21 課金サーバ

Claims (19)

  1.  可逆圧縮方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、前記オーディオストリームを他の情報処理装置に配信する配信装置のスケーリングを行うスケーリング部
     を備える情報処理装置。
  2.  前記スケーリング部は、前記オーディオストリームの配信を要求する前記他の情報処理装置の数、および、前記他の情報処理装置に対する前記オーディオストリームの配信開始時刻に基づいて、前記スケーリングを行う
     ように構成された
     請求項1に記載の情報処理装置。
  3.  前記配信装置は、前記他の情報処理装置に対する課金処理の料金に応じて、前記オーディオストリームの生成開始時に前記オーディオストリームの配信を許可する
     ように構成された
     請求項1に記載の情報処理装置。
  4.  前記配信装置は、前記他の情報処理装置に対する課金処理の料金に応じて、前記オーディオストリームの生成が開始されてから所定の時間経過後に前記オーディオストリームの配信を許可する
     ように構成された
     請求項1に記載の情報処理装置。
  5.  前記配信装置は、前記他の情報処理装置に対する課金処理の料金に応じて、前記オーディオストリームの生成終了後に前記オーディオストリームの配信を許可する
     ように構成された
     請求項1に記載の情報処理装置。
  6.  前記ビットレート情報は、前記所定の期間を含む
     ように構成された
     請求項1に記載の情報処理装置。
  7.  前記所定の期間は、基準期間ごとに、前記基準期間だけ増加し、
     前記ビットレート情報は、前記基準期間ごとに更新される
     ように構成された
     請求項1に記載の情報処理装置。
  8.  前記ビットレート情報は、前記オーディオストリームを管理する管理ファイルに含まれる
     ように構成された
     請求項7に記載の情報処理装置。
  9.  前記管理ファイルには、前記基準期間を示す情報が含まれる
     ように構成された
     請求項8に記載の情報処理装置。
  10.  前記ビットレート情報の初期値は、前記オーディオストリームを管理する管理ファイルに含まれ、
     前記ビットレート情報の更新値は、前記オーディオストリームを格納するファイルに含まれる
     ように構成された
     請求項7に記載の情報処理装置。
  11.  前記ビットレート情報は、前記オーディオストリームを格納するファイルに含まれる
     ように構成された
     請求項7に記載の情報処理装置。
  12.  前記ビットレート情報は、前記オーディオストリームを格納するファイルとは異なるファイルに含まれ、前記オーディオストリームを管理する管理ファイルに管理される
     ように構成された
     請求項7に記載の情報処理装置。
  13.  前記可逆圧縮方式は、losslessDSD(Direct Stream Digital)方式、FLAC(Free Lossless Audio Codec)方式、またはALAC(Apple lossless Audio Codec)方式である
     ように構成された
     請求項1に記載の情報処理装置。
  14.  情報処理装置が、
     可逆圧縮方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、前記オーディオストリームを他の情報処理装置に配信する配信装置のスケーリングを行うスケーリングステップ
     を含む情報処理方法。
  15.  第1の情報処理装置と、
     第2の情報処理装置と、
     配信装置と
     を備え、
     前記第1の情報処理装置は、可逆圧縮方式で符号化されたオーディオストリームのビットレートの所定の期間の平均値を含むビットレート情報に基づいて、前記オーディオストリームを前記第2の情報処理装置に配信する前記配信装置のスケーリングを行う
     ように構成された
     情報処理システム。
  16.  前記第2の情報処理装置に対する課金処理を行う課金処理装置
     をさらに備え、
     前記配信装置は、前記課金処理装置による前記課金処理の料金に応じて、前記オーディオストリームを配信する
     ように構成された
     請求項15に記載の情報処理システム。
  17.  前記配信装置は、前記課金処理の料金に応じて、前記オーディオストリームの生成開始時に前記オーディオストリームの配信を許可する
     ように構成された
     請求項16に記載の情報処理システム。
  18.  前記配信装置は、前記課金処理の料金に応じて、前記オーディオストリームの生成が開始されてから所定の時間経過後に前記オーディオストリームの配信を許可する
     ように構成された
     請求項16に記載の情報処理システム。
  19.  前記配信装置は、前記課金処理の料金に応じて、前記オーディオストリームの生成終了後に前記オーディオストリームの配信を許可する
     ように構成された
     請求項16に記載の情報処理システム。
PCT/JP2017/010111 2016-03-28 2017-03-14 情報処理装置および情報処理方法、並びに情報処理システム WO2017169727A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201780019077.5A CN108886626B (zh) 2016-03-28 2017-03-14 信息处理装置、信息处理方法以及信息处理系统
US16/086,663 US10735794B2 (en) 2016-03-28 2017-03-14 Information processing device, information processing method, and information processing system
JP2018508963A JP6977711B2 (ja) 2016-03-28 2017-03-14 情報処理装置および情報処理方法、並びに情報処理システム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016-063224 2016-03-28
JP2016063224 2016-03-28

Publications (1)

Publication Number Publication Date
WO2017169727A1 true WO2017169727A1 (ja) 2017-10-05

Family

ID=59964621

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/010111 WO2017169727A1 (ja) 2016-03-28 2017-03-14 情報処理装置および情報処理方法、並びに情報処理システム

Country Status (4)

Country Link
US (1) US10735794B2 (ja)
JP (1) JP6977711B2 (ja)
CN (1) CN108886626B (ja)
WO (1) WO2017169727A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020136907A (ja) * 2019-02-20 2020-08-31 キヤノン株式会社 情報配信装置、情報処理装置、情報配信方法、情報処理方法及びプログラム
WO2021066163A1 (ja) * 2019-10-04 2021-04-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
KR20210109591A (ko) * 2019-01-04 2021-09-06 텐센트 아메리카 엘엘씨 초기화 계층을 사용하는 유연한 상호운용성 및 능력 시그널링

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3782412B1 (en) 2018-04-17 2023-09-27 Telefonaktiebolaget LM Ericsson (publ) A radio network node, a wireless device and methods therein for transmission and reception of positioning system information
US11687386B2 (en) * 2020-10-07 2023-06-27 Tencent America LLC MPD validity expiration processing model

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000350164A (ja) * 1999-06-01 2000-12-15 Canon Inc 画像記録装置、方法及びコンピュータ読み取り可能な記憶媒体
JP2008546014A (ja) * 2005-05-30 2008-12-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 最小限の記憶容量を必要とするダイレクトストリームデジタルオーディオ
US20130054756A1 (en) * 2010-02-03 2013-02-28 Manh-Hung P Do Redirection apparatus and method
JP2013509040A (ja) * 2009-10-16 2013-03-07 クゥアルコム・インコーポレイテッド マルチメディアを適応的にストリーミングすること
JP2013509818A (ja) * 2009-10-28 2013-03-14 クゥアルコム・インコーポレイテッド 符号化ビデオ・データのストリーミング
JP2013109547A (ja) * 2011-11-21 2013-06-06 Sony Computer Entertainment Inc 情報処理システム、情報処理方法、プログラム及び情報記憶媒体
US20150195328A1 (en) * 2014-01-06 2015-07-09 Intel IP Corporation Client/server signaling commands for dash

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US7571246B2 (en) * 2004-07-29 2009-08-04 Microsoft Corporation Media transrating over a bandwidth-limited network
US20060235683A1 (en) * 2005-04-13 2006-10-19 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Lossless encoding of information with guaranteed maximum bitrate
JP2009163440A (ja) * 2007-12-28 2009-07-23 Nec Corp 負荷分散方法、負荷分散システム、負荷分散サーバ及び負荷分散プログラム
JP2011172021A (ja) * 2010-02-18 2011-09-01 Nec Corp キャッシュサーバ制御装置、コンテンツ配信システム、コンテンツ配信方法、及びプログラム
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
WO2013077034A1 (ja) 2011-11-21 2013-05-30 株式会社ソニー・コンピュータエンタテインメント 情報処理システム、情報処理方法、プログラム及び情報記憶媒体
CN104429087B (zh) * 2012-07-10 2018-11-09 夏普株式会社 再现装置、再现方法、发布装置、发布方法
US9398465B2 (en) 2013-08-08 2016-07-19 Intel IP Corporation User equipment distribution information collection
US9948994B2 (en) * 2014-07-16 2018-04-17 Crestron Electronics, Inc. Transmission of digital audio signals using an internet protocol

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000350164A (ja) * 1999-06-01 2000-12-15 Canon Inc 画像記録装置、方法及びコンピュータ読み取り可能な記憶媒体
JP2008546014A (ja) * 2005-05-30 2008-12-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 最小限の記憶容量を必要とするダイレクトストリームデジタルオーディオ
JP2013509040A (ja) * 2009-10-16 2013-03-07 クゥアルコム・インコーポレイテッド マルチメディアを適応的にストリーミングすること
JP2013509818A (ja) * 2009-10-28 2013-03-14 クゥアルコム・インコーポレイテッド 符号化ビデオ・データのストリーミング
US20130054756A1 (en) * 2010-02-03 2013-02-28 Manh-Hung P Do Redirection apparatus and method
JP2013109547A (ja) * 2011-11-21 2013-06-06 Sony Computer Entertainment Inc 情報処理システム、情報処理方法、プログラム及び情報記憶媒体
US20150195328A1 (en) * 2014-01-06 2015-07-09 Intel IP Corporation Client/server signaling commands for dash

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FUJIOKA, S. ET AL.: "A study of scale-out system configuration for a streaming-server", PROCEEDINGS OF THE 2015 IEICE GENERAL CONFERENCE, vol. 2, 24 February 2015 (2015-02-24), pages 109, ISSN: 1349-1369 *
HIRONOBU FUKAMI: "Chapter 5: Scalable WordPress using AWS", READER FOR TRAINING WORDPRESS PROFESSIONAL, 15 November 2014 (2014-11-15), pages 97 - 103, ISBN: 978-4-7741-6787-9 *
NIKKEI COMPUTER, 15 October 2001 (2001-10-15), pages 36 - 41, ISSN: 0285-4619 *
NIKKEI ELECTRONICS, 15 January 1996 (1996-01-15), pages 67 - 75, ISSN: 0385-1680 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210109591A (ko) * 2019-01-04 2021-09-06 텐센트 아메리카 엘엘씨 초기화 계층을 사용하는 유연한 상호운용성 및 능력 시그널링
JP2022510183A (ja) * 2019-01-04 2022-01-26 テンセント・アメリカ・エルエルシー 初期化階層を使用した柔軟な相互運用性および能力のシグナリング
JP7119229B2 (ja) 2019-01-04 2022-08-16 テンセント・アメリカ・エルエルシー 初期化階層を使用した柔軟な相互運用性および能力のシグナリング
US11770433B2 (en) 2019-01-04 2023-09-26 Tencent America LLC Flexible interoperability and capability signaling using initialization hierarchy
KR102595173B1 (ko) * 2019-01-04 2023-10-30 텐센트 아메리카 엘엘씨 초기화 계층을 사용하는 유연한 상호운용성 및 능력 시그널링
JP2020136907A (ja) * 2019-02-20 2020-08-31 キヤノン株式会社 情報配信装置、情報処理装置、情報配信方法、情報処理方法及びプログラム
JP7305371B2 (ja) 2019-02-20 2023-07-10 キヤノン株式会社 情報配信装置、情報配信方法及びプログラム
WO2021066163A1 (ja) * 2019-10-04 2021-04-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Also Published As

Publication number Publication date
CN108886626B (zh) 2021-07-16
US10735794B2 (en) 2020-08-04
US20190104332A1 (en) 2019-04-04
JPWO2017169727A1 (ja) 2019-02-07
CN108886626A (zh) 2018-11-23
JP6977711B2 (ja) 2021-12-08

Similar Documents

Publication Publication Date Title
JP6977711B2 (ja) 情報処理装置および情報処理方法、並びに情報処理システム
US10459943B2 (en) System and method for splicing media files
JP7080007B2 (ja) 情報処理装置および情報処理方法
EP2897369B1 (en) Content supply device, content supply method, program, and content supply system
Quinlan et al. Datasets for AVC (H. 264) and HEVC (H. 265) evaluation of dynamic adaptive streaming over HTTP (DASH)
US20150106860A1 (en) Method and System for Trick Play in Over-the-Top Video Delivery
JP6876928B2 (ja) 情報処理装置および方法
US20140359679A1 (en) Content streaming with client device trick play index
JP6555263B2 (ja) 情報処理装置および方法
US10375439B2 (en) Information processing apparatus and information processing method
JP7238948B2 (ja) 情報処理装置および情報処理方法
WO2017169721A1 (ja) ファイル生成装置およびファイル生成方法
WO2017169720A1 (ja) 再生装置および再生方法、並びにファイル生成装置およびファイル生成方法
WO2018142946A1 (ja) 情報処理装置および方法
CN111512634A (zh) 信息处理装置、信息处理方法和程序
JPWO2018173876A1 (ja) コンテンツ処理装置およびコンテンツ処理方法、並びにプログラム
WO2014196393A1 (ja) コンテンツ供給装置、コンテンツ供給方法、プログラム、端末装置、およびコンテンツ供給システム
KR102343639B1 (ko) 압축 부호화 장치 및 방법, 복호 장치 및 방법, 그리고 프로그램
US20200314163A1 (en) Image processing device and method thereof
CN105472403A (zh) 一种支持自适应移动流媒体的云服务框架实现方法及系统
JP2023161219A (ja) 送信装置、受信装置及びそれらのプログラム
Quinlan et al. Datasets for AVC (H. 264) and HEVC (H. 265) evaluation of dynamic
KR20130029235A (ko) 스트리밍 되어오는 동영상 파일을 실시간 변환하여 스트리밍 전송하는 방법

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2018508963

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17774271

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 17774271

Country of ref document: EP

Kind code of ref document: A1