WO2005062614A1 - 映像データ処理方法および映像データ処理装置 - Google Patents

映像データ処理方法および映像データ処理装置 Download PDF

Info

Publication number
WO2005062614A1
WO2005062614A1 PCT/JP2004/012976 JP2004012976W WO2005062614A1 WO 2005062614 A1 WO2005062614 A1 WO 2005062614A1 JP 2004012976 W JP2004012976 W JP 2004012976W WO 2005062614 A1 WO2005062614 A1 WO 2005062614A1
Authority
WO
WIPO (PCT)
Prior art keywords
stream
picture
video
trick play
reproduction
Prior art date
Application number
PCT/JP2004/012976
Other languages
English (en)
French (fr)
Inventor
Yoshiaki Kusunoki
Tsuyoshi Abe
Original Assignee
Mitsubishi Denki Kabushiki Kaisha
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Denki Kabushiki Kaisha filed Critical Mitsubishi Denki Kabushiki Kaisha
Priority to US10/583,276 priority Critical patent/US7613381B2/en
Priority to EP04787680.0A priority patent/EP1699240B1/en
Publication of WO2005062614A1 publication Critical patent/WO2005062614A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/173Analogue secrecy systems; Analogue subscription systems with two-way working, e.g. subscriber sending a programme selection signal
    • H04N7/17309Transmission or handling of upstream communications
    • H04N7/17318Direct or substantially direct transmission and handling of requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2387Stream processing in response to a playback request from an end-user, e.g. for trick-play
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection

Definitions

  • Video data processing method and video data processing device are Video data processing method and video data processing device
  • the present invention relates to a video distribution system that records and accumulates video in a server and distributes a video stream stored in response to a request from a terminal to a terminal that has made a request.
  • the present invention relates to a data processing method and a data processing apparatus for realizing special reproduction such as fast-forward, fast-rewind, and pause, in which Z or the reproduction direction is changed.
  • a video stream compressed by MPEG-2 or the like (hereinafter, referred to as a normal playback stream to distinguish it from a special playback stream) is played back, particularly in a video playback system using a network.
  • a normal playback stream to distinguish it from a special playback stream
  • I frames intra-frame coded pictures
  • the problem with the network bandwidth is serious, and the special playback method using only I frames generally requires about three times the bandwidth as compared to normal playback due to the amount of code in the I frames. And, it is difficult to actually increase the band for trick play. Therefore, as a countermeasure, there is a method of separately preparing a special reproduction stream.However, this method is simple in terms of the system configuration. And the need to manage the normal playback stream and the special playback stream in association with each other o
  • a repeat picture coded with a motion vector of a macroblock of 0 and a prediction error of 0 following a frame or intra-field encoded data as a special reproduction stream is used.
  • a method of inserting and distributing data has been proposed (for example, see Patent Document 1).
  • the transfer rate can be significantly reduced by adding a repeat picture with a very small code amount following an I frame with a large code amount in the execution of trick play. Since the transfer rate can be increased, there is no need to secure a large memory for trick play.
  • the special playback stream to be generated can be configured in the same way as the normal playback stream in terms of syntax, so no special logic or additional circuit is required to handle the special stream, and the special playback stream is switched to a dedicated logic. No need.
  • VBV buffer Video Buffering Verifier buffer: a virtual buffer for controlling the amount of code generation
  • VBV Delay data residence time in the decoder buffer
  • Patent Document 1 Patent No. 3304634 (Page 10, FIG. 1)
  • Patent Document 2 JP-A-2002-77811 (Page 12, FIG. 1)
  • the VBV delay had to be obtained through complicated calculation processing, such as simulating a VBV buffer, and this was a power that could not be obtained within a practical range, depending on the system load.
  • the values of the normal play stream are diverted as they are, and optimization for the trick play stream is performed. Has not been done. For this reason, the standard MPEG-2 stream may be deviated from the standard, and the reproduced video may be disturbed or the multiplexing may fail in the multiplexing device.
  • the normal reproduction stream power is also reduced to the special reproduction stream.
  • ,, So When performing special playback between a server and a terminal on a network, using only I-frames may increase the required network bandwidth or cause a failure in the decoder buffer, and the decoder that plays back the special playback stream could cause image distortion.
  • the present invention has been made to solve such a conventional problem, and when performing special reproduction via a network, a video data processing method and a video data processing apparatus that reduce video disturbance. Is provided.
  • a video data processing method for generating a trick play stream with a changed playback speed and playback direction for a video stream encoded using inter-frame prediction comprising: Optionally, selectively extracting the video stream power frame intra-coded pictures;
  • a repeat picture indicating the content is generated, and the repeat picture is placed after the intra-frame encoded picture in which the encoding parameter selected based on the reproduction speed and the reproduction direction in the data transmission order is changed.
  • a video data processing apparatus for generating a trick play stream in which a playback speed and a playback direction are changed with respect to a video stream encoded using inter-frame prediction. Means for selectively extracting the video stream power intra-frame encoded image;
  • the video stream selectively extracts the intra-frame encoded picture in accordance with the speed and direction of the special reproduction stream to be generated, and encodes the intra-frame encoded picture.
  • the encoding parameters are analyzed in accordance with the speed and the direction, the repeat parameters are analyzed, and a repeat picture showing the same display content as the intra-frame encoded picture is generated.
  • FIG. 1 is a schematic block diagram showing a video distribution system including a video data processing device according to a first embodiment of the present invention.
  • FIGS. 2 (a) and (b) are diagrams illustrating the structure of a fast-forward playback stream according to Embodiment 1 of the present invention.
  • FIG. 3 (a) and (b) are diagrams illustrating the structure of a pause stream in Embodiment 1 of the present invention.
  • FIGS. 4 (a) and 4 (b) are diagrams for explaining the structure of a fast-rewind playback stream according to Embodiment 1 of the present invention.
  • FIGS. 5 (a) and (b) are diagrams showing transitions of a VBV buffer according to Embodiment 1 of the present invention.
  • FIG. 6 is a schematic block diagram showing a wide-area monitoring system including a video data processing device according to Embodiment 2 of the present invention.
  • FIG. 7 is a block diagram showing a trick play module according to Embodiment 2 of the present invention.
  • FIG. 8 is a diagram illustrating a time stamp for each GOP in Embodiment 2 of the present invention.
  • FIG. 1 includes a video data processing apparatus according to Embodiment 1 of the present invention, which includes a server that distributes video on a network and a terminal that receives and reproduces a video distributed from the server. It is a figure showing a video distribution system.
  • the normal reproduction is performed at the same reproduction speed as the speed at which the video was recorded, and the special reproduction is performed at a speed different from the normal reproduction, such as the normal reproduction speed.
  • Fast forward playback with speeds of 2x, 5x, 15x, etc. fast rewind playback with the playback direction reversed for fast forward playback, and pause to continuously display the same video I do.
  • the video stream used in the first embodiment is recorded as a program stream of ISOZIE C13818-1, so-called MPEG-2.
  • the illustrated video distribution system includes a server 1 and terminals 51 to 53 connected to each other via a network 31.
  • the terminals 51 to 53 have the same configuration, and only the terminal 51 is shown in detail.
  • the server 1 includes a storage unit 2, a reading unit 3, a switch 4, a switch 6, a reproduction control unit 5, a distribution unit 7, an extraction unit 12, a special reproduction processing unit 11, and an address map 21. ing.
  • the storage unit 2 is provided for storing a video stream therein, and the storage unit 2 stores a plurality of normal playback streams. Further, the address map 21 associates the playback time stamp of the GOP (Group of Pictures) of the normal playback stream stored in the storage unit 2 with the address stored in the storage unit 2. Table has been saved.
  • GOP Group of Pictures
  • the reading unit 3 receives the GOP data recorded at the corresponding address of the stream from the storage unit 2 based on the time stamp and the address information recorded in the address map 21 according to an instruction from the reproduction control unit 5. Read out.
  • the reproduction control unit 5 controls the reading unit 3, the switch 4, and the switch 6 depending on whether the reproduction request from the terminal 51-53 is the normal reproduction or the special reproduction, and outputs the stream from the storage unit 2. Control the flow.
  • the extraction unit 12 extracts from the normal reproduction stream up to the intra-frame encoded picture data which is the first picture data of the sequence header indicating the beginning of the MPEG-2 video unit.
  • the normal reproduction stream is stored in the program stream format, demultiplexing for separating the program stream into elementary streams is performed in parallel with the above extraction work.
  • the special reproduction processing unit 11 includes an analysis unit 13 that analyzes the input intra-frame encoded picture, a decoder buffer calculation unit 14 that calculates a decoder buffer of the generated special reproduction stream, and An intra-frame encoded picture data conversion processing unit 15 for changing encoding parameters of an intra-frame encoded picture, and a repeat picture adding unit for generating a repeat picture for displaying the same image as the intra-frame encoded picture 16, a code amount control unit 17 for controlling the generated code amount of the special reproduction stream to be generated, and a PS (program storage) for multiplexing the special reproduction stream into a program stream having the same format as the normal reproduction stream. And a special reproduction stream based on the intra-frame encoding picture of the normal reproduction stream.
  • the analysis unit 13 includes a VBV delay, a temporal 'reference (Temporal Reference), a picture' coding 'type (Picture Coding Type), and a code amount of the input intra-frame encoded picture. Then, necessary parameters are acquired in the special reproduction processing unit 11.
  • the decoder buffer calculation unit 14 calculates the VBV delay of the generated special reproduction stream based on the parameters acquired from the analysis unit 13. The method of calculating the VBV delay will be described later.
  • the intra-frame encoded picture data conversion processing unit 15 performs, for example, a temporal 'reference', a VBV delay, and a sequence header and subsequent frames so as to be suitable for the special reproduction stream generated by the input intra-coded picture. Change the bit rate value (Bit Rate Value) and VBV buffer size value (VBV Buffer Size Value) up to the coded picture.
  • the repeat picture adding unit 16 codes the motion vector to 0 and the prediction error to 0 so that the display content is the same as that of the preceding intra-frame encoded picture, and sets the skipped macro block to 0. By using this, data whose code amount is greatly reduced is generated.
  • the code amount control unit 17 predicts the generated code amount with respect to the target transfer rate of the special reproduction stream to be generated, and if the predicted code amount is smaller than the target transfer rate, performs the target by performing stuffing. If the transfer rate approaches the transfer rate and the predicted code amount is likely to exceed the target transfer rate, the target code amount is temporarily increased and the related bit rate value, for example, ⁇ SCR (System Clock Reference: System clock reference value) ) Is readjusted, and the generated code amount is controlled by performing processing so as not to cause inconsistency with the MPEG standard.
  • ⁇ SCR System Clock Reference: System clock reference value
  • the PS conversion unit 18 divides the trick play stream generated in the format of the video elementary stream into packs and converts the stream into the program stream format.
  • the distribution unit 7 transmits, for example, RTP (Real-time Transport), which is a transmission protocol for streaming reproduction of video, for the normal reproduction stream and the special reproduction stream.
  • RTP Real-time Transport
  • distribution is performed via the network 31 to the terminal, for example, the terminal 51 for which the distribution request has been made.
  • terminal 51 As described above, since terminals 51-53 all have the same configuration, terminal 51 will be described here.
  • the terminal 51 requests the server 1 connected via the network 31 to perform distribution, and in that case, the type of the desired video stream, the normal reproduction or the special reproduction, and the reproduction direction in the case of the special reproduction. And playback speed. Further, the terminal 51 receives the video stream distributed from the server 1, and performs normal reproduction and special reproduction by decoding the video stream.
  • the terminal 51 includes a reproduction input unit 41 for receiving a user's operation, a reproduction instruction unit 42 for converting a received user request into an internal command, and transmitting the command to the server 1 via a network. It comprises a receiving unit 43 that receives the video stream from 1, a decoder unit 44 that decodes the received video stream, and a display unit 45 that displays the decoded video.
  • the reproduction input unit 41 accepts the type of stream that the user desires to reproduce and the reproduction state such as normal reproduction, fast forward, fast rewind, and pause. Further, the reproduction instruction unit 42 is logically connected to the server 1 via the network 31. The user request accepted by the playback input unit 41 is converted into an internal command by the playback instruction unit 42, and transmitted to the connected server 1.
  • the receiving unit 43 also receives a stream to be received by the terminal 51, and extracts a necessary video stream from the received RTP packet. Also, the decoder 44 decodes the stream compressed by MPEG-2 and displays it on the display unit 45.
  • the terminal 51 normally reproduces data that the user wants to view.
  • the type of stream and the playback state (normal playback) requested by the user are input to the playback input unit 41, and the playback instruction unit 42 converts the content of the user's request into an internal command, and And sends a command to the playback control unit 5 of the server 1.
  • the reproduction control unit 5 in the server 1 receives the instruction from the reproduction instruction unit 42 in the terminal 51, and controls the readout unit 2, the switch 4, and the switch 6 according to the contents of the instruction.
  • Switch 4 is set to a side and switch 6 is set to c side because normal playback is instructed.
  • the reproduction control unit 5 should reproduce the stream to be reproduced based on the table held in the address map 21 and associating the time stamp with the storage address of the storage unit 2.
  • the storage address is obtained from the time stamp, and the reading unit 3 is instructed to read one GOP data recorded at the obtained address.
  • the reading unit 3 reads the GOP data recorded at the specified address from the storage unit 2 and sends the read GOP data to the distribution unit 7 via the switches 4 and 6.
  • the distribution unit 7 performs RTP packetization of the normal reproduction stream in the program stream format, and distributes it to the network 31 while considering the network band, the transfer rate, and the reproduction time stamp. At this time, the RTP packet is transmitted by designating the IP (Internet Protocol) address of the terminal 51 that has made the request, and another terminal should not receive it by mistake! .
  • IP Internet Protocol
  • the reproduction control unit 5 obtains the next time stamp to be distributed and the storage address from the address map 21 and reads the storage address of the next GOP to be reproduced. Then, an instruction is issued to the reading unit 3.
  • the read GOP data is distributed by the distribution unit 7 following the previous GOP data. By repeating this operation, the normal reproduction stream is sequentially read out and transmitted to the network as RTP-packeted data.
  • the receiving unit 43 receives only the RTP packet in which the IP address of the terminal 51 is specified as the transmission destination among the RTP packets transmitted from the server 1 via the network 31. Further, the receiving unit 43 removes an RTP packet header unnecessary for reproduction from the received RTP packet, and converts the RTP packet into a program stream. This program stream is decoded in MPEG-2 by the decoder 44 and is displayed on the display unit 45.
  • the RTP packets are successively transmitted from the server 1 irrespective of the reception and reproduction state of the terminal 51. Therefore, the receiving unit 43 receives all the RTP packets in which the IP address of the terminal 51 is described as the transmission destination, and transmits the received data to the decoder 44 one after another. Brady. By such an operation, normal reproduction by RTP communication between the server 1 and the terminal 51 can be performed.
  • the reproduction instruction unit 42 transmits a corresponding instruction to the reproduction control unit 5 of the server 1 via the network 31.
  • the reproduction control unit 5 sets the switch 4 to the b side and the switch 6 to the d side so that the video stream flows to the special reproduction processing unit 11.
  • the number of GOPs to be skipped also depends on the number of repeat pictures added to the trick play stream. For example, since the number of pictures in a GOP is 15, a special playback stream consisting of three pictures per GOP is used if two repeat pictures are used. The GOP is read, and if it is 15x speed, the corresponding GOP is read every 3 GOPs.
  • the reproduction control unit 5 obtains a storage address corresponding to the time stamp to be reproduced as fast forward from the correspondence table between the time stamp and the storage address held in the address map 21 in accordance with the fast forward speed, and stores the stored address. An instruction is sent to the reading unit 3 to read the address from the storage unit 2.
  • the reading unit 3 reads the GOP data of the stream for special reproduction recorded at the storage address from the storage unit 2, and sends the GOP data to the extraction unit 12 via the switch 4.
  • the extraction unit 12 demultiplexes a normal reproduction stream in the form of a program stream into a video elementary stream, and further extracts only intra-frame encoded pictures.
  • the extracted intra-frame encoded picture is sent to the special reproduction processing unit 11, where a process for generating a special reproduction stream is performed.
  • FIG. 2 shows a frame configuration of a fast-forward trick play stream generated by the trick play processing unit 11.
  • FIG. 2A shows a normal reproduction stream from which a special reproduction stream is generated.
  • N is the number of pictures in the GOP
  • M is the period in which the intra-coded picture or the forward prediction picture appears (period expressed by the number of pictures)
  • FIG. 2 Normal playback stream power of (a) This is a fast-forward special playback stream generated, and repeats the displayed picture I in the frame of the normal playback stream and the display content of I following this 2-frame repeat picture.
  • the trick play stream is formed by adding the character B continuously. And then later on
  • Intra-frame encoded picture I is selected based on the playback speed and playback direction.
  • the fast-forward speed can be adjusted by selectively extracting I-frames from the normal playback stream according to the speed of the fast-forward.
  • a repeat picture is a picture that has been encoded so as to repeatedly display the display contents of an intra-frame encoded picture.
  • the repeated picture has a motion vector of 0 and a prediction error of 0.
  • a skipped macroblock in which coding of the macroblock is omitted is used.
  • a bidirectional predicted picture is used as a coding method for a repeat picture, but a forward predicted picture may be used.
  • the normal playback stream has a maximum of B power B in one GOP.
  • the amount of code becomes very small, and the GOP in which the intra-frame coded picture I and the two repeat pictures B constituting the generated special reproduction stream are also composed.
  • the transfer rate can also be reduced.
  • the playback speed is 5 [times] at 6 [Mbps], and every 3 GOPs.
  • special playback can be performed in the same 6 [Mbps] band.
  • the picture type may be a forward prediction picture that is a bidirectional prediction picture in the first embodiment.
  • the first embodiment employs a configuration in which two repeat pictures are used. The reason is that, for example, when the transfer rate of a normal playback stream is [Mbps], the special playback stream is also the same at 6 [Mbps]. This is because this is an appropriate number when a transfer rate of about the same is desired, and the number of repeat pictures may be changed as necessary.
  • the decoder buffer calculation unit 14 calculates the VBV delay of the special reproduction stream.
  • the VBV delay indicates the transition of the picture data occupying the VBV buffer of the continuous stream, and should be a value that does not cause overflow and underflow of the VBV buffer. Therefore, when determining the VBV delay, it is necessary to control the exact value by simulating the VBV transition. While pushing It is not realistic to always simulate the transition of the VBV buffer because of the heavy computational load. Therefore, in the first embodiment, the decoder buffer calculator 14 derives the VBV delay by a simple arithmetic calculation. The fact that the VBV delay of the trick play stream can be derived by simple arithmetic calculation and the detailed calculation method will be described later.
  • the intra-frame encoded picture data conversion processing unit 15 converts the temporal reference, the VBV delay and the sequence header into an intra-frame encoded picture so as to become an intra-frame encoded picture corresponding to the generated special reproduction stream.
  • Bit 'rate value ⁇ VBV' buffer 'size value up to coded picture is changed. For example, if the temporal reference of the intra-frame encoded picture is 2 in the normal playback stream and one repeat picture is added in the special playback stream, the temporal 'reference is changed to 1.
  • the VBV delay is replaced with the VBV delay for the special playback stream calculated by the decoder buffer calculator 14.
  • the repeat picture adding unit 16 generates repeat picture data for displaying the same content as the display contents of the intra-frame encoded picture, and performs encoding after the intra-frame encoded picture. Furthermore, the code amount control unit 17 performs stuffing if the predicted code amount is smaller than the target transfer rate, if it is, and temporarily increases the target transfer rate if it exceeds it. Then, make adjustments so that the data of the special playback stream to be generated can be transferred. Lastly, the PS conversion section 18 performs a manoreplexing of the generated trick play stream into a program stream.
  • the trick play stream generated by the trick play processing unit 11 as described above is sent to the distribution unit 7 via the switch 6.
  • the distribution unit 7 performs RTP packet routing using the terminal that has performed the request as the destination IP address, and performs distribution, as in the case of the normal playback stream. By repeating this operation for each GOP used as a trick play stream, the trick play stream can be distributed.
  • the receiving unit 43 designates the IP address of the terminal 51 as the destination in the RTP packet transmitted from the server 1 via the network 31. Only received RTP packets are received. Further, the receiving unit 43 removes an RTP packet header unnecessary for reproduction from the received RTP packet, and converts the RTP packet into a program stream.
  • the trick play stream returned to the program stream has the same content as the normal program stream in terms of the syntax of the power stream, which is a fast-forward video that is trick play. Therefore, similarly to the normal reproduction, the decoder 44 can decode the MPEG-2 and display the reproduced image on the display unit 45.
  • FIG. 3 shows a frame configuration of a special reproduction stream in the case of a pause.
  • Fig. 3 (b) is a paused special playback stream generated from the normal playback stream in Fig. 3 (a), which is used for the fast-forward playback configuration shown in Fig. 2 (b).
  • I frame is always the same I
  • the intra-frame encoded picture I of the GOP to be displayed as a pause in the normal playback stream is used, and the display content of I is repeated following this I.
  • a trick play stream composed by adding R in succession is generated as a trick play stream based on the playback speed and playback direction (that is, the above-described intra-coded picture I).
  • 0 corresponds to an intra-frame encoded picture in which the encoding parameter selected based on the reproduction speed and the reproduction direction is changed).
  • the reproduction control unit 5 instructs the reading unit 3 to always read the same time stamp data storage address from the storage unit 2 while referring to the address map 21.
  • the read GOP data is processed by the special playback processing unit 11 as shown in FIG.
  • the stream is converted into a playback stream, and is delivered from the delivery unit 7 to the terminal 51.
  • the generated special playback stream for pause has a data structure in which the same playback image is continuously displayed, and the terminal 51 performs sequential decoding and playback processing in the same manner as in normal playback or fast forward. By simply continuing, a paused playback image can be displayed.
  • FIG. 4 shows a frame configuration of a trick play stream in the case of fast rewind.
  • FIG. 4 (b) is a fast-rewind special reproduction stream generated by the normal reproduction stream power of FIG. 4 (a).
  • the trick-play stream of fast rewinding consists of an intra-frame encoded picture I that is temporally after the normal playback stream, and a 2-frame that repeats the display contents of I following this I.
  • a special playback stream is formed by adding repeat picture B of the same frame in succession.
  • 0 R is added to generate a trick play stream configured as a trick play stream based on the playback speed and playback direction (that is, the above-mentioned intra-frame encoded picture I).
  • 0 corresponds to an intra-frame encoded picture in which the encoding parameter selected based on the reproduction speed and the reproduction direction is changed).
  • the number of frames in the GOP in the special playback stream is different from that in the normal playback stream in which the number of frames in the GOP is originally 15 frames. Power, and as a result, a 5x fast rewind image can be displayed. Furthermore, it is possible to perform fast rewind at 10 ⁇ speed for every 2GOP and 15 ⁇ speed for every 3GOP for the intra-frame encoded picture used for the special reproduction stream to be created.
  • the reproduction control unit 5 determines the time stamp of the normal reproduction stream to be read in accordance with the fast rewind speed. Furthermore, referring to the address map 21, the time stamp to be read out is read. Determines the storage address of the GOP data and reads the corresponding GOP data from the storage unit 2. The read GOP data is converted by the trick play processing unit 11 into a trick play stream of fast rewind. Similarly, the next read time stamp is determined according to the fast rewind speed, the storage address is obtained from the address map 21, the corresponding GOP data is read from the storage unit 2, and the operation of sending the data to the special reproduction processing unit 11 is continued.
  • a trick-play stream of fast rewind as shown in Fig. 4 (b) is generated.
  • the generated special playback stream of fast rewind is distributed from the distribution unit 7 to the terminal 51.
  • the trick play stream of fast rewind has a data structure in which the playback image is reversed in time, and the terminal 51 performs fast rewind only by continuing decoding and playback processing in the same manner as in normal playback. Can be displayed.
  • FIG. 5 (a) is a diagram showing the transition of the VBV buffer of the virtual decoder in the normal reproduction stream
  • FIG. 5 (b) is a diagram showing the transition of the VBV buffer of the virtual decoder in the special reproduction stream.
  • the horizontal axis indicates time
  • the vertical axis indicates the occupancy of the VBV buffer
  • the solid line indicates the transition of the VBV buffer.
  • the slope a of the solid line of the VBV buffer indicates the transfer rate of the normal playback stream.
  • the first I picture is filled into the VBV buffer at transfer rate a,
  • Decoding starts after the time indicated by the V delay. At that time,
  • the data is removed from the VBV buffer.
  • is the display frame interval, which is 1Z29.97 in NTSC. Also, between the transfer rate a and the code amount d,
  • the time difference, X is the fill opening of the second and third pictures of the trick play stream.
  • is the VBV delay of the first I picture of the special playback stream
  • is special
  • d is the first I of the special playback stream
  • the amount of picture data, a is the transfer rate of the trick play stream.
  • the VBV delay of the special playback stream can be obtained.
  • the VBV delay of the trick play stream can be obtained by the simple arithmetic calculation described above, not the VBV delay obtained by simulating the transition of the VBV buffer as in the case of obtaining the VBV delay in general. .
  • the trick play stream can also be configured by replacing all the VBV delays with the fixed value OxFFFF.
  • the fact that the VBV delay is OxFFFF is a value indicating that the stream is at VBR (Variable Bit Rate).
  • a value other than OxFFFF is included as the VBV delay, it indicates CBR (Constant Bit Rate).
  • CBR Constant Bit Rate
  • MPEG-2 CBR is defined as a special form of VBR Therefore, there is no problem in setting the generated special playback stream to VBR. In this case, even higher-speed processing is possible because the calculation processing for the VBV delay only needs to be replaced with data that does not require any processing.
  • the normal reproduction stream power when performing the special reproduction of the video between the server and the terminal connected on the network, the normal reproduction stream power also generates the special reproduction stream in real time. There is no need to prepare a special playback stream on the recording medium in advance, and it is not necessary to perform special management for the special playback stream prepared beforehand.
  • the trick play stream to be generated generates a trick play stream with a reduced transfer rate by adding a repeat picture with a small code amount to the I frame from which the normal play stream power is also extracted, and generates a codec per second. Since the volume is reduced, it is possible to transfer even during trick play without increasing the network load.
  • the generated special reproduction stream is generated at a normal speed on the reproduction side so as to produce an image as if the special reproduction was also performed. In this way, special playback can be realized without having to provide a special mechanism when playing the special playback stream.
  • control parameters related to the decoder buffer such as VBV delay, for controlling the decoder buffer are reset to appropriate values so as to conform to the special playback stream to be generated, it is possible to prevent the decoder buffer from becoming entangled. it can.
  • VBV delay has an appropriate value, even if there is a multiplexing device on the path through which the trick play stream is distributed, a multiplexing error does not occur.
  • the decoder buffer control parameters are obtained from the transfer rate before conversion to the trick play stream, the decoder buffer control parameters, and the transfer rate after conversion. As more suitable A sharp value can be derived, and furthermore, the failure of the decoder buffer does not occur.
  • the VBV delay can be obtained by simple arithmetic calculation, and therefore, compared to the method of calculating the VBV delay by simulating a decoder buffer.
  • the calculation can be performed at a high speed without causing a system load increase due to a calculation with a small system load.
  • the decoder buffer control parameters such as the VBV delay to a significant fixed value such as OxFFFF, the time required for the calculation process of the decoder buffer control parameters that does not even require the simple arithmetic calculation described above is required. Since almost no load is generated, it is possible to set decoder buffer control parameters such as VBV delay without increasing the load on the system.
  • the transfer rate is adjusted by the stuffing when the generated code amount is small! /, And when the code amount is large! /
  • the transfer rate can be controlled for the special playback stream to be generated by temporarily increasing the code amount to be played and controlling the code amount.
  • the transfer rate can be changed only when the transfer rate can be easily adjusted.
  • the stuffing performed for encoding to adjust the transfer rate may be evenly inserted after each repeat picture so that the code amount and VBV delay of each picture become uniform.
  • FIG. 6 is a diagram illustrating a wide-area monitoring system including the video data processing device according to the second embodiment of the present invention.
  • a system is constructed in which the video captured by the cameras 101-103 is stored and stored in the server 120, and the video stored from a plurality of terminals 111-113 can be viewed.
  • the terminal can also perform special playback such as fast forward, fast rewind, and pause.
  • the surveillance cameras 101-103 compress the captured video into an MPEG-2 program stream, and furthermore, RTPZUDP (User Datagram Protocol: User The datagram protocol is packetized and transmitted to the server 120 via the network 100.
  • RTPZUDP User Datagram Protocol: User The datagram protocol is packetized and transmitted to the server 120 via the network 100.
  • the server 120 has three storage functions for video streams shot by the cameras 101 to 103, and can be selected by initial setting.
  • the first is a primary storage server function that constantly receives and stores the multicast stream from cameras 101-103 endlessly.
  • the second is the multicast stream from cameras 101-103, which is triggered by an alarm.
  • the third function is an image storage server function that saves video streams stored in another server (not shown in Fig. 6) . These three storage functions are switched by default. Can be used.
  • server 120 is set as the primary storage server.
  • the server 120 includes a request receiving module 121, a receiving module 122, a video database 123, a distribution module 124, a storage module 125, a trick play module 126, and an HDD (node 'disk). 'Drive) equipped with 127.
  • the request receiving module 121 is a module for responding to a storage and distribution request from the outside, and shown in the terminal 111-113 and the! /, Na! / It accepts requests for image distribution and storage, controls other modules in the server 120 using the internal IZF, and transmits a response message to the requesting terminal or server.
  • the request receiving module 121 is compatible with RTSP (Real Time Streaming Protocol), and enables normal reproduction and special reproduction of the video stream stored in the server 120.
  • the request receiving module 121 also has various search functions using the video database 123. For example, it is also possible to search for a target video stream by using a time or a photographed camera as a search key.
  • the receiving module 122 performs a process of receiving a stream distributed by multicast from the cameras 101-103.
  • the advantages of the cameras 101-103 transmitting by multicast are that one video stream can be saved simultaneously by another server, and that the video of the camera can be viewed directly from the terminals 111-113. If you want to send only to, you may send it in a broadcast.
  • This receiving module 122 is used for RTPZUDP packet Reception is performed only when the transmission IP address of the packet is the IP address or the multicast address of the server 120 and the port numbers match.
  • the receiving module 122 obtains, as a time stamp, the time at which the head data of the GOP sent in the RTPZUDP packet is received. Since the received RTPZUDP packet has an RTPZUDP header added, remove it and combine the payload part of the RTPZUDP packet into a program stream.
  • the storage module 125 stores the received video stream, which is a program stream, in the HDD 127 in GOP units, and manages the data stored in the HDD 127 in GOP units.
  • the video database 123 provides management and search functions for recording and managing meta information (information indicating the structure and attributes of the content) of video streams and GOPs that the storage module 125 manages and stores. I do.
  • the types of meta information of the video stream include, for example, a camera number, a video compression method and a compression level, a time stamp indicating the time obtained by the receiving module 122, and a shooting time.
  • the distribution module 124 distributes the video stream managed by the storage module 125 to the network 100 according to the request from the request receiving module 121.
  • the program stream that is the transmission data is RTPZUDP-packeted, and the IP address of the terminal 111 is set as the transmission destination IP address.
  • the transmission timing of each GOP is controlled based on the reception time stamp of each GOP recorded in the video database 123.
  • the normal reproduction stream read from the storage module 125 is transferred to the special reproduction module 126 and the special reproduction stream generated by the special reproduction module 126 is distributed.
  • the distribution timing of the trick play stream for fast forward and fast rewind, if the reception timestamp interval of the GOP to be distributed is 15x, the distribution is performed so that it becomes 1Z15.
  • the normal playback stream power also extracts the intra-frame encoded picture (I frame), passes it to the trick play module 126, and generates a trick play stream. Also, parameters such as the transfer rate of the normal reproduction stream and the transfer rate of the desired special reproduction stream, which are required for the reproduction, are passed to the special reproduction module 126 to generate the special reproduction stream.
  • the terminals 111-113 it is possible to view the video stream stored in the server 120, and it is possible to view by sending a playback request to the request receiving module 121 of the server 120.
  • the terminal 111 requests a video stream to be viewed from the server 120
  • the corresponding video stream is delivered from the server 120 in RTPZUDP packet units.
  • the terminal 111 can reproduce the requested video stream by receiving a packet having the same transmission IP address and port number in the RTPZUDP packet on the network.
  • the trick play module 126 includes an I-frame buffer 131 for receiving an I-frame transferred from the distribution module 124, an analysis unit 132 for analyzing a data structure and encoding parameters of the received I-frame data, A decoder buffer calculation unit 133 that calculates the VBV delay of the special playback stream to be generated, an I frame data conversion processing unit 134 that changes the parameters of the I frame data used for the special playback stream, and an I frame A repeater with a repeat picture 135 for generating and adding a repeat picture indicating the same display content as the frame, a code amount controller 136 for controlling the code amount of the generated special reproduction stream to match the target transfer rate, A PS conversion unit 137 that converts the generated trick play stream into a program stream; Koto is constituted by a trick play stream buffer 138 for transmitting the reproduced stream to the distribution module 124.
  • the server 120 is set as a primary storage server that constantly receives and stores the multicast stream from the cameras 101-103 endlessly as a storage method.
  • the receiving module 122 of the server 120 constantly monitors the RTPZ UDP packet of the network 100, and the destination IP address of the RTPZUDP packet is set to its own IP address or multicast address. Yes, and if the port numbers match, receive the corresponding RTPZUDP packet.
  • the video stream in packet units received by the receiving module 122 is converted into a program stream in the form of an RTPZUDP packet, and is further transferred to the HDD 127 in GOP units each time a GOP unit is composed of one or more packets. A record is made.
  • the video database 123 records the time at which the corresponding GOP was received at the server 120 as a GOP reception time stamp, and also records meta information such as camera information, a video compression method, and a compression level. By repeating this operation, the video stream is accumulated in the server 120.
  • the terminal 111 obtains a list of video streams stored in the server 120 with respect to the request receiving module 121 of the server 120.
  • a search function of the video database 123 is used to obtain a list of video streams and a search is performed without specifying anything as a search key, a list of stored video streams can be obtained. From the list of video streams thus obtained, the terminal 111 can select any desired video stream. Each video stream is assigned a unique video ID, and the video stream is identified using the video ID.
  • the terminal 111 issues a playback request command for the selected video ID to the request reception module 121 to play back the selected video stream.
  • the request receiving module 121 that has received the reproduction request sends a command to the distribution module 124 to start reproduction of the specified video ID.
  • the distribution module 124 specifies the GOP of the video stream that matches the video ID and matches the playback time, and issues a playback instruction to the storage module 125.
  • the storage module 125 reads the GOP of the specified video stream from the HDD 127 and sends it to the distribution module 124.
  • the distribution module 124 distributes the GOP acquired from the storage module 125.
  • the GOP of the video stream is RTP / UDP-packeted, and the IP address of the terminal 111 and the same port number as the receiving terminal are specified as the destination IP address.
  • the distribution timing is controlled based on the reception time stamp, which is one of the meta data of the distribution data recorded in 123.
  • the distribution module 124 distributes the GOP so as to reproduce the reception time stamp, which is the time at which the receiving module 122 received the GOP, as the distribution timing of the GOP.
  • the distribution timing of the video data captured by the camera and further encoded from the camera is reproduced, and as a result, overflow and underflow do not occur in various buffers in the network and in the reproduction environment. Decoding reproduction is possible.
  • the RTPZUDP packet distributed from the distribution module 125 is received by the terminal 111 that has requested reproduction.
  • the terminal 111 can obtain the normal playback stream in the form of a program stream by removing the RTPZUDP header from the continuously delivered RTPZUDP packets and connecting the payloads of the plurality of RTPZUDP packets.
  • the terminal 111 can acquire the video reproduction stream stored in the server 120, and can further reproduce the video reproduction stream acquired by a decoder (not shown) provided therein.
  • the fast forward method which is one of the typical trick play
  • the terminal 111 issues a video ID for performing special reproduction and an instruction for performing special reproduction to the request receiving module 121 of the server 120.
  • the request receiving module 121 that has received the reproduction request issues a selected video ID and a fast-forward command to the distribution module 124.
  • the distribution module 124 uses the video database 123 to acquire the meta information of the stream of the selected video ID, and performs fast forward at 15 times speed. Determine the GOP to be read to be represented.
  • FIG. 8 shows the relationship between the GOP and the reception time stamp.
  • N 15 and fast-forwarding at 15 ⁇ speed when there are two repeat pictures
  • reading may be performed every 3 GOPs.
  • the read GOP is determined according to the rapid traverse speed, and the determined GOP is read from the storage module 125 power SHDD127 power.
  • the distribution module 124 extracts an I frame from the obtained GOP data of the normal reproduction stream, and sends it to the trick play module 126.
  • the I frame buffer 131 of the trick play module 126 stores the I frame data sent from the distribution module 124.
  • the analysis unit 132 analyzes the VBV delay, temporal reference, picture coding type, and code amount of the I frame data stored in the I frame buffer 131, and performs analysis necessary for each processing in the special reproduction module 126. Get parameters.
  • the decoder buffer calculation unit 133 calculates the VBV delay of the generated special reproduction stream based on the parameters acquired from the analysis unit 132. As the method of calculating the VBV delay, the method described in the first embodiment is used.
  • the I-frame data conversion processing unit 134 converts the bit rate from the temporal reference, the VBV delay, and the sequence header to the I-frame so that the input I-frame picture conforms to the special playback stream to be generated. Change the value or VBV 'buffer size value.
  • Repeat picture adding section 135 uses skipped macroblocks so that the motion vector is 0 and the prediction error is 0 so that the display content is the same as that of the preceding I frame, and the amount of data is reduced. Create repeat picture data that is encoded to greatly reduce
  • the code amount control unit 136 predicts the generated code amount with respect to the target transfer rate of the special reproduction stream to be generated, and if the predicted code amount is smaller than the target transfer rate, performs target transfer by stuffing. If the estimated coding rate is expected to exceed the target transfer rate by approaching the rate, the target transfer rate is temporarily increased and the related bit rate value and SCR are readjusted, and the MPEG-2 standard is used. The generated code amount is controlled by performing the processing so that no inconsistency occurs. [0116]
  • the PS conversion section 137 divides the trick play stream generated in the video elementary stream format into packs and converts the trick play stream into the program stream format. The generated program stream is stored in the trick play stream buffer 138, and the data is passed to the distribution module 124.
  • the distribution module 124 also performs RTP / UDP packet filtering on the received trick play stream in the same manner as the normal play stream, and specifies the IP address and port number of the terminal 111 as the destination IP address, Furthermore, while considering the fast-forward speed based on the reception time stamp for each GOP, which is one of the meta information of the distribution data recorded in the video database 123, that is, if the speed is 15 times, the reception time stamp between the GOPs is determined. The distribution timing is controlled in GOP units so that the interval is 1Z15. The RTPZUDP packet distributed from the distribution module 124 is received by the terminal 111 that has requested reproduction.
  • the terminal 111 can obtain the trick play stream by removing the RTPZUDP header from the continuously delivered RTPZUDP packet, converting the RTPZUDP packet into a program stream packet, and connecting a plurality of payload packets. Then, by playing back the obtained special reproduction stream in the same manner as the normal reproduction stream, it is possible to realize 15x speed fast-forward special reproduction.
  • This trick play stream is the same in syntax as a normal play stream, and can be handled in the same way as a normal play stream. As described above, the terminal 111 can reproduce the obtained special reproduction stream.
  • the force described for the 15x speed of fast-forward If the speed is 30x of fast-forward, one I-frame is read out every 6GOPs, and the time interval of the time table to be distributed may be set to 1Z15. In the case of fast rewind, it is sufficient to read out in the reverse direction and send it to the special reproduction module 126. If it is a pause, repeat the same GOP data and send it to the special playback module 126!
  • the delivery timing of the fast-forward and fast-rewind special playback streams is determined based on the time stamp at the time of reception. Since the reception time is the same, it is meaningless to use the reception time table. Therefore, a method of distributing based on the time information of the generated special reproduction stream is adopted.
  • the trick play stream described in the second embodiment is generated by playing back at a normal speed on the playback side, so that the power is also presented as if the tricky playback was performed. When the special playback stream is played back on the side, it can be handled in the same way as a normal playback stream without requiring a special mechanism.
  • the program stream SCR System Clock Reference
  • PTS Presentation Time Stamp: playback output
  • the normal playback stream power when performing special playback of a video between a server and a terminal connected on a network, the normal playback stream power also generates a special playback stream in real time. There is no need to prepare a special playback stream on the recording medium in advance, and it is not necessary to perform special management for the special playback stream prepared beforehand.
  • the trick play stream to be generated is a trick play stream with a reduced transfer rate generated by adding a repeat picture with a small code amount to an I frame from which the normal play stream power is also extracted, and generating a codec per second. Since the volume is reduced, it is possible to transfer even during trick play without increasing the network load.
  • the generated special reproduction stream is generated at a normal speed on the reproduction side so as to produce an image as if the special reproduction was performed. In this way, special playback can be realized without having to provide a special mechanism when playing the special playback stream.
  • the value of the encoding parameter of the I frame from which the power of the normal playback stream is also extracted is reset to be used in accordance with the rules of the special playback stream to be generated and the MPEG-2 stream, and is used for the special generated stream. Distortion of the reproduced video due to an incorrect value of the multiplexing parameter and multiplexing failure in the multiplexing device are eliminated.
  • control parameters related to the decoder buffer such as VBV delay for controlling the decoder buffer are reset to appropriate values so as to conform to the special reproduction stream to be generated, it is possible to prevent the decoder buffer from being broken. it can.
  • VBV delay has an appropriate value, no multiplexing error occurs even if there is a multiplexing device on the path through which the trick play stream is distributed.
  • the decoder buffer control parameters are obtained from the transfer rate before conversion to the trick play stream, the decoder buffer control parameters, and the transfer rate after conversion, the decoder buffer control parameters for the trick play stream are obtained. As a result, a more appropriate value can be derived, and the failure of the decoder buffer does not occur.
  • the derivation of the decoder buffer control parameters is a simple arithmetic calculation, it can be obtained at high speed without causing an increase in the system load due to the calculation.
  • the transfer rate is adjusted by the stuffing when the generated code amount is small! /, And when the code amount is large! /
  • the transfer rate can be controlled for the special playback stream to be generated by temporarily increasing the code amount to be played and controlling the code amount.
  • the transfer rate can be changed only when the transfer rate can be easily adjusted.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

 抽出部(12)で通常再生ストリームからIフレームを抽出し、フレーム内符号化ピクチャデータ変換処理部(15)で上記Iフレームの符号化パラメータおよびVBVディレイ等のデコーダバッファに関する制御パラメータを特殊再生用に変更し、リピートピクチャ付加部(16)で上記Iフレームと同じ内容を表示するリピートピクチャを生成した上で、上記Iフレームの後ろに付加し、さらに符号量制御部(17)で転送レートの制御を行う。ネットワーク上でサーバと端末間で特殊再生を行う場合、Iフレームのみを利用すると必要とするネットワーク帯域が上昇したり、デコーダバッファの破綻を生じる可能性があり、特殊再生ストリームを再生するデコーダで映像の乱れを生じる可能性があったが、このような問題が解決された。

Description

明 細 書
映像データ処理方法および映像データ処理装置
技術分野
[0001] 本発明は、映像をサーバに記録蓄積し、端末力 の要求によって蓄積している映 像ストリームを要求のあった端末に配信する映像配信システムにおいて、通常の再 生に対して速度および Zまたは再生方向を変更した、例えば早送り、早巻き戻し、一 時停止などの特殊再生を実現するためのデータ処理方法およびデータ処理装置に 関するものである。
背景技術
[0002] 従来、特にネットワークを利用した映像再生システムにお 、て、 MPEG— 2等で圧 縮された映像ストリーム (以下、特殊再生ストリームと区別するために通常再生ストリー ムと称する)について、再生の速度および Zまたは再生方向を変更した特殊再生を 実行しょうとする場合、通常再生ストリーム力も時間的に断続した(間欠的に発生され る)フレーム内符号化ピクチャ (Iフレーム)のみを抽出し、さらに抽出した Iフレームを 連続的に端末に配信し、端末で受信した後、再生する構成をとるのが一般的であつ た。
[0003] し力しながら、上記従来の方法では、通常再生ストリームから Iフレームのみを抽出 するので、本来の MPEG— 2の構造から逸脱したストリームになる場合がある。そのた め、 Iフレームのみ力も構成される特殊再生ストリームの再生を可能にするために、再 生側のデコーダに何らかの仕組みを用意しなければならないという問題があった。
[0004] また、符号量の大きな Iフレームのみを高速に抽出し、連続して配信することから、 単位時間当たりの転送符号量 (転送レート)が非常に大きくなり、このために、伝送路 上にあるバッファ、例えば多重装置や分離装置のバッファがオーバーフローを発生し たり、ネットワークの帯域制限を越えたり、再生側のデコーダバッファがオーバーフロ 一を発生したりする問題があった。そのため、転送レートが増大した特殊再生ストリー ムの転送を可能にするために、ネットワークの帯域を拡大したり、伝送路の各バッファ のメモリサイズを大きくしたりするなどの対策が必要であった。 [0005] 特に、ネットワーク帯域についての問題は深刻で、 Iフレームのみを利用した特殊再 生方法では、 Iフレームの符号量にもよる力 通常再生に比べて一般的に 3倍程度の 帯域を必要とした。しかし、現実的に特殊再生のために帯域を上げることは困難であ る。そこで、 1つの対策として、特殊再生ストリームを別途用意する方法があるが、この 方法は、システムの構成上は簡単ではある力 通常再生ストリームに加え、特殊再生 ストリームを別途用意することなるため、蓄積するデータ量が多くなる上、通常再生ス トリームと特殊再生ストリームを関連付けて管理することが必要であるという問題があ つた o
[0006] このような従来の問題について、特殊再生ストリームとしてフレームもしくはフィール ド内符号ィ匕されたデータに続いて、マクロブロックの動きベクトルを 0、予測誤差を 0に 符号化されたリピートピクチャを挿入し、データを配信する方法が提案された (例えば 、特許文献 1参照)。このリピートピクチャを挿入する方法によると、特殊再生の実行 において、符号量の大きい Iフレームに続いて、符号量の非常に少ないリピートピクチ ャを追加することによって、転送レートを大幅に削減することができるので、転送レー トの上昇を防ぎ、特殊再生用に大きなメモリを確保する必要がない。さらに、生成され る特殊再生ストリームは、シンタックス的に通常再生ストリームと同じ構成にできるため 、特殊ストリームを扱う上で、別途ロジックや回路の増設を必要とせず、特殊再生時に 専用のロジックに切り替える必要もない。
[0007] また、ネットワーク上にあるサーバと端末との間における特殊再生時のデータ生成 方法については、特殊再生を行う際に、通常再生ストリーム力 抽出した Iフレームと 、保存されているリピートピクチャデータから、特殊再生ストリームを構築し、さらに抽 出した Iフレームデータの VBVディレイ(VBV Delay:デコーダバッファにおけるデータ の滞在時間)に基づいて、 VBVバッファ(Video Buffering Verifierバッファ:符号発生 量制御用仮想バッファ)を破綻させな ヽようにリピーチピクチャに続 ヽてスタッフイング を挿入する方法が提案された (例えば、特許文献 2参照)。
[0008] 特許文献 1 :特許第 3304634号 (第 10頁、図 1)
特許文献 2 :特開 2002-77811号公報 (第 12頁、図 1)
発明の開示 発明が解決しょうとする課題
[0009] し力しながら、上記リピートピクチャを挿入する従来技術では、 Iフレームに続いてリ ピートピクチャを挿入するだけでは、生成された特殊再生ストリームにおける各フレー ムのデータとしては全く問題がなくとも、複数の連続した映像として見た場合、符号ィ匕 されているパラメータについて整合性が取れない場合がある。例えば、元の通常再 生ストリームに符号ィ匕されているパラメータである各フレームの再生順番、転送レート 、 VBVディレイについて、生成した特殊再生ストリームに対応した値になるように適正 化を行っていなければ、特殊再生ストリームの再生が正しく行われず、結果として再 生映像が乱れる可能性がある。特に、 VBVディレイの値が正しくないと、再生側のデ コーダバッファの破綻や、もし伝送路に多重装置が存在するならば、多重処理にお いて多重ミスを発生する問題がある。通常 VBVディレイは、 VBVバッファのシミュレ ートを行う等、複雑な計算処理によって求めなくてはならず、システム負荷との兼ね合 いもあり、実用の範囲で求めることができな力つた。
[0010] また、上記リピーチピクチャに続いてスタッフイングを挿入する従来技術では、リビー トビクチャを前もって用意し、特殊再生の状態や変換前の元ストリームの状態を常に 管理しておく必要があり、プログラムの構造が複雑になり、リアルタイムでかつ多くのス トリームが並列で処理されるシステムには適していな力つた。また、通常再生ストリー ムに符号化されて ヽる VBVディレイを特殊再生ストリームでも使用して ヽるため、通 常再生ストリームと同じデータサイズ分だけスタッフイングを行うことになる。そのため、 VBVバッファの破綻を防ぐことは可能になる力 特殊再生ストリームの転送レートを削 減することはもとより、特殊再生ストリームの転送レートを制御することはできない。ま た、特殊再生ストリームに埋め込まれた元ストリームの映像および圧縮に関するパラメ ータ(以下、符号ィ匕パラメータ)については、通常再生ストリームの値をそのまま流用 し、特殊再生ストリームに対しての適正化が行われていない。そのため、一般的な M PEG— 2ストリームの規約から逸脱する場合があり、再生映像が乱れたり、多重装置 にお 、て多重化が失敗したりする恐れがある。
[0011] このように、特殊再生を行う従来の技術では、通常再生ストリーム力も特殊再生スト
Figure imgf000005_0001
、な 、ので、ネットヮー ク上でサーバと端末間で特殊再生を行う場合、 Iフレームのみを利用すると必要とす るネットワーク帯域が上昇したり、デコーダバッファの破綻を生じる可能性があり、特 殊再生ストリームを再生するデコーダで映像の乱れを生じる可能性があった。
[0012] 本発明は、このような従来の課題を解消するためになされたものであり、ネットワーク 越しに特殊再生を行う場合に、映像の乱れの少な ヽ映像データ処理方法および映 像データ処理装置を提供するものである。
課題を解決するための手段
[0013] 本発明の映像データ処理方法は、
フレーム間予測を用いて符号ィ匕された映像ストリームに対して、再生速度および再 生方向を変更した特殊再生ストリームを生成する映像データ処理方法であって、 生成する特殊再生ストリームの速度と方向に合わせて、上記映像ストリーム力 フレ ーム内符号化ピクチャを選択的に抽出する工程と、
上記抽出したフレーム内符号ィ匕ピクチャの符号化パラメータを解析する解析工程と 上記速度と方向に合わせて、上記符号化パラメータを変更する変更工程と、 上記抽出したフレーム内符号ィ匕ピクチャと同じ表示内容を示すリピートピクチャを生 成し、上記リピートピクチャを、データの伝送順で上記再生速度および再生方向に基 づいて選択される上記符号ィ匕パラメータを変更したフレーム内符号ィ匕ピクチャの後ろ に続けて付加することによって、特殊再生ストリームを生成する生成工程とを備えた ことを特徴とする。
[0014] また、本発明の映像データ処理装置は、
フレーム間予測を用いて符号ィ匕された映像ストリームに対して、再生速度および再 生方向を変更した特殊再生ストリームを生成する映像データ処理装置であって、 生成する特殊再生ストリームの速度と方向に合わせて、上記映像ストリーム力 フレ ーム内符号ィ匕ピクチャを選択的に抽出する手段と、
上記抽出されたフレーム内符号ィ匕ピクチャの符号化パラメータを解析する解析手 段と、
上記速度と方向に合わせて、上記符号化パラメータを変更する変更手段と、 上記抽出されたフレーム内符号ィ匕ピクチャと同じ表示内容を示すリピートピクチャを 生成し、上記リピートピクチャを、データの伝送順で上記再生速度および再生方向に 基づいて選択される上記符号ィ匕パラメータを変更したフレーム内符号ィ匕ピクチャの後 ろに続けて付加することによって、特殊再生ストリームを生成する生成手段とを備えた ことを特徴とする。
発明の効果
[0015] 本発明によれば、生成する特殊再生ストリームの速度と方向に合わせて、映像ストリ 一ムカもフレーム内符号ィ匕ピクチャを選択的に抽出し、そのフレーム内符号ィ匕ピクチ ャの符号ィ匕パラメータを解析し、上記速度と方向に合わせて、上記符号化パラメータ を変更するとともに、上記フレーム内符号ィ匕ピクチャと同じ表示内容を示すリピートピ クチャを生成し、上記リピートピクチャをデータの伝送順で上記符号ィ匕パラメータを変 更したフレーム内符号ィ匕ピクチャの後ろに付加した特殊再生ストリームを生成するこ とにより、特殊再生ストリームのネットワーク越しでの再生において、映像の乱れが発 生することがな 、と 、う効果がある。
図面の簡単な説明
[0016] [図 1]本発明の実施の形態 1の映像データ処理装置を備えた映像配信システムを示 す概略ブロック図である。
[図 2] (a)及び (b)は、本発明の実施の形態 1にお!/、ての早送り再生のストリームの構 造を説明する図である。
[図 3] (a)及び (b)は、本発明の実施の形態 1においての一時停止のストリームの構造 を説明する図である。
[図 4] (a)及び (b)は、本発明の実施の形態 1にお 、ての早巻き戻し再生のストリーム の構造を説明する図である。
[図 5] (a)及び (b)は、本発明の実施の形態 1においての VBVバッファの遷移を示す 図である。
[図 6]本発明の実施の形態 2の映像データ処理装置を備えた広域監視システムを示 す概略ブロック図である。
[図 7]本発明の実施の形態 2においての特殊再生モジュールを示すブロック図である [図 8]本発明の実施の形態 2においての GOP毎のタイムスタンプを説明する図である 符号の説明
[0017] 1 サーバ、 2 蓄積部、 3 読み出し部、 4 スィッチ、 5 再生制御部、 6 ス イッチ、 7 配信部、 11 特殊再生処理部、 12 抽出部、 13 解析部、 14 デコーダバッファ計算部、 15 フレーム内符号ィヒピクチャデータ変換処理部、 16 リピートピクチャ付加部、 17 符号量制御部、 18 PS化部、 21 アドレスマツ プ、 31 ネットワーク、 41 再生入力部、 42 再生指示部、 43 受信部、 44 デコーダ、 45 表示部、 51, 52, 53 端末、 100 ネットワーク、 101, 102, 1 03 カメラ、 111, 112, 113 端末、 120 サーノ 、 121 要求受付モジュール 、 122 受信モジュール、 123 映像データベース、 124 配信モジュール、 1 25 蓄積モジュール、 126 特殊再生モジュール、 127 HDD, 131 Iフレー ムバッファ、 132 解析部、 133 デコーダバッファ計算部、 134 Iフレームデー タ変換処理部、 135 リピートピクチャ付加部、 136 符号量制御部、 137 PS 化部、 138 特殊再生ストリームバッファ。
発明を実施するための最良の形態
[0018] 実施の形態 1.
図 1はネットワーク上に映像を配信するサーバおよびこのサーバから配信された映 像を受信して再生を行う端末カゝら構成される本発明の実施の形態 1の映像データ処 理装置を備えた映像配信システムを示す図である。
[0019] この実施の形態 1の映像配信システムでは、映像が記録された速度と同一の再生 速度である通常再生と、通常再生に対して速度を変更した特殊再生、例えば通常再 生の速度に対して 2倍、 5倍、 15倍等の速度を変えた早送り再生、さらに早送り再生 に対して再生方向を逆にした早巻き戻し再生、また同じ映像を継続的に表示する一 時停止を実現する。ここで、この実施の形態 1で使用する映像ストリームは、 ISOZIE C13818— 1、いわゆる MPEG— 2のプログラムストリームで記録されているものとする [0020] 図示の映像配信システムは、ネットワーク 31を介して互いに接続されたサーバ 1と、 端末 51乃至 53とを含む。端末 51乃至 53は互いに同一の構成を有し、端末 51のみ その詳細が図示されている。
サーバ 1は、蓄積部 2と、読み出し部 3と、スィッチ 4、スィッチ 6と、再生制御部 5と、 配信部 7と、抽出部 12と、特殊再生処理部 11と、アドレスマップ 21とを備えている。
[0021] 蓄積部 2は、内部に映像ストリームを保存するために設けられたものであり、この蓄 積部 2には、通常再生ストリームが複数保存される。また、アドレスマップ 21には、蓄 積部 2に保存されて!、る通常再生ストリームの GOP (Group of Pictures)単位の再生 タイムスタンプと、蓄積部 2に保存されて ヽるアドレスとを対応付けたテーブルが保存 されている。
[0022] 読み出し部 3は、再生制御部 5からの指示により、アドレスマップ 21に記録されてい るタイムスタンプとアドレス情報をもとに、蓄積部 2から該当ストリームの該当アドレスに 記録された GOPデータを読み出す。
[0023] 再生制御部 5は、端末 51— 53からの再生要求が、通常再生か、特殊再生かによつ て読み出し部 3、スィッチ 4、スィッチ 6を制御し、蓄積部 2からのストリームの流れを制 御する。
[0024] 抽出部 12は、通常再生ストリームから、 MPEG— 2の映像単位の先頭を示すシーケ ンスヘッダ力 最初のピクチャデータであるフレーム内符号ィ匕ピクチャデータまでを 抽出する。この実施の形態 1では、通常再生ストリームはプログラムストリーム形式で 保存されているので、上記抽出作業に並行して、プログラムストリームをエレメンタリー ストリームに分離するデマルチプレックスも合わせて行う。
[0025] 特殊再生処理部 11は、入力されたフレーム内符号ィ匕ピクチャの解析を行う解析部 13と、生成する特殊再生ストリームのデコーダバッファの計算を行うデコーダバッファ 計算部 14と、入力されたフレーム内符号ィ匕ピクチャの符号ィ匕パラメータを変更するフ レーム内符号ィ匕ピクチャデータ変換処理部 15と、フレーム内符号ィ匕ピクチャと同じ映 像表示を行うリピートピクチャを生成するリピートピクチャ付加部 16と、生成する特殊 再生ストリームの発生符号量を制御する符号量制御部 17と、特殊再生ストリームを通 常再生ストリームと同じ形式のプログラムストリームに多重化を行う PS (プログラムスト リーム)化部 18とによって構成されており、通常再生ストリームのフレーム内符号ィ匕ピ クチャを基に特殊再生ストリームの生成を行う。
[0026] 特殊再生処理部 11において、解析部 13は、入力されたフレーム内符号ィ匕ピクチャ の VBVディレイ、テンポラル'リファレンス(Temporal Reference)、ピクチャ'コーデイン グ'タイプ (Picture Coding Type)、符号量等の解析を行い、特殊再生処理部 11内で 必要なパラメータを取得する。
[0027] また、デコーダバッファ計算部 14は、解析部 13から取得したパラメータをもとに、生 成する特殊再生ストリームの VBVディレイの計算を行う。なお、 VBVディレイの計算 方法については後述する。
[0028] また、フレーム内符号ィ匕ピクチャデータ変換処理部 15は、入力したフレーム内符号 化ピクチャが生成する特殊再生ストリームに適するように、例えばテンポラル'リファレ ンスゃ VBVディレイおよびシーケンスヘッダ以降フレーム内符号化ピクチャまでのビ ット'レート値(Bit Rate Value)や VBV'バッファ 'サイズ値(VBV Buffer Size Value)を 変更する。
[0029] また、リピートピクチャ付加部 16は、先行するフレーム内符号ィ匕ピクチャと表示内容 が同じになるように、動きベクトルを 0かつ予測誤差を 0に符号ィ匕し、かつスキップドマ クロブロックを使用することによって符号量を大幅に削減したデータを生成する。
[0030] また、符号量制御部 17は、生成する特殊再生ストリームの目標転送レートに対して 、発生する符号量を予測し、予測符号量が目標転送レートに比べて小さいなら、スタ ッフイングによって目標転送レートに近づけ、一方予測符号量が目標転送レートを上 回りそうであれば、一時的に目標符号量を上げるとともに関連する例えばビット'レー ト値ゃ SCR (System Clock Reference:システム時刻基準参照値)の再調整を行い、 MPEGの規格に対して矛盾が生じな 、処理を行うことによって、発生符号量の制御 を行う。
[0031] また、 PS化部 18は、ビデオエレメンタリーストリームの形式で生成された特殊再生 ストリームをパック単位に分割し、プログラムストリームの形式に変換を行う。
[0032] 配信部 7は、通常再生ストリームおよび特殊再生ストリームについて、例えば映像を ストリーミング再生するための伝送プロトコルである RTP (Real-time Transport Protocol:リアルタイム 'プロトコル)に従って、ネットワーク 31を介して配信要求がなさ れた端末、例えば端末 51に対して配信を行う。
[0033] 上記のように、端末 51— 53は全て同一構成をとるため、ここでは端末 51について 説明を行う。
[0034] 端末 51は、ネットワーク 31を介して接続されたサーバ 1に対して配信を要求し、そ の際に希望する映像ストリームの種類、通常再生か特殊再生か、特殊再生の場合は 再生方向と再生速度を指定する。また、端末 51は、サーバ 1から配信された映像スト リームを受信し、さらにデコードすることによって通常再生および特殊再生を行う。
[0035] この端末 51は、ユーザ力もの操作を受け付ける再生入力部 41と、受け付けたユー ザの要求を内部のコマンドに変換してネットワークを介してサーバ 1に送信する再生 指示部 42と、サーバ 1からの映像ストリームを受信する受信部 43と、受信した映像ス トリームをデコードするデコーダ部 44と、デコードした映像を表示する表示部 45とに よって構成される。
[0036] 端末 51において、再生入力部 41は、ユーザが再生を希望するストリームの種類お よび通常再生、早送り、早巻き戻し、一時停止等の再生状態の受け付けを行う。また 、再生指示部 42は、ネットワーク 31を介してサーバ 1に論理的に接続されている。再 生入力部 41で受け付けられたユーザ要求が再生指示部 42で内部のコマンドに変換 され、接続されたサーバ 1に送信される。また、受信部 43は、端末 51で受信すべきス トリームの受信を行い、受信した RTPパケットから必要な映像ストリームを抜き出す。 また、デコーダ 44は、 MPEG— 2で圧縮されたストリームをデコードし、表示部 45で表 示を行う。
[0037] 次に、実施の形態 1の動作について説明する。まず、端末 51においてユーザが視 聴したいデータを通常再生する場合について説明する。端末 51では、ユーザがリク ェストしたストリームの種類および再生状態 (通常再生)が再生入力部 41に入力され 、再生指示部 42は、ユーザのリクエスト内容を内部のコマンドに変換し、ネットワーク 31を経由してサーバ 1の再生制御部 5に命令を送信する。
[0038] サーバ 1内の再生制御部 5は、端末 51内の再生指示部 42からの命令を受信し、命 令の内容に従って、読み出し部 2、スィッチ 4、スィッチ 6を制御する。今回の場合、通 常再生が指示されているので、スィッチ 4を a側に、スィッチ 6を c側に設定する。
[0039] さらに、再生制御部 5は、再生すべきストリームについて、アドレスマップ 21に保持 されて 、る、タイムスタンプと蓄積部 2の蓄積アドレスとを対応付けたテーブルをもとに 、再生すべきタイムスタンプから蓄積アドレスを求め、読み出し部 3に対してこの求め たアドレスに記録された 1つの GOPデータを読み出すように指示を出す。
[0040] 読み出し部 3は、指示されたアドレスに記録された GOPデータを蓄積部 2から読み 出し、読み出した GOPのデータをスィッチ 4およびスィッチ 6を経由して配信部 7に送 る。
[0041] 配信部 7は、プログラムストリーム形式の通常再生ストリームを RTPパケットィ匕し、ネ ットワーク帯域と転送レートおよび再生タイムスタンプを鑑みながら、ネットワーク 31に 配信を行う。このとき、 RTPパケットはリクエストのあった端末 51の IP (Internet Protocol:インターネットプロトコル)アドレスを指定して送信が行われ、別の端末が誤 つて受信しな!、ようになって!/、る。
[0042] このようにして 1GOPの配信が終了すると、再生制御部 5は、次の配信すべきタイム スタンプと蓄積アドレスをアドレスマップ 21から求め、次の再生すべき GOPの蓄積ァ ドレスを読み出すように読み出し部 3に指示を出す。読み出された GOPデータは、配 信部 7により、先の GOPデータに続いて配信が行われる。この動作を繰り返すことに よって、通常再生ストリームが順次読み出され、 RTPパケットィ匕されたデータとしてネ ットワークに送出される。
[0043] 次に、端末 51における通常再生ストリームの受信動作を説明する。端末 51におい ては、受信部 43は、ネットワーク 31を経由してサーバ 1から送信された RTPパケット の内、送信先として端末 51の IPアドレスが指定された RTPパケットのみを受信する。 さらに、受信部 43は、受信した RTPパケットから再生に不要な RTPパケットヘッダを 取り除き、プログラムストリームに変換する。このプログラムストリームは、デコーダ 44 にて MPEG— 2のデコードを行 、、表示部 45で表示を行う。
[0044] RTPパケットは、端末 51の受信および再生状態によらず、サーバ 1から次々と送信 されてくる。よって、受信部 43は、送信先として端末 51の IPアドレスが記述された RT Pパケットであれば全て受信を行い、受信したデータを次々とデコーダ 44へ送信を行 う。このような動作により、サーバ 1と端末 51間の RTP通信による通常再生が可能と なっている。
[0045] 次に、特殊再生の動作を説明する。まず、早送りの特殊再生について説明する。端 末 51において、ユーザが特殊再生、例えば早送りの指示を再生入力部 41に行うと、 再生指示部 42は、ネットワーク 31を経由して対応する命令をサーバ 1の再生制御部 5に伝える。再生制御部 5は、特殊再生を行う場合、スィッチ 4を b側に、スィッチ 6を d 側に設定し、特殊再生処理部 11に映像ストリームが流れるようにする。
[0046] この実施の形態 1では、早送りを行う場合、全ての GOPを再生するのではなぐ早 送りの速度に応じて幾つかの GOPをスキップする。スキップする GOPの数は、特殊 再生ストリームに付加されるリピートピクチャ数にも依存する。例えば、 GOP内のピク チヤ数が 15であるので、リピートピクチャを 2個使用し、 GOPあたり 3つのピクチヤから なる特殊再生ストリームを構成する場合、 5倍速の早送りであれば通常再生ストリーム の全ての GOPを読み出し、 15倍速であれば 3GOP毎に該当 GOPを読み出すような 構成をとる。
[0047] 再生制御部 5は、早送りの速度に合わせて、アドレスマップ 21に保持されたタイムス タンプと蓄積アドレスの対応テーブルから、早送りとして再生すべきタイムスタンプに 対応する蓄積アドレスを求め、その蓄積アドレスを蓄積部 2から読み出すように読み 出し部 3に命令を送る。
[0048] 読み出し部 3は、蓄積アドレスに記録された特殊再生を行うストリームの GOPデータ を蓄積部 2から読み出し、スィッチ 4を経由して抽出部 12に送る。抽出部 12は、プロ グラムストリームの形式である通常再生ストリームをビデオエレメンタリーストリームに デマルチプレックスし、さらにフレーム内符号ィ匕ピクチャのみを抽出する。抽出したフ レーム内符号ィ匕ピクチャは特殊再生処理部 11に送られ、特殊再生ストリームを生成 する処理が行われる。
[0049] 特殊再生処理部 11では、まず最初に、解析部 13において、入力されたフレーム内 符号化ピクチャ力も VBVディレイ、テンポラル'リファレンス、ピクチャ'コーディング'タ イブ、符号量等のパラメータの抽出および解析を行う。そして、生成する特殊再生スト リームのフレーム構成を組み立てる。 [0050] 図 2に特殊再生処理部 11で生成される早送りの特殊再生ストリームのフレーム構成 を示す。図 2 (a)は、特殊再生ストリームを生成する元となる通常再生ストリームであり 、この通常再生ストリームは、 M = 3、 N= 15の GOP構造を持つ。ここで、 Nは GOP 内のピクチャ数、 Mはフレーム内符号ィ匕ピクチャ又は順方向予測ピクチヤが現れる周 期(ピクチャ数で表された周期)である)また、図 2 (b)は、図 2 (a)の通常再生ストリー ム力 生成した早送りの特殊再生ストリームであり、通常再生ストリームのフレーム内 符号化ピクチャ Iと、この Iに続いて Iの表示内容を繰り返す 2フレームのリピートピク
0 0 0
チヤ Bを続けて付加することで特殊再生ストリームを構成する。さらにその後には、上
R
述のフレーム内符号ィ匕ピクチャ Iに対応する特殊再生ストリームに続いて、次の GOP
0
のフレーム内符号ィ匕ピクチャ I と 2個のリピートピクチャ Bを続けて付加することによ
15 R
り構成された特殊再生ストリームが再生速度および再生方向に基づく特殊再生ストリ ームとして生成される(すなわち、上記フレーム内符号ィ匕ピクチャ Iおよびそれに続く
0
フレーム内符号ィ匕ピクチャ I が再生速度および再生方向に基づいて選択される符
15
号化パラメータを変更したフレーム内符号ィ匕ピクチャに相当する)。
[0051] 図 2 (a)と図 2 (b)を比較するとわかるように、元が GOP内のフレーム数が 15フレー ムである通常再生ストリームに対して、特殊再生ストリームでは GOP内のフレーム数 力^にまで削減されており、結果として 5倍速の早送り映像表示を行うことができる。
[0052] 同様に、フレーム内符号ィ匕ピクチャ Iと 2個のリピートピクチャ Bの後ろに、 I を続け
0 R 15 ずに、図示されていないがさらに次の GOPのフレーム内符号化ピクチャである I と 2
30 個のリピートピクチャ Bを続けることによって、 10倍速を実現できる。このように、早送
R
りの速度に合わせて通常再生ストリームから Iフレームを選択的に抽出することによつ て、早送りの速度を調整することができる。
[0053] 一方で、リピートピクチャとは、フレーム内符号ィ匕ピクチャの表示内容を繰り返して 表示するように符号化されたもので、例えば動きベクトル 0、予測誤差 0となるように符 号ィ匕を行っており、さらにデータ量削減のためマクロブロックの符号ィ匕を省略したスキ ップドマクロブロックを使用する。ここでは、リピートピクチャの符号ィ匕方式として、双方 向予測ピクチャを用 V、ることとするが、順方向予測ピクチャを用いてもよい。
[0054] このようなリピートピクチャを用いることによって、図 2で示すように、この実施の形態 1の特殊再生ストリームでは通常再生ストリーム 1つの GOP内の B力 B までのピク
1 14 チヤデータを一切使用せず、 2個のリピートピクチャ Bと若干のスタッフイングで置き
R
換えるので、符号量が非常に小さくなるとともに、生成された特殊再生ストリームを構 成するフレーム内符号ィ匕ピクチャ Iと 2個のリピートピクチャ B力も構成される GOPの
0 R
転送レートも小さくすることができる。
[0055] そのため、一般的な特殊再生として行われる Iフレームのみの転送では、その転送 レートが非常に大きくなるのに対して、この実施の形態 1の特殊再生方法による特殊 再生ストリームでは、転送レートの上昇を防ぐことができる。例えば、 6 [Mbps]の転送 レート、 1GOPが 15フレームからなる通常再生ストリームについて Iフレームのみを転 送することによって 15倍速の特殊再生を行う場合、一般的に 18 [Mbps]の帯域が必 要となる。
[0056] し力しながら、この実施の形態 1のようにリピートピクチャを 2個利用した特殊再生で は、全ての GOPを再生した場合は 5倍速の再生速度で 6 [Mbps]、 3GOP毎の再生 であれば 15倍速でも同じく 6 [Mbps]の帯域で特殊再生を行うことができる。この構 成をとつた特殊再生ストリームについて再生を行うと、同じ映像が 3フレーム分再生さ れるが、視覚上全く問題がない。
[0057] なお、ピクチャタイプは、この実施の形態 1では双方向予測ピクチヤとする力 順方 向予測ピクチヤであってもよい。また、この実施の形態 1では、リピートピクチャを 2個 使用する構成をとっている力 その理由は、例えば通常再生ストリームの転送レート 力 [Mbps]の場合に、特殊再生ストリームも同じ 6 [Mbps]程度の転送レートにした い場合に適切な数であるためであり、必要に応じてリピートピクチャの数を変更しても よい。
[0058] 次に、解析部 13で得られた VBVディレイおよび通常再生ストリームの符号量をもと に、デコーダバッファ計算部 14では、特殊再生ストリームの VBVディレイの計算を行 う。通常、 VBVディレイは、連続するストリームの VBVバッファに占めるピクチャデー タの遷移を示し、 VBVバッファのオーバーフローおよびアンダーフローを発生させな いような値でなければならない。よって、 VBVディレイを決定する場合、 VBVの遷移 をシミュレートすることによって正確な値の制御を行うことが必要となる。し力しながら、 VBVバッファの遷移を常にシミュレートすることは、計算負荷が大きぐ現実的でない 。そこで、この実施の形態 1では、デコーダバッファ計算部 14において、 VBVディレ ィが簡単な算術計算によって導出する。なお、特殊再生ストリームの VBVディレイが 簡単な算術計算によって導出できることおよび詳細な計算方法については後述する
[0059] フレーム内符号ィ匕ピクチャデータ変換処理部 15では、生成される特殊再生ストリー ムに対応したフレーム内符号ィ匕ピクチャになるように、そのテンポラル'リファレンスや VBVディレイおよびシーケンスヘッダからフレーム内符号化ピクチャまでのビット'レ 一ト値ゃ VBV'バッファ 'サイズ値が変更される。例えば、通常再生ストリームにおい てフレーム内符号ィ匕ピクチャのテンポラル ·リファレンスが 2であり、特殊再生ストリーム でリピートピクチャを 1個付加する場合は、テンポラル'リファレンスは 1に変更される。 また、 VBVディレイも、デコーダバッファ計算部 14で計算された特殊再生ストリーム 用の VBVディレイに置き換えられる。
[0060] リピートピクチャ付加部 16では、フレーム内符号ィ匕ピクチャの表示内容と同じ表示 を行うリピートピクチャのデータを生成し、フレーム内符号ィ匕ピクチャの後ろに符号ィ匕 を行う。さらに、符号量制御部 17では、予測する符号量が目標とする転送レートに対 して少な!/、ようであればスタッフイングを行 、、上回るようであれば目標転送レートを 一時的に上昇させて、生成する特殊再生ストリームのデータが転送できるように調整 を行う。最後に、 PS化部 18では、生成された特殊再生ストリームをプログラムストリー ムにマノレチプレックスを行う。
[0061] 以上のようにして特殊再生処理部 11で生成された特殊再生ストリームは、スィッチ 6 を経由して配信部 7に送られる。配信部 7では、通常再生ストリームと同様に、リクエス トを行った端末を送信先 IPアドレスとして RTPパケットィ匕を行い、配信を行う。この操 作を、特殊再生ストリームとして利用する GOP単位で繰り返すことによって、特殊再 生ストリームの配信が行える。
[0062] 次に、端末 51における特殊再生ストリームの受信動作を説明する。端末 51では、 通常再生ストリームを受信するのと同様に、受信部 43は、ネットワーク 31を経由して サーバ 1から送信された RTPパケットの内、送信先として端末 51の IPアドレスが指定 された RTPパケットのみを受信する。さらに、受信部 43は、受信した RTPパケットから 再生に不要な RTPパケットヘッダを取り除き、プログラムストリームに変換する。
[0063] プログラムストリームに戻された特殊再生ストリームは、映像ストリームの内容は特殊 再生である早送り映像である力 シンタックス上は通常のプログラムストリームと何ら変 わりがない。そのため、通常再生と同様に、デコーダ 44にて MPEG— 2のデコードを 行い、表示部 45に再生画を表示することが可能である。
[0064] 図 3に一時停止の場合の特殊再生ストリームのフレーム構成を示す。図 3 (a)は、特 殊再生ストリームを生成する元となる通常再生ストリームであり、この通常再生ストリー ムは、 M = 3、 N= 15の GOP構造を持つ。また、図 3 (b)は、図 3 (a)の通常再生スト リームから生成した一時停止の特殊再生ストリームであり、図 2 (b)で示した早送り再 生の構成に対して、使用する Iフレームが常に同じ I
0を用いる以外、同じ構成をとる。
[0065] 一時停止においては、通常再生ストリームにおける一時停止として表示したい GO Pのフレーム内符号ィ匕ピクチャ Iを利用し、この Iに続いて Iの表示内容を繰り返す 2
0 0 0
フレームのリピートピクチャ Bを続けて付加することで特殊再生ストリームを構成する
R
。さらにその後には、上述のフレーム内符号ィ匕ピクチャ I
0に対応する特殊再生ストリー ムに続いて、同じ映像を構成するために、この同じ I
0と 2個のリピートピクチャ B
Rを続 けて付加することにより構成された特殊再生ストリームが再生速度および再生方向に 基づく特殊再生ストリームとして生成される(すなわち、上記フレーム内符号化ピクチ ャ I
0およびそれに続く同じフレーム内符号ィ匕ピクチャ I
0が再生速度および再生方向に 基づいて選択される符号ィ匕パラメータを変更したフレーム内符号ィ匕ピクチャに相当す る)。このような構成により、継続的に同じ映像を示す一時停止用の特殊再生ストリー ムを構成できる。一時停止の場合は継続的に同じ映像を表示すればいいので、リピ 一トビクチャ Bの数を増やすことによって、サーバおよびネットワークの負荷を下げる
R
ようにすることちでさる。
[0066] 次に、図 1を用いて、一時停止を行う動作について説明する。図 1において、再生 制御部 5は、アドレスマップ 21を参照しながら常に同じタイムスタンプデータの蓄積ァ ドレスを蓄積部 2から読み出すように、読み出し部 3に対して指示を行う。読み出され た GOPデータは、特殊再生処理部 11によって図 3 (b)に示すような一時停止の特殊 再生ストリームに変換され、配信部 7から端末 51に対して配信が行われる。生成され た一時停止用の特殊再生ストリームは、継続的に同じ再生画が表示されるデータ構 造を持ち、端末 51は、通常再生や早送りのときと同じように、順次デコードおよび再 生処理を継続するだけで、一時停止の再生画を表示することができる。
[0067] 図 4に早巻き戻しの場合の特殊再生ストリームのフレーム構成を示す。図 4 (a)は、 特殊再生ストリームを生成する元となる通常再生ストリームであり、この通常再生ストリ ームは、 M = 3、 N= 15の GOP構造を持つ。また、図 4 (b)は、図 4 (a)の通常再生ス トリーム力 生成した早巻き戻しの特殊再生ストリームである。
[0068] 早巻き戻しでは、時間的に後の映像が先に表示されるように構成されなければなら ない。そのため、早巻き戻しの特殊再生ストリームは、通常再生ストリームの時間的に 後のフレーム内符号ィ匕ピクチャ I と、この I に続いて I の表示内容を繰り返す 2フレ
15 15 15
ームのリピートピクチャ Bを続けて付加することで特殊再生ストリームを構成する。さら
R
にその後には、上述のフレーム内符号ィ匕ピクチャ I
15に対応する特殊再生ストリームに 続いて、前の GOPのフレーム内符号化ピクチャ Iと 2個のリピートピクチャ Bを続けて
0 R 付加することにより構成された特殊再生ストリームが再生速度および再生方向に基づ く特殊再生ストリームとして生成される(すなわち、上記フレーム内符号ィ匕ピクチャ I
15 およびそれに続くフレーム内符号ィ匕ピクチャ I
0が再生速度および再生方向に基づい て選択される符号ィ匕パラメータを変更したフレーム内符号ィ匕ピクチャに相当する)。こ のような構成により、表示映像の順が通常再生ストリームと反対になった早巻き戻し再 生用の特殊再生ストリームを生成することができる。
[0069] 図 4 (a)と図 4 (b)を比較するとわかるように、元が GOP内のフレーム数が 15フレー ムである通常再生ストリームに対して、特殊再生ストリームでは GOP内のフレーム数 力^にまで削減されており、結果として 5倍速の早巻き戻し映像表示を行うことができ る。さらに、作成する特殊再生ストリームに使用するフレーム内符号ィ匕ピクチャを 2G OP毎にすれば 10倍速、 3GOP毎にすれば 15倍速の早巻き戻しが可能である。
[0070] 次に、図 1を用いて、早巻き戻しを行う動作について説明する。図 1において、再生 制御部 5は、早巻き戻しの速度に合わせて、読み出すべき通常再生ストリームのタイ ムスタンプを決定する。さら〖こ、アドレスマップ 21を参照し、読み出すべきタイムスタン プデータの蓄積アドレス決定し、蓄積部 2から該当 GOPデータを読み出す。読み出 された GOPデータは、特殊再生処理部 11によって早巻き戻しの特殊再生ストリーム に変換される。同様に、早巻き戻し速度に合わせて、次の読み出しタイムスタンプを 決定し、アドレスマップ 21から蓄積アドレスを求め、該当 GOPデータを蓄積部 2から 読み出し、特殊再生処理部 11に送り込む動作を続けることによって、図 4 (b)に示す ような早巻き戻しの特殊再生ストリームが生成される。生成された早巻き戻しの特殊 再生ストリームは、配信部 7から端末 51に対して配信が行われる。この早巻き戻しの 特殊再生ストリームは、再生画が時間的に逆になつたデータ構造を持ち、端末 51は 通常再生のときと同じように順次デコードおよび再生処理を継続するだけで早巻き戻 しの再生画を表示することができる。
[0071] 次に、特殊再生ストリームにおける VBVディレイの導出方法について説明する。図 5 (a)は通常再生ストリームにおける仮想デコーダの VBVバッファの遷移を示した図 であり、図 5 (b)は特殊再生ストリームにおける仮想デコーダの VBVバッファの遷移を 示した図である。図 5 (a)および図 5 (b)の両図とも、横軸に時間、縦軸に VBVバッフ ァの占有量を示し、実線が VBVバッファの遷移を示して!/、る。
[0072] 図 5において、 VBVバッファの実線の傾き aは、通常再生ストリームの転送レートを
N
表している。先頭の Iピクチャは、転送レート aで VBVバッファに充填が行われ、 VB
N
Vディレイで示されるて 時間後にデコードが開始される。そのとき、 Iピクチャのデー
NO
タ量である d 力VBVバッファから抜き去られる。
NO
[0073] 次のピクチャは、先頭ピクチヤの充填が完了し次第すぐに充填が開始され、同じく
て 時間後に d が VBVバッファ力も抜き去られる。このとき、隣接するピクチャの充
Nl N1
填開始時間の差 X は、
NO
X = τ + Δ ί- τ · ' · ( 1)
NO NO Nl
で表される。ここで、 Δ ίは表示フレームの間隔であり、 NTSCでは 1Z29. 97であ る。また、転送レート aと符号量 d との間には、
N NO
d 二 a Χ χ · ' · (2)
NO Ν NO
という関係がある。
[0074] 一方、図 5 (b)に示される特殊再生ストリームにつ 、ても、上記通常再生ストリームと 同じ関係がある。つまり、
X = τ + Δ ί- τ - - (3)
TO TO Tl
d =a X x - - (4)
TO T TO
である。ここで、 x は特殊再生ストリームの先頭 Iピクチャと次のピクチヤの充填開始
TO
時間の差、 X は特殊再生ストリームの 2番目のピクチャと 3番目のピクチャの充填開
T1
始時間の差、 τ は特殊再生ストリームの先頭 Iピクチャの VBVディレイ、 τ は特殊
TO Tl 再生ストリームの 2番目のピクチャの VBVディレイ、 d は特殊再生ストリームの先頭 I
TO
ピクチャのデータ量、 aは特殊再生ストリームの転送レートである。
T
[0075] さらに、通常再生ストリームと特殊再生ストリームの間において、先頭の VBVバッフ ァの充填量を同じと仮定すると、
a X τ =a X τ · · · (ο)
Ν NO Τ TO
の関係が導かれる。これは、図 5において破線で示す内容である。
[0076] 以上より、特殊再生ストリームの VBVディレイは、
τ =a z a X τ ··· (Ό)
TO Ν Τ NO
τ = τ -d /a + Δ ί· · · (7)
Tl TO TO T
τ = τ -d /a + Δ ί· · · (8)
Τ2 Tl Tl Τ
の関係が導かれる。つまり、通常再生ストリームの転送レート a、特殊再生ストリーム
N
の転送レート a、通常再生ストリームにおける先頭ピクチャの VBVディレイである τ
T NO
から、特殊再生ストリームの VBVディレイを求めることができる。以上より、一般的に V BVディレイを求めるときのように VBVバッファの遷移をシミュレートすることによって V BVディレイを求めることなぐ上記簡単な算術計算によって特殊再生ストリームの VB Vディレイを求めることができる。
[0077] なお、上記では特殊再生ストリームの VBVディレイを計算によって導出する方法を 示したが、全ての VBVディレイを固定値 OxFFFFに置き換えることによつても、特殊 再生ストリームを構成することができる。 VBVディレイが OxFFFFであることは、ストリ ームが VBR (Variable Bit Rate:可変ビットレート)であることを示す値である。一方、 V BVディレイとして OxFFFF以外の値が入っている場合は、 CBR (Constant Bit Rate: 固定ビットレート)を示す。 MPEG— 2では、 CBRは VBRの特殊な形態と定義されて いるため、生成した特殊再生ストリームを VBRに設定することについて何ら問題はな い。この場合、 VBVディレイに関する計算処理が全く必要なぐデータの置き換えだ けで済むのでさらに高速な処理が可能になる。
[0078] このように実施の形態 1では、ネットワーク上で接続されたサーバと端末間で映像の 特殊再生を実行する場合において、通常再生ストリーム力も特殊再生ストリームをリア ルタイムに生成するので、あら力じめ記録媒体に特殊再生ストリームを用意しておく 必要や、あら力じめ用意しておいた特殊再生ストリームに対する特別な管理を行う必 要がない。
[0079] また、生成する特殊再生ストリームは、通常再生ストリーム力も抽出した Iフレームに 、符号量の少ないリピートピクチャを付加して、転送レートを抑えた特殊再生ストリー ムを生成し、秒あたりの符号量を削減しているので、特殊再生のときも、ネットワーク の負荷を上昇させることなく転送が可能である。
[0080] また、生成された特殊再生ストリームは、再生側で通常の速度で再生することによつ て、あた力も特殊再生されたかのような映像を呈するように生成されているので、再生 側で特殊再生ストリームを再生するにあたり、特別な仕組みを設ける必要がなぐ特 殊再生を実現できる。
[0081] さらに、通常再生ストリーム力も抽出した Iフレームの符号化パラメータの値を、生成 する特殊再生ストリームおよび MPEG— 2ストリームの規約に従うように再設定して特 殊生成ストリームに使用するので、符号化パラメータが不正な値をとることによる再生 映像の乱れや、多重装置における多重化の失敗がなくなる。
[0082] また、生成する特殊再生ストリームに適合するように、デコーダバッファを制御する V BVディレイ等のデコーダバッファに関する制御パラメータを適正な値に設定し直す ので、デコーダバッファの破淀を防ぐことができる。
[0083] また、 VBVディレイが適正な値になって 、るので、もし特殊再生ストリームが配信さ れる経路上に多重装置があっても、多重ミスを生じることがな 、。
[0084] また、デコーダバッファ制御用パラメータを、特殊再生ストリームに変換する前の転 送レートならびにデコーダバッファの制御用パラメータおよび変換後の転送レートか ら求めるので、特殊再生ストリームのデコーダバッファ制御用パラメータとして、より適 切な値を導出でき、さらにデコーダバッファの破綻が起きなくなる。
[0085] また、この実施の形態 1で示した VBVディレイの計算方法では、簡単な算術計算に より VBVディレイを求めることができるので、デコーダバッファのシミュレートにより VB Vディレイを求める方法に比べてシステムの負荷が少なぐ計算によるシステムの負 荷上昇を発生させることなぐまた高速に求めることができる。
[0086] さらに、 VBVディレイ等のデコーダバッファ制御用パラメータを OxFFFF等の有意 な固定値に設定することにより、上記簡単な算術計算すら行う必要がなぐデコーダ ノ ッファ制御用パラメータの計算処理に係る時間および負荷がほとんど発生しないの で、システムの負荷をほとんど上昇させることなぐ VBVディレイ等のデコーダバッフ ァ制御用パラメータを設定することができる。
[0087] さらに、変動する特殊再生ストリームの符号量に対して、転送レートの調整を発生符 号量が少な!/、ときはスタッフイングで調整し、符合量が大き!/、ときは目標とする符号量 を一時的に上昇させて、符号量を制御することにより、生成する特殊再生ストリームに 対して転送レートの調整の制御ができるので、通常再生と同じ転送レートにしたり、特 殊再生のときのみ転送レートを変化させたり、簡単に転送レートを調整できる。
なお、転送レート調整のために符号ィ匕するスタッフイングを、各ピクチャの符号量や VBVディレイが均一になるように、各リピートピクチャの後に均等に挿入するようにし ても良い。
[0088] 以上のように実施の形態 1によれば、特殊再生ストリームのネットワーク越しでの再 生において、映像の乱れが発生することがない。
[0089] 実施の形態 2.
図 6は本発明の実施の形態 2の映像データ処理装置を備えた広域監視システムを 示す図である。この実施の形態 2では、カメラ 101— 103で撮影された映像をサーバ 120に蓄積保存し、複数台の端末 111一 113から蓄積された映像を視聴できるシス テムを構築している。端末は、任意の映像を通常の再生速度で視聴できる他に、早 送り、早巻き戻し、一時停止などの特殊再生も可能である。
[0090] 監視カメラ 101— 103は、撮影した映像を MPEG— 2プログラムストリームに圧縮を 行い、さらに RTPプロトコルに対応した RTPZUDP (User Datagram Protocol:ユー ザ ·データグラム ·プロトコル)パケット化を行い、ネットワーク 100を経由してサーバ 12 0に送信する。
[0091] サーバ 120は、カメラ 101— 103が撮影した映像ストリームについて 3つの蓄積機 能を有しており、初期設定で選択が可能である。その 1つ目は、カメラ 101— 103から のマルチキャストストリームを、エンドレスに常時受信 ·蓄積を行う一次蓄積サーバ機 能、 2つ目は、カメラ 101— 103からのマルチキャストストリームを、アラームをトリガに 受信'蓄積するアラーム蓄積サーバ機能、 3つ目は、図 6に示されていない別のサー バに蓄積された映像ストリームを退避する画像保存サーバ機能であり、これら 3つの 蓄積機能を初期設定で切り替えて使用できる。ここでは、サーバ 120は、一次蓄積サ ーバに設定されているものとして、以下説明を続ける。
[0092] サーバ 120は、要求受付モジュール 121と、受信モジュール 122と、映像データべ ース 123と、配信モジュール 124と、蓄積モジュール 125と、特殊再生モジュール 12 6と、 HDD (ノヽード'ディスク'ドライブ) 127とを備えている。
[0093] 要求受付モジュール 121は、外部からの蓄積および配信要求に応じるためのモジ ユールであって、端末 111一 113および図 6に示されて!/、な!/、別のサーバからの映 像の配信および蓄積の要求を受け付け、サーバ 120内の他のモジュールに対して 内部 IZFを利用して制御を行うとともに、要求のあった端末もしくはサーバに対して 要求に対する応答メッセージ送信も行う。この要求受付モジュール 121は、 RTSP ( Real Time Streaming Protocol:リアルタイム ·ストリーミング'プロトコル)に対応しており 、サーバ 120に蓄積されている映像ストリームの通常再生および特殊再生が可能に なっている。また、要求受付モジュール 121は、映像データベース 123を利用した各 種検索機能も備えており、例えば時間や撮影されたカメラを検索キーにして対象とな る映像ストリームを検索することも可能である。
[0094] 受信モジュール 122は、カメラ 101— 103からマルチキャスト配信されたストリームの 受信処理を行う。カメラ 101— 103がマルチキャストで送信するメリットは、 1つの映像 ストリームを他のサーバで同時に保存が可能であることと、端末 111一 113から直接 カメラの映像が視聴可能となることであり、サーバ 120に対してのみ送信したいので あればュ-キャストで送信してもよい。この受信モジュール 122は、 RTPZUDPパケ ットの送信 IPアドレスがサーバ 120の IPアドレスもしくはマルチキャストアドレスであり 、かつポート番号が一致していたときのみ受信を行う。また、受信モジュール 122は、 RTPZUDPパケットで送られた GOPの先頭データを受信した時刻をタイムスタンプ として取得する。受信した RTPZUDPパケットは、 RTPZUDPヘッダが付加されて いるので、それらを取り除き、 RTPZUDPパケットのペイロード部を結合し、プロダラ ムストリームにする。
[0095] 蓄積モジュール 125は、受信したプログラムストリームである映像ストリームについて GOP単位で HDD127に蓄積を行うとともに、 HDD 127に蓄積されたデータにつ!/ヽ て GOP単位で管理を行う。
[0096] 映像データベース 123は、蓄積モジュール 125が管理'蓄積を行っている映像スト リームおよび GOPのメタ情報 (コンテンツの構造や属性を示す情報)につ 、ての記録 '管理および検索機能を提供する。映像ストリームのメタ情報の種類としては、例えば カメラ番号、映像の圧縮方式および圧縮レベル、受信モジュール 122で取得した時 間を示すタイムスタンプ、撮影時刻等がある。
[0097] 配信モジュール 124は、要求受付モジュール 121からの要求に従い、蓄積モジュ ール 125が管理する映像ストリームをネットワーク 100に配信を行う。映像ストリームを ネットワーク 100経由で、例えば端末 111に対して通常再生ストリームとして配信する ときは、送信データであるプログラムストリームを RTPZUDPパケットィ匕し、送信先 IP アドレスとして端末 111の IPアドレスを設定するとともに、映像データベース 123に記 録されている GOP毎の受信タイムスタンプをもとに GOP単位の送信のタイミングの制 御を行う。
[0098] 一方、特殊再生ストリームを配信するときは、蓄積モジュール 125から読み出した通 常再生ストリームを特殊再生モジュール 126にー且転送し、特殊再生モジュール 12 6が生成した特殊再生ストリームについて配信を行う。特殊再生ストリームの配信タイ ミングは、早送りおよび早巻き戻しについては、配信する GOPの受信タイムスタンプ 間隔が、 15倍速であれば 1Z15になるように配信を行う。特殊再生モジュール 126 を利用するには、通常再生ストリーム力もフレーム内符号ィ匕ピクチャ (Iフレーム)を抽 出して特殊再生モジュール 126に渡すとともに、特殊再生ストリームを生成するため に必要とされるパラメータ、例えば通常再生ストリームの転送レート、希望する特殊再 生ストリームの転送レート等のパラメータについても特殊再生モジュール 126に渡し、 特殊再生ストリーム生成を行う。
[0099] 端末 111一 113では、サーバ 120に蓄積された映像ストリームを視聴することが可 能であり、サーバ 120の要求受付モジュール 121に再生のリクエストを送ることによつ て視聴が可能になる。例えば、端末 111が視聴したい映像ストリームをサーバ 120に リクエストすると、対応する映像ストリームが RTPZUDPパケット単位でサーバ 120か ら配信される。端末 111は、ネットワーク上の RTPZUDPパケット内の送信 IPァドレ スおよびポート番号が一致しているパケットについて受信を行うことによって、リクエス トした映像ストリームの再生を行うことができる。
[0100] 次に、図 7を用いて、特殊再生モジュール 126について説明する。特殊再生モジュ ール 126は、配信モジュール 124から転送される Iフレームを受信するための Iフレー ムノ ッファ 131と、受信した Iフレームデータのデータ構造や符号化パラメータの解析 を行う解析部 132と、生成する特殊再生ストリームの VBVディレイの計算を行うデコ ーダバッファ計算部 133と、特殊再生ストリームに利用する Iフレームデータについて パラメータの変更を行う Iフレームデータ変換処理部 134と、 Iフレームに続いてこの I フレームと同じ表示内容を示すリピートピクチャを生成'付加するリピートピクチャ付カロ 部 135と、生成する特殊再生ストリームの符号量を目標とする転送レートに合うように 制御を行う符号量制御部 136と、生成された特殊再生ストリームをプログラムストリー ムに変換する PS化部 137と、生成された特殊再生ストリームを配信モジュール 124 に伝えるための特殊再生ストリームバッファ 138とによって構成されている。
[0101] 次に、実施の形態 2の動作について説明する。サーバ 120は、蓄積方法としてカメ ラ 101— 103からのマルチキャストストリームをエンドレスに常時受信'蓄積を行う一次 蓄積サーバに設定がなされているものとする。サーバ 120がー次蓄積サーバに設定 がなされると、サーバ 120の受信モジュール 122は、常時ネットワーク 100の RTPZ UDPパケットについて監視を行い、 RTPZUDPパケットの送信先 IPアドレスが自ら の IPアドレスもしくはマルチキャストアドレスであり、さらにポート番号が一致していれ ば、該当 RTPZUDPパケットの受信を行う。 [0102] 受信モジュール 122で受信されたパケット単位の映像ストリームは、 RTPZUDPパ ケット形式力もプログラムストリームに変換され、さらに単独もしくは複数のパケットで G OP単位が構成されるごとに GOP単位で HDD 127に記録が行われる。また、映像デ ータベース 123は、該当 GOPがサーバ 120において受信された時刻を GOPの受信 タイムスタンプとして記録するとともに、カメラ情報、映像の圧縮方式および圧縮レべ ル等のメタ情報の記録を行う。この動作を繰り返すことによって、サーバ 120に映像ス トリームが蓄積されていく。
[0103] 次に、通常再生の動作について説明する。まず、例えば端末 111から任意の映像 を選択し、再生する場合について説明する。まず最初に、端末 111は、サーバ 120 の要求受付モジュール 121に対して、サーバ 120内に蓄積されている映像ストリーム の一覧を取得する。映像ストリームの一覧を取得するには、映像データベース 123の 検索機能を利用し、検索キーとして特に何も指定しないで検索を実行すると、蓄積さ れた映像ストリームの一覧を取得することができる。こうして取得した映像ストリームの 一覧から、端末 111は、任意の希望する映像ストリームを選択することができる。映像 ストリームは、それぞれについて重複しない映像 IDが割り当てられており、映像ストリ ームの特定には映像 IDが利用される。
[0104] 次に、端末 111は、選択した映像ストリームを再生するために、要求受付モジユー ル 121に対して、選択した映像 IDの再生要求コマンドを発行する。再生要求を受け た要求受付モジュール 121は、配信モジュール 124に対して指定された映像 IDの再 生を開始するように命令を送る。配信モジュール 124は、映像データベース 123を利 用して、映像 IDに一致し、かつ再生時間に一致する映像ストリームの GOPを特定し 、蓄積モジュール 125に再生の指示を出す。蓄積モジュール 125は、前記特定した 映像ストリームの GOPを HDD127から読み出し、配信モジュール 124に送る。配信 モジュール 124は、蓄積モジュール 125から取得した GOPの配信を行う。
[0105] 配信モジュール 125による配信においては、映像ストリームの GOPを RTP/UDP パケットィ匕し、送信先 IPアドレスとして端末 111の IPアドレスおよび受信する端末と同 一のポート番号を指定し、さらに映像データベース 123に記録しておいた配信デー タのメタ情報の 1つである受信タイムスタンプをもとに配信タイミングの制御を行う。つ まり、配信モジュール 124は、該当 GOPの配信タイミングとして、受信モジュール 122 で GOPを受信した時刻である受信タイムスタンプを再現するように GOPの配信を行 う。これによつて、カメラにて撮影され、さらにエンコードされた映像データのカメラから の配信タイミングが再現され、結果としてネットワークおよび再生環境における各種バ ッファにおいてオーバーフローおよびアンダーフローを発生することなぐリアルタイ ムなデコード再生が可能になる。
[0106] 配信モジュール 125から配信された RTPZUDPパケットは、再生を要求した端末 1 11により受信される。端末 111は、連続的に配信される RTPZUDPパケットについ て RTPZUDPヘッダを取り除き、複数の RTPZUDPパケットのペイロードをつなぎ 合わせることによってプログラムストリームの形をした通常再生ストリームを取得できる
。以上より、端末 111は、サーバ 120に蓄積された映像再生ストリームを取得し、さら に図示しないが内部に備えられたデコーダによって取得した映像再生ストリームを再 生することができる。
[0107] 次に、特殊再生の動作について説明する。ここでは、代表的な特殊再生の 1つであ る早送りの方法について説明する。説明の簡略化のために、蓄積されている通常再 生データは、 MPEG— 2プログラムストリームで、 N= 15とする。
[0108] 早送りの場合、 GOP内の Iフレームのみを順次再生すれば 15倍速である力 Iフレ ームの後にリピートピクチャを 2枚付加した特殊再生ストリームを生成し、再生を行うと 、通常再生ストリームに比べ 5倍速の表示を行うことができる。さらに早送りの速度を 高速にするには、離散的に GOPを読み出せばよぐ例えば 3GOP毎に読み出せば 1 5倍速、 6GOP毎に読み出せば 30倍速の早送りを行うことができる。ここでは、端末 1 11から任意の映像について 15倍速の早送りの特殊再生がリクエストされたものとす る。
[0109] 通常再生の場合と同じように、端末 111は、サーバ 120の要求受付モジュール 121 に対して、特殊再生を行う映像 IDと特殊再生を行う命令を発行する。再生要求を受 け付けた要求受付モジュール 121は、配信モジュール 124に対して、選択された映 像 IDと早送りのコマンドを発行する。配信モジュール 124は、映像データベース 123 を用いて、選択された映像 IDのストリームのメタ情報を取得し、 15倍速の早送りを実 現するための読み込み対象の GOPを決定する。
[0110] 図 8に GOPと受信タイムスタンプの関係を示す。図 8において、 N= 15、リピートピ クチャが 2枚の場合の 15倍速の早送りでは、 3GOP毎の読み出しを行えばよい。この ようにして早送り速度に応じて読み込み GOPを決定し、決定した GOPを蓄積モジュ ール 125力 SHDD127力ら読み出しを行う。配信モジュール 124は、取得した通常再 生ストリームの GOPデータから Iフレームを抽出し、特殊再生モジュール 126に送る。
[0111] 図 7において、特殊再生モジュール 126の Iフレームバッファ 131には、配信モジュ ール 124から送られた Iフレームデータが格納される。解析部 132は、 Iフレームバッ ファ 131に格納された Iフレームデータの VBVディレイ、テンポラル'リファレンス、ピク チヤ ·コーディング ·タイプ、符号量の解析を行い、特殊再生モジュール 126内の各 処理で必要なパラメータを取得する。
[0112] デコーダバッファ計算部 133では、解析部 132から取得したパラメータをもとに、生 成する特殊再生ストリームの VBVディレイの計算を行う。この VBVディレイの計算方 法については、上記実施の形態 1で示した方法を用いるものとする。
[0113] Iフレームデータ変換処理部 134は、入力した Iフレームピクチャが生成される特殊 再生ストリームに適合するように、例えばテンポラル'リファレンスや VBVディレイおよ びシーケンスヘッダ以降 Iフレームまでのビット ·レート値や VBV'バッファ ·サイズ値を 変更する。
[0114] リピートピクチャ付加部 135は、先行する Iフレームと表示内容が同じになるように、 動きベクトルを 0かつ予測誤差を 0になるように、力つスキップドマクロブロックを使用 しデータ量を大幅に削減するように符号ィ匕されたリピートピクチャのデータを作成する
[0115] 符号量制御部 136は、生成する特殊再生ストリームの目標転送レートに対して、発 生する符号量を予測し、予測符号量が目標転送レートに比べて小さいなら、スタッフ イングによって目標転送レートに近づけ、予測符号化量が目標転送レートを上回りそ うであれば、一時的に目標転送レートを上げるとともに関連する例えばビット'レート 値や SCRの再調整を行 、、 MPEG— 2の規格に対して矛盾が生じな 、処理を行うこ とによって、発生符号量の制御を行う。 [0116] PS化部 137は、ビデオエレメンタリーストリームの形式で生成された特殊再生ストリ ームをパック単位に分割し、プログラムストリームの形式に変換を行う。生成されたプ ログラムストリームは、特殊再生ストリームバッファ 138に保存され、当該データを配信 モジュール 124に渡す。
[0117] 配信モジュール 124は、受け取った特殊再生ストリームについても、通常再生ストリ ームと同様に、 RTP/UDPパケットィ匕し、送信先 IPアドレスとして端末 111の IPアド レスおよびポート番号を指定し、さらに映像データベース 123に記録しておいた配信 データのメタ情報の 1つである GOP毎の受信タイムスタンプをもとに早送り速度を鑑 みながら、つまり 15倍速であれば GOP間の受信タイムスタンプの間隔が 1Z15にな るように、 GOP単位での配信タイミングの制御を行う。配信モジュール 124から配信さ れた RTPZUDPパケットは、再生を要求した端末 111により受信される。
[0118] 端末 111は、連続的に配信される RTPZUDPパケットについて、 RTPZUDPへッ ダを取り除き、プログラムストリームのパケットにし、さらに複数のペイロードパケットを つなぎ合わせることによって、特殊再生ストリームを取得できる。そして、取得した特 殊再生ストリームを通常再生ストリームと同様に再生することによって、 15倍速の早送 りの特殊再生を実現することができる。この特殊再生ストリームは、シンタックス上、通 常再生ストリームと何ら変わりがないため、通常再生ストリームと同様に扱うことが可能 である。以上より、端末 111は、取得した特殊再生ストリームを再生することができる。
[0119] ここでは、早送りの 15倍速について説明した力 早送りの 30倍速であれば、 6GOP 毎に 1つの Iフレームを読み出し、配信するタイムテーブルの時間間隔を 1Z15にす ればよい。また、早巻き戻しであれば、逆方向に読み出して、特殊再生モジュール 1 26に送ればよい。また、一時停止であれば、同じ GOPのデータを繰り返し、特殊再 生モジュール 126に送ればよ!、。
[0120] なお、早送りおよび早巻き戻しの特殊再生ストリームの配信タイミングについては、 受信時のタイムスタンプをもとに配信することによってリアルタイム性を確保できた力 一時停止の特殊再生において配信を行うタイミングは、受信時刻が同一であるため、 受信タイムテーブルを使用するのは無意味である。従って、生成した特殊再生ストリ ームの時刻情報をもとに配信を行なう方法をとる。 [0121] この実施の形態 2で説明した特殊再生ストリームは、再生側で通常の速度で再生す ることによって、あた力も特殊再生されたかのような映像を呈するように生成されてい るので、再生側で特殊再生ストリームを再生するにあたり、特別な仕組みを設ける必 要がなぐ通常再生ストリームと同様に扱うことができる。
[0122] また、通常再生から特殊再生、もしくは特殊再生力 通常再生に遷移するときに、 シームレスに再生を続けるためには、プログラムストリームの SCR (System Clock Reference)および PTS (Presentation Time Stamp :再生出力の時刻管理情報)や DT S (Decoding Time Stamp :復号の時刻管理情報)の時間情報の連続性を保証するこ とが必要である。もし、これらの時間情報が連続していないと、デコーダによっては、 デコーダバッファのオーバーフローやアンダーフローが発生したり、デコードの一時 中断や停止が発生したりする恐れがある。
[0123] 従って、通常再生と特殊再生間の切り替え時には、先行するストリームの最終 SCR をもとに、後続するストリームの SCRが連続するように、後続するストリームの SCRに オフセットを行うことが望ましい。さらに、後続するストリームの PTSおよび DTSについ ても、 SCRが行ったオフセット相当を行うことも必要である。
[0124] このように実施の形態 2では、ネットワーク上で接続されたサーバと端末間で映像の 特殊再生を実行する場合において、通常再生ストリーム力も特殊再生ストリームをリア ルタイムに生成するので、あら力じめ記録媒体に特殊再生ストリームを用意しておく 必要や、あら力じめ用意しておいた特殊再生ストリームに対する特別な管理を行う必 要がない。
[0125] また、生成する特殊再生ストリームは、通常再生ストリーム力も抽出した Iフレームに 、符号量の少ないリピートピクチャを付加して、転送レートを抑えた特殊再生ストリー ムを生成し、秒あたりの符号量を削減しているので、特殊再生のときも、ネットワーク の負荷を上昇させることなく転送が可能である。
[0126] また、生成された特殊再生ストリームは、再生側で通常の速度で再生することによつ て、あた力も特殊再生されたかのような映像を呈するように生成されているので、再生 側で特殊再生ストリームを再生するにあたり、特別な仕組みを設ける必要がなぐ特 殊再生を実現できる。 [0127] さらに、通常再生ストリーム力も抽出した Iフレームの符号化パラメータの値を、生成 する特殊再生ストリームおよび MPEG— 2ストリームの規約に従うように再設定して特 殊生成ストリームに使用するので、符号化パラメータが不正な値をとることによる再生 映像の乱れや、多重装置における多重化の失敗がなくなる。
[0128] また、生成する特殊再生ストリームに適合するように、デコーダバッファを制御する V BVディレイ等のデコーダバッファに関する制御パラメータを適正な値に設定し直す ので、デコーダバッファの破淀を防ぐことができる。
[0129] また、 VBVディレイが適正な値になって 、るので、もし特殊再生ストリームが配信さ れる経路上に多重装置があっても多重ミスを生じることがない。
[0130] また、デコーダバッファ制御用パラメータを、特殊再生ストリームに変換する前の転 送レートならびにデコーダバッファの制御用パラメータおよび変換後の転送レートか ら求めるので、特殊再生ストリームのデコーダバッファ制御用パラメータとして、より適 切な値を導出でき、さらにデコーダバッファの破綻が起きなくなる。
[0131] また、デコーダバッファ制御用パラメータの導出が簡単な算術計算であるため、計 算によるシステムの負荷上昇を発生させることなぐまた高速に求めることができる。
[0132] さらに、デコーダバッファ制御用パラメータを固定値に設定することにより、デコーダ ノ ッファ制御用パラメータの計算処理に係る時間および負荷がほとんど発生しないの で、システムの負荷をほとんど上昇させることなぐデコーダバッファ制御用パラメータ を設定することができる。
[0133] さらに、変動する特殊再生ストリームの符号量に対して、転送レートの調整を発生符 号量が少な!/、ときはスタッフイングで調整し、符合量が大き!/、ときは目標とする符号量 を一時的に上昇させて、符号量を制御することにより、生成する特殊再生ストリームに 対して転送レートの調整の制御ができるので、通常再生と同じ転送レートにしたり、特 殊再生のときのみ転送レートを変化させたり、簡単に転送レートを調整できる。
[0134] 以上のように実施の形態 2によれば、特殊再生ストリームのネットワーク越しでの再 生において、映像の乱れが発生することがない。

Claims

請求の範囲
[1] フレーム間予測を用いて符号ィ匕された映像ストリームに対して、再生速度および再 生方向を変更した特殊再生ストリームを生成する映像データ処理方法であって、 生成する特殊再生ストリームの速度と方向に合わせて、上記映像ストリーム力 フレ ーム内符号化ピクチャを選択的に抽出する工程と、
上記抽出したフレーム内符号ィ匕ピクチャの符号化パラメータを解析する解析工程と 上記速度と方向に合わせて、上記符号化パラメータを変更する変更工程と、 上記抽出したフレーム内符号ィ匕ピクチャと同じ表示内容を示すリピートピクチャを生 成し、上記リピートピクチャを、データの伝送順で上記再生速度および再生方向に基 づいて選択される上記符号ィ匕パラメータを変更したフレーム内符号ィ匕ピクチャの後ろ に続けて付加することによって、特殊再生ストリームを生成する生成工程とを備えた ことを特徴とする映像データ処理方法。
[2] 上記解析工程は、上記抽出したフレーム内符号ィ匕ピクチャのデコーダバッファに関 する制御パラメータを解析し、
上記変更工程は、伝送された上記特殊再生ストリームがデコーダバッファで破綻に 至らないように、上記デコーダバッファに関する制御パラメータを変更する
ことを特徴とする請求項 1記載の映像データ処理方法。
[3] 上記変更工程は、上記特殊再生ストリームを構成するフレーム内符号ィ匕ピクチャお よびリピートピクチャのデコーダバッファに関する制御パラメータを、上記抽出された フレーム内符号ィ匕ピクチャの上記解析されたデコーダバッファ制御用パラメータ、な らびに上記映像ストリームの転送レート、および生成する特殊再生ストリームの転送レ ートから導出することを特徴とする請求項 2記載の映像データ処理方法。
[4] 上記変更工程は、上記特殊再生ストリームを構成するフレーム内符号ィ匕ピクチャお よびリピートピクチャのデコーダバッファに関する制御パラメータを、上記映像ストリー ムおよび生成する特殊再生ストリームの符号化構成によらず、有意な固定値とするこ とを特徴とする請求項 2記載の映像データ処理方法。
[5] 上記特殊再生ストリームの発生する符号量が、目標とする転送レート以下と予想さ れる場合は、スタッフイングにより上記目標とする転送レートに合わせ、上記特殊再生 ストリームの発生する符号量が、上記目標とする転送レートを上回ると予想される場 合は、上記目標とする転送レートを一時的に上げる工程をさらに備えたことを特徴と する請求項 1記載の映像データ処理方法。
[6] フレーム間予測を用いて符号ィ匕された映像ストリームに対して、再生速度および再 生方向を変更した特殊再生ストリームを生成する映像データ処理装置であって、 生成する特殊再生ストリームの速度と方向に合わせて、上記映像ストリーム力 フレ ーム内符号ィ匕ピクチャを選択的に抽出する手段と、
上記抽出されたフレーム内符号ィ匕ピクチャの符号化パラメータを解析する解析手 段と、
上記速度と方向に合わせて、上記符号化パラメータを変更する変更手段と、 上記抽出されたフレーム内符号ィ匕ピクチャと同じ表示内容を示すリピートピクチャを 生成し、上記リピートピクチャを、データの伝送順で上記再生速度および再生方向に 基づいて選択される上記符号ィ匕パラメータを変更したフレーム内符号ィ匕ピクチャの後 ろに続けて付加することによって、特殊再生ストリームを生成する生成手段とを備えた ことを特徴とする映像データ処理装置。
[7] 上記解析手段は、上記抽出したフレーム内符号ィ匕ピクチャのデコーダバッファに関 する制御パラメータを解析し、
上記変更手段は、伝送された上記特殊再生ストリームがデコーダバッファで破綻に 至らないように、上記デコーダバッファに関する制御パラメータを変更する
ことを特徴とする請求項 6記載の映像データ処理装置。
[8] 上記変更手段は、上記特殊再生ストリームを構成するフレーム内符号ィ匕ピクチャお よびリピートピクチャのデコーダバッファに関する制御パラメータを、上記抽出された フレーム内符号ィ匕ピクチャの上記解析されたデコーダバッファ制御用パラメータ、な らびに上記映像ストリームの転送レート、および生成する特殊再生ストリームの転送レ ートから導出することを特徴とする請求項 7記載の映像データ処理装置。
[9] 上記変更手段は、上記特殊再生ストリームを構成するフレーム内符号ィ匕ピクチャお よびリピートピクチャのデコーダバッファに関する制御パラメータを、上記映像ストリー ムおよび生成する特殊再生ストリームの符号化構成によらず、有意な固定値とするこ とを特徴とする請求項 7記載の映像データ処理装置。
上記特殊再生ストリームの発生する符号量が、目標とする転送レート以下と予想さ れる場合は、スタッフイングにより上記目標とする転送レートに合わせ、上記特殊再生 ストリームの発生する符号量が、上記目標とする転送レートを上回ると予想される場 合は、上記目標とする転送レートを一時的に上げる手段をさらに備えたことを特徴と する請求項 6記載の映像データ処理装置。
PCT/JP2004/012976 2003-12-19 2004-09-07 映像データ処理方法および映像データ処理装置 WO2005062614A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US10/583,276 US7613381B2 (en) 2003-12-19 2004-09-07 Video data processing method and video data processing apparatus
EP04787680.0A EP1699240B1 (en) 2003-12-19 2004-09-07 Video data processing method and video data processing device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003-422024 2003-12-19
JP2003422024A JP4118232B2 (ja) 2003-12-19 2003-12-19 映像データ処理方法および映像データ処理装置

Publications (1)

Publication Number Publication Date
WO2005062614A1 true WO2005062614A1 (ja) 2005-07-07

Family

ID=34708725

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/012976 WO2005062614A1 (ja) 2003-12-19 2004-09-07 映像データ処理方法および映像データ処理装置

Country Status (4)

Country Link
US (1) US7613381B2 (ja)
EP (1) EP1699240B1 (ja)
JP (1) JP4118232B2 (ja)
WO (1) WO2005062614A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1889481A1 (en) * 2005-04-25 2008-02-20 Nokia Corporation Method and device for compressed domain video editing
EP1968318A1 (en) * 2005-12-27 2008-09-10 Mitsubishi Electric Corporation Distributing apparatus and reproducer
CN112738635A (zh) * 2020-12-28 2021-04-30 上海掌门科技有限公司 一种用于播放视频信息的方法与设备

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9456243B1 (en) 2003-06-06 2016-09-27 Arris Enterprises, Inc. Methods and apparatus for processing time-based content
WO2005043901A1 (ja) * 2003-11-04 2005-05-12 Sharp Kabushiki Kaisha レジューム再生システム
US8472792B2 (en) 2003-12-08 2013-06-25 Divx, Llc Multimedia distribution system
US7519274B2 (en) 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
WO2006027846A1 (ja) * 2004-09-10 2006-03-16 Matsushita Electric Industrial Co., Ltd. ザッピングストリームの生成装置とその方法
US7675872B2 (en) * 2004-11-30 2010-03-09 Broadcom Corporation System, method, and apparatus for displaying pictures
US20060280431A1 (en) * 2005-06-03 2006-12-14 Kirk Blattman Supporting trick modes in a streaming digital video environment using a root trick mode stream
EP1806919A1 (en) * 2006-01-05 2007-07-11 Alcatel Lucent Media delivery system with content-based trick play mode
US8630306B2 (en) * 2006-01-09 2014-01-14 At&T Intellectual Property I, L.P. Fast channel change apparatus and method for IPTV
JP5200204B2 (ja) 2006-03-14 2013-06-05 ディブエックス リミテッド ライアビリティー カンパニー 高信頼性システムを含む連合型デジタル権限管理機構
CN100551043C (zh) * 2007-02-08 2009-10-14 华为技术有限公司 一种快进快退播放视频数据的方法和流媒体服务器
US8566695B2 (en) 2007-03-30 2013-10-22 Sandisk Technologies Inc. Controlling access to digital content
JP5147278B2 (ja) * 2007-04-09 2013-02-20 株式会社日立製作所 映像配信装置およびキーフレーム配信方法
JP5189640B2 (ja) * 2007-08-09 2013-04-24 ジーブイビービー ホールディングス エス.エイ.アール.エル. ビデオデータの再生システム
EP2186328B1 (en) * 2007-08-29 2014-03-12 Thomson Licensing Method for generating video data for trick play
KR20100106327A (ko) 2007-11-16 2010-10-01 디브이엑스, 인크. 멀티미디어 파일을 위한 계층적 및 감소된 인덱스 구조
US8966103B2 (en) * 2007-12-21 2015-02-24 General Instrument Corporation Methods and system for processing time-based content
US8997161B2 (en) * 2008-01-02 2015-03-31 Sonic Ip, Inc. Application enhancement tracks
CN101540899B (zh) * 2008-03-19 2012-02-29 上海贝尔阿尔卡特股份有限公司 流媒体系统中的i帧解析方法和i帧解析器
CN102549557B (zh) 2009-01-07 2015-09-09 索尼克Ip股份有限公司 针对在线内容的媒体指南的特定化、集中式、自动化创建
CN101500117A (zh) * 2009-02-18 2009-08-05 腾讯科技(深圳)有限公司 一种视音频数据播放的控制方法及装置
US20100247066A1 (en) * 2009-03-30 2010-09-30 Samsung Electronics Co., Ltd. Method and apparatus for reverse playback of encoded multimedia content
US9769504B2 (en) * 2009-03-31 2017-09-19 Comcast Cable Communications, Llc Dynamic distribution of media content assets for a content delivery network
JP5723888B2 (ja) 2009-12-04 2015-05-27 ソニック アイピー, インコーポレイテッド 基本ビットストリーム暗号材料伝送システムおよび方法
JP5694674B2 (ja) * 2010-03-03 2015-04-01 株式会社メガチップス 画像符号化装置、画像符号化復号化システム、画像符号化方法、画像表示方法
US9247312B2 (en) 2011-01-05 2016-01-26 Sonic Ip, Inc. Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol
US8984144B2 (en) 2011-03-02 2015-03-17 Comcast Cable Communications, Llc Delivery of content
US8925021B2 (en) 2011-07-11 2014-12-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and system for trick play in over-the-top video delivery
US9467708B2 (en) 2011-08-30 2016-10-11 Sonic Ip, Inc. Selection of resolutions for seamless resolution switching of multimedia content
US8818171B2 (en) 2011-08-30 2014-08-26 Kourosh Soroushian Systems and methods for encoding alternative streams of video for playback on playback devices having predetermined display aspect ratios and network connection maximum data rates
KR101928910B1 (ko) 2011-08-30 2018-12-14 쏘닉 아이피, 아이엔씨. 복수의 최대 비트레이트 레벨들을 사용하여 인코딩된 비디오를 인코딩하고 스트리밍하기 위한 시스템들 및 방법들
US8964977B2 (en) 2011-09-01 2015-02-24 Sonic Ip, Inc. Systems and methods for saving encoded media streamed using adaptive bitrate streaming
US8909922B2 (en) 2011-09-01 2014-12-09 Sonic Ip, Inc. Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
US20130179199A1 (en) 2012-01-06 2013-07-11 Rovi Corp. Systems and methods for granting access to digital content using electronic tickets and ticket tokens
JP5938655B2 (ja) * 2012-01-11 2016-06-22 パナソニックIpマネジメント株式会社 再生装置、撮像装置およびプログラム
US8396983B1 (en) 2012-03-13 2013-03-12 Google Inc. Predictive adaptive media streaming
US8407747B1 (en) * 2012-03-13 2013-03-26 Google Inc. Adaptive trick play streaming
JP2013232697A (ja) 2012-04-27 2013-11-14 Sony Corp コンテンツ転送装置及びコンテンツ転送方法、コンテンツ再生装置及びコンテンツ再生方法、コンテンツ配信システム、並びにコンピューター・プログラム
US9197685B2 (en) * 2012-06-28 2015-11-24 Sonic Ip, Inc. Systems and methods for fast video startup using trick play streams
US9143812B2 (en) 2012-06-29 2015-09-22 Sonic Ip, Inc. Adaptive streaming of multimedia
US10452715B2 (en) 2012-06-30 2019-10-22 Divx, Llc Systems and methods for compressing geotagged video
EP2875417B1 (en) 2012-07-18 2020-01-01 Verimatrix, Inc. Systems and methods for rapid content switching to provide a linear tv experience using streaming content distribution
EP3796660A1 (en) * 2012-09-04 2021-03-24 TiVo Solutions Inc. Wireless media streaming system
US8997254B2 (en) 2012-09-28 2015-03-31 Sonic Ip, Inc. Systems and methods for fast startup streaming of encrypted multimedia content
US8914836B2 (en) 2012-09-28 2014-12-16 Sonic Ip, Inc. Systems, methods, and computer program products for load adaptive streaming
JP2014093733A (ja) * 2012-11-06 2014-05-19 Nippon Telegr & Teleph Corp <Ntt> 映像配信装置、映像再生装置、映像配信プログラム及び映像再生プログラム
US9191457B2 (en) 2012-12-31 2015-11-17 Sonic Ip, Inc. Systems, methods, and media for controlling delivery of content
US9264475B2 (en) 2012-12-31 2016-02-16 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US9313510B2 (en) 2012-12-31 2016-04-12 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US10397292B2 (en) 2013-03-15 2019-08-27 Divx, Llc Systems, methods, and media for delivery of content
US9906785B2 (en) 2013-03-15 2018-02-27 Sonic Ip, Inc. Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata
US9344517B2 (en) 2013-03-28 2016-05-17 Sonic Ip, Inc. Downloading and adaptive streaming of multimedia content to a device with cache assist
US20140344861A1 (en) 2013-05-14 2014-11-20 Tivo Inc. Method and system for trending media programs for a user
US9094737B2 (en) 2013-05-30 2015-07-28 Sonic Ip, Inc. Network video streaming with trick play based on separate trick play files
US9247317B2 (en) 2013-05-30 2016-01-26 Sonic Ip, Inc. Content streaming with client device trick play index
US9967305B2 (en) 2013-06-28 2018-05-08 Divx, Llc Systems, methods, and media for streaming media content
US9343112B2 (en) 2013-10-31 2016-05-17 Sonic Ip, Inc. Systems and methods for supplementing content from a server
US9866878B2 (en) 2014-04-05 2018-01-09 Sonic Ip, Inc. Systems and methods for encoding and playing back video at different frame rates using enhancement layers
KR20150121459A (ko) * 2014-04-21 2015-10-29 삼성전자주식회사 VoD 서비스를 제공하는 서버 장치 및 클라이언트 장치와 그 서비스 제공 방법
US9813777B1 (en) * 2015-02-27 2017-11-07 Cox Communications, Inc. Time shifting content for network DVR and trick play keys
US10075292B2 (en) 2016-03-30 2018-09-11 Divx, Llc Systems and methods for quick start-up of playback
US10148989B2 (en) 2016-06-15 2018-12-04 Divx, Llc Systems and methods for encoding video content
KR20180092163A (ko) * 2017-02-08 2018-08-17 삼성전자주식회사 비디오 재생을 위한 전자 장치 및 서버
US10498795B2 (en) 2017-02-17 2019-12-03 Divx, Llc Systems and methods for adaptive switching between multiple content delivery networks during adaptive bitrate streaming
KR102413839B1 (ko) * 2017-11-15 2022-06-28 삼성전자 주식회사 컨텐츠 제공장치, 그 제어방법 및 기록매체
JP2019208280A (ja) * 2019-08-16 2019-12-05 サターン ライセンシング エルエルシーSaturn Licensing LLC テレビ受信機、表示装置、並びに装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001359072A (ja) * 2000-06-14 2001-12-26 Sony Corp データ変換装置及び方法、データ配信装置及び方法、データ配信システム
JP2002077827A (ja) * 2000-06-14 2002-03-15 Sony Corp データ配信装置及び方法、データ配信システム
JP2002112194A (ja) * 2000-09-29 2002-04-12 Sony Corp データ処理方法及び装置、データ伝送システム、伝送媒体

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3289045B2 (ja) * 1994-04-12 2002-06-04 三菱電機株式会社 ディジタル記録再生装置
JP3304634B2 (ja) 1994-09-21 2002-07-22 三菱電機株式会社 ディジタル信号再生装置
US6219381B1 (en) * 1997-05-26 2001-04-17 Kabushiki Kaisha Toshiba Image processing apparatus and method for realizing trick play
JP2001028748A (ja) * 1999-07-12 2001-01-30 Sony Corp データ再生伝送装置及びデータ再生伝送方法
US7333711B2 (en) * 2000-06-14 2008-02-19 Sony Corporation Data distribution apparatus and method, and data distribution system
JP2002077811A (ja) 2000-08-24 2002-03-15 Sony Corp データ処理方法及び装置、データ伝送システム、伝送媒体
JP4337248B2 (ja) * 2000-08-31 2009-09-30 ソニー株式会社 画像情報の伝送装置、伝送システムおよび伝送方法
US7024098B2 (en) * 2003-05-05 2006-04-04 Thomson Licensing Reverse trick modes on progressive video using special groups of pictures
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001359072A (ja) * 2000-06-14 2001-12-26 Sony Corp データ変換装置及び方法、データ配信装置及び方法、データ配信システム
JP2002077827A (ja) * 2000-06-14 2002-03-15 Sony Corp データ配信装置及び方法、データ配信システム
JP2002112194A (ja) * 2000-09-29 2002-04-12 Sony Corp データ処理方法及び装置、データ伝送システム、伝送媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1889481A1 (en) * 2005-04-25 2008-02-20 Nokia Corporation Method and device for compressed domain video editing
EP1889481A4 (en) * 2005-04-25 2010-03-10 Nokia Corp METHOD AND DEVICE FOR EDITING COMPRESSED DOMAIN VIDEO
EP1968318A1 (en) * 2005-12-27 2008-09-10 Mitsubishi Electric Corporation Distributing apparatus and reproducer
EP1968318A4 (en) * 2005-12-27 2009-08-05 Mitsubishi Electric Corp DISTRIBUTION AND REPRODUCTIVE APPARATUS
CN112738635A (zh) * 2020-12-28 2021-04-30 上海掌门科技有限公司 一种用于播放视频信息的方法与设备
CN112738635B (zh) * 2020-12-28 2023-05-05 上海掌门科技有限公司 一种用于播放视频信息的方法与设备

Also Published As

Publication number Publication date
EP1699240A4 (en) 2013-04-10
JP4118232B2 (ja) 2008-07-16
US7613381B2 (en) 2009-11-03
EP1699240B1 (en) 2017-11-08
EP1699240A1 (en) 2006-09-06
US20070140647A1 (en) 2007-06-21
JP2005184429A (ja) 2005-07-07

Similar Documents

Publication Publication Date Title
JP4118232B2 (ja) 映像データ処理方法および映像データ処理装置
KR100711635B1 (ko) 화상 부호화 방법
JP4538908B2 (ja) データ変換装置及び方法
KR100945548B1 (ko) 비디오 오류 회복
JP5489675B2 (ja) 映像情報再生方法及びシステム、並びに映像情報コンテンツ
US20060143669A1 (en) Fast channel switching for digital TV
US20090064242A1 (en) Fast channel switching for digital tv
KR101712102B1 (ko) Rtsp 세션에 기초해 스트리밍 데이터를 송수신하는 방법 및 장치
WO2007004395A1 (ja) 再生装置、ビデオ復号装置、同期再生方法、プログラム及び記録媒体
EP1879346A1 (en) System and method of audio/video streaming
US20030128765A1 (en) Receiving apparatus
JP4613860B2 (ja) Mpeg符号化ストリーム復号装置
JP4295079B2 (ja) 特殊映像データ処理方法及び特殊映像データ処理装置及び特殊映像データ処理システム
KR100975170B1 (ko) 화상 데이터 재생 장치 및 방법
JP2002199344A (ja) マルチメディア情報送信サーバ装置
JP6641344B2 (ja) 符号化装置
US8401086B1 (en) System and method for increasing responsiveness to requests for streaming media
JP3583977B2 (ja) デジタルビデオ再生装置
KR20040010173A (ko) 화상 데이터 재생 장치 및 방법
JP2013219513A (ja) 画像データ送信装置、画像データ送信方法および画像データ送信プログラム
JP4350638B2 (ja) 映像記録装置
JPH099215A (ja) データ多重方法、データ伝送方法、及び多重データ復号方法、多重データ復号装置
JP5100852B2 (ja) デジタル信号記録再生装置および方法、デジタル信号再生装置および方法
JP2004193961A (ja) 映像伝送システム
JP2009049855A (ja) コンテンツ再生装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2007140647

Country of ref document: US

Ref document number: 10583276

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

REEP Request for entry into the european phase

Ref document number: 2004787680

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2004787680

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: DE

WWP Wipo information: published in national office

Ref document number: 2004787680

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 10583276

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: JP