JP2008067179A - Receiver and coded data reproduction method - Google Patents
Receiver and coded data reproduction method Download PDFInfo
- Publication number
- JP2008067179A JP2008067179A JP2006244321A JP2006244321A JP2008067179A JP 2008067179 A JP2008067179 A JP 2008067179A JP 2006244321 A JP2006244321 A JP 2006244321A JP 2006244321 A JP2006244321 A JP 2006244321A JP 2008067179 A JP2008067179 A JP 2008067179A
- Authority
- JP
- Japan
- Prior art keywords
- offset
- time information
- display time
- buffer
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
- H04N21/44004—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/23406—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving management of server-side video buffer
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
本発明は、受信装置および符号化データ再生方法に関し、具体的には、高能率符号化された動画像符号化データの復号方法であって、伝送路等の遅延によって規定通りの復号ができない場合に、より視覚的に良好な再生画像を表示する符号化データ再生装置および符号化データ再生方法に関する。 The present invention relates to a receiving apparatus and encoded data reproduction method, and more specifically, a decoding method for moving image encoded data that has been encoded with high efficiency, and when decoding as prescribed cannot be performed due to a delay in a transmission path or the like In particular, the present invention relates to an encoded data reproduction apparatus and an encoded data reproduction method for displaying a visually improved reproduction image.
近年、映像信号の配信手段が多様化しており、放送波だけでなくインターネットを使った動画配信も行われている。一般的に動画配信では限られた放送帯域や回線帯域を使用するために高能率符号化が行われる。例えば、オーディオ、ビデオそれぞれを高能率符号化し、時分割多重してMPEG2(Moving Pictures Experts Group2)トランスポートストリーム(以下ではMPEG2−TSと呼称する)として配信される。 In recent years, video signal distribution means have been diversified, and not only broadcast waves but also video distribution using the Internet has been performed. In general, high-efficiency encoding is performed in order to use a limited broadcast band or line band in moving image distribution. For example, audio and video are encoded with high efficiency, time division multiplexed, and distributed as an MPEG2 (Moving Pictures Experts Group 2) transport stream (hereinafter referred to as MPEG2-TS).
MPEG2−TS方式の場合、オーディオ、ビデオそれぞれの表示時刻を表すPTS(Presentation Time Stamp)や復号時刻を表すDTS(Decoding Time Stamp)、基準時刻情報を表すPCR(Program Clock Reference)が多重化されており、これらの時刻情報を用いて再生時刻の制御やオーディオとビデオの同期を確保している。このうち、PCRはSTC(System Time Clock)と呼ぶクロックを再生するための時刻情報で、伝送路の遅延が一定である場合に正確にSTCが再生できるように規定されている。受信装置では正確に再生されたSTCを基準として、PTSおよびDTSが示す時刻に該当するオーディオフレームやビデオフレームの再生表示や復号を行う。 In the case of the MPEG2-TS system, a PTS (Presentation Time Stamp) representing the display time of audio and video, a DTS (Decoding Time Stamp) representing the decoding time, and a PCR (Program Clock Reference) representing the reference time information are multiplexed. The time information is used to control playback time and to synchronize audio and video. Among these, PCR is time information for reproducing a clock called STC (System Time Clock), and is defined so that an STC can be accurately reproduced when a delay of a transmission path is constant. The receiving apparatus reproduces and displays and decodes audio frames and video frames corresponding to the times indicated by the PTS and DTS with reference to the correctly reproduced STC.
インターネットを使った動画配信では、配信されるデータに対して十分な伝送速度が得られないことがある。この場合、PCRを含む配信データは遅延を伴って伝送され、STCが正確に再生されないことがある。STCが正確に再生できない場合、出力のずれやビデオ出力の同期信号の劣化によって再生画像自体が劣化してしまうという問題がある。 In moving image distribution using the Internet, a sufficient transmission speed may not be obtained for distributed data. In this case, distribution data including PCR is transmitted with a delay, and the STC may not be reproduced accurately. When the STC cannot be reproduced accurately, there is a problem that the reproduced image itself is deteriorated due to the output deviation or the deterioration of the synchronization signal of the video output.
このような問題を解決するために、特許文献1では、PCRの受信タイミングが規定通りでない場合にも良好な再生画像を得るようにしている。即ち、特許文献1では、受信した再生データ中のビデオのフレーム数をカウントし、バッファに30フレーム毎の受信データを蓄積すると共に30フレーム分のデータ量を測定し、30フレーム分の再生データを30フレーム期間にわたって均一レートでデコーダに供給するものである。 In order to solve such a problem, Japanese Patent Application Laid-Open No. H10-228688 obtains a good reproduced image even when the PCR reception timing is not as specified. That is, in Patent Document 1, the number of video frames in the received reproduction data is counted, the reception data for every 30 frames is accumulated in the buffer, the data amount for 30 frames is measured, and the reproduction data for 30 frames is stored. The data is supplied to the decoder at a uniform rate over a period of 30 frames.
図5は、特許文献1におけるバッファの入出力タイミングを示しており、図5(A)は入力タイミング、図5(B)はデコーダへの出力タイミングである。
図5(A)に示すように、30フレーム分の再生データは一定ではないため、入力に要する時間も一定ではない。受信装置では、30フレーム分の符号量から30フレーム分の再生データの転送レートを求め、図5(B)に示すように30フレーム期間にわたって一定間隔でデコーダに出力する。
FIG. 5 shows the input / output timing of the buffer in Patent Document 1. FIG. 5A shows the input timing, and FIG. 5B shows the output timing to the decoder.
As shown in FIG. 5 (A), the playback data for 30 frames is not constant, so the time required for input is not constant. In the receiving apparatus, the transfer rate of the reproduction data for 30 frames is obtained from the code amount for 30 frames, and is output to the decoder at regular intervals over a period of 30 frames as shown in FIG.
このようにして、特許文献1では、伝送路で遅延が発生し、受信装置への入力タイミングが変化した場合でもデコーダへの転送レートは変化しない。即ち、PCRに遅延があっても遅延を吸収するように再生データを均一化してデコードに転送しようとするものである。
しかしながら、インターネットを介した動画配信では、極端な伝送遅延や定常的な伝送路の転送レート不足が想定される。このような状況下においては、特許文献1の技術であっても、デコーダに十分な再生データを供給できない。 However, in the distribution of moving images via the Internet, extreme transmission delays and steady transmission line transfer rate shortages are assumed. Under such circumstances, even with the technique of Patent Document 1, sufficient reproduction data cannot be supplied to the decoder.
図6は、特許文献1において、定常的に伝送路の転送レートが不足している場合の動作を示しており、図6(A)は入力タイミング、図6(B)はデコーダへの出力タイミングである。
定常的に伝送路の転送レートが不足している場合には、図6(A)に示すように30フレーム分の再生データの入力に、30フレーム期間よりも長い時間がかかるので、図6(B)に示すように、30フレーム分の再生データを30フレーム期間でデコーダに出力しようとすると、再生データを出力できない期間が生じる。
FIG. 6 shows an operation when the transfer rate of the transmission line is constantly insufficient in Patent Document 1, FIG. 6 (A) is the input timing, and FIG. 6 (B) is the output timing to the decoder. It is.
When the transfer rate of the transmission path is steadily insufficient, as shown in FIG. 6A, it takes a longer time than 30 frames to input the reproduction data for 30 frames. As shown in B), when 30 frames of reproduction data is output to the decoder in a 30 frame period, a period during which the reproduction data cannot be output occurs.
図6(B)に示すように、再生データがデコーダに入力されない期間がある場合は、STCに対してDTSやPTSが大きく遅れ、符号化時の想定通りの処理では正常に再生表示ができない問題がでてくる。また、符号化データが全くデコーダに供給されない期間があるため、この期間は再生画像が全く更新されないという問題がある。 As shown in FIG. 6B, when there is a period during which reproduction data is not input to the decoder, DTS and PTS are greatly delayed with respect to STC, and normal reproduction and display cannot be performed by processing as expected at the time of encoding. Comes out. In addition, since there is a period during which no encoded data is supplied to the decoder, there is a problem in that the reproduced image is not updated at all during this period.
本発明は、上述のような実情を考慮してなされたものであって、伝送路の帯域不足や、一時的な遅延によって符号化データの伝送レートが符号化時の規定から大きくはずれている場合においても、視覚的に良好な再生画像を出力する受信装置および符号化データ再生方法を提供することを目的とする。 The present invention has been made in consideration of the above-described circumstances, and the transmission rate of encoded data is greatly deviated from the encoding specification due to insufficient bandwidth of the transmission path or temporary delay. In the present invention, it is an object to provide a receiving apparatus and an encoded data reproduction method for outputting a visually reproduced image.
上述の課題を解決するため、本発明の受信装置および符号化データ再生方法は、次のような構成とする。
この受信装置は、オーディオデータとビデオデータの少なくとも一方を含み、基準時刻情報と、前記オーディオデータあるいは前記ビデオデータの表示時刻情報とを含む符号化データから、前記基準時刻情報を基に基準クロックを再生し、該基準クロックと前記表示時刻情報が一致する時刻に前記表示時刻情報に対応する前記オーディオデータあるいは前記ビデオデータを再生する受信装置であって、前記オーディオデータ、前記ビデオデータ、前記符号化データのうち少なくとも1つを格納するバッファと、前記オーディオデータあるいは前記ビデオデータを入力して、表示時刻情報を抽出するPTS抽出手段と、前記バッファのバッファ占有率と予め設定している上限の閾値及び下限の閾値とを比較してオフセットを設定するオフセット設定手段と、前記オフセット設定手段で設定されたオフセットと前記PTS抽出手段で抽出した表示時刻情報とに基づいて、前記オーディオデータあるいは前記ビデオデータの表示時刻を制御するデコード制御手段とを備えるものである。
In order to solve the above-described problems, the receiving apparatus and the encoded data reproduction method of the present invention are configured as follows.
The receiving apparatus includes at least one of audio data and video data, and generates a reference clock based on the reference time information from encoded data including reference time information and display time information of the audio data or the video data. A receiving device that reproduces and reproduces the audio data or the video data corresponding to the display time information at a time when the reference clock and the display time information coincide with each other, the audio data, the video data, and the encoding A buffer for storing at least one of the data, a PTS extracting means for inputting the audio data or the video data and extracting display time information, a buffer occupancy of the buffer, and a preset upper threshold And the offset to set the offset by comparing with the lower threshold And a decoding control means for controlling the display time of the audio data or the video data based on the offset set by the offset setting means and the display time information extracted by the PTS extraction means. is there.
ここで、前記オフセット設定手段は、前記バッファのバッファ占有率が前記下限の閾値以下になると正のオフセットを設定し、バッファ占有率が前記上限の閾値以上になると負のオフセットを設定し、前記デコーダ制御手段は、前記表示時刻情報にオフセットを加算して、正のオフセットのときには、表示時刻を遅らせ、負のオフセットのときには、表示時刻を早くするものであってもよいし、
また、前記バッファのバッファ占有率が前記下限の閾値以下になると負のオフセットを設定し、バッファ占有率が前記上限の閾値以上になると正のオフセットを設定し、前記デコーダ制御手段は、前記表示時刻情報からオフセットを減算して、負のオフセットのときには、表示時刻を遅らせ、正のオフセットのときには、表示時刻を早くするものであってもよい。
Here, the offset setting means sets a positive offset when the buffer occupancy of the buffer falls below the lower limit threshold, sets a negative offset when the buffer occupancy exceeds the upper limit threshold, and the decoder The control means may add an offset to the display time information, delay the display time when the offset is positive, and advance the display time when the offset is negative.
Further, when the buffer occupancy rate of the buffer becomes equal to or lower than the lower limit threshold value, a negative offset is set, and when the buffer occupancy rate becomes equal to or higher than the upper limit threshold value, a positive offset is set. By subtracting the offset from the information, the display time may be delayed when the offset is negative, and the display time may be advanced when the offset is positive.
さらに、前記オフセットは、表示フレーム間隔の定数倍としてもよい。 Further, the offset may be a constant multiple of the display frame interval.
また、この符号化データ再生方法は、オーディオデータとビデオデータの少なくとも一方を含み、基準時刻情報と、前記オーディオデータあるいは前記ビデオデータの表示時刻情報とを含む符号化データから、前記基準時刻情報を基に基準クロックを再生し、該基準クロックと前記表示時刻情報が一致する時刻に前記表示時刻情報に対応する前記オーディオデータあるいは前記ビデオデータを再生する符号化データ再生方法であって、前記オーディオデータ、前記ビデオデータ、前記符号化データのうち少なくとも1つをバッファに格納し、前記バッファにバッファ占有率の下限の閾値と上限の閾値を設定し、バッファ占有率が前記下限の閾値以下になると前記表示時刻情報に正のオフセットを付加して表示時刻を遅らせ、バッファ占有率が前記上限の閾値以上になると前記表示時刻情報に負のオフセットを付加して表示時刻を早くするようにしてもよいし、 The encoded data reproduction method includes at least one of audio data and video data, and the reference time information is obtained from encoded data including reference time information and display time information of the audio data or the video data. An encoded data reproduction method for reproducing the audio data or the video data corresponding to the display time information at a time when the reference clock and the display time information coincide with each other. , Storing at least one of the video data and the encoded data in a buffer, setting a lower limit threshold and an upper limit threshold of the buffer occupancy in the buffer, and when the buffer occupancy is equal to or lower than the lower limit threshold, Add a positive offset to the display time information to delay the display time, and the buffer occupancy By adding a negative offset may be quickly display time on the display time information and becomes more serial upper threshold,
また、この符号化データ再生方法は、オーディオデータとビデオデータの少なくとも一方を含み、基準時刻情報と、前記オーディオデータあるいは前記ビデオデータの表示時刻情報とを含む符号化データから、前記基準時刻情報を基に基準クロックを再生し、該基準クロックと前記表示時刻情報が一致する時刻に前記表示時刻情報に対応する前記オーディオデータあるいは前記ビデオデータを再生する符号化データ再生方法であって、前記オーディオデータ、前記ビデオデータ、前記符号化データのうち少なくとも1つをバッファに格納し、該バッファにバッファ占有率の下限の閾値と上限の閾値を設定し、バッファ占有率が前記下限の閾値以下になると前記基準時刻情報に負のオフセットを付加して表示時刻を遅らせ、バッファ占有率が前記上限の閾値以上になると前記基準時刻情報に正のオフセットを付加して表示時刻を早くするものであってもよい。
さらに、前記オフセットは、表示フレーム間隔の定数倍としてもよい。
The encoded data reproduction method includes at least one of audio data and video data, and the reference time information is obtained from encoded data including reference time information and display time information of the audio data or the video data. An encoded data reproduction method for reproducing the audio data or the video data corresponding to the display time information at a time when the reference clock and the display time information coincide with each other. , Storing at least one of the video data and the encoded data in a buffer, and setting a lower limit threshold and an upper limit threshold of the buffer occupancy in the buffer, and when the buffer occupancy is equal to or lower than the lower limit threshold, The display time is delayed by adding a negative offset to the reference time information, and the buffer occupancy is It may be configured to quickly display time by adding a positive offset to the reference time information and equal to or larger than the upper limit threshold value.
Further, the offset may be a constant multiple of the display frame interval.
また、上述した構成の受信装置の各手段や符号化データ再生方法として、コンピュータを機能させるためのプログラムを作成しておき、または、そのプログラムをコンピュータ読み取り可能な記録媒体に記録しておき、このプログラムをコンピュータで実行することによっても上記課題を解決することができる。 Further, as each means of the receiving apparatus having the above-described configuration and the encoded data reproduction method, a program for causing the computer to function is created, or the program is recorded on a computer-readable recording medium. The above problem can also be solved by executing the program on a computer.
本発明によれば、符号化データ用バッファもしくはオーディオデータ用バッファやビデオデータ用バッファの占有率からPTSもしくはSTCを調節しているため、デコード処理の制御は調整されたPTSやSTCに従って行えばよい。従って、入力データレートが符号化時の想定から大きくずれている場合においても、全体の制御自体は通常の処理と共通化できる効果がある。 According to the present invention, since the PTS or STC is adjusted based on the occupation ratio of the encoded data buffer, audio data buffer, or video data buffer, the decoding process may be controlled according to the adjusted PTS or STC. . Therefore, even when the input data rate is greatly deviated from the assumption at the time of encoding, there is an effect that the entire control itself can be made common with normal processing.
また、PTSもしくはSTCを調節することによって、符号化データ用バッファ、オーディオデータ用バッファやビデオデータ用バッファの占有率が適正に保たれるため、オーバーフローやアンダーフローすることがなくなり、デコーダにはフレーム単位のオーディオデータやビデオデータを確実に入力することができるという効果もある。 Also, by adjusting the PTS or STC, the occupancy of the encoded data buffer, audio data buffer, and video data buffer is maintained appropriately, so that overflow and underflow do not occur, and the decoder has no frame. There is also an effect that audio data and video data in units can be input reliably.
以下、図面を参照して本発明の受信装置および符号化データ再生方法に係る好適な実施形態について詳細に説明する。 DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, exemplary embodiments according to a receiving device and an encoded data reproduction method of the invention will be described in detail with reference to the drawings.
図1は、本実施形態に係る受信装置の機能ブロック図であり、同図において、受信装置は、デマルチプレクサ部1、PCR検出部2、減算回路3、STC部4、VCXO(Voltage Controlled Xtal Oscillator:電圧制御水晶発振器)5、オーディオPTS抽出部6、オーディオバッファ7、ビデオバッファ8、ビデオPTS抽出部9、オフセット設定部10、加算回路11、加算回路12、オーディオデコーダ13、ビデオデコーダ14、デコード制御部15で構成される。
FIG. 1 is a functional block diagram of a receiving apparatus according to the present embodiment, in which the receiving apparatus includes a demultiplexer unit 1, a
以下、本実施形態に係る受信装置にMPEG2−TSが入力された場合の動作を説明する。 Hereinafter, an operation when MPEG2-TS is input to the receiving apparatus according to the present embodiment will be described.
まず、デマルチプレクサ部1は、入力されたMPEG2−TSデータをオーディオデータやビデオデータやPCRデータに分離する。
分離されたビデオデータは、ビデオバッファ8へ蓄積されるとともに、ビデオPTS抽出部9へ供給される。このビデオバッファ8では、ビデオバッファサイズに対して蓄積されているビデオデータの量、即ちバッファ占有率が出力される。
また、オーディオデータは、オーディオバッファ7へ蓄積されるとともに、オーディオPTS抽出部6へ供給される。このオーディオバッファ7についても、ビデオバッファ8のように、バッファ占有量を出力するようにしてもよい。
また、PCRデータは、PCR検出部2へ供給される。
First, the demultiplexer unit 1 separates the input MPEG2-TS data into audio data, video data, and PCR data.
The separated video data is stored in the
Audio data is stored in the audio buffer 7 and supplied to the audio PTS extraction unit 6. The audio buffer 7 may also output the buffer occupation amount like the
Further, the PCR data is supplied to the
PCR検出部2は、供給されたPCRデータからPCRを抽出する。
STC部4は、VXCO5から例えば27MHzのクロックを入力し、STCの値を発生し、このSTCの値を減算回路3に入力する。
この減算回路3は、STCの値と、PCR検出部2で検出した値との減算を行い、その減算結果をVCXO5にフィードバックし、フィードバック補償されたクロックがSTC部4に入力される。STC部4では、このフィードバック回路によって符号化側で想定されているクロックが正確に再生される。
The
The STC unit 4 receives, for example, a 27 MHz clock from the VXCO 5, generates an STC value, and inputs this STC value to the subtraction circuit 3.
The subtraction circuit 3 performs subtraction between the STC value and the value detected by the
オーディオPTS抽出部6は、デマルチプレクサ部1で分離されたオーディオデータを入力し、オーディオPTSを抽出して加算回路11に供給する。
ビデオPTS抽出部9は、デマルチプレクサ部1で分離されたビデオデータを入力し、ビデオPTSを抽出して加算回路12に供給する。
The audio PTS extraction unit 6 receives the audio data separated by the demultiplexer unit 1, extracts the audio PTS, and supplies it to the adder circuit 11.
The video PTS extraction unit 9 receives the video data separated by the demultiplexer unit 1, extracts the video PTS, and supplies it to the
オフセット設定部10は、ビデオバッファ8のバッファ占有率と予め設定している上限の閾値及び下限の閾値とを比較してオフセットの値を設定し、このオフセットを加算回路11及び12に供給し、加算回路11及び12ではそれぞれオーディオPTS、ビデオPTSと加算が行われ、加算後のオーディオPTSとビデオPTSはデコード制御部15に供給される。このオフセット設定部10の動作については後述する。
The offset setting
デコード制御部15は、オーディオバッファ7からオーディオデータの読み出しとオーディオデコーダ13でのオーディオデコードと再生、及びビデオバッファ8からビデオデータの読み出しとビデオデコーダ14でのビデオデコードと再生を制御する。
The
PCRデータは、ビデオデータやオーディオデータに多重化されることもある。この場合は、PCRを含むビデオデータやオーディオデータをビデオバッファ8やオーディオバッファ7に入力するとともに、PCR検出部2にも重複して入力する。
PCR data may be multiplexed with video data or audio data. In this case, video data and audio data including PCR are input to the
図2には、ビデオバッファ8のバッファ占有率の遷移とオフセットの設定例が示されている。図2の縦軸は、バッファ占有率を示し、(A)の点線はバッファがFULLであるバッファ占有率100%を示し、(B)と(C)の点線はそれぞれバッファ占有率の上限の閾値及び下限の閾値を示している。また、図2の横軸は、時間軸を示している。
FIG. 2 shows a setting example of the transition of the buffer occupancy ratio and the offset of the
オフセット設定部10では、バッファ占有率が下限の閾値(C)と上限の閾値(B)で示された範囲からはずれた場合に、この範囲に収まるようにオフセットを調節する。
また、図2の時間軸のt0〜t7は、ビデオデータを表示する時刻で、ビデオPTS検出部9で検出されたPTSで示される時刻である。
When the buffer occupancy deviates from the range indicated by the lower limit threshold value (C) and the upper limit threshold value (B), the offset setting
Also, t 0 to t 7 on the time axis in FIG. 2 are times when video data is displayed, which are times indicated by the PTS detected by the video PTS detector 9.
図2において、復号を開始する時にビデオデータを蓄積し、時刻t0に最初のビデオデータをデコードする。図2に示したバッファ占有率の遷移モデルは、簡単化のためにビデオバッファ8からのビデオデータ出力は瞬時に行われるものとして記載してある。
時刻t2からt7の期間の点線(D)は、仮に十分な回線速度が保たれていたとした場合の遷移を示し、実線(E)は、一時的に回線速度が低下し十分なビデオデータが入力されない場合の遷移を示している。
2, stores the video data when starting the decoding, to decode the first video data at time t 0. In the buffer occupation rate transition model shown in FIG. 2, for simplification, the video data output from the
From the time t 2 for a period of t 7 the dotted line (D) is, if a transition in the case where a sufficient line speed was to have been maintained, a solid line (E) is temporarily line speed is lowered enough video data The transition when no is input is shown.
実線(E)の遷移において、t3で下限の閾値(C)を下回り、以降の表示タイミングt4及びt5でも下限の閾値(C)を下回っている。この場合、デコード処理は行わずにバッファ占有率が下限の閾値(C)を超えるまでオフセットを増加させる。ここでは、オフセットは1単位が1フレーム期間に相当するものとする。 In the transition of the solid (E), below the threshold (C) of the lower limit at t 3, is below the lower limit of the threshold value (C) also display timing t 4 and t 5 after. In this case, without performing the decoding process, the offset is increased until the buffer occupancy exceeds the lower limit threshold (C). Here, one unit of offset corresponds to one frame period.
次に、図2を例にして、オフセットを増加させた場合のデコード制御部15の動作について説明する。
時刻t4において、オフセットが0から1に増加すると、デコード制御部15にはPTSとしてt(4+1)が入力され、本来時刻t4に再生されるビデオデータが時刻t5に再生されるように制御される。さらに時刻t5において、オフセットが1から2に増加すると、デコード制御部15にはPTSとしてt(4+2)が入力され、本来時刻t4に再生されるビデオデータが時刻t6に再生されるように制御される。また、本来t5に再生されるビデオデータが時刻t7に再生されるように制御される。
Next, the operation of the
When the offset increases from 0 to 1 at time t 4 , t (4 + 1) is input as the PTS to the
次に、図3には、回線速度が回復する場合のビデオバッファ8のバッファ占有率の遷移とオフセットの設定例が示されている。図2と同様に、図3の縦軸は、バッファ占有率を示し、(A)の点線はバッファがFULLであるバッファ占有率100%を示し、(B)と(C)の点線はそれぞれバッファ占有率の上限の閾値及び下限の閾値を示している。
Next, FIG. 3 shows a setting example of the transition of the buffer occupation rate and the offset of the
また、図3の横軸は、時間軸を示しており、時間軸のt7〜t13はビデオデータを表示する時刻で、ビデオPTS検出部9で検出されたPTSで示される時刻である。
また、時刻t11までの期間の点線(D)は、仮に十分な回線速度が保たれていたとした場合の遷移を示し、実線(E)は、十分なビデオデータが入力されたり、過供給された場合の遷移を示している。
Also, the horizontal axis of FIG. 3 indicates the time axis, and t 7 to t 13 on the time axis are times when video data is displayed, and are times indicated by the PTS detected by the video PTS detector 9.
The dotted line in the period up to time t 11 (D) is, if a transition in the case where a sufficient line speed was to have been maintained, a solid line (E) is or are entered enough video data is over-supplied The transition is shown.
図3において、時刻t7からt9ではバッファ占有率が下限の閾値(C)と上限の閾値(B)との範囲に収まっているので、オフセットが2のまま復号を継続する。即ち、規定よりも2フレーム遅れたタイミングで再生される状態を継続する。
時刻t10においては、バッファ占有率が上限の閾値(B)以上になっているので、オフセットを1減少させ、さらに時刻t11においてもバッファ占有率が上限の閾値(B)以上になっているので、オフセットをさらに1減少させる。
In FIG. 3, since the buffer occupancy is within the range between the lower limit threshold (C) and the upper limit threshold (B) from time t 7 to t 9 , decoding is continued with the offset being 2. That is, the state of being played back at a timing delayed by 2 frames from the standard is continued.
At time t 10, since the buffer occupancy is greater than or equal to the upper threshold (B), reduced 1 offset, which is the buffer occupancy than the upper threshold (B) even more time t 11 Therefore, the offset is further reduced by one.
次に、図3を例にして、時刻t7からt13の間のデコード制御部15の動作について説明する。
時刻t9まではオフセットが2なので、例えば時刻t8にはデコード制御部15にPTSとしてt(8+2)が入力され、本来時刻t8に再生されるビデオデータが時刻t10に再生されるように制御される。
Next, FIG. 3 as an example, the operation of the
Since the offset is 2 until time t 9 , for example, at time t 8 , t (8 + 2) is input to the
時刻t10において、オフセットが2から1に減少すると、デコード制御部15にPTSとしてt(10+1)が入力され、本来時刻t10に再生されるビデオデータが時刻t11に再生されるように制御される。
このとき、本来時刻t8に再生されるビデオデータを再生するように制御するとともに、次のフレームのビデオデータをビデオバッファ8から削除するように制御する。
When the offset decreases from 2 to 1 at time t 10 , t (10 + 1) is input as the PTS to the
At this time, control is performed so that the video data originally reproduced at time t 8 is reproduced, and the video data of the next frame is deleted from the
さらに、時刻t11において、オフセットが1から0に減少すると、デコード制御部15にはPTSとして本来のt11が入力される。ここでは、本来時刻t10に再生されるビデオデータが再生され、時刻t11に再生されるビデオデータはビデオバッファ8から削除される。
Furthermore, when the offset decreases from 1 to 0 at time t 11 , the original t 11 is input to the
ビデオデータが高能率符号化されている場合、ビデオデータをそのままバッファから削除すると前後のビデオフレームに影響することがあるので、バッファから削除はせずにデコードを行っても表示しないようにして、バッファから符号化データを取り除いたものとしてもよい。 If the video data is highly efficient encoded, deleting the video data from the buffer as it is may affect the previous and next video frames. The encoded data may be removed from the buffer.
次に、図4のフローチャートを用いて、オフセット設定およびデコード制御の動作を説明する。
まず、オフセットを0にリセットし、バッファ占有率の上限の閾値と下限の閾値を設定する(ステップS0401)。
STC部4で発生されたクロックとビデオPTS抽出部9で抽出されたビデオPTSとが等しい(ピクチャ再生時刻)かどうかを判定し、ピクチャ再生時刻でない場合には(ステップS0402/NO)、ピクチャ再生時刻まで待ち、一方、ピクチャ再生時刻の場合には(ステップS0402/YES)、バッファ占有率が上限の閾値以上かどうかを判定する(ステップS0403)。
Next, operations of offset setting and decoding control will be described using the flowchart of FIG.
First, the offset is reset to 0, and an upper limit threshold and a lower limit threshold of the buffer occupancy are set (step S0401).
It is determined whether or not the clock generated by the STC unit 4 and the video PTS extracted by the video PTS extraction unit 9 are equal (picture reproduction time). If it is not the picture reproduction time (step S0402 / NO), picture reproduction is performed. On the other hand, if it is the picture playback time (step S0402 / YES), it is determined whether or not the buffer occupancy is equal to or greater than the upper limit threshold (step S0403).
バッファ占有率が上限の閾値以上の場合(ステップS0403/YES)は、オフセットから1を減算し(ステップS0404)、ステップS0407へ進む。
一方、バッファ占有率が上限の閾値未満の場合(ステップS0403/NO)は、バッファ占有率が加減の閾値以下かどうかを判定する(ステップS0405)。
If the buffer occupancy is equal to or greater than the upper limit threshold (step S0403 / YES), 1 is subtracted from the offset (step S0404), and the process proceeds to step S0407.
On the other hand, if the buffer occupancy is less than the upper limit threshold (step S0403 / NO), it is determined whether the buffer occupancy is less than or equal to the threshold for adjustment (step S0405).
バッファ占有率が下限の閾値以下の場合(ステップS0405/YES)は、オフセットに1を加算し(ステップS0406)、ステップS0407へ進む。
他方、バッファ占有率が下限の閾値未満の場合(ステップS0405/NO)は、ステップS0407へ進む。
If the buffer occupancy is equal to or lower than the lower limit threshold (step S0405 / YES), 1 is added to the offset (step S0406), and the process proceeds to step S0407.
On the other hand, if the buffer occupancy is less than the lower limit threshold (step S0405 / NO), the process proceeds to step S0407.
そして、デコーダ制御部15は、オフセット付きのPTSに基づいてデコード及び表示制御を行い(ステップS0407)、デコード終了かどうかを判定し(ステップS0408)、デコードが終了するまでステップS0402〜S0408を繰り返す。
Then, the
上述した実施形態では、オフセットを1フレーム期間相当の値で増加もしくは減少させていたが、1フレーム期間相当の値の定数倍としても構わない。
また、バッファ占有率が上限の閾値以上あるいは下限の閾値以下かどうかを判定していたが、上限の閾値を超えるあるいは下限の閾値未満としても構わない。
また、ビデオバッファのバッファ占有率を用いて判定を行っていたが、オーディオバッファを用いても構わない。
また、符号化データ(MPEG2−TS)をそのまま蓄積するバッファを備え、該バッファの占有率を用いて判定を用いても構わない。
In the embodiment described above, the offset is increased or decreased by a value corresponding to one frame period, but may be a constant multiple of a value corresponding to one frame period.
Further, although it is determined whether the buffer occupancy is equal to or higher than the upper limit threshold or lower than the lower limit threshold, the buffer occupancy may exceed the upper limit threshold or be lower than the lower limit threshold.
Further, although the determination is made using the buffer occupation rate of the video buffer, an audio buffer may be used.
Further, a buffer for storing the encoded data (MPEG2-TS) as it is may be provided, and the determination may be performed using the occupation rate of the buffer.
さらに、上述の実施形態では、PTSにオフセットを付加していたが、STCに逆のオフセットをつけるようにしてもよい。 Furthermore, in the above-described embodiment, an offset is added to the PTS, but a reverse offset may be added to the STC.
以上のように、本実施形態を構成することによって、符号化データ用バッファもしくはオーディオデータ用バッファやビデオデータ用バッファの占有率からPTSもしくはSTCを調節しているため、デコード処理の制御は調整されたPTSやSTCに従って行えばよいので、入力データレートが符号化時の想定から大きくずれている場合においても、全体の制御自体は通常の処理と共通化できる効果がある。 As described above, by configuring the present embodiment, the PTS or STC is adjusted based on the occupation ratio of the encoded data buffer, the audio data buffer, or the video data buffer, so that the decoding process control is adjusted. Therefore, even when the input data rate is greatly deviated from the assumption at the time of encoding, the entire control itself can be shared with normal processing.
また、PTSもしくはSTCを調節することによって、符号化データ用バッファ、オーディオデータ用バッファやビデオデータ用バッファの占有率が適正に保たれるため、オーバーフローやアンダーフローすることがなくなり、デコーダにはフレーム単位のオーディオデータやビデオデータを確実に入力することができるという効果もある。 Also, by adjusting the PTS or STC, the occupancy of the encoded data buffer, audio data buffer, and video data buffer is maintained appropriately, so that overflow and underflow do not occur, and the decoder has no frame. There is also an effect that audio data and video data in units can be input reliably.
また、本発明の実施形態は、上記の受信装置の各部の機能をコンピュータプログラム化し、このコンピュータプログラムを受信装置へインストールして実行することでも実現される。また、このコンピュータプログラムを着脱可能な記録媒体に記録したり、ネットワークを介してダウンロードすることにより、移送が簡単になり容易に実施することができる。 The embodiment of the present invention can also be realized by converting the functions of the respective units of the above receiving apparatus into a computer program, and installing and executing the computer program on the receiving apparatus. Further, the computer program can be recorded on a detachable recording medium or downloaded via a network, so that the transfer can be simplified and implemented easily.
尚、本発明は上述した実施形態に限定されず、本発明の要旨を逸脱しない範囲内で各種の変形、修正が可能であるのは勿論である。 Note that the present invention is not limited to the above-described embodiment, and various modifications and corrections can be made without departing from the scope of the present invention.
1…デマルチプレクサ部、2…PCR検出部、3…減算回路、4…STC部、5…VCXO、6…オーディオPTS抽出部、7…オーディオバッファ、8…ビデオバッファ、9…ビデオPTS抽出部、10…オフセット設定部、11…加算回路、12…加算回路、13…オーディオデコーダ、14…ビデオデコーダ、15…デコード制御部。
DESCRIPTION OF SYMBOLS 1 ... Demultiplexer part, 2 ... PCR detection part, 3 ... Subtraction circuit, 4 ... STC part, 5 ... VCXO, 6 ... Audio PTS extraction part, 7 ... Audio buffer, 8 ... Video buffer, 9 ... Video PTS extraction part, DESCRIPTION OF
Claims (10)
前記オーディオデータ、前記ビデオデータ、前記符号化データのうち少なくとも1つを格納するバッファと、
前記オーディオデータあるいは前記ビデオデータを入力して、表示時刻情報を抽出するPTS抽出手段と、
前記バッファのバッファ占有率と予め設定している上限の閾値及び下限の閾値とを比較してオフセットを設定するオフセット設定手段と、
前記オフセット設定手段で設定されたオフセットと前記PTS抽出手段で抽出した表示時刻情報とに基づいて、前記オーディオデータあるいは前記ビデオデータの表示時刻を制御するデコード制御手段とを備えることを特徴とする受信装置。 A reference clock is reproduced based on the reference time information from encoded data including at least one of audio data and video data, and including reference time information and display time information of the audio data or the video data. A receiving device that reproduces the audio data or the video data corresponding to the display time information at a time when a clock and the display time information match;
A buffer for storing at least one of the audio data, the video data, and the encoded data;
PTS extraction means for inputting the audio data or the video data and extracting display time information;
An offset setting means for setting an offset by comparing a buffer occupation rate of the buffer with a preset upper limit threshold and a lower limit threshold;
And a decoding control means for controlling the display time of the audio data or the video data based on the offset set by the offset setting means and the display time information extracted by the PTS extraction means. apparatus.
前記オーディオデータ、前記ビデオデータ、前記符号化データのうち少なくとも1つをバッファに格納し、
該バッファにバッファ占有率の下限の閾値と上限の閾値を設定し、バッファ占有率が前記下限の閾値以下になると前記表示時刻情報に正のオフセットを付加して表示時刻を遅らせ、バッファ占有率が前記上限の閾値以上になると前記表示時刻情報に負のオフセットを付加して表示時刻を早くすることを特徴とする符号化データ再生方法。 A reference clock is reproduced based on the reference time information from encoded data including at least one of audio data and video data, and including reference time information and display time information of the audio data or the video data. An encoded data reproduction method for reproducing the audio data or the video data corresponding to the display time information at a time when a clock and the display time information coincide with each other,
Storing at least one of the audio data, the video data, and the encoded data in a buffer;
A lower limit threshold and an upper limit threshold for the buffer occupancy rate are set in the buffer, and when the buffer occupancy rate is equal to or lower than the lower limit threshold value, a positive offset is added to the display time information to delay the display time, and the buffer occupancy rate is An encoded data reproduction method characterized in that a negative offset is added to the display time information to make the display time earlier when the upper limit threshold is exceeded.
前記オーディオデータ、前記ビデオデータ、前記符号化データのうち少なくとも1つをバッファに格納し、
該バッファにバッファ占有率の下限の閾値と上限の閾値を設定し、バッファ占有率が前記下限の閾値以下になると前記基準時刻情報に負のオフセットを付加して表示時刻を遅らせ、バッファ占有率が前記上限の閾値以上になると前記基準時刻情報に正のオフセットを付加して表示時刻を早くすることを特徴とする符号化データ再生方法。 A reference clock is reproduced based on the reference time information from encoded data including at least one of audio data and video data, and including reference time information and display time information of the audio data or the video data. An encoded data reproduction method for reproducing the audio data or the video data corresponding to the display time information at a time when a clock and the display time information coincide with each other,
Storing at least one of the audio data, the video data, and the encoded data in a buffer;
A lower limit threshold and an upper limit threshold of the buffer occupancy rate are set in the buffer, and when the buffer occupancy rate falls below the lower limit threshold value, a negative offset is added to the reference time information to delay the display time, and the buffer occupancy rate A coded data reproduction method characterized in that a positive offset is added to the reference time information to make the display time earlier when the upper limit threshold is exceeded.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006244321A JP2008067179A (en) | 2006-09-08 | 2006-09-08 | Receiver and coded data reproduction method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006244321A JP2008067179A (en) | 2006-09-08 | 2006-09-08 | Receiver and coded data reproduction method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008067179A true JP2008067179A (en) | 2008-03-21 |
Family
ID=39289463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006244321A Pending JP2008067179A (en) | 2006-09-08 | 2006-09-08 | Receiver and coded data reproduction method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008067179A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015156604A (en) * | 2014-02-21 | 2015-08-27 | ルネサスエレクトロニクス株式会社 | content output device and program |
JP2018074480A (en) * | 2016-11-01 | 2018-05-10 | 日本放送協会 | Reception terminal and program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08251543A (en) * | 1995-03-14 | 1996-09-27 | Victor Co Of Japan Ltd | Reproduction system for picture and audio information |
JPH1093841A (en) * | 1996-09-11 | 1998-04-10 | Toshiba Corp | Video synchronizing signal correction device |
JP2001245292A (en) * | 2000-02-29 | 2001-09-07 | Japan Radio Co Ltd | Data receiver, date transmission receiving system and recording medium |
JP2004328423A (en) * | 2003-04-25 | 2004-11-18 | Toshiba Corp | System clock controller and control method of stream receiver |
-
2006
- 2006-09-08 JP JP2006244321A patent/JP2008067179A/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08251543A (en) * | 1995-03-14 | 1996-09-27 | Victor Co Of Japan Ltd | Reproduction system for picture and audio information |
JPH1093841A (en) * | 1996-09-11 | 1998-04-10 | Toshiba Corp | Video synchronizing signal correction device |
JP2001245292A (en) * | 2000-02-29 | 2001-09-07 | Japan Radio Co Ltd | Data receiver, date transmission receiving system and recording medium |
JP2004328423A (en) * | 2003-04-25 | 2004-11-18 | Toshiba Corp | System clock controller and control method of stream receiver |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015156604A (en) * | 2014-02-21 | 2015-08-27 | ルネサスエレクトロニクス株式会社 | content output device and program |
JP2018074480A (en) * | 2016-11-01 | 2018-05-10 | 日本放送協会 | Reception terminal and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3925311B2 (en) | Data distribution system | |
US9066061B2 (en) | Video information reproduction method and system, and video information content | |
US7280156B2 (en) | Process and device for synchronizing presentation of audio and/or video frames | |
KR100619007B1 (en) | Apparatus and method for controlling synchronization of video transport stream | |
US8798162B2 (en) | Encoding method, decoding method, encoder, and decoder | |
JP2010034995A (en) | Apparatus and method for playback of digital broadcast | |
US20150030088A1 (en) | Clock recovery for media stream in bursty network channel | |
JP2010212996A (en) | Information processing apparatus and multiplexing processing method | |
JP2006345223A (en) | Device and method for recording and output | |
JP6051847B2 (en) | Video information reproduction method and system | |
KR101600891B1 (en) | Synchronization method and system for audio and video of a plurality terminal | |
US7039114B2 (en) | Data separation and decoding device | |
US8854964B2 (en) | Method and apparatus for determining a transport bit rate for a Multiprogram transport stream | |
JP6891813B2 (en) | Information processing equipment, information processing methods, and programs | |
JP3846578B2 (en) | Information processing apparatus and method, recording medium, and program | |
JP2008067179A (en) | Receiver and coded data reproduction method | |
JP3299185B2 (en) | Encoding device | |
JP5848872B2 (en) | Broadcast receiver | |
KR20060041257A (en) | Exploitation of discontinuity indicator for trick mode operation | |
JP4475273B2 (en) | Information processing apparatus and method | |
JP5958008B2 (en) | Stream processing apparatus, stream processing method, and stream processing program | |
JP4874272B2 (en) | Video signal processing apparatus and video signal processing method | |
JP4212404B2 (en) | System clock control apparatus and system clock control method for stream receiver | |
JP2005130065A (en) | Transport stream multiplexer | |
JP2012016066A (en) | Video signal processor, and video signal processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100427 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100607 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101124 |