JP2004248199A - システム多重化装置 - Google Patents

システム多重化装置 Download PDF

Info

Publication number
JP2004248199A
JP2004248199A JP2003038467A JP2003038467A JP2004248199A JP 2004248199 A JP2004248199 A JP 2004248199A JP 2003038467 A JP2003038467 A JP 2003038467A JP 2003038467 A JP2003038467 A JP 2003038467A JP 2004248199 A JP2004248199 A JP 2004248199A
Authority
JP
Japan
Prior art keywords
audio
time
complete
pck
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003038467A
Other languages
English (en)
Inventor
Yoshinori Matsuura
慶典 松浦
Hiroshi Segawa
浩 瀬川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renesas Technology Corp
Original Assignee
Renesas Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renesas Technology Corp filed Critical Renesas Technology Corp
Priority to JP2003038467A priority Critical patent/JP2004248199A/ja
Priority to US10/677,228 priority patent/US7457525B2/en
Publication of JP2004248199A publication Critical patent/JP2004248199A/ja
Priority to US12/260,813 priority patent/US7873263B2/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23406Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving management of server-side video buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234318Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into objects, e.g. MPEG-4 objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】オーディオバッファにおけるオーバフローを防止しつつ、多重化ロスを軽減することが可能なシステム多重化装置を提供すること。
【解決手段】タイムゾーン開始時刻算出部11は、オーディオのビットレートに応じて、VOBU内に設定するタイムゾーンを算出する。タイムゾーン比較部12は、オーディオパックを多重する時刻と、タイムゾーン開始時刻算出部11によって算出されたタイムゾーンとを比較する。そして、フラグ設定部13は、タイムゾーン比較部12による比較結果に応じて、オーディオパックをコンプリートするか否かを設定する。したがって、VOBU境界よりも前にコンプリート処理が行なわれ、VOBU境界の直後にコンプリートPCKが生成されなくなり、バッファオーバフローが発生するのを防止することが可能となる。
【選択図】 図14

Description

【0001】
【発明の属する技術分野】
本発明は、デジタル圧縮された画像と音声とのデータを1つのストリームにするシステム多重化方式に関し、特に、オーディオデコーダのバッファにおけるオーバフローを防止したシステム多重化装置に関する。
【0002】
【従来の技術】
近年、半導体の性能向上に伴い、画像および音声をデジタル圧縮する方式が盛んに研究されるようになり、MPEG(Moving Picture Experts Group)など、画像・音声のデジタル圧縮の国際標準方式が定められた。それに伴い、デジタル圧縮を応用したデジタルTV放送やDVD(Digital Versatile Disc)などの映像記録再生装置が普及しつつある。
【0003】
動画と音声とを同時に扱う場合、デジタル圧縮された画像と音声とのデータを1つのストリームにするシステム多重化という処理が必要になる。このシステム多重化処理は、画像データと音声データとを小さな単位に分け、データ量と表示再生時刻とを考慮しながら、それぞれのデータを順番に並べて1つのストリームにまとめ上げる処理である。
【0004】
これに関連する技術として、特開平8−98160号公報に開示された技術がある。この特開平8−98160号公報に開示されたデータ多重化装置は、入力されるデジタル音声や動画像を符号化して符号化ストリームとして出力する複数の符号化器を備え、その複数の符号化ストリームを同時再生できるように多重化するものであり、各符号化ストリーム毎に仮想復号化バッファシミュレーションを行なってそのバッファ内のデータ占有量に基づいて多重化要求信号を出力する制御手段と、多重化要求信号に基づいて各符号化ストリームを多重化する多重化手段とを備えるものである。
【0005】
【特許文献1】
特開平8−98160号公報
【0006】
【発明が解決しようとする課題】
上述した特開平8−98160号公報に開示されたデータ多重化装置においては、各符号化ストリーム毎に仮想復号化バッファシミュレーションを行ない、そのバッファ内のデータ占有量に基づいて多重化を行なうものである。しかし、後述するように、VOBU(Video OBject Unit)境界のオーディオコンプリートを行なうと、オーディオデコーダのバッファにおいてオーバフローが発生するといった問題点があった。
【0007】
本発明は、上記問題点を解決するためになされたものであり、その目的は、オーディオバッファにおけるオーバフローを防止しつつ、多重化ロスを軽減することが可能なシステム多重化装置を提供することである。
【0008】
【課題を解決するための手段】
本発明のシステム多重化装置は、ビデオパックとオーディオパックとを多重して出力するシステム多重化装置であって、オーディオのビットレートに応じて、ビデオオブジェクトユニット内に設定するタイムゾーンを算出するための算出手段と、オーディオパックを多重する時刻と、算出手段によって算出されたタイムゾーンとを比較するための比較手段と、比較手段による比較結果に応じて、オーディオパックをコンプリートするか否かを設定するための設定手段とを含む。
【0009】
【発明の実施の形態】
図1は、システム多重化装置(以下、システム多重部とも呼ぶ。)を含んだ録画機(エンコーダ)および再生機(デコーダ)の概略構成を示すブロック図である。
【0010】
録画機は、画像データを符号化するビデオエンコーダ1と、音声データを符号化するオーディオエンコーダ2と、ビデオエンコーダ1から出力されたV−ES(Video−Elementary Stream)を一時的に蓄積するビデオバッファ3と、オーディオエンコーダ2から出力されたA−ES(Audio−Elementary Stream)を一時的に蓄積するオーディオバッファ4と、ビデオバッファ3およびオーディオバッファ4から出力されたV−ESおよびA−ESを多重化し、PS(Program Stream)として出力するシステム多重部5とを含む。
【0011】
また、再生機は、PSをV−ESおよびA−ESに分離するシステム分離部6と、システム分離部6によって分離されたV−ESを一時的に蓄積するビデオバッファ7と、システム分離部6によって分離されたA−ESを一時的に蓄積するオーディオバッファ8と、ビデオバッファ7から出力されたV−ESをデコードするビデオデコーダ9と、オーディオバッファ8から出力されたA−ESをデコードするオーディオデコーダ10とを含む。
【0012】
図2は、PSの構成の一例を示す図である。PSは、VOBUによって構成される。VOBUは、Audio、VideoおよびRDI(Real time Data Information)のPCKによって構成され、RDI_PCKから始まり、コンプリートされたV_PCK(Vc)およびA_PCK(Ac)で終わる。
【0013】
DVD−Video Recording規格(以下、DVD規格と呼ぶ。)においては、VOBU(GOP(Group Of Pictures):15枚程度の画像の単位)毎に画像および音声をフレームの単位で完結させるコンプリート処理が必要である。このコンプリート処理は、2KB(2048byte)のPCKに対し、ESが不足する部分をスタッフまたはパディングにより補填する処理である。
【0014】
図3は、DVD規格におけるPCK構成を示す図である。図3(a)は、通常のPCKの構成を示しており、14バイトのPack Headerと、14バイトのPacket Headerと、2020バイトのESとを含む。
【0015】
また、図3(b)は、スタッフが挿入されたVOBUコンプリートPCKの構成を示しており、14バイトのPack Headerと、14バイトのPacket Headerと、1〜7バイトのStuffと、任意の長さのESとを含む。
【0016】
また、図3(c)は、パディングが挿入されたVOBUコンプリートPCKの構成を示しており、14バイトのPack Headerと、14バイトのPacket Headerと、任意の長さのESと、8バイト以上のPadding Packetとを含む。
【0017】
DVD規格のように、VBR(Variable Bit Rate)制御を行なうビデオ符号化においては、1ピクチャの符号量が一定ではなく、VOBU境界はビデオの符号量に依存して、任意の時刻になるという特徴がある。
【0018】
また、再生専用のDVD−Videoと録画再生用のDVD−VRとの規格が異なるように、各アプリケーションによってシステム多重化の条件が規格化されている。DVD規格においては、デコーダのオーディオバッファ8のサイズとして、4KBが規定されている。
【0019】
図4は、デコーダのオーディオバッファの蓄積量の推移を示す図である。システム分離部6からのPCK出力によって、オーディオバッファ8にデータが入力され(蓄積量が上昇)、フレーム周期毎のデコード時刻にデータがオーディオデコーダ10へ出力される(蓄積量が下降)。4KBのオーディオバッファ8に対して、2KBのPCKをオーディオバッファ8に入力してオーバフロー/アンダーフローを起こさないように制御(オーディオバッファ制御)するために、2KBを中心に蓄積量を推移させる。
【0020】
このため、図4に示すように、オーディオバッファ8から一定レートでデータを引き抜くと仮定して仮想バッファ残量を計算し、仮想バッファ残量が1KBになったときに次のPCKをシステム分離部6から出力させる。以下、この方式を仮想バッファ制御方式と呼ぶ。
【0021】
図5は、システム多重部5の処理手順を説明するためのフローチャートである。システム多重部5は、1PCKを構成するに足るV−ESがビデオバッファ3にあるか否かをチェックする(S11)。ビデオバッファ3にV−ESが十分にある場合、システム多重部5は、PCK構成を図3のいずれにするかを決定する(S12)。
【0022】
次に、システム多重部5は、ビデオPACK構成において、VOBU境界が認識されてコンプリートPCKを構成したか、オーディオPCKもコンプリートすべきか否かを判定する(S13)。この処理の詳細は後述する。
【0023】
次に、システム多重部5は、V−ESと同様に、1PCKを構成するに足るA−ESがオーディオバッファ4にあるか否かをチェックする(S14)。オーディオバッファ4にA−ESが十分にある場合、システム多重部5は、PCK構成を図3のいずれにするかを決定する(S15)。
【0024】
次に、システム多重部5は、ビデオPCKおよびオーディオPCKのいずれを出力するかを判定する(S16)。最後に、システム多重部5は、選択されたビデオPCKまたはオーディオPCKを出力する(S17)。
【0025】
図6は、図5のステップS13の処理の詳細を説明するためのフローチャートである。まず、システム多重部5は、ビデオPAK構成がコンプリートPCKであるか否かを判定する(S21)。ビデオPCKがコンプリートPCKであれば(S21,Yes)、次のオーディオPCKをコンプリートPCKと判定して、オーディオコンプリートフラグに1を設定する(S22)。また、ビデオPCKがコンプリートPCKでなければ(S21,No)、次のオーディオPCKをコンプリートPCKでないと判定して、オーディオコンプリートフラグに0を設定する(S23)。以下、この方式をVOBU境界強制コンプリート方式と呼ぶ。
【0026】
図7は、AC−3における録画モード、音声記録モード、ビットレート、フレーム長およびPCK周期の関係を示す図である。たとえば、録画モードが高画質であり、音声記録モードが11の場合、ビットレートが384kbpsとなり、フレーム長が1536byteとなり、PCK周期が3788SCRとなる。
【0027】
図8は、仮想バッファ制御方式を、オーディオの1フレームが長いモード、たとえば図7の高画質モード(ビットレートが384kbps、フレーム長が1536byte)に適用した場合におけるバッファ推移を示す図である。デコーダは、バッファ蓄積量2KBを中心にして蓄積量の制御を行なうが、上下の振れ幅が大きくなり、オーディオバッファ8の上限、下限に対するマージンが小さくなってしまう。
【0028】
このような仮想バッファ制御方式において、オーディオフレームレングスが長い場合、いつ起こるかわからないVOBU境界によるコンプリート処理が、バッファ蓄積量が多いときに発生すると、バッファオーバフローが発生することがある。
【0029】
図9は、オーディオバッファにおいてオーバフローが発生する場合を説明するための図である。図9(a)は、ピクチャ周期が3003SCRのV−ESを示している。図9(b)は、オーディオフレームレングスが1536byte、フレーム周期が2880SCRのA−ESを示している。図9(c)は、オーディオPCK周期が3840SCRのPSを示している。図9(d)は、デコーダのオーディオバッファ8のバッファ推移を示している。
【0030】
図9(c)に示すように、VOBU境界が発生するときにコンプリートPCKが生成される。そのため、オーディオバッファ蓄積量が多いときにVOBU境界が発生すると、バッファオーバフローが起こることがある。
【0031】
図10は、図9を用いて説明した問題点を解決するための一例を示す図である。図10に示すように、全てのオーディオPCKをコンプリートすれば、VOBU境界が発生した場合に、新たなコンプリートPCKを生成する必要がなくなるため、バッファオーバフローを防止することができる。しかし、コンプリートPCKに挿入されるスタッフやパディングは意味のないデータであるため、多重化効率が低下するといった問題点がある。
【0032】
また、多重化効率を低下させずにバッファオーバフローを防止する方法として、オーディオコンプリート判定処理においてVOBU境界を事前に認識する方法がある。図11は、VOBU境界を事前に認識する処理を説明するためのフローチャートである。この処理は、図5のステップS13に相当する。また、図12は、ビデオコンプリート時刻の算出例を説明するための図である。以下、図12を参照しながら、図11に示すVOBU境界を事前に認識する処理について説明する。
【0033】
まず、システム多重部5は、VOBU最終ピクチャの2フレーム手前のピクチャ(ピクチャ(n−2))のVideo−ESの符号量から、いくつのV_PCKによって構成されるかを算出し、そのピクチャ(n−2)の最終V_PCK時刻を算出する(S31)。
【0034】
次に、同様にしてピクチャ(n−1)の最終V_PCK時刻を算出し(S32)、ピクチャ(n)の最終V_PCK時刻を算出する(S33)。そして、システム多重部5は、ピクチャ(n)の最終V_PCK時刻を暫定的にビデオコンプリート時刻とする(S34)。
【0035】
図12(a)に示すように、ピクチャ(n)のビデオコンプリート時刻がピクチャ(n)最終時刻(ピクチャ周期時間)よりも手前の場合には、ピクチャ(n)最終時刻をビデオコンプリート時刻とする。また、図12(b)に示すように、ピクチャ(n)のビデオコンプリート時刻がピクチャ(n)最終時刻を越える場合には、その時刻をビデオコンプリート時刻とする。
【0036】
図12(a)および図12(b)においては、ピクチャ(n−2)およびピクチャ(n−1)の最終V_PCK時刻がピクチャ周期時間を超える場合であった。しかし、1ピクチャのビデオの符号量(PCK数)が1ピクチャ時間に伝送可能なPCK数よりも少ない場合は、ピクチャ周期時間をピクチャの最終V_PCK時刻とし、1ピクチャのPCK数が1ピクチャ時間に伝送可能なPCK数よりも多い場合は、PCK数から求めた時刻をピクチャの最終V_PCK時刻とする必要がある。
【0037】
このとき、最終V_PCK時刻がピクチャ周期時間を超えた分の時間が、次のピクチャの開始時刻となる。そのため、ピクチャ(N−3)、(n−2)、(n−1)の符号量により、各ピクチャの最終V_PCK時刻がピクチャ周期時間を超えるか否かによって8ケースのバリエーションが存在することになる。
【0038】
図13は、各ピクチャの最終V_PCK時刻がピクチャ周期時間を超えるか否かによって発生する8ケースのバリエーションを説明するための図である。たとえば、図13(a)は、ピクチャ(n−2)、(n−1)および(n)の最終V_PCK時刻が、それぞれピクチャ周期時間を超える場合を示している。また、図13(c)は、ピクチャ(n−2)の最終V_PCK時刻がピクチャ周期時間を超え、ピクチャ(n−1)の最終V_PCK時刻がピクチャ周期時間以内であり、ピクチャ(n)の最終V_PCK時刻がピクチャ周期時間を超える場合を示している。
【0039】
このように、ビデオコンプリート時刻を算出する場合には、多くの状態を考慮しなければならず、VOBU境界を事前に認識するためには複雑な処理が必要になる。
【0040】
以下、オーディオコンプリート処理に要する時間の増加を抑えながら、多重化効率を向上させるシステム多重化装置について説明する。
【0041】
(第1の実施の形態)
本発明の第1の実施の形態におけるシステム多重化装置を含んだエンコーダおよびデコーダの概略構成は、図1に示すものと同様である。したがって、重複する構成および機能の説明は繰返さない。
【0042】
図14は、本発明の第1の実施の形態におけるシステム多重化装置の機能的構成を示す図である。このシステム多重化装置は、コンプリートの可能性があるタイムゾーンの開始時刻(以下、コンプリートゾーンとも呼ぶ。)を算出するタイムゾーン開始時刻算出部11と、オーディオPCKを多重すべき時刻とタイムゾーン開始時刻算出部11によって算出されたタイムゾーン開始時刻とを比較するタイムゾーン比較部12と、タイムゾーン比較部12による比較結果に応じてオーディオコンプリートフラグを設定するフラグ設定部13とを含む。なお、図14に示す機能的構成は、CPU(Central Processing Unit)が所定のプログラムを実行することによって実現されてもよいし、ハードウェアによって実現されてもよい。
【0043】
図15は、本発明の第1の実施の形態におけるシステム多重化装置の処理手順を説明するためのフローチャートである。本実施の形態におけるシステム多重化装置は、A_PCKの1周期内に必ず1回はA_PCKが出力されることに着目したものである。
【0044】
まず、タイムゾーン開始時刻算出部11は、オーディオのビットレートを参照して導出されるPCK周期から、コンプリートゾーンを算出する(S41)。次に、タイムゾーン比較部12は、オーディオPCKを多重すべき時刻(以下、SCR時刻と呼ぶ。)とタイムゾーン開始時刻とを比較し、オーディオPCKを多重すべき時刻がタイムゾーン内にあるか否かを判定する(S42)。
【0045】
オーディオPCKを多重すべき時刻がタイムゾーン内にあれば(S42,Yes)、フラグ設定部13はオーディオコンプリートフラグに1を設定し、コンプリートPCKを生成する(S43)。また、オーディオPCKを多重すべき時刻がタイムゾーン内になければ(S42,No)、フラグ設定部13はオーディオコンプリートフラグに0を設定し、通常のA_PCKを生成する(S44)。なお、コンプリートゾーンの基点は、GOP境界時刻とする。
【0046】
オーディオのビットレートは、たとえば、ユーザが録画(録音)モードを設定することによって決定される。DVDレコーダの製品仕様にも依存するが、図7に示す音声録画モードそのものを設定する場合や、高画質(短時間)/標準/長時間モードの切替えによって音声記録モードを選択する場合もある。
【0047】
コンプリートゾーン開始時刻の算出は、GOP境界時刻からさかのぼり、確実に1つ以上のA_PCKが存在するタイムゾーン、すなわちオーディオPCK周期を用いて行なう。1byte当たりのSCR時刻は、次式のようになる。
【0048】
1byte当たりのSCR時刻=(8bit/bitrate×90KHz)…(1)
たとえば、ビットレートが384kbpsの場合、1byte当たりのSCR時刻は、SCR時刻換算において以下のようになる。
【0049】
1byte当たりのSCR時刻=8bit/384kbps×90KHz=720/384SCR=1.875SCR …(2)
1PCK内のES量を、PCK長2048byteからPSヘッダおよびPESヘッダを除いた値とする。仮に、ES量を図3(a)に示すように2020byteとすると、1PCKの周期は、以下のようになる。
【0050】
Figure 2004248199
このため、コンプリートゾーンを切り上げて3788SCRとする。
【0051】
図16は、本発明の第1実施の形態におけるシステム多重化装置において適用されたコンプリートゾーンを説明するための図である。図16(a)および図16(b)は、図9(a)および図9(b)と同様であるので詳細な説明は繰返さない。図16(c)に示すように、GOP境界時刻から1A_PCK周期だけ前の時刻から、VOBU境界時刻までをコンプリートゾーンとしている。図16(c)においては、コンプリートA_PCKが2つ生成されている。
【0052】
図16(d)は、オーディオバッファの蓄積量の推移を示している。図16(d)に示すように、VOBU境界よりも前にコンプリート処理が行なわれるため、VOBU境界の直後にコンプリートA_PCKが生成されず、バッファオーバフローが発生するのを防止することができる。
【0053】
図17は、本発明の第1の実施の形態におけるシステム多重化装置によって適用されるコンプリートゾーンを模式的に説明するための図である。コンプリートゾーン内に2つのコンプリートPCKが生成されることを示している。
【0054】
以上説明したように、本実施の形態におけるシステム多重化装置によれば、GOP境界時刻を基点としたコンプリートゾーンを算出し、オーディオPCKを多重すべき時刻がコンプリートゾーン内にあれば、そのオーディオPCKをコンプリートするようにしたので、オーディオバッファのオーバフローを防止しつつ、パディングやスタッフの挿入による多重化ロスを軽減して多重化効率を向上させることが可能となった。
【0055】
(第2の実施の形態)
本発明の第1の実施の形態においては、全てのビットレートに対してコンプリートゾーンを設け、オーディオPCKを多重すべき時刻がコンプリートゾーン内であるか否かによってA_PCKをコンプリートしていた。しかし、仮想バッファ制御方式のみで、オーディオバッファのオーバフローが発生しない程符号長が短い場合には、逆に多重化効率を低下させることが考えられる。
【0056】
本発明の第2の実施の形態においては、オーディオのフレームレングスに応じて、第1の実施の形態において説明したタイムゾーンコンプリート方式を適用するか否かを判定する。なお、本実施の形態におけるシステム多重化装置を含んだエンコーダの構成およびシステム多重化装置の機能的構成は、図1に示す第1の実施の形態におけるエンコーダの構成および図14に示すシステム多重化装置の機能的構成と同様である。したがって、重複する構成および機能の説明は繰返さない。
【0057】
オーディオのフレームレングスがしきい値以上の場合には、上述したタイムゾーンコンプリート方式を用いてコンプリート処理を行なう。また、オーディオのフレームレングスがしきい値よりも短い場合には、VOBU境界強制コンプリート方式を用いてコンプリート処理を行なう。
【0058】
DVD規格のシステム多重化装置のように、4Kbyteのオーディオバッファを有し、2Kbyteを中心にバッファ残量を制御する場合、オーディオのフレームレングス1024byteをしきい値とする。
【0059】
図18は、上述したしきい値の算出方法を説明するための図である。4Kbyteのオーディオバッファの蓄積量の中心に2KbyteのPCKをおき、その上部とオーディオバッファの上限との差(1024byte)をしきい値としている。これは、オーディオバッファの蓄積量が2Kbyteを中心として推移するため、2KbyteのA_PCKが出力された直後にVOBU境界が発生してコンプリート処理が行なわれても、オーディオのフレームレングスに相当するデータがオーディオバッファに蓄積されるに過ぎないことによるものである。
【0060】
図19は、オーディオバッファの容量が4.2Kbyteであり、A_PCKに含まれるA−ESが1.8Kbyteの場合のしきい値の算出方法を説明するための図である。4.2Kbyteのオーディオバッファの蓄積量の中心(2.1Kbyte)に1.8KbyteのPCKをおき、その上部とオーディオバッファの上限との差(1.2Kbyte)をしきい値としている。
【0061】
以上説明したように、本実施の形態におけるシステム多重化装置によれば、オーディオのフレームレングスがしきい値以上であるか否かによって、タイムゾーンコンプリート方式とVOBU境界強制コンプリート方式とを切替えるようにしたので、オーディオのフレームレングスが短いときに発生する多重化効率の低下を防止することが可能となった。
【0062】
(第3の実施の形態)
第1の実施の形態においてはビットレートに応じてコンプリートゾーンを算出するための処理が必要であり、第2の実施の形態においてはオーディオのフレームレングスとしきい値とを比較して方式を切替える処理が必要であるため、処理時間が長くなる。
【0063】
本発明の第3の実施の形態においては、製品に採用される最悪(最長)のコンプリートタイムゾーンを予め設定することによって、処理速度を向上させるものである。なお、本実施の形態におけるシステム多重化装置を含んだエンコーダの構成およびシステム多重化装置の機能的構成は、図1に示す第1の実施の形態におけるエンコーダの構成および図14に示すシステム多重化装置の機能的構成と同様である。したがって、重複する構成および機能の説明は繰返さない。
【0064】
たとえば、製品のビットレートとして192Kbpsまでサポートされる場合、タイムゾーン開始時刻はGOP境界から7575SCRだけ手前となる。この値をシステム多重化装置に予め設定しておき、ビットレートにかかわらずこの値を用いてコンプリート処理を行なう。なお、図7においては、AC−3のみについて記載されているが、MPEG−1AudioなどのAudio種別においても本発明を適用することが可能である。
【0065】
以上説明したように、本実施の形態におけるシステム多重化装置によれば、予め設定されたタイムゾーン開始時刻を用いてコンプリート処理を行なうようにしたので、システム多重化装置の処理速度の向上を図ることが可能となった。
【0066】
(第4の実施の形態)
第1の実施の形態においては、時刻がコンプリートタイムゾーン内のとき、実バッファ蓄積量が少なく、コンプリート処理の必要がない場合であっても、コンプリート処理が行なわれて多重化ロスが発生する場合がある。本実施の形態においては、このコンプリート処理の必要があるか否かを判定して、多重化ロスの軽減を図るものである。なお、本実施の形態におけるシステム多重化装置を含んだエンコーダの構成は、図1に示す第1の実施の形態におけるエンコーダの構成と同様である。また、本実施の形態におけるシステム多重化装置の機能的構成は、図14に示すシステム多重化装置の機能的構成と比較して、フラグ設定部にオーディオバッファの残量を計算する機能が追加された点のみが異なる。したがって、重複する構成および機能の説明は繰返さない。なお、本実施の形態におけるフラグ設定部の参照符号を13’として説明する。
【0067】
図20は、本発明の第1の実施の形態におけるシステム多重化装置のオーディオバッファの推移およびA_PCKの構成を説明するための図である。図20に示すように、オーディオPCKを多重すべき時刻がコンプリートタイムゾーン内にある4つのA_PCKがコンプリートされることになる。
【0068】
図21は、本発明の第1の実施の形態におけるシステム多重化装置の多重化ロスを軽減した場合のオーディオバッファの推移およびA_PCKの構成を説明するための図である。図21に示すように、コンプリートタイムゾーン内にある最初の2つのA_PCKをコンプリートしなくても、オーディオバッファにおけるオーバフローは発生しない。
【0069】
本発明の第4の実施に形態におけるシステム多重化装置においては、フラグ設定部13’が、多重開始から出力されたPCK内のESによるバッファ蓄積量の増加と、PTS(デコード時刻)においてオーディオバッファから引抜かれるデータ量とを計算することによって、オーディオバッファの蓄積量を算出する。
【0070】
タイムゾーン比較部12によってSCR時刻がタイムゾーン内とあると判定されると、フラグ設定部13’はオーディオバッファの実バッファ残量を参照して、コンプリートしていない通常のPCKを出力した後、連続してコンプリートPCKを出力してもバッファオーバフローが発生しないかを判定する。オーバフローが発生しないと判定した場合には、フラグ設定部13’は、オーディオコンプリートフラグに0を設定して、通常のA_PCKを出力する。
【0071】
また、オーバフローが発生すると判定した場合には、フラグ設定部13’はオーディオコンプリートフラグに1を設定して、コンプリートA_PCKを出力する。
【0072】
図22は、通常PCKが出力された直後に、強制的にVOBUコンプリート処理が行なわれた場合のオーディオのバッファ推移を示す図である。実バッファの残量を計算してA_PCKをコンプリートするか否かを判定しているので、通常のPCKが出力された直後に、強制的にBOVUコンプリート処理が行なわれたとしても、オーディオバッファにおいてオーバフローが発生することはない。
【0073】
以上説明したように、本実施の形態におけるシステム多重化装置によれば、オーディオバッファの残量計算を行なってA_PCKをコンプリートするか否かを判定するようにしたので、不要なコンプリートPCKの生成を防止することができ、多重化効率の改善を図ることが可能となった。
【0074】
今回開示された実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【0075】
【発明の効果】
本発明のシステム多重化装置によれば、比較手段が、オーディオパックを多重する時刻と算出手段によって算出されたタイムゾーンとを比較し、設定手段が比較手段による比較結果に応じて、オーディオパックをコンプリートするか否かを設定するようにしたので、VOBU境界よりも前にコンプリート処理が行なわれ、VOBU境界の直後にコンプリートPCKが生成されなくなり、バッファオーバフローが発生するのを防止することが可能となった。
【図面の簡単な説明】
【図1】システム多重化装置を含んだ録画機および再生機の概略構成を示すブロック図である。
【図2】PSの構成の一例を示す図である。
【図3】DVD規格におけるPCK構成を示す図である。
【図4】デコーダのオーディオバッファの蓄積量の推移を示す図である。
【図5】システム多重部5の処理手順を説明するためのフローチャートである。
【図6】図5のステップS13の処理の詳細を説明するためのフローチャートである。
【図7】録画モード、音声記録モード、ビットレート、フレーム長およびPCK周期の関係を示す図である。
【図8】仮想バッファ制御方式を、オーディオの1フレームが長いモードに適用した場合におけるバッファ推移を示す図である。
【図9】オーディオバッファにおいてオーバフローが発生する場合を説明するための図である。
【図10】図9を用いて説明した問題点を解決するための一例を示す図である。
【図11】VOBU境界を事前に認識する処理を説明するためのフローチャートである。
【図12】ビデオコンプリート時刻の算出例を説明するための図である。
【図13】各ピクチャの最終V_PCK時刻がピクチャ周期時間を超えるか否かによって発生する8ケースのバリエーションを説明するための図である。
【図14】本発明の第1の実施の形態におけるシステム多重化装置の機能的構成を示す図である。
【図15】本発明の実施の形態1におけるシステム多重化装置の処理手順を説明するためのフローチャートである。
【図16】本発明の第1の実施の形態におけるシステム多重化装置において適用されたコンプリートゾーンを説明するための図である。
【図17】本発明の第1の実施の形態におけるシステム多重化装置によって適用されるコンプリートゾーンを模式的に説明するための図である。
【図18】しきい値の算出方法を説明するための図である。
【図19】オーディオバッファの容量が4.2Kbyteであり、A_PCKに含まれるA−ESが1.8Kbyteの場合のしきい値の算出方法を説明するための図である。
【図20】本発明の第1の実施の形態におけるシステム多重化装置のオーディオバッファの推移およびA_PCKの構成を説明するための図である。
【図21】本発明の第1の実施の形態におけるシステム多重化装置の多重化ロスを軽減した場合のオーディオバッファの推移およびA_PCKの構成を説明するための図である。
【図22】通常PCKが出力された直後に、強制的にVOBUコンプリート処理が行なわれた場合のオーディオのバッファ推移を示す図である。
【符号の説明】
1 ビデオエンコーダ、2 オーディオエンコーダ、3,7 ビデオバッファ、4,8 オーディオバッファ、5 システム多重部、6 システム分離部、9ビデオデコーダ、10 オーディオデコーダ、11 タイムゾーン開始時刻算出部、12 タイムゾーン比較部、13 フラグ設定部。

Claims (5)

  1. ビデオパックとオーディオパックとを多重して出力するシステム多重化装置であって、
    オーディオのビットレートに応じて、ビデオオブジェクトユニット内に設定するタイムゾーンを算出するための算出手段と、
    オーディオパックを多重する時刻と、前記算出手段によって算出されたタイムゾーンとを比較するための比較手段と、
    前記比較手段による比較結果に応じて、オーディオパックをコンプリートするか否かを設定するための設定手段とを含む、システム多重化装置。
  2. 前記算出手段は、グループオブピクチャ境界時刻よりもオーディオパック周期だけ前の時刻から、前記ビデオオブジェクトユニット境界時刻までをタイムゾーンとする、請求項1記載のシステム多重化装置。
  3. 前記設定手段は、オーディオフレームレングスが所定値以上の場合には、前記比較手段による比較結果に応じて、オーディオパックをコンプリートするか否かを設定し、
    前記オーディオフレームレングスが前記所定値より小さい場合には、前記ビデオオブジェクトユニット境界時刻直後に強制的にオーディオパックをコンプリートするよう設定する、請求項1または2記載のシステム多重化装置。
  4. ビデオパックとオーディオパックとを多重して出力するシステム多重化装置であって、
    オーディオパックを多重する時刻と、ビデオオブジェクトユニット内に予め設定されたタイムゾーンとを比較するための比較手段と、
    前記比較手段による比較結果に応じて、オーディオパックをコンプリートするか否かを設定するための設定手段とを含む、システム多重化装置。
  5. 前記設定手段は、オーディオのバッファ残量を計算し、コンプリートされていないオーディオパックを出力した場合にバッファオーバフローが発生するか否かを判定して、オーディオパックをコンプリートするか否かを設定する、請求項1〜4のいずれかに記載のシステム多重化装置。
JP2003038467A 2003-02-17 2003-02-17 システム多重化装置 Withdrawn JP2004248199A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2003038467A JP2004248199A (ja) 2003-02-17 2003-02-17 システム多重化装置
US10/677,228 US7457525B2 (en) 2003-02-17 2003-10-03 System multiplexing apparatus preventing overflow of audio decoder buffer
US12/260,813 US7873263B2 (en) 2003-02-17 2008-10-29 Multiplexing method preventing overflow of audio decoder buffer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003038467A JP2004248199A (ja) 2003-02-17 2003-02-17 システム多重化装置

Publications (1)

Publication Number Publication Date
JP2004248199A true JP2004248199A (ja) 2004-09-02

Family

ID=32905104

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003038467A Withdrawn JP2004248199A (ja) 2003-02-17 2003-02-17 システム多重化装置

Country Status (2)

Country Link
US (2) US7457525B2 (ja)
JP (1) JP2004248199A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050096918A1 (en) * 2003-10-31 2005-05-05 Arun Rao Reduction of memory requirements by overlaying buffers
US7624021B2 (en) 2004-07-02 2009-11-24 Apple Inc. Universal container for audio data
US20080049036A1 (en) * 2006-08-24 2008-02-28 Mediatek Inc. Multimedia Playback System, FIFO Memory System, and Method for Storing Multimedia Data
JP4837744B2 (ja) * 2006-10-31 2011-12-14 パナソニック株式会社 多重化装置、集積回路、多重化方法、多重化プログラム、多重化プログラムを記録したコンピュータ読み取り可能な記録媒体及び多重化ストリームを記録したコンピュータ読み取り可能な記録媒体
KR101369745B1 (ko) * 2007-04-11 2014-03-07 삼성전자주식회사 비동기화된 비트스트림들의 다중화 및 역다중화 방법 및장치

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5481543A (en) * 1993-03-16 1996-01-02 Sony Corporation Rational input buffer arrangements for auxiliary information in video and audio signal processing systems
JPH0898160A (ja) 1994-09-28 1996-04-12 Victor Co Of Japan Ltd データ多重化装置
US5802068A (en) * 1995-06-30 1998-09-01 Nippon Steel Corporation Multiplexing apparatus of a plurality of data having different bit rates
WO1998001970A1 (en) * 1996-07-03 1998-01-15 Matsushita Electric Industrial Co., Ltd. Data multiplexing method, data multiplexer using the multiplexing method, multiple data repeater, multiple data decoding method, multiple data decoding device using the decoding method, and recording medium on which the methods are recorded
CN1118065C (zh) * 1997-12-15 2003-08-13 松下电器产业株式会社 光盘的记录和复制设备及方法
EP1250004A1 (en) * 2001-04-11 2002-10-16 Deutsche Thomson-Brandt Gmbh Method and apparatus for controlling the insertion of stuffing data into a bitstream to be recorded
JP3773805B2 (ja) * 2001-04-27 2006-05-10 Necエレクトロニクス株式会社 データストリーム生成方法とそのための装置
JP2003046949A (ja) * 2001-07-30 2003-02-14 Hitachi Ltd データ多重化方法、データ記録媒体、データ記録装置及びデータ記録プログラム

Also Published As

Publication number Publication date
US7873263B2 (en) 2011-01-18
US20090052869A1 (en) 2009-02-26
US20040170387A1 (en) 2004-09-02
US7457525B2 (en) 2008-11-25

Similar Documents

Publication Publication Date Title
US5521922A (en) Data demultiplexer
JP3039624B2 (ja) オーディオ・ビデオ同期再生装置
US7706667B2 (en) Recording apparatus and method, reproducing apparatus and method, recording medium, and program
JP2003046949A (ja) データ多重化方法、データ記録媒体、データ記録装置及びデータ記録プログラム
JP4775208B2 (ja) 再生方法、再生プログラムおよび再生装置
JP4294660B2 (ja) 再生装置、再生方法及びその記録媒体
JP4717452B2 (ja) データ多重化装置
JPH0973299A (ja) Mpegオーディオ再生装置およびmpeg再生装置
US7873263B2 (en) Multiplexing method preventing overflow of audio decoder buffer
US8359413B2 (en) Data stream buffer control using reference time and decoding time
US6718119B1 (en) Video/audio decoding apparatus and method
WO2008001478A1 (en) Format converter, format converting method, and moving image decoding system
JPH1155626A (ja) テレビジョン信号符号化装置およびテレビジョン信号記録装置
JP5046907B2 (ja) 記録装置、その制御方法、プログラム
JP4900945B2 (ja) 記録装置、及び記録方法
JP4029630B2 (ja) インタリーブ処理装置とインタリーブ処理方法及びインタリーブ処理プログラム
JP2008176918A (ja) 再生装置、再生方法及びその記録媒体
JP3542976B2 (ja) 圧縮符号化データ再生方法および装置
JP2008312008A (ja) オーディオストリーム処理方法および再生装置と出力装置
JP3403865B2 (ja) ストリーム多重装置およびストリーム多重方法
JPH10164512A (ja) データ処理同期装置
JPH11225309A (ja) 音響信号処理装置及びオーディオ高速再生方法
JP2004015384A5 (ja)
JPH11213564A (ja) 情報符号化装置および情報復号化装置および情報符号化復号化記録再生装置
JP2002199356A (ja) Ps多重化システム及びps多重化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060116

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20071115