JP2005294977A - スライドウィンドウ(slidingwindow)を用いた2パスビデオエンコーディング方法とシステム - Google Patents

スライドウィンドウ(slidingwindow)を用いた2パスビデオエンコーディング方法とシステム Download PDF

Info

Publication number
JP2005294977A
JP2005294977A JP2004103718A JP2004103718A JP2005294977A JP 2005294977 A JP2005294977 A JP 2005294977A JP 2004103718 A JP2004103718 A JP 2004103718A JP 2004103718 A JP2004103718 A JP 2004103718A JP 2005294977 A JP2005294977 A JP 2005294977A
Authority
JP
Japan
Prior art keywords
frame
bit rate
indicates
analysis window
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004103718A
Other languages
English (en)
Inventor
Yi-Kai Chen
怡凱 陳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ulead Systems Inc
Original Assignee
Ulead Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ulead Systems Inc filed Critical Ulead Systems Inc
Priority to JP2004103718A priority Critical patent/JP2005294977A/ja
Priority to US10/828,199 priority patent/US7302000B2/en
Priority to TW93122684A priority patent/TWI249957B/zh
Publication of JP2005294977A publication Critical patent/JP2005294977A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】スライドウィンドウを用いた2パスビデオエンコーディング方法を提供する。
【解決手段】本方法は、ビデオシーケンスを受信し、最初からのビデオシーケンスのフレームの一部を分析ウィンドウとして選択し、分析ウィンドウの各フレームを符号化して、複数の統計特徴を得て、統計特徴に従って、可変ビットレート分配方法により、分析ウィンドウの各フレームに修正ビットレートを分配し、修正されたビットレートに従って、最初とアウトポイント間で生じる分析ウィンドウのフレームを符号化し、ビデオシーケンスが完全に符号化されない場合、アウトポイントの次のフレームからのビデオシーケンスのフレームの一部分を、新しい分析ウィンドウとして選択する。
【選択図】図3

Description

本発明は、ビデオエンコーディング技術に関するものであって、特に、スライドウィンドウを用いた2パスビデオエンコーディング方法とシステムに関するものである。
ビデオシーケンス(VS)は、一連の静的フレームとしてとらえられ、大きいストレージ領域と伝送帯域幅が要求される。例えば、640×480画素で15フレーム/秒等、90分のフルカバービデオストリームは、640×480(画素/フレーム)×3(バイト/画素)×15(フレーム/秒)=13.18(MB/秒)の帯域幅と13.18(MB/秒)×90×60=69.50(GB)のファイルサイズを必要とする。相当な大きさのデジタルビデオストリームは、保存とリアルタイムの伝送が困難で、よって、多くの圧縮技術が導入されている。
MPEG規格は、確実に、ビデオエンコーダが画一化したファイルを作成し、標準化した規格デコーダを有するあらゆるシステムを起動し、実行する。デジタルビデオは、空間的、時間的冗長を含み、顕著な犠牲を伴わないで圧縮される。MPEGコード化は共通基準で、独立した特定のアプリケーションを実行し、時間的統計冗長と空間方向に基づいた圧縮が必要とされる。時間的冗長は、近接する画素によりシェアされる明度の類似に基づく。MPEGは、離散コサイン変換(discrete cosine transform、DCT)と量子化により、冗長明度にフレーム内空間圧縮を使用する。時間的冗長は、ビデオフレーム間の同一の時間的動きを検索し、ビデオに、滑らかで、リアルな動きを提供する。
ビデオフレーム間の時間的圧縮にとって、MPEGは予測、更には、正確さ、動き補償予測にかかっている。MPEGの利用により、時間的圧縮、Iフレーム、Bフレーム、及びPフレームを形成する。Iフレームはイントラフレームで、シーケンスを処理する単一のイメージで、他のピクチャの情報を使用せず、それ自身のピクチャ情報のみで符号化される。MPEGは、前の、或いは、後続のフレームを参照しないでフレーム内だけで符号化する。Pフレームは、予測符号化ピクチャで、過去のIピクチャまたはPピクチャを参照ピクチャとして、時間軸上で前向きに動き予測の符号化がされたものである。Bフレームは、双方向予測符号化ピクチャで、過去と将来のIピクチャまたはPピクチャを参照ピクチャとして、時間軸上で前向きおよび後向きに動き予測の符号化がされたものである。使用される動きベクトルは、前向き、後向き、或いは、両方である。
MPEGは、イメージと動き補償において、離散コサイン変換を8×8ブロック画素に適用することにより生成される係数を量子化することにより、圧縮を達成している。
MPEGビデオエンコーダの一般的なアプローチは、ビデオ空間の複雑度にかかわらず、ピクチャのまとまり(group of picture、GOP)に、固定ビットレート(constant bit rate、CBR)を利用する。ビットレートはビデオ画質を表示し、一秒のビデオをビットに取り込む物理的な空間がどのくらいかを定義するのに用いられる。それらは、纏まったピクチャ(GOP)間のビット配分と等しい重要性を担い、エンコードタスクの自由度の度合いを減少させる。固定ビットレート符号化は、各フレームタイプに対し、異なる量子化スケールを実行し、纏まったピクチャ(GOP)内で、好ましい品質のストリームを得る。複雑なソースがやがて変化し、符号化アルゴリズムがそれを調節する充分な時間を有する時、固定ビットレート方法は的確に作用する。しかし、ソースの統計特徴が急速に変化する場合、固定ビットレート操作は短時間ウィンドウ(幾つかのフレーム、或いは、ピクチャのまとまり(GOP))にとって、好ましいフレーム品質で、ビデオ全体が得られる時、不連続品質である。
ビデオシーケンス(VS)は、本質的に可変のものであり、好ましいエンコーディングアプローチは、可変ビットレート(variable bit rate、VBR)符号化アルゴリズムを採用することにより導入される。一般に、可変ビットレートエンコーダーは、期間内で、非定置の出力ビットレートを生成し、複合フレームは、単一のより高いビットレートを有する。可変ビットレートエンコーダーは、連続したビデオシーケンスの全体に渡って、同じ、或いは、異なる量子化スケールを用い、一定のビデオ画質を得る。
可変ビットレートアルゴリズムは、一定のビデオ画質に適しているが、ビットレート配分は、ワンパスのビデオシーケンスにとって最適ではない。与えられたビットレート割当量を、更に、適切に、異なるフレームに割り当てるために、レート制御スキームは、可能な全量子化スケール下で、連続したビデオシーケンスの各フレームに、ビットレートを再分配する必要がある。2パス可変ビットレート技術が導入されて、上述の目的を達成している。
図1は、公知の可変ビットレートによる2パスエンコーディング方法を示す図である。第一パスエンコーディング21は、全ソースを符号化して、統計特徴を得て、必要制限条件を満たす最善のビットレート分配を決定する。その後、第二パスエンコーディング23は、得られた統計特徴に従って、ビットレートを再分配することにより、全ソース20aを符号化し、可変ビットレートビデオストリーム20bを生成する。注意すべきことは、第一パスで符号化された可変ビットレートビデオストリームは無視され、第二パスに届けられない。
ソリューションは実現可能であるが、可変ビットレートによる2パスエンコーディング方法は、時間が集中的である。よって、符号化結果は、2パスエンコーディングを完了した後得られ、即答の要求を妨げてしまう。
これにより、即答の要求を満たす効果的なアプローチを提供するシステムと方法が必要である。
特開平9−172642号公報
本発明は、即答の要求を満たすことが可能な、スライドウィンドウを用いた2パスビデオエンコーディング方法とシステムを提供することを目的とする。
本発明の方法は、コンピュータにより、ビデオシーケンスを受信する工程と、最初からの前記ビデオシーケンスのフレームの一部を分析ウィンドウとして選択する工程と、前記分析ウィンドウの各フレームを符号化して、前記分析ウィンドウの各フレームへのビットレート、量子化スケール、フレームの複雑度、その他の複合統計特徴を得る工程と、前記統計特徴に従って、前記分析ウィンドウの各フレームにビットレートを再分配する工程と、前記再分配されたビットレートに従って、最初と切点間で生じる前記分析ウィンドウで、フレームを符号化する工程と、前記ビデオシーケンスが完全に符号化されない場合、前記切点の次のフレームからの前記ビデオシーケンスのフレームの一部分を、新しいウィンドウとして選択する工程と、からなる。
本発明は、更に、スライドウィンドウを用いた2パスビデオエンコーディングシステムを提供することをもう一つの目的とする。本システムは、スライドウィンドウ制御モジュールと、統計特徴捕捉モジュールと、ビットレート再分配モジュールと、可変ビットレートエンコードモジュールと、からなる。スライドウィンドウ制御モジュールは、ビデオシーケンスを受信し、当該ビデオシーケンスのフレームの一部を分析ウィンドウとして選択し、最初と切点間で生じる前記分析ウィンドウからのフレームをエンコードウィンドウとして選択し、前記ビデオシーケンスが完全に符号化されない場合、前記切点の次のフレームからの前記ビデオシーケンスのフレームの一部分を、新しいウィンドウとして選択する。統計特徴捕捉モジュールは、分析ウィンドウを受信し、前記分析ウィンドウ全体を符号化して、分析ウィンドウの各フレームの複合統計特徴を得る。
ビットレート再分配モジュールは、前記統計特徴に従って、可変ビットレート分配方法により、前記分析ウィンドウの各フレームの第一ビットレートを計算する。ビデオシーケンスエンコードモジュールは、前記第一ビットレートに従って、前記分析ウィンドウの前記フレームを符号化する。
本発明は、更に、スライドウィンドウを用いた2パスビデオエンコードを実行する時、コンピュータプログラムを保存するコンピュータ読み取り可能記憶媒体を開示する。
好ましくは、分析ウィンドウのフレーム数は、900以上である。統計特徴は、マクロブロック、第二ビットレート個々に対し、複合量子化スケールを有する。可変ビットレート分配方法は、以下の公式を用いる。
Figure 2005294977
即答の要求を満たす効果的なアプローチが提供される。
図2は、本発明のスライドウィンドウを用いた2パスビデオエンコーディングのシステム機構を示す図である。システム10は、処理ユニット11、メモリ12、記憶装置13、入力装置14、ディスプレイ装置15、及び、コミュニケーション装置16、からなる。処理ユニット11はバス17により、ノイマン構造に基づいて、メモリ12、記憶装置13、入力装置14、ディスプレイ装置15、及び、コミュニケーション装置16と接続される。処理ユニット11、メモリ12、記憶装置13、ディスプレイ装置15、入力装置14、及び、コミュニケーション装置16は、メインフレームコンピュータ、ミニコンピュータ、ワークステーション、ホストコンピュータ、パソコン、或いは、モバイルコンピュータに組み込まれる。
処理ユニット11は、メモリ12からの指令により制御され、オペレータは、入力装置14により、テスト時間予測機能を実行する。一つ、或いは、それ以上の処理ユニット11があり、コンピュータ10は、CPU、或いは、複合処理ユニット、広く、並行処理環境と称される。メモリ12は、好ましくは、ランダムアクセスメモリRAMで、ROMやフラッシュROMを有する。メモリ12は、好ましくは、経路指定、プログラム、オブジェクト、コンポーネンツ、或いは、その他を含むプログラムモジュールを有し、2パスビデオエンコーディング機能を実行する。処理ユニット11は、以下のように、スライドウィンドウを用いて、2パスビデオエンコーディング方法を実行する。
図3は、本発明の好ましい具体例によるスライドウィンドウを用いた2パスビデオエンコーディングの方法を示すフローチャートである。本方法は、
工程311において、ビデオシーケンスを受信する。
工程321において、最初からの前記ビデオシーケンスのフレームの一部を分析ウィンドウとして選択する。統計特徴計算のための充分なフレームを得るため、分析ウィンドウのフレーム数は、900以上である。
工程322において、前記分析ウィンドウの各フレームを符号化して、分析ウィンドウの各フレームへのビットレート、量子化スケール、フレームの複雑度、その他の適切な統計特徴を得る。注意すべきことは、前述の符号化は、固定ビットレート(CBR)アプローチ、可変ビットレート(VBR)アプローチ、或いは、その他を使用することである。異なるシーンは、アクティビティ、或いは、動き、低アクティビティ、スローモーションシーンから、高アクティビティ、ハイモーションへの測距等、異なる特徴を有し、可変ビットレートエンコーディングのビットレートは、時々変わる。よって、工程323において、計算された統計特徴に従って、前記分析ウィンドウの各フレームの(再分配)ビットレートを計算する。公式(1)は、特定のフレームの再計算ビットレートの公式例を示す。
Figure 2005294977
注意すべきことは、ビットレート再計算公式は、公式(1)に限定するものではなく、他の既知のビットレート再分配アルゴリズムを使用することが出来る。このような、ビットレート再分配は、高複雑度フレームに、低複雑度フレームのそれより大きいビットレートを備えさせる。工程324において、ビットレートの分配に従って、最初と所定のアウトポイント間で生じる分析ウィンドウのフレームを符号化する。所定のアウトポイントは、好ましくは、分析ウィンドウの二分の一から三分の一の長さに位置する。
工程325において、ビデオシーケンスが完全に符号化されたか否かを判断し、符号化された場合、工程は終了する。符号化されていない場合、前記前の所定のアウトポイントの次のフレームからの、ビデオシーケンスのフレームの一部分を、新しい分析ウィンドウとして選択する。新しい分析ウィンドウの幾つかは、様々な実行要求に基づく前の分析ウィンドウのそれと等しいか、或いは、異なる。よって、新しい分析ウィンドウは、新しい統計特徴計算の前の分析ウィンドウの確実なフレームと重なる。前の分析ウィンドウと新しい分析ウィンドウとの間に重複がない場合、それらのウィンドウが、異なるシーンと一致する時、不連続品質が特に明らかになる。本方法の順序が前の具体例で記述されているが、本方法に限定するものではない。
図4は、本発明の好ましい具体例による符号化順序の例を示す図である。
最初に、ビデオシーケンス41が受信される。工程322〜323を参照すると、工程は、最初からの前記ビデオシーケンス41のフレームの一部を第一ウィンドウ(ライン411で示される)として選択し、第一ウィンドウの各フレームを符号化して、統計特徴を得て、各フレームに適宜に、ビットレートを再分配する。工程324を参照すると、工程は、再分配されたビットレートに従って、最初と所定のアウトポイント(点線412で示される)間で生じる第一ウィンドウを符号化する。
その後、工程325〜326を参照すると、工程は、前の所定のアウトポイント41aの次のフレームからのビデオシーケンス41のフレームの一部分を、第二ウィンドウ(ライン421で示される)として選択する。同様に、工程322〜324を参照すると、工程は、最初と所定のアウトポイント41b(点線422)間の第二ウィンドウのフレームを符号化する。最後に、工程325〜326を参照すると、工程は、前の所定のアウトポイント41bの次のフレームからのビデオシーケンス41のフレームの一部分を、第三ウィンドウ(ライン431で示される)として選択する。同様に、工程322〜324を参照すると、工程は、最初と最後(点線432)間の第三ウィンドウのフレームを符号化する。注意すべきことは、第一パスで符号化されたフレームは、無視され、第二パスに届けられないことである。
本発明は、更に、スライドウィンドウを用いた2パスビデオエンコーディングのシステムを開示する。
図5は、本発明の好ましい具体例によるスライドウィンドウを用いた2パスビデオエンコーディングのシステムを示す図である。システム50は、好ましくは、スライドウィンドウ制御モジュール51と、統計特徴捕捉モジュール52と、ビットレート再分配モジュール53と、可変ビットレートエンコードモジュール54と、からなる。
注意すべきことは、システム50は、処理ユニット11、チップ、チップセット、或いは、その他の電気回路による実行のコンピュータプログラムで実行されることである。スライドウィンドウ制御モジュール51は、ビデオシーケンスを受信し、ビデオシーケンスのフレームの一部を分析ウィンドウとして選択し、分析ウィンドウを統計特徴捕捉モジュール52に伝送する。統計特徴捕捉モジュール52は、分析ウィンドウを受信し、分析ウィンドウの各フレームを符号化して、マクロブロック、ビットレート、或いは、その他の量子化スケール等、統計特徴を得て、フレームの統計特徴をスライドウィンドウ制御モジュール51に伝送する。
注意すべきことは、前記符号化は、固定ビットレートアプローチ、可変ビットレートアプローチ、或いは、その他を用いることである。スライドウィンドウ制御モジュール51は、フレームの統計特徴を、ビットレート再分配モジュール53に順に伝送する。ビットレート再分配モジュール53は、フレームの統計特徴を受信し、各フレームのビットレートを、適宜に、再計算して、新たに計算されたビットレートを、スライドウィンドウ制御モジュール51に伝送する。ビットレート再計算公式は、方程式(1)に限定されない。その他の可変ビットレートアルゴリズムを採用することも出来る。
スライドウィンドウ制御モジュール51は、最初と所定のアウトポイント間で生じる前記分析ウィンドウからのフレームを選択し、選択されたフレームを、再計算されたビットレートと共に、可変ビットレートエンコードモジュール54に伝送する。所定のアウトポイントは、好ましくは、最初から、分析ウィンドウの二分の一から三分の一の長さに位置する。可変ビットレートエンコードモジュール54はフレームとビットレートを受信し、受信したフレームを適宜に、可変ビットレートエンコーディングビデオストリームに符号化する。スライドウィンドウ制御モジュール51は、前の所定のアウトポイントの次のフレームからのビデオシーケンスのフレームの一部分を、新しい分析ウィンドウとして選択する。
注意すべきことは、スライドウィンドウ制御モジュール51により実行される新しい分析ウィンドウ選択と、可変ビットレートエンコードモジュール54により実行されるフレームエンコーディングは、同時に、操作されることである。モジュール間の残りの操作は、類似点により推定される。
本発明は、更に、図6で示されるような、スライドウィンドウを用いた2パスビデオエンコーディング方法を提供するコンピュータプログラムを保存する記憶媒体を開示する。
コンピュータプログラム製品は、コンピュータシステムに用の媒体に体化されたコンピュータ読み取りプログラムコードを有する記憶媒体60からなり、コンピュータ読み取りプログラムコードは、ビデオシーケンスを受信するコンピュータ読み取りプログラムコード621、最初からのビデオシーケンスのフレームの一部分を分析ウィンドウとして選択するコンピュータ読み取りプログラムコード622、分析ウィンドウのフレームを符号化して、統計特徴を得るコンピュータ読み取りプログラムコード623、統計特徴に従って、分析ウィンドウのフレームにビットレートを分配するコンピュータ読み取りプログラムコード624、最初と所定のアウトポイント間に生じる分析ウィンドウのフレームを符号化するコンピュータ読み取りプログラムコード625、ビデオシーケンスが完全に符号化されない場合、前の所定のアウトポイントの次のフレームからのビデオシーケンスのフレームの一部分を、新しい分析ウィンドウとして選択するコンピュータ読み取りプログラムコード626、からなる。
本発明の方法及びシステム、或いは、ある局面は、フレキシブルディスク、CD−ROM、ハードディスク、或いは、その他の機械読み取り記録媒体等、実体の媒体に体化されるプログラムコード(指令など)という形式をとり、プログラムコードがロードされて、コンピュータ等の機械により実行される時、機械は、本発明を実行する装置となる。本発明の方法及び装置は、光ファイバー、或いは、その他の伝送方式により、電気配線、ケーブル布線等、伝送媒体に渡って伝送されるプログラムコードの形式で体化される。プログラムコードが受信され、ロードされて、コンピュータ等の機械により実行される時、機械は本発明を実行する装置となる。汎用プロセッサで実行される時、プログラムコードはプロセッサと組み合わされて、同じように、特定の論理回路の作用をする無類の装置を提供する。
本発明では好ましい実施例を前述の通り開示したが、これらは決して本発明に限定するものではなく、当該技術を熟知する者なら誰でも、本発明の精神と領域を脱しない範囲内で各種の変動や潤色を加えることができ、従って本発明明の保護範囲は、特許請求の範囲で指定した内容を基準とする。
公知の可変ビットレートによる2パスエンコーディング方法を示す図である。 本発明の好ましい具体例によるスライドウィンドウを用いた2パスビデオエンコーディングのシステム機構を示す図である。 本発明のスライドウィンドウを用いた2パスビデオエンコーディングの方法を示すフローチャートである。 本発明の好ましい具体例によるエンコーディング順序の例を示す図である。 本発明の好ましい具体例によるスライドウィンドウを用いた2パスビデオエンコーディングのシステムを示す図である。 本発明の好ましい具体例によるスライドウィンドウを用いた2パスビデオエンコーディングの方法を提供するコンピュータプログラムの記憶媒体を示す図である。
符号の説明
21…第一パスエンコーディング
22…第二パスエンコーディング
23…第二パスエンコーディング
20a…全ソース
20b…可変ビットレートビデオストリーム
10、50…システム
11…処理ユニット
12…メモリ
13…記憶装置
14…入力装置
15…ディスプレイ装置
16…コミュニケーション装置
17…バス
51…スライドウィンドウ制御モジュール
52…統計特徴捕捉モジュール
53…ビットレート再分配モジュール
54…可変ビットレートエンコードモジュール

Claims (18)

  1. スライドウィンドウを用いた2パスビデオエンコーディング方法であって、本方法は、コンピュータにより以下の工程を実行し、
    ビデオシーケンスを受信する工程と、
    最初からの前記ビデオシーケンスのフレームの一部を分析ウィンドウとして選択する工程と、
    前記分析ウィンドウの各フレームを符号化して、複数の統計特徴を得る工程と、
    前記統計特徴に従って、可変ビットレート分配方法により、前記分析ウィンドウの各フレームに修正ビットレートを分配する工程と、
    前記修正されたビットレートに従って、最初とアウトポイント間で生じる前記分析ウィンドウのフレームを符号化する工程と、
    前記ビデオシーケンスが完全に符号化されない場合、前記アウトポイントの次のフレームからのビデオシーケンスのフレームの一部分を、新しい分析ウィンドウとして選択する工程と、
    からなることを特徴とする、ビデオエンコーディング方法。
  2. 前記分析ウィンドウのフレーム数は、900以上であることを特徴とする、請求項1に記載のビデオエンコーディング方法。
  3. 前記統計特徴は、マクロブロック、オリジナルのビットレート個々に対し、複数の量子化スケールを有することを特徴とする、請求項1に記載のビデオエンコーディング方法。
  4. 前記可変ビットレート分配方法は、
    Figure 2005294977
    の公式を用い、前記BR2(i)は、第(i)フレームの修正ビットレートを示し、前記BR1(i)は、統計特徴の第(i)フレームのオリジナルビットレートを示し、前記√[Qavg(i)]は、統計特徴の第(i)フレームの量子化スケールの平均の平方根を示し、前記BRtargetは、所定のターゲットビットレートを示し、前記Fwindowは、分析ウィンドウの若干のフレームを示し、前記FRは、一秒のビデオ再生で幾つのフレームが示される所定のフレームレートを示すことを特徴とする、請求項3に記載のビデオエンコーディング方法。
  5. 前記可変ビットレート分配方法は、
    Figure 2005294977
    の公式を用い、前記BR2(i)は、第(i)フレームの修正ビットレートを示し、前記BR1(i)は、統計特徴の第(i)フレームのオリジナルビットレートを示し、前記√[Qavg(i)]は、統計特徴の第(i)フレームの複数の量子化スケールの平均の平方根を示し、前記BRtargetは、所定のターゲットビットレートを示し、前記Fwindowは、分析ウィンドウの若干のフレームを示し、前記FRは、一秒のビデオ再生で幾つのフレームが示される所定のフレームレートを示すことを特徴とする、請求項1に記載のビデオエンコーディング方法。
  6. 前記アウトポイントは、最初から、前記分析ウィンドウの二分の一から三分の一の長さに位置することを特徴とする、請求項1に記載のビデオエンコーディング方法。
  7. スライドウィンドウを用いた2パスビデオエンコーディングシステムであって、
    ビデオシーケンスを受信し、当該ビデオシーケンスのフレームの一部を分析ウィンドウとして選択し、最初とアウトポイント間で生じる前記分析ウィンドウからのフレームをエンコードウィンドウとして選択し、前記ビデオシーケンスが完全に符号化されない場合、前記アウトポイントの次のフレームからの前記ビデオシーケンスのフレームの一部分を、新しいウィンドウとして選択するスライドウィンドウ制御モジュールと、
    分析ウィンドウを受信し、前記分析ウィンドウ全体を符号化して、分析ウィンドウの各フレームの複合統計特徴を得る統計特徴捕捉モジュールと、
    前記統計特徴に従って、可変ビットレート分配方法により、前記分析ウィンドウの各フレームの第一ビットレートを計算するビットレート再分配モジュールと、
    前記修正ビットレートに従って、前記分析ウィンドウの前記フレームを符号化する可変ビットレートエンコードモジュールと、
    からなることを特徴とする、請求項に記載のビデオエンコーディングシステム。
  8. 前記分析ウィンドウのフレーム数は、900以上であることを特徴とする請求項7に記載のビデオエンコーディングシステム。
  9. 前記統計特徴は、マクロブロック、オリジナルのビットレート個々に対し、複数の量子化スケールを有することを特徴とする、請求項7に記載のビデオエンコーディングシステム。
  10. 前記可変ビットレート分配方法は、
    Figure 2005294977
    の公式を用い、前記BR2(i)は、第(i)フレームの修正ビットレートを示し、前記BR1(i)は、統計特徴の第(i)フレームのオリジナルビットレートを示し、前記√[Qavg(i)]は、統計特徴の第(i)フレームの複数の量子化スケールの平均の平方根を示し、前記BRtargetは、所定のターゲットビットレートを示し、前記Fwindowは、分析ウィンドウの若干のフレームを示し、前記FRは、一秒のビデオ再生で幾つのフレームが示される所定のフレームレートを示すことを特徴とする、請求項9に記載のビデオエンコーディング方法。
  11. 前記可変ビットレート分配方法は、
    Figure 2005294977
    の公式を用い、前記BR2(i)は、第(i)フレームの修正ビットレートを示し、前記BR1(i)は、統計特徴の第(i)フレームのオリジナルビットレートを示し、前記√[Qavg(i)]は、統計特徴の第(i)フレームの複数の量子化スケールの平均の平方根を示し、前記BRtargetは、所定のターゲットビットレートを示し、前記Fwindowは、分析ウィンドウの若干のフレームを示し、前記FRは、一秒のビデオ再生で幾つのフレームが示される所定のフレームレートを示すことを特徴とする、請求項7に記載のビデオエンコーディング方法。
  12. 前記アウトポイントは、最初から、前記分析ウィンドウの二分の一から三分の一の長さに位置することを特徴とする、請求項7に記載のビデオエンコーディングシステム。
  13. スライドウィンドウを用いた2パスビデオエンコーディング方法を実行する時、コンピュータプログラムを保存するコンピュータ読み取り記憶媒体であって、本方法は、
    ビデオシーケンスを受信する工程と、
    最初からの前記ビデオシーケンスのフレームの一部を分析ウィンドウとして選択する工程と、
    前記分析ウィンドウの各フレームを符号化して、複数の統計特徴を得る工程と、
    前記統計特徴に従って、可変ビットレート分配方法により、前記分析ウィンドウの各フレームに修正ビットレートを分配する工程と、
    前記修正されたビットレートに従って、前記最初とアウトポイントで生じる前記分析ウィンドウの前記フレームを符号化する工程と、
    前記ビデオシーケンスが完全に符号化されない場合、前記アウトポイントの次のフレームからの前記ビデオシーケンスのフレームの一部分を、新しい分析ウィンドウとして選択する工程と、
    からなることを特徴とする、コンピュータ読み取り記憶媒体。
  14. 前記分析ウィンドウのフレーム数は、900以上であることを特徴とする、請求項13に記載のコンピュータ読み取り記憶媒体。
  15. 前記統計特徴は、マクロブロック、オリジナルのビットレート個々に対し、複数の量子化スケールを有することを特徴とする、請求項13に記載のコンピュータ読み取り記憶媒体。
  16. 前記可変ビットレート分配方法は、
    Figure 2005294977
    の公式を用い、前記BR2(i)は、第(i)フレームの修正ビットレートを示し、前記BR1(i)は、統計特徴の第(i)フレームのオリジナルビットレートを示し、前記√[Qavg(i)]は、統計特徴の第(i)フレームの複数の量子化スケールの平均の平方根を示し、前記BRtargetは、所定のターゲットビットレートを示し、前記Fwindowは、分析ウィンドウの若干のフレームを示し、前記FRは、一秒のビデオ再生で幾つのフレームが示される所定のフレームレートを示すことを特徴とする、請求項15に記載のコンピュータ読み取り記憶媒体。
  17. 前記可変ビットレート分配方法は、
    Figure 2005294977
    の公式を用い、前記BR2(i)は、第(i)フレームの修正ビットレートを示し、前記BR1(i)は、統計特徴の第(i)フレームのオリジナルビットレートを示し、前記√[Qavg(i)]は、統計特徴の第(i)フレームの複数の量子化スケールの平均の平方根を示し、前記BRtargetは、所定のターゲットビットレートを示し、前記Fwindowは、分析ウィンドウの若干のフレームを示し、前記FRは、一秒のビデオ再生で幾つのフレームが示される所定のフレームレートを示すことを特徴とする、請求項13に記載のコンピュータ読み取り記憶媒体。
  18. 前記アウトポイントは、最初から、前記分析ウィンドウの二分の一から三分の一の長さに位置することを特徴とする、請求項13に記載のコンピュータ読み取り記憶媒体。
JP2004103718A 2004-03-31 2004-03-31 スライドウィンドウ(slidingwindow)を用いた2パスビデオエンコーディング方法とシステム Pending JP2005294977A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004103718A JP2005294977A (ja) 2004-03-31 2004-03-31 スライドウィンドウ(slidingwindow)を用いた2パスビデオエンコーディング方法とシステム
US10/828,199 US7302000B2 (en) 2004-03-31 2004-04-21 Method and system for two-pass video encoding using sliding windows
TW93122684A TWI249957B (en) 2004-03-31 2004-07-29 Method and system for two-pass video encoding using sliding windows

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004103718A JP2005294977A (ja) 2004-03-31 2004-03-31 スライドウィンドウ(slidingwindow)を用いた2パスビデオエンコーディング方法とシステム

Publications (1)

Publication Number Publication Date
JP2005294977A true JP2005294977A (ja) 2005-10-20

Family

ID=35060508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004103718A Pending JP2005294977A (ja) 2004-03-31 2004-03-31 スライドウィンドウ(slidingwindow)を用いた2パスビデオエンコーディング方法とシステム

Country Status (3)

Country Link
US (1) US7302000B2 (ja)
JP (1) JP2005294977A (ja)
TW (1) TWI249957B (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070230565A1 (en) * 2004-06-18 2007-10-04 Tourapis Alexandros M Method and Apparatus for Video Encoding Optimization
EP1841237B1 (en) * 2006-03-29 2014-10-08 TELEFONAKTIEBOLAGET LM ERICSSON (publ) Method and apparatus for video encoding
WO2009086455A1 (en) * 2007-12-28 2009-07-09 Nellcor Puritan Bennett Llc Airway instability index calculation system and method
US8667279B2 (en) * 2008-07-01 2014-03-04 Sling Media, Inc. Systems and methods for securely place shifting media content
US8385404B2 (en) 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
EP2200320A1 (en) * 2008-12-18 2010-06-23 Thomson Licensing Method and apparatus for two-pass video signal encoding using a sliding window of pictures
US8681858B2 (en) * 2009-12-23 2014-03-25 General Instrument Corporation Rate control for two-pass encoder
US8885050B2 (en) * 2011-02-11 2014-11-11 Dialogic (Us) Inc. Video quality monitoring
US8638854B1 (en) 2011-04-07 2014-01-28 Google Inc. Apparatus and method for creating an alternate reference frame for video compression using maximal differences
US9154799B2 (en) 2011-04-07 2015-10-06 Google Inc. Encoding and decoding motion via image segmentation
WO2013058750A1 (en) * 2011-10-19 2013-04-25 Harmonic Inc. Multi-channel variable bit-rate video compression
US10412424B2 (en) 2011-10-19 2019-09-10 Harmonic, Inc. Multi-channel variable bit-rate video compression
US9094684B2 (en) 2011-12-19 2015-07-28 Google Technology Holdings LLC Method for dual pass rate control video encoding
US9609341B1 (en) 2012-04-23 2017-03-28 Google Inc. Video data encoding and decoding using reference picture lists
TWI505262B (zh) 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
US9014266B1 (en) 2012-06-05 2015-04-21 Google Inc. Decimated sliding windows for multi-reference prediction in video coding
US9673841B2 (en) 2013-03-15 2017-06-06 Quanta Computer, Inc. Error-correcting code
US9756331B1 (en) 2013-06-17 2017-09-05 Google Inc. Advance coded reference prediction
WO2015095166A2 (en) * 2013-12-16 2015-06-25 Arris Enterprises, Inc. Producing an output need parameter for an encoder
US20150288965A1 (en) * 2014-04-08 2015-10-08 Microsoft Corporation Adaptive quantization for video rate control
EP4131975A4 (en) * 2020-04-14 2023-11-22 LG Electronics, Inc. POINT CLOUD DATA TRANSMITTING APPARATUS, POINT CLOUD DATA TRANSMITTING METHOD, POINT CLOUD DATA RECEIVING APPARATUS, AND POINT CLOUD DATA RECEIVING METHOD
CN112511854B (zh) * 2020-11-27 2023-03-24 刘亚虹 一种直播视频精彩片段生成方法、装置、介质和设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6747991B1 (en) * 2000-04-26 2004-06-08 Carnegie Mellon University Filter and method for adaptively modifying the bit rate of synchronized video and audio streams to meet packet-switched network bandwidth constraints
US6925120B2 (en) * 2001-09-24 2005-08-02 Mitsubishi Electric Research Labs, Inc. Transcoder for scalable multi-layer constant quality video bitstreams
US7099389B1 (en) * 2002-12-10 2006-08-29 Tut Systems, Inc. Rate control with picture-based lookahead window

Also Published As

Publication number Publication date
TW200533205A (en) 2005-10-01
US7302000B2 (en) 2007-11-27
US20050226321A1 (en) 2005-10-13
TWI249957B (en) 2006-02-21

Similar Documents

Publication Publication Date Title
JP2005294977A (ja) スライドウィンドウ(slidingwindow)を用いた2パスビデオエンコーディング方法とシステム
US5719632A (en) Motion video compression system with buffer empty/fill look-ahead bit allocation
US9762917B2 (en) Quantization method and apparatus in encoding/decoding
CN1169087C (zh) 多道数据压缩方法
US11792398B2 (en) Video encoding
JP3982835B2 (ja) 対話アプリケーション用画像データ圧縮
US20020057739A1 (en) Method and apparatus for encoding video
US12192478B2 (en) Adaptively encoding video frames using content and network analysis
KR20130018413A (ko) 랜덤 액세스 능력을 갖는 이미지 압축 방법
US11277619B2 (en) Rate control for video splicing applications
JP2002232882A (ja) 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。
US8045611B2 (en) Video processing and recording apparatuses and methods
CN114501029B (zh) 图像编码、图像解码方法、装置、计算机设备和存储介质
CN114257818A (zh) 视频的编、解码方法、装置、设备和存储介质
CN1211876A (zh) 数字信号编码方法和装置、信号记录介质和信号传送方法
US7113644B2 (en) Image coding apparatus and image coding method
JP3833744B2 (ja) 物体領域符号化装置
JP2010098352A (ja) 画像情報符号化装置
Jubran et al. Sequence-level reference frames in video coding
JP2009171339A (ja) 動画像符号化装置、方法及びプログラム
CN117714700A (zh) 一种视频编码方法、装置、设备、可读存储介质及产品
US20060061497A1 (en) Bit rate conversion apparatus and method
CN112822493A (zh) 基于复杂度来适应性地对视频帧进行编码
US20080317121A1 (en) Rate control methods and devices
JP4514666B2 (ja) 動画像符号化装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20070411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071127

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080226

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080227

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080229

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080303

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090414