JP4949591B2 - ビデオ誤り回復方法 - Google Patents

ビデオ誤り回復方法 Download PDF

Info

Publication number
JP4949591B2
JP4949591B2 JP2002505524A JP2002505524A JP4949591B2 JP 4949591 B2 JP4949591 B2 JP 4949591B2 JP 2002505524 A JP2002505524 A JP 2002505524A JP 2002505524 A JP2002505524 A JP 2002505524A JP 4949591 B2 JP4949591 B2 JP 4949591B2
Authority
JP
Japan
Prior art keywords
video
frame
video frames
video frame
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002505524A
Other languages
English (en)
Other versions
JP2004502359A (ja
JP2004502359A5 (ja
Inventor
ハンヌクセラ ミスカ
Original Assignee
ロアク エヌディー インベストメンツ エル.エル.シー.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ロアク エヌディー インベストメンツ エル.エル.シー. filed Critical ロアク エヌディー インベストメンツ エル.エル.シー.
Publication of JP2004502359A publication Critical patent/JP2004502359A/ja
Publication of JP2004502359A5 publication Critical patent/JP2004502359A5/ja
Application granted granted Critical
Publication of JP4949591B2 publication Critical patent/JP4949591B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Description

【0001】
(技術分野)
本発明は、通信ネットワーク上でのマルチメディア・データ転送、特に、エラーを起こしやすいネットワーク上でのビデオ・データ転送に関する。本発明は、データ損失によるビデオ画像の知覚品質の劣化を軽減することができる新しい方法を提供する。
【0002】
(背景技術)
本発明の利点を理解してもらうためには、従来技術による周知の通常のマルチメディア・コンテンツの生成および検索システムの枠組みの再検討をし、圧縮ビデオ・シーケンスの特徴を紹介すれば、理解がかなり容易になると考える。以下の説明においては、情報が、パケットをベースとするデータ・プロトコル(例えば、インターネット)により送信されるネットワーク内に記憶されているマルチメディア・データの検索を重点的に説明するが、本発明は、同じように固定ラインPSTN(公衆電話網)または移動PLMN(公衆陸上移動通信網)電話システムにも適用することができることを理解されたい。本発明は、また、パケットをベースとするプロトコルと回線交換データ伝送プロトコルの組合わせを使用するネットワークでも適用することができる。例えば、現在標準化が行われている汎用移動電話システム(UMTS)は、回線交換素子およびパケットをベースとする素子の両方を含むことができる。本発明は、ビデオ・ストリーミングのような非リアルタイムの用途にも適用することができるし、ビデオ電話のようなリアルタイムの通信の用途にも適用することができる。
【0003】
図1は、通常のマルチメディア・コンテンツ生成および検索システムである。全体を参照番号1で示すこのシステムは、1つまたはそれ以上のマルチメディア・コンテンツ・ソース10を持つ。これらのソースは、例えば、ビデオ・カメラおよびマイクロホンを含むことができるが、他の素子も含むことができる。例えば、マルチメディア・コンテンツは、また、コンピュータ・アニメ・グラフィックス、またはネットワークで接続しているハードドライブのような大容量記憶媒体上に記憶しているデータ・ファイルのライブラリを含むことができる。
【0004】
(「トラック」と呼ばれる)異なる媒体タイプからなるマルチメディア・クリップを構成するために、種々のソース10から捕捉または検索した生のデータを結合させることができる。図1のマルチメディア生成および検索システムの場合には、このタスクはエディタ12により行われる。生のマルチメディア・データが必要とする記憶スペースは、通常、メガバイト単位の巨大なものである。それ故、特に低いビット速度のチャネルを通じて魅力的なマルチメディア検索サービスを容易に行うために、通常、編集プロセスの際にマルチメディア・クリップが圧縮される。マルチメディア・クリップを形成するために、生のデータの種々のソースが結合され、圧縮されると、クリップは、マルチメディア・サーバ14に送られる。通常、多数のクライアント16が、同じ形式のネットワークを通してサーバにアクセスすることができるが、分かりやすくするために、図1にはクライアントは1つしか図示していない。
【0005】
サーバ14は、クライアントが提示する要求および制御コマンド15に応答することができる。サーバの主なタスクは、クライアント16に必要なマルチメディア・クリップを送信することである。クライアントがクリップを受信すると、このクリップは、クライアントの端末装置のところで解凍され、マルチメディア・コンテンツが「再生」される。再生の段階で、マルチメディア・クリップの各成分は、クライアントの端末装置内に設置されている適当な再生手段18上に表示される。例えば、ビデオコンテンツは、端末装置のディスプレイ上に表示され、オーディオコンテンツはラウドスピーカ等で再生される。
【0006】
図2を参照しながら、マルチメディア・クリップ・エディタ12の動作をさらに詳細に説明する。生のデータは、1つまたはそれ以上のデータ・ソース10から捕捉デバイス20により捕捉される。データはハードウェア、専用デバイス・ドライバ(すなわち、ソフトウェア)およびそのデバイス・ドライバを制御することによりハードウェアを使用する捕捉アプリケーション・プログラムにより捕捉される。例えば、データ・ソースがビデオ・カメラである場合には、ビデオ・データを捕捉するのに必要なハードウェアは、パーソナル・コンピュータに取り付けられているビデオ・グラッバ・カードから構成することができる。捕捉デバイス20の出力は、一般に、圧縮していないデータ、または圧縮していないデータと比較した場合、品質に無関係な若干圧縮したデータである。例えば、ビデオ・グラッバ・カードの出力は、圧縮していないYUV4:2:0フォーマット、またはモーションJPEG画像フォーマットのビデオ・フレームであってもよい。「ストリーム」という用語は、実際には、多くの場合、マルチメディア・データがリアルタイムで種々のソースから、生のデータの連続している「流れ」から捕捉されることを意味する。他の方法としては、マルチメディア・データのソースを、ネットワーク・ハードドライブのような大容量記憶媒体上に常駐する、予め記憶したファイルの形にすることもできる。
【0007】
エディタ22は、個々の媒体ソース10から入手した別々の媒体ストリームを1つの時間的ラインにリンクする。例えば、オーディオコンテンツおよびビデオコンテンツのような同時に再生しなければならないマルチメディア・ストリームは、各フレームの必要な再生時間を表示してリンクされる。他のマルチメディア・ストリームの必要な再生時間の表示も行うことができる。最初は独立していたマルチメディア・ストリームが、このような方法で現在リンクしていることを表示するために、この点から、マルチメディア「トラック」という用語が、マルチメディア・コンテンツを表示するための一般的な用語として使用される。また、エディタ22は、種々の方法でマルチメディア・トラックを編集することもできる。例えば、ビデオ・フレーム速度を半分に減速することもできるし、ビデオ画像の空間的解像度を低減することもできる。
【0008】
圧縮段階24においては、問題の媒体タイプに対して適当な方法で、各媒体トラックを別々に圧縮することができる。例えば、圧縮していないYUV4:2:0ビデオ・トラックを低ビット速度ビデオ符号化用のITU-T勧告H.263により圧縮することができる。多重化段階26においては、1つのビット・ストリームとなるように圧縮媒体トラックがインターリーブされる。多数の異なる媒体タイプからなる、この1本のビット・ストリームは、「マルチメディア・クリップ」と呼ばれる。しかし、マルチメディア・ビット・ストリームを供給する場合、多重化が不可欠なものではないことに留意されたい。次に、クリップは、マルチメディア・サーバ14に送られる。
【0009】
図3のフローチャートを参照しながら、マルチメディア・サーバ14の動作をより詳細に説明する。通常、マルチメディア・サーバは、2つの動作モード、すなわち、非リアルタイム・モードとリアルタイム・モードとを持つ。すなわち、マルチメディア・サーバは、予め記憶しているマルチメディア・クリップ、または生の(リアルタイムの)マルチメディア・ストリームを供給することができる。前者の場合には、最初にサーバのデータベース30内にクリップを記憶しなければならない。次に、サーバが、「オンデマンド」モードでこのデータベースにアクセスする。後者の場合、マルチメディア・クリップは、エディタ12により、連続的媒体ストリームとしてサーバに送られ、直ちにクライアント16に送られる。サーバは、多重化フォーマットで使用されるヘッダ情報の中のいくつかを除去し、圧縮することができ、また媒体クリップをネットワーク上で送るのに適当なパケット内に収容することもできる。クライアントは、「制御プロトコル」15により、サーバの動作を制御する。制御プロトコルが供給する最小の一組の制御は、必要な媒体クリップを選択する機能からなる。さらに、サーバは、もっと高度の制御をサポートすることができる。例えば、クライアント16は、クリップの送信をストップすることができ、またはその送信を一時的にストップし、再開することもできる。さらに、クライアントは、伝送チャネルの処理能力が何らかの理由で変動した場合、媒体の流れを制御することができる。この場合、サーバは、動的に送信のために使用できる帯域幅を利用するために、ビット・ストリームを調整する。
【0010】
図4は、通常のマルチメディア検索クライアント16に属するモジュールである。マルチメディア・サーバから圧縮および多重化した媒体クリップを検索している場合、クライアントは、クリップ内に含まれている異なる媒体トラックを分離するために、最初にクリップ40を逆多重化する。その後で、個々の媒体トラックが解凍される(42)。次に、解凍された(再構成された)媒体トラックが、クライアントの出力デバイス18により再生される。これらの動作の他に、クライアントは、エンド・ユーザに対してインターフェースとして機能し、ユーザ入力により再生を制御し、クライアント−サーバ制御トラヒックを処理するコントローラ・ユニット46を含む。逆多重化動作、解凍動作および再生動作は、クリップの以降の部分をダウンロードしながら行うことができることに留意されたい。この方法は、通常、「ストリーミング」と呼ばれる。他の方法としては、クライアントは、全クリップをダウンロードし、それを逆多重化し、個々の媒体トラックのコンテンツを解凍し、その後にのみ、再生機能をスタートすることができる。
【0011】
次に、通信ネットワークでの送信に適しているデジタル・ビデオ・シーケンスの性質について説明する。フィルム上に記録された通常の映画のようなビデオ・シーケンスは、一連の静止画像を含み、通常は、15〜30フレーム/秒の比較的速い速度で画像を順次表示することにより、画像が動いているように見せる。フレーム速度が比較的速いために、連続しているフレーム内の画像は、非常によく似ている傾向があり、そのため、かなりの量の冗長な情報を含む。例えば、通常、1つのシーンは、例えば、背景および、例えば、ニュースキャスターの顔、交通等のような多くの種々の形をとる、ある種の動いている領域のようないくつかの静止素子を含む。他の方法としては、そのシーンを撮影しているカメラ自身が移動することができ、その場合、画像のすべての素子は、同じ種類の動作をする。多くの場合、このことは、あるビデオ・フレームと次のビデオ・フレームとの間の全体の変化が、どちらかといえば小さいことを意味する。もちろん、このような変化は、運動の性質により異なる。例えば、動作が速ければ速いほど、あるフレームと次のフレームとの間の変化は大きい。同様に、あるシーンが多数の運動する素子を含んでいる場合には、あるフレームと次のフレームとの間の変化は、1つの素子だけが運動している場合よりも大きい。
【0012】
ビデオ圧縮方法の基本は、ビデオ・シーケンスの冗長で知覚上関係のない部分を低減することである。ビデオ・シーケンス内の冗長な部分は、空間的な冗長な部分、時間的に冗長な部分、スペクトル的に冗長な部分に分類することができる。「空間的に冗長な部分」は、隣接するピクセル間の相互関連を示すために使用する用語である。「時間的に冗長な部分」という用語は、1つの画像内に現れる対象物が、後続の画像内に現れる対象物に類似していることを表す用語であり、一方、「スペクトル的に冗長な部分」は同じ画像の異なるカラー成分間の相互関連を表す。
【0013】
単に、画像の所与のシーケンス内の種々の形の冗長な部分を低減するだけでは、普通、十分効率的な圧縮を行うことはできない。それ故、大部分の現在のビデオ・エンコーダは、主観的に最も重要でないビデオ・シーケンスのこれらの部分の品質も低減する。さらに、符号化されたビット・ストリーム自身の冗長な部分も、圧縮パラメータおよび係数の効率的で損失の少ない符号化により削除される。通常、この削除は、「可変長符号化」(VLC)と呼ばれる技術により行われる。
【0014】
ビデオ圧縮方法は、通常、「動作補正時間的予測」を使用する。この方法は、フレーム間の画像の対象物または領域の動きを追跡することにより、シーケンス内の他のフレームからビデオ・シーケンス内のいくつかの(多くの場合、多数の)フレームを「予測」することができる時間的に冗長な部分を削除する方法である。時間的に冗長な部分の削除方法を使用しない圧縮画像は、通常、INTRAまたはIフレームと呼ばれ、一方、時間的に予測された画像は、INTERまたはPフレームと呼ばれる。INTERフレームの場合には、予測した(動作補正)画像が十分正確であることはほとんどない。それ故、空間的に圧縮された予測誤り画像は、各INTERフレームとも関連している。多くのビデオ圧縮スキームは、通常、B画像またはBフレームと呼ばれる2方向予測フレームも導入する。B画像は、基準またはいわゆる「アンカー」画像のペア(IまたはPフレーム)の間に挿入され、図5に示すように、アンカー画像の一方または両方から予測される。図を見れば分かるように、シーケンスは、INTRAまたはIフレーム50からスタートする。B画像(全体を参照番号52で示す)は、通常、順方向予測P画像54と比較した場合、圧縮比が高い。図5の場合には、矢印51aおよび51bは、2方向の予測プロセスを示し、一方、矢印53は順方向の予測を示す。B画像は、アンカー画像としては使用されない、すなわち、B画像からは他のフレームは予測されない。それ故、B画像は、ビデオ・シーケンスから捨てられるが、それにより将来の画像の品質は劣化しない。B画像はP画像と比較した場合、圧縮性能を改善するが、構成のために、より大容量のメモリを必要とし、その処理要件はもっと複雑になり、B画像を使用すると遅延が大きくなる。
【0015】
時間的予測の上記説明を読めば、所与のフレーム内で画像コンテンツの劣化を招くデータ損失の影響は、時間と共に伝播し、そのフレームから予測される後続のフレームを劣化させることがはっきりわかるだろう。また、ビデオ・シーケンスの符号化は、INTRAフレームからスタートすることも分かる。何故なら、シーケンスのスタート部分では、予測の基準を形成するために、前のフレームを使用することができないからである。しかし、例えば、クライアントの端末装置18に表示された場合に、フレームの再生順序は、符号化/復号化の順序とは異なる場合があることに留意されたい。それ故、INTRAフレームから符号化/復号化動作がスタートするが、このことは、フレームをINTRAフレームから再生しなければならないことを意味していない。
【0016】
低いビット速度のビデオ符号化で使用される、異なる画像タイプについての詳細な情報は、1998年11月の、ビデオ技術用の回路およびシステムに関するIEEE議事録の、G.コート、B.エロール、M.ギャラント、およびF.コセンティニの論文、「H.263+:低いビット速度でのビデオ符号化」を参照されたい。
【0017】
現在周知のマルチメディア検索システムおよびビデオ符号化(圧縮)技術の性質に関する上記情報から考えて、通信ネットワークによるビデオ・シーケンスの検索/ストリーミングで重要な問題が発生することを理解されたい。ビデオ・フレームは、通常、あるフレームが他のフレームから予測されるので、圧縮ビデオ・シーケンスは、特に伝送誤りを起こしやすい。ネットワーク伝送誤りによりデータ損失が発生した場合には、ビット・ストリームのコンテンツに関する情報が失われる。伝送誤りの影響は変化する場合がある。ビデオ・フレームの再構成に極めて重要な情報(例えば、画像ヘッダ内に記憶している情報)に損失があると、受信クライアントのところで画像を表示することができなくなる。それ故、全フレームおよびそれから予測したフレームの任意のシーケンスも失われる(すなわち、再構成し表示することができない)。情報の損失が軽度の場合には、画像コンテンツの一部だけが影響を受ける。しかし、劣化したフレームから予測したフレームも影響を受け、次のINTRAフレームが送信され、正しく再構成されるまで、エラーが、画像シーケンス内を時間的かつ空間的に伝播する。この問題は、(例えば、INTRAフレームが10秒毎に送信されるというような)INTRAフレームが頻繁に送信されない非常に低いビット速度通信の場合には、非常に深刻な問題になる。
【0018】
伝送誤りの性質は、問題の通信ネットワークにより異なる。固定ラインおよび移動電話システムのような回線交換ネットワークの場合には、伝送誤りは、通常、ビットの反転という形をとる。すなわち、例えば、マルチメディア・ストリームのビデオコンテンツを示すデジタル・データは、1が0になったり、0が1になったりするように劣化し、画像コンテンツが誤って表示される結果となる。移動電話ネットワークの場合には、ビット反転誤りは、通常、無線リンク品質の劣化により発生する。
【0019】
パケット交換データ通信を使用するネットワークの場合には、伝送誤りは、パケット損失の形をとる。このタイプのネットワークの場合には、データ・パケットは、通常、ネットワーク内の混雑のために失われる。ネットワークが混雑すると、ゲートウェイ・ルータのようなネットワーク素子が、データ・パケットを捨てる場合があり、UDP(ユーザ・データグラム・プロトコル)のような信頼性の低い転送プロトコルを使用している場合には、損失パケットは再送信されない。さらに、ネットワークの観点からいえば、数百バイトを含む比較的大きなパケットを送信するほうが有利であり、それ故、損失パケットは、低いビット速度のビデオ・シーケンスのいくつかの画像を含んでいる場合がある。通常、大多数のビデオ・フレームは、時間的に予測されたINTERフレームであり、それ故、1つまたはそれ以上のこのような画像に損失があると、クライアントの端末のところで再構成した場合、ビデオ・シーケンスの品質に重大な影響を与える。1つまたはそれ以上のフレームに損失が生じるばかりでなく、これらのフレームから予測したすべての後続の画像も劣化する。
【0020】
多くの従来技術の方法は、伝送誤りによる圧縮ビデオ・シーケンスの劣化に関連する問題に取り組んでいる。通常、これらの方法は、「誤り回復」方法とよばれ、通常、2つの分類、すなわち、誤り訂正方法および隠蔽方法に分類される。誤り訂正は、最初の場所に全然誤りが起こらなかったかのように、誤ったデータを完全に回復する機能である。例えば、再送信は、誤り訂正方法であると見なすことができる。誤り隠蔽は、再構成したビデオにおいて、目で見てほとんど誤りに気がつかないように伝送誤りの影響を覆い隠す機能である。誤り隠蔽方法は、通常、3つの分類、すなわち順方向誤り隠蔽、後処理による誤り隠蔽、および会話型誤り隠蔽に分けられる。順方向誤り隠蔽は、伝送誤りが発生しても、受信機がデータを容易に回復することができるように、送信端末が送信データにある程度の冗長性を与える技術である。例えば、送信ビデオ・エンコーダは、圧縮ビデオ信号の予測経路を短縮することができる。一方、後処理による誤り隠蔽は、完全に受信機指向の技術である。これらの方法は、間違って受信したデータの正しい表現を推定しようとする。送信機および受信機は、伝送誤りの影響を最低限度に低減するために協力することができる。これらの方法は、主に受信機からのフィードバック情報に依存している。後処理による誤り隠蔽は、受動的誤り隠蔽と呼ぶこともできる。一方、他の2つの分類は、能動的誤り隠蔽である。本発明は、ビデオ圧縮の際に使用する予測経路を短縮する方法に属する。下記の方法は、パケット交換ネットワークまたは回線交換ネットワークを通して送信される圧縮ビット・ストリームにも同様に適用することができることに留意されたい。基本的データ・ネットワークおよび発生する伝送誤りのタイプの性質は、従来技術の上記説明および本発明の適用の両方に本質的に無関係である。
【0021】
ビデオ・シーケンスの予測経路を短縮する誤り回復方法は、下記の原理に基づいている。ビデオ・シーケンスがINTERフレームの長いトレーンを含んでいる場合には、伝送誤りによる画像データ損失は、すべての後続の復号化INTERフレームの劣化を引き起こし、エラーは伝播し、復号化ビデオ・ストリームで長時間目で見ることができるようになる。それ故、システムの誤り回復は、ビデオ・ビット・ストリーム内のINTERフレーム・シーケンスの長さを短くすることにより、改善することができる。このような改善は、1.ビデオ・ストリーム内のINTRAフレームの頻度を増大すること、2.Bフレームを使用すること、3.基準画像を選択すること、4.ビデオ冗長性符号化と呼ばれる技術を使用すること、により行うことができる。
【0022】
ビデオ・シーケンス内の予測経路の長さを短縮するための従来技術による方法は、すべて圧縮シーケンスのビット速度を増大する傾向があることを実証することができる。このような傾向は、特に、低いビット速度の伝送チャネル、または使用できる全部の帯域幅を複数のユーザの間で共有しなければならないチャネル内においては、望ましくない影響である。ビット速度の増大は、使用する方法および符号化するビデオ・シーケンスの正確な性質により異なる。
【0023】
マルチメディア検索システム、および圧縮ビデオ・シーケンスの性質に関連する上記の説明から考えて、知覚画像品質に対する伝送誤りの影響の制限に関連する重要な問題があることを理解することができるだろう。ある種の従来技術の方法は、圧縮ビデオ・シーケンス内で使用する予測経路の長さを制限することによりこの問題を解決しているが、ほとんどの場合、このような方法を使用すると、シーケンスを符号化するのに必要なビット速度が増大する結果になる。それ故、本発明の1つの目的は、ビット速度を許容できる低い速度に維持しながら、伝送誤りへの圧縮ビデオ・シーケンスの回復力を改善することである。
【0024】
(発明の開示)
上記目的に従い、第1の態様においては、本発明は、圧縮ビデオ・シーケンスを形成するために、ビデオ・フレーム・シーケンスを符号化するための方法を提供する。上記圧縮ビデオ・シーケンスは、少なくとも第1の圧縮ビデオ・フレーム・フォーマットおよび第2の圧縮ビデオ・フレーム・フォーマットに符号化されたフレームを含み、上記第1の圧縮ビデオ・フレーム・フォーマットは、非時間的予測フォーマットであり、上記第2の圧縮ビデオ・フレーム・フォーマットは、時間的予測フォーマットである。上記方法は、第1のビデオ・フレームが、第1の圧縮ビデオ・フレーム・フォーマットに符号化されるべきことを示す、上記第1のビデオ・フレームに関連する第1の表示を識別するステップと、上記第1の表示を第2のビデオ・フレームに関連づけるステップと、上記第1の圧縮ビデオ・フレーム・フォーマットに上記第2のビデオ・フレームを符号化するステップと、上記第2のビデオ・フレームの前に発生するN個のビデオ・フレームを含む第1の組のビデオ・フレームを定義するステップと、上記第2の圧縮ビデオ・フレーム・フォーマットに上記第1の組のビデオ・フレームを符号化するステップと、上記第2のビデオ・フレームの後に発生するM個のビデオ・フレームを含む第2の組のビデオ・フレームを定義するステップと、上記第2の圧縮ビデオ・フレーム・フォーマットに上記第2の組のビデオ・フレームを符号化するステップとを含むことを特徴とする。
【0025】
第2の態様によれば、本発明は、圧縮ビデオ・シーケンスを形成するために、ビデオ・フレーム・シーケンスを符号化するためのビデオ・エンコーダを提供する。上記圧縮ビデオ・シーケンスは、少なくとも第1の圧縮ビデオ・フレーム・フォーマット、および第2の圧縮ビデオ・フレーム・フォーマットに符号化されたフレームを含み、上記第1の圧縮ビデオ・フレーム・フォーマットは、非時間的予測フォーマットであり、上記第2の圧縮ビデオ・フレーム・フォーマットは、時間的予測フォーマットである。上記エンコーダは、上記第1のビデオ・フレームが、上記第1の圧縮ビデオ・フレーム・フォーマットに符号化されるべきことを示す、第1のビデオ・フレームに関連する第1の表示を識別するための手段と、上記第1の表示を第2のビデオ・フレームに関連づけるための手段と、上記第1の圧縮ビデオ・フレーム・フォーマットに上記第2のビデオ・フレームを符号化するための手段と、上記第2のビデオ・フレームの前に発生するN個のビデオ・フレームを含む第1の組のビデオ・フレームを定義するための手段と、上記第2の圧縮ビデオ・フレーム・フォーマットに上記第1の組のビデオ・フレームを符号化するための手段と、上記第2のビデオ・フレームの後に発生するM個のビデオ・フレームを含む第2の組のビデオ・フレームを定義するための手段と、上記第2の圧縮ビデオ・フレーム・フォーマットに上記第2の組のビデオ・フレームを符号化するための手段とを含むことを特徴とする。
【0026】
第3の態様によれば、本発明は、本発明の第2の態様のビデオ・エンコーダを含むビデオ・コーデックを提供する。
第4の態様によれば、本発明は、本発明の第2の態様のビデオ・エンコーダを含むマルチメディア・コンテンツ生成システムを提供する。
第5の態様によれば、本発明は、本発明の第2の態様のビデオ・エンコーダを含むマルチメディア端末を提供する。
第6の態様によれば、本発明は、上記端末が無線通信デバイスであることを特徴とする、本発明の第5の態様のマルチメディア端末を提供する。
【0027】
第7の態様によれば、本発明は、解凍ビデオ・フレーム・シーケンスを形成するために、圧縮ビデオ・フレーム・シーケンスを復号化する方法を提供する。上記圧縮ビデオ・シーケンスは、少なくとも第1の圧縮ビデオ・フレーム・フォーマット、および第2の圧縮ビデオ・フレーム・フォーマットに符号化されたフレームを含み、上記第1の圧縮ビデオ・フレーム・フォーマットは、非時間的予測フォーマットであり、上記第2の圧縮ビデオ・フレーム・フォーマットは、時間的予測フォーマットである。上記方法は、上記第1のビデオ・フレームが、上記第1の圧縮ビデオ・フレーム・フォーマットに符号化される第1のビデオ・フレームに関連する第1の表示を識別するステップと、上記第1のビデオ・フレームを復号化するステップと、上記解凍ビデオ・シーケンス内の上記第1のビデオ・フレームの前に挿入するために、上記第2の圧縮ビデオ・フレーム・フォーマットのN個のビデオ・フレームの第1の組を受信するステップと、N個のビデオ・フレームの上記第1の組を復号化するステップと、第1の組のフレームに関連する再生情報により第1の組のフレームを再編成するステップと、上記解凍ビデオ・シーケンス内の上記第1のビデオ・フレームの後に挿入するために、上記第2の圧縮ビデオ・フレーム・フォーマットのM個のビデオ・フレームの第2の組を受信するステップと、ビデオ・フレームの上記第2の組を復号化するステップとを含むことを特徴とする。
【0028】
第8の態様によれば、本発明は、解凍ビデオ・フレーム・シーケンスを形成するために、圧縮ビデオ・シーケンスを復号化するためのビデオ・デコーダを提供する。上記圧縮ビデオ・シーケンスは、少なくとも第1の圧縮ビデオ・フレーム・フォーマット、および第2の圧縮ビデオ・フレーム・フォーマットに符号化されたフレームを含み、上記第1の圧縮ビデオ・フレーム・フォーマットは、非時間的予測フォーマットであり、上記第2の圧縮ビデオ・フレーム・フォーマットは、時間的予測フォーマットである。デコーダは、上記第1のビデオ・フレームが、上記第1の圧縮ビデオ・フレーム・フォーマットに符号化される第1のビデオ・フレームに関連する第1の表示を識別するための手段と、上記第1のビデオ・フレームを復号化するための手段と、上記解凍ビデオ・シーケンス内の上記第1のビデオ・フレームの前に挿入するために、上記第2の圧縮ビデオ・フレーム・フォーマットのN個のフレームの第1の組を受信するための手段と、N個のビデオ・フレームの第1の組を復号化するための手段と、上記第1の組のフレームに関連する再生情報により上記第1の組のフレームのフレームを順序づけるための手段と、上記解凍ビデオ・シーケンス内の上記第1のビデオ・フレームの後に挿入するために、上記第2の圧縮ビデオ・フレーム・フォーマットのM個のビデオ・フレームの第2の組を受信するための手段と、ビデオ・フレームの上記第2の組を復号化するための手段とを備えることを特徴とする。
【0029】
第9の態様によれば、本発明は、本発明の第8の態様のビデオ・デコーダを含むビデオ・コーデックを提供する。
第10の態様によれば、本発明は、本発明の第8の態様のビデオ・デコーダを含むマルチメディア・コンテンツ検索システムを提供する。
第11の態様によれば、本発明は、本発明の第8の態様のビデオ・デコーダを含むマルチメディア端末を提供する。
第12の態様によれば、本発明は、上記端末が無線通信デバイスであることを特徴とする、本発明の第11の態様のマルチメディア端末を提供する。
【0030】
第13の態様によれば、本発明は、圧縮ビデオ・シーケンスを形成するために、ビデオ・フレーム・シーケンスを符号化するためのビデオ・エンコーダとしてコンピュータを動作させるためのコンピュータ・プログラムを提供する。上記圧縮ビデオ・シーケンスは、少なくとも第1の圧縮ビデオ・フレーム・フォーマット、および第2の圧縮ビデオ・フレーム・フォーマットに符号化されたフレームを含み、上記第1の圧縮ビデオ・フレーム・フォーマットは、非時間的予測フォーマットであり、上記第2の圧縮ビデオ・フレーム・フォーマットは、時間的予測フォーマットである。上記コンピュータ・プログラムは、上記第1のビデオ・フレームを上記第1の圧縮ビデオ・フレーム・フォーマットに符号化すべきことを示す、第1のビデオ・フレームに関連する第1の表示を識別するためのコンピュータ実行コードと、上記第1の表示を第2のビデオ・フレームに関連づけるためのコンピュータ実行コードと、上記第1の圧縮ビデオ・フレーム・フォーマットに上記第2のビデオ・フレームを符号化するためのコンピュータ実行コードと、上記第2のビデオ・フレームの前に発生するN個のビデオ・フレームを含む第1の組のビデオ・フレームを定義するためのコンピュータ実行コードと、上記第2の圧縮ビデオ・フレーム・フォーマットに上記第1の組のビデオ・フレームを符号化するためのコンピュータ実行コードと、上記第2のビデオ・フレームの後に発生するM個のビデオ・フレームを含む第2の組のビデオ・フレームを定義するためのコンピュータ実行コードと、上記第2の圧縮ビデオ・フレーム・フォーマットに上記第2の組のビデオ・フレームを符号化するためのコンピュータ実行コードとを含むことを特徴とする。
【0031】
第14の態様によれば、本発明は、圧縮ビデオ・フレーム・シーケンスを形成するために、圧縮ビデオ・フレーム・シーケンスを復号化するためのビデオ・デコーダとしてコンピュータを動作させるためのコンピュータ・プログラムを提供する。上記圧縮ビデオ・シーケンスは、少なくとも第1の圧縮ビデオ・フレーム・フォーマット、および第2の圧縮ビデオ・フレーム・フォーマットに符号化されたフレームを含み、上記第1の圧縮ビデオ・フレーム・フォーマットは、非時間的予測フォーマットであり、上記第2の圧縮ビデオ・フレーム・フォーマットは、時間的予測フォーマットである。上記コンピュータ・プログラムは、上記第1のビデオ・フレームが、上記第1の圧縮ビデオ・フレーム・フォーマットに符号化される第1のビデオ・フレームに関連する第1の表示を識別するためのコンピュータ実行コードと、上記第1のビデオ・フレームを復号化するためのコンピュータ実行コードと、上記解凍ビデオ・シーケンス内の上記第1のビデオ・フレームの前に挿入するために、上記第2の圧縮ビデオ・フレーム・フォーマットのN個のフレームの第1の組を受信するためのコンピュータ実行コードと、N個のビデオ・フレームの上記第1の組を復号化するためのコンピュータ実行コードと、上記第1の組のフレームに関連する再生情報に従って上記第1の組のフレームのフレームを順序づけるためのコンピュータ実行コードと、上記解凍ビデオ・シーケンス内の上記第1のビデオ・フレームの後に挿入するために、上記第2の圧縮ビデオ・フレーム・フォーマットのM個のビデオ・フレームの第2の組を受信するためのコンピュータ実行コードと、ビデオ・フレームの上記第2の組を復号化するためのコンピュータ実行コードとを含むことを特徴とする。
【0032】
第15の態様によれば、本発明は、本発明の第13および14の態様のコンピュータ・プログラムを提供する。
【0033】
他の態様によれば、本発明は、圧縮ビデオ・フレーム・シーケンスを形成するために、ビデオ・フレーム・シーケンスを符号化するためのビデオ・エンコーダとしてコンピュータを動作させるためのコンピュータ・プログラムを含む記憶媒体を提供する。上記圧縮ビデオ・シーケンスは、少なくとも第1の圧縮ビデオ・フレーム・フォーマット、および第2の圧縮ビデオ・フレーム・フォーマットに符号化されたフレームを含み、上記第1の圧縮ビデオ・フレーム・フォーマットは、非時間的予測フォーマットであり、上記第2の圧縮ビデオ・フレーム・フォーマットは、時間的予測フォーマットである。上記記憶媒体は、上記第1のビデオ・フレームが、上記第1の圧縮ビデオ・フレーム・フォーマットに符号化されるべきことを示す、第1のビデオ・フレームに関連する第1の表示を識別するためのコンピュータ実行コードと、上記第1の表示を第2のビデオ・フレームに関連づけるためのコンピュータ実行コードと、上記第1の圧縮ビデオ・フレーム・フォーマットに上記第2のビデオ・フレームを符号化するためのコンピュータ実行コードと、上記第2のビデオ・フレームの前に発生するN個のビデオ・フレームを含む第1の組のビデオ・フレームを定義するためのコンピュータ実行コードと、上記第2の圧縮ビデオ・フレーム・フォーマットに上記第1の組のビデオ・フレームを符号化するためのコンピュータ実行コードと、上記第2のビデオ・フレームの後に発生するM個のビデオ・フレームを含む第2の組のビデオ・フレームを定義するためのコンピュータ実行コードと、上記第2の圧縮ビデオ・フレーム・フォーマットに上記第2の組のビデオ・フレームを符号化するためのコンピュータ実行コードとを含むことを特徴とする。
【0034】
他の態様によれば、本発明は、解凍ビデオ・フレーム・シーケンスを形成するために、圧縮ビデオ・フレーム・シーケンスを復号化するためのビデオ・デコーダとして、コンピュータを動作させるためのコンピュータ・プログラムを含む記憶媒体を提供する。上記圧縮ビデオ・シーケンスは、少なくとも第1の圧縮ビデオ・フレーム・フォーマット、および第2の圧縮ビデオ・フレーム・フォーマットに符号化されたフレームを含み、上記第1の圧縮ビデオ・フレーム・フォーマットは、非時間的予測フォーマットであり、上記第2の圧縮ビデオ・フレーム・フォーマットは、時間的予測フォーマットである。上記記憶媒体は、上記第1のビデオ・フレームが、上記第1の圧縮ビデオ・フレーム・フォーマットに符号化される第1のビデオ・フレームに関連する第1の表示を識別するためのコンピュータ実行コードと、上記第1のビデオ・フレームを復号化するためのコンピュータ実行コードと、上記解凍ビデオ・シーケンス内の上記第1のビデオ・フレームの前に挿入するために、上記第2の圧縮ビデオ・フレーム・フォーマットのN個のフレームの第1の組を受信するためのコンピュータ実行コードと、N個のビデオ・フレームの第1の組を復号化するためのコンピュータ実行コードと、第1の組のフレームに関連する再生情報により第1の組のフレームを順序づけるためのコンピュータ実行コードと、上記解凍ビデオ・シーケンス内の上記第1のビデオ・フレームの後に挿入するために、上記第2の圧縮ビデオ・フレーム・フォーマットのM個のビデオ・フレームの第2の組を受信するためのコンピュータ実行コードと、ビデオ・フレームの上記第2の組を復号化するためのコンピュータ実行コードとを含むことを特徴とする。
【0035】
他の態様によれば、本発明は、圧縮ビデオ・シーケンスを形成するために、ビデオ・フレーム・シーケンスを符号化するための方法を提供する。上記圧縮ビデオ・シーケンスは、少なくとも第1の圧縮ビデオ・フレーム・フォーマットおよび第2の圧縮ビデオ・フレーム・フォーマットに符号化されたフレームを含み、上記第1の圧縮ビデオ・フレーム・フォーマットは、非時間的予測フォーマットであり、上記第2の圧縮ビデオ・フレーム・フォーマットは、時間的予測フォーマットである。上記方法は、上記第1のビデオ・フレームが、上記第1の圧縮ビデオ・フレーム・フォーマットに符号化されるべきことを示す、第1のビデオ・フレームに関連する第1の表示を識別するステップと、上記圧縮ビデオ・シーケンス内の予測経路の長さを短縮するように上記第1の表示を第2のビデオ・フレームに関連づけるステップとを含むことを特徴とする。
【0036】
本発明のビデオ符号化方法は、従来の方法により符号化したビット・ストリームよりも大きな誤り回復力を持つ符号化されたビデオ・データ・ストリームを提供する。より詳細に説明すると、本発明は、時間的予測画像の劣化を引き起こすデータ損失の影響が、従来技術のビデオ・コーデックと比較した場合、伝播する範囲が狭いビデオ符号化/復号化システムを提供する。本発明によれば、時間的予測フレームの劣化は、ビデオ・シーケンス内の予測経路を短縮することにより軽減する。このようなフレームの劣化の軽減は、INTRA符号化フレームの挿入を効果的に遅らせることにより行われる。このようなフレームの劣化の軽減は、例えば、周期的なINTRAフレーム要求の後で、遠隔地の端末からのINTRAフレーム更新要求またはシーン・カットにより行うことができる。本発明によれば、周期的なINTRA要求、INTRA更新要求、またはシーン・カットに関連するフレームのような、INTRAフォーマットに符号化されるフレームは、それ自身はINTRAフォーマットに符号化されない。上記符号化を行う代わりに、ビデオ・シーケンス内で後に発生するフレームは、INTRAフォーマットに符号化するために選択される。好適には、(「実際の」INTRAフレームと呼ばれる)INTRAフォーマットに実際に符号化されたフレームは、周期的なINTRA要求、INTRAフレーム要求またはシーン・カットの間のほぼ中央に位置するように選択することが好ましい。実際のINTRAフレームの前に発生するフレームは、実際のINTRAフレームからスタートして、逆方向に時間的予測により符号化される。一方、その後で発生するこれらのフレームは、順方向の時間的予測により符号化される。本発明の好適な実施形態の場合には、反対方向に予測されたこれらフレームは、INTER(Pフレーム)フォーマットに符号化される。他の実施形態の場合には、Bフレーム・フォーマットに符号化されたフレームによる反対方向の予測が使用される。
【0037】
本発明は、周期的なINTRA要求、INTRAフレーム更新要求、またはシーン・カットに関連するフレーム自身がINTRAフォーマットに符号化される従来のビデオ符号化方法と比較した場合、実質的に改善された誤り回復を提供する。より詳細に説明すると、本発明を使用すれば、伝送誤りによるフレーム損失の百分率が有意に低減する。予測経路の長さを短縮することにより誤り回復を改善することを目的とする従来の方法と比較した場合、本発明は、ビット速度を著しく増大させない。
【0038】
本発明は、例えば、ビデオが、UDPのような信頼性の低いパケットをベースとする転送プロトコルの一番上に流れるマルチメディア検索システムで実行することができる。本発明は、また、リアルタイム・ビデオ電話の分野で実行することができる。本発明は、通信リンクの少なくとも一部が、無線チャネルで形成されている移動通信分野に特に適している。無線通信リンクは、ビット誤り率が比較的高い傾向があり、また帯域幅が制限されているので、本発明による高い誤り回復力が特に有利である。特に、ビット速度が著しく増大しないからである。
【0039】
ネットワークの正確な性質、接続のタイプ、および送信プロトコルは、本発明の実行のために重要なものではないことをさらに強調しておきたい。ネットワークは、固定ライン(PSTN)および、通信リンクの少なくとも一部が無線チャネルにより形成されている移動体通信ネットワーク(PLMN)の両方を含むことができる。ネットワーク内のデータ伝送は、完全にパケットをベースとするものにすることもできるし、完全に回線交換にすることもできるし、または回線交換データ伝送およびパケット交換データ伝送の両方を含むことができる。例えば、ネットワークは、回線交換データ伝送が使用されている他のネットワーク素子に接続しているパケットをベースとするデータ伝送を使用しているいくつかの素子(例えば、コア・ネットワーク)を含むことができる。このタイプのシステムの一例としては、ネットワークの少なくとも一部が回線交換送信に依存することができる現在提案されているUMTS第三世代移動電話ネットワークがある。
【0040】
データ・ストリームに影響を与える伝送誤りの正確な性質も、本発明の適用とは無関係である。さらに、本発明の暗号化、復号化および再生方法は、予め記憶しているオンデマンド・ビデオ、および生の(リアルタイムの)ビデオ圧縮にも使用することができる。本発明は、上記のようなビデオ・シーケンス内の予測経路の長さを短縮するための従来の方法を含む従来技術の誤り訂正、隠蔽および回復方法とは別に、または一緒に使用することができることを重ねて強調しておきたい。
【0041】
(発明を実施するための最良の形態)
本発明およびその利点をもっとよく理解してもらうために、図7および図8を比較しながら、本発明のビデオ符号化方法の好適な実施形態について説明するが、これは単に例示としてのものに過ぎない。図7は、従来の方法により構成されている圧縮ビデオ・シーケンスであり、図8は、本発明の方法により構成された圧縮ビデオ・シーケンスである。両図のシーケンスは、同じ画像コンテンツを示し、より長いシーケンスのビデオ形成部分のいくつかの連続フレームを含む。既述のように、INTRAフォーマットに符号化したフレームは、総称的に参照番号50で表し、INTERフレームは参照番号54で表す。INTERフレームを構成する順方向予測プロセスは、従来通り、参照番号53で表す。両シーケンスの頭の部分には、シーン・カット70が位置している。以下の説明においては、ビデオ・シーケンス内のシーン・カットに関連して、本発明の方法の適用について重点的に説明するが、本発明は、同じように、従来通り、シーン・カット、遠隔地の端末からのINTRAフレーム要求、または周期的なINTRAフレーム・リフレッシュ動作を含むが、これらに限定されない、INTRAフォーマットへのフレームの符号化が行われる任意の状況に適用できることを理解されたい。
【0042】
図7の一連のフレームは、INTRAフレーム50が、シーケンス内のシーン・カット70の直後に挿入される従来の符号化スキームを示す。シーン・カットが発生すると、以降の画像コンテンツは、シーン・カット以前の画像コンテンツとはかなり異なる。それ故、前のフレームから順方向に予測されたINTERフレームとして、シーン・カット直後にフレームを符号化することはできないか、実行不能である。それ故、この従来の符号化スキームの場合には、INTRAフレーム50(l1)は、シーン・カットの直後に挿入される。次に、例えば、次のシーン・カット、周期的なINTRA要求、またはINTRAフレーム更新要求(70)が発生するまで、以降のフレームが、そのINTRAフレームから順方向に予測(INTER符号化)される。
【0043】
すでに説明したように、本発明の方法は、図8に示すように、INTRAフレームの挿入を遅らせる方法に基づいている。本発明によれば、INTRAフレームは、ビデオ・ストリーム内に直ちに挿入されるのではなく、ビデオ・シーケンス内で後に発生したフレームが、選択され、INTRAフォーマットに符号化される。図8においては、このフレームをl1で示す。図8を見れば分かるように、シーン・カット70とl1との間のフレーム(図8のP2およびP3)は、矢印80で示すように、l1とは反対方向にINTERフレームとして予測される。それ故、これらフレームは、l1の復号化が行われる前には復号化することができない。何故なら、前の画像コンテンツを復号化するには、それより前にl1を再構成しておかなければならないからである。このことは、本発明によるビデオ・シーケンスの再生中に必要な最初のバッファリング遅延は、通常、シーン・カットとその後のINTRAフレームとの間の時間より、長くなければならないことを意味する。
【0044】
INTERフレームP5を復号化できるようにするためには、どれだけの数のフレームを連続的に送信しなければならないかを検討することにより、本発明の方法の主な利点を実証することができる。図7の従来のフレーム順序付けスキームを使用した場合には、P5の復号化を成功させるには、l1、P2、P3、P4およびP5を正しく送信し、復号化しなければならない。それ故、例えば、フレームl1内のような、シーケンス内で早期にデータ損失(例えば、パケット損失)が発生すると、復号化した画像コンテンツにエラーが発生し、このエラーは、P5までシーケンスを通して広がる。本発明の方法の場合には、P5の復号化を成功させるには、l1、P4およびP5だけを正しく送信し、復号化しさえすればよい。すなわち、本発明の方法を使用した場合には、画像シーケンス内の予測経路は、効果的に短縮し、その結果、フレームP5が正しく復号化される可能性が高くなる。さらに、シーケンス内のエラーの時間的伝播が減少する。例えば、フレームP2内でのような、シーケンス内の早期のデータ損失によりフレームP2およびP3の復号化した画像コンテンツにエラーが発生する。
【0045】
以下に本発明のビデオ符号化方法について詳細に説明する。本発明の方法により実行したビデオ・エンコーダの機能を、図9のその動作内容90を示す、従来のビデオ・エンコーダの動作と比較し、対比する。
従来技術のビデオ・エンコーダ90の場合には、符号化されていない生の画像は、最初、フレーム・グラバーまたは生のビデオ・フレームを記憶しているコンピュータ・ハードドライブのような記憶デバイスに接続しているビデオ・カメラからエンコーダに送られる。他の方法としては、エンコーダは、ビデオ・ソースまたは記憶デバイスに制御コマンドを発することにより、圧縮するための新しいフレームを要求することができる。図9のステップ91は、圧縮するための新しいビデオ・フレームの入手プロセスを示す。符号化されていないフレームがエンコーダに送られる速度は、固定速度であっても、可変速度であってもよい。
【0046】
通常、ビデオ・シーケンスのビット速度は、フレームをスキップすることにより、すなわち、それらフレームをビデオ・シーケンスから省略することにより遅くすることができる。特定のフレームを符号化すべきか否かの決定は、ビデオ・エンコーダのビット速度制御アルゴリズムにより行われる。図9のステップ92は、そのプロセスを示す。ビット速度制御ロジックが、所与のフレームを符号化すべきであると決定した場合には、従来のビデオ・エンコーダは、次に、そのフレームを符号化するモードを決定する。ステップ94は、この意志決定プロセスを示す。周期的INTRAリフレッシュが要求された場合、INTRAフレーム更新要求を遠隔端末から受信した場合、またはシーン・カットが発生した場合には、ステップ98に示すように、フレームは、INTRAフォーマットに符号化される。そうでない場合には、ステップ96において、フレームはINTERフレーム・フォーマットに符号化される。分かりやすくするために、この説明は、いくぶん簡単にしてあり、他のフレーム・タイプ、すなわち、2方向予測Bフレームの処理は、ここでは説明しない。しかし、このように説明を簡単にしたが、それは従来技術のエンコーダの動作を理解するのには支障はない。
【0047】
比較のために、図10に本発明のビデオ符号化方法の手続要素を示す。上記の従来技術のビデオ・エンコーダと同等の機能を行う、本発明の方法の素子には、図9の参照番号と同じ参照番号を使用している。
最初に、符号化していない生のビデオ・フレームが、エンコーダに送られるか、またはエンコーダが、圧縮するための新しいフレームを要求することができる。これは、図10のステップ91で表される。次に、エンコーダは、画像コンテンツを、例えば、シーン・カット、周期的INTRAフレーム・リフレッシュ・インターバルの時間切れ、または遠隔端末からのINTRAフレーム更新要求の受信の結果として画像コンテンツをINTRAフォーマットに符号化すべきかどうかを決定する(ステップ94)。本発明によれば、エンコーダが、何らかの理由で、INTRAフレームが必要であると決定した場合には、エンコーダは、図10のステップ101に示すように、このようなINTRAフレームが必要であることを記録する。INTRAフレームが必要であることを示すこのような記録は、例えば、そのフレームに対してフラッグをセットし、フレーム・バッファ内に、そのフラッグを記憶することにより行うことができる。INTRAフレームに対する要求を表示する方法については、以下にさらに詳細に説明する。しかし、INTRA要求を表示する正確な方法は、本発明を実行するのに重要なものではないことを理解されたい。次に、フレームは、バッファされる(102)。
【0048】
本発明のエンコーダは、圧縮の前に生の画像データを記憶するために使用するバッファを維持する。都合のよいことに、バッファは、時間の長さ(T)に対応する多数の生の画像フレームを収容するのに十分な容量を持っている。いくつかのいわゆる「メタ」データは、画像データの各フレームに関連している。メタデータは、符号化すべきフレームに関する情報を供給し、すでに説明したように、上記要求が行われた場合には、INTRAフレーム要求の表示を含む。INTRAフォーマットに符号化すべきフレームに対して、メタデータは、(基準フレームが前に符号化したフレームでない場合には)、動き補正のために使用する基準フレームの数を含むことができる。すべてのフレームに対するメタデータは、その中に圧縮されていないビデオ・フレームを符号化するための順序を含む圧縮順序番号COを含む。各入力フレームは、バッファに記憶される。
【0049】
最初に、符号化をスタートする前に、バッファが空にされる。符号化がスタートすると、時間の長さTに対応する多数のフレームを含むまで、バッファがフレームで満たされる(102)。バッファが満杯になった時を決定するために、バッファが監視される(ステップ103)。バッファが満杯になると、「最も古い」フレームが、すなわち、バッファに最初にロードされたフレームが、バッファから除去される。図10のステップ104は、この動作を示す。エンコーダは、例えば、メタデータに対応するフレームをチェックし、INTRA要求フラッグがセットされているかどうかを決定することにより、問題のフレームがINTRAフレーム要求に関連しているかどうかを決定する(ステップ105)。フレームがINTRA要求に関連していない場合には、エンコーダのビット速度制御アルゴリズムは、フレームをスキップすべきかどうかを決定し(ステップ92)、またはフレームをINTERフレームとして符号化すべきかどうかを決定する(ステップ107)。フレームがスキップされ、そのフレームが、前のフレーム以外のフレームを動き補正用の基準として使用すべきであることを示す表示を含んでいる場合には、その表示がバッファ内で次のフレームを記載しているメタデータにコピーされる。フレームをスキップしないという決定がなされた場合には、そのフレームは、シーケンス内の前のフレームを基準として、またはメタデータにより動き補正基準として表示されたものにより、INTERフォーマットに符号化される(ステップ107)。
【0050】
バッファから検索したフレームが、INTRAフレーム要求に関連している場合には、全体を参照番号108で示す、INTRAフレーム処理手順が実行される。図11は、ステップ108の手続要素の詳細図である。現在のINTRAフレーム要求が、時点T1のところで発生する。INTRAフレーム処理手順の第1のステップは、次のINTRAフレーム要求、すなわち、現在処理されているものの次のINTRAフレーム要求の位置を知るために、フレーム・バッファの探索を行うことである。図11のステップ110は上記探索を示す。次のINTRA要求の発生時間T2は、その関連メタデータから決定される。次に、INTRAフォーマットに符号化される実際のフレームが、2つの要求されたINTRAフレームからの違いがほぼ等しくなるように決定される。すなわち、現在のINTRA要求が、その発生時間がT1であるフレームと関連している場合には、T3−T1がほぼT2−T3に等しくなるように、バッファからその発生時間がT3であるフレームが選択される。この新しく発見されたフレームが、INTRAフォーマットへの符号化のために選択される。図11の参照番号112は、今説明したこのプロセスを示す。本発明によれば、INTRAフォーマットに実際に符号化されるフレーム(以後「実際の」INTRAフレームと呼ぶ)は、最初のINTRA符号化要求には関連していないが、ビデオ・シーケンス内で後で発生するある他のフレームに関連する。バッファがINTRAフレーム要求に関連する他のフレームを含んでいない場合には、INTRAフォーマットに符号化される実際のフレームは、その発生時間T3と時間T1におけるINTRA要求との間の時間差が、T3とバッファの最後のフレームとの間の時間差に、ほぼ等しくなるように選択される。
【0051】
次に、ステップ114において、INTRAフォーマットに符号化される実際のフレームがバッファから除去され、実際のINTRAフレーム以前のフレームの順番が反対になる。実際のINTRAフレームの直前および直後のフレームには、これらフレームが動き補正用の基準として、実際のINTRAフレームを使用すべきとの表示を含むようにマークが付けられる。最後に、INTRAフォーマットに符号化するために選択されたフレームが、INTRAフレームとして符号化され(ステップ116)、またT2に対応するフレームまでのフレームであって、T2に対応するフレームを含まないフレームが、動き補正時間的予測符号化により符号化される。実際のINTRAフレーム以前に発生するこれらのフレームは、実際のINTRAフレームからスタートして、逆方向に符号化され、一方、実際のINTRAフレーム以後に発生するこれらのフレームは、順方向に符号化される。実際のINTRAフレームに先行するフレームの順序を反対にしても、必ずしも、バッファの物理的な再配置をしなくてもよいことを理解されたい。以下にさらに詳細に説明するように、バッファ内でのフレームの効果的な反転は、各フレームに割り当てられた圧縮順序(CO)番号により行うことができる。
【0052】
1つの例を考えると、上記INTRAフレーム処理手順をもっとよく理解することができる。この場合、ビデオ捕捉/検索システムのビデオ・エンコーダは、本発明の方法を実行するために設計されているものと仮定する。エンコーダは、圧縮していないフォーマットのビデオ・データを5秒間(+1フレーム)記憶することができるバッファを含む。エンコーダは、毎秒25フレームの一定の速度で、ビデオ・フレーム・ソースにより圧縮していない、(すなわち、生の)ビデオ・フレームの供給を受ける。それ故、連続しているフレーム間の時間差は、一定で、40ミリ秒である。表1は、シーケンス内の任意の瞬間におけるバッファのコンテンツを示す。
【0053】
【表1】
Figure 0004949591
表1においては、所与の生のビデオ・フレームの再生/捕捉時間は、時間tを基準にしてミリ秒で表される。すでに説明したように、メタデータは、フレームを圧縮し、解凍する順序を示すために使用される圧縮順序番号(CO)を含む、圧縮していないビデオ・フレームに関する追加情報を記憶するために使用される。
【0054】
この例で考慮の対象にする特定のビデオ・シーケンスにおいては、シーン・カットは存在しないで、5秒毎に周期的なINTRAリフレッシュが要求される。関連INTRAフレーム要求表示は、圧縮していない各ビデオ・フレームと一緒に供給されるメタデータ内に含まれている。表1を見れば分かるように、この例の目的のために、最初のINTRA要求は、時間tにおいて発生するものと仮定する。INTRA要求は5秒毎に行われるので、次のこのような要求は、t+5000msの時点で行われる。圧縮していないビデオ・フレームと一緒に供給されるメタデータにより、エンコーダは、INTRA要求が何時おこなわれるのかを判断することができる。
【0055】
本発明の方法を使用する場合には、エンコーダは、INTRA要求に直接関連するフレームにはINTRA符号化を適用しないが、現在のINTRA要求と後続のINTRA要求との間の時間のほぼ中間で、INTRAフォーマットに符号化されるフレームを選択する。必ずしも、連続するINTRA要求間の正確に等距離のフレームを選択できるわけではない。何故なら、この選択は、連続しているINTRA要求間の時間的間隔、およびビデオ・シーケンスのフレーム速度により異なるからである。本発明の、フレームが40msの間隔で分離していて、INTRA要求が5000msの一定の間隔で発生するこの例の場合には、INTRAフォーマットに符号化するのに最も適しているフレームは、t+2480ms、またはt+2520msにおいて発生するフレームのどちらかである(表1参照)。それ故、エンコーダは、t+2480msまたはt+2520msで発生するフレームを実際のINTRAフレームとして選択することができる。これら2つのフレームのどちらかは、INTRAフォーマットへの符号化のための、同じ程度に適当な選択とみなすことができる。実際のINTRAフレームの選択を決定するために使用する基準は、方法の実行に従って変化するが、この場合には、t+2480msにおいて発生するフレームを、実際のINTRAフレームとして選択するものと仮定する。
【0056】
都合のよいことに、エンコーダは、圧縮順序(CO)番号をバッファ内の圧縮していないフレームに割り当てる。バッファ内のすべてのフレームは、実際のINTRAフレーム、すなわち、INTRAフォーマットに符号化するためにすでに選択したフレームを示す圧縮順序番号がつけられる。好適には、この圧縮順序情報は、表2に示すように、各フレームに関連するメタデータ内に記憶するのが好ましい。
【0057】
【表2】
Figure 0004949591
【0058】
エンコーダ・バッファ内の実際のINTRAフレームに先行する圧縮していないフレームには、バッファ内で早期に発生するフレームに大きな圧縮順序番号がつけられるように、圧縮順序番号が順次割り当てられる。実際のINTRAフレームには、圧縮順序番号、CO=0が割り当てられる。それ故、現在説明している例の場合、実際のINTRAフレーム直前のフレーム(すなわち、t+2440msにおいて発生するフレーム)には、圧縮順序番号CO=1が割り当てられる。その前のフレームには、圧縮順序番号CO=2が割り当てられる。そのフレームの前のフレームには、圧縮順序番号CO=3が割り当てられる。以下同様。現在説明している例の場合には、この圧縮順序番号割当てスキームによれば、バッファ内の最初のフレームには、圧縮順序番号CO=62が割り当てられる。当業者であれば、この圧縮順序番号割当てスキームを使用すれば、実際のINTRAフレームに先行するフレームを、最初のINTRA要求に関連したフレーム(すなわち、時間tにおいて発生するフレーム)から順方向にではなく、実際のINTRAフレームから逆方向に予測すべきであることをはっきりと示していることを理解することができるだろう。
【0059】
実際のINTRAフレーム直後のフレーム(すなわち、t+2520msにおいて発生するフレーム)の圧縮順序番号、および以降のフレームの圧縮順序番号は、実際のINTRAフレームに先行するシーケンス内の最初のフレームの圧縮順序番号から順番につけられる。それ故、現在説明している例の場合には、エンコーダのフレーム・バッファ内の実際のINTRAフレームの直後に発生する圧縮していないビデオ・フレームには、圧縮順序番号CO=63が割り当てられ、次のフレームには、圧縮順序番号CO=64が割り当てられ、次のフレームには圧縮順序番号CO=65が割り当てられる。以下同様。さらに、本発明の場合には、実際のINTRAフレームの直後のフレームには、その基準画像(そこから予測が行われるフレーム)が、前の圧縮順序番号を持つフレームではなく、圧縮順序番号CO=0を持つ実際のINTRAフレームになるように、圧縮順序番号が割り当てられる。都合のよいことに、この表示は、実際のINTRAフレームの直後に発生するフレームに関連するメタデータ内に収容される。現在説明している例の場合には、このことは、圧縮順序番号CO=63を持つ実際のINTRAフレームの直後のフレームは、圧縮順序番号CO=62を持つフレームから予測されるのではなく、圧縮順序番号、CO=0を持つ実際のINTRAフレームから予測されることを意味する。
表2は、圧縮順序番号割当て後のビデオ・バッファの内容を示す。
【0060】
次に、エンコーダは、バッファから実際のINTRAフレームを除去し、前に割り当てられた圧縮順序番号に従って、バッファを再編成し、選択した(すなわち、実際の)INTRAフレームを符号化する。
バッファの物理的再編成に対する要件は、使用するバッファのタイプにより異なることを強調しておきたい。エンコーダがバッファを探索し、ランダムにそのコンテンツにアクセスすることができる(すなわち、バッファは、ランダム・アクセス・バッファである)場合には、圧縮順序番号が示す順序で符号化するために直接フレームを選択することができ、その場合、物理的な再編成を行う必要はない。一方、この例の場合に仮定したように、バッファには先入れ先出し方式で容易にアクセスすることができ、圧縮順序番号によりフレームを物理的に再編成するのが得策である。
【0061】
実際のINTRAフレームは、任意の適当な方法で符号化することができる。符号化方法の正確な選択は、例えば、後で圧縮ビデオ・データを送信するために使用する通信チャネルの特性により異なる。使用できるビット速度は、符号化方法の選択を定めることができる1つの可能な基準である。例えば、固定ライン・ビデオ検索またはビデオ電話システムの場合には、使用可能なp×64kbit/sのビット速度で、通信システムで最適な性能を供給するように特に設計されている、ITU-T勧告H.261により選択した(実際の)INTRAフレームを符号化するのが適している。他の方法としては、ビデオ・データをマルチメディア・ビット・ストリームに含ませたいなら、MPEG4規格による符号化の方が適している。非常に遅いビット速度の通信を、特に無線通信チャネルを通して行う場合には、別の代替ビデオ符号化スキームとして、ITU-T勧告H.263を使用することもできる。
【0062】
表3は、上記の再編成動作後のバッファの内容を示す。
【表3】
Figure 0004949591
【0063】
(t+5000に対応するフレームを除く)バッファ内の残りのフレームは、INTERフォーマットに符号化される。フレームが順次予測されるシーケンスは、その圧縮順序番号および関連メタデータにより供給される基準画像選択に関する情報により決定される。ここでもまた、使用するINTER符号化の正確な詳細は、本発明の方法の適用にとって重要ではない。ビデオ・フレームが符号化される順序は、その割り当てられた圧縮順序番号によって決まるので、符号化プロセスは下記のように行われる。圧縮順序番号CO=1からCO=62までの圧縮順序番号を持つフレームは、実際のINTRAフレーム(圧縮順序番号CO=0)からスタートして、相互に順次予測される。すなわち、圧縮順序番号CO=1を持つフレームは、基準画像として実際のINTRAフレームによりINTER符号化され、圧縮順序番号CO=2を持つフレームは、その圧縮順序番号がCO=1である復号化したINTER符号化フレームから予測される。以下同様。このプロセスは、順方向予測プロセスのように見える。しかし、圧縮していないフレームには、逆方向に圧縮順序番号が割り当てられるので、フレームCO=1からCO=62は、実際のINTRAフレームから逆の順序で効果的に予測される。
【0064】
このプロセスは、圧縮順序番号CO=63まで継続して行われる。このフレームは、実際のINTRAフレーム(CO=0)から順方向に予測したINTERフォーマットに符号化すべきであり、フレームCO=62から予測すべきではない。本発明の方法の場合には、これはフレームCO=63に関連するメタデータ内に表示される。このメタデータは、フレームCO=63のINTER予測符号化の際に使用する基準画像の圧縮順序番号が、CO=0、すなわち、実際のINTRAフレームであることを表示する。予測の原点がフレームCO=0にリセットされると、エンコーダは、順次バッファ内の残りの圧縮していないビデオ・フレーム、(圧縮順序番号CO=63からCO=124を持つフレーム)を継続的に符号化する。すなわち、フレームCO=63が、その基準画像としてのフレームCO=0(すなわち、実際のINTRAフレーム)により、INTERフォーマットに符号化され、フレームCO=64が、CO=63から予測され、フレームCO=65がフレームCO=64から予測される。以下同様。
【0065】
上記説明においては、本発明のビデオ符号化方法を、ビデオ・シーケンスが、主に2つのタイプのビデオ・フレーム、すなわち、非時間的予測INTRAフレーム、および時間的予測INTRAフレームに基づいて符号化された例により、本発明を説明した。しかし、当業者であれば、本発明の方法は、他のタイプのビデオ・フレームを含むように広く適用することができることを理解されたい。より詳細に説明すると、順方向、逆方向、または順方向および逆方向の両方向に時間的予測を使用するB画像を、本発明と一緒に使用することができる。すなわち、実際のINTRAフレーム、または実際のINTRAフレームから逆方向に予測した、INTERフォーマット・フレーム中の任意のフレームをB画像の構成のためのアンカー画像として使用することができる。B画像は、順方向の予測、逆方向の予測またはこれら2つの予測の組合わせにより構成することができる。同様に、また、B画像を実際のINTRAフレームから順方向に予測した、INTERフォーマット・フレームを含むシーケンスの一部に含ませることもできる。
【0066】
今説明したプロセスにより、ビデオ・データの各フレームを、選択した(実際の)INTRAフレームを参照して、簡単な方法で符号化することができる。しかし、その割り当てられた圧縮順序番号によるビデオ・フレームの符号化は、符号化プロセスの実行を容易にするが、フレームを復号化する際に問題が起こる。より詳細に説明すると、ビデオ・フレームは、再生のための正しい順序で符号化することができない。表3の再生/捕捉時間を見れば、このことを理解することができるだろう。それ故、フレームが符号化され、その後で、この順序でデコーダに通信チャネルを通して送信されると、デコーダは、フレームが正しい順序で必ず再生されるように、その意図する再生時間によりフレームを再編成する。
【0067】
このプロセスについては、本明細書中に以下にさらに詳細に説明するが、ここでは、情報は、デコーダにおける必要な再生時間に関連する各フレームに関連していることに留意されたい。上記情報は、画像データ自身および各フレームの圧縮順序番号を含むメタデータと一緒にデコーダに送信される。あるパケット交換ネットワークの場合には、データ・パケットは、これらデータ・パケットが送信されたのと同じ順序で受信機に到着しない場合があることに留意されたい。RTP(信頼性の高い送信プロトコル)のようなある種の送信プロトコルは、データ・パケットが送信される順序、いわゆる「シーケンス番号」の表示を供給する。これにより、データ・パケットを、受信機においてその正しい順序に組み立てることができる。このタイプのシステムの場合には、ビデオ・データと一緒に圧縮順序番号を送信する必要は全然ない。何故なら、ビデオ・フレームが符号化された順序を受信データ・パケットのシーケンス番号から推定することができるからである。しかし、送信プロトコルによりシーケンス番号が供給されないシステムの場合には、圧縮順序についての情報を送信する必要がある。各ビデオ・フレームの予定再生時間に関する情報は、ビデオ・データを通信リンクを通してビデオ・データを送信する際に使用するファイルまたは多重化/送信フォーマット・ヘッダ内に容易に組込むことができ、またビデオ符号化フォーマット/構文自身内に含ませることができる。
【0068】
本発明は、本質的に、INTRA要求後のINTRAフレームの挿入を遅らせるので、INTRAフォーマットに実際に符号化されるフレームの前に、逆方向予測INTERフレームを表示しなければならない。本発明の方法の他の実施形態の場合には、図14に示すように、Bフレームを使用することができる。この方法は、圧縮ビデオ構文または周囲のファイルまたは送信フォーマットが、以降のアンカー・フレーム(l1)の前に、逆の順序で予測したフレーム(例えば、図8のINTER符号化フレームP2およびP3)の再生ができないような状況の場合には有利である場合がある。通常、例えば、ITU-T勧告H.263のように、Bフレームは、逆方向、順方向または両方向の予測をサポートする。それ故、本発明の符号化方法は、以降のアンカー・フレーム(l1)から、逆方向に予測されるBフレームにより実行することができる。しかし、この技術は、本発明の好適な実施形態において前に説明した方法よりも圧縮効率が悪い。
【0069】
図14について説明すると、本発明の他の実施形態の符号化方法は、実際のINTRAフレームが選択された点に関しては、好適な実施形態と類似の方法で進行する。エンコーダのバッファ内の実際のINTRAフレームに先行するフレームは、Bフレーム52として符号化され、各Bフレームは、図14に示すように、実際のINTRAフレームから直接逆方向に予測された51bである。Bフレームの逆方向の予測は、ITU-T H.263のようなビデオ符号化勧告によりすでにサポートされているので、この他の実施形態の場合には、実際のINTRAフレームに先行するフレームに逆の順序でCO番号を割り当てる必要はない。各フレームを、予測基準としての実際のINTRAフレームにより、Bフレーム・フォーマットに符号化しなければならないことを表示するだけで十分である。この情報は、実際のINTRAフレームに先行する各フレームに関連するメタデータに含ませることができる。バッファの実際のINTRAフレームに続くこれらのフレームは、次に、INTERフォーマットに順次符号化される。実際のINTRAフレームを実際のINTRAフレームの直後のフレームに対する予測基準として使用すべきであるという表示は、そのフレームに対するメタデータに含められる。
【0070】
本発明の方法の他の実施形態は、ビデオ圧縮方法が、基準画像選択をサポートしない場合に使用することができる。この場合には、ビデオ・コーデックを制御し、呼び出す層(例えば、制御プログラム)は、コーデックの基準フレーム・バッファの内容を、それを参照すべき瞬間の直前の時点で、実際のINTRAフレームで置き換えることができる。上記例について説明すると、このことは、フレームCO=63の符号化または復号化をスタートした場合には、基準フレーム・バッファに、フレームCO=0をロードしなければならないことを意味する。この本発明の他の実施形態を使用できるようにするために、圧縮ビデオ構文または多重化/送信フォーマットは、実際のINTRAフレームを識別し、フレーム中のどれがそれを基準として必要とするかを示す情報を含んでいなければならない。
【0071】
次に、すでに説明したビデオ符号化方法と一緒に使用するのに適している復号化方法およびビデオ再生方法の例示としての実施形態について説明する。図12は、本発明の復号化方法を示す。復号化プロセスの場合には、デコーダは、伝送チャネルから符号化されたフレームを受信し、フレームをバッファする(120)。次に、デコーダは、バッファしたフレーム122を復号化する。この場合、伝送チャネルとしては、圧縮ビデオまたはマルチメディア・データの送信に適している任意の通信チャネルを使用することができる。送信は、インターネット、ISDNまたはPSTN(公衆交換電話回線網)のような固定ライン・ネットワークを通して行われる。他の方法としては、ネットワークの少なくとも一部は、PLMN(公衆陸上移動通信網)が供給するような無線リンクを含むことができる。「伝送チャネル」という通常の用語は、例えば、表示または他の処理用のコンピュータのハードドライブのような記憶媒体から記憶ファイルを検索する場合に行われるデータの送信を含むことも理解されたい。
【0072】
圧縮ビデオ・シーケンスの各フレームは、符号化された方法により、当業者であれば周知の本質的に標準的な方法で復号化される。このような復号化が可能なのは、本発明の方法は、INTRAおよびINTER符号化フレーム自身のフォーマットを必ずしも変更しないからである。それ故、圧縮していない各ビデオ・フレームの符号化は、すでに説明したように、標準化されたまたは専用の任意の適当なスキームにより行うことができる。
【0073】
復号化後に、圧縮していないフレームは、再生バッファ内に記憶される(124)。エンコーダで使用するバッファの長さがTである場合には(符号化段階の上記説明参照)、デコーダで使用するバッファは、少なくとも0.5×T秒の圧縮していないビデオ画像を保持することができれば有利である。次に、解凍ビデオ・フレームは、その正しい再生シーケンスに順序づけられる。デコーダは、各フレームに関連する再生時間情報に従ってフレームを順序づける。すでに説明したように、この情報は、エンコーダのバッファ内にビデオ・フレームを記憶している場合には、データ構造体に組込むことができ、圧縮ビデオ構文で、または圧縮ビデオ・フレームをデコーダに送信する場合には、多重化/送信フォーマットにより実行することができる。ある種の状況においては、例えば、通信チャネルの処理能力が低下した場合には、デコーダは、その予定再生時間の後でフレームを実際に受信することができる。その予定再生時間の後でフレームを受信した場合には、またはフレームをその予定再生時間の前に受信したが、正確に時間通りに確実に再生するために十分に迅速に復号化できなかった場合には、そのようなフレームはデコーダの入力バッファ内にまったく記憶しないこともできる。しかし、後で到着するフレームを記憶する方が有利な場合もあり、その予定の再生に間に合って復号化できない場合もある。何故なら、これらのフレームは、例えば、他のフレームの誤り隠蔽を改善するために使用できるからである。
【0074】
図13は、本発明の例示としての実施形態による、ビデオ再生「エンジン」の手順ステップを示す。再生エンジンは、その入力として、ビデオ・デコーダのバッファ124から、その予定再生時間に従って正しく順序づけられた解凍ビデオ・フレームを受信する。新しいビデオ・シーケンスの再生がスタートした場合、入力ビデオ・フレームは、再生バッファ132内にバッファされる。一時的な中止なしでビデオ・シーケンスを確実に再生するために、この最初のバッファ時間は、少なくとも0.5×T秒でなければならない。最初のバッファ時間の後で、再生プロセスは、ステップ134、136および138からなる通常の再生ループに入る。ループの最初のステップ134においては、再生が予定されているフレームが、再生バッファ内にあるかどうかの判断が行われる。そのようなフレームが存在する場合には、それが表示される(136)。そのようなフレームが存在していない場合、またはフレームが表示されたばかりである場合には、プロセスは、周期的待機状態、またはアイドル状態(138)に入る。都合のよいことに、再生ループの動作速度は、元の捕捉されたシーケンスの(最大)フレーム速度である。例えば、シーケンスが毎秒25フレームの速度で捕捉された場合には、再生ループは、40ミリ秒毎に実行される。
【0075】
図15は、本発明のマルチメディア・コンテンツ生成システムの例示としての実施形態である。この図の場合には、システムは3つの媒体ソース10、すなわち、オーディオ・ソース151a、ビデオ・ソース151bおよびデータ・ソース151cを含む。当業者であれば、媒体ソースの数は、この図に示す3つの例に制限されないことを理解することができるだろう。また、各ソースは、「生の」ソース、すなわち、リアルタイムの媒体コンテンツ、および、例えば、ネットワークで接続しているハードドライブ等のような大容量記憶媒体に常駐している媒体コンテンツのファイルのような、リアルタイムでない媒体ソースを含むが、これらに限定されない多数の異なる形をとることができることは明らかである。
【0076】
本発明のマルチメディア・コンテンツ生成システムは、その全体を参照番号20で示すマルチメディア捕捉手段を含む。この例示としての実施形態の場合には、専用捕捉装置が、各媒体ソース用に設置されている。それ故、捕捉手段20は、オーディオ捕捉装置152a、ビデオ捕捉装置152b、およびデータ捕捉装置152cを含む。オーディオ捕捉装置は、例えば、マイクロホン、アナログ−デジタル変換器、およびデジタル化したオーディオ・データのフレームを形成するための信号処理電子回路を含むことができる。ビデオ捕捉装置は、すでに説明したように、アナログ・ビデオ入力からデジタルビデオ・フレームを生成するためのビデオ・グラッバ・カードを含むことができる。各媒体ソースに対して、捕捉装置は、また、媒体ソースおよびその関連する捕捉装置の動作を制御するために必要な専用デバイス・ドライバおよびアプリケーション・プログラムのようなソフトウェアを含むことができる。マルチメディア捕捉手段20の出力は、一組の圧縮していない媒体ストリームであり、各ストリームは、媒体ソース151a−151c中の1つに対応する。
【0077】
他の方法としては、1つまたはそれ以上の媒体ソースが、マルチメディア・コンテンツ・エディタ22への適用にすでに適している形でその内容を供給する場合には、その媒体内容を直接エディタに適用することができる。これは、例えば、媒体ソースが、例えば、大容量記憶媒体上に記憶しているファイルからデジタルの形で検索したオーディオまたはビデオ・フレームである場合である。
【0078】
マルチメディア・コンテンツ・エディタ22は、マルチメディア捕捉手段が供給する各媒体ストリームを受信し、それらストリームを一緒にリンクして1つの時間ラインとする。例えば、オーディオおよびビデオコンテンツのような同時に再生されなければならないマルチメディア・ストリームは、各フレームの必要な再生時間の表示をつけてリンクされる。他のマルチメディア・ストリームの必要な再生時間に関する表示も供給することができる。このようにリンクされた場合、マルチメディア・コンテンツの各成分は、「トラック」と呼ばれる。エディタ22は、また、媒体トラックを種々の方法で編集する可能性を供給する。例えば、ビデオ・フレーム速度を半分に減速することもできるし、ビデオ画像の空間的解像度を低減することもできる。
【0079】
符号化ユニット24は、エディタ22から媒体トラックを受信する。この例示としての実施形態の場合には、各トラックは、問題の媒体タイプに適した方法で、別々に符号化され、個々のエンコーダが、各媒体タイプに対して使用される。それ故、この例の場合には、3つのエンコーダ、すなわち、オーディオ・エンコーダ157a、ビデオ・エンコーダ157b、およびデータ・エンコーダ157cが使用される。ここでもまた、本発明の方法を実行するためには、個々のエンコーダの正確な数は重要でないことを理解することができるだろう。また、データ・エンコーダの場合には、符号化方法が、データの性質により異なる場合があることに留意されたい。各エンコーダは、媒体トラックが、例えば、狭い帯域幅を持つ通信リンクを通して送信するのに適している、もっとコンパクトな方法で表現されるように、各媒体トラック内の冗長な情報を除去する。使用する圧縮技術は、損失を起こさない圧縮方法および損失を起こす圧縮方法の両方を含むことができる。オーディオ・トラックおよびビデオ・トラックは、任意の適当な方法で符号化することができ、その選択は、受信クライアントに、さらにマルチメディア・データを送信するために使用する通信チャネルの性質により異なる。例えば、オーディオ・トラックは、GSM EFR音声コーデックにより符号化することができる。ビデオ・エンコーダ157bは、本明細書にすでに記載した方法により実施される。ビデオ・エンコーダは、動き補正時間的予測を使用し、すでに説明したように、本発明の方法により画像シーケンス内で使用する予測経路の長さを短縮するような方法で動作し、データ損失によるエラーに対して、より大きな回復力を持つ圧縮ビデオ・トラックを供給する。
【0080】
符号化ユニット24により生成された圧縮媒体トラックは、マルチプレクサ26により受信される。この場合、これら圧縮媒体トラックは、マルチメディア「クリップ」と呼ばれる1本のビット・ストリームを形成するようにインターリーブされる。次に、クリップは、マルチメディア・サーバ14に送られ、そこからさらに通信リンクを通して受信クライアントに送信することができる。
【0081】
図16は、本発明の方法を使用することができる別な状況を示す。この図は、ITU-T勧告H.324により実行されるマルチメディア端末160を示す。上記端末は、マルチメディア・トランシーバ・デバイスと見なすことができる。この端末は、通信ネットワークを通して送信するために、マルチメディア・データ・ストリームを捕捉し、符号化し、多重化する素子、および受信マルチメディア・コンテンツを受信し、逆多重化し、復号化し、再生する素子を含む。ITU-T勧告H.324は、端末の動作を全体的に定義し、端末装置の種々の素子の動作を制御する他の勧告に言及している。通常、このようなマルチメディア端末は、ビデオ電話のようなリアルタイムのマルチメディア用途に使用されるが、その用途はこのような用途に限定されない。例えば、H.324マルチメディア端末は、また、例えば、マルチメディア・コンテンツ・サーバからマルチメディア・コンテンツをダウンロードまたはストリーミングするためのマルチメディア・コンテンツ検索クライアントとして使用することができる。
【0082】
本発明の場合には、図16のH.324端末は、本発明の方法を実行するのに適している多数の他のマルチメディア端末の1つに過ぎない。端末装置の位置決めおよび実行については、多くの別の方法があることに留意されたい。図16に示すように、マルチメディア端末は、アナログPSTN(公衆交換電話回線網)のような固定ライン電話網に接続している通信装置内に設置することができる。この場合、マルチメディア端末は、ITU-T勧告V.8、V.34およびそうしたい場合には、V.8bisに適合するモデム171を装備することができる。他の方法としては、マルチメディア端末は、外部モデムに接続することもできる。このモデムは、多重化デジタル・データおよびマルチメディア端末が生成する制御信号を、PSTNを通して送信するのに適しているアナログの形に変換することができる。上記モデムは、さらに、マルチメディア端末が、PSTNからアナログの形でデータおよび制御信号を受信することができるようにし、上記データおよび制御信号を端末が適当な方法で逆多重化し、処理することができるデジタル・データ・ストリームに変換する。
【0083】
H.324マルチメディア端末は、また、ISDN(デジタル総合サービス網)のようなデジタル固定ライン・ネットワークに直接接続可能でも良い。この場合、端末は、H.324/I(ITU-T勧告H.324の付属書類D)に従って実施され、モデム171の代わりに、ITU-T I.400勧告シリーズによるISDNユーザ・ネットワーク・インターフェースが使用される。図16の場合には、ブロック172が、このISDNユーザ・インターフェースである。
【0084】
H.324マルチメディア端末は、また、移動通信用途でも使用することができる。勧告H.324の付属書類Cは、H.324端末を、エラーが発生しやすい送信環境で使用できるよう適応させる多くの修正を示す。これらの修正の大部分は、データ・ストリームの結合に使用される多重化プロトコル(ITU-T勧告H.223)であり、データ損失およびチャネル・エラーによる劣化により強いビット・ストリームを生成するためのものである。これらの修正の使用は移動通信に限定されないが、このタイプの通信リンクの場合に通常使用される比較的高いビット誤り率により移動用途での使用に特に適している。H.324付属書類Cは、また、移動用途の場合には、モデム171の代わりに、図16のブロック173で示すような任意の適当な無線インターフェースを使用することができる。それ故、H.324付属書類Cに従って実施された移動マルチメディア端末(通常、H.324/M端末と呼ばれる)は、任意の現在または未来の移動体通信ネットワークでの使用に適している無線部分を内蔵することができる。例えば、H.324/Mマルチメディア端末は、現在の第二世代のGSM移動電話ネットワーク、または提案されている第三世代のUMTS(汎用移動電話システム)に接続することができる無線トランシーバを含むことができる。
【0085】
しかし、場所が何処であれ、マルチメディア端末を実施すると、回線交換、およびパケットをベースとする無線通信リンクの両方を含み、無線リンクを含む移動体通信ネットワークを含むことができる、通信ネットワークと、マルチメディア・コンテンツを交換する可能性がでてくる。例えば、ISDNネットワークに接続しているH.324/Iマルチメディア端末は、PLMN移動電話ネットワークで、H.324/M端末と接続することができる。ネットワークを通して端末間で送信されるマルチメディア・データは、エラーおよびデータ損失の種々のソースの影響を受ける。これらは、例えば、無線通信リンクに影響を与える干渉、およびコアISDNネットワーク内で発生する恐れがある混雑によるパケット損失により、ビット反転誤りを含んでいる場合が多い。それ故、伝送誤りに対して高度の回復力を持つビデオ・ビット・ストリームを供給するように通信マルチメディア端末のビデオ・エンコーダを実施することが望ましい。すでに説明したように、本発明のビデオ符号化方法は、誤り回復力がさらに強化された時間的予測技術により圧縮されたビデオ・シーケンスを供給する。それ故、本発明のビデオ符号化方法は、マルチメディア端末で実施するのに理想的なものであり、特にエラーを起こしやすい通信チャネルを通して使用されることが多いデバイスで使用するのに特に適している。
【0086】
二方向通信、すなわち、ビデオ・データの送受信用に設計されているマルチメディア端末においては、本発明により実施したビデオ・エンコーダとビデオ・デコーダの両方を使用しなければならない。本発明のある実施形態のビデオ・エンコーダは、フレームが圧縮されている順序を変更することができるので、受信端末のビデオ・デコーダは、表示する前に、受信フレームを正しく順序づけなければならない。それ故、本発明の通常のマルチメディア端末は、上記符号化/復号化方法を行うエンコーダ/デコーダのペアを含む。このようなエンコーダおよびデコーダのペアは、多くの場合、「コーデック」という名前の1つの結合機能ユニットとして実施される。一方、マルチメディア端末を、マルチメディア検索クライアントとしてだけ使用する場合には、本発明により実施されたデコーダだけを含んでいるだけでよい。
【0087】
図16を参照しながら、通常のH.324マルチメディア端末について以下にさらに詳細に説明する。マルチメディア端末160は、種々のいわゆる「端末装置」を含む。このマルチメディア端末装置は、全体をそれぞれ参照番号161、162および163で示すビデオ・デバイス、オーディオ・デバイスおよびテレマティック装置を含む。ビデオ装置161は、例えば、ビデオ画像を捕捉するためのビデオ・カメラ、受信ビデオコンテンツを表示するためのモニタ、およびオプションとして処理装置を含むことができる。オーディオ装置162は、通常、例えば、言語によるメッセージを捕捉するためのマイクロホン、および受信したオーディオコンテンツを再生するためのラウドスピーカを含む。オーディオ装置は、また、他のオーディオ処理ユニットを含むこともできる。テレマティック装置163は、データ端末、キーボード、電子ホワイトボードまたはファックス・ユニットのような静止画像トランシーバを含むことができる。
【0088】
ビデオ装置は、ビデオ・コーデック165に接続している。ビデオ・コーデックは、ビデオ・エンコーダおよび対応するビデオ・デコーダを備える。このビデオ・コーデックは、通信リンクを通してさらに送信するために、捕捉したビデオ・データを適当な形に符号化し、通信ネットワークから受信した圧縮ビデオコンテンツを復号化する。図16の例の場合には、ビデオ・コーデックは、遅いビット速度のビデオ会議用に使用するのに特に適している、ITU-T勧告H.263により実行される。この場合、通信リンクは使用できる帯域幅が、例えば、20kbpsである無線チャネルである。
【0089】
同様に、端末オーディオ装置は、図16に参照番号166で示すオーディオ・コーデックに接続している。この例の場合には、オーディオ・コーデックは、ITU-T勧告G.723.1に従って実施される。ビデオ・コーデックのように、オーディオ・コーデックもエンコーダ/デコーダのペアを備えている。オーディオ・コーデックは、端末のオーディオ装置が捕捉したオーディオ・データを、通信リンクを通して送信するのに適している形に変換し、ネットワークから受信した符号化されたオーディオ・データを、例えば、端末のラウドスピーカで再生するのに適している形に変換する。オーディオ・コーデックの出力は、遅延ブロック167に送られる。この遅延ブロックは、ビデオ符号化による遅延を補正し、それにより、オーディオコンテンツおよびビデオコンテンツを確実に同期させる。
【0090】
マルチメディア端末のシステム制御ブロック164は、送信端末と受信端末との間に通常の動作モードを確立するために、端末−ネットワーク間の信号送信を制御する。H.324は、エンドツーエンド信号方式は、ITU-T勧告H.245が定義する制御プロトコルにより実行すべきことを規定している。図16に参照番号168で示すH.245制御プロトコルは、送信端末および受信端末の符号化機能および復号化機能に関する情報を交換し、ビデオ・エンコーダの種々の符号化モードを動作できるようにすることができる。システム制御ブロック164は、また、ITU-T勧告H.233により、データ暗号化の使用を制御する。データ伝送の際に使用する暗号化のタイプに関する情報は、暗号化ブロック169からマルチプレクサ/デマルチプレクサ(MUX/DMUXユニット)170に送られる。
【0091】
マルチメディア端末からのデータの送信中、MUX/DMUXユニット170は、1本のビット・ストリームを形成するために、符号化され、同期しているビデオ・ストリームおよびオーディオ・ストリームをテレマティック装置163からのデータ入力と結合する。暗号化ブロック169が供給する、ビット・ストリームに適用されるデータ暗号化のタイプ(もし使用する場合)に関する情報は、暗号化モードを選択するために使用される。それに応じて、多重化され、また恐らく暗号化されているマルチメディア・ビット・ストリームを受信した場合には、MUX/DMUXユニット170は、ビット・ストリームを復号化し、それをその構成マルチメディア成分に分割し、復号化および再生のために、これらの成分を適当なコーデックおよび/または端末装置に送る。H.324規格によれば、MUX/DMUXユニット170は、ITU-T勧告H.223を実行しなければならない。
【0092】
本発明のマルチメディア・コンテンツ生成システム、マルチメディア端末、マルチメディア検索クライアント、ビデオ・エンコーダ、デコーダおよびビデオ・コーデックの機能素子は、ソフトウェアまたは専用ハードウェア、またはこれら2つの組合わせとして実施することができることに留意されたい。本発明のビデオ符号化および復号化方法は、本発明の機能ステップを実行するための機械が読むことができる命令を含むコンピュータ・プログラムの形で実施するのに特に適している。それ故、本発明のエンコーダおよびデコーダは、記憶媒体上に記憶しているソフトウェアとして実施することができ、コンピュータにビデオ符号化および/または復号化機能を供給するために、デスクトップ型パーソナル・コンピュータのようなコンピュータで実行することができる。
【0093】
本発明の利点を強調するために、シミュレーション実験の結果を考慮することによって、パケット損失の場合の動作を検討する。この例の場合、本発明の符号化方法を実施するように設計されたビデオ・エンコーダを、毎秒10フレームの速度で、QCIF(1/4共通中間フォーマット)ビデオ・フレームを符号化するために使用するものと仮定する。周期的INTRAフレーム要求は、5秒の間隔で発生するが、ビデオ・シーケンス内のシーン・カットのために、INTRAフレーム要求は発生しない。INTRA符号化フレームを表すのに必要なデータの量は2000バイトであり、INTERフレームの大きさは約200バイトであると仮定する。これらの数字は、ITU-T勧告H.263のような現在使用しているビデオ符号化により符号化したINTRAおよびINTER符号化QCIFフォーマット・フレームの通常の数字である。
【0094】
インターネットおよびローカル・エリア・ネットワーク(LAN)でデータ伝送用に使用するプロトコル・データ・ユニットの一般的な最大サイズは、約1500バイトである。このパケット・サイズの場合には、通常のINTRA符号化フレームは、その送信のために2つのパケットを必要とする。一方、1つのパケットは、7つのINTERフレームを運ぶことができる。このことは、5秒間のビデオを構成する50フレームを送信するためには、全部で9つのパケットが必要であることを意味する。(通常のように)シーケンスがINTRAフレームでスタートする場合には、通常の5秒間のビデオ・シーケンスは、1つのINTRAフレームと、49のINTER符号化フレームを含む。すでに説明したように、INTRAフレーム要求は、それを送信するために2つのパケットを必要とし、一方、残りの49のINTER符号化フレームは、7つのパケット内に収容することができる。それ故、全部で9つのパケットが必要になる。インターネットを通してデータを送信するには、大きなパケットを使用すると有利であることに留意されたい。第一に、インターネット・バックボーン内において、パケット損失の確率は、本質的には、パケット・サイズとは無関係であり、第二に、大きなパケット・サイズを使用すると、パケット・ヘッダ・オーバーヘッドが低減するからである。
【0095】
本発明の符号化方法を適用した場合、エンコーダは、QCIFフォーマットの入力ビデオ・フレームを記憶するために、その持続時間が5秒+1フレームであるバッファを使用する。符号化プロセスがスタートすると、バッファは最初空になり、その後で、圧縮していないQCIFビデオ・フレームで満たされる。シーケンス内の第1のフレームは、INTRA要求に関連する。この例のバッファの長さは、周期的INTRAリフレッシュ要求速度と一致するように選択され、考慮対象の時間内にシーン・カットまたはINTRAフレーム更新要求が発生しないと仮定しているので、バッファ内に記憶された最後のフレームは、次のINTRA要求と関連する。それ故、エンコーダは、その発生時間が2つのINTRAフレーム要求のほぼ中間である、バッファ内の圧縮していないフレームの位置を知ることができる。このフレームは、INTRAフォーマットへの符号化のために選択され(すなわち、実際のINTRAフレームとなるように選択され)、上記符号化プロセスが、バッファ内のフレームに適用される。ここで考慮するシミュレーションの場合には、さらに、すでに符号化済みであり、現在、圧縮ビデオ・フレームが、パケットをベースとする通信ネットワークを通して送信中であり、通信チャネルは混雑していて、その結果、送信パケットにある割合で損失が生じるものと仮定する。シミュレーションしたビット速度は、18880bpsであり、インターネットを通るオーディオ・ビジュアル・ストリーミングの目標ビット速度は、28.8kbpsモデムを使用する。
【0096】
下記の表においては、本発明の符号化方法の誤り回復と、INTRA要求に関連するすべてのフレーム自身が、(図7に示すように)INTRAフォーマットに符号化される従来の符号化スキームの誤り回復とが比較されている。表4は、平均、9つのパケット内で1つのパケットが喪失する場合の、フレーム損失の数値(11%のパケット損失)を示す。一方、表5は、9つのパケット中の2つのパケットが喪失する状況の、対応する数値(22%のパケット損失)を示す。
【0097】
【表4】
Figure 0004949591
【0098】
【表5】
Figure 0004949591
上記の両方のケースは、本発明の方法を使用した場合には、フレーム損失が少ないことを示す。
【0099】
以上の説明においては、本発明の方法を、例示としての実施形態を参照しながら説明した。当業者であれば、本発明は、上記の例示としての実施形態の正確な詳細に限定されないこと、およびその本質的な属性および特徴から逸脱することなしに、他の形式で実施することができることを理解することができるだろう。それ故、上記の例示としての実施形態は、本発明を制限するものではなく、説明のためのものであるとみなすべきである。それ故、本発明の範囲については、添付の特許請求の範囲、および本明細書に記載する発明のコンセプトの一般的な説明を参照されたい。
【0100】
さらに、(特許請求の範囲を含む)本明細書に記載し、図面に示す各機能は、他の開示および/または図に示す機能とは独立しているもので、本発明に含まれる。この点に関して、本発明は、それが特許請求の範囲に関連していてもいなくても、または解決すべき問題のいずれかまたはすべてを緩和するか否かを問わず、本明細書にはっきりとまたは一般的な表現で開示したすべての新規な機能または機能の組合わせを含む。
本明細書と一緒に提出された添付の要約を引用によって本明細書の記載に援用する。
【図面の簡単な説明】
【図1】 従来技術のマルチメディア・コンテンツ生成および検索システムである。
【図2】 通常のマルチメディア・クリップ・エディタが実行する動作である。
【図3】 通常のマルチメディア・サーバの入力および出力である。
【図4】 マルチメディア・クリップの検索中に通常のクライアント端末が実行する動作である。
【図5】 圧縮ビデオ・シーケンス内のI、PおよびBフレーム間の予測依存性を示す。
【図6】 INTERフレーム符号化を使用するビデオ・シーケンスの一例である。
【図7】 シーン・カット直後におけるINTRAフレームのビデオ・フレーム・シーケンスへの挿入を示す。
【図8】 本発明のビデオ符号化方法により形成したビデオ・シーケンスの一例である。
【図9】 従来技術のビデオ・エンコーダの動作を示すフローチャートである。
【図10】 本発明の好適な実施形態のビデオ符号化方法を示すフローチャートである。
【図11】 本発明の方法によるINTRAフレームの処理を示すフローチャートである。
【図12】 本発明の好適な実施形態によるビデオ復号化方法の手順ステップを示すフローチャートである。
【図13】 ビデオ再生中の本発明による方法の動作を示すフローチャートである。
【図14】 Bフレームを使用した、本発明の他の実施形態によるビデオ符号化方法の手順ステップを示す。
【図15】 本発明に従って実行される、ビデオ・エンコーダが組込まれたマルチメディア・コンテンツ生成および検索システムである。
【図16】 本発明のビデオ符号化/復号化を実行できるビデオ・エンコーダおよびビデオ・デコーダを備えるビデオ・コーデックを含む汎用H.324マルチメディア端末のブロック図である。

Claims (48)

  1. 対応する符号化したビデオ・フレームの組を形成するために、時間的順序を有する符号化していないビデオ・フレームの組を符号化するための方法であって、前記方法が、
    前記符号化していない組の特定のビデオ・フレームに関連する標示であって、前記時間的順序の特定の位置に発生する前記特定のビデオ・フレームが非時間的予測ビデオ・フレーム・フォーマットに符号化されるものであることと時間的予測ビデオ・フレーム・フォーマットにおいてフレーム予測の開始位置として使用されるものであることを示す、前記標示を受信するステップと、
    前記符号化していない組のビデオ・フレームを選択するステップであって、前記選択されたビデオ・フレームは、以下である:
    前記特定のビデオ・フレーム以外であって、
    前記特定のビデオ・フレームに代わって前記非時間的予測ビデオ・フレーム・フォーマットに符号化され、
    前記選択されたビデオ・フレームの前に発生する前記符号化していない組のN個のビデオ・フレームと、前記選択されたビデオ・フレームの後に発生する前記符号化していない組のM個のビデオ・フレームの前記時間的順序の位置に発生する、前記選択するステップと、
    前記特定のビデオ・フレームに代わって前記選択されたビデオ・フレームを前記非時間的予測ビデオ・フレーム・フォーマットに符号化するステップと、
    前記N個のビデオ・フレームを前記選択されたビデオ・フレームを時間的予測の開始位置として用いて時間的逆方向予測ビデオ・フレーム・フォーマットに符号化することによって、符号化したビデオ・フレームの第1のサブセットを形成するステップと、
    前記M個のビデオ・フレームを前記選択されたビデオ・フレームを時間的予測の開始位置として用いて時間的順方向予測ビデオ・フレーム・フォーマットに符号化することによって、符号化したビデオ・フレームの第2のサブセットを形成するステップとを含み、
    前記選択されたビデオ・フレームの選択は、伝送エラーを起こしやすい通信チャネルを通して前記符号化したビデオ・フレームの組が送信される時の伝送エラー伝播の可能性を、前記特定のビデオ・フレームが時間的予測の開始位置として用いられた場合における前記符号化したビデオ・フレームの組に対する伝送エラー伝播の可能性と比較して少なくする、前記符号化したビデオ・フレームの第1および第2のサブセットの各予測経路の長さを提供することを特徴とする方法。
  2. 請求項1に記載の方法において、前記非時間的予測ビデオ・フレーム・フォーマットが、INTRAフレーム・フォーマットであることを特徴とする方法。
  3. 請求項1に記載の方法において、前記N個のビデオ・フレームをINTERフレーム・フォーマットに符号化することによって、前記符号化したビデオ・フレームの第1のサブセットを形成するステップを含むことを特徴とする方法。
  4. 請求項1に記載の方法において、前記N個のビデオ・フレームをPフレーム・フォーマットに符号化することによって、前記符号化したビデオ・フレームの第1のサブセットを形成するステップを含むことを特徴とする方法。
  5. 請求項1に記載の方法において、前記N個のビデオ・フレームをBフレーム・フォーマットに符号化することによって、前記符号化したビデオ・フレームの第1のサブセットを形成するステップを含むことを特徴とする方法。
  6. 請求項1に記載の方法において、前記M個のビデオ・フレームをINTERフレーム・フォーマットに符号化することによって、前記符号化したビデオ・フレームの第2のサブセットを形成するステップを含むことを特徴とする方法。
  7. 請求項1に記載の方法において、前記M個のビデオ・フレームをPフレーム・フォーマットに符号化することによって、前記符号化したビデオ・フレームの第2のサブセットを形成するステップを含むことを特徴とする方法。
  8. 請求項3に記載の方法において、前記N個の各ビデオ・フレームにシーケンシャルな圧縮順序番号を割り当てるステップであって、前記N個のビデオ・フレームの前記時間的順序において最も新しく発生するビデオ・フレームに最も小さな圧縮順序番号が割り当てられ、前記N個のビデオ・フレームの前記時間的順序において最も先に発生するビデオ・フレームに最も大きな圧縮順序番号を割り当てるステップと、
    前記選択されたビデオ・フレームを、前記最も小さな圧縮順序番号を持つ前記ビデオ・フレームをINTERフレーム・フォーマットに符号化するための予測基準フレームとして標示するステップと、
    圧縮順序番号の昇順に、連続してINTERフレーム・フォーマットに前記N個のビデオ・フレームのビデオ・フレームを符号化するステップと、により前記N個のビデオ・フレームを符号化するステップを含むことを特徴とする方法。
  9. 請求項1に記載の方法において、前記N個の各ビデオ・フレームに圧縮順序番号を割り当てるステップと、前記N個のビデオ・フレームの各々に割り当てられた圧縮順序番号により決定された順序で前記N個のビデオ・フレームを符号化するステップとを含むことを特徴とする方法。
  10. 請求項5に記載の方法において、前記選択されたビデオ・フレームを前記N個の各ビデオ・フレームの予測基準フレームとして標示するステップと、
    前記選択されたビデオ・フレームを参照して前記Bフレーム・フォーマットに符号化することによって、ビデオ・フレームの第1のサブセットを形成するステップと、により前記N個のビデオ・フレームを符号化するステップを含むことを特徴とする方法。
  11. 請求項1に記載の方法において、前記M個の各ビデオ・フレームにシーケンシャルな圧縮順序番号を割り当てるステップであって、前記M個のビデオ・フレームの前記時間的順序において最も先に発生するビデオ・フレームに最も小さな圧縮順序番号が割り当てられ、前記M個のビデオ・フレームの前記時間的順序において最も新しく発生するビデオ・フレームに最も大きな圧縮順序番号を割り当てるステップと、
    前記選択されたビデオ・フレームを、前記最も小さな圧縮順序番号を持つ前記ビデオ・フレームをINTERフレーム・フォーマットに符号化するための予測基準フレームとして標示するステップと、
    圧縮順序番号の昇順に、連続してINTERフレーム・フォーマットに前記M個のビデオ・フレームのビデオ・フレームを符号化するステップと、により前記M個のビデオ・フレームを符号化するステップを含む、ことを特徴とする方法。
  12. 請求項1に記載の方法において、前記M個の各ビデオ・フレームに圧縮順序番号を割り当てるステップと、前記M個のビデオ・フレームの各々に割り当てられた圧縮順序番号により決定された順序で前記M個のビデオ・フレームを符号化するステップとを含むことを特徴とする方法。
  13. 請求項1に記載の方法において、前記標示はシーン・カットを伴うINTRAフレーム要求であることを特徴とする方法。
  14. 請求項1に記載の方法において、前記標示は周期的INTRAフレーム要求であることを特徴とする方法。
  15. 請求項1に記載の方法において、前記標示は受信端末からフィードバックとしてINTRAフレーム更新要求であることを特徴とする方法。
  16. 請求項1ないし15のいずれか一項に記載の方法において、
    符号化していないビデオ・フレームの前記組のほぼ中間に発生するビデオ・フレームとして前記選択されたビデオ・フレームを選択するステップを含むことを特徴とする方法。
  17. 請求項1ないし16のいずれか一項に記載の方法において、さらに、前記ビデオ・フレームの意図された再生順序に関する情報を提供するステップを含むことを特徴とする方法。
  18. 請求項1ないし17のいずれか一項に記載の方法において、さらに、前記ビデオ・フレームの意図された再生時間に関する情報を提供するステップを含むことを特徴とする方法。
  19. 請求項4に記載の方法において、前記Pフレーム・フォーマットに符号化されたN個のビデオ・フレームの連続するビデオ・フレーム間のBフレームを符号化するステップを含むことを特徴とする方法。
  20. 請求項7に記載の方法において、前記Pフレーム・フォーマットに符号化されたM個のビデオ・フレームの連続するビデオ・フレーム間のBフレームを符号化するステップを含むことを特徴とする方法。
  21. 対応する符号化したビデオ・フレームの組を形成するために、時間的順序を有する符号化していないビデオ・フレームの組を符号化するためのエンコーダであって、前記エンコーダが、
    前記符号化していない組の特定のビデオ・フレームに関連する標示であって、前記時間的順序の特定の位置に発生する前記特定のビデオ・フレームが非時間的予測ビデオ・フレーム・フォーマットに符号化されるものであることと時間的予測ビデオ・フレーム・フォーマットにおいてビデオ・フレーム予測の開始位置として使用されるものであることを示す、前記組の特定の標示を受信する手段と、
    前記符号化していない組のビデオ・フレームを選択する手段であって、前記選択されたビデオ・フレームは、以下である:
    前記特定のビデオ・フレーム以外であって、
    前記特定のビデオ・フレームに代わって前記非時間予測ビデオ・フレーム・フォーマットに符号化され、
    前記選択されたビデオ・フレームの前に発生する前記符号化していない組のN個のビデオ・フレームと、前記選択されたビデオ・フレームの後に発生する前記符号化していない組のM個のビデオ・フレームの前記時間的順序の位置に発生する、前記選択する手段と、
    前記特定のビデオ・フレームに代わって前記選択されたビデオ・フレームを前記非時間的予測ビデオ・フレーム・フォーマットに符号化する手段と、
    前記N個のビデオ・フレームを前記選択されたビデオ・フレームを時間的予測の開始位置として用いて、時間的逆方向予測ビデオ・フレーム・フォーマットに符号化することによって、符号化したビデオ・フレームの第1のサブセットを形成する手段と、
    前記M個のビデオ・フレームを時間的予測の開始位置として前記選択されたビデオ・フレームを用いて、時間的順方向予測ビデオ・フレーム・フォーマットに符号化することによって、符号化したビデオ・フレームの第2のサブセットを形成する手段とを含み、
    前記選択されたビデオ・フレームの選択は、伝送エラーを起こしやすい通信チャネルを通して前記符号化したビデオ・フレームの組が送信される時の伝送エラー伝播の可能性を、前記特定のビデオ・フレームが時間的予測の開始位置として用いられた場合における前記符号化したビデオ・フレームの組に対する伝送エラー伝播の可能性と比較して少なくする、前記符号化したビデオ・フレームの第1および第2のサブセットの各予測経路の長さを提供することを特徴とするエンコーダ。
  22. 請求項21に記載のエンコーダにおいて、前記非時間的予測ビデオ・フレーム・フォーマットが、INTRAフレーム・フォーマットであることを特徴とするエンコーダ。
  23. 請求項21に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第1のサブセットを形成する前記手段は、前記N個のビデオ・フレームをINTERフレーム・フォーマットに符号化するよう構成されることを特徴とするエンコーダ。
  24. 請求項21に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第1のサブセットを形成する前記手段は、前記N個のビデオ・フレームをPフレーム・フォーマットに符号化するよう構成されることを特徴とするエンコーダ。
  25. 請求項21に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第1のサブセットを形成する前記手段は、前記N個のビデオ・フレームをBフレーム・フォーマットに符号化するよう構成されることを特徴とするエンコーダ。
  26. 請求項21に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第2のサブセットを形成する前記手段は、前記M個のビデオ・フレームをINTERフレーム・フォーマットに符号化するよう構成されることを特徴とするエンコーダ。
  27. 請求項21に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第2のサブセットを形成する前記手段は、前記M個のビデオ・フレームをPフレーム・フォーマットに符号化するよう構成されることを特徴とするエンコーダ。
  28. 請求項21に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第1のサブセットを形成する前記手段が、
    前記N個の各ビデオ・フレームにシーケンシャルな圧縮順序番号を割り当てる手段であって、前記N個のビデオ・フレームの前記時間的順序において最も新しく発生するビデオ・フレームに最も小さな圧縮順序番号が割り当てられ、前記N個のビデオ・フレームの前記時間的順序において最も先に発生するビデオ・フレームに最も大きな圧縮順序番号を割り当てる手段と、
    前記選択されたビデオ・フレームを、前記最も小さな圧縮順序番号を持つ前記ビデオ・フレームをINTERフレーム・フォーマットに符号化するための予測基準フレームとして標示する手段と、
    圧縮順序番号の昇順に、連続してINTERフレーム・フォーマットに前記N個のビデオ・フレームのビデオ・フレームを符号化する手段とを含むことを特徴とするエンコーダ。
  29. 請求項21に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第1のサブセットを形成する前記手段は、前記第1のサブセットのビデオ・フレームの前記N個の各ビデオ・フレームに圧縮順序番号を割り当て、前記N個のビデオ・フレームの各々に割り当てられた圧縮順序番号により決定された順序で前記N個のビデオ・フレームを符号化するよう構成されることを特徴とするエンコーダ。
  30. 請求項25に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第1のサブセットを形成する前記手段が、
    前記選択されたビデオ・フレームを前記N個の各ビデオ・フレームの予測基準フレームとして標示する手段と、
    前記選択されたビデオ・フレームを参照して前記N個のビデオ・フレームを前記Bフレーム・フォーマットに符号化する手段と、
    を含むことを特徴とするエンコーダ。
  31. 請求項21に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第2のサブセットを形成する前記手段が、
    前記M個の各ビデオ・フレームにシーケンシャルな圧縮順序番号を割り当てる手段であって、前記M個のビデオ・フレームの前記時間的順序において最も先に発生するビデオ・フレームに最も小さな圧縮順序番号が割り当てられ、前記M個のビデオ・フレームの前記時間的順序において最も新しく発生するビデオ・フレームに最も大きな圧縮順序番号を割り当てる手段と、
    前記選択されたビデオ・フレームを、前記最も小さな圧縮順序番号を持つ前記ビデオ・フレームをINTERフレーム・フォーマットに符号化するための予測基準フレームとして標示する手段と、
    圧縮順序番号の昇順に、連続してINTERフレーム・フォーマットに前記M個のビデオ・フレームのビデオ・フレームを符号化する手段とを含むことを特徴とするエンコーダ。
  32. 請求項21に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第2のサブセットを形成する前記手段は、前記第2のサブセットのビデオ・フレームの前記M個の各ビデオ・フレームに圧縮順序番号を割り当て、前記M個のビデオ・フレームの各々に割り当てられた圧縮順序番号により決定された順序で前記M個のビデオ・フレームを符号化するよう構成されることを特徴とするエンコーダ。
  33. 請求項21に記載のエンコーダにおいて、標示を受信する前記手段が、シーン・カットを伴うINTRAフレーム要求を受信するよう構成され、前記INTRAフレーム要求は前記特定のビデオ・フレームが前記非時間的予測ビデオ・フレーム・
    フォーマットに符号化されることを標示することを特徴とするエンコーダ。
  34. 請求項21に記載のエンコーダにおいて、標示を受信する前記手段が、周期的INTRAフレーム要求を受信するよう構成され、前記周期的INTRAフレーム要求は前記特定のビデオ・フレームが前記非時間的予測ビデオ・フレーム・フォーマットに符号化されることを標示することを特徴とするエンコーダ。
  35. 請求項21に記載のエンコーダにおいて、標示を受信する前記手段が、受信端末からフィードバックとしてINTRAフレーム更新要求を受信するよう構成され、前記INTRAフレーム更新要求は前記特定のビデオ・フレームが前記非時間的予測ビデオ・フレーム・フォーマットに符号化されることを標示することを特徴とするエンコーダ。
  36. 請求項21ないし35のいずれか一項に記載のエンコーダにおいて、前記選択する手段は、
    符号化していないビデオ・フレームの前記組のほぼ中間に発生するビデオ・フレームとして前記選択されたビデオ・フレームを選択するよう構成されることを特徴とするエンコーダ。
  37. 請求項21ないし36のいずれか一項に記載のエンコーダにおいて、前記エンコーダはさらに、前記ビデオ・フレームの意図された再生順序に関する情報を提供する手段を含むことを特徴とするエンコーダ。
  38. 請求項21ないし37のいずれか一項に記載のエンコーダにおいて、前記エンコーダはさらに、前記ビデオ・フレームの意図された再生時間に関する情報を提供する手段を含むことを特徴とするエンコーダ。
  39. 請求項24に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第1のサブセットを形成する手段は、前記Pフレーム・フォーマットに符号化されたN個のビデオ・フレームの連続するビデオ・フレーム間のBフレームを符号化する手段を含むことを特徴とするエンコーダ。
  40. 請求項27に記載のエンコーダにおいて、前記符号化したビデオ・フレームの第2のサブセットを形成する手段は、前記Pフレーム・フォーマットに符号化されたM個のビデオ・フレームの連続するビデオ・フレーム間のBフレームを符号化する手段を含むことを特徴とするエンコーダ。
  41. ビデオ・コーデックであって、請求項21ないし40のいずれか一項に記載のエンコーダを含むことを特徴とするビデオ・コーデック。
  42. マルチメディア・コンテンツ生成システムであって、請求項21ないし40のいずれか一項に記載のエンコーダを含むことを特徴とするマルチメディア・コンテンツ生成システム。
  43. マルチメディア端末であって、請求項21ないし40のいずれか一項に記載のエンコーダを含むことを特徴とするマルチメディア端末。
  44. 請求項43に記載のマルチメディア端末において、前記マルチメディア端末が、無線通信デバイスであることを特徴とするマルチメディア端末。
  45. 対応する符号化したビデオ・フレームの組を形成するために、時間的順序を有する符号化していないビデオ・フレームの組を符号化するためのエンコーダとしてコンピュータを動作させるためのコンピュータ・プログラムであって、符号化される前記ビデオ・フレームは時間的順序を有し、前記コンピュータ・プログラムが、
    前記符号化していない組の特定のビデオ・フレームに関連する標示であって、前記時間的順序の特定の位置に発生するビデオ・フレームが非時間的予測ビデオ・フレーム・フォーマットに符号化されるものであることと、時間的予測ビデオ・フレーム・フォーマットにおいてビデオ・フレーム予測の開始位置として使用されるものであることを示す、前記標示を受信するためのコンピュータ・コードと、
    前記符号化していない組のビデオ・フレームを選択するためのコンピュータ・コードであって、前記選択されたビデオ・フレームは、以下である:
    前記特定のビデオ・フレーム以外であって、
    前記特定のビデオ・フレームに代わって前記非時間的予測ビデオ・フレーム・フォーマットに符号化され、
    前記選択されたビデオ・フレームの前に発生する前記符号化していない組のN個のビデオ・フレームと、前記選択されたビデオ・フレームの後に発生する前記符号化していない組のM個のビデオ・フレームの前記時間的順序の位置に発生する、前記選択するためのコンピュータ・コードと、
    前記特定のビデオ・フレームに代わって前記選択されたビデオ・フレームを前記非時間的予測ビデオ・フレーム・フォーマットに符号化するためのコンピュータ・コードと、
    前記N個のビデオ・フレームを前記選択されたビデオ・フレームを時間的予測の開始位置として用いて時間的逆方向予測ビデオ・フレーム・フォーマットに符号化することによって、符号化したビデオ・フレームの第1のサブセットを形成するためのコンピュータ・コードと、
    前記M個のビデオ・フレームを前記選択されたビデオ・フレームを時間的予測の開始位置として用いて時間的順方向予測ビデオ・フレーム・フォーマットに符号化することによって、符号化したビデオ・フレームの第2のサブセットを形成するためのコンピュータ・コードとを含み、
    前記選択されたビデオ・フレームの選択は、伝送エラーを起こしやすい通信チャネルを通して前記符号化したビデオ・フレームの組が送信される時の伝送エラー伝播の可能性を、前記特定のビデオ・フレームが時間的予測の開始位置として用いられた場合における前記符号化したビデオ・フレームの組に対する伝送エラー伝播の可能性と比較して少なくする、前記符号化したビデオ・フレームの第1および第2のサブセットの各予測経路の長さを提供することを特徴とするコンピュータ・プログラム。
  46. 請求項45に記載のコンピュータ・プログラムを含む記憶媒体。
  47. 対応する符号化したビデオ・フレームの組を形成するために、時間的順序を有する符号化していないビデオ・フレームの組を符号化するための装置であって、前記装置が、
    前記符号化していない組の特定のビデオ・フレームに関連する標示であって、前記時間的順序の特定の位置に発生する前記特定のビデオ・フレームが非時間的予測ビデオ・フレーム・フォーマットに符号化されるものであることと時間的予測ビデオ・フレーム・フォーマットにおいてビデオ・フレーム予測の開始位置として使用されるものであることを示す、前記標示を受信し、
    前記符号化していない組のビデオ・フレームを選択することであって、前記選択されたビデオ・フレームは、以下である:
    前記特定のビデオ・フレーム以外であって、
    前記選択されたビデオ・フレームの前に発生する前記符号化していない組のN個のビデオ・フレームと、前記選択されたビデオ・フレームの後に発生する前記符号化していない組のM個のビデオ・フレームの前記時間的順序の位置に発生する、前記選択をし、
    前記特定のビデオ・フレームに代わって前記選択されたビデオ・フレームを前記非時間的予測ビデオ・フレーム・フォーマットに符号化し、
    前記N個のビデオ・フレームを前記選択されたビデオ・フレームを時間的予測の開始位置として用いて時間的逆方向予測ビデオ・フレーム・フォーマットに符号化することによって、符号化したビデオ・フレームの第1のサブセットを形成し、
    前記M個のビデオ・フレームを前記選択されたビデオ・フレームを時間的予測の開始位置として用いて時間的順方向予測ビデオ・フレーム・フォーマットに符号化することによって、符号化したビデオ・フレームの第2のサブセットを形成するように構成され、
    前記選択されたビデオ・フレームの選択は、前記符号化したビデオ・フレームの組が、前記特定のビデオ・フレームが時間的予測の開始位置として用いられた場合の前記組に対する伝送エラー伝播の可能性と比較して、伝送エラーを起こしやすい通信チャネルを通して送信される時の伝送エラー伝播の可能性を少なくする、前記符号化したビデオ・フレームの第1および第2のサブセットの各予測経路の長さを提供することを特徴とする装置。
  48. 対応する符号化したビデオ・フレームの組を形成するために、時間的順序を有する符号化していないビデオ・フレームの組を符号化するための装置であって、前記装置が、
    前記符号化していない組の特定のビデオ・フレームに関連する標示であって、前記時間的順序の特定の位置に発生する前記特定のビデオ・フレームが非時間的予測ビデオ・フレーム・フォーマットに符号化されるものであることと時間的予測ビデオ・フレーム・フォーマットにおいてビデオ・フレーム予測の開始位置として使用されるものであることを示す、前記標示を受信するように構成されるユニットと、
    前記符号化していない組のビデオ・フレームを選択することであって、前記選択されたビデオ・フレームは、以下である:
    前記特定のビデオ・フレーム以外であって、
    前記特定のビデオ・フレームに代わって前記非時間的予測ビデオ・フレーム・フォーマットに符号化され、
    前記選択されたビデオ・フレームの前に発生する前記符号化していない組のN個のビデオ・フレームと、前記選択されたビデオ・フレームの後に発生する前記符号化していない組のM個のビデオ・フレームの前記時間的順序の位置に発生する、前記選択するように構成される選択ユニットと、
    前記特定のビデオ・フレームに代わって前記選択されたビデオ・フレームを前記非時間的予測ビデオ・フレーム・フォーマットに符号化するように構成されるエンコーダと、
    前記N個のビデオ・フレームを前記選択されたビデオ・フレームを時間的予測の開始位置として用いて時間的逆方向予測ビデオ・フレーム・フォーマットに符号化することによって、符号化したビデオ・フレームの第1のサブセットを形成するように構成されるエンコーダと、
    前記M個のビデオ・フレームを前記選択されたビデオ・フレームを時間的予測の開始位置として用いて時間的順方向予測ビデオ・フレーム・フォーマットに符号化することによって、符号化したビデオ・フレームの第2のサブセットを形成するように構成されるエンコーダとを含み、
    前記選択されたビデオ・フレームの選択は、伝送エラーを起こしやすい通信チャネルを通して前記符号化したビデオ・フレームの組が送信される時の伝送エラー伝播の可能性を、前記特定のビデオ・フレームが時間的予測の開始位置として用いられた場合における前記符号化したビデオ・フレームの組に対する伝送エラー伝播の可能性と比較して少なくする、前記符号化したビデオ・フレームの第1および第2のサブセットの各予測経路の長さを提供することを特徴とする装置。
JP2002505524A 2000-06-30 2001-06-28 ビデオ誤り回復方法 Expired - Lifetime JP4949591B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0016243A GB2364459B (en) 2000-06-30 2000-06-30 Video error resilience
GB0016243.8 2000-06-30
PCT/EP2001/007366 WO2002001882A2 (en) 2000-06-30 2001-06-28 Video error resilience

Publications (3)

Publication Number Publication Date
JP2004502359A JP2004502359A (ja) 2004-01-22
JP2004502359A5 JP2004502359A5 (ja) 2009-09-10
JP4949591B2 true JP4949591B2 (ja) 2012-06-13

Family

ID=9894877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002505524A Expired - Lifetime JP4949591B2 (ja) 2000-06-30 2001-06-28 ビデオ誤り回復方法

Country Status (15)

Country Link
US (2) US20020041629A1 (ja)
EP (1) EP1300024A2 (ja)
JP (1) JP4949591B2 (ja)
KR (1) KR100945548B1 (ja)
CN (2) CN100473169C (ja)
AU (1) AU2001291657A1 (ja)
BR (1) BR0111218A (ja)
CA (1) CA2412722C (ja)
EE (1) EE200200719A (ja)
GB (1) GB2364459B (ja)
HK (1) HK1088161A1 (ja)
HU (1) HUP0302078A3 (ja)
MX (1) MXPA02011734A (ja)
WO (1) WO2002001882A2 (ja)
ZA (1) ZA200208713B (ja)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002034021A (ja) * 2000-07-14 2002-01-31 Mitsubishi Electric Corp 画像信号蓄積再生装置および画像信号送信装置
US20050259750A1 (en) * 2002-07-24 2005-11-24 Koninklijke Philips Electronics N.V. Method and encoder for encoding a digital video signal
US7796499B2 (en) * 2003-12-05 2010-09-14 Telefonaktiebolaget L M Ericsson (Publ) Method of and system for video fast update
US7676722B2 (en) * 2004-03-31 2010-03-09 Sony Corporation Multimedia content delivery using pre-stored multiple description coded video with restart
US7958252B2 (en) * 2004-05-04 2011-06-07 Qualcomm Incorporated System for scalable transmission of content in a data network
CN1973550B (zh) * 2004-07-07 2010-08-18 汤姆森许可贸易公司 使用冗余视频流的通过dsl的数字视频广播系统中的快速频道改变
US7561620B2 (en) * 2004-08-03 2009-07-14 Microsoft Corporation System and process for compressing and decompressing multiple, layered, video streams employing spatial and temporal encoding
JP2008518544A (ja) * 2004-10-29 2008-05-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Mpegストリームのスライシング
US8006279B2 (en) * 2004-12-10 2011-08-23 Alcatel Lucent Distributive system for marking and blocking video and audio content related to video and audio programs
JP2007214010A (ja) 2006-02-10 2007-08-23 Seiko Epson Corp 放電灯点灯装置及びプロジェクタ
KR100775176B1 (ko) * 2006-03-10 2007-11-12 엘지전자 주식회사 동영상 정보를 썸네일로 재생하는 방법 및 이를 이용한단말기
DE102006012449A1 (de) * 2006-03-17 2007-09-20 Benq Mobile Gmbh & Co. Ohg Verfahren zum Dekodieren eines Datenstroms und Empfänger
US8279928B2 (en) * 2006-05-09 2012-10-02 Canon Kabushiki Kaisha Image encoding apparatus and encoding method, image decoding apparatus and decoding method
US7868879B2 (en) * 2006-05-12 2011-01-11 Doremi Labs, Inc. Method and apparatus for serving audiovisual content
KR101345073B1 (ko) 2006-09-07 2013-12-26 톰슨 라이센싱 각 그룹이 인트라 인코딩된 픽처와 둘 이상의 예측 인코딩된 픽처를 포함하는, 비디오 시퀀스의 픽처들의 그룹들을 인코딩하기 위한 방법 및 장치
US8711929B2 (en) * 2006-11-01 2014-04-29 Skyfire Labs, Inc. Network-based dynamic encoding
US9247260B1 (en) 2006-11-01 2016-01-26 Opera Software Ireland Limited Hybrid bitmap-mode encoding
DE102006057983A1 (de) * 2006-12-08 2008-06-12 Siemens Ag Verfahren zur Vidoecodierung einer Folge digitalisierter Bilder
WO2008092131A2 (en) * 2007-01-25 2008-07-31 Skyfire Labs, Inc. Mobile device user interface for remote interaction
US8055779B1 (en) 2007-05-10 2011-11-08 Adobe Systems Incorporated System and method using data keyframes
US8542908B2 (en) * 2007-05-10 2013-09-24 Yeda Research & Development Co. Ltd. Bidirectional similarity of signals
US9979931B2 (en) * 2007-05-30 2018-05-22 Adobe Systems Incorporated Transmitting a digital media stream that is already being transmitted to a first device to a second device and inhibiting presenting transmission of frames included within a sequence of frames until after an initial frame and frames between the initial frame and a requested subsequent frame have been received by the second device
US8180029B2 (en) * 2007-06-28 2012-05-15 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8194741B2 (en) * 2007-10-12 2012-06-05 Broadcom Corporation Method and system for processing B pictures with missing or invalid forward reference pictures
US8380874B2 (en) 2007-10-19 2013-02-19 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8706907B2 (en) 2007-10-19 2014-04-22 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8391312B2 (en) 2007-10-19 2013-03-05 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8145780B2 (en) * 2007-10-19 2012-03-27 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8699678B2 (en) 2007-10-19 2014-04-15 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8111713B2 (en) 2007-10-19 2012-02-07 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8321581B2 (en) * 2007-10-19 2012-11-27 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US20090103529A1 (en) * 2007-10-19 2009-04-23 Rebelvox, Llc Telecommunication and multimedia management method and apparatus
US8682336B2 (en) * 2007-10-19 2014-03-25 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8001261B2 (en) 2007-10-19 2011-08-16 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
US8090867B2 (en) * 2007-10-19 2012-01-03 Voxer Ip Llc Telecommunication and multimedia management method and apparatus
CN101192903B (zh) * 2007-11-28 2011-08-03 腾讯科技(深圳)有限公司 数据帧编解码控制方法
CN101232619B (zh) * 2008-01-25 2011-05-11 浙江大学 嵌入帧内编码块的视频编码方法
US8902996B2 (en) 2008-02-26 2014-12-02 Richwave Technology Corp. Adaptive wireless video transmission systems and methods
US8265171B2 (en) * 2008-02-26 2012-09-11 Richwave Technology Corp. Error resilient video transmission using instantaneous receiver feedback and channel quality adaptive packet retransmission
CN101931807B (zh) * 2010-06-29 2016-07-06 无锡中感微电子股份有限公司 验证多媒体播放器容错性的方法和装置
JP5978574B2 (ja) * 2011-09-12 2016-08-24 ソニー株式会社 送信装置、送信方法、受信装置、受信方法および送受信システム
US9407923B2 (en) 2013-05-20 2016-08-02 Gamefly Israel Ltd. Overconing lost IP packets in streaming video in IP networks
EP3061233B1 (en) 2013-10-25 2019-12-11 Microsoft Technology Licensing, LLC Representing blocks with hash values in video and image coding and decoding
US10521086B1 (en) * 2013-12-17 2019-12-31 Amazon Technologies, Inc. Frame interpolation for media streaming
US10567754B2 (en) 2014-03-04 2020-02-18 Microsoft Technology Licensing, Llc Hash table construction and availability checking for hash-based block matching
KR102287779B1 (ko) * 2014-06-23 2021-08-06 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 해시 기반의 블록 매칭의 결과에 기초한 인코더 결정
EP3416386B1 (en) 2014-09-30 2021-01-13 Microsoft Technology Licensing, LLC Hash-based encoder decisions for video coding
US9900643B2 (en) 2014-10-10 2018-02-20 At&T Intellectual Property I, L.P. Method and apparatus for transmitting media content
CN105376595A (zh) * 2015-12-17 2016-03-02 杭州雄迈信息技术有限公司 一种视频混合编码系统和方法
US11095877B2 (en) 2016-11-30 2021-08-17 Microsoft Technology Licensing, Llc Local hash-based motion estimation for screen remoting scenarios
US10291936B2 (en) 2017-08-15 2019-05-14 Electronic Arts Inc. Overcoming lost or corrupted slices in video streaming
CN111641824B (zh) * 2019-03-01 2022-08-05 杭州海康威视数字技术股份有限公司 视频倒放方法及装置
US11202085B1 (en) 2020-06-12 2021-12-14 Microsoft Technology Licensing, Llc Low-cost hash table construction and hash-based block matching for variable-size blocks

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02200084A (ja) * 1989-01-30 1990-08-08 Victor Co Of Japan Ltd 高能率符号化方式
JPH02234586A (ja) * 1989-03-08 1990-09-17 Victor Co Of Japan Ltd 高能率符号化方式
US5146325A (en) 1991-04-29 1992-09-08 Rca Thomson Licensing Corporation Video signal decompression apparatus for independently compressed even and odd field data
EP0691788A1 (en) * 1992-03-24 1996-01-10 Kabushiki Kaisha Toshiba Variable length code recording/playback apparatus
JP2565057B2 (ja) 1992-06-30 1996-12-18 日本ビクター株式会社 フレ−ム間又はフィ−ルド間予測符号化方法
TW224553B (en) * 1993-03-01 1994-06-01 Sony Co Ltd Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture
US5592226A (en) * 1994-01-26 1997-01-07 Btg Usa Inc. Method and apparatus for video data compression using temporally adaptive motion interpolation
US5874997A (en) * 1994-08-29 1999-02-23 Futuretel, Inc. Measuring and regulating synchronization of merged video and audio data
JP3711571B2 (ja) * 1994-09-29 2005-11-02 ソニー株式会社 画像符号化装置及び画像符号化方法
JP3591033B2 (ja) * 1995-02-15 2004-11-17 ソニー株式会社 符号化データの特殊再生方法および特殊再生装置
GB2301973B (en) * 1995-06-06 1999-10-20 Sony Uk Ltd Motion compensated video processing
US5774593A (en) * 1995-07-24 1998-06-30 University Of Washington Automatic scene decomposition and optimization of MPEG compressed video
JPH0974566A (ja) * 1995-09-04 1997-03-18 Sony Corp 圧縮符号化装置及び圧縮符号化データの記録装置
JP3068002B2 (ja) * 1995-09-18 2000-07-24 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
US6057893A (en) * 1995-12-28 2000-05-02 Sony Corporation Picture encoding method, picture encoding apparatus, picture transmitting method and picture recording medium
JP3823275B2 (ja) * 1996-06-10 2006-09-20 富士通株式会社 動画像符号化装置
JP3606306B2 (ja) * 1998-10-08 2005-01-05 沖電気工業株式会社 画像符号化装置、画像復号化装置及び画像伝送システム
US6526097B1 (en) * 1999-02-03 2003-02-25 Sarnoff Corporation Frame-level rate control for plug-in video codecs

Also Published As

Publication number Publication date
WO2002001882A8 (en) 2004-04-29
MXPA02011734A (es) 2003-03-27
JP2004502359A (ja) 2004-01-22
CA2412722C (en) 2012-02-07
US20050123045A1 (en) 2005-06-09
KR100945548B1 (ko) 2010-03-08
KR20030014709A (ko) 2003-02-19
ZA200208713B (en) 2003-08-06
BR0111218A (pt) 2003-03-18
WO2002001882A3 (en) 2002-09-12
CN1449628A (zh) 2003-10-15
EE200200719A (et) 2004-08-16
AU2001291657A1 (en) 2002-01-08
HK1088161A1 (en) 2006-10-27
HUP0302078A3 (en) 2005-10-28
CN100473169C (zh) 2009-03-25
US20020041629A1 (en) 2002-04-11
US8355437B2 (en) 2013-01-15
WO2002001882A2 (en) 2002-01-03
HUP0302078A2 (hu) 2003-09-29
CN1738432A (zh) 2006-02-22
CA2412722A1 (en) 2002-01-03
CN1738432B (zh) 2011-02-09
GB0016243D0 (en) 2000-08-23
EP1300024A2 (en) 2003-04-09
GB2364459A (en) 2002-01-23
GB2364459B (en) 2004-03-31

Similar Documents

Publication Publication Date Title
JP4949591B2 (ja) ビデオ誤り回復方法
KR100927159B1 (ko) 데이터 전송
JP5026167B2 (ja) ストリーム伝送サーバおよびストリーム伝送システム
JP2004507178A (ja) ビデオ信号符号化方法
KR100800716B1 (ko) 근거리 통신을 이용한 동영상 데이터 송수신 장치 및 그송수신 장치에서의 동영상 데이터 송수신 방법
JP2005176352A (ja) 移動通信端末機の動画像ストリーミングサービスのための無線動画像ストリーミングファイル、サービス方法及びシステム
JP2005522115A (ja) データストリーミングシステムのためのデータ構造
JP4526294B2 (ja) ストリームデータ送信装置、受信装置、プログラムを記録した記録媒体、およびシステム
US7558323B2 (en) Video data transmission method for changing transmission data amounts in accordance with a transmission speed and a transmission system therefor
JP5031230B2 (ja) データ送信装置及び方法
JP4255685B2 (ja) 画像伝送方法および画像伝送装置
JP4892541B2 (ja) 画像伝送方法および画像伝送システム
KR0147941B1 (ko) 고속재생을 위한 부호화시스템
JP2000253369A (ja) データ伝送装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090724

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090826

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110214

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110221

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110314

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110408

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20110707

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110707

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110711

AA92 Notification that decision to refuse application was cancelled

Free format text: JAPANESE INTERMEDIATE CODE: A971092

Effective date: 20110913

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110922

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120120

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120213

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120308

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4949591

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term