JP2015515806A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2015515806A5 JP2015515806A5 JP2015503204A JP2015503204A JP2015515806A5 JP 2015515806 A5 JP2015515806 A5 JP 2015515806A5 JP 2015503204 A JP2015503204 A JP 2015503204A JP 2015503204 A JP2015503204 A JP 2015503204A JP 2015515806 A5 JP2015515806 A5 JP 2015515806A5
- Authority
- JP
- Japan
- Prior art keywords
- feature
- macroblock
- hierarchy
- prediction
- video data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 claims description 26
- 238000007906 compression Methods 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 13
- 230000000875 corresponding Effects 0.000 claims description 2
- 238000004590 computer program Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 4
- 230000002596 correlated Effects 0.000 description 3
- 230000002860 competitive Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001747 exhibiting Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006011 modification reaction Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001131 transforming Effects 0.000 description 1
Images
Description
本発明を例示的な実施形態を参照しながら具体的に図示・説明したが、当業者であれば、添付の特許請求の範囲に包含される本発明の範囲から逸脱することなく、形態および細部の詳細な変更が可能であることを理解するであろう。
なお、本発明は、実施の態様として以下の内容を含む。
〔態様1〕
映像データを処理する方法であって、
検出アルゴリズムを用いて、少なくとも1つのフレーム内で、対象の領域における特徴およびオブジェクトのうちの少なくとも一方を検出する過程と、
パラメータのセットを用いて、特徴およびオブジェクトのうちの検出された前記少なくとも一方をモデル化する過程と、
特徴およびオブジェクトのうちの検出された前記少なくとも一方の、あらゆるインスタンスを、複数のフレームにわたって相関させる過程と、
相関された前記インスタンスの、少なくとも1つのトラックを形成する過程と、
前記少なくとも1つのトラックを、符号化する映像データの少なくとも1つのブロックに関連付ける過程と、
関連付けられた前記トラックの情報を用いて、映像データの前記少なくとも1つのブロックに対するモデルベース予測を生成する過程であって、前記モデルベース予測を、処理した映像データとして記憶することを含む、過程と、
を備える、映像データの処理方法。
〔態様2〕
態様1に記載の映像データの処理方法において、前記検出アルゴリズムが、ノンパラメトリックな特徴検出アルゴリズムの種類に含まれる、映像データの処理方法。
〔態様3〕
態様1に記載の映像データの処理方法において、前記パラメータのセットが、特徴およびオブジェクトのうちの前記少なくとも一方に関する情報を含み、メモリに記憶される、映像データの処理方法。
〔態様4〕
態様3に記載の映像データの処理方法において、特徴のパラメータが、特徴記述子ベクトルおよび当該特徴の位置を含む、映像データの処理方法。
〔態様5〕
態様4に記載の映像データの処理方法において、前記パラメータが、その特徴の検出時に生成される、映像データの処理方法。
〔態様6〕
態様1に記載の映像データの処理方法において、映像データの前記少なくとも1つのブロックがマクロブロックであり、前記少なくとも1つのトラックが特徴を当該マクロブロックに関連付ける、映像データの処理方法。
〔態様7〕
映像データを処理する方法であって、
対象の領域における特徴およびオブジェクトのうちの少なくとも一方を検出する過程と、
パラメータのセットを用いて、特徴およびオブジェクトのうちの前記少なくとも一方をモデル化する過程と、
特徴およびオブジェクトのうちの前記少なくとも一方の、あらゆるインスタンスを、複数のフレームにわたって相関させる過程と、
相関された前記インスタンスの、少なくとも1つの行列を形成する過程と、
前記少なくとも1つの行列を、符号化する映像データの少なくとも1つのブロックに関連付ける過程と、
関連付けられた前記行列の情報を用いて、映像データの前記少なくとも1つのブロックに対するモデルベース予測を生成する過程であって、前記モデルベース予測を、処理した映像データとして記憶することを含む、過程と、
を備える、映像データの処理方法。
〔態様8〕
態様7に記載の映像データの処理方法において、前記パラメータのセットが、特徴およびオブジェクトのうちの前記少なくとも一方に関する情報を含み、メモリに記憶される、映像データの処理方法。
〔態様9〕
態様8に記載の映像データの処理方法において、特徴のパラメータが、特徴記述子ベクトルおよび当該特徴の位置を含む、映像データの処理方法。
〔態様10〕
態様9に記載の映像データの処理方法において、前記パラメータが、その特徴の検出時に生成される、映像データの処理方法。
〔態様11〕
態様7に記載の映像データの処理方法において、さらに、
あるベクトル空間の少なくとも1つの部分空間を用いて、前記少なくとも1つの行列を、特徴およびオブジェクトのうちの相関された前記少なくとも一方の、パラメトリックモデルとしてまとめる過程、
を含む、映像データの処理方法。
〔態様12〕
映像データを処理するコーデックであって、
少なくとも2つの映像フレーム内における特徴のインスタンスを特定する、特徴ベース検出手段であって、特定される、当該特徴のインスタンスが、前記1つまたは2つ以上の映像フレーム内の他のピクセルよりもデータ複雑さを示す複数のピクセルを有する、特徴ベース検出手段と、
前記特徴ベース検出手段に動作可能に接続されたモデル化手段であって、2つまたは3つ以上の映像フレーム内における特徴の前記インスタンスの対応関係をモデル化する、特徴ベースの対応関係モデルを生成するモデル化手段と、
前記特徴ベースの対応関係モデルを用いて特徴の前記インスタンスを符号化する方が、第1の映像符号化プロセスを用いて特徴の当該インスタンスを符号化するよりも圧縮効率が向上すると判断された場合に、前記特徴ベースの対応関係モデルの使用を優先するキャッシュと、
を備える、コーデック。
〔態様13〕
態様12に記載のコーデックにおいて、従来の映像圧縮法による前記ピクセルの符号化が所定の閾値を超える場合に、前記データ複雑さが判断される、コーデック。
〔態様14〕
態様12に記載のコーデックにおいて、従来の映像圧縮法により前記特徴を符号化すると割り当てられる帯域量が所定の閾値を超える場合に、前記データ複雑さが判断される、コーデック。
〔態様15〕
態様14に記載のコーデックにおいて、前記所定の閾値が、所定の数値、データベースに記憶された所定の数値、過去に符号化した特徴に割り当てられた帯域量の平均値として設定される数値、および過去に符号化した特徴に割り当てられた帯域量の中央値として設定される数値のうちの少なくとも1つである、コーデック。
〔態様16〕
態様12に記載のコーデックにおいて、前記第1の映像符号化プロセスが、動き補償予測プロセスを含む、コーデック。
〔態様17〕
態様12に記載のコーデックにおいて、前記使用の優先が、競争モード内の各ソリューション候補の符号化コストを比較することによって決定され、前記ソリューション候補が、追跡手段、キー予測動きモデル、キー予測サンプリングスキーム、サブタイル化スキーム、再構成アルゴリズム(、および(場合によっては)副次的な予測スキーム)を含む、コーデック。
〔態様18〕
態様17に記載のコーデックにおいて、前記特徴ベースのモデル化の使用が優先されると、特徴の前記インスタンスのデータ複雑さのレベルが前記閾値として使用され、これにより、特徴の後続のインスタンスがその閾値以上のデータ複雑さのレベルを示すと、前記エンコーダが、特徴の当該後続のインスタンスに対する特徴ベースの圧縮の開始及び使用を自動的に判断する、コーデック。
〔態様19〕
態様12に記載のコーデックにおいて、前記特徴ベース検出手段が、FPAトラッカー、MBCトラッカーおよびSURFトラッカーのうちの1つを利用する、コーデック。
〔態様20〕
映像データを処理するコーデックであって、
少なくとも2つの映像フレーム内における特徴のインスタンスを特定する、特徴ベースの検出手段であって、特定される、特徴の当該インスタンスが、前記少なくとも2つの映像フレームのうちの少なくとも1つの映像フレーム内の他のピクセルよりもデータ複雑さを示す複数のピクセルを有する、特徴ベース検出手段と、
前記特徴ベース検出手段に動作可能に接続されたモデル化手段であって、前記少なくとも2つの映像フレーム内における、特徴の特定されたインスタンスの対応関係をモデル化する特徴ベースの対応関係モデルを生成するモデル化手段と、
複数の前記特徴ベースの対応関係モデルのうち、所与の特徴ベースの対応関係モデルにより、特徴の特定された前記インスタンスの圧縮効率が向上すると判断された場合に、その対応関係モデルの使用を優先するメモリと、
を備える、コーデック。
〔態様21〕
態様20に記載のコーデックにおいて、特定された特徴の圧縮効率を、第1の映像符号化プロセスを用いた場合の当該特徴のインスタンスの符号化と、データベースに記憶された圧縮効率の所定の数値との一方と比べることにより、当該特徴の特定されたインスタンスの圧縮効率の向上を判断する、コーデック。
〔態様22〕
映像データを処理する方法であって、
特徴のペルおよび特徴記述子のうちの少なくとも一方をベクトル化することにより、特徴をモデル化する過程と、
(a)特徴のペルの異なるベクトル間または異なる特徴記述子間の平均二乗誤差(MSE)の最小化と、(b)特徴のペルの異なるベクトル間または異なる特徴記述子間の内積の最大化との少なくとも一方により、類似する特徴を特定する過程と、
標準の動き予測・補償アルゴリズムを適用する過程であって、これにより前記特徴の並進動きを考慮し、処理した映像データを得る過程と、
を備える、映像データの処理方法。
〔態様23〕
映像データを処理する方法であって、
モデルベース予測を、ターゲットのフレームを符号化するようにコーデックを構成することによって実現する過程と、
従来の符号化プロセスを用いて、前記ターゲットのフレーム内のマクロブロックを符号化する過程と、
前記マクロブロックの符号化を分析する過程であって、そのマクロブロックの従来の符号化が効率的と非効率の少なくとも一方と判断され、前記従来の符号化が非効率と判断された場合、前記マクロブロックに対する予測を複数のモデルに基づいて複数生成することによって、前記エンコーダが分析され、そのマクロブロックの前記複数の予測の評価が、符号化サイズに基づく、過程と、
前記マクロブロックの前記予測を、前記従来の符号化によるマクロブロックと共に順位付けする過程と、
を備える、映像データの処理方法。
〔態様24〕
態様23に記載の映像データの処理方法において、前記マクロブロックの前記従来の符号化を、符号化サイズが所定のサイズ閾値よりも小さい場合に効率的とする、映像データの処理方法。
〔態様25〕
態様23に記載の映像データの処理方法において、前記マクロブロックの前記従来の符号化を、前記ターゲットマクロブロックがスキップマクロブロックである場合に効率的とする、映像データの処理方法。
〔態様26〕
態様23に記載の映像データの処理方法において、前記マクロブロックの前記従来の符号化を、符号化サイズが閾値よりも大きい場合に非効率とする、映像データの処理方法。
〔態様27〕
態様23に記載の映像データの処理方法において、前記マクロブロックの前記従来の符号化が非効率と判断された場合に、当該マクロブロックに対する符号化を競争モードで複数生成して互いの圧縮効率を比較する、映像データの処理方法。
〔態様28〕
態様27に記載の映像データの処理方法において、競争モードの符号化アルゴリズムが、
前記マクロブロックから前記予測を減算する手順であって、これにより、残差信号を生成する手順、
ブロックベースの二次元DCTの近似を用いて、前記残差信号を変換する手順、および
エントロピーエンコーダを用いて、変換係数を符号化する手順、
を備える、映像データの処理方法。
〔態様29〕
態様23に記載の映像データの処理方法において、複数の予測を生成することによって分析される前記エンコーダが、一次的予測および重み付けされた副次的予測を合計する複合予測を生成する、映像データの処理方法。
〔態様30〕
映像データを処理する方法であって、
モデルベース圧縮のために、複数の忠実度でデータをモデル化する過程であって、当該複数の忠実度が、マクロブロック階層、特徴としてのマクロブロック階層、特徴階層、およびオブジェクト階層のうちの少なくとも1つを含む過程、
を備え、
前記マクロブロック階層は、ブロックベースの動き予測・補償(BBMEC)アプリケーションを用いて、復号化した参照フレーム内の限られた探索空間から各タイルに対する予測を見つけ出し、
前記特徴としてのマクロブロック階層は、(i)前記マクロブロック階層と同じ1回目のBBMECアプリケーションを用いて、一番最近の参照フレームからターゲットのマクロブロックの第1の予測を見つけ出し、(ii)2回目のBBMECアプリケーションを用いて、二番目に最近の参照フレームを探索することにより、前記第1の予測に対する第2の予測を見つけ出し、(iii)徐々に過去のフレームを溯ってBBMECアプリケーションを適用することにより、前記ターゲットのマクロブロックのトラックを生成し、
前記特徴階層は、マクロブロックのグリッドに関係なく特徴を検出及び追跡し、その特徴を当該特徴と重複するマクロブロックに関連付けて、特徴のトラックを用いて、復号化した参照フレームをナビゲートすることで前記重複するマクロブロックに対する良好なマッチを見つけ出し、さらに、複数の特徴が1つの対象のターゲットのマクロブロックと重複する場合には、重複の最も大きい特徴が当該ターゲットのマクロブロックをモデル化するのに選択され、
前記オブジェクト階層では、オブジェクトが複数のマクロブロックを包含するか又は複数のマクロブロックと重複する場合、そのオブジェクトに対応する全てのマクロブロックに関して単一の動きベクトルを算出可能であり、これにより演算量及び符号化サイズを節約する、
映像データの処理方法。
〔態様31〕
態様30に記載の映像データの処理方法において、前記複数の忠実度が、順次的に調べられる、映像データの処理方法。
〔態様32〕
態様30に記載の映像データの処理方法において、前記複数の忠実度が、競争モードで調べられる、映像データの処理方法。
〔態様33〕
プログラムコード手段を備えるコンピュータプログラムプロダクトであって、
前記プログラムコード手段は、コンピュータにロードされることにより、態様1に記載の処理方法を実行するように当該コンピュータを制御する、コンピュータプログラムプロダクト。
〔態様34〕
プログラムコード手段を備えるコンピュータプログラムプロダクトであって、
前記プログラムコード手段は、コンピュータにロードされることにより、態様7に記載の処理方法を実行するように当該コンピュータを制御する、コンピュータプログラムプロダクト。
〔態様35〕
プログラムコード手段を備えるコンピュータプログラムプロダクトであって、
前記プログラムコード手段は、コンピュータにロードされることにより、態様22に記載の処理方法を実行するように当該コンピュータを制御する、コンピュータプログラムプロダクト。
〔態様36〕
プログラムコード手段を備えるコンピュータプログラムプロダクトであって、
前記プログラムコード手段は、コンピュータにロードされることにより、態様23に記載の処理方法を実行するように当該コンピュータを制御する、コンピュータプログラムプロダクト。
〔態様37〕
プログラムコード手段を備えるコンピュータプログラムプロダクトであって、
前記プログラムコード手段は、コンピュータにロードされることにより、態様30に記載の処理方法を実行するように当該コンピュータを制御する、コンピュータプログラムプロダクト。
なお、本発明は、実施の態様として以下の内容を含む。
〔態様1〕
映像データを処理する方法であって、
検出アルゴリズムを用いて、少なくとも1つのフレーム内で、対象の領域における特徴およびオブジェクトのうちの少なくとも一方を検出する過程と、
パラメータのセットを用いて、特徴およびオブジェクトのうちの検出された前記少なくとも一方をモデル化する過程と、
特徴およびオブジェクトのうちの検出された前記少なくとも一方の、あらゆるインスタンスを、複数のフレームにわたって相関させる過程と、
相関された前記インスタンスの、少なくとも1つのトラックを形成する過程と、
前記少なくとも1つのトラックを、符号化する映像データの少なくとも1つのブロックに関連付ける過程と、
関連付けられた前記トラックの情報を用いて、映像データの前記少なくとも1つのブロックに対するモデルベース予測を生成する過程であって、前記モデルベース予測を、処理した映像データとして記憶することを含む、過程と、
を備える、映像データの処理方法。
〔態様2〕
態様1に記載の映像データの処理方法において、前記検出アルゴリズムが、ノンパラメトリックな特徴検出アルゴリズムの種類に含まれる、映像データの処理方法。
〔態様3〕
態様1に記載の映像データの処理方法において、前記パラメータのセットが、特徴およびオブジェクトのうちの前記少なくとも一方に関する情報を含み、メモリに記憶される、映像データの処理方法。
〔態様4〕
態様3に記載の映像データの処理方法において、特徴のパラメータが、特徴記述子ベクトルおよび当該特徴の位置を含む、映像データの処理方法。
〔態様5〕
態様4に記載の映像データの処理方法において、前記パラメータが、その特徴の検出時に生成される、映像データの処理方法。
〔態様6〕
態様1に記載の映像データの処理方法において、映像データの前記少なくとも1つのブロックがマクロブロックであり、前記少なくとも1つのトラックが特徴を当該マクロブロックに関連付ける、映像データの処理方法。
〔態様7〕
映像データを処理する方法であって、
対象の領域における特徴およびオブジェクトのうちの少なくとも一方を検出する過程と、
パラメータのセットを用いて、特徴およびオブジェクトのうちの前記少なくとも一方をモデル化する過程と、
特徴およびオブジェクトのうちの前記少なくとも一方の、あらゆるインスタンスを、複数のフレームにわたって相関させる過程と、
相関された前記インスタンスの、少なくとも1つの行列を形成する過程と、
前記少なくとも1つの行列を、符号化する映像データの少なくとも1つのブロックに関連付ける過程と、
関連付けられた前記行列の情報を用いて、映像データの前記少なくとも1つのブロックに対するモデルベース予測を生成する過程であって、前記モデルベース予測を、処理した映像データとして記憶することを含む、過程と、
を備える、映像データの処理方法。
〔態様8〕
態様7に記載の映像データの処理方法において、前記パラメータのセットが、特徴およびオブジェクトのうちの前記少なくとも一方に関する情報を含み、メモリに記憶される、映像データの処理方法。
〔態様9〕
態様8に記載の映像データの処理方法において、特徴のパラメータが、特徴記述子ベクトルおよび当該特徴の位置を含む、映像データの処理方法。
〔態様10〕
態様9に記載の映像データの処理方法において、前記パラメータが、その特徴の検出時に生成される、映像データの処理方法。
〔態様11〕
態様7に記載の映像データの処理方法において、さらに、
あるベクトル空間の少なくとも1つの部分空間を用いて、前記少なくとも1つの行列を、特徴およびオブジェクトのうちの相関された前記少なくとも一方の、パラメトリックモデルとしてまとめる過程、
を含む、映像データの処理方法。
〔態様12〕
映像データを処理するコーデックであって、
少なくとも2つの映像フレーム内における特徴のインスタンスを特定する、特徴ベース検出手段であって、特定される、当該特徴のインスタンスが、前記1つまたは2つ以上の映像フレーム内の他のピクセルよりもデータ複雑さを示す複数のピクセルを有する、特徴ベース検出手段と、
前記特徴ベース検出手段に動作可能に接続されたモデル化手段であって、2つまたは3つ以上の映像フレーム内における特徴の前記インスタンスの対応関係をモデル化する、特徴ベースの対応関係モデルを生成するモデル化手段と、
前記特徴ベースの対応関係モデルを用いて特徴の前記インスタンスを符号化する方が、第1の映像符号化プロセスを用いて特徴の当該インスタンスを符号化するよりも圧縮効率が向上すると判断された場合に、前記特徴ベースの対応関係モデルの使用を優先するキャッシュと、
を備える、コーデック。
〔態様13〕
態様12に記載のコーデックにおいて、従来の映像圧縮法による前記ピクセルの符号化が所定の閾値を超える場合に、前記データ複雑さが判断される、コーデック。
〔態様14〕
態様12に記載のコーデックにおいて、従来の映像圧縮法により前記特徴を符号化すると割り当てられる帯域量が所定の閾値を超える場合に、前記データ複雑さが判断される、コーデック。
〔態様15〕
態様14に記載のコーデックにおいて、前記所定の閾値が、所定の数値、データベースに記憶された所定の数値、過去に符号化した特徴に割り当てられた帯域量の平均値として設定される数値、および過去に符号化した特徴に割り当てられた帯域量の中央値として設定される数値のうちの少なくとも1つである、コーデック。
〔態様16〕
態様12に記載のコーデックにおいて、前記第1の映像符号化プロセスが、動き補償予測プロセスを含む、コーデック。
〔態様17〕
態様12に記載のコーデックにおいて、前記使用の優先が、競争モード内の各ソリューション候補の符号化コストを比較することによって決定され、前記ソリューション候補が、追跡手段、キー予測動きモデル、キー予測サンプリングスキーム、サブタイル化スキーム、再構成アルゴリズム(、および(場合によっては)副次的な予測スキーム)を含む、コーデック。
〔態様18〕
態様17に記載のコーデックにおいて、前記特徴ベースのモデル化の使用が優先されると、特徴の前記インスタンスのデータ複雑さのレベルが前記閾値として使用され、これにより、特徴の後続のインスタンスがその閾値以上のデータ複雑さのレベルを示すと、前記エンコーダが、特徴の当該後続のインスタンスに対する特徴ベースの圧縮の開始及び使用を自動的に判断する、コーデック。
〔態様19〕
態様12に記載のコーデックにおいて、前記特徴ベース検出手段が、FPAトラッカー、MBCトラッカーおよびSURFトラッカーのうちの1つを利用する、コーデック。
〔態様20〕
映像データを処理するコーデックであって、
少なくとも2つの映像フレーム内における特徴のインスタンスを特定する、特徴ベースの検出手段であって、特定される、特徴の当該インスタンスが、前記少なくとも2つの映像フレームのうちの少なくとも1つの映像フレーム内の他のピクセルよりもデータ複雑さを示す複数のピクセルを有する、特徴ベース検出手段と、
前記特徴ベース検出手段に動作可能に接続されたモデル化手段であって、前記少なくとも2つの映像フレーム内における、特徴の特定されたインスタンスの対応関係をモデル化する特徴ベースの対応関係モデルを生成するモデル化手段と、
複数の前記特徴ベースの対応関係モデルのうち、所与の特徴ベースの対応関係モデルにより、特徴の特定された前記インスタンスの圧縮効率が向上すると判断された場合に、その対応関係モデルの使用を優先するメモリと、
を備える、コーデック。
〔態様21〕
態様20に記載のコーデックにおいて、特定された特徴の圧縮効率を、第1の映像符号化プロセスを用いた場合の当該特徴のインスタンスの符号化と、データベースに記憶された圧縮効率の所定の数値との一方と比べることにより、当該特徴の特定されたインスタンスの圧縮効率の向上を判断する、コーデック。
〔態様22〕
映像データを処理する方法であって、
特徴のペルおよび特徴記述子のうちの少なくとも一方をベクトル化することにより、特徴をモデル化する過程と、
(a)特徴のペルの異なるベクトル間または異なる特徴記述子間の平均二乗誤差(MSE)の最小化と、(b)特徴のペルの異なるベクトル間または異なる特徴記述子間の内積の最大化との少なくとも一方により、類似する特徴を特定する過程と、
標準の動き予測・補償アルゴリズムを適用する過程であって、これにより前記特徴の並進動きを考慮し、処理した映像データを得る過程と、
を備える、映像データの処理方法。
〔態様23〕
映像データを処理する方法であって、
モデルベース予測を、ターゲットのフレームを符号化するようにコーデックを構成することによって実現する過程と、
従来の符号化プロセスを用いて、前記ターゲットのフレーム内のマクロブロックを符号化する過程と、
前記マクロブロックの符号化を分析する過程であって、そのマクロブロックの従来の符号化が効率的と非効率の少なくとも一方と判断され、前記従来の符号化が非効率と判断された場合、前記マクロブロックに対する予測を複数のモデルに基づいて複数生成することによって、前記エンコーダが分析され、そのマクロブロックの前記複数の予測の評価が、符号化サイズに基づく、過程と、
前記マクロブロックの前記予測を、前記従来の符号化によるマクロブロックと共に順位付けする過程と、
を備える、映像データの処理方法。
〔態様24〕
態様23に記載の映像データの処理方法において、前記マクロブロックの前記従来の符号化を、符号化サイズが所定のサイズ閾値よりも小さい場合に効率的とする、映像データの処理方法。
〔態様25〕
態様23に記載の映像データの処理方法において、前記マクロブロックの前記従来の符号化を、前記ターゲットマクロブロックがスキップマクロブロックである場合に効率的とする、映像データの処理方法。
〔態様26〕
態様23に記載の映像データの処理方法において、前記マクロブロックの前記従来の符号化を、符号化サイズが閾値よりも大きい場合に非効率とする、映像データの処理方法。
〔態様27〕
態様23に記載の映像データの処理方法において、前記マクロブロックの前記従来の符号化が非効率と判断された場合に、当該マクロブロックに対する符号化を競争モードで複数生成して互いの圧縮効率を比較する、映像データの処理方法。
〔態様28〕
態様27に記載の映像データの処理方法において、競争モードの符号化アルゴリズムが、
前記マクロブロックから前記予測を減算する手順であって、これにより、残差信号を生成する手順、
ブロックベースの二次元DCTの近似を用いて、前記残差信号を変換する手順、および
エントロピーエンコーダを用いて、変換係数を符号化する手順、
を備える、映像データの処理方法。
〔態様29〕
態様23に記載の映像データの処理方法において、複数の予測を生成することによって分析される前記エンコーダが、一次的予測および重み付けされた副次的予測を合計する複合予測を生成する、映像データの処理方法。
〔態様30〕
映像データを処理する方法であって、
モデルベース圧縮のために、複数の忠実度でデータをモデル化する過程であって、当該複数の忠実度が、マクロブロック階層、特徴としてのマクロブロック階層、特徴階層、およびオブジェクト階層のうちの少なくとも1つを含む過程、
を備え、
前記マクロブロック階層は、ブロックベースの動き予測・補償(BBMEC)アプリケーションを用いて、復号化した参照フレーム内の限られた探索空間から各タイルに対する予測を見つけ出し、
前記特徴としてのマクロブロック階層は、(i)前記マクロブロック階層と同じ1回目のBBMECアプリケーションを用いて、一番最近の参照フレームからターゲットのマクロブロックの第1の予測を見つけ出し、(ii)2回目のBBMECアプリケーションを用いて、二番目に最近の参照フレームを探索することにより、前記第1の予測に対する第2の予測を見つけ出し、(iii)徐々に過去のフレームを溯ってBBMECアプリケーションを適用することにより、前記ターゲットのマクロブロックのトラックを生成し、
前記特徴階層は、マクロブロックのグリッドに関係なく特徴を検出及び追跡し、その特徴を当該特徴と重複するマクロブロックに関連付けて、特徴のトラックを用いて、復号化した参照フレームをナビゲートすることで前記重複するマクロブロックに対する良好なマッチを見つけ出し、さらに、複数の特徴が1つの対象のターゲットのマクロブロックと重複する場合には、重複の最も大きい特徴が当該ターゲットのマクロブロックをモデル化するのに選択され、
前記オブジェクト階層では、オブジェクトが複数のマクロブロックを包含するか又は複数のマクロブロックと重複する場合、そのオブジェクトに対応する全てのマクロブロックに関して単一の動きベクトルを算出可能であり、これにより演算量及び符号化サイズを節約する、
映像データの処理方法。
〔態様31〕
態様30に記載の映像データの処理方法において、前記複数の忠実度が、順次的に調べられる、映像データの処理方法。
〔態様32〕
態様30に記載の映像データの処理方法において、前記複数の忠実度が、競争モードで調べられる、映像データの処理方法。
〔態様33〕
プログラムコード手段を備えるコンピュータプログラムプロダクトであって、
前記プログラムコード手段は、コンピュータにロードされることにより、態様1に記載の処理方法を実行するように当該コンピュータを制御する、コンピュータプログラムプロダクト。
〔態様34〕
プログラムコード手段を備えるコンピュータプログラムプロダクトであって、
前記プログラムコード手段は、コンピュータにロードされることにより、態様7に記載の処理方法を実行するように当該コンピュータを制御する、コンピュータプログラムプロダクト。
〔態様35〕
プログラムコード手段を備えるコンピュータプログラムプロダクトであって、
前記プログラムコード手段は、コンピュータにロードされることにより、態様22に記載の処理方法を実行するように当該コンピュータを制御する、コンピュータプログラムプロダクト。
〔態様36〕
プログラムコード手段を備えるコンピュータプログラムプロダクトであって、
前記プログラムコード手段は、コンピュータにロードされることにより、態様23に記載の処理方法を実行するように当該コンピュータを制御する、コンピュータプログラムプロダクト。
〔態様37〕
プログラムコード手段を備えるコンピュータプログラムプロダクトであって、
前記プログラムコード手段は、コンピュータにロードされることにより、態様30に記載の処理方法を実行するように当該コンピュータを制御する、コンピュータプログラムプロダクト。
Claims (2)
- 請求項20に記載のコーデックにおいて、特定された特徴の圧縮効率を、第1の映像符号化プロセスを用いた場合の当該特徴のインスタンスの符号化と、データベースに記憶された圧縮効率の所定の数値との一方と比べることにより、当該特徴の特定されたインスタンスの圧縮効率の向上を判断する、コーデック。
- 映像データを処理する方法であって、
モデルベース圧縮のために、複数の忠実度でデータをモデル化する過程であって、当該複数の忠実度が、マクロブロック階層、特徴としてのマクロブロック階層、特徴階層、およびオブジェクト階層のうちの少なくとも1つを含む過程、
を備え、
前記マクロブロック階層は、ブロックベースの動き予測・補償(BBMEC)アプリケーションを用いて、復号化した参照フレーム内の限られた探索空間から各タイルに対する予測を見つけ出し、
前記特徴としてのマクロブロック階層は、(i)前記マクロブロック階層と同じ1回目のBBMECアプリケーションを用いて、一番最近の参照フレームからターゲットのマクロブロックの第1の予測を見つけ出し、(ii)2回目のBBMECアプリケーションを用いて、二番目に最近の参照フレームを探索することにより、前記第1の予測に対する第2の予測を見つけ出し、(iii)徐々に過去のフレームを溯ってBBMECアプリケーションを適用することにより、前記ターゲットのマクロブロックのトラックを生成し、
前記特徴階層は、マクロブロックのグリッドに関係なく特徴を検出及び追跡し、その特徴を当該特徴と重複するマクロブロックに関連付けて、特徴のトラックを用いて、復号化した参照フレームをナビゲートすることで前記重複するマクロブロックに対する良好なマッチを見つけ出し、さらに、複数の特徴が1つの対象のターゲットのマクロブロックと重複する場合には、重複の最も大きい特徴が当該ターゲットのマクロブロックをモデル化するのに選択され、
前記オブジェクト階層では、オブジェクトが複数のマクロブロックを包含するか又は複数のマクロブロックと重複する場合、そのオブジェクトに対応する全てのマクロブロックに関して単一の動きベクトルを算出可能であり、これにより演算量及び符号化サイズを節約する、
映像データの処理方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261615795P | 2012-03-26 | 2012-03-26 | |
US61/615,795 | 2012-03-26 | ||
US201261707650P | 2012-09-28 | 2012-09-28 | |
US61/707,650 | 2012-09-28 | ||
US13/725,940 | 2012-12-21 | ||
US13/725,940 US9578345B2 (en) | 2005-03-31 | 2012-12-21 | Model-based video encoding and decoding |
PCT/US2013/025123 WO2013148002A2 (en) | 2012-03-26 | 2013-02-07 | Context based video encoding and decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015515806A JP2015515806A (ja) | 2015-05-28 |
JP2015515806A5 true JP2015515806A5 (ja) | 2016-02-25 |
Family
ID=47901315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015503204A Pending JP2015515806A (ja) | 2012-03-26 | 2013-02-07 | コンテキストベースの映像符号化及び映像復号化 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP2815572A2 (ja) |
JP (1) | JP2015515806A (ja) |
CA (1) | CA2868448A1 (ja) |
TW (1) | TW201342926A (ja) |
WO (1) | WO2013148002A2 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9578345B2 (en) | 2005-03-31 | 2017-02-21 | Euclid Discoveries, Llc | Model-based video encoding and decoding |
US9532069B2 (en) | 2004-07-30 | 2016-12-27 | Euclid Discoveries, Llc | Video compression repository and model reuse |
US9743078B2 (en) | 2004-07-30 | 2017-08-22 | Euclid Discoveries, Llc | Standards-compliant model-based video encoding and decoding |
WO2015054811A1 (en) | 2013-10-14 | 2015-04-23 | Microsoft Corporation | Features of intra block copy prediction mode for video and image coding and decoding |
CN105659602B (zh) | 2013-10-14 | 2019-10-08 | 微软技术许可有限责任公司 | 用于视频和图像编码的帧内块复制预测模式的编码器侧选项 |
WO2015054812A1 (en) | 2013-10-14 | 2015-04-23 | Microsoft Technology Licensing, Llc | Features of base color index map mode for video and image coding and decoding |
MX360926B (es) | 2014-01-03 | 2018-11-22 | Microsoft Technology Licensing Llc | Prediccion de vector de bloque en codificacion/descodificacion de video e imagen. |
US10390034B2 (en) | 2014-01-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area |
US11284103B2 (en) | 2014-01-17 | 2022-03-22 | Microsoft Technology Licensing, Llc | Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning |
US10542274B2 (en) | 2014-02-21 | 2020-01-21 | Microsoft Technology Licensing, Llc | Dictionary encoding and decoding of screen content |
US9621917B2 (en) | 2014-03-10 | 2017-04-11 | Euclid Discoveries, Llc | Continuous block tracking for temporal prediction in video encoding |
US10091507B2 (en) | 2014-03-10 | 2018-10-02 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
US10097851B2 (en) | 2014-03-10 | 2018-10-09 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
TWI499985B (zh) * | 2014-04-30 | 2015-09-11 | Univ Nat Taiwan Science Tech | 影像特徵點自動點選方法和對應系統 |
EP3158734A4 (en) | 2014-06-19 | 2017-04-26 | Microsoft Technology Licensing, LLC | Unified intra block copy and inter prediction modes |
US9767853B2 (en) | 2014-07-21 | 2017-09-19 | International Business Machines Corporation | Touch screen video scrolling |
KR102330740B1 (ko) | 2014-09-30 | 2021-11-23 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙 |
US10659783B2 (en) | 2015-06-09 | 2020-05-19 | Microsoft Technology Licensing, Llc | Robust encoding/decoding of escape-coded pixels in palette mode |
US10986349B2 (en) | 2017-12-29 | 2021-04-20 | Microsoft Technology Licensing, Llc | Constraints on locations of reference blocks for intra block copy prediction |
US11830225B2 (en) | 2018-05-30 | 2023-11-28 | Ati Technologies Ulc | Graphics rendering with encoder feedback |
CN110503636B (zh) * | 2019-08-06 | 2024-01-26 | 腾讯医疗健康(深圳)有限公司 | 参数调整方法、病灶预测方法、参数调整装置及电子设备 |
CN111083497B (zh) * | 2019-12-31 | 2022-07-08 | 北京奇艺世纪科技有限公司 | 一种视频截图方法及装置 |
CN113938666B (zh) * | 2021-10-25 | 2023-07-25 | 珠海普罗米修斯视觉技术有限公司 | 基于关键帧的视频数据传输方法、装置及存储介质 |
US20240146963A1 (en) * | 2022-10-17 | 2024-05-02 | Alibaba Damo (Hangzhou) Technology Co., Ltd. | Method and apparatus for talking face video compression |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6738424B1 (en) * | 1999-12-27 | 2004-05-18 | Objectvideo, Inc. | Scene model generation from video for use in video processing |
US7436981B2 (en) | 2005-01-28 | 2008-10-14 | Euclid Discoveries, Llc | Apparatus and method for processing video data |
US7508990B2 (en) | 2004-07-30 | 2009-03-24 | Euclid Discoveries, Llc | Apparatus and method for processing video data |
JP4928451B2 (ja) | 2004-07-30 | 2012-05-09 | ユークリッド・ディスカバリーズ・エルエルシー | ビデオデータを処理する装置および方法 |
US7457435B2 (en) | 2004-11-17 | 2008-11-25 | Euclid Discoveries, Llc | Apparatus and method for processing video data |
US7457472B2 (en) | 2005-03-31 | 2008-11-25 | Euclid Discoveries, Llc | Apparatus and method for processing video data |
AU2005286786B2 (en) | 2004-09-21 | 2010-02-11 | Euclid Discoveries, Llc | Apparatus and method for processing video data |
AU2006230545B2 (en) * | 2005-03-31 | 2010-10-28 | Euclid Discoveries, Llc | Apparatus and method for processing video data |
US8908766B2 (en) * | 2005-03-31 | 2014-12-09 | Euclid Discoveries, Llc | Computer method and apparatus for processing image data |
JP5567021B2 (ja) * | 2008-10-07 | 2014-08-06 | ユークリッド・ディスカバリーズ・エルエルシー | 特徴を基礎とするビデオ圧縮 |
US8848802B2 (en) * | 2009-09-04 | 2014-09-30 | Stmicroelectronics International N.V. | System and method for object based parametric video coding |
-
2013
- 2013-02-07 WO PCT/US2013/025123 patent/WO2013148002A2/en active Application Filing
- 2013-02-07 EP EP13710636.5A patent/EP2815572A2/en not_active Withdrawn
- 2013-02-07 CA CA2868448A patent/CA2868448A1/en not_active Abandoned
- 2013-02-07 JP JP2015503204A patent/JP2015515806A/ja active Pending
- 2013-03-04 TW TW102107461A patent/TW201342926A/zh unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2015515806A5 (ja) | ||
JP2015536092A5 (ja) | ||
US11546627B2 (en) | Moving picture decoding method and moving picture encoding method | |
JP5555221B2 (ja) | 着目物の適応的な色モデル・パラメータ推定に係る方法および装置 | |
US8761254B2 (en) | Image prediction encoding device, image prediction decoding device, image prediction encoding method, image prediction decoding method, image prediction encoding program, and image prediction decoding program | |
KR102177900B1 (ko) | 비디오에 있어서의 키포인트 궤적을 처리하는 방법 | |
JP2012505600A5 (ja) | ||
JP2015536092A (ja) | 標準に準拠した、モデルベースの映像符号化及び映像復号化 | |
TW201342926A (zh) | 基於模型的視訊編碼和解碼 | |
CN104067619A (zh) | 视频解码器、视频编码器、视频解码方法以及视频编码方法 | |
TWI685250B (zh) | Hevc編碼最佳參考圖框的選擇方法、裝置及編碼器 | |
KR102261669B1 (ko) | 인공신경망 기반 객체영역 검출방법, 장치 및 이에 대한 컴퓨터 프로그램 | |
US20130155228A1 (en) | Moving object detection method and apparatus based on compressed domain | |
US9143790B2 (en) | Encoding and decoding a video image sequence by image areas | |
JP5566786B2 (ja) | 誤差絶対値和の推定システム及び推定方法 | |
US11164328B2 (en) | Object region detection method, object region detection apparatus, and non-transitory computer-readable medium thereof | |
JP6242055B2 (ja) | 画像符号化装置 | |
KR102345258B1 (ko) | 객체영역 검출방법, 장치 및 이에 대한 컴퓨터 프로그램 | |
US9497482B2 (en) | Methods for comparing a target block to a reference window for motion estimation during video encoding | |
KR101471599B1 (ko) | 문턱치값을 이용한 모션 벡터 예측 방법 | |
CN114422803B (zh) | 一种视频处理方法、装置及设备 | |
US9521417B2 (en) | Video encoding device using predicted motion vector for blocks of different size | |
Liang et al. | Learning to segment videos in HEVC compressed domain | |
US20200068214A1 (en) | Motion estimation using pixel activity metrics | |
CN103533375B (zh) | 视频压缩方法与视频压缩装置 |