JP2015133716A - 幾何学的動き分割の結果生じた重なり合った領域のスムージング - Google Patents

幾何学的動き分割の結果生じた重なり合った領域のスムージング Download PDF

Info

Publication number
JP2015133716A
JP2015133716A JP2015023467A JP2015023467A JP2015133716A JP 2015133716 A JP2015133716 A JP 2015133716A JP 2015023467 A JP2015023467 A JP 2015023467A JP 2015023467 A JP2015023467 A JP 2015023467A JP 2015133716 A JP2015133716 A JP 2015133716A
Authority
JP
Japan
Prior art keywords
value
block
partition
pixel
geometric motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015023467A
Other languages
English (en)
Inventor
ペイソン・チェン
Payson Chen
シャンリン・ワン
Xianglin Wang
マルタ・カークゼウィックズ
Karczewicz Marta
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2015133716A publication Critical patent/JP2015133716A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/543Motion estimation other than block-based using regions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/66Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving data partitioning, i.e. separation of data into packets or partitions according to importance

Abstract

【課題】映像ブロックの幾何学的動き分割において、区画境界における区画の重なり合う部分に関する動き補償を行うための技法を提供する。
【解決手段】装置は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算し、遷移領域内のピクセルの予測値に基づいてブロックの遷移領域内のピクセルの残差値を計算し、ピクセルの残差値を出力するように構成された映像符号化器20を含む。映像復号器は、符号化されたブロックに関する残差値を受信し、幾何学的動き分割線の定義を使用した後に符号化されたブロックを復号するために同様のフィルタを用いる。
【選択図】図2

Description

本出願は、米国仮特許出願第61/305,892号(出願日:2010年2月18日)、米国仮特許出願第61/323,233号(出願日:2010年4月12日)、及び米国仮特許出願第61/323,244号(出願日:2010年4月12日)の利益を主張するものであり、それらの各々の内容全体がここにおける引用によって明示で組み入れられている。
[関連出願の相互参照]
本特許出願は、下記の同時係属米国特許出願に関するものである。Chen et al.(チェン、等)により、Attorney Docket No.101050U2を有し、これと同時並行して出願され、これの譲受人に対して譲渡され、ここにおける引用によって明示で組み入れられている“ADAPTIVE TRANSFORM SIZE SELECTION FOR GEOMETRIC MOTION PARTITIONING”(幾何学的動き分割のための適応型変換サイズ選択)、Chen et al.(チェン、等)により、Attorney Docket No.101050U3を有し、これと同時並行して出願され、これの譲受人に対して譲渡され、ここにおける引用によって明示で組み入れられている“ENCODING MOTION VECTORS FOR GEOMETRIC MOTION PARTITIONING”(幾何学的動き分割に関する動きベクトルの符号化)、及び、Joshi et al.(ジョシ、等)により、Attorney Docket No.101637を有し、これと同時並行して出願され、これの譲受人に対して譲渡され、ここにおける引用によって明示で組み入れられている“FIXED POINT IMPLEMENTATION FOR GEOMETRIC MOTION PARTITIONING”(幾何学的動き分割のための固定小数点実装)。
[技術分野]
本開示は、映像コーディングに関するものである。
[背景]
デジタル映像能力は、デジタルテレビ、デジタル直接放送システム、無線放送システム、パーソナルデジタルアシスタント(PDA)、ラップトップコンピュータ、デスクトップコンピュータ、デジタルカメラ、デジタル記録装置、デジタルメディアプレーヤ、ビデオゲームプレイ装置、ビデオゲーム卓、携帯電話、衛星無線電話、映像テレビ電話会議装置、等を含む広範なデバイスに組み入れることができる。デジタル映像装置は、デジタル映像情報をより効率的に送信及び受信するための映像圧縮技法、例えば、MPEG−2、MPEG−4、ITU−T H.263又はITU−T H.264/MPEG−4、Part10、アドバンストビデオコーディング(Advanced Video Coding)(AVC)によって定義された規格、及び該規格の拡大版において説明されるそれら、を実装する。
映像圧縮技法は、映像シーケンスに内在する冗長性を低減又は除去するために空間予測及び/又は時間予測を行う。ブロックに基づく映像コーディングのために、映像フレーム又はスライスをマクロブロックに分割することができる。各マクロブロックは、さらに分割することができる。イントラコーディング(intra−coding)された(I)フレーム又はスライス内のマクロブロックは、隣接するマクロブロックに関する空間予測を用いて符号化される。インターコーディング(inter−coding)された(P又はB)フレーム又はスライス内のマクロブロックは、同じフレーム又はスライス内の隣接するマクロブロックに関する空間予測又はその他の基準フレームに関する時間予測を用いることができる。
概して、本開示は、映像ブロックの幾何学的動き分割(geometric motion partitioning)をサポートするための技法を説明する。すなわち、本開示の技法は、長方形のブロックを2つ以上の厳密に長方形の区画(partition)に分割するのではなく、任意の区画境界を用いてブロックを分割することを提供し、幾何学的動き分割と呼ばれる。幾何学的動き分割をサポートするために、本開示は、区画境界における区画の重なり合う部分に関する動き補償を行うための技法を提供する。本開示は、分割されたブロックのサブブロックのための変換サイズを好適に選択するための技法も提供する。さらに、本開示は、区画の動きベクトルを個々に符号化するための技法を提供する。さらに、本開示の技法は、固定小数点実装又は浮動小数点実装のいずれかを用いて実行することができる。
一例では、方法は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割することと、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算することと、ブロックの遷移領域内のピクセルの予測値に基づいて遷移領域内のピクセルの残差値(residual value)を計算することと、ピクセルの残差値を出力することと、を含む。
他の例では、装置は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値計算し、ブロックの遷移領域内のピクセルの予測値に基づいて遷移領域内のピクセルの残差値を計算し、及びピクセルの残差値を出力するように構成された映像符号化器を含む。
他の例では、装置は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割するための手段と、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算するための手段と、ブロックの遷移領域内のピクセルの予測値に基づいて遷移領域内のピクセルの残差値を計算するための手段と、ピクセルの残差値を出力するための手段と、を含む。
他の例では、コンピュータプログラム製品は、実行されたときに、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算し、ブロックの遷移領域内のピクセルの予測値に基づいて遷移領域内のピクセルの残差値を計算し、及びピクセルの残差値を出力することをプロセッサに行わせる命令を格納しているコンピュータによって読み取り可能な媒体、を備える。
他の例では、方法は、符号化された映像データのブロック、符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及びブロックの遷移領域内のピクセルに関する残差値を受信することと、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算することと、予測値及び残差値に基づいてブロックの遷移領域内のピクセルに関する再構築された値を計算することと、ピクセルの再構築された値を出力することと、を含む。
他の例では、装置は、符号化された映像データのブロック、符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及びブロックの遷移領域内のピクセルに関する残差値を受信し、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算し、予測値及び残差値に基づいてブロックの遷移領域内のピクセルに関する再構築された値を計算し、及びピクセルの再構築された値を出力するように構成された映像復号器を含む。
他の例では、装置は、符号化された映像データのブロック、符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及びブロックの遷移領域内のピクセルに関する残差値を受信するための手段と、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算するための手段と、予測値及び残差値に基づいてブロックの遷移領域内のピクセルに関する再構築された値を計算するための手段と、ピクセルの再構築された値を出力するための手段と、を含む。
他の例では、コンピュータプログラム製品は、実行されたときに、符号化された映像データのブロック、符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及びブロックの遷移領域内のピクセルに関する残差値を受信し、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算し、予測値及び残差値に基づいてブロックの遷移領域内のピクセルに関する再構築された値を計算し、及びピクセルの再構築された値を出力することをプロセッサに行わせる命令を格納しているコンピュータによって読み取り可能な媒体を備える。
他の例では、方法は、幾何学的動き分割線を用いて映像データのブロックを第1の幾何学的区画及び第2の幾何学的区画に分割することであって、ブロックは、N×Nピクセルを備えることと、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割することと、(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを符号化することと、を含む。
他の例では、装置は、幾何学的動き分割線を用いて映像データのブロックを第1の幾何学的区画及び第2の幾何学的区画に分割し、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割し、及び(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを符号化するように構成され、ブロックは、N×Nピクセルを備える、映像符号化器、を含む。
他の例では、装置は、幾何学的動き分割線を用いて映像データのブロックを第1の幾何学的区画及び第2の幾何学的区画に分割するための手段であって、ブロックは、N×Nピクセルを備える手段と、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割するための手段と、(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを符号化するための手段と、を含む。
他の例では、コンピュータプログラム製品は、実行されたときに、幾何学的動き分割線を用いて映像データのブロックを第1の幾何学的区画及び第2の幾何学的区画に分割し、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割し、及び(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを符号化することをプロセッサに行わせる命令を格納しており、ブロックは、N×Nピクセルを備える、コンピュータによって読み取り可能な媒体、を備える。
他の例では、方法は、幾何学的動き分割線によって第1の幾何学的区画及び第2の幾何学的区画に分割された符号化された映像データのブロックを受信することであって、ブロックは、N×Nピクセルを備えることと、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割することと、(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを逆変換することと、を含む。
他の例では、装置は、幾何学的動き分割線によって第1の幾何学的区画及び第2の幾何学的区画に分割された符号化された映像データのブロックを受信し、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割し、(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを逆変換するように構成され、ブロックは、N×Nピクセルを備える、映像復号器、を含む。
他の例では、装置は、幾何学的動き分割線によって第1の幾何学的区画及び第2の幾何学的区画に分割された符号化された映像データのブロックを受信するための手段であって、ブロックは、N×Nピクセルを備える手段と、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割するための手段と、(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを逆変換するための手段と、を含む。
他の例では、コンピュータプログラム製品は、実行されたときに、幾何学的動き分割線によって第1の幾何学的区画及び第2の幾何学的区画に分割された符号化された映像データのブロックを受信し、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割し、及び(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを逆変換することをプロセッサに行わせる命令を格納しており、ブロックは、N×Nのピクセルを備える、コンピュータによって読み取り可能な媒体、を備える。
他の例では、方法は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割することと、第1の区画に関する第1の動きベクトル及び第2の区画に関する第2の動きベクトルを決定することと、第1の区画に隣接するブロックに関する動きベクトルから選択された第1の動き予測子(predictor)に基づいて第1の動きベクトルを符号化することと、第2の区画に隣接するブロックに関する動きベクトルから選択された第2の動き予測子に基づいて第2の動きベクトルを符号化することであって、第2の区画に隣接するブロックは、第1の区画に隣接するブロックから独立して決定されることと、符号化された第1及び第2の動きベクトルを出力することと、を含む。
他の例では、装置は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、第1の区画に関する第1の動きベクトル及び第2の区画に関する第2の動きベクトルを決定し、第1の区画に隣接するブロックに関する動きベクトルから選択された第1の動き予測子に基づいて第1の動きベクトルを符号化し、第2の区画に隣接するブロックに関する動きベクトルから選択された第2の動き予測子に基づいて第2の動きベクトルを符号化し、及び、符号化された第1及び第2の動きベクトルを出力するように構成され、第2の区画に隣接するブロックは、第1の区画に隣接するブロックから独立して決定される、映像符号化器、を含む。
他の例では、装置は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割するための手段と、第1の区画に関する第1の動きベクトル及び第2の区画に関する第2の動きベクトルを決定するための手段と、第1の区画に隣接するブロックに関する動きベクトルから選択された第1の動き予測子に基づいて第1の動きベクトルを符号化するための手段と、第2の区画に隣接するブロックに関する動きベクトルから選択された第2の動き予測子に基づいて第2の動きベクトルを符号化するための手段であって、第2の区画に隣接するブロックは、第1の区画に隣接するブロックから独立して決定される手段と、符号化された第1及び第2の動きベクトルを出力するための手段と、を含む。
他の例では、コンピュータプログラム製品は、実行されたときに、分割されたブロックに隣接するブロックの組を決定し、第1の区画に隣接するブロックを備えるブロック組の第1の部分組を決定し、及び第1の部分組を決定することから独立して、第2の区画に隣接するブロックを備えるブロックの組の第2の部分組を決定することをプロセッサに行わせる命令を格納しているコンピュータによって読み取り可能な媒体、を備える。
他の例では、方法は、幾何学的動き分割線によって第1の区画及び第2の区画に分割された映像データのブロック、第1の区画に関する第1の符号化動きベクトル、及び第2の区画に関する第2の符号化動きベクトルを受信することと、第1の区画に隣接するブロックに関する動きベクトルから選択された第1の動き予測子に基づいて第1の符号化された動きベクトルを復号することと、第2の区画に隣接するブロックに関する動きベクトルから選択された第2の動き予測子に基づいて第2の符号化された動きベクトルを復号することであって、第2の区画に隣接するブロックは、第1の区画に隣接するブロックから独立して決定されることと、復号された第1及び第2の動きベクトルを用いてブロックを復号することと、を含む。
他の例では、装置は、幾何学的動き分割線によって第1の区画及び第2の区画に分割された映像データのブロック、第1の区画に関する第1の符号化された動きベクトル、及び第2の区画に関する第2の符号化された動きベクトルを受信し、第1の区画に隣接するブロックに関する動きベクトルから選択された第1の動き予測子に基づいて第1の符号化された動きベクトルを復号し、第2の区画に隣接するブロックに関する動きベクトルから選択された第2の動き予測子に基づいて第2の符号化された動きベクトルを復号し、及び復号された第1及び第2の動きベクトル用いてブロックを復号するように構成され、第2の区画に隣接するブロックは、第1の区画に隣接するブロックから独立して決定される、映像復号器、を含む。
他の例では、装置は、幾何学的動き分割線によって第1の区画及び第2の区画に分割された映像データのブロック、第1の区画に関する第1の符号化された動きベクトル、及び第2の区画に関する第2の符号化された動きベクトルを受信するための手段と、第1の区画に隣接するブロックに関する動きベクトルから選択された第1の動き予測子に基づいて第1の符号化された動きベクトルを復号するための手段と、第2の区画に隣接するブロックに関する動きベクトルから選択された第2の動き予測子に基づいて第2の符号化された動きベクトルを復号するための手段であって、第2の区画に隣接するブロックは、第1の区画に隣接するブロックから独立して決定される手段と、復号された第1及び第2の動きベクトルを用いてブロックを復号するための手段と、を含む。
他の例では、コンピュータプログラム製品は、実行されたときに、幾何学的動き分割線によって第1の区画及び第2の区画に分割された映像データのブロック、第1の区画に関する第1の符号化された動きベクトル、及び第2の区画に関する第2の符号化された動きベクトルを受信し、第1の区画に隣接するブロックに関する動きベクトルから選択された第1の動き予測子に基づいて第1の符号化された動きベクトルを復号し、第2の区画に隣接するブロックに関する動きベクトルから選択された第2の動き予測子に基づいて第2の符号化された動きベクトルを復号し、及び復号された第1及び第2の動きベクトルを用いてブロックを復号することをプロセッサに行わせる命令を格納しており、第2の区画に隣接するブロックは、第1の区画に隣接するブロックから独立して決定される、コンピュータによって読み取り可能な媒体、を備える。
他の例では、方法は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割することと、幾何学的動き分割線の傾き値及びy切片値を計算することであって、傾き値及びy切片値は、整数値を備えることと、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算することと、マスクに基づいて第1の区画及び第2の区画を符号化することと、符号化された第1の区画、符号化された第2の区画、傾き値、及びy切片値を出力することと、を含む。
他の例では、装置は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、幾何学的動き分割線の傾き値及びy切片値を計算し、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算し、マスクに基づいて第1の区画及び第2の区画を符号化し、及び符号化された第1の区画、符号化された第2の区画、傾き値、及びy切片値を出力するように構成され、傾き値及びy切片値は、整数値を備える、映像符号化器、を含む。
他の例では、装置は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割するための手段と、幾何学的動き分割線の傾き値及びy切片値を計算するための手段であって、傾き値及びy切片値は、整数値を備える手段と、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算するための手段と、マスクに基づいて第1の区画及び第2の区画を符号化するための手段と、符号化された第1の区画、符号化された第2の区画、傾き値、及びy切片値を出力するための手段と、を含む。
他の例では、コンピュータプログラム製品は、実行されたときに、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、幾何学的動き分割線の傾き値及びy切片値を計算し、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算し、マスクに基づいて第1の区画及び第2の区画を符号化し、及び符号化された第1の区画、符号化された第2の区画、傾き値、及びy切片値を出力することをプロセッサに行わせる命令を格納しており、傾き値及びy切片値は、整数値を備える、コンピュータによって読み取り可能な媒体、を備える。
他の例では、方法は、幾何学的動き分割線によって第1の区画及び第2の区画に分割されている符号化された映像データのブロックを受信し、幾何学的動き分割線を定義する傾き値及びy切片値を受信することであって、傾き値及びy切片値は、整数値を備えることと、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算することと、マスクに基づいてブロックの第1の区画及び第2の区画を復号することと、復号されたブロックを出力することと、を含む。
他の例では、装置は、幾何学的動き分割線によって第1の区画及び第2の区画に分割されている符号化された映像データのブロックを受信し、幾何学的動き分割線を定義する傾き値及びy切片値を受信し、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算し、マスクに基づいてブロックの第1の区画及び第2の区画を復号し、及び復号されたブロックを出力するように構成され、傾き値及びy切片値は、整数値を備える、映像復号器、を含む。
他の例では、装置は、幾何学的動き分割線によって第1の区画及び第2の区画に分割されている符号化された映像データのブロックを受信するための手段と、幾何学的動き分割線を定義する傾き値及びy切片値を受信するための手段であって、傾き値及びy切片値は、整数値を備える手段と、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算するための手段と、マスクに基づいてブロックの第1の区画及び第2の区画を復号するための手段と、復号されたブロックを出力するための手段と、を含む。
他の例では、コンピュータプログラム製品は、実行されたときに、幾何学的動き分割線によって第1の区画及び第2の区画に分割されている符号化された映像データのブロックを受信し、幾何学的動き分割線を定義する傾き値及びy切片値を受信し、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算し、マスクに基づいてブロックの第1の区画及び第2の区画を復号し、及び復号されたブロックを出力することをプロセッサに行わせる命令を格納しており、傾き値及びy切片値は、整数値を備える、コンピュータによって読み取り可能な媒体、を備える。
1つ以上の例の詳細が添付図及び以下の説明において詳述される。それらの説明及び図面から、及び請求項からその他の特徴、目的、及び利点が明確であろう。
幾何学的動き分割のための技法を利用することができる映像符号化及び復号システム例を示したブロック図である。 幾何学的動き分割のための技法を実装することができる映像符号化器の例を示したブロック図である。 幾何学的動き分割されたブロックを含む符号化された映像シーケンスを復号することができる映像復号器の例を示したブロック図である。 幾何学的動き分割線を用いて分割されているブロック及び幾何学的動き分割線を定義するために用いられるパラメータを例示した概念図である。 幾何学的動き分割線を用いて分割されているブロック及び幾何学的動き分割線の近傍の遷移領域内のピクセルを例示した概念図である。 3×3ピクセル配列を例示した概念図である。 幾何学的動き分割線を用いて分割されたブロックに関する残差値を計算するときにスムージングを行うための方法例を示したフローチャートである。 適応型変換サイズ選択を用いて変換されるブロック例を示した概念図である。 適応型変換サイズ選択を用いて変換される他のブロック例の概念図である。 N×Nブロックのサブブロックのための変換サイズを決定するための方法例を示したフローチャートである。 幾何学的分割されたブロック及び隣接するサブブロックを例示したブロック図である。 映像データのブロックの幾何学的動き区画の動きベクトルを符号化するための方法例を示したフローチャートである。 固定小数点実装を用いて映像データのブロックを符号化するための方法例を示したフローチャートである。
[詳細な説明]
概して、本開示は、映像ブロックの幾何学的動き分割をサポートするための技法について説明する。すなわち、この開示の技法は、長方形のブロックを2つ以上の厳密に長方形の区画に分割するのではなく、任意の区画境界を用いてブロックを分割することを提供し、幾何学的動き分割と呼ばれる。分割線は、2つのパラメータ、すなわち、分割線に垂直で及び分割されたブロックの中心点を起点とする線分の長さρ(ロー)、及び、分割されたブロックの中心点を通る水平線に対する垂直線の角度θ(シータ)を用いて定義することができる。幾つかの例では、分割線は、各区画のピクセルを画定するステップ付き線(stepped line)によって実現することができ、従って、分割線は、ブロックのいずれのピクセル内も通らない。
例及び説明の目的上、本開示は、マクロブロックの幾何学的動き分割のための技法を説明する。しかしながら、これらの技法は、あらゆる映像データのブロックを分割するために概して適用できることが理解されるべきである。用語マクロブロックは、典型的には16×16ピクセルのサイズを有する二次元ピクセル配列を用いてデジタルピクチャ及び映像データをコーディングするためのデータ構造を意味する。マクロブロックは、色度データと輝度データとを含むことができる。典型的には、色度データは、水平的に又は垂直的に2倍分だけ輝度データと比較してダウンサンプリングされる。従って、マクロブロックは、4つの輝度ブロックと2つの色度ブロックとを含むことができる。4つの輝度ブロックの各々は、8×8ピクセルを備えることができ、及び、マクロブロックの各角は、輝度ブロックのうちの正確に1つの角が接することができる。2つの色度ブロックは、8×8ピクセルブロックであることができ、従って、色度ブロックの各々の角は、マクロブロックの各角に接する。従って、色度ブロックは、互いに及び輝度ブロックと重なり合うことができる。
映像コーディング規格は、典型的には、映像データのブロックを符号化するための様々な予測モードを提供する。イントラ予測(intra−prediction)は、スライス又はフレームのブロックをその同じスライス又はフレームのその他のブロックと比較して符号化することを含む。インター予測(inter−prediction)は、動き推定及び動き補償技法を用いて、スライス又はフレームのブロックを1つ以上のその他のスライス又はフレームと比較して符号化することを可能にする。
本開示の技法は、幾何学的動き分割が概して対象であり、任意の区画サイズ及び形状を許容することができる。すなわち、上述されるロー値及びシータ値を用いて定義された分割線は、マクロブロックを符号化するために長方形でない区画を用いるのを可能にすることができる。特に、本開示の技法は、幾何学的動き区画に関する動きベクトルを生成するための技法、及び幾何学的動き区画に基づいて動き補償を行うための技法を説明する。幾何学的動き分割線は、ブロックを長方形の区画に分割することに制限されない。幾つかの例では、幾何学的動き分割線は、N×NブロックをN×Mブロックに分割することができる一方で、幾何学的動き分割は、ブロックを長方形でない区画、例えば、三角形の区画、に分割する能力も提供する。この方法で、幾何学的動き分割線は、ブロックの1つの水平境界及びそのブロックの1つの垂直境界と交差することができる。
幾つかの例では、幾何学的動き分割をサポートすることは、変更された動き補償技法の使用を含む。特に、変更された動き補償技法は、幾何学的動き分割線の近傍における遷移領域内のピクセルのためのスムージングフィルタを提供することができる。本開示の動き補償技法は、該重なり合うピクセルに関する残差値を決定することを含むことができる。一例では、本開示の技法は、この境界領域内で動き補償を行うための低域通過フィルタ(例えば、スムージングフィルタ)を定義する。すなわち、幾何学的分割線における区画間での遷移をスムージングする様々なフィルタを定義することができる。ピクセルが遷移領域内に存在する場合は、そのピクセルのための動き補償は、これらのフィルタのうちの1つを適用してそのピクセルに関する予測値を決定し、次に、予測値と符号化されるべきピクセルの値との間の差分を決定することによって行うことができ、フィルタは、区画に関する動きベクトルによって特定された予測ブロックからの値を適用する。この差分は、ピクセルに関する残差値を表すことができる。
他の例では、幾何学的に分割されたブロックの境界領域において動き補償を行うために、加重平均を用いることができる。すなわち、ピクセルに関する動き補償された値を決定するために、2つの区画からのピクセルに関する値の加重平均を計算することができる。ピクセルが相対的により近い方の区画のための値は、他方の区画のための値よりも大きく加重することができる。ピクセルに関する予測された値は、この方法で計算し、残差値を計算するために、又は受信された残差値を予測された値に適用することによって符号化されたブロックを再構築するために用いることができる。
本開示は、幾何学的動き区画を用いて分割されたブロックの残差を符号化するための技法も含む。幾何学的区画を用いてブロックの残差を符号化するために、分割線の位置に基づいて適応型変換サイズを用いることができる。概して、N×Nピクセルの各サブブロックブロックに関して、サブブロックに関する残差は、区画がブロック内を横切らない場合にN×Nの変換サイズを用いて符号化することができ、そうでない場合は、N×NサブブロックをN/2×N/2サブブロックに細分することができ、それらの各々は、分割線がサブブロック内を横切るかどうかに関して再解析することができる。
例えば、ブロックサイズが16×16であると仮定する。内部の各々の8×8サブブロックに関して、8×8ブロック内部の全ピクセルが同じ区画に属する場合は8×8変換を用いることができ、そうでない場合は、4つの4×4変換を用いることができる。他の例として、ブロックサイズが32×32又は64×64であるときには、各々の32×32又は16×16の内部サブブロックに関して、16×16ブロック内部の全ピクセルが同じ区画に属する場合に16×16変換を用いることができ、そうでない場合は、各々の16×16サブブロックに関して論理を繰り返すことができる。
本開示は、幾何学的動き分割線を用いて分割されたブロックの区画に関する動きベクトルを符号化するための技法をさらに提供する。これらの技法は、動きベクトルのための動き予測子を選択することを含むことができ、動き予測子のための候補は、同じブロックの2つの区画の動きベクトルの場合と異なることができる。動き予測子のための候補は、従来の符号化規格に関する動き予測子よりも大きい潜在力を有するそれらを含むこともできる。
本開示の技法は、固定小数点実装において適用することもできる。特に、幾何学的動き分割線は、その線の傾き(m)及びy切片(c)を表す固定小数点(例えば、整数)値を用いて定義することができる。符号化器及び復号器は、幾何学的動き区画を評価するために固定小数点算術を用いるように構成することができ、従って、符号化器及び復号器は、固定小数点値から同一のマスクを生成する。符号化器及び復号器は、次のようにマスクを計算するように構成することができ、すなわち、マスクの各点(x,y)に関して、マスク内の(x,y)における点の値は、y−mx<cの場合は1であり、マスク内の(x,y)における点の値は、y−mx≧cの場合は0である。この方法で、符号化器及び復号器は、(各々のx値及びy値によって定義された点の組を備える)マスクを計算するように構成することができ、従って、マスク内の各点に関して、マスク内のその点の値は、その点のy値と線の傾き値及びその点のx値の積との間の差分が線のy切片値よりも大きいかどうかを示す値に設定される。マスク内の各点の値は、1ビット値を備えることができる。
0の値を有するマスク内の点は、領域ゼロに対応し、1の値を有するマスク内の点は、領域1に対応する。幾何学的動き区画によって定義されるように、領域ゼロは、1つの区画であることができ、領域1は、他の区画であることができる。従って、符号化器及び復号器は、浮動小数点算術を用いて幾何学的動き区画の角度θ(シータ)及び中心点までの距離ρ(ロー)からマスクを計算するのではなく、角度値及び中心点値に基づいて傾きm及びy切片cのための固定小数点、整数値を用いてマスクを計算するように構成することができる。本開示の技法は、幾何学的動き分割を特定のブロック又はブロックの組のために用いられるかどうか、そしてそうである場合は、固定小数点又は浮動小数点演算のいずれがブロック又はブロックの組のために用いられるかをシグナリングすることを含むこともできる。
図1は、幾何学的動き分割のための技法を利用することができる映像符号化及び復号システム例10を示したブロック図である。図1に示されるように、システム10は、通信チャネル16を介して行先デバイス14に符号化された映像を送信するソースデバイス12を含む。ソースデバイス12及び行先デバイス14は、広範なデバイスのうちのいずれも備えることができる。幾つの場合には、ソースデバイス12及び行先デバイス14は、無線通信デバイス、例えば、無線ハンドセット、いわゆる携帯又は衛星無線電話、又は通信チャネル16を通じて映像情報を通信することができるあらゆる無線デバイス、を備えることができ、その場合は、通信チャネル16は無線である。しかしながら、幾何学的動き分割に関する本開示の技法は、無線用途又は設定に必ずしも限定されない。例えば、これらの技法は、オーバーザエアテレビ放送、ケーブルテレビ送信、衛星テレビ送信、インターネット映像送信、記憶媒体において符号化される符号化されたデジタル映像、又はその他のシナリオに適用することができる。従って、通信チャネル16は、符号化された映像データの送信に適する無線又は有線媒体のあらゆる組み合わせを備えることができる。
図1の例では、ソースデバイス12は、映像ソース18と、映像符号化器20と、変調器/復調器(モデム)22と、送信機24と、を含む。行先デバイス14は、受信機26と、モデム28と、映像復号器30と、表示装置32と、を含む。本開示により、ソースデバイス12の映像符号化器20は、幾何学的動き分割のための技法を適用するように構成することができる。その他の例では、ソースデバイス及び行先デバイスは、その他のコンポーネント又は配置を含むことができる。例えば、ソースデバイス12は、外部映像ソース18、例えば外部カメラ、から映像データを受信することができる。同様に、行先デバイス14は、一体化された表示装置を含むのではなく、外部の表示装置とインタフェースすることができる。
図1の例示されたシステム10は、単なる一例であるにすぎない。幾何学的動き分割のための技法は、あらゆるデジタル映像符号化及び/又は復号デバイスによって実行することができる。概して本開示の技法は映像符号化デバイスによって実行されるが、それらの技法は、典型的には“CODEC”と呼ばれる映像符号化器/復号器によって実行することもできる。さらに、本開示の技法の幾つかの態様は、映像前置プロセッサによって実行することもできる。ソースデバイス12及び行先デバイス14は、単に該コーディングデバイスの例であり、ソースデバイス12は、行先デバイス14への送信のためにコーディングされた映像データを生成する。幾つかの例では、デバイス12、14は、実質的に対称的に動作することができ、従って、デバイス12、14の各々は、映像符号化及び復号コンポーネントを含む。従って、システム10は、例えば、映像ストリーミング、映像再生、映像放送、又は映像テレフォニーのための映像デバイス12、14間での1方向又は2方向送信をサポートすることができる。
ソースデバイス12の映像ソース18は、映像キャプチャデバイス、例えば、ビデオカメラ、以前にキャプチャされた映像を含む映像アーカイブ、及び/又は映像コンテンツプロバイダからの映像フィード、を含むことができる。さらなる代替として、映像ソース18は、コンピュータグラフィックスに基づくデータをソース映像、又は、ライブ映像、アーカイブに保存された映像、及びコンピュータによって生成された映像の組み合わせ、として生成することができる。幾つかの場合は、映像ソース18がビデオカメラである場合は、ソースデバイス12及び行先デバイス14は、いわゆるカメラフォン又はビデオフォンを形成することができる。しかしながら、上述されるように、本開示において説明される技法は、映像コーディング全般に対して適用可能であり、無線及び/又は有線用途に適用することができる。各々の場合において、キャプチャされた、予めキャプチャされた、又はコンピュータによって生成された映像を映像符号化器20によって符号化することができる。符号化された映像情報は、通信規格によりモデム22によって変調し、送信機24を介して行先デバイス14に送信することができる。モデム22は、信号変調用に設計された様々なミキサ、フィルタ、増幅器又はその他のコンポーネントを含むことができる。送信機24は、データを送信するために設計された回路を含むことができ、増幅器と、フィルタと、1つ以上のアンテナとを含む。
行先デバイス14の受信機26は、チャネル16を通じて情報を受信し、モデム28は、その情報を復調する。繰り返すと、映像符号化プロセスは、幾何学的動き分割に従ってここにおいて説明される技法のうちの1つ以上を実装することができる。チャネル16を通じて通信された情報は、マクロブロック及びその他のコーディングされたユニット、例えば、ピクチャグループ(GOP)、の特性及び/又は処理を記述する構文要素を含む、映像復号器30によっても用いられる、映像符号化器20によって定義された構文情報を含むことができる。表示装置32は、復号された映像データをユーザに表示し、様々な表示装置、例えば、陰極線管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、又はその他のタイプの表示装置のうちのいずれも備えることができる。
図1の例において、通信チャネル16は、あらゆる無線又は有線通信媒体、例えば、無線周波数(RF)スペクトル又は1本以上の物理的送信線、又は無線及び有線媒体のあらゆる組み合わせ、を備えることができる。通信チャネル16は、パケットに基づくネットワーク、例えば、ローカルエリアネットワーク、ワイドエリアネットワーク、又はグローバルネットワーク、例えば、インターネット、の一部を形成することができる。通信チャネル16は、ソースデバイス12から行先デバイス14に映像データを送信するための適切な通信媒体、又は異なる通信媒体の集合、を概して代表し、有線又は無線媒体のあらゆる適切な組み合わせを含む。通信チャネル16は、ソースデバイス12から行先デバイス14への通信を容易にするために役立つことができるルータ、スイッチ、基地局、又はその他の装置、を含むことができる。
映像符号化器20及び映像復号器30は、映像圧縮規格、例えばMPEG−4、Part 10、Advanced Video Coding(AVC)(アドバンスト映像コーディング)と代替で呼ばれるITU−T H.264規格、により動作することができる。しかしながら、本開示の技法は、いずれの特定のコーディング規格にも限定されない。その他の例は、MPEG−2と、ITU−T H.263と、を含む。図1には示されないが、幾つかの態様においては、映像符号化器20及び映像復号器30は、音声符号化器及び復号器と各々一体化することができ、及び、共通のデータストリーム又は別個のデータストリームにおける音声と映像の両方の符号化を処理するために該当するMUX−DEMUXユニット、又はその他のハードウェアとソフトウェアとを含むことができる。該当する場合は、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、又はその他のプロトコル、例えばユーザデータグラムプロトコル(UDP)、に準拠することができる。
ITU−T H.264/MPEG−4(AVC)規格は、ジョイントビデオチーム(JVT)と呼ばれる共同パートナー関係の産物としてITU−T Video Coding Experts Group(VCEG)とISO/IEC Moving Picture Experts Group(MPEG)の共同で作成されたものである。幾つの態様では、本開示において説明される技法は、H.264規格に概して準拠するデバイスに適用することができる。H.264規格は、ITU−T Study Groupによる、2005年3月付のITU−T勧告H.264、Advanced Video Coding for generic audiovisual services(一般的音声映像サービスのための高度映像コーディング)において説明され、ここでは、H.264規格又はH.264仕様、又はH.264/AVC規格又は仕様と呼ばれることがある。ジョイントビデオチーム(JVT)は、H.264/MPEG−4AVCの拡大版に関する作業を継続中である。
映像符号化器20及び映像復号器30は、各々、様々な適切な符号化器回路、例えば、1つ以上のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリートロジック、ソフトウェア、ハードウェア、ファームウェア又はそれらのあらゆる組み合わせのうちのいずれかとして実装することができる。映像符号化器20及び映像復号器30の各々は、1つ以上の符号化器又は復号器に含めることができ、それらのいずれも、各々のカメラ、コンピュータ、モバイルデバイス、加入者デバイス、ブロードキャストデバイス、セットトップボックス、サーバ、等において結合された符号化器/復号器(CODEC)の一部として一体化することができる。
映像シーケンスは、典型的には、映像ピクチャとも呼ばれる一続きの映像フレームを含む。ピクチャグループ(GOP)は、概して、一続きの1つ以上の映像フレームを備える。GOPは、GOPに含まれる幾つかのフレームを記述する構文データをGOPのヘッダ、GOPの1つ以上のフレームのヘッダ、又はその他の場所に含めることができる。各フレームは、各々のフレームのための符号化モードを記述するフレーム構文データを含むことができる。映像符号化器20は、典型的には、映像データを符号化するために個々の映像フレーム内の映像ブロックに対して動作する。映像ブロックは、マクロブロック、マクロブロックの一区画、又はマクロブロックよりも大きいブロックに対応することができる。映像ブロックは、固定された又は可変のサイズを有することができ、及び、指定されたコーディング規格によりサイズが異なることができる。各映像フレームは、1つ以上のスライスを含むことができる。各スライスは、複数のマクロブロックを含むことができ、それらは、サブブロックとも呼ばれる区画内に配置することができる。
一例として、ITU−T H.264規格は、様々なブロックサイズ、例えば、輝度(luma)成分に関しては16 by 16、8 by 8、又は4 by 4、及び色度(chroma)成分に関しては8×8、でのイントラ予測、及び、様々なブロックサイズ、例えば、輝度成分に関しては16×16、16×8、8×16、8×8、8×4、4×8及び4×4、及び色度成分に関しては対応するスケーリングされたサイズ、でのインター予測、をサポートする。本開示では、“N×N”及び“N by N”は、縦寸法又は横寸法の点でのブロックのピクセル寸法を互換的に指し示すために用いることができ、例えば、16×16ピクセル又は16 by 16ピクセルである。概して、16×16のブロックは、縦方向に16のピクセル(y=16)及び横方向に16のピクセル(x=16)を有することになる。同様に、N×Nブロックは、概して、縦方向にNのピクセル及び横方向にNのピクセルを有し、ここで、Nは負でない整数値を表す。ブロック内のピクセルは、行及び列で配置することができる。さらに、ブロックは、横方向のピクセル数が縦方向と必ずしも同じである必要がない。例えば、ブロックは、N×Mのピクセルを備えることができ、ここで、Mは、必ずしもNと等しくない。
16 by 16よりも小さいブロックサイズは、16 by 16のマクロブロックの区画と呼ぶことができる。映像ブロックは、例えば、離散コサイン変換(DCT)、整数変換、ウェーブレット変換、又は概念的に類似する変換をコーディングされた映像ブロックと予測映像ブロックとの間のピクセル差分を表す残差映像ブロックデータに適用後における、ピクセル領域におけるピクセルデータのブロック、又は変換領域における変換係数のブロックを備えることができる。幾つかの場合は、映像ブロックは、変換領域における量子化された変換係数のブロックを備えることができる。
より小さい映像ブロックは、より良い解像度を提供することができ、及び、高レベルの詳細度を含む映像フレームの位置のために用いることができる。概して、マクロブロック、及びサブブロックと時々呼ばれる様々な区画は、映像ブロックとみなすことができる。さらに、スライスは、複数の映像ブロック、例えば、マクロブロック及び/又はサブブロック、であるとみなすことができる。各スライスは、映像フレームの独立して復号可能な単位であることができる。代替として、フレーム自体が復号可能な単位であることができ、又はフレームのその他の部分を復号可能な単位として定義することができる。用語“ココーディングされた単位”又は“コーディング単位”は、映像フレームの独立して復号可能な単位、例えば、フレーム全体、フレームのスライス、シーケンスとも呼ばれるピクチャのグループ(GOP)、又は適用可能なコーディング技法により定義された他の独立して復号可能な単位を指し示すことができる。
本開示の技法により、映像符号化器20は、ブロック、例えば、マクロブロック、のインターモード符号化中に幾何学的動き分割を用いるように構成することができる。すなわち、映像符号化器20は、幾何学的区画とも呼ばれる幾何学的動き分割線を用いて最良の形で符号化できることを決定することができる。原点がブロックの中心であると仮定される。次に、各幾何学的動き分割線が、区画境界を画定する線に垂直な原点を通る線によって定義される。すなわち、映像符号化器20は、2つのパラメータ、すなわち、分割線に垂直で及び分割されたブロックの中心点を起点とする線分の長さρ(ロー)、及び、分割されたブロックの中心点を通る水平線に対する垂直線の角度θ(シータ)を用いて幾何学的動き分割線を定義することができる。換言すると、幾何学的動き分割線は、X軸に対する垂直線の角度及び原点からの分割線の距離によって定義される。映像符号化器20は、ブロックを2つの区画に分割すべきであることを決定し、及び、それらの2つの区画間の区分に最も適合する(ρ,θ)によって定義された分割線を計算するように構成することができる。以下の方程式(1)は、幾何学的動き分割線を定義する。
Y=(-1/tan(θ))・x+ρ/sin(θ)=mx+c (1)
様々な例において、映像符号化器20は、固定された又は可変のサイズのブロック、例えば、16×16、32×32、及び/又は64×64のブロックを用いるように構成することができる。概して、N×Nブロックに関しては、映像符号化器20は、[0,(N/2)−1]の範囲内のρに関する値を選択することができる。従って、16×16ブロックに関しては、映像符号化器20は、[0,7]の範囲内のρに関する値を選択するように構成することができる。他の例として、32×32ブロックに関しては、映像符号化器20は、[0,15]の範囲内のρに関する値を選択するように構成することができる。さらに他の例として、64×64ブロックに関しては、映像符号化器20は、[0,31]の範囲内のρに関する値を選択するように構成することができる。幾つかの例では、映像符号化器20は、[0,31]の範囲内のθに関する値を選択するように構成することができる。従って、θに関する値の範囲は、11.25度のステップサイズを有することができる。これらの例では、16×16のブロックサイズに関しては256の可能な幾何学的区画、32×32のブロックサイズに関しては512の可能な幾何学的区画、及び64×64のブロックサイズに関しては1024の可能な幾何学的区画が存在することができる。しかしながら、ブロックサイズ及びρとθのステップサイズの選択は、上述される値には必ずしも限定されない。
映像符号化器20及び映像復号器30は、特定のピクセルがいずれの幾何学的動き区画に対応するかを決定するように構成することができ、及び、符号化器及び復号器の両方が所定のピクセルに関して同じ区画を選択するように構成すべきである。幾つかの例では、映像符号化器20及び映像復号器30は、幾何学的動き区画を用いてブロックを分割するときには固定小数点計算を用いることができる。ピクセルが領域ゼロ又は領域1に対応するかの指示を、ゼロはピクセルが領域ゼロに属することを示し、1はピクセルが領域1に属することを示すバイナリマスクとして効率的に格納することができる。可能な幾何学的区画の数及びブロックサイズに起因して、映像符号化器20及び映像復号器30において全マスクを格納するのは法外になることがある。従って、本開示は、オンザフライ(on
the fly)で、及び幾つかの場合は固定小数点演算を用いて、マスクを計算するための技法を含む。
公式(1)内の傾きm及びy切片cは三角関数を含み、従って、この公式に厳格に基づくオンザフライでのマスクの計算は、浮動小数点実装を要求することになる。幾つかの場合は、2つのデバイスが一致する浮動小数点実装を有するのは困難であり、又は不可能な場合さえもある。従って、マスクは、固定小数点算術を用いて計算することができる。従って、遷移領域内のピクセルに関する予測値を計算することは、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算することと、固定小数点算術を用いて、マスクに基づいて第1の区画内の遷移領域内のピクセルの少なくとも1つの隣接ピクセル及び第2の区画内の少なくとも1つの隣接ピクセルの位置を見つけ出す(locate)ことと、を含むことができる。
固定小数点算術を用いる例では、θ=0及びθ=πの場合は幾何学的動き区画は無限の傾き及び無限のy切片を有する垂直線になるため除外することができる。残りの場合においては、1/tanθ及び1/sinθは、固定小数点値を用いて表すことができる。その他のパラメータρは、整数として既に表すことができる。1/tanθに関しては、θの残りの値に関する最大絶対値は5.0273であり、1/tanθの2つの連続する値間の最大絶対差は、0.1989であることができる。同様に、1/sinθに関しては、最大絶対値は、5.1258であることができ、1/sinθの2つの連続する値間の最大絶対差は、0.0196であることができる。マスク計算を固定小数点演算に変換するために、映像符号化器20は、2の適切なべき乗を1/tanθ及び1/sinθに乗じ、その結果の小数点以下を四捨五入して整数を求めることができる。
一例において、固定小数点実装に関しては、映像符号化器20は、220、すなわち1048576、を1/tanθ及び1/sinθに乗じ、それらの小数点以下を四捨五入して整数を求めることができる。1のステップサイズを有する最大で64×64のブロックサイズの例におけるρの最大値は32であるため、yの切片値を表すためには25ビットの符号付き実装が適切である。式“mx”内のxは、−32乃至31の値をとることができるため、mxは、25ビットの符号付き整数として表すこともできる。幾つかの例では、映像符号化器20及び映像復号器30は、θの32個の値の各々に関して、1/tanθ及び1/sinθの値を格納するために32ビットの符号付き整数を用いることができる。sin関数及びtan関数の対称的性質に起因して、映像符号化器20及び映像復号器30は、傾き及び切片の8個の値のみを32ビットの符号付き整数として格納するように構成することができる。前述されるように、これらの格納された値は、θ=0及びθ=πのときには用いる必要がない。
映像符号化器20及び映像復号器30は、固定小数点演算を用いて同一のマスクを導き出すように構成することができる。これは、本来は幾何学的動き分割によって引き起こされることがある、映像符号化器20と映像復号器30との間のドリフト誤差を引き起こすのを回避することができる。領域0内のいずれかの点(x,y)に関してy−m≧cであるように領域ゼロを定義する。同様に、領域1内のいずれかの点(x,y)に関してy−m<cであるように領域1を定義する。あらゆる幾何学的動き区画に関して、及びあらゆる点(x,y)に関して、映像符号化器20は、固定小数点でy−mxを計算し、その結果をy切片と比較してその点が領域ゼロ又は領域1のいずれに属するかを決定することができる。θ=0又はθ=πのときには、幾何学的動き区画は、x=ρによって定義された垂直線である。その場合は、x<ρであるブロックからのすべての点を区画0に属するように定義することができ、残りの点(x≧ρ)は区画1に属するように定義することができる。映像符号化器20及び映像復号器30は、いずれの点が領域ゼロに対応し、いずれの点が領域1に対応するかを示すブロックのためのマスクを計算するためにそのブロック内の各点を通じて繰り返すように構成することができる。固定小数点演算を用いてブロックのためのマスクを計算後は、幾何学に基づく動き区画のための残りの演算はマスクに基づくことができる。
この方法で、映像符号化器20は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、幾何学的動き分割線の傾き値及びy切片値を計算し、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算し、マスクに基づいて第1の区画及び第2の区画を符号化し、及び、符号化された第1の区画、符号化された第2の区画、傾き値、及びy切片値を出力するように構成され、傾き値及びy切片値は、整数値を備える、映像符号化器の例、に対応することができる。
幾何学的動き区画を用いたブロックの分割は、各々が各々の動きベクトルを有する、ブロックの2つの長方形でない区画を生成することができる。それらの区画は、符号化されているブロックに関する予測値に対応することができる。映像符号化器20は、幾何学的動き区画に関する動きベクトルを符号化することもできる。映像符号化器20は、動き予測子に関して動きベクトルを符号化することができる。映像符号化器20は、ブロックを符号化するときにはラスター走査順序設定を前提にし、既に符号化されている隣接ブロック、例えば、現在のブロックの上方、左、及び右上のブロック、の動きベクトルの中央値として動き予測子を選択することができる。本開示の技法は、従来のコーディング規格で用いられるよりも広範な候補動きベクトルの組から中央値を選択することと、ブロックの各動きベクトルのために潜在的に異なる候補動きベクトルを用いることと、を含む。すなわち、映像符号化器20は、単一のブロックの幾何学的動き区画の動きベクトルのために異なる動き予測子を用いることを決定することができる。
さらに、映像符号化器20は、ブロックに関する残差値を計算する。概して、ブロックのピクセルに関する残差値は、ブロックのピクセルに関する実際値及びブロックの共配置されたピクセルに関する予測値との間の差分に対応する。一例では、本開示の技法は、幾何学的動き分割線を越える遷移をスムージングすることを含む。そうするために、映像符号化器20は、分割線周囲の特定の遷移領域を用いて構成することができる。一例として、映像符号化器20は、現在のピクセル上にセンタリングされた3×3ピクセルウィンドーを用いるように構成することができる。一例として、映像符号化器20は、真上の、下の、左の、及び右のピクセルのうちの少なくとも2つが異なる区画に属する場合に現在のピクセルが遷移領域内にあると決定するように構成することができる。他の例として、映像符号化器20は、直ぐ隣の8つの隣接するピクセルのうちの少なくとも2つが異なる区画に属する場合に現在のピクセルが遷移領域内にあると決定するように構成することができる。その他の例では、これらの方式は、現在のピクセルが遷移領域内に属するかどうかを決定する際にピクセルが考慮される現在のピクセルの周囲にセンタリングされた異なるサイズのウィンドーにまで拡大させることができる。
遷移をスムージングするために、映像符号化器20は、分割線を越えて低域通過フィルタを適用するように構成することができる。フィルタは、フィルタリングされるピクセル上にセンタリングされた係数の行列、例えば3×3行列、に対応することができる。従って、フィルタは、遷移領域内のピクセル上にセンタリングすることができる。低域通過フィルタは、様々な係数を有することができる。低域通過フィルタの一例は以下の通りであることができる。1 2 12 3 21 2 1
ここで、“3”係数は、現在のピクセルに対応し、その他の係数は、現在のピクセルのその他の直ぐ隣のピクセルに対応する。低域通過フィルタの他の例は以下の通りである。0 1 01 4 10 1 0
ここで、“4”係数は、現在のピクセルに対応し、その他の係数は、現在のピクセルのその他の直ぐ隣のピクセルに対応する。遷移領域内のピクセルに関する予測値を計算するために、映像符号化器20は、(フィルタが遷移領域内のピクセル上にセンタリングされているときに)フィルタの係数及びそれらの係数と共配置されたピクセルの値の積を計算し、積の和を計算し、及び積の和を係数の和で除することができる。
この方法で、映像符号化器20は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算し、遷移領域内のピクセルの予測値に基づいてブロックの遷移領域内のピクセルの残差値を計算し、ピクセルの残差値を出力するように構成された映像符号化器の例に対応する。
幾つかの例では、遷移領域内でのスムージングのために、映像符号化器20は、現在のピクセルに関する様々な条件に基づいて選択的にフィルタリングを行う。それらの条件は、分割線に垂直な方向に沿ったピクセル値の差分(又は一定の形の勾配)と、ブロックの2つの区画間の動きベクトル差分と、分割線方向と、基準フレームインデックスと、量子化パラメータと、2つの区画のピクセル数と、を含むことができる。遷移領域内のピクセルをフィルタリングすべきかどうか及びどのようにフィルタリングすべきかを決定するためにその他の条件も解析することができる。
視覚上の品質を向上させるための他の方法は、遷移領域内部のピクセルに関する2つの予測を重なり合わせることを含む。映像符号化器20は、ブロックの区画に関する各々の動きベクトルを用いて、遷移領域に属するピクセルに関する2つの予測を生成することができる。映像符号化器20は、次に、加重された和を用いて2つの予測を結合することができる。例えば、ピクセルが区画1に属し及び遷移領域内にも存在する場合は、映像符号化器20は、2/3の重み、及び他方の区画からの予測値のための1/3の重みを用いて第1の区画値からの予測値を加重することができる。その他の重み値、例えば(3/4、1/4)又は(1/2、1/2)は、その他の例において適用することができる。幾つかの例では、重み値は、好適に決定することができる。
幾つの例では、加重和の演算のための加重係数は、現在のピクセルに関する様々な条件に基づいて決定される。それらの条件は、分割線に垂直な方向に沿ったピクセル値の差分(又は一定の形の勾配)と、ブロックの2つの区画間の動きベクトル差分と、分割線方向と、基準フレームインデックスと、量子化パラメータと、2つの区画のピクセル数と、を含むことができる。遷移領域内のピクセルをフィルタリングすべきかどうか及びどのようにフィルタリングすべきかを決定するためにその他の条件も解析することができる。
映像符号化器20は、残差値への変換、例えば、離散コサイン変換、4×4整数変換、8×8変換、16×16変換、又はその他の変換、を適用することができる。一例では、映像符号化器20は、幾何学動き分割線が区画内を通るかどうかに基づいて、ブロックの区画の残差のための変換サイズを好適に選択することができる。この例では、用語区画は、幾何学的動き区画とは正反対に、N×Nブロックの(N/2)×(N/2)又はそれよりも小さい区画を意味する。
一例として、幾何学的動き分割線を用いてN×Nブロックが分割されると仮定する。映像符号化器20は、N×Nブロックを4つの重なり合わない(N/2)×(N/2)ブロックに分割する。次に、各々の(N/2)×(N/2)ブロックに関して、映像符号化器20は、幾何学的動き分割が(N/2)×(N/2)内を通るかどうかを決定することができる。幾何学的動き分割線が(N/2)×(N/2)ブロック内を通らない場合は、映像符号化器20は、ブロックのために(N/2)×(N/2)の変換サイズを用いることができる。他方、幾何学的動き分割線が(N/2)×(N/2)内を通る場合は、映像符号化器20は、方法を反復的に実行する、すなわち、(N/2)×(N/2)を4つの重なり合わない(N/4)×(N/4)ブロックに分割し、幾何学的動き分割線が(N/4)×(N/4)ブロックのうちのいずれか内を通るかを決定することができる。映像符号化器20は、最小変換サイズ、例えば、4×4、を用いて構成することができ、その点において、映像符号化器20は、幾何学的動き分割線がサブブロック内を通るかどうかにかかわらずそのサブブロックのための最小変換サイズを選択することができる。
この方法で、映像符号化器20は、幾何学的動き分割線を用いて映像データのブロックを第1の幾何学的区画及び第2の幾何学的区画に分割し、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割し、(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを符号化するように構成され、ブロックは、N×Nピクセルを備える、映像符号化器の例、に対応することができる。
イントラ予測又はインター予測コーディングに従って予測データ及び残差データを生成し、及び変換(例えば、H.264/AVCで用いられる4×4又は8×8整数変換又は離散コサイン変換DCT)に従って変換係数を生成した後は、変換係数の量子化を行うことができる。量子化は、概して、変換係数を表すために用いられるデータの量を可能な場合は低減させるために変換係数が量子化されるプロセスを意味する。量子化プロセスは、それらの係数の一部又は全部と関連付けられたビット深度を低減させることができる。例えば、量子化中にnビット値を切り捨ててmビット値にすることができ、ここで、nはmよりも大きい。
量子化に引き続き、例えば、コンテンツ適応型可変長コーディング(content adaptive variable length coding(CAVALC)、コンテキスト適応型バイナリ算術コーディング(context adaptive binary arithmetric coding(CABAC)、又は他のエントロピーコーディング方法により、量子化されたデータのエントロピーコーディングを行うことができる。エントロピーコーディングのために構成された処理ユニット、又は他の処理ユニットは、その他の処理機能、例えば、量子化された係数のゼロランレングス(zero run length)コーディング及び/又は構文情報の生成、例えば、コーディングされたブロックバターン(CBP)値、マクロブロックタイプ、コーディングモード、コーディングされたユニットのための最大マクロブロックサイズ(例えば、フレーム、スライス、マクロブロック、又はシーケンス)、等を行うことができる。
映像符号化器20は、例えば、フレームヘッダ、ブロックヘッダ、スライスヘッダ、又はGOPヘッダにおいて、映像復号器30に対して構文データ、例えばブロックに基づく構文データ、フレームに基づく構文データ、及びGOPに基づく構文データ、をさらに送信することができる。例えば、映像符号化器20が、固定小数点算術を可能にするために、幾何学的動き区画を定義する角度値及び長さ値のための整数を提供する場合は、映像符号化器20は、整数の使用をシグナリングすることができる。映像符号化器20は、シーケンスパラメータセット又はピクチャパラメータセットでこれをシグナリングすることができる。代替として、映像符号化器20は、再定義されたプロフィール及び/又はレベルの組を用いることができ、従って、幾何学的動き区画に関する固定小数点算術を可能にするための整数値の使用を示すプロフィールインジケータ(profile_idc)又はレベルインジケータ(level_idc)値を選択することができる。映像符号化器20は、幾何学的動き区画がピクチャのシーケンス及び/又は個々のピクチャのためにイネーブルにされるかどうかをシグナリングすることもできる。
さらに、映像符号化器20は、ブロックのためにスムージングがイネーブルにされているかどうか、そしてそうである場合は、そのスムージングがどのようにして完遂されるか、例えば、スムージングフィルタの指示、をシグナリングすることができる。例えば、映像符号化器20は、スムージングフィルタの係数をシグナリングすることができる。映像符号化器20は、適応型変換サイズ選択がイネーブルにされるかどうかもシグナリングすることができる。映像符号化器20は、動き予測子に対して動きベクトルを符号化するために、候補動きベクトルの拡張された組がピクチャに関して許容されるかどうかをシグナリングすることもできる。
映像復号器30は、受信された映像データを復号するときに本開示の技法を用いるように構成することができる。映像復号器30によって適用される技法は、基本的には、映像符号化器20によって適用されるそれらと対称的であることができる。例えば、映像復号器30は、これらの技法の固定小数点実装を達成するために、符号化されたブロックのための幾何学的動き区画を定義する傾き及び切片のための固定小数点値を受信することができる。従って、映像復号器30は、幾何学的動き区画の傾き及び切片に基づいて、オンザフライでブロックのためのマスクを計算することができ、各ピクセルが領域ゼロ又は領域1内に入るかを決定するためにブロックのための各ピクセルの位置を通じて繰り返すことができる。
この方法で、映像復号器30は、幾何学的動き分割線によって第1の区画及び第2の区画に分割されている符号化された映像データのブロックを受信し、幾何学的動き分割線を定義する傾き値及びy切片値を受信し、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算し、マスクに基づいてブロックの第1の区画及び第2の区画を復号し、及び復号されたブロックを出力するように構成され、傾き値及びy切片値は、整数値を備える、映像復号器の例、に対応することができる。
他の例として、映像復号器30は、ブロックのための幾何学的動き分割線におけるそのブロックの遷移領域をスムージングするためのスムージング技法を実装することができる。映像復号器30は、ブロックのピクセルに関する予測値を決定するためにブロックの各幾何学的動き区画に関する動きベクトルを受信することができる。映像復号器30は、上述されるように、幾何学的動き区画遷移領域内のピクセルにスムージングフィルタを適用することができる。従って、映像復号器30は、符号化された映像データのブロック、符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、およびブロックの遷移領域内のピクセルに関する残差値を受信し、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算し、予測値及び残差値に基づいてブロックの遷移領域内のピクセルに関する再構築された値を計算し、及びピクセルの再構築された値を出力するように構成された映像復号器の例、に対応することができる。
さらに他の例として、映像復号器30は、適応型変換サイズ選択に基づいて、様々なサイズの残差値のためのキーワードを受信することができる。これらのキーワードは、可変長コードに対応することができ、ブロックのための変換サイズに基づいて異なる辞書に対応することができる。従って、映像復号器30は、幾何学的動き分割線が特定のブロック内を通るかどうかに基づいてそのブロックのための変換サイズを決定することができる。この方法で、映像復号器30は、幾何学的動き分割線によって第1の幾何学的区画及び第2の幾何学的区画に分割された符号化された映像データのブロックを受信し、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割し、(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを逆変換するように構成され、ブロックは、N×Nピクセルを備える、映像復号器の例、に対応することができる。
さらに他の例として、映像復号器30は、動き予測子に関する幾何学的動き区画に関する動きベクトルを復号することができる。本開示の技法により、映像復号器30は、候補動きベクトルのより大きい組から動き予測子を決定することができ、及び、各幾何学的区画のための動き予測子を個々に決定することができる。この方法で、映像復号器30は、幾何学的動き分割線によって第1の区画及び第2の区画に分割された映像データのブロック、第1の区画に関する第1の符号化された動きベクトル、及び第2の区画に関する第2の符号化された動きベクトルを受信し、第1の区画に隣接するブロックに関する動きベクトルから選択された第1の動き予測子に基づいて第1の符号化された動きベクトルを復号し、第2の区画に隣接するブロックに関する動きベクトルから選択された第2の動き予測子に基づいて第2の符号化された動きベクトルを復号し、及び、復号された第1及び第2の動きベクトルを用いてブロックを復号するように構成され、第2の区画に隣接するブロックは、第1の区画に隣接するブロックから独立して決定される、映像復号器の例、に対応することができる。
映像符号化器20及び映像復号器30は、各々、様々な適切な符号化器又は復号器回路、例えば1つ以上のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、個別論理回路、ソフトウェア、ハードウェア、ファームウェア又はそれらのあらゆる組み合わせ、のうちのいずれかとして適宜実装することができる。映像符号化器20及び映像復号器30の各々は、1つ以上の符号化器又は復号器内に含めることができ、それらのいずれも、結合された映像符号化器/復号器(CODEC)の一部として一体化することができる。映像符号化器20及び/又は映像復号器30を含む装置は、集積回路、マイクロプロセッサ、及び/又は無線通信デバイス、例えば携帯電話、を備えることができる。
映像符号化器20及び映像復号器30は、本開示の技法のあらゆる組み合わせを実行するように構成することができる。すなわち、映像符号化器20及び映像復号器30は、幾何学的動き分割のための固定小数点実装、幾何学的動き区画境界によって定義された遷移領域のスムージング、各幾何学的動き区画に関する動きベクトルの符号化、及び/又は幾何学的動き分割線がサブブロックを通るかどうかに基づくサブブロックのための適応型変換サイズ選択のうちのあらゆる1つ以上をあらゆる組み合わせで実行するように構成することができる。
幾つかの例では、映像符号化器20及び映像復号器30は、本開示において説明される幾つかの技法を実装することができるが、それらの技法は、ディスエーブルにすることができ、又は、映像符号化器20及び映像復号器30のうちの1つは、技法の同じ組をサポートすることができない。従って、映像符号化器20は、特定の映像ストリームのためにいずれの技法が用いられるかをシグナリングすることができ、及び、映像復号器30は、映像復号器30が映像ストリームを符号化するために用いられる技法をサポートするかどうかに基づいて、映像ストリームを取り出すか又は使用するかを選択することができる。例えば、映像符号化器20は、プロフィールインジケータ(profile_idc値)、レベルインジケータ(level_idc値)、ヘッダデータ、又はその他の記述データを用いて、シーケンスパラメータセット、ピクチャパラメータセットにおいていずれの技法が用いられるかをシグナリングすることができる。
図2は、幾何学的動き分割のための技法を実装することができる映像符号化器20の例を示したブロック図である。映像符号化器20は、マクロブロック、又はマクロブロックの区画又は小区画を含む映像フレーム内のブロックのイントラ及びインターコーディングを行うことができる。イントラコーディングは、所定の映像フレーム内の映像の空間冗長性を低減又は除去するために空間予測に依存する。インターコーディングは、映像シーケンスの隣接フレーム内での映像の時間的冗長性を低減又は除去するために時間的予測に依存する。イントラモード(Iモード(登録商標))は、幾つかの空間に基づく圧縮モードのうちのいずれかを意味することができ、インターモード、例えば単方向予測(Pモード)又は双方向予測(Bモード)、は、幾つかの時間に基づく圧縮モードのうちのいずれかを意味することができる。図2ではインターモード符号化のためのコンポーネントが描かれているが、映像符号化器20は、イントラモード符号化のためのコンポーネントをさらに含むことができることが理解されるべきである。しかしながら、該コンポーネントは、簡潔性及び明確性のために例示されない。
図2に示されるように、映像符号化器20は、符号化される映像フレーム内の現在の映像ブロックを受信する。図2の例では、映像符号化器20は、モード選択ユニット40と、動き推定ユニット42と、動き補償ユニット44と、イントラ予測ユニット46と、基準フレームストア64と、加算器50と、変換ユニット52と、量子化ユニット54と、エントロピーコーディングユニット56と、を含む。映像ブロック再構築のために、映像符号化器20は、逆量子化ユニット58と、逆変換ユニット60と、加算器62と、も含む。再構築された映像からブロック性アーティファクトを除去するためにブロック境界をフィルタリングするためにデブロッキングフィルタ(図2に示されていない)を含めることもできる。希望される場合は、デブロッキングフィルタは、加算器62の出力を典型的にフィルタリングする。
符号化プロセス中には、映像符号化器20は、コーディングされる映像フレーム又はスライスを受信する。フレーム又はスライスは、複数の映像ブロックに分割することができる。動き推定ユニット42及び動き補償ユニット44は、時間的圧縮を提供するために1つ以上の基準フレーム内の1つ以上のブロックに対する受信された映像ブロックのインター予測コーディングを行う。イントラ予測ユニットは、空間圧縮を提供するためにコーディングされるブロックと同じフレーム又はスライス内において1つ以上の隣接ブロックに対する受信された映像ブロックのイントラ予測コーディングを行うこともできる。
モード選択ユニット40は、例えば、誤差結果に基づいてコーディングモード、イントラ又はインター、のうちの1つを選択することができ、その結果得られたイントラ又はインターコーディングされたブロックを、残差ブロックデータを生成するために加算器50に及び符号化されたブロックを基準フレームとしての使用のために再構築するために加算器62に提供する。
動き推定ユニット42及び動き補償ユニット44は、高度に一体化することができるが、概念上の目的のために別個に例示される。動き推定は、映像ブロックのための動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、例えば、現在のフレーム内でコーディング中の現在のブロック(又は他方のコーディングされた単位)に対する予測基準フレーム内の予測ブロック(又は他方のコーディングされた単位)の変位を示すことができる。予測ブロックは、ピクセル差分の点でコーディングされるブロックと非常に一致することが判明しているブロックであり、それは、絶対差の和(SAD)、平方差の和(SSD)、又はその他の差分測定基準によって決定することができる。動きベクトルは、マクロブロックの区画の変位を示すこともできる。動き補償は、動き推定によって決定された動きベクトルに基づいて予測ブロックをフェッチ又は生成することを含むことができる。繰り返しになるが、動き推定ユニット42及び動き補償ユニット44は、幾つかの例では、機能的に一体化することができる。
幾つかの例では、動き推定ユニット42は、幾何学的動き分割線を用いてブロックを分割すべきであることを決定することができる。動き推定ユニット42は、幾何学的動き分割線のためのパラメータ、例えば、分割されたブロックの原点から幾何学的動き分割線の中点までの線の角度θ及び距離ρ、を計算することができる。幾つかの例では、動き推定ユニット42は、これらの技法の固定小数点実装を可能にするために、それらのパラメータを幾何学的動き分割線の傾きm及びy切片cとして決定することができる。さらに、映像符号化器20及び映像復号器30(図1及び3)は、θの異なる値のための1/tan(θ)及び1/sin(θ)のためのルックアップテーブルの同一のコピーを格納することができる。幾何学モードに関して、映像符号化器20は、出力ビットストリームにおいてθ及びρのための値をシグナリングすることができる。映像復号器30は、映像符号化器20によって計算されたマスクと同じであるマスクを計算するために固定小数点計算を行うためにシグナリングされた値を用いるように構成することができる。
動き推定ユニット42は、映像ブロックを基準フレームストア64内の基準フレームの映像ブロック(又は区画)と比較することによって、インターコーディングされたフレームの映像ブロック又はそれの幾何学的動き区画に関する動きベクトルを計算する。動き補償ユニット44は、基準フレーム、例えば、Iフレーム又はPフレーム、の小整数(sub−integer)ピクセルを内挿することもできる。ITU H.264規格は、基準フレームを“リスト”と呼んでいる。従って、基準フレームストア64内に格納されたデータは、リスト内に格納することができる。動き推定ユニット42は、基準フレームストア64からの1つ以上の基準フレームのブロックを現在のフレーム、例えば、Pフレーム又はBフレームの符号化されるべきブロックと比較する。基準フレームストア64内の基準フレームが小整数ピクセルのための値を含むときには、動き推定ユニット42によって計算された動きベクトルは、基準フレームの小整数ピクセル位置を指し示すことができる。
幾つかの例では、動き推定ユニット42は、動きベクトルを符号化するために、動きベクトルと動き予測子との間の差分を計算することができる。動き推定ユニット42は、符号化中の現在のブロックの上方の、左の、左上の、及び右上のブロックの動きベクトルの中央値として動き予測子を選択することができる。動き推定ユニット42は、現在のブロックの上方及び左のブロックが分割されているかどうか、及びそうである場合はこれらの区画が個別の動きベクトルを有するかどうか、を決定することもできる。そうである場合は、動き推定ユニット42は、これらの候補の動きベクトル全部の中央値から動き予測子を選択することができる。動き予測子を決定後は、動き推定ユニット42は、動きベクトルと動き予測子との間の差分を計算することができる。動き推定ユニット42は、計算された差分をエントロピーコーディングユニット56に及び計算された動きベクトルを動き補償ユニット44に送信する。
動き補償ユニット44は、予測ブロックに基づいて予測データを計算することができる。映像符号化器20は、コーディング中の原映像ブロックから動き補償ユニット44からの予測データを減じることによって残差映像ブロックを形成する。加算器50は、この減算演算を行うコンポーネント又はコンポーネント(複数)を表す。
幾つかの例では、動き補償ユニット44は、本開示の技法により、ブロックのための幾何学的動き分割線によって定義された遷移領域におけるそのブロック内のピクセルをフィルタリングすることができる。例えば、動き補償ユニット44は、領域ゼロ及び領域1の両方からの値を考慮する3×3ピクセルフィルタを用いて遷移領域内のピクセルのための予測値を計算することができ、ここで、領域ゼロ及び領域1は、幾何学的動き区画に対応する。他の例として、動き補償ユニット44は、領域ゼロ内のピクセルに関する値及び領域1内のピクセルに関する値の加重和を計算することによって遷移領域内のピクセルに関する予測値を計算することができる。遷移領域内のピクセルに関する予測値を計算後は、加算器50は、ピクセルの予測値と実際値との間の差分としてピクセルに関する残差値を計算することができる。この方法で、加算器50によって計算された残差値は、動き補償ユニット44によって計算されたスムージングされた予測値に基づくことができる。
変換ユニット52は、変換、例えば、離散コサイン変換(DCT)又は概念的に類似する変換、を残差ブロックに適用し、残差変換係数値を備える映像ブロックを生成する。変換ユニット52は、DCTに概念的に類似するその他の変換、例えば、H.264規格によって定義されたそれら、を行うことができる。ウェーブレット変換、整数変換、サブバンド変換又はその他のタイプの変換も使用可能である。いずれの場合も、変換ユニット52は、残差ブロックに変換を適用し、残差変換係数のブロックを生成する。変換は、残差情報をピクセル値領域から変換領域、例えば、周波数領域、に変換することができる。
幾つかの例では、変換ユニット52は、動き補償ユニット44から様々なサイズのブロックを受信することができる。動き補償ユニット44は、ブロックが幾何学的動き分割線に接するどうかに基づいてブロックサイズを選択するように構成することができる。例えば、原ブロックが16×16ブロックであると仮定する。動き補償ユニット44は、原ブロックを4つの8×8ブロックに分割することができる。次に、動き補償ユニット44は、幾何学的動き分割線に接する4つの8×8ブロックのうちのすべてを4×4ブロックに分割することができる。変換ユニット52は、各々の可能なブロックサイズに関する変換を用いて構成することができる。この方法で、映像符号化器20は、ブロックに関する残差値を計算するときに幾何学的動き分割されたブロックのための適応型変換サイズ選択を行うことができる。16×16ブロックの例が説明されるが、その他のサイズブロック、例えば、32×32、64×64、等、に対して同様の技法を適用することができる。さらに、動き補償ユニット44は、最小ブロックサイズ、例えば、4×4、で構成することができる。
量子化ユニット54は、ビットレートをさらに低減させるために残差変換係数を量子化する。量子化プロセスは、係数の一部又は全部と関連付けられたビット深度を低減させることができる。量子化度は、量子化パラメータを調整することによって変更することができる。
量子化に後続して、エントロピーコーディングユニット56は、量子化された変換係数をコーディングする。例えば、エントロピーコーディングユニット56は、コンテンツ適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、又は他のエントロピーコーディング技法を実行することができる。エントロピーコーディングユニット56によるエントロピーコーディングに引き続き、符号化された映像を他のデバイスに送信すること又はのちの送信又は取り出しのためにアーカイブに保存することができる。コンテキスト適応型バイナリ算術コーディングの場合は、コンテキストは、隣接するマクロブロックに基づくことができる。
幾つかの場合は、エントロピーコーディングユニット56又は映像符号化器20の他のユニットは、エントロピーコーディングに加えて、その他のコーディング機能を実行するように構成することができる。例えば、エントロピーコーディングユニット56は、マクロブロック及び区画のためのCBP値を決定するように構成することができる。さらに、幾つかの場合は、エントロピーコーディングユニット56は、マクロブロック又はそれの区画内で係数のランレングス(run length)コーディングを行うことができる。特に、エントロピーコーディングユニット56は、マクロブロック又は区画内で変換係数を走査するためにジグザグ走査又はその他の走査パターンを適用すること及びさらなる圧縮のためにゼロのランを符号化することができる。エントロピーコーディングユニット56は、符号化された映像ビットストリームでの送信のための該当する構文要素を有するヘッダ情報を構築することもできる。
逆量子化ユニット58及び逆変換ユニット60は、例えば基準ブロックとしてののちの使用を目的として、ピクセル領域内の残差ブロックを再構築するために逆量子化及び逆変換をそれぞれ適用する。動き補償ユニット44は、基準フレームストア64のフレームのうちの1つの予測ブロックに残差ブロックを加えることによって基準ブロックを計算することができる。動き補償ユニット44は、動き推定における使用のために小整数ピクセル値を計算するために再構築された残差ブロックに1つ以上の内挿フィルタを適用することもできる。加算器62は、基準フレームストア64内での格納のために再構築された映像ブロックを生成するために動き補償ユニット44によって生成された動き補償された予測ブロックに再構築された残差ブロックを加える。再構築された映像ブロックは、後続する映像フレーム内のブロックをインターコーディングするための基準ブロックとして動き推定ユニット42及び動き補償ユニット44によって用いることができる。
図3は、映像復号器30の例を示したブロック図であり、それは、符号化された映像シーケンスを復号する。図3の例では、映像復号器30は、エントロピー復号ユニット70と、動き補償ユニット72と、イントラ予測ユニット74と、逆量子化ユニット76と、逆変換ユニット78と、基準フレームストア82と、加算器80と、を含む。映像復号器30は、幾つかの例では、映像符号化器20に関して説明された符号化パス(pass)と概して相互的である復号パスを行うことができる(図2)。イントラ予測ユニット74は、空間的に隣接するブロックから予測ブロックを形成するためにビットストリーム内で受信されたイントラ予測モードを用いることができる。
動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルに基づいて予測データを生成することができる。幾何学的動き分割線を用いて符号化されたブロックが分割されたときには、動き補償ユニット72は、ブロックのいずれのピクセルがいずれの区画に対応するかを決定するためにブロックのための幾何学的動き分割線の定義を受信することができる。幾つかの例では、その線の定義は、ブロックの原点から幾何学的動き分割線の中心までの線の角度θ及び長さρによることができる。幾つかの例では、その線の定義は、幾何学的動き分割線の傾きm及びy切片cによることができ、従って、動き補償ユニット72は、固定小数点算術を用いてブロックのいずれの幾何学的区画ピクセルに対応するかを示すマスクを計算することができる。
動き補償ユニット72は、基準フレームストア82内の基準フレーム内の予測ブロックを識別するためにビットストリームで受信された動きベクトルを用いることができる。幾つかの例では、動きベクトルは、以前に符号化されたブロック又はそれらの区画から選択された動き予測子に関して符号化することができる。従って、動き補償ユニット72は、ブロック又は区画のための動き予測子を決定し、次に受信された差分値を動き予測子に加えることによって動きベクトルを復号することができる。
動き補償ユニット72は、スムージングフィルタを用いて幾何学的動き区画間の遷移領域内のピクセルに関する予測値を計算するように構成することもできる。例えば、動き補償ユニット72は、予測値を決定するためにこれらのピクセルに3×3ピクセルフィルタを適用することができる。他の例として、動き補償ユニット72は、第1の区画からの値と第2の区画からの値の加重和を用いて遷移領域内のピクセルのための予測値を計算することができる。
逆量子化ユニット76は、ビットストリームで提供されてエントロピー復号ユニット70によって復号された量子化されたブロック係数を逆量子化、すなわち量子化解除、する。逆量子化プロセスは、例えばH.264復号規格によって定義されるような、従来のプロセスを含むことができる。逆量子化プロセスは、量子化度、そして同様に適用されるべき逆量子化度、を決定するために各マクロブロックのために符号化器50によって計算された量子化パラメータQPの使用を含むこともできる。
逆変換ユニット58は、ピクセル領域において残差ブロックを生成するために、逆変換、例えば、逆DCT、逆整数変換、又は概念的に類似する逆変換プロセスを変換係数に適用する。動き補償ユニット72は、動き補償されたブロックを生成し、可能な場合は内挿フィルタに基づいて内挿を行う。サブピクセル精度を有する動き推定のために用いられる内挿フィルタのための識別子を構文要素内に含めることができる。動き補償ユニット72は、基準ブロックの小整数ピクセルのための内挿された値を計算するために映像ブロックの符号化中に映像符号化器20によって用いられる内挿フィルタを用いることができる。動き補償ユニット72は、受信された構文情報により映像符号化器20によって用いられる内挿フィルタを決定すること及び内挿フィルタを用いて予測ブロックを生成することができる。
幾つかの例では、逆変換ユニット78は、動き補償ユニット72から符号化されたブロックのための変換サイズの指示を受信することができる。動き補償ユニット72は、ブロックが幾何学的動き区画に接するかどうかを決定し、そしてそうである場合は、変換サイズを1/2だけ縮小して最小変換サイズ、例えば、4×4ピクセル、にする。幾つかの例では、変換されたブロックは、適用すべき変換のサイズを記述する構文情報を含むことができる。
動き補償ユニット72は、符号化された映像シーケンスのフレームを符号化するために用いられるマクロブロックのサイズを決定するための構文情報、符号化された映像シーケンスのフレームの各マクロブロックがどのように分割されるかを記述する区画情報、各区画が符号化される方法を示すモード、各々のインター符号化されたマクロブロック又は区画のための1つ以上の基準フレーム、及び符号化された映像シーケンスを復号するためのその他の情報を用いることができる。
加算器80は、復号されたブロックを形成するために動き補償ユニット72又はイントラ予測ユニットによって生成された対応する予測ブロックと残差ブロックを合計する。希望される場合は、ブロック性アーティファクトを除去するために復号されたブロックをフィルタリングするためにデブロッキングフィルタを適用することもできる。復号された映像ブロックは、次に、基準フレームストア82内に格納され、それは、後続する動き補償のための基準ブロックを提供し及び表示装置(例えば、図1の表示装置32)上での提示のための復号された映像も生成する。
図4は、幾何学的動き分割線116を用いて分割されているブロック110を例示した概念図である。幾何学的動き分割線116は、ブロック110を2つの区画、すなわち、領域112及び領域114、に分割する。
幾つかの例では、幾何学的動き分割線116は、垂直線120の特性により定義することができる。特に、x軸113及びy軸111の交差点をブロック110のための原点として定義する。垂直線120は、幾何学的動き分割線116に垂直であり、点124において幾何学的動き分割線116と交差する。角度118は、x軸113に対する垂直線120の角度に対応する。距離122は、ブロック110の原点と幾何学的動き分割線116の点124との間の距離に対応し、それは、ブロック110の原点からの幾何学的動き分割線116の垂直距離でもある。角度118は、θ(シータ)と呼ぶこともでき、距離122は、ρ(ロー)と呼ぶことができ、θ及びρは上記において定義されるとおりである。この方法で、幾何学的動き分割線116は、角度118及び距離122の組み合わせを用いてブロック110のために定義することができる。
代替として、幾何学的動き分割線116は、傾き126及びy切片128により定義することができる。傾き角度126は、幾何学的動き分割線116の傾きに対応する。y切片128は、幾何学的動き分割線116がy軸111と交差する点に対応する。上記において定義されるように、傾き126は、mを用いて表すこともでき、y切片128は、cを用いて表すことができる。傾き126及びy切片128は、ピクセルが領域112にあるか又は領域114にあるかを示すブロック110のためのマスクを計算するために固定小数点算術を用いるのを可能にするために、傾き126及びy切片128は整数値として表すことができる。傾き126及びy切片128は、便宜上以下に再掲した上記の方程式(1)によって角度118及び距離120に数学的に関連付けられる。
Y=(-1/tan(θ))・x+ρ/sin(θ)=mx+c (1)
図5は、幾何学的動き分割線138を用いて分割されているブロック130を例示した概念図である。幾何学的動き分割線138は、ブロック130を2つの領域、すなわち、領域132及び領域134、に分割する。遷移領域136は、幾何学的動き分割線138付近のピクセルを含む。幾つかの例では、遷移領域136は、領域132における少なくとも1つの隣接ピクセル及び領域134における少なくとも1つの隣接ピクセルを有するピクセルを含むように定義することができる。隣接ピクセルは、上隣の、下隣の、左隣の、右隣の、左上隣の、右上隣の、左下隣の、及び/又は右下隣のうちのいずれか又は全部を含むことができる。
領域136内のピクセルは、それらのピクセルが領域132又は領域134のいずれにより近いかを示すための様々な陰影レベルを用いて例示される。特に、この例では、より明るい陰影のピクセルは領域132により近く、より暗い陰影のピクセルは、領域134により近い。一例では、ピクセルは、そのピクセルの大部分の隣接ピクセルが特定の領域内に存在するときにその領域の方に近いと言うことができる。幾つかの例では、映像符号化器20及び/又は映像復号器30は、遷移領域136内のピクセルにスムージングフィルタを適用するように構成することができる。
図6は、3×3ピクセル配列140を例示した概念図である。ピクセル配列140は、現在のピクセル142と、隣接ピクセル144A乃至144H(隣接ピクセル144)とを含む。特に、図6の例では、ピクセル144Bは、上隣のピクセルに対応し、ピクセル144Gは、下隣のピクセルに対応し、ピクセル144Dは、左隣のピクセルに対応し、ピクセル144Eは、右隣のピクセルに対応し、ピクセル144Aは、左上隣のピクセルに対応し、ピクセル144Cは、右上隣のピクセル144Eに対応し、ピクセル144Fは、左下隣のピクセルに対応し、ピクセル144Hは、右下隣のピクセルに対応する。
ピクセル配列140は、現在のピクセル142が遷移領域、すなわち、幾何学的動き分割線付近の領域、内にあるかどうかを決定するときに用いることができる。隣接ピクセル144のうちの2つ以上が異なる領域内に存在するときには、現在のピクセル142は、遷移領域内に含まれると言うことができる。例えば、隣接ピクセル144Dが領域ゼロ内に存在し、隣接ピクセル144Eが領域1内に存在する場合は、現在のピクセル142は、遷移領域内に存在すると言うことができる。幾つかの例では、現在のピクセル142は、大部分の隣接ピクセルが特定の領域内に存在するときにその領域により近いと言うことができる。例えば、現在のピクセル142は、隣接ピクセル144A、144B、144C、144D、及び144Fが領域ゼロ内に存在し、隣接ピクセル144E、144G、及び144Hが領域1内に存在する場合は領域ゼロにより近いと言うことができる。
ピクセル配列140は、現在のピクセル142の値を調整するために3×3スムージングフィルタを定義するために用いることもできる。フィルタは、現在のピクセル142及び隣接ピクセル144の各々のための定義された重みを有することができる。現在のピクセル142に関する値を計算するために、ピクセル配列140内のピクセルの各々の重みは、対応する位置におけるピクセルの値を乗じ、次に、加算して重みの和によって除算することができる。一例では、隣接ピクセル144Aは、1の重み、隣接ピクセル144Bは、2の重み、隣接ピクセル144Cは、1の重み、隣接ピクセル144Dは、2の重み、隣接ピクセル144Eは、2の重み、隣接ピクセル144Fは、1の重み、隣接ピクセルGは、2の重み、隣接ピクセル144Hは、1の重み、現在のピクセル142は、3の重みを有する。これらの重みは、各々のピクセルの値を乗じ、15(1+2+1+2+3+2+1+2+1)によって除して現在のピクセル142に関するスムージングされた値を計算することができる。
他の例では、隣接ピクセル144Aは、0の重み、隣接ピクセル144Bは、1の重み、隣接ピクセル144Cは、0の重み、隣接ピクセル144Dは、1の重み、隣接ピクセル144Eは、1の重み、隣接ピクセル144Fは、0の重み、隣接ピクセル144Gは、1の重み、隣接ピクセル144Hは、0の重み、現在のピクセル142は、4の重みを有する。これらの重みは、各々のピクセルの値を乗じ、8(1+1+4+1+1)によって除して現在のピクセル142に関するスムージングされた値を計算することができる。その他の例では、その他のスムージングフィルタを生成するために、その他の重みを隣接ピクセル144及び現在のピクセル142に割り当てることができる。さらに、隣接ピクセル144に割り当てられた重みは、必ずしも対称的である必要がない。さらに、より大きいスムージングフィルタ、例えば、5×5、7×7、等も定義することができる。
図7は、幾何学的動き分割線を用いて分割されたブロックに関する残差値を計算するときにスムージングを行うための方法例を示したフローチャートである。図7の方法は、例を目的として映像符号化器20に関して説明されているが、あらゆるその他の処理ユニットによって実行できることが理解されるべきである。例えば、図7の方法は、映像復号器30によって適用することもできる。
最初に、映像符号化器20は、符号化されるべき映像データのブロックを受信する(150)。この例の目的上、ブロックは、インター予測符号化されたフレーム、例えば、Pフレーム又はBフレーム、のブロックに対応することが仮定される。動き推定ユニット42は、ブロックのための動き探索を行うことができる。動き探索の結果、動き推定ユニット42は、幾何学的動き分割線を用いてブロックを分割すべきであることを決定することができる(152)。その結果、動き推定ユニット42は、幾何学的動き分割線を用いてブロックを分割し、2つの動きベクトル、各幾何学的動き区画ごとに1つ、を生成することができる。
動き推定ユニット42は、動きベクトルを、幾何学的動き分割線の定義とともに動き補償ユニット44に送信することができる。幾何学的動き分割線の定義は、ブロックの原点から幾何学的動き分割線までの垂直線のための角度値及び距離値を用いて、又は、幾つかの例では幾何学的動き分割線のための傾き値及びy切片値を用いて表すことができる。動き補償ユニット44は、幾何学的動き分割線の定義を用いてブロックのためのマスクを計算することができる。垂直線の角度及び長さを用いて線が定義されるときには、計算は、浮動小数点算術を用いて行うことができる。幾何学的動き分割線の傾き及びy切片を用いて線が定義されるときには、計算は、固定小数点算術を用いて行うことができる。
動き補償ユニット44は、遷移領域に対応するブロック内のピクセルを決定することができる(154)。これらのピクセルは、幾何学的動き区画のうちの1方において少なくとも1つの隣接ピクセルを有し、他方の幾何学的動き区画内において他の隣接ピクセルを有するピクセルに対応することができる。隣接ピクセルの組は、ピクセルの直ぐ隣(例えば、真上、真下、真横)のみのものを含むことができ、又は、ピクセルに対角の隣接するものを含むことができる。動き補償ユニット44は、遷移領域内のピクセルのためのスムージングプロセスを開始することができる。
遷移領域内のピクセルは、定義上、ブロックの両方の幾何学的動き区画内の隣接物を含む。従って、スムージングは、ブロックの両方の区画からの値を用いて遷移領域内のピクセルに関する予測値を計算することによって2つの区画間で生じる(156)。幾つかの例では、遷移領域内のピクセルのスムージングは、各区画からの遷移領域内の共配置されたピクセルに関する値の加重和を計算することによって生じる。
幾つかの例では、遷移領域内でのピクセルのスムージングは、遷移領域内のピクセルの周囲のピクセルの値の平均を求めて遷移領域内のピクセルのための予測値を計算することによって生じ、それは、各区画内の隣接ピクセルを含む。従って、動き補償ユニット44は、係数として割り当てられている重みを有するフィルタをフィルタリングされるべきピクセル及び隣接ピクセルに適用することによって遷移領域内のピクセルに関する予測値を計算することができる。動き補償ユニット44は、次に、フィルタリングされたピクセルに関する予測値を生成するためにこれらの値の各々を加算して重みの和によって除することによってこれらの値の平均を求めることができる。
動き補償ユニット44は、同様の方法で遷移領域内のピクセルの各々に関する予測値を計算することができる。次に、映像符号化器20は、例えば加算器50を用いて、原ブロックから予測値を減じる(158)ことによってブロックに関する残差値を計算することができる。以下においてさらに詳細に説明されるように、映像符号化器20は、ブロックに関する残差を、変換ユニット52によって変換されるべき様々なサイズのサブブロックに分割することができる。サブブロックに適用される遷移のサイズは、幾何学的分割線が区画内を通るかどうかに基づいて好適に決定することができる。映像符号化器20は、計算された残差も出力することができる。出力することは、ネットワークを通じて送信すること、放送すること、コンピュータによって読み取り可能な媒体に格納すること、又はその他の方法でデータを出力することを含むことができる。
図7の方法は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割することと、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算することと、遷移領域内のピクセルの予測値に基づいてブロックの遷移領域内のピクセルの残差値を計算することと、ピクセルの残差値を出力することと、を含む方法として要約することができる。
映像復号器30によって同様の方法を実行することができる。該方法は、符号化された映像データのブロック、符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及びブロックの遷移領域内のピクセルに関する残差値を受信することと、第1の区画からの少なくとも1つの隣接ピクセルに関する値及び第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いてブロックの遷移領域内のピクセルの予測値を計算することと、予測値及び残差値に基づいてブロックの遷移領域内のピクセルに関する再構築された値を計算することと、ピクセルの再構築された値を出力することと、を含むことができる。
図8は、適応型変換サイズ選択を用いて変換されるべきブロック例170を示した概念図である。ブロック170は、幾何学的動き区画線172を用いて分割されている。図8の例では、ブロック170は、16×16ピクセルのブロックである。変換ユニット52(図2)は、異なる変換を用いてブロック170のサブブロックを変換するために異なるサイズの様々な変換を用いて構成することができる。映像符号化器20は、最初にブロック170を4つの8×8ブロック174A乃至174D(8×8ブロック174)に分割することができ、ここで、Trは、変換サイズを示す“変換”を意味する。
8×8ブロック174の各々に関して、映像符号化器20は、幾何学的動き分割線172が8×8ブロック内を通るかどうかを決定することができる。そうである場合は、映像符号化器20は、8×8ブロックを4×4ブロックにさらに分割することができる。そうでない場合は、映像符号化器20は、8×8変換を用いて8×8ブロックを変換することができる。
図8の例では、幾何学的動き分割線172は、8×8ブロック174B、174C、及び174D内を通る。従って、8×8ブロック174B、174C、及び174Dは、重なり合わない4×4ブロックにさらに分割される。従って、この例では、8×8ブロック174B、174C、及び174Dの4×4サブブロックは、4×4変換を用いて変換される。映像符号化器20は、4×4の最小変換サイズを用いて構成することができ、従って、4×4ブロックをそれ以上分割することはできない。しかしながら、最小変換サイズは、4×4である必要はなく、代わりに2×2であることができ、又は、映像符号化器20は、最小変換サイズを用いて構成されないことがある。幾つかの例では、最小変換サイズは、4×4よりも大きいことができる。この例では、幾何学的動き分割線172は、8×8ブロック174A内を通らず、従って、8×8ブロック174Aには8×8変換が適用される。
図9は、適応型変換サイズ選択を用いて変換されるべき他のブロック例180の概念図である。この例では、ブロック180は、幾何学的動き分割線182によって分割されている32×32ブロックを備える。最初に、映像符号化器20は、ブロック180を4つの16×16ブロック184A乃至184D(16×16ブロック184)に分割することができる。映像符号化器20は、次に、幾何学的動き分割線182が16×16ブロック184のうちのいずれかを通るかどうかを決定することができる。
この例では、幾何学的動き分割線182は、16×16ブロック184A内を通らない。従って、映像符号化器20は、16×16区画を用いて16×16区画184Aを変換することができる。幾何学的動き分割線182は、16×16ブロック184B、184C、及び184D内を通るため、映像符号化器20は、図9に示されるように16×16ブロック184B、184C、及び184Dを8×8ブロックにさらに分割することができる。映像符号化器20は、図9の例において再度示されるように、幾何学的動き分割線182が通る8×8ブロックの各々を4×4ブロックにさらに分割することができる。この例では、16×16ブロック184Bのうちの1つの8×8ブロックが4×4ブロックにさらに分割され、16×16ブロック184Cのうちの1つの8×8ブロックが4×4ブロックにさらに分割され、16×16ブロック184Dの8×8ブロックのうちの3つが4×4ブロックにさらに分割される。例を目的として、映像符号化器20は、4×4の最小変換サイズを用いて構成されると仮定されている。
映像符号化器20は、8×8変換サイズを用いて分割されなかった8×8ブロックを変換し、4×4変換サイズを用いて4×4ブロックの各々を変換することができる。映像符号化器20は、16×16変換を用いて16×16ブロック184Aを変換することができる。この方法で、映像符号化器20は、ブロック180のサブブロックが幾何学的動き分割線182に接するかどうかに基づいてそれらのサブブロックのための変換サイズを好適に決定することができる。
図10は、N×Nブロックのサブブロックのための変換サイズを決定するための方法例を示したフローチャートである。例を目的として映像符号化器20に関して説明されるが、図10の方法は、あらゆるその他の処理ユニットによって実行可能であることが理解されるべきである。例えば、図10の方法は、例えば、N×Nブロックのサブブロックを逆変換するために、それらのサブブロックのための変換サイズを決定するために映像復号器30によって適用することもできる。
最初に、映像符号化器20は、N×Nブロックを受信する(200)。N×Nブロックは、分割されている完全なブロック又はそのサブブロックであることができる。映像符号化器20は、幾何学的動き分割線がN×Nブロック内を通るかどうかを決定することができる(202)。通らない(202の“いいえ”分岐)である場合は、映像符号化器20は、N×Nブロックを変換するためにN×N変換サイズを用いることができる(204)。
他方、幾何学的動き分割線がN×Nブロック内を通る(202の“はい”分岐)場合は、映像符号化器20は、N×Nブロックを4つの重なり合わない(N/2)×(N/2)ブロックに分割することができる(206)。次に、映像符号化器20は、各々の(N/2)×(N/2)ブロックのための変換サイズを決定することができる(208)。そうするために、映像符号化器20は、各(N/2)×(N/2)ブロックに関して図10の方法の繰り返しの呼び出しを行うことができる。すなわち、映像符号化器20は、幾何学的動き分割線が各(N/2)×(N/2)ブロック内を通るかどうかを決定することができる。それが通らないそれらに関しては、映像符号化器20は、(N/2)×(N/2)変換サイズを用いて変換することができ、それが通るそれらに関しては、映像符号化器20は、4つの(N/4)×(N/4)ブロックにさらに細分割して、図10の方法の繰り返し例を再度使用して、各(N/4)×(N/4)ブロックのための変換サイズを決定することができる。映像符号化器20は、次に、変換されたサブブロックを出力することができる。出力することは、ネットワークを通じて送信すること、放送すること、コンピュータによって読み取り可能な媒体に格納すること、又はその他の方法でデータを出力することを含むことができる。
図10の方法と同様の方法例は、幾何学的動き分割線を用いて映像データのブロックを第1の幾何学的区画及び第2の幾何学的区画に分割することであって、ブロックは、N×Nピクセルを備えることと、映像データブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割することと、(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを符号化することと、を含むことができる。
同様の方法を映像復号器30によって実行することができる。映像復号器によって実行される方法例は、幾何学的動き分割線によって第1の幾何学的区画及び第2の幾何学的区画に分割された符号化された映像データのブロックを受信することであって、ブロックは、N×Nピクセルを備えることと、映像データのブロックを4つの等しいサイズの、重なり合わない(N/2)×(N/2)サブブロックに分割することと、(N/2)×(N/2)よりも小さい変換サイズを用いて幾何学的動き分割線が通るサブブロックのうちの少なくとも1つを逆変換することと、を含むことができる。
以下の擬似コードは、図10の方法の部分的実装例として、(x,y)を開始点とするブロックのための変換サイズを決定するための関数例“determineTransformSize”を提供する。変数傾き及び切片は、ブロックに関する幾何学的動き分割線を定義する傾き値及び切片値である。変数_minTransformは、水平方向及び垂直方向の両方において最小変換サイズにより定義されたグローバル変数、例えば、4である。変数currSizeは、現在の変換サイズであり、それは、幾何学的動き分割されているN×Nブロックのために(N/2)を用いて初期化することができる。
変数startPartitionは、(x,y)におけるブロックの開始ピクセルのための区画に対応し、変数curPartitionは、ブロックの現在のピクセルのための区画を追跡する。値startPartition及びcurPartitionは、cのような条件付き演算子“?”を用いて計算され、“condition?result1:result2”は、“condition”(条件)が真である場合はresult1(結果1)を戻し、そうでない場合は、result2(結果2)を戻す。2つのfor loop(ループ用)は、ブロックのピクセルを通じて繰り返す。いずれかの点で現在のピクセルのための区画が開始ピクセルの区画とマッチしない場合は、幾何学的動き分割線は、ブロック内を通る。これは、for loopを中断させ、繰り返し呼び出しに1/2だけ縮小された現在の変換サイズcurrSizeを有するTransformSizeを決定させる。その他の場合は、ブロックの全ピクセルが同じ区画内にとどまる場合は、ブロックを変換するために変換サイズcurrSizeを用いることができる。
int determine TransformSize(int currSize.int x, int y,int slope,.int intercept){
if(currSize>_minTransform){
int curPartition=0;
int startPartition=((y-slope*x)>intercept)?0:1;
for(int i<x+currSize)&&(curPartition==startPartition;i++)
for(intj=y;((j<y+ currSize)&&(curPartition=startPartition;j ++)
curPartition=((j-slope*i)> intercept) ?0:1;
if(curr Partition== startPartition)
return currSize
else
return determine TransformSize(currSize/2,x,y,slope,intercept);
}
else
return currSize
}
図11は、幾何学的に分割されたブロック220及び隣接するサブブロック228A乃至228F(隣接サブブロック228)を例示したブロック図である。幾何学的動き分割線226は、ブロック220を2つの区画、すなわち、区画222及び区画224に分割する。映像符号化器、例えば映像符号化器20、は、隣接するサブブロック228のうちの各々の1つに関する動きベクトルに関して区画222、224に関する動きベクトルを符号化することができる。すなわち、映像符号化器20は、隣接するサブブロック228のうちのいずれが各々の区画222、224の隣接物としてみなされるかを決定することができる。
区画222の隣接物は、区画224の隣接物とは必ずしもみなされず、同様に、区画224の隣接物は、区画222の隣接物とは必ずしもみなされない。例えば、映像符号化器20は、サブブロック228の各々が区画222の隣接物であると決定することができるが、サブブロック228のうちのいずれも区画224の隣接物ではない。サブブロック228A及び228Eの各々に関して、右境界に位置するピクセルが区画の隣接物である場合は、サブブロックは、その区画の隣接物であるとみなすことができる。サブブロック228B及び228Fの各々に関して、下側境界に位置するピクセルが区画の隣接物である場合にその区画の隣接物であるとみなすことができる。サブブロック228Dは、右下隅のピクセルが区画の隣接物である場合にその区画の隣接物であるとみなすことができる。サブブロック228Cは、左下隅のピクセルが区画の隣接物である場合にその区画の隣接物であるとみなすことができる。他の例では、サブブロックの部分的境界ピクセルが隣接物である場合は、そのサブブロックは、区画の隣接物であるとみなすことができる。
映像符号化器20は、区画のための動き予測子を決定するためにその区画に隣接するとみなされるサブブロック228に関する動きベクトルの中央値を計算することができる。区画に隣接するとみなされるサブブロック228に関する動きベクトルは、候補動き予測子の組と呼ぶこともできる。例を目的として、サブブロック228の各々が区画222に隣接すると決定されたと仮定すると、映像符号化器20は、区画222のための動き予測子を決定するためにサブブロック228の各々に関する動きベクトルの中央値を計算することができる。映像符号化器20は、次に、動きベクトルを符号化するために区画222に関する動きベクトルと区画222のための動き予測子との間の差分を計算することができる。
例を目的として、サブブロック228C、228E、及び228Fが区画224に隣接すると決定されたと仮定すると、映像符号化器20は、区画224のための動き予測子を決定するためにサブブロック228C、228E、及び228Fに関する動きベクトルの中央値を計算することができる。映像符号化器20は、次に、動きベクトルを符号化するために区画224に関する動きベクトルと区画224のための動き予測子との間の差分を計算することができる。
この方法で、映像符号化器又は映像復号器は、サブブロック228A、228B、228C、及び228Dのみから選択する従来の方法よりも大規模な組の候補動き予測子から動き予測子を選択することができる。さらに、映像符号化器又は映像復号器は、他方の区画、例えば、区画224、のための動き予測子から独立して一方の区画、例えば、区画222、のための動き予測子を選択することができる。従って、区画222、224は、同じブロック220の区画であるが、区画222、224のための動き予測子は異なることができる。従って、映像符号化器又は映像復号器は、区画を含有するブロック、すなわち、区画が一部を形成するブロック、ではなく、候補動き予測子に関連するブロックが区画に隣接するかどうかに基づいて区画のための動き予測子を選択することができる。
図12は、映像データのブロックの幾何学的動き区画の動きベクトルを符号化するための方法例を示したフローチャートである。例を目的として映像符号化器20に関して説明されるが、図12の方法は、あらゆるその他の処理ユニットによって実行できることが理解されるべきである。例えば、図12の方法は、幾何学的動き分割されているブロックの符号化された動きベクトルを復号するために映像復号器30によって適用することもできる。
最初に、映像符号化器20は、映像データのブロックを受信することができる(250)。映像符号化器20は、次に、幾何学的動き区画を用いてブロックを分割することができる(252)。映像符号化器20は、次に、第1の幾何学的動き区画のための候補予測子の組を決定することができる(254)。すなわち、映像符号化器20は、ブロックに隣接する一組のサブブロックのうちのいずれが第1の区画にも同様に隣接するとみなされるかを決定することができる。次に、映像符号化器20は、第1の区画に隣接するサブブロックに関する動きベクトルを取り出すことができる。映像符号化器20は、次に、これらの動きベクトルの中央値を計算し、計算された中央値を第1の区画のための動き予測子として用いることができる(256)。映像符号化器20は、次に、第1の区画のための予測子に関して動きベクトルを符号化するために第1の区画に関する動きベクトルと第1の区画のための動き予測子との間の差分を計算することができる(258)。
次に、映像符号化器20は、第2の幾何学的動き区画のための候補予測子の組を決定することができる(260)。すなわち、映像符号化器20は、ブロックに隣接する一組のサブブロックのうちのいずれが第2の区画に隣接するとみなされるかを決定することができる。次に、映像符号化器20は、第2の区画に隣接するサブブロックに関する動きベクトルを取り出すことができる。映像符号化器20は、次に、これらの動きベクトルの中央値を計算し、計算された中央値を第2の区画のための動き予測子として用いることができる(262)。映像符号化器20は、次に、第2の区画のための予測子に関して動きベクトルを符号化するために第2の区画に関する動きベクトルと第2の区画のための動き予測子との間の差分を計算することができる(264)。映像符号化器20は、次に、符号化された動きベクトルを出力することができる。出力することは、ネットワークを通じて送信すること、放送すること、コンピュータによって読み取り可能な媒体に格納すること、又はその他の方法でデータを出力することを含むことができる。
この方法で、映像符号化器20は、各区画のために独立して選択された候補動き予測子を用いて、互いに独立してブロックの幾何学的動き区画に関する動きベクトルを符号化することができる。従って、映像符号化器20は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割することと、第1の区画に関する第1の動きベクトル及び第2の区画に関する第2の動きベクトルを決定することと、第1の区画に隣接するブロックに関する動きベクトルから選択された第1の動き予測子に基づいて第1の動きベクトルを符号化することと、第2の区画に隣接するブロックに関する動きベクトルから選択された第2の動き予測子に基づいて第2の動きベクトルを符号化することであって、第2の区画に隣接するブロックは、第1の区画に隣接するブロックから独立して決定されることと、符号化された第1及び第2の動きベクトルを出力することと、を含む方法を実行することができる。映像符号化器20は、図11に関して説明されるように、従来用いられるよりも大規模な組の動きベクトルから候補動き予測子を選択することもできる。
映像復号器30は、符号化されたブロックに関する符号化された動きベクトルを復号するために同様の方法を利用することができる。動き予測子と動きベクトルとの間の差分を計算するのではなく、映像復号器30は、動きベクトルを復号するために符号化された動きベクトルを受信して符号化された動きベクトルのための値を動き予測子に加えることができる。従って、映像復号器30は、幾何学的動き分割線によって第1の区画及び第2の区画に分割された映像データのブロック、第1の区画に関する第1の符号化された動きベクトル及び第2の区画に関する第2の符号化された動きベクトルを受信することと、第1の区画に隣接するブロックに関する動きベクトルから選択された第1の動き予測子に基づいて第1の符号化された動きベクトルを復号することと、第2の区画に隣接するブロックに関する動きベクトルから選択された第2の動き予測子に基づいて第2の符号化された動きベクトルを復号することであって、第2の区画に隣接するブロックは、第1の区画に隣接するブロックから独立して決定されることと、復号された第1及び第2の動きベクトルを用いてブロックを復号することと、を含む方法を実行することができる。
図13は、固定小数点実装を用いて映像データのブロックを符号化するための方法例を示したフローチャートである。例を目的として、映像符号化器20に関して説明されるが、図13の方法と同様のそれらをその他の処理ユニットによって実行できることが理解されるべきである。例えば、図13の方法と同様のそれは、固定小数点実装において映像データを復号するために映像復号器30によって適用することもできる。
最初に、映像符号化器20は、映像データのブロックを受信することができる(280)。映像符号化器20は、次に、幾何学的動き区画を用いてブロックを分割することができる(282)。映像符号化器20は、幾何学的動き分割線に垂直であり及びブロックの原点から始まる線分の角度θ及び長さρにより、ブロックを分割するために用いられる幾何学的動き分割線を定義することができる。
映像符号化器20は、角度値及び長さ値のためのステップサイズを用いて構成することができ、従って、角度値及び長さ値は、特定のビット数を有する整数によって格納することができる。例として、映像符号化器20は、5ビットの数字内に幾何学的動き分割線を定義する角度値を格納するように構成することができる。角度値は、1のステップサイズ及び0乃至31の範囲を有することができる。従って、角度値の2つの連続するステップ間の差分は、11.25度の差分を表すことができる。長さ値は、ブロックのサイズに依存することができ、及び、0乃至N/2−1の範囲を有する符号付き整数に対応することができ、ここで、Nは、ブロックサイズを表す。例えば、16×16ブロックに関しては、長さ値は、0乃至7の間の符号付き整数に対応することができ、32×32ブロックに関しては、長さ値は、0乃至15の間の符号付き整数に対応することができ、64×64ブロックに関しては、長さ値は、0乃至31の間の符号付き整数に対応することができる。
しかしながら、固定小数点実装を可能にするために、映像符号化器20は、例えば、公式(1)により、幾何学的動き分割線のための傾き及びy切片を計算することができる(284)。映像符号化器20は、傾き及びy切片を整数値として表すことができる。すなわち、符号化器20は、角度値及び長さ値から傾き値及びy切片値を計算し、傾き値及びy切片値に整数値、例えば、65536、を乗じ、次に、計算された傾き値及びy切片値の小数点第一位を四捨五入して整数を求めることができる。映像符号化器20は、その結果得られた傾き値及びy切片値を、適切なサイズのビットベクトル、例えば、32ビット整数値、として格納することができる。
映像符号化器20は、次に、傾き値及びy切片値を用いてブロックのためのマスクを計算することができる(286)。すなわち、映像符号化器20は、ブロックの各点を通じて繰り返し、その点が領域0にあるか又は領域1にあるかを決定することができる(例えば、図11の例では区画222又は区画224)。映像符号化器20は、ブロックを符号化するときにマスクを参照すること、すなわち、マスクに基づいてブロックを符号化することができる(288)。例えば、映像符号化器20は、ブロックに関する残差を計算するために、ブロックの各区画の境界を決定することができる。すなわち、映像符号化器20は、第1の区画と関連付けられた動きベクトル又は第2の区画と関連付けられた動きベクトルを用いてブロックのピクセルのための値を取り出すかどうかを決定するためにマスクを参照することができる。
映像符号化器20は、これらの動きベクトルを用いてピクセルのための値を取り出し、これらの値と符号化されるべきブロックとの間の差分を計算することによってブロックに関する残差を計算することができる。この方法で、映像符号化器20は、マスクを用いてブロック内のピクセルが第1の区画に対応するか又は第2の区画に対応するかを決定し、第1の区画に関する動きベクトルによって示された基準ブロックから第1の区画内のピクセルに関する予測値を取り出し、及び、第2の区画に関する動きベクトルによって示された基準ブロックから第2の区画内のピクセルに関する予測値を取り出すことができる。
幾つかの例では、映像符号化器20は、本開示において説明されるスムージング技法を用いて区画間の遷移をスムージングすることができる。すなわち、映像符号化器20は、遷移領域内のブロックのピクセルの組を決定し、第1の区画に関する動きベクトルによって示される基準ブロック及び第2の区画に関する動きベクトルによって示される基準ブロックに基づいて遷移領域内のピクセルの組に関する予測値を計算することができる。
映像符号化器20は、次に、符号化されたブロック、及び幾何学的動き分割線を定義する傾き値及びy切片値を出力することができる(290)。出力することは、ネットワークを通じて送信すること、放送すること、コンピュータによって読み取り可能な媒体に格納すること、又はその他の方法でデータを出力することを含むことができる。映像符号化器20は、本開示の技法を用いて区画に関する動きベクトルをさらに符号化することができ、及び、残差のサブブロックを変換するときに本開示の適応型変換サイズ選択技法を適用することができる。
この方法で、映像符号化器、例えば映像符号化器20、によって実行することができる図13の方法に対応する方法例は、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割することと、幾何学的動き分割線の傾き値及びy切片値を計算することであって、傾き値及びy切片値は、整数値を備えることと、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算することと、マスクに基づいて第1の区画及び第2の区画を符号化することと、符号化された第1の区画、符号化された第2の区画、傾き値、及びy切片値を出力することと、を含むことができる。
映像復号器、例えば、映像復号器30、は、映像データを復号するための同様の方法を実行することができる。映像データを復号する方法例は、幾何学的動き分割線によって第1の区画及び第2の区画に分割されている符号化された映像データのブロックを受信することと、幾何学的動き分割線を定義する傾き値及びy切片値を受信することであって、傾き値及びy切片値は、整数値を備えることと、第1の区画内のブロックのピクセル及び第2の区画内のブロックのピクセルを示すマスクを計算することと、マスクに基づいてブロックの第1の区画及び第2の区画を復号することと、復号されたブロックを出力することと、を含むことができる。
1つ以上の例において、説明される機能は、ハードウェア、ソフトウェア、ファームウェア、又はそれらのあらゆる組み合わせ内に実装することができる。ソフトウェア内に実装される場合は、それらの機能は、コンピュータによって読み取り可能な媒体において1つ以上の命令又はコードとして格納又は送信すること及びハードウェアに基づく処理ユニットによって実行することができる。コンピュータによって読み取り可能な媒体は、コンピュータによって読み取り可能な記憶媒体を含むことができ、それは、有形な媒体、例えば、データ記憶媒体、又は、例えば通信プロトコルによる1つの場所から他へのコンピュータプログラムの転送を容易にするあらゆる媒体を含む通信媒体、に対応する。この方法で、コンピュータによって読み取り可能な媒体は、概して、(1)非一時的である有形なコンピュータによって読み取り可能な記憶媒体又は(2)信号又は搬送波、等の通信媒体に対応することができる。データ記憶媒体は、本開示において説明される技法の実装のための命令、コード及び/又はデータ構造を取り出すために1つ以上のコンピュータ又は1つ以上のプロセッサによってアクセスすることができるあらゆる利用可能な媒体であることができる。コンピュータプログラム製品は、コンピュータによって読み取り可能な媒体を含むことができる。
例として、及び制限することなしに、該コンピュータによって読み取り可能な記憶媒体は、RAM、ROM、EEPROM、CD−ROM又はその他の光学ディスク記憶装置、磁気ディスク記憶装置、又はその他の磁気記憶デバイス、フラッシュメモリ、又は、希望されるプログラムコードを命令又はデータ構造の形態で格納するために使用することができ及びコンピュータによってアクセスすることができるあらゆるその他の媒体を備えることができる。さらに、いずれの接続もコンピュータによって読み取り可能な媒体であると適切に呼ばれる。例えば、命令が、同軸ケーブル、光ファイバケーブル、より対線、デジタル加入者ライン(DSL)、又は無線技術、例えば、赤外線、無線、及びマイクロ波、を用いてウェブサイト、サーバ、又はその他の遠隔ソースから送信される場合は、該同軸ケーブル、光ファイバケーブル、より対線、DSL、又は無線技術、例えば赤外線、無線、及びマイクロ波、は、媒体の定義の中に含まれる。しかしながら、コンピュータによって読み取り可能な記憶媒体及びデータ記憶媒体は、接続、搬送波、信号、又はその他の過渡的媒体は含まず、非過渡的な有形の記憶媒体が代わりに対象となることが理解されるべきである。ここにおいて用いられるときのディスク(disk及びdisc)は、コンパクトディスク(CD)(disc)と、レーザディスク(登録商標)(disc)と、光ディスク(disc)と、デジタルバーサタイルディスク(DVD)(disc)と、フロッピー(登録商標)ディスク(disk)と、ブルーレイディスク(disc)と、を含み、ここで、diskは通常は磁気的にデータを複製し、discは、レーザを用いて光学的にデータを複製する。上記の組合せも、コンピュータによって読み取り可能な媒体の適用範囲に含めるべきである。
命令は、1つ以上のプロセッサ、例えば、1つ以上のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルロジックアレイ(FPGA)、又はその他の同等の集積回路又は個別論理回路、によって実行することができる。従って、用語“プロセッサ”は、ここにおいて用いられる場合は、上記の構造又はここにおいて説明される技法の実装に適したあらゆるその他の構造のうちのいずれかを意味することができる。さらに、幾つかの態様では、ここにおいて説明される機能は、符号化及び復号のために構成されるか又は結合されたコーデック内に組み入れられた専用ハードウェア及び/又はソフトウェアモジュール内において提供することができる。さらに、それらの技法は、1つ以上の回路又は論理素子内において完全に実装可能である。
本開示の技法は、無線ハンドセット、集積回路(IC)又はICの組(例えば、チップセット)を含む非常に様々なデバイス又は装置内に実装することができる。本開示では、開示された技法を実行するように構成されたデバイスの機能上の態様を強調するために様々なコンポーネント、モジュール、又はユニットが説明されるが、異なるハードウェアユニットによる実現は必ずしも要求しない。むしろ、上述されるように、様々なユニットを、適切なソフトウェア及び/又はファームウェアと関係させて、コーデックハードウェアユニット内に結合すること又は上述される1つ以上のプロセッサを含む相互運用可能なハードウェアユニットの集合によって提供することができる。
様々な例が説明されている。これらの及びその他の例は、次の請求項の適用範囲内にある。
様々な例が説明されている。これらの及びその他の例は、次の請求項の適用範囲内にある。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[C1]
映像データを符号化するための方法であって、
幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割することと、
前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの遷移領域内のピクセルの予測値を計算することと、
前記遷移領域内の前記ピクセルの前記予測値に基づいて前記ブロックの前記遷移領域内の前記ピクセルの残差値を計算することと、
前記ピクセルの前記残差値を出力することと、を備える、方法。
[C2]
前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通るC1に記載の方法。
[C3]
前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線は、角度値及び長さ値によって定義され、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備えるC1に記載の方法。
[C4]
前記角度値及び前記長さ値に基づいて前記幾何学的動き分割線の傾き値及びy切片値を計算することをさらに備え、前記傾き値及びy切片値は、整数値を備えるC3に記載の方法。
[C5]
前記幾何学的動き分割線のための前記角度値及び前記長さ値を出力することをさらに備えるC3に記載の方法。
[C6]
前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算することは、
前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算することと、
前記積の前記和を計算することと、
前記積の前記和を前記係数の前記和によって除することと、を備えるC1に記載の方法。
[C7]
映像データを符号化するための装置であって、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの遷移領域内のピクセルの予測値を計算し、前記ブロックの前記遷移領域内の前記ピクセルの前記予測値に基づいて前記遷移領域内の前記ピクセルの残差値を計算し、及び前記ピクセルの前記残差値を出力するように構成された映像符号化器を備える、装置。
[C8]
前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通るC7に記載の装置。
[C9]
前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線は、角度値及び長さ値によって定義され、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備えるC7に記載の装置。
[C10]
前記映像符号化器は、前記角度値及び前記長さ値に基づいて前記幾何学的動き分割線の傾き値及びy切片値を計算するように構成され、前記傾き値及びy切片値は、整数値を備えるC9に記載の装置。
[C11]
前記映像符号化器は、前記幾何学的動き分割線のための前記角度値及び前記長さ値を出力するように構成されるC9に記載の装置。
[C12]
前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算するために、前記映像符号化器は、前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算し、前記積の前記和を計算し、及び前記積の前記和を前記係数の前記和によって除するように構成されるC7に記載の装置。
[C13]
映像データを符号化するための装置であって、
幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割するための手段と、
前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの遷移領域内のピクセルの予測値を計算するための手段と、
前記ブロックの前記遷移領域内の前記ピクセルの前記予測値に基づいて前記遷移領域内の前記ピクセルの残差値を計算するための手段と、
前記ピクセルの前記残差値を出力するための手段と、を備える、装置。
[C14]
前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通るC13に記載の装置。
[C15]
前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線は、角度値及び長さ値によって定義され、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備えるC13に記載の装置。
[C16]
前記角度値及び前記長さ値に基づいて前記幾何学的動き分割線の傾き値及びy切片値を計算するための手段をさらに備え、前記傾き値及び前記y切片値は、整数値を備えるC15に記載の装置。
[C17]
前記幾何学的動き分割線のための前記角度値及び前記長さ値を出力するための手段をさらに備えるC15に記載の装置。
[C18]
前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算するための前記手段は、
前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算するための手段と、
前記積の前記和を計算するための手段と、
前記積の前記和を前記係数の前記和によって除するための手段と、を備えるC13に記載の装置。
[C19]
実行されたときに、
幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、
前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの遷移領域内のピクセルの予測値を計算し、
前記ブロックの前記遷移領域内の前記ピクセルの前記予測値に基づいて前記遷移領域内の前記ピクセルの残差値を計算し、及び
前記ピクセルの前記残差値を出力することをプロセッサに行わせる命令を格納しているコンピュータによって読み取り可能な記憶媒体、を備える、コンピュータプログラム製品。
[C20]
前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通るC19に記載のコンピュータプログラム製品。
[C21]
前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線は、角度値及び長さ値によって定義され、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備えるC19に記載のコンピュータプログラム製品。
[C22]
前記角度値及び前記長さ値に基づいて前記幾何学的動き分割線の傾き値及びy切片値を計算することを前記コンピュータに行わせる命令をさらに備え、前記傾き値及び前記y切片値は、整数値を備えるC21に記載のコンピュータプログラム製品。
[C23]
前記幾何学的動き分割線のための前記角度値及び前記長さ値を出力することを前記プロセッサに行わせる命令をさらに備えるC21に記載のコンピュータプログラム製品。
[C24]
前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算することを前記プロセッサに行わせる前記命令は、
前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算し、
前記積の前記和を計算し、及び
前記積の前記和を前記係数の前記和によって除することを前記プロセッサに行わせる命令を備えるC19に記載のコンピュータプログラム製品。
[C25]
映像データを復号する方法であって、
符号化された映像データのブロック、前記符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及び前記ブロックの遷移領域内のピクセルに関する残差値を受信することと、
前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの前記遷移領域内の前記ピクセルの予測値を計算することと、
前記予測値及び前記残差値に基づいて前記ブロックの前記遷移領域内の前記ピクセルに関する再構築された値を計算することと、
前記ピクセルの前記再構築された値を出力することと、を備える、方法。
[C26]
前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通るC25に記載の方法。
[C27]
前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線の前記定義を受信することは、角度値及び長さ値を受信することを備え、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備えるC25に記載の方法。
[C28]
前記幾何学的動き分割線の前記定義を受信することは、前記幾何学的動き分割線の傾き値及びy切片値を受信することを備え、前記傾き値及び前記y切片値は、整数値を備えるC25に記載の方法。
[C29]
前記予測値を計算することは、
前記第1の区画内の前記ブロックのピクセル及び前記第2の区画内の前記ブロックのピクセルを示すマスクを計算することと、
前記固定小数点算術を用いて前記マスクに基づいて前記第1の区画内の前記少なくとも1つの隣接ピクセル及び前記第2の区画内の前記少なくとも1つの隣接ピクセルの位置を見つけ出すことと、を備えるC28に記載の方法。
[C30]
前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算することは、
前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算することと、
前記積の前記和を計算することと、
前記積の前記和を前記係数の前記和によって除することと、を備えるC25に記載の方法。
[C31]
映像データを復号するための装置であって、符号化された映像データのブロック、前記符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及び前記ブロックの遷移領域内のピクセルに関する残差値を受信し、前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの前記遷移領域内の前記ピクセルの予測値を計算し、前記予測値及び前記残差値に基づいて前記ブロックの前記遷移領域内の前記ピクセルに関する再構築された値を計算し、及び前記ピクセルの前記再構築された値を出力するように構成された映像復号器を備える、装置。
[C32]
前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通るC31に記載の装置。
[C33]
前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線の前記定義は、角度値と長さ値とを備え、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備えるC31に記載の装置。
[C34]
前記幾何学的動き分割線の前記定義は、前記幾何学的動き分割線の傾き値及びy切片値を備え、前記傾き値及び前記y切片値は、整数値を備えるC31に記載の装置。
[C35]
前記予測値を計算するために、前記映像復号器は、前記第1の区画内の前記ブロックのピクセル及び前記第2の区画内の前記ブロックのピクセルを示すマスクを計算し、及び固定小数点算術を用いて前記マスクに基づいて前記第1の区画内の前記少なくとも1つの隣接ピクセル及び前記第2の区画内の前記少なくとも1つの隣接ピクセルの位置を見つけ出すように構成されるC34に記載の装置。
[C36]
前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算するために、前記映像復号器は、前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算し、前記積の前記和を計算し、及び前記積の前記和を前記係数の前記和によって除するように構成されるC31に記載の装置。
[C37]
映像データを復号するための装置であって、
符号化された映像データのブロック、前記符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及び前記ブロックの遷移領域内のピクセルに関する残差値を受信するための手段と、
前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの前記遷移領域内の前記ピクセルの予測値を計算するための手段と、
前記予測値及び前記残差値に基づいて前記ブロックの前記遷移領域内の前記ピクセルに関する再構築された値を計算するための手段と、
前記ピクセルの前記再構築された値を出力するための手段と、を備える、装置。
[C38]
前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通るC37に記載の装置。
[C39]
前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線の前記定義を受信するための前記手段は、角度値及び長さ値を受信するための手段を備え、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備えるC37に記載の装置。
[C40]
前記幾何学的動き分割線の前記定義を受信するための前記手段は、前記幾何学的動き分割線の傾き値及びy切片値を受信するための手段を備え、前記傾き値及び前記y切片値は、整数値を備えるC37に記載の装置。
[C41]
前記予測値を計算するための前記手段は、
前記第1の区画内の前記ブロックのピクセル及び前記第2の区画内の前記ブロックのピクセルを示すマスクを計算するための手段と、
前記固定小数点算術を用いて前記マスクに基づいて前記第1の区画内の前記少なくとも1つの隣接ピクセル及び前記第2の区画内の前記少なくとも1つの隣接ピクセルの位置を見つけ出すための手段と、を備えるC40に記載の装置。
[C42]
前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算するための前記手段は、
前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算するための手段と、
前記積の前記和を計算するための手段と、
前記積の前記和を前記係数の前記和によって除するための手段と、を備えるC37に記載の装置。
[C43]
実行されたときに、
符号化された映像データのブロック、前記符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及び前記ブロックの遷移領域内のピクセルに関する残差値を受信し、
前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの前記遷移領域内の前記ピクセルの予測値を計算し、
前記予測値及び前記残差値に基づいて前記ブロックの前記遷移領域内の前記ピクセルに関する再構築された値を計算し、及び
前記ピクセルの前記再構築された値を出力することをプロセッサに行わせる命令を格納しているコンピュータによって読み取り可能な記憶媒体、を備える、コンピュータプログラム製品。
[C44]
前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通るC43に記載のコンピュータプログラム製品。
[C45]
前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線の前記定義を前記プロセッサに行わせる前記命令は、角度値及び長さ値を受信することを前記プロセッサに行わせる命令を備え、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備えるC43に記載のコンピュータプログラム製品。
[C46]
前記幾何学的動き分割線の前記定義を受信することを前記プロセッサに行わせる前記命令は、前記幾何学的動き分割線の傾き値及びy切片値を受信することを前記プロセッサに行わせる命令を備え、前記傾き値及び前記y切片値は、整数値を備えるC43に記載のコンピュータプログラム製品。
[C47]
前記予測値を計算することを前記プロセッサに行わせる前記命令は、
前記第1の区画内の前記ブロックのピクセル及び前記第2の区画内の前記ブロックのピクセルを示すマスクを計算し、及び
固定小数点算術を用いて前記マスクに基づいて前記第1の区画内の前記少なくとも1つの隣接ピクセル及び前記第2の区画内の前記少なくとも1つの隣接ピクセルの位置を見つけ出すことを前記プロセッサに行わせる命令を備えるC46に記載のコンピュータプログラム製品。
[C48]
前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算することを前記プロセッサに行わせる前記命令は、
前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算し、
前記積の前記和を計算し、及び
前記積の前記和を前記係数の前記和によって除することを前記プロセッサに行わせる命令を備えるC43に記載のコンピュータプログラム製品。

Claims (48)

  1. 映像データを符号化するための方法であって、
    幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割することと、
    前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの遷移領域内のピクセルの予測値を計算することと、
    前記遷移領域内の前記ピクセルの前記予測値に基づいて前記ブロックの前記遷移領域内の前記ピクセルの残差値を計算することと、
    前記ピクセルの前記残差値を出力することと、を備える、方法。
  2. 前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通る請求項1に記載の方法。
  3. 前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線は、角度値及び長さ値によって定義され、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備える請求項1に記載の方法。
  4. 前記角度値及び前記長さ値に基づいて前記幾何学的動き分割線の傾き値及びy切片値を計算することをさらに備え、前記傾き値及びy切片値は、整数値を備える請求項3に記載の方法。
  5. 前記幾何学的動き分割線のための前記角度値及び前記長さ値を出力することをさらに備える請求項3に記載の方法。
  6. 前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算することは、
    前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算することと、
    前記積の前記和を計算することと、
    前記積の前記和を前記係数の前記和によって除することと、を備える請求項1に記載の方法。
  7. 映像データを符号化するための装置であって、幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの遷移領域内のピクセルの予測値を計算し、前記ブロックの前記遷移領域内の前記ピクセルの前記予測値に基づいて前記遷移領域内の前記ピクセルの残差値を計算し、及び前記ピクセルの前記残差値を出力するように構成された映像符号化器を備える、装置。
  8. 前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通る請求項7に記載の装置。
  9. 前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線は、角度値及び長さ値によって定義され、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備える請求項7に記載の装置。
  10. 前記映像符号化器は、前記角度値及び前記長さ値に基づいて前記幾何学的動き分割線の傾き値及びy切片値を計算するように構成され、前記傾き値及びy切片値は、整数値を備える請求項9に記載の装置。
  11. 前記映像符号化器は、前記幾何学的動き分割線のための前記角度値及び前記長さ値を出力するように構成される請求項9に記載の装置。
  12. 前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算するために、前記映像符号化器は、前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算し、前記積の前記和を計算し、及び前記積の前記和を前記係数の前記和によって除するように構成される請求項7に記載の装置。
  13. 映像データを符号化するための装置であって、
    幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割するための手段と、
    前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの遷移領域内のピクセルの予測値を計算するための手段と、
    前記ブロックの前記遷移領域内の前記ピクセルの前記予測値に基づいて前記遷移領域内の前記ピクセルの残差値を計算するための手段と、
    前記ピクセルの前記残差値を出力するための手段と、を備える、装置。
  14. 前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通る請求項13に記載の装置。
  15. 前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線は、角度値及び長さ値によって定義され、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備える請求項13に記載の装置。
  16. 前記角度値及び前記長さ値に基づいて前記幾何学的動き分割線の傾き値及びy切片値を計算するための手段をさらに備え、前記傾き値及び前記y切片値は、整数値を備える請求項15に記載の装置。
  17. 前記幾何学的動き分割線のための前記角度値及び前記長さ値を出力するための手段をさらに備える請求項15に記載の装置。
  18. 前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算するための前記手段は、
    前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算するための手段と、
    前記積の前記和を計算するための手段と、
    前記積の前記和を前記係数の前記和によって除するための手段と、を備える請求項13に記載の装置。
  19. 実行されたときに、
    幾何学的動き分割線を用いて映像データのブロックを第1の区画及び第2の区画に分割し、
    前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの遷移領域内のピクセルの予測値を計算し、
    前記ブロックの前記遷移領域内の前記ピクセルの前記予測値に基づいて前記遷移領域内の前記ピクセルの残差値を計算し、及び
    前記ピクセルの前記残差値を出力することをプロセッサに行わせる命令を格納しているコンピュータによって読み取り可能な記憶媒体、を備える、コンピュータプログラム製品。
  20. 前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通る請求項19に記載のコンピュータプログラム製品。
  21. 前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線は、角度値及び長さ値によって定義され、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備える請求項19に記載のコンピュータプログラム製品。
  22. 前記角度値及び前記長さ値に基づいて前記幾何学的動き分割線の傾き値及びy切片値を計算することを前記コンピュータに行わせる命令をさらに備え、前記傾き値及び前記y切片値は、整数値を備える請求項21に記載のコンピュータプログラム製品。
  23. 前記幾何学的動き分割線のための前記角度値及び前記長さ値を出力することを前記プロセッサに行わせる命令をさらに備える請求項21に記載のコンピュータプログラム製品。
  24. 前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算することを前記プロセッサに行わせる前記命令は、
    前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算し、
    前記積の前記和を計算し、及び
    前記積の前記和を前記係数の前記和によって除することを前記プロセッサに行わせる命令を備える請求項19に記載のコンピュータプログラム製品。
  25. 映像データを復号する方法であって、
    符号化された映像データのブロック、前記符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及び前記ブロックの遷移領域内のピクセルに関する残差値を受信することと、
    前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの前記遷移領域内の前記ピクセルの予測値を計算することと、
    前記予測値及び前記残差値に基づいて前記ブロックの前記遷移領域内の前記ピクセルに関する再構築された値を計算することと、
    前記ピクセルの前記再構築された値を出力することと、を備える、方法。
  26. 前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通る請求項25に記載の方法。
  27. 前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線の前記定義を受信することは、角度値及び長さ値を受信することを備え、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備える請求項25に記載の方法。
  28. 前記幾何学的動き分割線の前記定義を受信することは、前記幾何学的動き分割線の傾き値及びy切片値を受信することを備え、前記傾き値及び前記y切片値は、整数値を備える請求項25に記載の方法。
  29. 前記予測値を計算することは、
    前記第1の区画内の前記ブロックのピクセル及び前記第2の区画内の前記ブロックのピクセルを示すマスクを計算することと、
    前記固定小数点算術を用いて前記マスクに基づいて前記第1の区画内の前記少なくとも1つの隣接ピクセル及び前記第2の区画内の前記少なくとも1つの隣接ピクセルの位置を見つけ出すことと、を備える請求項28に記載の方法。
  30. 前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算することは、
    前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算することと、
    前記積の前記和を計算することと、
    前記積の前記和を前記係数の前記和によって除することと、を備える請求項25に記載の方法。
  31. 映像データを復号するための装置であって、符号化された映像データのブロック、前記符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及び前記ブロックの遷移領域内のピクセルに関する残差値を受信し、前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの前記遷移領域内の前記ピクセルの予測値を計算し、前記予測値及び前記残差値に基づいて前記ブロックの前記遷移領域内の前記ピクセルに関する再構築された値を計算し、及び前記ピクセルの前記再構築された値を出力するように構成された映像復号器を備える、装置。
  32. 前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通る請求項31に記載の装置。
  33. 前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線の前記定義は、角度値と長さ値とを備え、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備える請求項31に記載の装置。
  34. 前記幾何学的動き分割線の前記定義は、前記幾何学的動き分割線の傾き値及びy切片値を備え、前記傾き値及び前記y切片値は、整数値を備える請求項31に記載の装置。
  35. 前記予測値を計算するために、前記映像復号器は、前記第1の区画内の前記ブロックのピクセル及び前記第2の区画内の前記ブロックのピクセルを示すマスクを計算し、及び固定小数点算術を用いて前記マスクに基づいて前記第1の区画内の前記少なくとも1つの隣接ピクセル及び前記第2の区画内の前記少なくとも1つの隣接ピクセルの位置を見つけ出すように構成される請求項34に記載の装置。
  36. 前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算するために、前記映像復号器は、前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算し、前記積の前記和を計算し、及び前記積の前記和を前記係数の前記和によって除するように構成される請求項31に記載の装置。
  37. 映像データを復号するための装置であって、
    符号化された映像データのブロック、前記符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及び前記ブロックの遷移領域内のピクセルに関する残差値を受信するための手段と、
    前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの前記遷移領域内の前記ピクセルの予測値を計算するための手段と、
    前記予測値及び前記残差値に基づいて前記ブロックの前記遷移領域内の前記ピクセルに関する再構築された値を計算するための手段と、
    前記ピクセルの前記再構築された値を出力するための手段と、を備える、装置。
  38. 前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通る請求項37に記載の装置。
  39. 前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線の前記定義を受信するための前記手段は、角度値及び長さ値を受信するための手段を備え、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び前記原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備える請求項37に記載の装置。
  40. 前記幾何学的動き分割線の前記定義を受信するための前記手段は、前記幾何学的動き分割線の傾き値及びy切片値を受信するための手段を備え、前記傾き値及び前記y切片値は、整数値を備える請求項37に記載の装置。
  41. 前記予測値を計算するための前記手段は、
    前記第1の区画内の前記ブロックのピクセル及び前記第2の区画内の前記ブロックのピクセルを示すマスクを計算するための手段と、
    前記固定小数点算術を用いて前記マスクに基づいて前記第1の区画内の前記少なくとも1つの隣接ピクセル及び前記第2の区画内の前記少なくとも1つの隣接ピクセルの位置を見つけ出すための手段と、を備える請求項40に記載の装置。
  42. 前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算するための前記手段は、
    前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算するための手段と、
    前記積の前記和を計算するための手段と、
    前記積の前記和を前記係数の前記和によって除するための手段と、を備える請求項37に記載の装置。
  43. 実行されたときに、
    符号化された映像データのブロック、前記符号化されたブロックを第1の区画及び第2の区画に分割する幾何学的動き分割線の定義、及び前記ブロックの遷移領域内のピクセルに関する残差値を受信し、
    前記第1の区画からの少なくとも1つの隣接ピクセルに関する値及び前記第2の区画からの少なくとも1つの隣接ピクセルに関する値を適用するフィルタを用いて前記ブロックの前記遷移領域内の前記ピクセルの予測値を計算し、
    前記予測値及び前記残差値に基づいて前記ブロックの前記遷移領域内の前記ピクセルに関する再構築された値を計算し、及び
    前記ピクセルの前記再構築された値を出力することをプロセッサに行わせる命令を格納しているコンピュータによって読み取り可能な記憶媒体、を備える、コンピュータプログラム製品。
  44. 前記幾何学的動き分割線は、前記ブロックの水平境界及び前記ブロックの垂直境界を通る請求項43に記載のコンピュータプログラム製品。
  45. 前記ブロックの原点は、前記ブロックの前記中心を備え、前記幾何学的動き分割線の前記定義を前記プロセッサに行わせる前記命令は、角度値及び長さ値を受信することを前記プロセッサに行わせる命令を備え、前記角度値は、x軸に対する前記幾何学的動き分割線に垂直で及び原点を通る線の角度を備え、前記長さ値は、前記原点から前記垂直線が前記幾何学的動き分割線と交わる点までの距離を備える請求項43に記載のコンピュータプログラム製品。
  46. 前記幾何学的動き分割線の前記定義を受信することを前記プロセッサに行わせる前記命令は、前記幾何学的動き分割線の傾き値及びy切片値を受信することを前記プロセッサに行わせる命令を備え、前記傾き値及び前記y切片値は、整数値を備える請求項43に記載のコンピュータプログラム製品。
  47. 前記予測値を計算することを前記プロセッサに行わせる前記命令は、
    前記第1の区画内の前記ブロックのピクセル及び前記第2の区画内の前記ブロックのピクセルを示すマスクを計算し、及び
    固定小数点算術を用いて前記マスクに基づいて前記第1の区画内の前記少なくとも1つの隣接ピクセル及び前記第2の区画内の前記少なくとも1つの隣接ピクセルの位置を見つけ出すことを前記プロセッサに行わせる命令を備える請求項46に記載のコンピュータプログラム製品。
  48. 前記フィルタは、前記遷移領域内の前記ピクセル上にセンタリングされた係数の行列を備え、前記予測値を計算することを前記プロセッサに行わせる前記命令は、
    前記フィルタの前記係数及び前記係数と共配置されたピクセルの値の積を計算し、
    前記積の前記和を計算し、及び
    前記積の前記和を前記係数の前記和によって除することを前記プロセッサに行わせる命令を備える請求項43に記載のコンピュータプログラム製品。
JP2015023467A 2010-02-18 2015-02-09 幾何学的動き分割の結果生じた重なり合った領域のスムージング Pending JP2015133716A (ja)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US30589210P 2010-02-18 2010-02-18
US61/305,892 2010-02-18
US32324410P 2010-04-12 2010-04-12
US32323310P 2010-04-12 2010-04-12
US61/323,233 2010-04-12
US61/323,244 2010-04-12
US13/013,687 US9020030B2 (en) 2010-02-18 2011-01-25 Smoothing overlapped regions resulting from geometric motion partitioning
US13/013,687 2011-01-25

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012554007A Division JP2013520877A (ja) 2010-02-18 2011-02-16 幾何学的動き分割の結果生じた重なり合った領域のスムージング

Publications (1)

Publication Number Publication Date
JP2015133716A true JP2015133716A (ja) 2015-07-23

Family

ID=44369618

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2012554007A Withdrawn JP2013520877A (ja) 2010-02-18 2011-02-16 幾何学的動き分割の結果生じた重なり合った領域のスムージング
JP2015023467A Pending JP2015133716A (ja) 2010-02-18 2015-02-09 幾何学的動き分割の結果生じた重なり合った領域のスムージング

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2012554007A Withdrawn JP2013520877A (ja) 2010-02-18 2011-02-16 幾何学的動き分割の結果生じた重なり合った領域のスムージング

Country Status (7)

Country Link
US (5) US8879632B2 (ja)
EP (1) EP2537343A2 (ja)
JP (2) JP2013520877A (ja)
KR (1) KR101387276B1 (ja)
CN (1) CN102763415B (ja)
TW (3) TW201204056A (ja)
WO (3) WO2011103213A2 (ja)

Families Citing this family (114)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8824553B2 (en) 2003-05-12 2014-09-02 Google Inc. Video compression method
EP2188978A2 (en) * 2007-09-10 2010-05-26 Nxp B.V. Method and apparatus for line-based motion estimation in video image data
KR101510108B1 (ko) * 2009-08-17 2015-04-10 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US8879632B2 (en) * 2010-02-18 2014-11-04 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning
CN102215396A (zh) 2010-04-09 2011-10-12 华为技术有限公司 一种视频编解码方法和系统
EP2375751A1 (en) * 2010-04-12 2011-10-12 Panasonic Corporation Complexity reduction of edge-detection based spatial interpolation
JP2012023597A (ja) * 2010-07-15 2012-02-02 Sony Corp 画像処理装置及び画像処理方法
US9202289B2 (en) * 2010-09-30 2015-12-01 Electronics And Telecommunications Research Institute Method for coding and decoding target block partition information using information about neighboring blocks
US9380314B2 (en) * 2010-12-20 2016-06-28 Texas Instruments Incorporated Pixel retrieval for frame reconstruction
US9807424B2 (en) * 2011-01-10 2017-10-31 Qualcomm Incorporated Adaptive selection of region size for identification of samples in a transition zone for overlapped block motion compensation
JP5478740B2 (ja) 2011-01-12 2014-04-23 三菱電機株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
CN102884794B (zh) * 2011-03-07 2016-08-10 松下知识产权经营株式会社 运动补偿装置、运动图像编码装置、运动图像解码装置、运动补偿方法、以及集成电路
US8718389B2 (en) * 2011-04-13 2014-05-06 Huawei Technologies Co., Ltd. Image encoding and decoding methods and related devices
EP2521357A1 (de) * 2011-05-06 2012-11-07 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Filterung von kodierten Bildpartitionen
WO2012173745A1 (en) * 2011-06-13 2012-12-20 Dolby Laboratories Licensing Corporation Fused region-based vdr prediction
US9344743B2 (en) * 2011-08-24 2016-05-17 Texas Instruments Incorporated Flexible region based sample adaptive offset (SAO) and adaptive loop filter (ALF)
WO2013033790A1 (en) * 2011-09-09 2013-03-14 Newsouth Innovations Pty Limited A method and apparatus for communicating and recovering motion information
US8964849B2 (en) * 2011-11-01 2015-02-24 Blackberry Limited Multi-level significance maps for encoding and decoding
JP2013102297A (ja) 2011-11-07 2013-05-23 Canon Inc 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム
JP5871628B2 (ja) * 2011-11-07 2016-03-01 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
CA2773990C (en) 2011-11-19 2015-06-30 Research In Motion Limited Multi-level significance map scanning
WO2013089700A1 (en) * 2011-12-14 2013-06-20 Intel Corporation Methods, systems, and computer program products for assessing a macroblock candidate for conversion to a skipped macroblock
US9762904B2 (en) 2011-12-22 2017-09-12 Qualcomm Incorporated Performing motion vector prediction for video coding
US9531990B1 (en) 2012-01-21 2016-12-27 Google Inc. Compound prediction using multiple sources or prediction modes
KR101842551B1 (ko) * 2012-01-26 2018-03-28 한국전자통신연구원 모션 파티션 모드 판정 방법 및 부호화기
US8737824B1 (en) 2012-03-09 2014-05-27 Google Inc. Adaptively encoding a media stream with compound prediction
US8819525B1 (en) 2012-06-14 2014-08-26 Google Inc. Error concealment guided robustness
US9185414B1 (en) 2012-06-29 2015-11-10 Google Inc. Video encoding using variance
US9628790B1 (en) 2013-01-03 2017-04-18 Google Inc. Adaptive composite intra prediction for image and video compression
US9374578B1 (en) 2013-05-23 2016-06-21 Google Inc. Video coding using combined inter and intra predictors
FR3011429A1 (fr) * 2013-09-27 2015-04-03 Orange Codage et decodage video par heritage d'un champ de vecteurs de mouvement
WO2015055245A1 (en) * 2013-10-16 2015-04-23 Huawei Technologies Co., Ltd. A method for determining a corner video part of a partition of a video coding block
US10171834B2 (en) 2013-11-29 2019-01-01 Mediatek Inc. Methods and apparatus for intra picture block copy in video compression
US9609343B1 (en) 2013-12-20 2017-03-28 Google Inc. Video coding using compound prediction
KR101980349B1 (ko) * 2014-03-05 2019-05-20 엘지전자 주식회사 폴리곤 유닛 기반 영상 인코딩/디코딩 방법 및 이를 위한 장치
US10362336B2 (en) 2014-03-25 2019-07-23 Qualcomm Incorporated Palette predictor signaling with run length code for video coding
KR101894512B1 (ko) * 2014-06-26 2018-09-04 후아웨이 테크놀러지 컴퍼니 리미티드 고효율 비디오 코딩 중 깊이 기반 블록 파티셔닝의 제공 방법 및 장치
WO2016074745A1 (en) 2014-11-14 2016-05-19 Huawei Technologies Co., Ltd. Systems and methods for processing a block of a digital image
JP6443869B2 (ja) * 2014-11-14 2018-12-26 ホアウェイ・テクノロジーズ・カンパニー・リミテッド デジタル画像を処理するためのシステムおよび方法
WO2016074746A1 (en) 2014-11-14 2016-05-19 Huawei Technologies Co., Ltd. Systems and methods for mask based processing of a block of a digital image
KR102273670B1 (ko) * 2014-11-28 2021-07-05 삼성전자주식회사 움직임 보상 정보를 수정하는 데이터 처리 시스템과 데이터 처리 방법
WO2016182317A1 (ko) * 2015-05-12 2016-11-17 삼성전자 주식회사 인트라 예측을 수행하는 영상 복호화 방법 및 그 장치 및 인트라 예측을 수행하는 영상 부호화 방법 및 그 장치
US9769499B2 (en) * 2015-08-11 2017-09-19 Google Inc. Super-transform video coding
CN106485318B (zh) * 2015-10-08 2019-08-30 上海兆芯集成电路有限公司 具有混合协处理器/执行单元神经网络单元的处理器
US11412209B2 (en) * 2015-11-20 2022-08-09 Electronics And Telecommunications Research Institute Method and device for encoding/decoding image using geometrically modified picture
US9955176B2 (en) 2015-11-30 2018-04-24 Intel Corporation Efficient and scalable intra video/image coding using wavelets and AVC, modified AVC, VPx, modified VPx, or modified HEVC coding
US10602187B2 (en) 2015-11-30 2020-03-24 Intel Corporation Efficient, compatible, and scalable intra video/image coding using wavelets and HEVC coding
US20170155905A1 (en) * 2015-11-30 2017-06-01 Intel Corporation Efficient intra video/image coding using wavelets and variable size transform coding
US10469841B2 (en) 2016-01-29 2019-11-05 Google Llc Motion vector prediction using prior frame residual
US10306258B2 (en) 2016-01-29 2019-05-28 Google Llc Last frame motion vector partitioning
US11032550B2 (en) * 2016-02-25 2021-06-08 Mediatek Inc. Method and apparatus of video coding
GB2550579A (en) * 2016-05-23 2017-11-29 Sony Corp Image data encoding and decoding
CN109565592B (zh) 2016-06-24 2020-11-17 华为技术有限公司 一种使用基于分割的视频编码块划分的视频编码设备和方法
CN109565595B (zh) 2016-06-24 2021-06-22 华为技术有限公司 一种使用基于分割的视频编码块划分的视频编码设备和方法
WO2018072823A1 (en) * 2016-10-19 2018-04-26 Huawei Technologies Co., Ltd. Apparatuses and methods for encoding and decoding a video coding block of a video signal
CN110115033B (zh) 2016-12-23 2020-09-08 华为技术有限公司 用于有损静止图像编码的混合域协同后滤波器
CN110100437B (zh) * 2016-12-23 2020-09-08 华为技术有限公司 用于有损视频编码的混合域协作环路滤波器
US10715827B2 (en) * 2017-01-06 2020-07-14 Mediatek Inc. Multi-hypotheses merge mode
US10462482B2 (en) * 2017-01-31 2019-10-29 Google Llc Multi-reference compound prediction of a block using a mask mode
WO2018141416A1 (en) 2017-02-06 2018-08-09 Huawei Technologies Co., Ltd. Video encoder and decoder for predictive partitioning
CN116684602A (zh) * 2017-03-31 2023-09-01 松下电器(美国)知识产权公司 图像编码装置及方法、图像解码装置及方法、存储介质
US20190020888A1 (en) * 2017-07-11 2019-01-17 Google Llc Compound intra prediction for video coding
CN111034197B (zh) * 2017-08-22 2022-07-12 松下电器(美国)知识产权公司 图像编码器、图像解码器、图像编码方法和图像解码方法
KR20200038943A (ko) * 2017-08-22 2020-04-14 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 이미지 인코더, 이미지 디코더, 이미지 인코딩 방법 및 이미지 디코딩 방법
CN110999306B (zh) 2017-08-22 2022-09-16 松下电器(美国)知识产权公司 图像编码器和图像解码器
MX2020003656A (es) * 2017-10-02 2020-10-12 Arris Entpr Llc Sistema y método para reducir artefactos de bloque y proporcionar eficiencia de codificación mejorada.
WO2019078581A1 (ko) * 2017-10-16 2019-04-25 디지털인사이트주식회사 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2019124191A1 (ja) * 2017-12-18 2019-06-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
WO2019124193A1 (ja) * 2017-12-18 2019-06-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
WO2019151279A1 (ja) 2018-01-30 2019-08-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
JP7401309B2 (ja) 2018-01-30 2023-12-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
WO2019151297A1 (ja) 2018-01-30 2019-08-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
US11233996B2 (en) * 2018-02-22 2022-01-25 Lg Electronics Inc. Image decoding method and apparatus according to block division structure in image coding system
WO2019229683A1 (en) 2018-05-31 2019-12-05 Beijing Bytedance Network Technology Co., Ltd. Concept of interweaved prediction
US11695967B2 (en) * 2018-06-22 2023-07-04 Op Solutions, Llc Block level geometric partitioning
CN117834908A (zh) * 2018-07-02 2024-04-05 英迪股份有限公司 对视频进行解码的方法和对视频进行编码的方法
JP2021536191A (ja) * 2018-09-07 2021-12-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America ビデオコーディング用システムおよび方法
US11582480B2 (en) * 2018-09-25 2023-02-14 Digitalinsights Inc. Method and device for encoding or decoding image on basis of inter mode
CN111147850B (zh) * 2018-11-02 2022-10-11 北京字节跳动网络技术有限公司 用于基于历史的运动矢量预测的表维护
CN112219400B (zh) * 2018-11-06 2024-03-26 北京字节跳动网络技术有限公司 依赖位置的对运动信息的存储
CN112997489B (zh) * 2018-11-06 2024-02-06 北京字节跳动网络技术有限公司 具有几何分割的帧间预测的边信息信令
CN112997487A (zh) 2018-11-15 2021-06-18 北京字节跳动网络技术有限公司 仿射模式与其他帧间编解码工具之间的协调
CN113170184A (zh) * 2018-11-22 2021-07-23 北京字节跳动网络技术有限公司 默认运动候选的配置方法
WO2020112437A1 (en) * 2018-11-30 2020-06-04 Interdigital Vc Holdings, Inc. Triangle and multi-hypothesis combination for video coding and decoding
KR20200075775A (ko) * 2018-12-18 2020-06-26 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR102494697B1 (ko) * 2018-12-21 2023-02-06 삼성전자주식회사 삼각 예측 모드를 이용하는 영상 부호화 장치 및 영상 복호화 장치, 및 이에 의한 영상 부호화 방법 및 영상 복호화 방법
CN112565785B (zh) * 2018-12-28 2022-04-26 杭州海康威视数字技术股份有限公司 一种编解码方法及其设备
CN113170166B (zh) 2018-12-30 2023-06-09 北京字节跳动网络技术有限公司 具有几何分割的帧间预测在视频处理中有条件的应用
WO2020140948A1 (en) * 2019-01-02 2020-07-09 Beijing Bytedance Network Technology Co., Ltd. Motion vector derivation between dividing patterns
WO2020159982A1 (en) * 2019-01-28 2020-08-06 Op Solutions, Llc Shape adaptive discrete cosine transform for geometric partitioning with an adaptive number of regions
SG11202108103WA (en) 2019-01-28 2021-08-30 Op Solutions Llc Inter prediction in geometric partitioning with an adaptive number of regions
JP7307191B2 (ja) 2019-04-01 2023-07-11 北京字節跳動網絡技術有限公司 履歴に基づく動きベクトル予測のための補間フィルタの使用
CN114097228B (zh) 2019-06-04 2023-12-15 北京字节跳动网络技术有限公司 具有几何分割模式编解码的运动候选列表
US11570442B2 (en) 2019-06-05 2023-01-31 Qualcomm Incorporated Reducing motion field storage for prediction of video data using non-rectangular prediction modes
BR112021025846A2 (pt) * 2019-06-21 2022-02-08 Huawei Tech Co Ltd Derivação de peso de amostra de croma para modo de partição geométrica
KR20230135185A (ko) * 2019-06-21 2023-09-22 후아웨이 테크놀러지 컴퍼니 리미티드 서브 블록 파티셔닝 모드를 위한 인코더, 디코더 및 대응 방법
CN115278227B (zh) * 2019-06-24 2023-08-22 华为技术有限公司 一种由解码设备或编码设备实现的译码方法,编码器和解码器
CN113055689B (zh) * 2019-06-24 2022-11-01 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
KR20220030995A (ko) 2019-07-14 2022-03-11 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩에서 변환 블록 크기 제한
CN114270856A (zh) 2019-08-20 2022-04-01 北京字节跳动网络技术有限公司 视频处理中的备选插值滤波器的选择性使用
CN115118978B (zh) * 2019-08-26 2023-04-11 华为技术有限公司 运动信息存储方法及装置
WO2021037053A1 (en) * 2019-08-27 2021-03-04 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods of cabac coding for the indices of geometric partition flag
US11463693B2 (en) * 2019-08-30 2022-10-04 Qualcomm Incorporated Geometric partition mode with harmonized motion field storage and motion compensation
US20220385888A1 (en) * 2019-09-20 2022-12-01 Electronics And Telecommunications Research Institute Image encoding/decoding method and device, and recording medium storing bitstream
US11405619B2 (en) * 2019-09-23 2022-08-02 Qualcomm Incorporated Geometric partition mode with simplified motion field storage and motion compensation in video coding
CN112204986A (zh) * 2019-09-24 2021-01-08 北京大学 视频编解码的方法和装置
WO2021057996A1 (en) * 2019-09-28 2021-04-01 Beijing Bytedance Network Technology Co., Ltd. Geometric partitioning mode in video coding
MX2022003940A (es) * 2019-10-03 2022-04-25 Huawei Tech Co Ltd Proceso de codificacion para modo de particion geometrica.
KR20210047483A (ko) 2019-10-22 2021-04-30 에스케이하이닉스 주식회사 복수의 촬영 모드를 지원하는 이미지 센서
EP4059217A4 (en) * 2019-11-27 2023-11-29 HFI Innovation Inc. METHOD AND APPARATUS FOR DERIVING UNIFORM WEIGHT AND MOVEMENT INDICES FOR GEOMETRIC FUSION MODE IN VIDEO CODING
CN115176463A (zh) * 2019-12-30 2022-10-11 抖音视界有限公司 具有几何分割的块的运动矢量差
WO2022047099A1 (en) * 2020-08-28 2022-03-03 Op Solutions, Llc Methods and systems of adaptive geometric partitioning
CN112565769B (zh) * 2020-12-02 2022-10-28 浙江大华技术股份有限公司 块划分方法、帧间预测方法、视频编码方法及相关装置
CN113099229B (zh) * 2021-02-22 2022-08-09 浙江大华技术股份有限公司 块划分方法、帧间预测方法、视频编码方法及相关装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002223445A (ja) * 2001-01-26 2002-08-09 Nippon Telegr & Teleph Corp <Ntt> 画像符号化装置と画像復号装置および画像符号化方法と画像復号方法および画像符号化プログラムを記録した記録媒体と画像復号プログラムを記録した記録媒体および画像符号化プログラムと画像復号プログラム
JP2005277968A (ja) * 2004-03-25 2005-10-06 Matsushita Electric Ind Co Ltd 画像符号化方法および画像復号化方法
JP2008054267A (ja) * 2006-07-28 2008-03-06 Hitachi Ltd 画像処理装置、画像符号化装置及び画像復号化装置
US20080101707A1 (en) * 2006-10-30 2008-05-01 Debargha Mukherjee Method for decomposing a video sequence frame
JP2008301336A (ja) * 2007-06-01 2008-12-11 Hitachi Ltd 画像処理装置、画像符号化装置及び画像復号化装置
WO2009051719A2 (en) * 2007-10-16 2009-04-23 Thomson Licensing Methods and apparatus for video encoding and decoding geometically partitioned super blocks
JP2009545920A (ja) * 2006-08-02 2009-12-24 トムソン ライセンシング ビデオ符号化処理のためにアダブティブなジオメトリック分割を行う方法および装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748789A (en) * 1996-10-31 1998-05-05 Microsoft Corporation Transparent block skipping in object-based video coding systems
US6665342B1 (en) 1999-07-02 2003-12-16 International Business Machines Corporation System and method for producing a still image representation of a motion video
GB0016838D0 (en) * 2000-07-07 2000-08-30 Forbidden Technologies Plc Improvements relating to representations of compressed video
KR101108661B1 (ko) * 2002-03-15 2012-01-25 노키아 코포레이션 비디오 시퀀스에서의 움직임 부호화 방법
KR100477649B1 (ko) 2002-06-05 2005-03-23 삼성전자주식회사 다양한 프레임 사이즈를 지원하는 정수 코딩 방법 및 그를적용한 코덱 장치
US6975773B1 (en) * 2002-07-30 2005-12-13 Qualcomm, Incorporated Parameter selection in data compression and decompression
US7095786B1 (en) * 2003-01-11 2006-08-22 Neo Magic Corp. Object tracking using adaptive block-size matching along object boundary and frame-skipping when object motion is low
JP4322920B2 (ja) * 2004-05-17 2009-09-02 三菱電機株式会社 画像符号化装置
JP5046335B2 (ja) * 2004-11-04 2012-10-10 トムソン ライセンシング ビデオ符号器におけるbフレームの高速モード決定のための方法および装置
EP2720466A1 (en) * 2005-09-26 2014-04-16 Mitsubishi Electric Corporation Moving image coding method
US20070133690A1 (en) * 2005-12-13 2007-06-14 Jun Xin Adaptive complexity control for motion estimation during video encoding
JP4949010B2 (ja) 2006-02-06 2012-06-06 パナソニック株式会社 画像復号化方法及び画像復号化装置
US8385424B2 (en) 2006-06-26 2013-02-26 Qualcomm Incorporated Reduction of errors during computation of inverse discrete cosine transform
ZA200901048B (en) * 2006-09-29 2010-05-26 Thomson Licensing Geometric intra prediction
US8019167B2 (en) * 2007-01-03 2011-09-13 Human Monitoring Ltd. Compressing high resolution images in a low resolution video
US20080240242A1 (en) * 2007-03-27 2008-10-02 Nokia Corporation Method and system for motion vector predictions
KR101366093B1 (ko) * 2007-03-28 2014-02-21 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
KR101680951B1 (ko) * 2007-04-12 2016-11-29 톰슨 라이센싱 비디오 인코더에서 고속으로 기하학적 모드를 결정하기 위한 방법들 및 장치
JP2008306413A (ja) 2007-06-06 2008-12-18 Panasonic Corp 画像符号化装置および画像符号化方法
US8437564B2 (en) * 2007-08-07 2013-05-07 Ntt Docomo, Inc. Image and video compression using sparse orthonormal transforms
BRPI0818344A2 (pt) * 2007-10-12 2015-04-22 Thomson Licensing Métodos e aparelhos para codificação e decodificação de vídeo de partições de modo bi-preditivo geometricamente particionadas
US8280181B2 (en) * 2007-12-13 2012-10-02 Seiko Epson Corporation Efficient filtering of image data
WO2009104850A1 (en) 2008-02-20 2009-08-27 Lg Electronics Inc. Method for encoding and decoding image, and apparatus for encoding and decoding image
KR20090099720A (ko) * 2008-03-18 2009-09-23 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
JP2009284275A (ja) 2008-05-23 2009-12-03 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラムおよびそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR101517768B1 (ko) * 2008-07-02 2015-05-06 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5401071B2 (ja) * 2008-10-09 2014-01-29 株式会社Nttドコモ 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、動画像処理システムおよび動画像処理方法
WO2010072946A2 (fr) * 2008-12-22 2010-07-01 France Telecom Prediction d'images par repartionnement d'une portion de zone causale de reference, codage et decodage utilisant une telle prediction
EP3651466A1 (fr) * 2009-07-03 2020-05-13 Orange Prédiction d'un vecteur mouvement d'une partition d'image courante de forme géometrique ou de taille différente de celle d'au moins une partition d'image de référence voisine, codage et decodage utilisant une telle prediction
US9736500B2 (en) * 2009-07-06 2017-08-15 Thomson Licensing Methods and apparatus for spatially varying residue coding
CN101605261A (zh) 2009-07-13 2009-12-16 清华大学 一种用于视频图像分块的方法及装置
WO2011050641A1 (en) * 2009-10-28 2011-05-05 Mediatek Singapore Pte. Ltd. Video coding methods and video encoders and decoders with localized weighted prediction
US8358698B2 (en) * 2010-01-08 2013-01-22 Research In Motion Limited Method and device for motion vector estimation in video transcoding using full-resolution residuals
US8879632B2 (en) * 2010-02-18 2014-11-04 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning
US9667942B2 (en) * 2012-11-20 2017-05-30 Qualcomm Incorporated Adaptive luminance compensation in three dimensional video coding

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002223445A (ja) * 2001-01-26 2002-08-09 Nippon Telegr & Teleph Corp <Ntt> 画像符号化装置と画像復号装置および画像符号化方法と画像復号方法および画像符号化プログラムを記録した記録媒体と画像復号プログラムを記録した記録媒体および画像符号化プログラムと画像復号プログラム
JP2005277968A (ja) * 2004-03-25 2005-10-06 Matsushita Electric Ind Co Ltd 画像符号化方法および画像復号化方法
JP2008054267A (ja) * 2006-07-28 2008-03-06 Hitachi Ltd 画像処理装置、画像符号化装置及び画像復号化装置
JP2009545920A (ja) * 2006-08-02 2009-12-24 トムソン ライセンシング ビデオ符号化処理のためにアダブティブなジオメトリック分割を行う方法および装置
US20080101707A1 (en) * 2006-10-30 2008-05-01 Debargha Mukherjee Method for decomposing a video sequence frame
WO2008054688A1 (en) * 2006-10-30 2008-05-08 Hewlett-Packard Development Company, L.P. Method for decomposing a video sequence frame
JP2008301336A (ja) * 2007-06-01 2008-12-11 Hitachi Ltd 画像処理装置、画像符号化装置及び画像復号化装置
WO2009051719A2 (en) * 2007-10-16 2009-04-23 Thomson Licensing Methods and apparatus for video encoding and decoding geometically partitioned super blocks

Also Published As

Publication number Publication date
KR101387276B1 (ko) 2014-04-29
TW201210346A (en) 2012-03-01
US20110200110A1 (en) 2011-08-18
US20110200109A1 (en) 2011-08-18
JP2013520877A (ja) 2013-06-06
TW201204056A (en) 2012-01-16
CN102763415B (zh) 2015-09-16
US20110200111A1 (en) 2011-08-18
US9020030B2 (en) 2015-04-28
KR20120126106A (ko) 2012-11-20
TW201143456A (en) 2011-12-01
WO2011103210A3 (en) 2012-02-02
US9654776B2 (en) 2017-05-16
EP2537343A2 (en) 2012-12-26
US20110200097A1 (en) 2011-08-18
US10250908B2 (en) 2019-04-02
US8879632B2 (en) 2014-11-04
WO2011103212A2 (en) 2011-08-25
WO2011103213A3 (en) 2012-02-16
WO2011103213A2 (en) 2011-08-25
CN102763415A (zh) 2012-10-31
WO2011103210A2 (en) 2011-08-25
WO2011103212A3 (en) 2012-02-16
US20170201770A1 (en) 2017-07-13

Similar Documents

Publication Publication Date Title
JP2015133716A (ja) 幾何学的動き分割の結果生じた重なり合った領域のスムージング
JP6042470B2 (ja) ビデオコーディングのための適応動き解像度
JP6254136B2 (ja) 統合されたマージモードおよび適応動きベクトル予測モード候補選択
KR101515696B1 (ko) 기하학적 모션 파티셔닝을 위한 고정 소수점 구현
JP5823623B2 (ja) ビデオコーディングのための動きベクトル予測子候補クリッピング削除
JP5778299B2 (ja) 動きベクトル予測
JP5587508B2 (ja) ビデオコード化のためのイントラ平滑化フィルタ
JP5823526B2 (ja) ビデオ符号化のための適応動きベクトル解像度信号伝達
JP5937200B2 (ja) ビデオコーディングのためのブロッキネスアーティファクトのフィルタ処理
JP2019080321A (ja) ビデオコーディングのための適応的な動きベクトル分解シグナリング
JP2018050308A (ja) ビデオコーディングのための動きベクトル予測の実行
KR20200023315A (ko) 모션 벡터 도출을 위한 부분 복원 기반 템플릿 매칭
JP2014143706A (ja) 大型マクロ・ブロックを用いたビデオ・コーディング
MX2014000718A (es) Exploracion de coeficientes en codificacion de video.
JP5937205B2 (ja) ビデオコーディングのためのランモードベース係数コーディング
JP2014525170A (ja) ビデオコード化のための複数領域走査順序

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151117

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160614