JP6640751B2 - ブロックベクトル導出を用いるイントラブロックコピー符号化のための方法およびシステム - Google Patents

ブロックベクトル導出を用いるイントラブロックコピー符号化のための方法およびシステム Download PDF

Info

Publication number
JP6640751B2
JP6640751B2 JP2016574117A JP2016574117A JP6640751B2 JP 6640751 B2 JP6640751 B2 JP 6640751B2 JP 2016574117 A JP2016574117 A JP 2016574117A JP 2016574117 A JP2016574117 A JP 2016574117A JP 6640751 B2 JP6640751 B2 JP 6640751B2
Authority
JP
Japan
Prior art keywords
vector
block
prediction
video
derived
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016574117A
Other languages
English (en)
Other versions
JP2017522803A5 (ja
JP2017522803A (ja
Inventor
ユーウェン ホー
ユーウェン ホー
イエン イエ
イエン イエ
シアオユー シウ
シアオユー シウ
Original Assignee
ヴィド スケール インコーポレイテッド
ヴィド スケール インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヴィド スケール インコーポレイテッド, ヴィド スケール インコーポレイテッド filed Critical ヴィド スケール インコーポレイテッド
Publication of JP2017522803A publication Critical patent/JP2017522803A/ja
Publication of JP2017522803A5 publication Critical patent/JP2017522803A5/ja
Application granted granted Critical
Publication of JP6640751B2 publication Critical patent/JP6640751B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ブロックベクトル導出を用いるイントラブロックコピー符号化(Intra block copy coding)に関する。
本出願は、2014年6月19日に出願された米国仮特許出願第62/014,664号の非仮出願であり、米国特許法第119条(e)に基づく同出願からの利益を主張する。同出願の内容は、その全体が、参照により本明細書に組み込まれる。過去20年にわたって、様々なデジタルビデオ圧縮技術が、効率的なデジタルビデオ通信、配信、および消費を可能にするために、開発され、規格化されてきた。H.261、MPEG−1、MPEG−2 H.263、MPEG−4(part−2)、およびH.264/AVC(MPEG−4 part 10 Advance Video Coding)など、商業的に広く展開されている規格のほとんどは、ISO/IECおよびITU−Tによって開発されている。新しい高度ビデオ圧縮技術が出現および成熟したために、新しいビデオ符号化規格である高効率ビデオ符号化(HEVC)が、ITU−Tビデオコーディングエキスパーツグループ(VCEG)およびISO/IEC MPEGによって共同開発中である。HEVC(ITU−T H.265/ISO/IEC 23008−2)は、2013年前半には国際規格として承認され、現在最新のH.264/AVCよりもかなり高い符号化効率を達成することができる。
スクリーンコンテンツ共有アプリケーションは、リモートデスクトップ、ビデオ会議、およびモバイルメディアプレゼンテーションアプリケーションの普及に伴って、近年ますます人気が高まっている。双方向スクリーンコンテンツ共有システムは、キャプチャラ、エンコーダ、および送信機を含むホストサブシステムと、受信機、デコーダ、およびディスプレイ(レンダラ)を含むクライアントサブシステムとを含むことができる。スクリーンコンテンツ符号化(SCC)については、業界からの様々なアプリケーション要件が存在する。自然なビデオコンテンツと比較した場合、スクリーンコンテンツは、シャープな曲線およびスクリーンコンテンツ内に頻繁に出現するテキストのために、いくつかの主要色および強いエッジを有する多数のブロックをしばしば含む。
ITU−T Q6/16 and ISO/IEC JCT1/SC29/WG11,"Joint Call for Proposals for Coding of Screen Content",MPEG2014/N14175,Jan.2014,San Jose,USA J.Chen,Y.Chen,T.Hsieh,R.Joshi,M.Karczewicz,W.−S.Kim,X.Li,C.Pang,W.Pu,K.Rapaka,J.Sole,L.Zhang,F.Zou,"Description of screen content coding technology proposal by Qualcomm",JCTVC−Q0031,Mar 2014,Valencia,ES C.-C.Chen,T.-S.Chang,R.-L.Liao,C.-W Kuo, W.-H.Peng, H.−M.Hang, Y.-J.Chang,C.-H Hung,C.-C.Lin,J.-S.Tu,E.-C.Ke,J.-Y.Kao,C.-L.Lin,F.-D.Jou,F.-C.Chen,"Description of screen content coding technology proposal by NCTU and ITRI International",JCTVC−Q0032,Mar 2014,Valencia,ES P.Lai,T.-D.Chuang,Y.-C.Sun,X.Xu,J.Ye,S.-T.Hsiang,Y.-W.Chen,K.Zhang,X.Zhang,S.Liu,Y.-W.Huang,S.Lei,"Description of screen content coding technology proposal by MediaTek",JCTVC−Q0033,Mar 2014,Valencia,ES Z.Ma,W.Wang,M.Xu,X.Wang,H.Yu,"Description of screen content coding technology proposal by Huawei Technologies",JCTVC−Q0034,Mar 2014,Valencia,ES B.Li,J.Xu,F.Wu,X.Guo,G.J.Sullivan,"Description of screen content coding technology proposal by Microsoft",JCTVC−Q0035,Mar 2014,Valencia,ES R.Cohen,A.Minezawa,X.Zhang,K.Miyazawa,A.Vetro,S.Sekiguchi,K.Sugimoto,T.Murakami,"Description of screen content coding technology proposal by Mitsubishi Electric Corporation",JCTVC−Q0036,Mar 2014,Valencia,ES X.Xiu,C.−M.Tsai,Y.He,Y.Ye,"Description of screen content coding technology proposal by InterDigital",JCTVC−Q0037,Mar 2014,Valencia,ES T.Lin,S.Wang,P.Zhang,and K.Zhou,"AHG8:P2M based dual−coder extension of HEVC", Document no JCTVC−L0303,Jan.2013 X.Guo,B.Li,J.−Z.Xu,Y.Lu,S.Li,and F.Wu,"AHG8:Major−color−based screen content coding",Document no JCTVC−O0182,Oct.2013 L. GuoM.Karczewicz,J.Sole,and R.Joshi,"Evaluation of Palette Mode Coding on HM−12.0+RExt−4.1",JCTVC−O0218,Oct2013 C.Pang,J.Sole,L.Guo,M.Karczewicz,and R.Joshi,"Non−RCE3:Intra Motion Compensation with 2−D MVs",JCTVC−N0256,July2013 B.Bross,W−J.Han,G.J.Sullivan,J−R.Ohm,T.Wiegand,"High Efficiency Video Coding (HEVC) Text Specification Draft 10",JCTVC−L1003.Jan2013 G.J.Sullivan and T.Wiegand,Rate−distortion optimization for video compression. IEEE Signal Processing Magazine,vol.15,issue 6,November1998 T.Vermeir,"Use cases and requirements for lossless and screen content coding", JCTVC−M0172,Apr.2013,Incheon,KR J.Sole,R.Joshi,M.Karczewicz,"AhG8:Requirements for wireless display applications",JCTVC−M0315,Apr.2013,Incheon,KR D.Flynn,M.Naccari,K.Sharman,C.Rosewarne,J.Sole,G.J.Sullivan,T.Suzuki,"HEVC Range Extension Draft 6",JCTVC−P1005,Jan.2014,San Jose J.Sole,S.Liu,"HEVC Screen Content Coding Core Experiment 1 (SCCE1):Intra Block Copying Extensions",JCTVC−Q 1121,Mar 2014,Valencia C.−C.Chen,X.Xu,L.Zhang,"HEVC Screen Content Coding Core Experiment 2 (SCCE2): Line-based Intra Copy",JCTVC−Q1122,Mar 2014,Valencia Y.-W.Huang, P. Onno,R. Joshi, R. Cohen,X. Xiu, Z. Ma,"HEVC Screen Content Coding Core Experiment 3 (SCCE3):Palette mode",JCTVC−Q1123,Mar.2014,Valencia Y.Chen,J.Xu,"HEVC Screen Content Coding Core Experiment 4(SCCE4): String matching for sample coding",JCTVC−Q1124,Mar 2014,Valencia X.Xiu, J. Chen,"HEVC Screen Content Coding Core Experiment 5:Inter-component prediction and adaptive color transforms", JCTVC−Q1125, Mar 2014,Valencia P.Onno,G.Laroche,T.Poirier,C.Gisquet,"AhG5:On the displacement vector prediction scheme for Intra Block Copy",JCTVC−Q0062,Mar 2014,Valencia X.Zhang,K.Zhang,J.An,H.Huang,S.Lei,"Block vector prediction for intra block copy",JCTVC−Q0080,Mar 2014,Valencia K.Zhang,J.An,X.Zhang,H.Huang,S.Lei,"Symmetric intra block copy",JCTVC−Q0082,Mar 2014,Valencia S.−T.Hsiang,T.−D.Chuang,S.Lei,"AHG8;Coding the prediction differences of the intra BC vectors",JCTVC−Q0095,Mar 2014,Valencia C.Pang,J.Sole,R.JoshiM.Karczewicz,"Block vector prediction method for intra block copy",JCTVC−Q0114,Mar 2014,Valencia L.Zhu,J.Xu,G.J.Sullivan,Y.Wu,S.Sankuratri,B.A.Kumar,"Ping− pong block vector predictor for intra block copy",JCTVC−Q0134,Mar 2014,Valencia B.Li,J.Xu,"Hash−based intraBC search",JCTVC−Q0252,Mar.2014,Valencia C.Pang,J.Sole,T.Hsieh,M.Karczewicz,"Intra block copy with larger search region",JCTVC−Q0139,Mar 2014,Valencia R.Joshi,J.Xu,R.Cohen,S.Liu,Z.Ma,Y.Ye,"Screen content coding test model 1 (SCM 1)",JCTVC−Q1014,Mar 2014,Valencia
既存のビデオ圧縮方法を使用して、スクリーンコンテンツをエンコードし、その後、そのコンテンツを受信機側に送信することができるが、ほとんどの既存の方法は、スクリーンコンテンツの特性に対応しておらず、したがって、低い圧縮性能をもたらす。従来のビデオ符号化技術を使用するスクリーンコンテンツの再構成は、しばしば深刻な品質問題をもたらす。例えば、曲線およびテキストが、不鮮明になり、認識するのが困難なことがある。したがって、スクリーンコンテンツを効率的に再構成するための、良好に設計されたスクリーンコンテンツ圧縮方法が、望ましい。
いくつかの例示的な実施形態では、入力ビデオブロックを含むビデオをエンコードしたビットストリームを生成するための方法が、提供される。エンコーダは、少なくとも、入力ビデオブロックの予測のための第1の候補ブロックベクトル(BV)を識別し、第1の候補ブロックベクトルは、第1の候補ブロックを指し示す(point)。エンコーダは、次に、第1の候補ブロックをエンコードするために使用される第1の予測ベクトル(例えば、ブロックベクトルまたは動きベクトル)を識別する。第1の候補ブロックベクトルおよび第1の予測ベクトルから、エンコーダは、導出された予測ベクトル(例えば、導出されたブロックベクトルまたは導出された動きベクトル)を生成する。エンコーダは、次に、入力ビデオブロックの予測のための導出された予測ベクトルを使用して、ビデオブロックをビットストリームにエンコードする。
いくつかの実施形態では、エンコーダは、導出された予測ベクトルをビットストリームで伝達する。いくつかの実施形態では、エンコーダは、第1の予測ベクトルをビットストリームで伝達し、入力ビデオブロックが第1の予測ベクトルから導出された導出された予測ベクトルを使用してエンコードされたことを示すフラグもビットストリームで伝達する。
いくつかの実施形態では、エンコーダは、マージ候補リスト内の導出された予測ベクトルを識別するインデックスをビットストリームで伝達する。
導出された予測ベクトルは、第1の候補ブロックベクトルと第1の予測ベクトルとを合算することによって生成することができる。そのような実施形態では、第1の予測ベクトルが第2のブロックベクトルである場合、導出された予測ベクトルは、第1の候補ブロックベクトルと第2のブロックベクトル(第1の予測ベクトル)とを合算することによって生成されるブロックベクトルとすることができる。第1の予測ベクトルが動きベクトルである場合、導出された予測ベクトルは、式
MVd=BV0+((MV1+2)>>2)
に従って、第1の候補ブロックベクトルと第1の動きベクトルとを合算することによって生成される動きベクトルとすることができ、ここで、BV0は、第1の候補ブロックベクトルであり、MV1は、第1の動きベクトルであり、MVdは、導出された動きベクトルである。
いくつかの例示的な実施形態では、導出された予測ベクトル(ブロックベクトルまたは動きベクトル)は、マージ候補として使用される。例示的な方法では、エンコーダは、少なくとも、入力ビデオブロックのエンコーディングのための第1のブロックベクトルマージ候補を識別し、エンコーダは、第1の候補ブロックをエンコードするために使用される第1の予測ベクトルを識別する。エンコーダは、次に、第1のブロックベクトルマージ候補および第1の予測ベクトルから、導出された予測ベクトル(導出されたブロックベクトルまたは導出された動きベクトル)を生成する。導出された予測ベクトルは、マージ候補リストに挿入される。マージ候補リストから、エンコーダは、入力ビデオブロックの予測のための選択された予測ベクトルを選択する。エンコーダは、次に、入力ビデオブロックの予測のための選択された予測ベクトルを使用して、入力ビデオブロックをビットストリームにエンコードする。選択された予測ベクトルは、導出された予測ベクトルとすることができる。
いくつかのそのような実施形態では、エンコーダは、導出された予測ベクトルを生成し、挿入する前に、マージ候補リストが満杯であるかどうかを決定する。導出された予測ベクトルを生成し、マージ候補リストに挿入するステップは、マージ候補リストが満杯ではないという決定が行われた後にだけ、実行される。
いくつかのそのような実施形態では、エンコーダは、先にエンコードされたビデオブロックの探索を行うことによって、第1の候補ブロックベクトルを識別する。
符号化されたビデオブロックをビットストリームからデコードする例示的な方法では、デコーダは、少なくとも、入力ビデオブロックの予測のための第1の候補ブロックベクトルを識別し、第1の候補ブロックベクトルは、第1の候補ブロックを指し示す(point)。デコーダは、第1の候補ブロックをエンコードするために使用された第1の予測ベクトルを識別する。デコーダは、次に、第1のブロックベクトルおよび第1の予測ベクトルから導出された予測ベクトルを生成し、符号化されたビデオブロックの予測のための導出された予測ベクトルを使用して、符号化されたビデオブロックをデコードする。
そのような実施形態では、第1の候補ブロックベクトルは、様々な異なる技法を使用して、識別することができる。1つのそのような方法では、第1の候補ブロックベクトルは、ビットストリームで伝達され、第1の候補ブロックベクトルの識別は、ビットストリームで伝達された第1の候補ブロックベクトルを受信することを含む。そのような方法では、導出された予測ベクトルの生成は、入力ビデオブロックが導出された予測ベクトルを用いてエンコードされたことを示すフラグをビットストリームで受信したことに応答して、実行することができる。別のそのような方法では、第1の候補ブロックベクトルの識別は、第1のブロックベクトルマージ候補の識別を含む。そのような実施形態では、導出された予測ベクトルは、マージ候補とすることもできる。デコーダは、導出された予測ベクトルマージ候補を識別するインデックスをビットストリームで受信したことに応答して、導出された予測ベクトルを使用して、符号化されたビデオブロックをデコードすることができる。
図1は、ブロックベースビデオエンコーダの例を示すブロック図である。 図2は、ブロックベースビデオデコーダの例を示すブロック図である。 図3は、8個の方向予測モードの例の図である。 図4は、33個の方向予測モードおよび2個の無方向予測モードの例を示す図である。 図5は、水平予測の例の図である。 図6は、平面モードの例の図である。 図7は、動き予測の例を示す図である。 図8は、ピクチャ内におけるブロックレベルの動きの例を示す図である。 図9は、符号化されたビットストリーム構造の例を示す図である。 図10は、例示的な通信システムを示す図である。 図11は、例示的な無線送受信ユニット(WTRU)を示す図である。 図12は、例示的なスクリーンコンテンツ共用システムを示す図である。 図13は、フルフレームイントラブロックコピーモードの例を示す図である。 図14は、局所領域イントラブロックコピーモードの例を示す図である。 図15は、イントラブロックコピーマージのための空間的候補の2つの例を示す図である。 図16は、例示的なブロックベクトル導出を示す図である。 図17は、例示的な動きベクトル導出を示す図である。 図18Aは、図18Bと併せて1つの例示的な方法のフローチャートである。 図18Bは、図18Aと併せて1つの例示的な方法のフローチャートである。
説明的な実施形態の詳細な説明が、様々な図を参照しながら、今から提供される。この説明は、可能な実施の詳細な例を提供するが、提供される詳細は、例としてのものであり、本出願の範囲を限定するものでは決してないことが意図されていることに留意されたい。
図1は、ブロックベースビデオエンコーダ、例えば、ハイブリッドビデオエンコーディングシステムの例を示すブロック図である。ビデオエンコーダ100は、入力ビデオ信号102を受信することができる。入力ビデオ信号102は、ブロックごとに処理することができる。ビデオブロックは、任意のサイズとすることができる。例えば、ビデオブロックユニットは、16×16ピクセルを含むことができる。16×16ピクセルのビデオブロックユニットは、マクロブロック(MB)と呼ばれることがある。高効率ビデオ符号化(HEVC)では、高解像度(例えば、1080p以上)ビデオ信号を効率的に圧縮するために、拡張されたブロックサイズ(例えば、それは符号化ツリーユニット(CTU)または符号化ユニット(CU)と呼ばれることがあり、2つの用語は、本開示の目的では等価である)を使用することができる。HEVCでは、CUは、最大で64×64ピクセルとすることができる。CUは、予測ユニット(PU)に分割することができ、それらに対しては、別々の予測方法を適用することができる。
入力ビデオブロック(例えば、MBまたはCU)に対して、空間的予測160および/または時間的予測162を実行することができる。空間的予測(例えば、「イントラ予測」)は、同じビデオピクチャ/スライス内のすでに符号化された近隣ブロックからのピクセルを使用して、現在のビデオブロックを予測することができる。空間的予測は、ビデオ信号に内在する空間冗長性を低減させることができる。時間的予測(例えば、「インター予測」または「動き補償予測」)は、(例えば、「参照ピクチャ」と呼ばれることがある)すでに符号化されたビデオピクチャからのピクセルを使用して、現在のビデオブロックを予測することができる。時間的予測は、ビデオ信号に内在する時間冗長性を低減させることができる。ビデオブロックのための時間的予測信号は、1または複数の動きベクトルによって伝達することができ、それらは、現在のブロックと参照ピクチャ内のそれの予測ブロックとの間の動きの量および/または方向を示すことができる。複数の参照ピクチャがサポートされる場合(例えば、H.264/AVCおよび/またはHEVCがそれに当てはまることがある)、ビデオブロックについて、それの参照ピクチャインデックスを送信することができる。参照ピクチャインデックスは、時間的予測信号が参照ピクチャストア164内のどの参照ピクチャから来るかを識別するために、使用することができる。
エンコーダ内のモード決定ブロック180は、例えば、空間的予測および/または時間的予測の後、予測モードを選択することができる。116において、現在のビデオブロックから予測ブロックを減算することができる。予測残差を変換(104)し、および/または量子化(106)することができる。量子化された残差係数を逆量子化(110)し、および/または逆変換(112)して、再構成された残差を形成することができ、それを予測ブロック126に加算し戻して、再構成されたビデオブロックを形成することができる。
インループフィルタリング(例えば、デブロッキングフィルタ、サンプル適応オフセット、および/または適応ループフィルタなど)を、再構成されたビデオブロックに適用することができ(166)、その後、それは、参照ピクチャストア164に入れられ、かつ/または将来のビデオブロックを符号化するために使用される。ビデオエンコーダ100は、出力ビデオストリーム120を出力することができる。出力ビデオストリーム120を形成するために、符号化モード(例えば、インター予測モードまたはイントラ予測モード)、予測モード情報、動き情報、および/または量子化された残差係数が、エントロピ符号化ユニット108に送られて、圧縮および/またはパックが行われ、ビットストリームを形成することができる。参照ピクチャストア164は、デコード済みピクチャバッファ(DPB)と呼ばれることがある。
図2は、ブロックベースビデオデコーダの例を示すブロック図である。ビデオデコーダ200は、ビデオビットストリーム202を受信することができる。ビデオビットストリーム202は、エントロピ復号化ユニット208において、アンパックし、および/またはエントロピデコードすることができる。ビデオビットストリームをエンコードするために使用された符号化モードおよび/または予測情報は、(例えば、イントラ符号化された場合は)空間的予測ユニット260、および/または(例えば、インターコーディングされた場合は)時間的予測ユニット262に送られて、予測ブロックを形成することができる。インターコーディングされた場合、予測情報は、予測ブロックサイズ、(例えば、動きの方向および量を示すことができる)1もしくは複数の動きベクトル、ならびに/または(例えば、どの参照ピクチャから予測信号を獲得すべきかを示すことができる)1もしくは複数の参照インデックスを含むことができる。動き補償予測は、時間的予測ユニット262によって適用されて、時間的予測ブロックを形成することができる。
残差変換係数は、逆量子化ユニット210および逆変換ユニット212に送られて、残差ブロックを再構成することができる。予測ブロックおよび残差ブロックは、226において、合算することができる。再構成されたブロックは、インループフィルタリング266を通過することができ、その後、それは、参照ピクチャストア264内に記憶される。参照ピクチャストア264内の再構成されたビデオは、表示デバイスを駆動するために使用することができ、かつ/または将来のビデオブロックを予測するために使用することができる。ビデオデコーダ200は、再構成されたビデオ信号220を出力することができる。参照ピクチャストア264は、デコード済みピクチャバッファ(DPB)と呼ばれることがある。
ビデオエンコーダおよび/またはデコーダ(例えば、ビデオエンコーダ100またはビデオデコーダ200)は、(例えば、イントラ予測と呼ばれることがある)空間的予測を実行することができる。空間的予測は、複数の予測方向の1つに従って、すでに符号化された近隣ピクチャから予測することによって、実行することができる(例えば、それは方向イントラ予測と呼ばれることがある)。
図3は、8個の方向予測モードの例の図である。図3の8個の方向予測モードは、H.264/AVCにおいてサポートすることができる。図3の300において全体的に示されるように、(DCモード2を含む)9個のモードは、以下の通りである。
●モード0:垂直予測
●モード1:水平予測
●モード2:DC予測
●モード3:対角線下−左予測
●モード4:対角線下−右予測
●モード5:垂直−右予測
●モード6:水平−下予測
●モード7:垂直−左予測
●モード8:水平−上予測
空間的予測は、様々なサイズおよび/または形状のビデオブロック上で実行することができる。ビデオ信号のルーマ成分の空間的予測は、(例えば、H.264/AVCでは)例えば、4×4、8×8、および16×16ピクセルのブロックサイズに対して、実行することができる。ビデオ信号のクロマ成分の空間的予測は、(例えば、H.264/AVCでは)例えば、8×8のブロックサイズに対して、実行することができる。サイズ4×4または8×8のルーマブロックの場合、(例えば、H.264/AVCでは)9個の予測モードのすべてを、例えば、8個の方向予測モードおよびDCモードをサポートすることができる。サイズ16×16のルーマブロックの場合、4個の予測モードを、例えば、水平、垂直、DC、および平面予測をサポートすることができる。
さらに、方向イントラ予測モードおよび無方向予測モードをサポートすることができる。
図4は、33個の方向予測モードおよび2個の無方向予測モードの例を示す図である。図4の400において全体的に示されるような、33個の方向予測モードおよび2個の無方向予測モードを、HEVCによってサポートすることができる。より大きいブロックサイズを使用する空間的予測をサポートすることができる。例えば、空間的予測は、任意のサイズ、例えば、4×4、8×8、16×16、32×32、または64×64の正方形ブロックサイズのブロック上で、実行することができる。(例えば、HEVCでは)方向イントラ予測を、1/32ピクセル精度で実行することができる。
(例えば、H.264/AVCでは)方向イントラ予測に加えて、例えば、無方向イントラ予測モードをサポートすることができる。無方向イントラ予測モードは、DCモードおよび/または平面モードを含むことができる。DCモードの場合、予測値は、利用可能な近隣ピクセルを平均することによって、獲得することができ、予測値は、ブロック全体に一様に適用することができる。平面モードの場合、線形補間を使用して、推移の遅い滑らかな領域を予測することができる。H.264/AVCは、16×16ルーマブロックおよびクロマブロックに対して、平面モードの使用を可能にすることができる。
エンコーダ(例えば、エンコーダ100)は、(例えば、図1のブロック180において)モード決定を実行して、ビデオブロックのための最良の符号化モードを決定することができる。エンコーダが、(例えば、インター予測の代わりに)イントラ予測を適用すると決定した場合、エンコーダは、利用可能なモードのセットから、最適なイントラ予測モードを決定することができる。選択された方向イントラ予測は、入力ビデオブロックにおける任意のテクスチャ、エッジ、および/または構造についての指示に関する強いヒントを提供することができる。
図5は、図5の500において全体として示されるような、(例えば、4×4ブロックについての)水平予測の例の図である。すでに再構成されたピクセルP0、P1、P2、およびP3(すなわち、影付きピクセル)を使用して、現在の4×4ビデオブロック内のピクセルを予測することができる。水平予測では、再構成されたピクセル、例えば、ピクセルP0、P1、P2、および/またはP3は、対応する行の方向に沿って水平に伝搬して、4×4ブロックを予測することができる。例えば、予測は、以下の式(1)に従って実行することができ、L(x,y)は、(x,y)において予測されるピクセルとすることができ、x,y=0...3である。
L(x,0)=P0
L(x,1)=P1 (1)
L(x,2)=P2
L(x,3)=P3
図6は、図6の600において全体として示されるような、平面モードの例の図である。平面モードは、しかるべく実行することができ、すなわち、(Tによって示される)最上行の右端のピクセルは、右端の列のピクセルを予測するために、複製することができる。(Lによって示される)左端の列の一番下のピクセルは、最下行のピクセルを予測するために、複製することができる。(左ブロックに示されるような)水平方向における双線形補間を実行して、中央ピクセルの第1の予測H(x,y)を生成することができる。(例えば、右ブロックに示されるような)垂直方向における双線形補間を実行して、中央ピクセルの第2の予測V(x,y)を生成することができる。L(x,y)=((H(x,y)+V(x,y))>>1)を使用して、水平予測と垂直予測との間の平均を実行することで、最終的な予測L(x,y)を獲得することができる。
図7および図8は、700および800において全体として示されるような、(例えば、図1の時間的予測ユニット162を使用する)ビデオブロックの動き予測の例を示す図である。図8は、ピクチャ内におけるブロックレベルの動きの例を示しており、例えば、参照ピクチャ「Ref pic0」、「Ref pic1」、および「Ref pic2」を含む、例示的なデコード済みピクチャバッファを示す図である。現在のピクチャ内のブロックB0、B1、およびB2は、それぞれ、参照ピクチャ「Ref pic0」、「Ref pic1」、および「Ref pic2」内のブロックから予測することができる。動き予測は、近隣ビデオフレームからのビデオブロックを使用して、現在のビデオブロックを予測することができる。動き予測は、時間相関を利用することができ、かつ/またはビデオ信号内に内在する時間冗長性を除去することができる。例えば、H.264/AVCおよびHEVCでは、時間的予測は、様々なサイズのビデオブロック上で実行することができる(例えば、ルーマ成分については、時間的予測ブロックサイズは、H.264/AVCでは、16×16から4×4まで、HEVCでは、64×64から4×4まで変化することができる)。動きベクトルを(mvx,mvy)とすると、時間的予測は、式(2)によって提供されるように実行することができ、
P(x,y)=ref(x−mvx,y−mvy) (2)
ここで、ref(x,y)は、参照ピクチャ内のロケーション(x,y)におけるピクセル値とすることができ、P(x,y)は、予測されたブロックとすることができる。ビデオ符号化システムは、分数ピクセル精度を有するインター予測をサポートすることができる。動きベクトル(mvx,mvy)が分数ピクセル値を有する場合、1または複数の補間フィルタを適用して、分数ピクセル位置におけるピクセル値を獲得することができる。ブロックベースビデオ符号化システムは、多仮説予測を使用して、時間的予測を改善することができ、例えば、その場合、異なる参照ピクチャからの数々の予測信号を組み合わせることによって、予測信号を形成することができる。例えば、H.264/AVCおよび/またはHEVCは、2つの予測信号を組み合わせることができる双予測を使用することができる。双予測は、各々が参照ピクチャからのものである、2つの予測信号を組み合わせて、以下の式(3)のように、予測を形成することができ、
Figure 0006640751
ここで、P0(x,y)およびP1(x,y)は、それぞれ、第1および第2の予測ブロックとすることができる。式(3)に示されるように、2つの予測ブロックは、2つの参照ピクチャref0(x,y)およびref1(x,y)からの、それぞれ2つの動きベクトル(mvx0,mvy0)および(mvx1,mvy1)を用いる、動き補償予測を実行することによって、獲得することができる。(例えば、116において)予測ブロックP(x,y)をソースビデオブロックから減算して、予測残差ブロックを形成することができる。予測残差ブロックは、(例えば、変換ユニット104において)変換することができ、かつ/または(例えば、量子化ユニット106において)量子化することができる。量子化された残差変換係数ブロックは、エントロピ符号化ユニット(例えば、エントロピ符号化ユニット108)に送って、エントロピ符号化し、ビットレートを低減させることができる。エントロピ符号化された残差係数は、パックして、出力ビデオビットストリーム(例えば、ビットストリーム120)の一部を形成することができる。
シングルレイヤビデオエンコーダは、単一のビデオシーケンス入力を取得し、シングルレイヤデコーダに送信される単一の圧縮されたビットストリームを生成することができる。ビデオコーデックは、(例えば、衛星、ケーブル、および地上伝送チャネル上でのTV信号の送信などの、しかし、それらに限定されない)デジタルビデオサービスのために設計することができる。ビデオ中心アプリケーションが異機種環境において展開される場合、ビデオ符号化規格の拡張として、マルチレイヤビデオ符号化技術を開発して、様々なアプリケーションを可能にすることができる。例えば、スケーラブルビデオ符号化および/またはマルチビュービデオ符号化などの、複数レイヤビデオ符号化技術は、2つ以上のビデオレイヤを扱うように設計することができ、その場合、各レイヤをデコードして、特定の空間解像度、時間解像度、忠実度、および/またはビューのビデオ信号を再構成することができる。シングルレイヤエンコーダおよびデコーダが、図1および図2を参照して説明されたが、本明細書で説明される概念は、例えば、マルチビューおよび/またはスケーラブルコーディング技術のための、複数レイヤエンコーダおよび/またはデコーダを利用することができる。
スケーラブルビデオ符号化は、異種ネットワーク上の異なる能力を有するデバイス上で動作するビデオアプリケーションについてのエクスペリエンスの質を改善することができる。スケーラブルビデオ符号化は、最も高い表現(例えば、時間的解像度、空間的解像度、品質など)において一度信号をエンコードすることができるが、クライアントデバイス上で動作するあるアプリケーションによって必要とされる特定のレートおよび表現に応じて、ビデオストリームのサブセットからの復号化を可能にすることができる。スケーラブルビデオ符号化は、非スケーラブルのソリューションと比較して、帯域幅および記憶を節約することができる。国際ビデオ規格、例えば、MPEG−2ビデオ、H.263、MPEG4ビジュアル、H.264などは、スケーラビリティのモードをサポートするツールおよび/またはプロファイルを有することができる。
表1は、異なるタイプのスケーラビリティの例を、それらをサポートすることができる対応する規格とともに提供している。ビット深度スケーラビリティおよび/またはクロマフォーマットスケーラビリティは、例えば、プロフェッショナル用のビデオアプリケーションによって主として使用されることがあるビデオフォーマット(例えば、8ビットビデオよりも高いもの、およびYUV4:2:0よりも高いクロマサンプリングフォーマット)に結び付けられる。アスペクト比スケーラビリティを提供することができる。
Figure 0006640751
スケーラブルビデオ符号化は、ベースレイヤビットストリームを使用して、ビデオパラメータの第1のセットと関連付けられた、ビデオ品質の第1のレベルを提供することができる。スケーラブルビデオ符号化は、1または複数のエンハンスメントレイヤビットストリームを使用して、エンハンスされたパラメータの1または複数のセットと関連付けられた、より高い品質の1または複数のレベルを提供することができる。ビデオパラメータのセットは、空間的解像度、フレームレート、(例えば、SNR、PSNR、VQM、ビジュアル品質などの形態を取る)再構成されたビデオの品質、(例えば、2つ以上のビューを有する)3D能力、ルーマおよびクロマビット深度、クロマフォーマット、ならびに基礎をなすシングルレイヤ符号化規格のうちの1または複数を含むことができる。異なる使用事例は、例えば、表1に示されるような、異なるタイプのスケーラビリティを使用することができる。スケーラブル符号化アーキテクチャは、1または複数のスケーラビリティ(例えば、表1に列挙されたスケーラビリティ)をサポートするように構成することができる、共通の構造を提供することができる。スケーラブル符号化アーキテクチャは、最低限の構成労力で異なるスケーラビリティをサポートする、柔軟性を有することができる。スケーラブル符号化アーキテクチャは、符号化ロジック(例えば、エンコーディングおよび/または復号化ロジック)が、スケーラブル符号化システム内において最大限再使用することができるように、ブロックレベル動作に対する変更を必要としなくてよい、少なくとも1つの好ましい動作モードを含むことができる。例えば、ピクチャレベルのインターレイヤ処理および管理ユニットに基づいた、スケーラブル符号化アーキテクチャを提供することができ、ピクチャレベルにおいて、インターレイヤ予測を実行することができる。
図9は、符号化されたビットストリーム構造の例を示す図である。符号化されたビットストリーム1000は、多数のNAL(ネットワークアブストラクションレイヤ)ユニット1001から成る。NALユニットは、符号化されたスライス1006などの、符号化されたサンプルデータ、またはパラメータセットデータ、スライスヘッダデータ1005、または(SEIメッセージと呼ばれることがある)補助エンハンスメント情報データ1007などの、高レベルシンタックスメタデータを含むことができる。パラメータセットは、(例えば、ビデオパラメータセット1002(VPS)は)複数のビットストリームレイヤに適用することができ、または(例えば、シーケンスパラメータセット1003(SPS)は)1つのレイヤ内の符号化されたビデオシーケンスに適用することができ、または(例えば、ピクチャパラメータセット1004(PPS)は)1つの符号化されたビデオシーケンス内の多数の符号化されたピクチャに適用することができる、必須シンタックス要素を含む、高レベルシンタックス構造である。パラメータセットは、ビデオビットストリームの符号化されたピクチャと一緒に送信することができ、または(信頼できるチャネルを使用するアウトオブバンド送信、ハードコーディングなどを含む)他の手段を通して送信することができる。スライスヘッダ1005も、相対的に小さい、またはあるスライスもしくはピクチャタイプにだけ関連する、何らかのピクチャ関連情報を含むことができる、高レベルシンタックス構造である。SEIメッセージ1007は、復号化プロセスによって必要とされないことがあるが、ピクチャ出力タイミングまたは表示、ならびにロス検出および隠蔽など、様々な他の目的のために使用することができる情報を搬送する。
図10は、通信システムの例を示す図である。通信システム1300は、エンコーダ1302と、通信ネットワーク1304と、デコーダ1306とを備えることができる。エンコーダ1302は、有線接続または無線接続とすることができる接続1308を介して、通信ネットワーク1304と通信することができる。エンコーダ1302は、図1のブロックベースビデオエンコーダに類似したものとすることができる。エンコーダ1302は、シングルレイヤコーデック(例えば、図1)またはマルチレイヤコーデックを含むことができる。例えば、エンコーダ1302は、ピクチャレベルのILPサポートを有するマルチレイヤ(例えば、2レイヤ)スケーラブル符号化システムとすることができる。デコーダ1306は、有線接続または無線接続とすることができる接続1310を介して、通信ネットワーク1304と通信することができる。デコーダ1306は、図2のブロックベースビデオデコーダに類似したものとすることができる。デコーダ1306は、シングルレイヤコーデック(例えば、図2)またはマルチレイヤコーデックを含むことができる。例えば、デコーダ1306は、ピクチャレベルのILPサポートを有するマルチレイヤ(例えば、2レイヤ)スケーラブル復号化システムとすることができる。
エンコーダ1302および/またはデコーダ1306は、デジタルテレビジョン、無線ブロードキャストシステム、ネットワーク要素/端末、コンテンツもしくはウェブサーバなどの(例えば、ハイパーテキスト転送プロトコル(HTTP)サーバなどの)サーバ、携帯情報端末(PDA)、ラップトップもしくはデスクトップコンピュータ、タブレットコンピュータ、デジタルカメラ、デジタル記録デバイス、ビデオゲーミングデバイス、ビデオゲームコンソール、セルラもしくは衛星無線電話、および/またはデジタルメディアプレーヤなどの、しかし、それらに限定されない、多種多様な有線通信デバイスおよび/または無線送受信ユニット(WTRU)に組み込むことができる。
通信ネットワーク1304は、適切なタイプの通信ネットワークとすることができる。例えば、通信ネットワーク1304は、音声、データ、ビデオ、メッセージング、放送などのコンテンツを複数の無線ユーザに提供する、多元接続システムとすることができる。通信ネットワーク1304は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共用を通して、そのようなコンテンツにアクセスすることを可能にすることができる。例えば、通信ネットワーク1304は、符号分割多元接続(CDMA)、時分割多元接続(TDMA)、周波数分割多元接続(FDMA)、直交FDMA(OFDMA)、および/またはシングルキャリアFDMA(SC−FDMA)などの、1または複数のチャネルアクセス方法を利用することができる。通信ネットワーク1304は、複数の接続された通信ネットワークを含むことができる。通信ネットワーク1304は、インターネット、および/またはセルラネットワーク、WiFiホットスポット、インターネットサービスプロバイダ(ISP)ネットワークなどの1もしくは複数の私設商用ネットワークを含むことができる。
図11は、例示的なWTRUのシステム図である。示されるように、WTRU1202は、プロセッサ1218、送受信機1220、送信/受信要素1222、スピーカ/マイクロフォン1224、キーパッドもしくはキーボード1226、ディスプレイ/タッチパッド1228、着脱不能メモリ1230、着脱可能メモリ1232、電源1234、全地球測位システム(GPS)チップセット1236、および/または他の周辺機器1238を含むことができる。WTRU102は、実施形態との整合性を保ちながら、上記の要素の任意のサブコンビネーションを含むことができることが理解される。さらに、エンコーダ(例えば、エンコーダ100)および/またはデコーダ(例えば、デコーダ200)が組み込まれた端末は、図11のWTRU1202内に示され、図11のWTRU1202を参照して本明細書で説明される、要素のいくつかまたはすべてを含むことができる。
プロセッサ1218は、汎用プロセッサ、専用プロセッサ、従来型プロセッサ、デジタル信号プロセッサ(DSP)、グラフィックス処理ユニット(GPU)、複数のマイクロプロセッサ、DSPコアと連携する1または複数のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)回路、他の任意のタイプの集積回路(IC)、状態機械などとすることができる。プロセッサ1218は、信号符号化、データ処理、電力制御、入力/出力処理、および/またはWTRU1202が有線および/または無線環境で動作することを可能にする他の任意の機能を実行することができる。プロセッサ1218は、送受信機1220に結合することができ、送受信機1220は、送信/受信要素1222に結合することができる。図11は、プロセッサ1218および送受信機1220を別々の構成要素として示しているが、プロセッサ1218および送受信機1220は、電子パッケージおよび/またはチップ内に一緒に統合することができることが理解される。
送信/受信要素1222は、エアインターフェース1215上で、別の端末に信号を送信し、かつ/または別の端末から信号を受信するように構成することができる。例えば、1または複数の実施形態では、送信/受信要素1222は、RF信号を送信および/または受信するように構成されたアンテナとすることができる。1または複数の実施形態では、送信/受信要素1222は、例えば、IR、UV、または可視光信号を送信および/または受信するように構成された放射器/検出器とすることができる。1または複数の実施形態では、送信/受信要素1222は、RF信号と光信号の両方を送信および/または受信するように構成することができる。送信/受信要素1222は、無線信号の任意の組み合わせを送信および/または受信するように構成することができることが理解される。
加えて、送信/受信要素1222は、図11では単一の要素として示されているが、WTRU1202は、任意の数の送信/受信要素1222を含むことができる。より具体的には、WTRU1202は、MIMO技術を利用することができる。したがって、一実施形態では、WTRU1202は、エアインターフェース1215上で無線信号を送信および受信するための2つ以上の送信/受信要素1222(例えば、複数のアンテナ)を含むことができる。
送受信機1220は、送信/受信要素1222によって送信される信号を変調し、かつ/または送信/受信要素1222によって受信された信号を復調するように構成することができる。上で言及されたように、WTRU1202は、マルチモード機能を有することができる。したがって、送受信機1220は、WTRU1202が、例えば、UTRAおよびIEEE802.11などの複数のRATを介して通信することを可能にするための、複数の送受信機を含むことができる。
WTRU1202のプロセッサ1218は、スピーカ/マイクロフォン1224、キーパッド1226、および/またはディスプレイ/タッチパッド1228(例えば、液晶表示(LCD)ディスプレイユニットまたは有機発光ダイオード(OLED)ディスプレイユニット)に結合することができ、それらからユーザ入力データを受信することができる。プロセッサ1218は、スピーカ/マイクロフォン1224、キーパッド1226、および/またはディスプレイ/タッチパッド1228にユーザデータを出力することもできる。加えて、プロセッサ1218は、着脱不能メモリ1230および/または着脱可能メモリ1232など、任意のタイプの適切なメモリから情報を入手することができ、かつそれらにデータを記憶することができる。着脱不能メモリ1230は、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、ハードディスク、または他の任意のタイプのメモリ記憶デバイスを含むことができる。着脱可能メモリ1232は、加入者識別モジュール(SIM)カード、メモリスティック、セキュアデジタル(SD)メモリカードなどを含むことができる。1または複数の実施形態では、プロセッサ1218は、WTRU1202上に物理的に配置されたメモリではなく、サーバまたはホームコンピュータ(図示されず)上などに配置されたメモリから情報を入手することができ、それにデータを記憶することができる。
プロセッサ1218は、電源1234から電力を受け取ることができ、WTRU1202内の他の構成要素への電力の分配および/または制御を行うように構成することができる。電源1234は、WTRU1202に給電するための任意の適切なデバイスとすることができる。例えば、電源1234は、1または複数の乾電池(例えば、ニッケル−カドミウム(NiCd)、ニッケル−亜鉛(NiZn)、ニッケル水素(NiMH)、リチウムイオン(Li−ion)など)、太陽電池、燃料電池などを含むことができる。
プロセッサ1218は、GPSチップセット1236に結合することができ、GPSチップセット1236は、WTRU1202の現在位置に関する位置情報(例えば、経度および緯度)を提供するように構成することができる。GPSチップセット1236からの情報に加えて、またはその代わりに、WTRU1202は、端末(例えば、基地局)からエアインターフェース1215上で位置情報を受信することができ、かつ/または2つ以上の近くの基地局から受信した信号のタイミングに基づいて、自らの位置を決定することができる。WTRU1202は、実施形態との整合性を保ちながら、任意の適切な位置決定方法を用いて、位置情報を獲得することができることが理解される。
プロセッサ1218は、他の周辺機器1238にさらに結合することができ、他の周辺機器1238は、追加的な特徴、機能、および/または有線もしくは無線接続性を提供する、1または複数のソフトウェアモジュールおよび/またはハードウェアモジュールを含むことができる。例えば、周辺機器1238は、加速度計、向きセンサ、動きセンサ、近接センサ、eコンパス、衛星送受信機、(写真またはビデオ用の)デジタルカメラおよび/またはビデオレコーダ、ユニバーサルシリアルバス(USB)ポート、バイブレーションデバイス、テレビ送受信機、ハンズフリーヘッドセット、Bluetooth(登録商標)モジュール、周波数変調(FM)ラジオユニット、ならびにデジタル音楽プレーヤ、メディアプレーヤ、ビデオゲームプレーヤモジュール、インターネットブラウザなどのソフトウェアモジュールを含むことができる。
例として、WTRU1202は、無線信号を送信および/または受信するように構成することができ、ユーザ機器(UE)、移動局、固定もしくは移動加入者ユニット、ページャ、セルラ電話、携帯情報端末(PDA)、スマートフォン、ラップトップ、ネットブック、タブレットコンピュータ、パーソナルコンピュータ、無線センサ、家電製品、または圧縮されたビデオ通信を受信および処理することが可能な他の任意の端末を含むことができる。
WTRU1202および/または通信ネットワーク(例えば、通信ネットワーク1304)は、広帯域CDMA(WCDMA(登録商標))を使用してエアインターフェース1215を確立することができる、ユニバーサル移動体通信システム(UMTS)地上無線アクセス(UTRA)などの無線技術を実施することができる。WCDMAは、高速パケットアクセス(HSPA)および/または進化型HSPA(HSPA+)などの通信プロトコルを含むことができる。HSPAは、高速ダウンリンクパケットアクセス(HSDPA)および/または高速アップリンクパケットアクセス(HSUPA)を含むことができる。WTRU1202および/または通信ネットワーク(例えば、通信ネットワーク1304)は、ロングタームエボリューション(LTE)および/またはLTEアドバンスト(LTE−A)を使用してエアインターフェース1215を確立することができる、進化型UMTS地上無線アクセス(E−UTRA)などの無線技術を実施することができる。
WTRU1202および/または通信ネットワーク(例えば、通信ネットワーク1304)は、IEEE802.16(例えば、マイクロ波アクセス用の世界的相互運用性(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV−DO、暫定標準2000(IS−2000)、暫定標準95(IS−95)、暫定標準856(IS−856)、移動体通信用グローバルシステム(GSM(登録商標))、GSMエボリューション用の高速データレート(EDGE)、GSM EDGE(GERAN)などの無線技術を実施することができる。WTRU1202および/または通信ネットワーク(例えば、通信ネットワーク1304)は、IEEE802.11、IEEE802.15などの無線技術を実施することができる。
図12は、例示的な2方向スクリーンコンテンツ共用システム1600を示す図である。図は、キャプチャラ1602と、エンコーダ1604と、送信機1606とを含む、ホストサブシステムを示している。図12は、(受信された入力ビットストリーム1610を出力する)受信機1608と、デコーダ1612と、ディスプレイ(レンダラ)1618とを含む、クライアントサブシステムをさらに示している。デコーダ1612は、表示ピクチャバッファ1614に出力し、それが、今度は、デコードされたピクチャ1616をディスプレイ1618に送信する。スクリーンコンテンツコーディング(SCC)については、業界からのアプリケーション要件が存在する。非特許文献12、13を参照されたい。ますます多くの人々が、メディアプレゼンテーションまたはリモートデスクトップ目的で、デバイスコンテンツを共有するようになっているので、スクリーンコンテンツ圧縮方法は、ある特定のアプリケーションのために重要になってきている。モバイルデバイスのスクリーンディスプレイは、高精細度または超高精細度をサポートするように大幅に改善された。従来のビデオ符号化方法は、スクリーン共有アプリケーションにおいてスクリーンコンテンツを送信するための帯域幅要件を増加させる。
上で説明されたように、図2は、図1のエンコーダなどのエンコーダによって生成されたビデオビットストリームを受信し、表示されるビデオ信号を再構成する、汎用ブロックベースシングルレイヤデコーダのブロック図である。やはり上で説明されたように、ビデオデコーダにおいて、ビットストリームは、最初にエントロピデコーダによって解析される。残差係数は、逆量子化され、逆変換されて、再構成された残差を獲得する。空間的予測または時間的予測を使用して、予測信号を獲得するために、符号化モードおよび予測情報が、使用される。予測信号および再構成された残差は、合算されて、再構成されたビデオを取得する。再構成されたビデオは、ループフィルタリングをさらに通過し、その後、参照ピクチャストア内に記憶されてから、表示すること、および/または将来のビデオ信号をデコードするために使用することができる。図1に示されるように、効率的な圧縮を達成するために、シングルレイヤエンコーダは、(イントラ予測とも呼ばれる)空間的予測および(インター予測および/または動き補償予測とも呼ばれる)時間的予測など、広く知られた技法を利用して、入力ビデオ信号を予測する。エンコーダは、レートおよび歪みといった検討事項の組み合わせなど、ある基準に通常は基づいて、最も適切な予測の形態を選択する、モード決定ロジックも有する。非特許文献11を参照されたい。エンコーダは、その後、予測残差(入力信号と予測信号との間の差信号)を変換し、量子化する。量子化された残差は、モード情報(例えば、イントラまたはインター予測)、および予測情報(動きベクトル、参照ピクチャインデックス、イントラ予測モードなど)と一緒に、エントロピコーダにおいてさらに圧縮され、出力ビデオビットストリーム内にパックされる。図1に示されるように、エンコーダは、量子化された残差に逆量子化および逆変換を適用して、再構成された残差を獲得し、それを予測信号に加算し戻すことによって、再構成されたビデオ信号も生成する。再構成されたビデオ信号は、ループフィルタプロセス(例えば、デブロッキングフィルタ、サンプル適応オフセット、または適応ループフィルタ)をさらに通過し、最終的に参照ピクチャストア内に記憶されて、将来のビデオ信号を予測するために使用することができる。
送信帯域幅および記憶を節約するために、MPEGは、多年にわたって、ビデオ符号化規格に取り組んできた。高効率ビデオ符号化(HEVC)(非特許文献13を参照されたい)は、新たに出現したビデオ圧縮規格である。HEVCは、現在、ITU−Tビデオコーディングエキスパーツグループ(VCEG)およびISO/IECムービングピクチャエキスパーツグループ(MPEG)によって一緒に共同開発されている。それは、H.264と比較して、品質は同じままで、帯域幅を50%節約することができる。HEVCは、それのエンコーダおよびデコーダが、図1および図2に関連して上で説明された方法に従って概ね動作するという点で、依然として、ブロックベースハイブリッドビデオ符号化規格である。HEVCは、より大きいビデオブロックの使用を可能にし、それは、四分木分割を使用して、ブロック符号化情報を伝達する。ピクチャまたはスライスは、最初に、同じサイズ(例えば、64×64)を有する、符号化ツリーブロック(CTB)に分割される。各CTBは、四分木を用いて、CUに分割され、各CUは、やはり四分木を使用して、予測ユニット(PU)と変換ユニット(TU)とにさらに分割される。インター符号化されたCUごとに、それのPUは、図3に関連して示され、説明されたような、8つの分割モードのうちの1つとすることができる。動き補償とも呼ばれる時間的予測が、適用されて、インター符号化されたすべてのPUを再構成する。(HEVCでは1/4ピクセルまでとすることができる)動きベクトルの精度に応じて、線形フィルタが、適用されて、分数位置におけるピクセル値を獲得する。HEVCでは、補間フィルタは、ルーマについては7または8つのタップ、クロマについては4つのタップを有する。HEVCにおけるデブロッキングフィルタは、コンテンツベースであり、符号化モードの違い、動きの違い、参照ピクチャの違い、ピクセル値の違いなど、数々の要因に応じて、異なるデブロッキングフィルタ操作が、TUおよびPU境界において適用される。エントロピ符号化について、HEVCは、高レベルパラメータを除く、ほとんどのブロックレベルシンタックス要素のために、コンテキストベース適応算術2値コーディング(CABAC)を採用する。CABACコーディングには、2種類のビンが存在し、一方は、コンテキストベースで符号化される通常のビンであり、他方は、コンテキストを用いずに、バイパスコーディングされるビンである。
現在のHEVC設計は、様々なブロック符号化モードを含むが、それは、スクリーンコンテンツ符号化のために、空間的冗長性を十分には利用していない。これは、HEVCが、4:2:0フォーマットの連続トーンビデオコンテンツに重点を置いており、モード決定および変換符号化ツールは、4:4:4ビデオのフォーマットでしばしばキャプチャされる、離散トーンスクリーンコンテンツに対して最適化されていないためである。HEVC規格が、2012年終盤に成熟し、安定化し始めたときに、規格化組織VCEGおよびMPEGは、スクリーンコンテンツ符号化のためのHEVCの将来の拡張に取り組み始めた。2014年1月に、スクリーンコンテンツ符号化についての提案の呼び掛け(CFP)が、ITU−T VCEGおよびISO/IEC MPEGによって共同で公表された。CFPは、かなりの量の注目を集め、様々な効率的なSCCソリューションを提案する様々な異なる会社から7つの応答(非特許文献2〜8)を得た。テキストおよびグラフィックスなどのスクリーンコンテンツ素材が、自然なビデオコンテンツと比較して、異なる特性を示すことを考慮して、スクリーンコンテンツ符号化の符号化効率を改善するいくつかの新規な符号化ツールが、例えば、IDストリングコピー(非特許文献9)、パレットコーディング(非特許文献10、11)、およびイントラブロックコピー(IntraBC)(非特許文献12、17)が、提案された。それらすべてのスクリーンコンテンツコーディング関連のツールは、中核的な実験(非特許文献18〜22)において調査された。スクリーンコンテンツは、線分またはブロック、および多くの小さい均質な領域(例えば、単色領域)に関して、高度に反復的なパターンを有する。通常、小さいブロック内には、わずか数色が存在するだけである。対照的に、自然なビデオの場合、小さいブロック内でさえも、多くの色が存在する。各位置における色値は、通常、それの上側または水平近隣ピクセルから反復される。IDストリングコピーは、先行する再構成されたピクセルバッファから、可変長のストリングを予測することを含む。位置およびストリング長が、伝達される。パレット符号化モードでは、ピクセル値を直接的に符号化する代わりに、それらの主要色を記録するためのディクショナリとして、パレットテーブルが使用される。符号化ブロック内の各ピクセルの色値を表すために、対応するパレットインデックスマップが使用される。さらに、「ラン」値を使用して、同じ主要色(すなわち、パレットインデックス)を有する連続するピクセルの長さを示すことで、空間的冗長性を低減させる。パレット符号化は、通常、わずかな色しか含まない大きいブロックに対して良好である。イントラブロックコピーは、再構成されたピクセルを使用して、同じピクチャ内の現在の符号化ブロックを予測することを含み、ブロックベクトルと呼ばれる変位情報が、符号化される。
図13は、フルフレームイントラブロックコピーモードの例を示す図である。複雑さおよび帯域幅アクセスを考慮して、HEVCでは、スクリーンコンテンツ符号化拡張参照ソフトウェア(SCM−1.0)(非特許文献31)は、イントラブロックコピーモードのための2つの構成を有する。1つは、フルフレームイントラブロックコピーモードであり、図13の1700において全体として示されるように、すべての再構成されたピクセルを、予測のために使用することができる。ブロックベクトル探索の複雑さを低減させるために、ハッシュベースイントラブロックコピー探索が提案された(非特許文献29、30)。もう1つは、局所領域イントラブロックコピーモードであり、それが、次に説明される。
図14は、1800において全体として示されるような、局所領域イントラブロックコピーモードの例を示す図である。局所領域イントラブロックコピーモードが使用される場合、左側および現在の符号化ツリーユニット(CTU)内の再構成されたピクセルだけが、参照として使用されることを許可される。
SCCと自然なビデオ符号化との間には、別の相違が存在する。自然なビデオ符号化の場合、符号化歪みは、ピクチャ全体に分散する。しかしながら、スクリーンコンテンツの場合、エラーは、通常、強いエッジの周囲に局所化され、それが、ピクチャ全体ではPSNR(ピーク信号対雑音比)がきわめて高い場合であっても、アーチファクトをより目立つようにする。したがって、スクリーンコンテンツは、主観的な品質の観点からは、エンコードするのがより困難である。
イントラブロックコピーモードの使用は、ブロックベクトルのシグナリングを必要とする。フルフレームイントラブロックコピー構成では、ブロックベクトルは、非常に大きいものであることができ、イントラブロックコピーモードのための高いオーバヘッドをもたらす。スクリーンコンテンツの場合、高度に反復的なパターンが存在するので、しばしば、1つのブロックは、複数の類似した対等物を見出すことができる。ブロックベクトル符号化効率を改善するために、様々な予測および符号化方法が提案された(非特許文献23〜28)。目下開示されているシステムおよび方法の実施形態は、ブロックベクトル導出を使用して、イントラブロックコピー符号化効率を改善する。本開示において議論および説明される変形の中には、(i)イントラブロックコピーマージモードにおけるブロックベクトル導出、および(ii)明示的なブロックベクトルモードを用いるイントラブロックコピーにおけるブロックベクトル導出がある。
本開示には、イントラブロックコピー符号化のための変位情報導出方法の説明が含まれる。参照ブロックの符号化タイプに応じて、導出されたブロックベクトルまたは動きベクトルを、異なる方法で使用することができる。1つの方法は、導出されたBVを、IntraBCマージモードにおけるマージ候補として使用することであり、このオプションは、以下の「イントラブロックコピーマージモード」と題されたサブセクションにおいて説明される。別の方法は、導出されたBV/MVを、通常のIntraBC予測のために使用することであり、このオプションは、以下の「導出されたブロックベクトルを用いるイントラブロックコピーモード」と題されたサブセクションにおいて説明される。
図16は、例示的なブロックベクトル導出を示す図である。ブロックベクトルを与えると、与えられたBVによって指し示される参照ブロックがIntraBC符号化されたブロックである場合、第2のブロックベクトルを導出することができる。導出されるブロックベクトルは、式(4)で計算される。図16は、2000において全体的に、この種類のブロックベクトル導出を示している。
BVd=BV0+BV1 (4)
図17は、例示的な動きベクトル導出を示す図である。与えられたBVによって指し示されるブロックが、インターコーディングされたブロックである場合、動きベクトルを導出することができる。図17は、2100において全体的に、MV導出のケースを示している。図17のブロックB1が、単予測モードである場合、ブロックB0のための整数ピクセルにおける導出された動きMVdは、
MVd=BV0+((MV1+2)>>2) (5)
である。いくつかの実施形態では、1/4ピクセル解像度における導出された値MVd_qは、
MVd_q=(BV0<<2)+MV1
として計算される。参照ピクチャは、B1のそれと同じである。HEVCでは、通常の動きベクトルは、1/4ピクセル精度であり、ブロックベクトルは、整数精度である。導出された動きベクトルについての整数ピクセル動きが、ここでは例として使用される。ブロックB1が、双予測モードである場合、動きベクトル導出を実行するための2つの方法が存在する。1つは、2つの方向についての2つの動きベクトルを別々に導出し、参照インデックスを単予測モードと同じに導出することである。もう1つは、より小さい量子化パラメータ(より高い品質)を有する参照ピクチャから、動きベクトルを選択することである。両方の参照ピクチャが、同じ量子化パラメータを有する場合、ピクチャオーダオブカウント(POC)距離においてより近い参照ピクチャ(より高い相関)から、動きベクトルを選択することができる。以下の説明は、複雑さを低減させるために、双予測を単予測に変換する、第2の方法を使用する例を使用する。
イントラブロックコピーマージモード
図15は、イントラブロックコピーマージのための空間的候補の2つの例を示す図である。HEVCメインプロファイル(非特許文献13)および範囲拡張(非特許文献17)では、インターコーディングユニットマージモードは、動き情報を直接的に伝達しないが、インターマージ候補リストのインデックスをデコーダに伝達する。インターマージ候補リストは、エンコーダにおけるものと同じ決定論的な方法で構成される。動き情報は、インデックスを使用して候補リストから導出される。図15の番号1902の例では、5つの空間的近隣ブロックおよび1つの時間的連結ブロックが存在する。インターモードで符号化されたそれらのブロックだけが、インターマージ候補リストに追加される。候補リストが、空間的および時間的近隣ブロックで満杯ではない場合、2つのリスト内の既存のマージ候補とゼロ動きとを組み合わせることによる双予測動きが、追加される。
イントラブロックコピーマージモードの場合、マージモードを適用する類似の方法が、実施される。BV情報は、明示的に符号化されないが、マージ候補インデックスが、符号化される。HEVC SCC拡張(SCM−1.0)(非特許文献31)では、BVは、最後に符号化されたBVをプレディクタとして使用する差分符号化を用いて、符号化される。BV候補リスト構成では、BVプレディクタが、最初にチェックされる。BVプレディクタが、現在のCUに対して有効である場合、それは、第1のマージ候補として追加される。その後、図15の番号1902および1904の例では、5つの空間的ブロックが、チェックされ、それらの有効なBVが、(1)空間的近隣ブロックが、IntraBCコーディングされ、したがって、BVを有し、(2)BVが、現在のCUに対して有効であり(例えば、BVによって指し示される参照ブロックが、ピクチャ境界の外になく、すでに符号化されており)、および(3)BVが、現在の候補リストにまだ出現していない場合、順番に追加される。マージ候補リストが、満杯ではない場合、BVは、リスト内にすでにあるそれらの有効なBVを用いて導出される。一実施形態では、式(4)の導出されたブロックベクトルだけが、考慮され、式(5)の導出された動きベクトルは、考慮されず、そのような例では、候補リスト内のマージ候補のすべては、イントラブロックコピーモードに対応するブロックベクトルである。
複雑な設計の場合、式(5)からの導出された動きベクトルは、ブロックベクトルとミックスし、一緒にマージ候補に追加することができる。別の実施形態は、候補ブロックベクトルBV0ごとのものであり、BV0に基づいて導出されたBVdまたはMVdが、有効である場合、BV0およびBVd/MVdを用いる双予測モードと候補ブロックを見なし、その場合、双予測は、ブロックベクトルBV0を適用することによって獲得された第1の予測を、導出されたブロックまたは動きベクトルBVd/MVdを適用することによって獲得された第2の予測とともに平均することによって獲得される。
図18Aおよび図18Bは、併せて1つの、イントラブロックコピーマージ候補リスト構成の例示的な方法のフローチャートである。例示的な方法2200は、ステップ2202において開始し、それは、「IntraBCマージ候補導出」である。方法は、次に、「空間的BV候補生成」と名付けられた破線ボックスに、特にステップ2204に進み、それは、「BVプレディクタを、それが現在のCUに対して有効である場合は、マージ候補リストに追加する」である。処理は、次に、ステップ2206に進み、それは、「空間的近隣ブロックからのBVをチェックし、それが有効である場合は、それをマージ候補リストに追加する」である。
方法は、次に、決定ボックス2208に進み、そこで、以下の条件が、すなわち、「((左側、上側、右上、左下の近隣ブロックがチェックされた)||(num_of_cand_list≧max_num_of_merge_cand))か?」が評価される。2208における条件が、偽であると決定された場合、処理は、ステップ2206に戻る。
2208における条件が、代わりに、真であると決定された場合、処理は、決定ボックス2210に進み、そこで、以下の条件が、すなわち、「(num_of_cand_list<max_num_of_merge_cand−1)か?」が、評価される。2210における条件が、真であると決定された場合、処理は、ステップ2212に進み、それは、「左上の近隣ブロックのBVをチェックし、それが有効である場合は、それをマージ候補リストに追加する」である。2210における条件が、偽であると決定された場合、ステップ2212は、バイパスされる。いずれにしても、処理は、次に、図18Bの「BVd候補生成」と題された破線ブロックに、特に決定ボックス2216に進み、そこで、以下の条件が、すなわち、「((リスト内のすべての空間的BV候補がチェックされた)||(num_of_cand_list≧max_num_of_merge_cand))か?」が評価される。
2216における条件が、真であると決定された場合、処理は、ステップ2224において終了する。2216における条件が、偽であると決定された場合、処理は、ステップ2218に進み、それは、「候補リストから1つの空間的BVを取り、BVdを導出する」である。
次に、処理は、決定ボックス2220に進み、そこで、以下の条件が、すなわち、「BVdは有効か?」が、評価される。2220における条件が、真であると決定された場合、処理は、ステップ2222に進み、それは、「BVdをマージ候補リストに追加する」である。2220における条件が、代わりに、偽であると決定された場合、処理は、決定ボックス2216に戻る。
導出されたブロックベクトルを用いるイントラブロックコピーモード
通常のイントラブロックコピーモードでは、ブロックベクトルは、符号化ユニット内の予測ユニットごとに明示的に伝達される。いくつかの実施形態では、このモードは、IntraBC予測において、伝達されたブロックベクトルが使用されるか、または導出されたブロックベクトルが使用されるかを示すためのフラグを追加することによって、拡張される。フラグが0である場合、伝達されたブロックベクトルが、IntraBC予測のために使用され、BV導出を適用する必要はない。フラグが1である場合、BVまたはMVが、伝達されたブロックベクトルに基づいて、式(4)または式(5)を使用して導出され、導出されたBVまたはMVが、イントラブロックコピー予測または動き補償予測のために使用される。
別の実施形態は、通常のIntraBCモードに2つのフラグを追加することである。第1のフラグは、BV導出プロセスが適用されるかどうかを示すために使用される。第1のフラグが、1である場合、第2のフラグが、単予測が使用されるか、または双予測が使用されるかを示すように符号化される。第2のフラグが、0である場合、導出されたBVまたはMVだけが、イントラブロックコピー予測または動き補償予測のために使用される。そうではなく、第2のフラグが、1である場合、伝達されたBVが、第1の予測を生成するために使用され、導出されたBVまたはMVが、第2の予測を生成するために使用され、最終的な予測は、双予測モードに類似して、それら2つの予測を平均することによって生成される。
ブロックベクトル導出のためのメモリアクセス帯域幅低減
ブロックベクトル導出は、図16および図17のブロックB1についての情報など、ブロック符号化モードおよびブロックベクトル/動きベクトルに関する情報を使用して動作する。デコーダチップ設計について、符号化されたすべてのブロックのモード/BV/動き情報を記憶するための2つの方法が存在する。1つは、外部メモリ内に情報を記憶することである。この技法は、外部メモリへのアクセスを必要とし、したがって、メモリアクセス帯域幅を増加させる。もう1つの技法は、オンチップメモリ内に情報をキャッシュすることであり、それは、キャッシュサイズを増加させる。
記憶される必要がある情報の量を低減させるための、2つの例示的な方法が、ここでは説明される。1つは、その情報を粗い粒度で記憶することである。HEVCでは、元のBV/MV情報は、4×4ブロックサイズに基づいて記憶される。メモリサイズは、より大きいブロックサイズ、例えば、16×16ブロックサイズに基づいた圧縮された形式で、元のBV/MV情報を記憶することによって、大幅に低減される。16×16ブロックサイズが使用される場合、必要とされるBV記憶は、HEVCにおける圧縮された動きと同じ粒度を有する。このように、それらのデータを妥当なサイズでキャッシュすることが可能である。第2のソリューションは、符号化されたブロックのその情報を、すでに符号化されたすべてのブロックの代わりに、限定された範囲でキャッシュすることである。例えば、デコーダは、現在のCTU行および現在のCTU行の上側の限られた数の符号化された近隣CTU行に関する情報だけをキャッシュすることができる。図16および図17の第1のBVによって指し示されるブロックB1が、デコーダがキャッシュする範囲外にある場合、このBVは、無効と見なされ、BV/MV導出は、適用されない。
符号化シンタックスおよびセマンティクス
HEVC範囲拡張ドラフト(非特許文献17)の現在のシンタックス設計に基づいた、イントラブロックコピーマージおよび導出されたブロックベクトルを用いるイントラブロックコピーを用いて符号化されたCUを伝達するための、新しいシンタックス要素が提案された。本セクションで説明される提案されたパレット符号化方法は、追加のシンタックスを導入することによって、ビットストリームで伝達することができる。以下の表(表2)は、提案されたシンタックス要素を示しており、HEVC範囲拡張ドラフト(非特許文献17)のそれに対する変更は、番号[10]、[12]、[13]、[14]、[17]、[27]、[28]、[29]、[40]、[41]、および[42]の行内に含まれる。
シンタックス
Figure 0006640751
Figure 0006640751
Figure 0006640751
Figure 0006640751
表2に関して、以下のことが留意される。
1に等しいintra_bc_merge_flag[x0][y0]は、現在の符号化ユニットが、マージモードで符号化され、ブロックベクトルが、マージ候補から選択されることを指定する。0に等しいintra_bc_merge_flag[x0][y0]は、符号化ユニットが、マージモードで符号化されず、現在の符号化ユニットのブロックベクトルが、明示的に符号化されることを指定する。存在しない場合、intra_bc_merge_flagの値は、0に等しいと推測される。配列インデックスx0、y0は、ピクチャの左上ルーマサンプルに対する、検討中の符号化ブロックの左上ルーマサンプルのロケーション(x0,y0)を指定する。
intra_bc_merge_index[x0][y0]は、現在の符号化ユニットのブロックベクトルがそれと同じであるマージ候補の間のインデックスを指定する。intra_bc_merge_index[x0][y0]は、0からイントラブロックコピーイングマージ候補マイナス1までの範囲内にあるものとする。配列インデックスx0、y0は、ピクチャの左上ルーマサンプルに対する、検討中の符号化ブロックの左上ルーマサンプルのロケーション(x0,y0)を指定する。
1に等しいintra_bc_bv_derivation_flag[x0][y0]は、導出されたBVまたはMVが、現在のPU予測のために使用されることを指定する。
さらなる例示的な実施形態
例示的な実施形態では、導出されたブロックベクトルが、生成され、導出されたブロックベクトルが、イントラブロックコピーマージモードにおけるマージ候補として使用される。いくつかのそのような方法では、導出されたブロックベクトルBVdは、ブロックベクトルBV0が与えられた場合、BVd=BV0+BV1に従って決定される。
別の例示的な実施形態では、導出された動きベクトルが、生成され、導出された動きベクトルが、イントラブロックコピーマージモードにおけるマージ候補として使用される。いくつかのそのような方法では、整数ピクセルユニットにおける導出された動きベクトルMVdは、ブロックベクトルBV0が与えられた場合、MVd=BV0+((MV1+2)>>2)に従って決定される。
例示的な実施形態では、導出されたブロックベクトルが、生成され、導出されたブロックベクトルが、イントラブロックコピー方法を用いる通常のIntraBC予測のために使用される。
別の例示的な実施形態では、導出された動きベクトルが、生成され、導出された動きベクトルが、動き補償予測方法を用いる通常のIntraBC予測のために使用される。
例示的な実施形態では、ブロックベクトル(BV)候補リストが、形成される。導出されたBV(BVd)が、生成され、BVdが、候補リストに追加される。
いくつかのそのような実施形態では、BV候補リストの形成は、BVプレディクタが現在の符号化ユニット(CU)に対して有効である場合、BVプレディクタを追加することと、5つの空間的ブロックをチェックし、有効なそれらそれぞれの空間的ブロックBVを追加することとを含む。いくつかのそのような実施形態では、空間的ブロックBVは、(i)空間的隣接ブロックがIntraBCコーディングされており、(ii)BVが現在のCUに対して有効であり、および(iii)BVが現在の候補リスト内にまだ出現していない場合に限って、追加される。いくつかのそのような実施形態では、BVdは、マージ候補リストが満杯ではない場合に限って、生成される。BVdは、候補リストに追加される前に、有効性についてチェックすることができる。いくつかの実施形態では、生成されたBVdは、専らBVd=BV0+BV1に従って導出される。いくつかのそのような方法では、導出された動きベクトル(MVd)が、生成され、MVdが、候補リストに追加される。いくつかの実施形態では、BVdは、(i)BVd=BV0+BV1、および(ii)MVd=BV0+((MV1+2)>>2)の両方に従って、導出される。いくつかの実施形態では、候補ブロックは、BV0およびBVd/MVdを用いる双予測モードとして扱われる。双予測は、最初に、ブロックベクトルBV0を適用することによって獲得された第1の予測を、ブロックベクトルまたは動きベクトルBVd/MVdを適用することによって獲得された第2の予測とともに平均することによって獲得することができる。
例示的な実施形態では、ビデオコーディングされたビットストリームが、受信され、IntraBC予測において、伝達されたブロックベクトルが使用されるか、または導出されたブロックベクトルが使用されるかを示すフラグが、識別される。フラグが、第1の値である場合、伝達されたブロックベクトルが、IntraBC予測のために使用される。フラグが、第2の値である場合、BVまたはMVが、伝達されたブロックベクトルに基づいて導出される。いくつかのそのような方法では、導出されたBVまたはMVは、イントラブロックコピー予測または動き補償予測のために使用される。
別の例示的な実施形態では、符号化されたビデオビットストリームが、受信される。ビットストリーム内の第1のフラグが、IntraBC予測において、伝達されたブロックベクトルが使用されるか、または導出されたブロックベクトルが使用されるかを示すものとして識別される。ビットストリーム内の第2のフラグが、単予測が使用されるか、または双予測が使用されるかを示すものとして識別される。
いくつかのそのような実施形態では、第1のフラグが1であり、第2のフラグが0である場合、イントラブロックコピー予測または動き補償予測のために、導出されたBV/MVだけが使用される。第1のフラグが1であり、第2のフラグが1である場合、伝達されたBVが、第1の予測を生成するために使用され、導出されたBV/MVが、第2の予測を生成するために使用され、最終的な予測は、それら2つの予測を平均することによって生成される。
例示的な実施形態では、元のBV/MV情報は、より大きいブロックサイズに基づいたBV/MV情報を記憶することによって、圧縮される。より大きいブロックサイズは、例えば、16×16ブロックサイズとすることができる。
別の例示的な実施形態では、デコーダは、すでに符号化されたすべてのブロックよりも小さい限定された範囲で、符号化されたブロックの情報をキャッシュするために使用される。いくつかのそのような方法では、デコーダは、現在のCTU行および現在のCTU行の上側の所定の数の符号化された近隣CTU行についての情報だけをキャッシュする。
例示的な実施形態では、予測ベクトルを導出するビデオ符号化方法が、提供される。方法は、ビデオブロックの予測のための第1の候補ブロックベクトルを識別するステップを含み、第1の候補ブロックベクトルは、第1の候補ブロックを指し示す(ポイントする)。少なくとも、第1の候補ブロックと関連付けられた第1の予測ブロックが、識別される。導出された予測ベクトルが、第1の候補ブロックベクトルおよび第1の予測ベクトルから生成され、ビデオブロックは、導出された予測ベクトルを使用して符号化される。いくつかの実施形態では、導出された予測ベクトルを使用するビデオブロックの符号化は、導出された予測ベクトルが指し示す(ポイントする)第2の候補ブロックを識別することと、第2の候補ブロックを使用してビデオブロックを予測することとを含む。
いくつかの実施形態では、ビデオブロックを符号化することは、第1の候補ブロックベクトルをビットストリームで伝達することを含む。いくつかの実施形態では、ビデオブロックを符号化することは、第1の予測ベクトルをビットストリームで伝達することをさらに含む。いくつかの実施形態では、ビデオブロックを符号化することは、フラグをビットストリームで伝達することをさらに含み、フラグの第1の値は、導出された予測ベクトルを使用して、ビデオブロックを符号化することを示し、フラグの第2の値は、第1の候補ブロックベクトルを使用して、ビデオブロックを符号化することを示す。いくつかの実施形態では、入力ビデオブロックをビットストリームにエンコードすることは、マージ候補リスト内で導出された予測ベクトルを識別するインデックスをビットストリームにエンコードすることを含む。
導出された予測ベクトルは、いくつかの実施形態では、第1の候補ブロックベクトルと第1の予測ベクトルとを合算することによって生成される。第1の候補ブロックベクトルおよび第1の予測ベクトルが、異なる精度を有する場合、第1の候補ブロックベクトルと第1の予測ベクトルとの合算は、それらを同じ精度に調整した後で実行することができる。
いくつかの実施形態では、ビデオ符号化方法は、マージ候補リストを生成するステップと、導出された予測ベクトルをマージ候補リストに挿入するステップとを含む。いくつかのそのような実施形態では、導出された予測ベクトルが有効であるかどうかについての決定が、行われ、導出された予測ベクトルは有効であると決定された後にだけ、導出された予測ベクトルが、マージ候補リストに挿入される。導出された予測ベクトルを使用してビデオブロックを符号化することは、マージ候補リスト内で導出された予測ベクトルを識別するインデックスを提供することを含む。導出された予測ベクトルが有効であるかどうかについての決定は、いくつかの実施形態では、導出された予測ベクトルが指し示す(ポイントする)第2の候補ブロック識別することと、第2の候補ブロック内のすべてのサンプルが利用可能かどうかを決定することとを含む。導出された予測ベクトルは、第2の候補ブロック内のすべてのサンプルが利用可能である場合に、有効であると決定される。導出された予測ベクトルは、第2の候補ブロック内の少なくとも1つのサンプルが利用可能ではない場合に、有効ではないと決定される。いくつかの実施形態では、第2の候補ブロック内のサンプルは、以下のいずれかが真である場合に、すなわち、サンプルがまだ符号化されていない、またはサンプルが異なるスライスもしくは異なるタイル内にある、またはサンプルがビデオピクチャ境界の外にある場合に、利用不可能である。
例示的な実施形態では、ビデオをエンコードしたビットストリームから、符号化されたビデオブロックをデコードする方法が、提供される。少なくとも、第1の候補ブロックベクトルが、入力ビデオブロックの予測のために識別され、第1の候補ブロックベクトルは、第1の候補ブロックを指し示す(ポイントする)。少なくとも、第1の候補ブロックと関連付けられた第1の予測ベクトルが、識別される。導出された予測ベクトルが、第1のブロックベクトルおよび第1の予測ベクトルから生成され、符号化されたビデオブロックは、導出された予測ベクトルを使用してデコードされる。いくつかのそのような実施形態では、第1の候補ブロックベクトルの識別は、ビットストリームで伝達された第1の候補ブロックベクトルを受信することを含む。
いくつかのそのような実施形態では、導出された予測ベクトルを使用する符号化されたビデオブロックの復号化は、入力ビデオブロックが導出された予測ベクトルを用いてエンコードされたことを示すフラグをビットストリームで受信したことに応答して、実行される。
いくつかの実施形態では、第1の候補ブロックベクトルの識別は、第1のブロックベクトルマージ候補の識別を含む。いくつかの実施形態では、導出された予測ベクトルは、導出された予測ベクトルマージ候補であり、符号化されたビデオブロックを導出された予測ベクトルマージ候補を使用してデコードすることは、導出された予測ベクトルマージ候補を識別するインデックスをビットストリームで受信したことに応答して、実行される。
例示的な実施形態では、入力ビデオブロックを含むビデオをエンコードしたビットストリームを生成するための、ビデオエンコーディング方法が、提供される。入力ビデオブロックの近隣ブロックが、識別される。近隣ブロックは、例えば、入力ビデオブロックの左側、上側、または左上の近隣ブロックとすることができる。近隣ブロックと関連付けられた第1のブロックベクトルが、識別され、第1のブロックベクトルは、第1の候補ブロックを指し示す(ポイントする)。第1の候補ブロックと関連付けられた第2のブロックベクトルが、識別される。導出されたブロックベクトルが、第1のブロックベクトルと第2のブロックベクトルとを合算することによって生成され、第1の予測ブロックが、入力ビデオブロックの予測のために、導出されたブロックベクトルを使用して生成される。
いくつかのそのような実施形態では、入力ビデオブロックのエンコーディングは、少なくとも、第3のブロックベクトルを使用して入力ビデオブロックの予測のための第2の予測ブロックを生成することをさらに含む。第1の予測ブロックおよび第2の予測ブロックは、比較され、予測ブロックおよびそれに関連するブロックベクトルが、エンコーディングメトリックに基づいて、選択される。エンコーディングメトリックは、例えば、ラグランジュのレート−歪みコストとすることができる。
例示的な実施形態では、入力ビデオブロックを含むビデオをエンコードしたビットストリームを生成するための、ビデオエンコーダが、提供される。エンコーダは、プロセッサと、プロセッサ上で実行された場合に、入力ビデオブロックの予測のための第1の候補ブロックベクトルを識別することであって、第1の候補ブロックベクトルは、第1の候補ブロックを指し示す(ポイントする)、識別することと、第1の候補ブロックをエンコードするために使用される第1の予測ベクトルを識別することと、第1の候補ブロックおよび第1の予測ベクトルから、導出された予測ベクトルを生成することと、入力ビデオブロックの予測のための導出された予測ベクトルを使用して、入力ビデオブロックをビットストリームにエンコードすることとを含む機能を実行するように動作する命令を記憶した、非一時的記憶媒体とを含む。
例示的な実施形態では、入力ビデオブロックを含むビデオをエンコードしたビットストリームを生成するための、ビデオエンコーダが、提供される。エンコーダは、プロセッサと、プロセッサ上で実行された場合に、少なくとも、入力ビデオブロックのエンコーディングのための第1のブロックベクトルマージ候補を識別することと、第1の候補ブロックをエンコードするために使用される第1の予測ベクトルを識別することと、第1のブロックベクトルマージ候補および第1の予測ベクトルから、導出された予測ベクトルを生成することと、導出された予測ベクトルをマージ候補リストに挿入することと、マージ候補リストから、入力ビデオブロックの予測のための選択された予測ベクトルを選択することと、入力ビデオブロックの予測のための選択された予測ベクトルを使用して、入力ビデオブロックをビットストリームにエンコードすることとを含む機能を実行するように動作する命令を記憶した、非一時的記憶媒体とを含む。
例示的な実施形態では、ビデオをエンコードしたビットストリームから符号化されたビデオブロックをデコードするための、ビデオデコーダが、提供され、デコーダは、プロセッサと、プロセッサ上で実行された場合に、少なくとも、符号化されたビデオブロックの復号化のための第1のブロックベクトルを識別することと、第1のブロックベクトルをエンコードするために使用された第1の予測ベクトルを識別することと、第1のブロックベクトルおよび第1の予測ベクトルから、導出された予測ベクトルを生成することと、符号化されたビデオブロックの予測のための導出された予測ベクトルを使用して、符号化されたビデオブロックをデコードすることとを含む機能を実行するように動作する命令を記憶した、非一時的記憶媒体とを含む。
上では特徴および要素が特定の組み合わせで説明されたが、各特徴または要素は、単独で使用することができ、または他の特徴および要素との任意の組み合わせで使用することができることを当業者は理解する。加えて、本明細書で説明された方法は、コンピュータまたはプロセッサによって実行されるための、コンピュータ可読媒体内に含まれた、コンピュータプログラム、ソフトウェア、またはファームウェアで実施することができる。コンピュータ可読媒体の例は、(有線または無線接続上で送信される)電子信号、およびコンピュータ可読記憶媒体を含む。コンピュータ可読記憶媒体の例は、リードオンリメモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスクおよび着脱可能ディスクなどの磁気媒体、光磁気媒体、ならびにCD−ROMディスクおよびデジタル多用途ディスク(DVD)などの光媒体を含むが、それらに限定されない。ソフトウェアと連携するプロセッサを使用して、WTRU、UE、端末、基地局、RNC、または任意のホストコンピュータにおいて使用するための無線周波送受信機を実施することができる。

Claims (20)

  1. 予測ベクトルを導出するビデオ符号化方法であって、
    第1のピクチャにおけるビデオブロックの予測のための第1の候補ブロックベクトルを識別するステップであって、前記第1の候補ブロックベクトルは、前記第1のピクチャにおける第1の候補ブロックを指し示している、ステップと、
    前記第1の候補ブロックと関連付けられた少なくとも第1の予測ベクトルを識別するステップと、
    前記第1の候補ブロックベクトルおよび前記第1の予測ベクトルから、導出された予測ベクトルを生成するステップと、
    前記導出された予測ベクトルを使用して、前記ビデオブロックを符号化するステップと
    を備えることを特徴とする方法。
  2. 前記導出された予測ベクトルを使用して、前記ビデオブロックを符号化する前記ステップは、
    前記導出された予測ベクトルが指し示している第2の候補ブロックを識別することと、
    前記第2の候補ブロックを使用して、前記ビデオブロックを予測することと
    を含むことを特徴とする請求項1に記載の方法。
  3. 前記ビデオブロックを符号化する前記ステップは、前記第1の候補ブロックベクトルをビットストリームの中でシグナリングすることを含むことを特徴とする請求項1に記載の方法。
  4. 前記ビデオブロックを符号化する前記ステップは、
    前記第1の予測ベクトルを前記ビットストリームの中でシグナリングすることをさらに含むことを特徴とする請求項3に記載の方法。
  5. 前記ビデオブロックを符号化する前記ステップは、
    フラグを前記ビットストリームの中でシグナリングすることであって、前記フラグの第1の値は、前記導出された予測ベクトルが、前記ビデオブロックを符号化するために使用されるのを示すことをさらに含むことを特徴とする請求項3に記載の方法。
  6. 前記フラグの第2の値は、前記第1の候補ブロックベクトルが、前記ビデオブロックを符号化するために使用されることを示すことを特徴とする請求項5に記載の方法。
  7. 前記導出された予測ベクトルは、前記第1の候補ブロックベクトルと前記第1の予測ベクトルとを合算することによって生成されることを特徴とする請求項1に記載の方法。
  8. 前記第1の候補ブロックベクトルおよび前記第1の予測ベクトルは、異なる精度を有し、前記第1の候補ブロックベクトルと前記第1の予測ベクトルとの合算は、それらを同じ精度に揃えた後で実行されることを特徴とする請求項7に記載の方法。
  9. 前記第1の予測ベクトルは、第2のブロックベクトルであり、前記導出された予測ベクトルは、導出されたブロックベクトルであることを特徴とする請求項1に記載の方法。
  10. 前記導出されたブロックベクトルは、前記第1の候補ブロックベクトルと前記第2のブロックベクトルとを合算することによって生成されることを特徴とする請求項9に記載の方法。
  11. 前記第1の予測ベクトルは、第1の動きベクトルであり、前記導出された予測ベクトルは、導出された動きベクトルであることを特徴とする請求項1に記載の方法。
  12. 前記導出された動きベクトルは、前記第1の候補ブロックベクトルと前記第1の動きベクトルとを合算することによって生成されることを特徴とする請求項11に記載の方法。
  13. 前記第1の候補ブロックベクトルおよび前記第1の動きベクトルは、異なる精度を有し、前記導出された動きベクトルは、前記第1の候補ブロックベクトルおよび前記第1の動きベクトルの前記精度を調整し、前記精度が調整された第1の候補ブロックベクトルと前記精度が調整された第1の動きベクトルとを合算することによって生成されることを特徴とする請求項12に記載の方法。
  14. 前記精度が調整された第1の候補ブロックベクトルと前記精度が調整された第1の動きベクトルとは、式
    MVd=BV0+((MV1+2)>>2)
    に従って合算され、ここで、BV0は、前記第1の候補ブロックベクトルであり、MV1は、前記第1の動きベクトルであり、MVdは、前記導出された動きベクトルであることを特徴とする請求項13に記載の方法。
  15. 前記ビデオ符号化方法は、前記導出された予測ベクトルをマージ候補リストに挿入するステップをさらに備えることを特徴とする請求項1に記載の方法。
  16. 前記導出された予測ベクトルが有効であるかどうかを決定するステップであって、前記導出された予測ベクトルは、前記導出された予測ベクトルが有効であると決定された後にだけ前記マージ候補リストに挿入される、ステップ
    をさらに備えることを特徴とする請求項15に記載の方法。
  17. 前記導出された予測ベクトルが有効であるかどうかを決定する前記ステップは、
    前記導出された予測ベクトルが指し示す第2の候補ブロックを識別することと、
    前記第2の候補ブロック内のすべてのサンプルが利用可能であるかどうかを決定することと、
    前記第2の候補ブロック内のすべてのサンプルが利用可能である場合は、前記導出された予測ベクトルは有効であると決定し、前記第2の候補ブロック内の少なくとも1つのサンプルが利用可能ではない場合は、前記導出された予測ベクトルは有効ではないと決定することと
    を含むことを特徴とする請求項16に記載の方法。
  18. 前記第2の候補ブロック内のサンプルは、以下のいずれかが真である場合、すなわち、
    前記サンプルが、まだ符号化されていない場合、または
    前記サンプルが、異なるスライスもしくは異なるタイル内にある場合、または
    前記サンプルが、ビデオピクチャ境界の外にある場合、
    利用不可能であることを特徴とする請求項17に記載の方法。
  19. 前記導出された予測ベクトルを使用して、前記ビデオブロックを符号化する前記ステップは、前記マージ候補リスト内で前記導出された予測ベクトルを識別するインデックスを備えることを含むことを特徴とする請求項15に記載の方法。
  20. ビデオをエンコードしたビットストリームから符号化されたビデオブロックをデコードする方法であって、
    第1のピクチャにおける前記符号化されたビデオブロックの予測のための少なくとも第1の候補ブロックベクトルを識別するステップであって、前記第1の候補ブロックベクトルは、前記第1のピクチャにおける第1の候補ブロックを指し示している、ステップと、
    記第1の候補ブロックと関連付けられた少なくとも第1の予測ベクトルを識別するステップと、
    前記第1の候補ブロックベクトルおよび前記第1の予測ベクトルから、導出された予測ベクトルを生成するステップと、
    前記導出された予測ベクトルを使用して、前記符号化されたビデオブロックをデコードするステップと
    を備えることを特徴とする方法。
JP2016574117A 2014-06-19 2015-06-18 ブロックベクトル導出を用いるイントラブロックコピー符号化のための方法およびシステム Active JP6640751B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462014664P 2014-06-19 2014-06-19
US62/014,664 2014-06-19
PCT/US2015/036472 WO2015195942A1 (en) 2014-06-19 2015-06-18 Methods and systems for intra block copy coding with block vector derivation

Publications (3)

Publication Number Publication Date
JP2017522803A JP2017522803A (ja) 2017-08-10
JP2017522803A5 JP2017522803A5 (ja) 2018-07-26
JP6640751B2 true JP6640751B2 (ja) 2020-02-05

Family

ID=53496980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016574117A Active JP6640751B2 (ja) 2014-06-19 2015-06-18 ブロックベクトル導出を用いるイントラブロックコピー符号化のための方法およびシステム

Country Status (7)

Country Link
US (4) US9877043B2 (ja)
EP (2) EP4033766A1 (ja)
JP (1) JP6640751B2 (ja)
KR (2) KR102402622B1 (ja)
CN (2) CN111432220B (ja)
TW (1) TWI679882B (ja)
WO (1) WO2015195942A1 (ja)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5705833B2 (ja) * 2010-04-13 2015-04-22 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像符号化方法および画像復号化方法
CN105659602B (zh) 2013-10-14 2019-10-08 微软技术许可有限责任公司 用于视频和图像编码的帧内块复制预测模式的编码器侧选项
WO2015054811A1 (en) 2013-10-14 2015-04-23 Microsoft Corporation Features of intra block copy prediction mode for video and image coding and decoding
MX360926B (es) * 2014-01-03 2018-11-22 Microsoft Technology Licensing Llc Prediccion de vector de bloque en codificacion/descodificacion de video e imagen.
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
EP3253059A1 (en) 2014-03-04 2017-12-06 Microsoft Technology Licensing, LLC Block flipping and skip mode in intra block copy prediction
EP3158734A4 (en) 2014-06-19 2017-04-26 Microsoft Technology Licensing, LLC Unified intra block copy and inter prediction modes
WO2015194913A1 (ko) * 2014-06-20 2015-12-23 성균관대학교 산학협력단 영상의 부호화/복호화 방법 및 이를 이용하는 장치
KR101748620B1 (ko) * 2014-06-20 2017-07-04 성균관대학교산학협력단 영상의 부호화/복호화 방법 및 이를 이용하는 장치
US10412387B2 (en) * 2014-08-22 2019-09-10 Qualcomm Incorporated Unified intra-block copy and inter-prediction
KR102034938B1 (ko) * 2014-09-01 2019-10-21 에이치에프아이 이노베이션 인크. 스크린 콘텐츠 및 비디오 코딩을 위한 인트라 픽처 블록 카피의 방법
KR102330740B1 (ko) 2014-09-30 2021-11-23 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙
EP3251350B1 (en) 2015-01-29 2023-04-19 VID SCALE, Inc. Intra-block copy searching
US10638129B2 (en) * 2015-04-27 2020-04-28 Lg Electronics Inc. Method for processing video signal and device for same
US10462468B2 (en) * 2015-09-08 2019-10-29 Mediatek Inc. Method and system of decoded picture buffer for intra block copy mode
US10812822B2 (en) * 2015-10-02 2020-10-20 Qualcomm Incorporated Intra block copy merge mode and padding of unavailable IBC reference region
CN116886928A (zh) * 2016-11-28 2023-10-13 韩国电子通信研究院 对图像编码/解码的方法和设备及存储比特流的记录介质
EP3349451A1 (en) * 2017-01-11 2018-07-18 Thomson Licensing Method and apparatus for selecting a coding mode used for encoding/decoding a residual block
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
JP2019129371A (ja) * 2018-01-23 2019-08-01 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法、及び動画像符号化用コンピュータプログラムならびに動画像復号用コンピュータプログラム
US10523948B2 (en) * 2018-02-05 2019-12-31 Tencent America LLC Method and apparatus for video coding
US10951903B2 (en) * 2018-04-02 2021-03-16 Intel Corporation Video analytics encoding for improved efficiency of video processing and compression
US10462483B1 (en) * 2018-04-26 2019-10-29 Tencent America LLC Method and apparatus for video coding
US11477474B2 (en) * 2018-06-08 2022-10-18 Mediatek Inc. Methods and apparatus for multi-hypothesis mode reference and constraints
US10448026B1 (en) * 2018-07-09 2019-10-15 Tencent America LLC Method and apparatus for block vector signaling and derivation in intra picture block compensation
US10904559B2 (en) * 2018-07-13 2021-01-26 Tencent America LLC Block vector prediction in intra block copy mode
US11057617B2 (en) * 2018-08-03 2021-07-06 Tencent America LLC Method and apparatus for video coding
JP7219030B2 (ja) * 2018-08-15 2023-02-07 日本放送協会 色差イントラ予測候補生成装置、画像符号化装置、画像復号装置、及びプログラム
WO2020058893A1 (en) 2018-09-19 2020-03-26 Beijing Bytedance Network Technology Co., Ltd. History based motion vector predictor for intra block copy
US10848782B2 (en) 2018-09-21 2020-11-24 Tencent America LLC Method and apparatus for video coding
US11172236B2 (en) * 2018-09-21 2021-11-09 Tencent America LLC Method and apparatus for video decoding that defines a search range for a reference block indicated by a block vector
TWI831837B (zh) * 2018-09-23 2024-02-11 大陸商北京字節跳動網絡技術有限公司 仿射模型的多個假設
US10764601B2 (en) * 2018-10-06 2020-09-01 Tencent America LLC Method and apparatus for video coding
WO2020084472A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Affine mode parameter inheritance or prediction
CN117880493A (zh) 2018-11-13 2024-04-12 北京字节跳动网络技术有限公司 用于空域运动候选列表的构建方法
KR102572355B1 (ko) * 2018-11-30 2023-08-30 텐센트 아메리카 엘엘씨 비디오 코딩을 위한 방법 및 장치
WO2020125798A1 (en) 2018-12-22 2020-06-25 Beijing Bytedance Network Technology Co., Ltd. Intra block copy mode with dual tree partition
US10904549B2 (en) 2018-12-13 2021-01-26 Tencent America LLC Method and apparatus for signaling of multi-hypothesis for skip and merge mode and signaling of distance offset table in merge with motion vector difference
JP7418152B2 (ja) * 2018-12-17 2024-01-19 キヤノン株式会社 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法
KR20200078378A (ko) * 2018-12-21 2020-07-01 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR20210123300A (ko) 2019-02-02 2021-10-13 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩에서 인트라 블록 복사를 위한 버퍼 관리
AU2020214083B2 (en) 2019-02-02 2023-06-01 Beijing Bytedance Network Technology Co., Ltd. Buffer management for intra block copy in video coding
WO2020164627A1 (en) 2019-02-17 2020-08-20 Beijing Bytedance Network Technology Co., Ltd. Motion candidate list construction for intra block copy mode
US11825120B2 (en) * 2019-02-28 2023-11-21 Qualcomm Incorporated Subblock coding by generalized intra prediction in video coding
CN117395439A (zh) 2019-03-01 2024-01-12 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的基于方向的预测
CN117640927A (zh) 2019-03-04 2024-03-01 北京字节跳动网络技术有限公司 视频编解码中的帧内块复制中的实施方式方面
WO2020184922A1 (ko) * 2019-03-08 2020-09-17 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN111989929B (zh) * 2019-03-09 2022-03-22 腾讯美国有限责任公司 视频解码方法、装置及计算机可读介质
WO2020184977A1 (ko) * 2019-03-11 2020-09-17 한국전자통신연구원 화면 내 블록 복사 기반 부호화/복호화 방법, 장치 및 비트스트림 저장매체
US10986353B2 (en) 2019-03-15 2021-04-20 Tencent America LLC Decoded picture buffer management for video coding
EP4322531A3 (en) * 2019-04-17 2024-04-10 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods harmonizing matrix-based intra prediction and secoundary core selection
US11350083B2 (en) * 2019-04-19 2022-05-31 Qualcomm Incorporated Intra block copy merging data syntax for video coding
BR112021025852B1 (pt) * 2019-06-20 2023-05-16 Jvckenwood Corporation Dispositivo de codificação de imagem, método de codificação de imagem, dispositivo de decodificação de imagem e método de decodificação de imagem
CN113924779A (zh) * 2019-06-20 2022-01-11 韩国电子通信研究院 视频编码/解码方法和装置以及比特流存储介质
CN114175645B (zh) 2019-07-06 2024-04-12 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的虚拟预测缓冲
CA3146391A1 (en) 2019-07-10 2021-01-14 Beijing Bytedance Network Technology Co., Ltd. Sample identification for intra block copy in video coding
EP3981146A4 (en) 2019-07-11 2022-08-03 Beijing Bytedance Network Technology Co., Ltd. BITSTREAM CONFORMITY RESTRICTIONS FOR INTRA-BLOCK COPY IN VIDEO ENCODING
AU2020316548A1 (en) 2019-07-25 2022-02-24 Beijing Bytedance Network Technology Co., Ltd. Mapping restriction for intra-block copy virtual buffer
CN117499659A (zh) 2019-07-25 2024-02-02 北京字节跳动网络技术有限公司 帧内块复制虚拟缓冲区的尺寸限制
CN114342410A (zh) 2019-09-05 2022-04-12 北京字节跳动网络技术有限公司 帧内块复制模式下块矢量的范围约束
JP7323709B2 (ja) 2019-09-09 2023-08-08 北京字節跳動網絡技術有限公司 イントラブロックコピーの符号化および復号化
WO2021057751A1 (en) 2019-09-23 2021-04-01 Beijing Bytedance Network Technology Co., Ltd. Setting intra-block copy virtual buffer based on virtual pipeline data unit
WO2021125904A1 (ko) * 2019-12-19 2021-06-24 주식회사 케이티 비디오 신호 처리 방법 및 장치
WO2021185306A1 (en) 2020-03-18 2021-09-23 Beijing Bytedance Network Technology Co., Ltd. Intra block copy buffer and palette predictor update
US11595678B2 (en) * 2020-06-11 2023-02-28 Tencent America LLC Spatial displacement vector prediction for intra picture block and string copying
CN112333446B (zh) * 2020-11-03 2022-11-15 中山大学 一种帧内块复制参考块压缩方法
CN112565749B (zh) * 2020-12-06 2022-08-09 浙江大华技术股份有限公司 一种视频编码方法、装置、系统及计算机可读存储介质
WO2023040968A1 (en) * 2021-09-15 2023-03-23 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
EP4304177A1 (en) * 2022-07-05 2024-01-10 Beijing Xiaomi Mobile Software Co., Ltd. Encoding/decoding video picture data

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10341440A (ja) * 1997-06-06 1998-12-22 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化方法および装置
KR101366241B1 (ko) * 2007-03-28 2014-02-21 삼성전자주식회사 영상 부호화, 복호화 방법 및 장치
US8665964B2 (en) * 2009-06-30 2014-03-04 Qualcomm Incorporated Video coding based on first order prediction and pre-defined second order prediction mode
KR101671460B1 (ko) * 2009-09-10 2016-11-02 에스케이 텔레콤주식회사 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR101484171B1 (ko) * 2011-01-21 2015-01-23 에스케이 텔레콤주식회사 예측 움직임벡터 색인부호화에 기반한 움직임정보 생성/복원 장치 및 방법, 및 그것을 이용한 영상 부호화/복호화 장치 및 방법
US9288501B2 (en) * 2011-03-08 2016-03-15 Qualcomm Incorporated Motion vector predictors (MVPs) for bi-predictive inter mode in video coding
US9866859B2 (en) 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
US9083983B2 (en) * 2011-10-04 2015-07-14 Qualcomm Incorporated Motion vector predictor candidate clipping removal for video coding
KR101960761B1 (ko) * 2011-11-24 2019-03-22 에스케이텔레콤 주식회사 모션 벡터의 예측 부호화/복호화 방법 및 장치
US20130272409A1 (en) * 2012-04-12 2013-10-17 Qualcomm Incorporated Bandwidth reduction in video coding through applying the same reference index
JP5983430B2 (ja) * 2013-01-25 2016-08-31 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
US10015515B2 (en) * 2013-06-21 2018-07-03 Qualcomm Incorporated Intra prediction from a predictive block
US9883197B2 (en) * 2014-01-09 2018-01-30 Qualcomm Incorporated Intra prediction of chroma blocks using the same vector
US9854237B2 (en) * 2014-10-14 2017-12-26 Qualcomm Incorporated AMVP and merge candidate list derivation for intra BC and inter prediction unification

Also Published As

Publication number Publication date
EP3158753A1 (en) 2017-04-26
WO2015195942A1 (en) 2015-12-23
CN111432220A (zh) 2020-07-17
CN111432220B (zh) 2022-05-06
US20150373366A1 (en) 2015-12-24
EP3158753B1 (en) 2021-12-08
KR20220079687A (ko) 2022-06-13
TW201618548A (zh) 2016-05-16
EP4033766A1 (en) 2022-07-27
US20190200038A1 (en) 2019-06-27
CN106576178A (zh) 2017-04-19
KR20170023086A (ko) 2017-03-02
KR102402622B1 (ko) 2022-05-27
US9877043B2 (en) 2018-01-23
CN106576178B (zh) 2020-03-13
US20200404321A1 (en) 2020-12-24
TWI679882B (zh) 2019-12-11
US10284874B2 (en) 2019-05-07
US20180160141A1 (en) 2018-06-07
JP2017522803A (ja) 2017-08-10

Similar Documents

Publication Publication Date Title
JP6640751B2 (ja) ブロックベクトル導出を用いるイントラブロックコピー符号化のための方法およびシステム
EP3158754B1 (en) Methods and systems for intra block copy search enhancement
KR102355224B1 (ko) 무손실 비디오 코딩의 시그널링을 위한 방법 및 장치
US20170289566A1 (en) Intra block copy coding with temporal block vector prediction
EP3446480A1 (en) Prediction systems and methods for video coding based on filtering nearest neighboring pixels
US9648319B2 (en) Device and method for scalable coding of video information based on high efficiency video coding
KR20210107021A (ko) 조도 보상에 대한 블록 사이즈 제한

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180618

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190604

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191105

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191226

R150 Certificate of patent or registration of utility model

Ref document number: 6640751

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250