JP7391456B2 - 画像処理方法、装置、端末及びコンピュータプログラム - Google Patents

画像処理方法、装置、端末及びコンピュータプログラム Download PDF

Info

Publication number
JP7391456B2
JP7391456B2 JP2022524011A JP2022524011A JP7391456B2 JP 7391456 B2 JP7391456 B2 JP 7391456B2 JP 2022524011 A JP2022524011 A JP 2022524011A JP 2022524011 A JP2022524011 A JP 2022524011A JP 7391456 B2 JP7391456 B2 JP 7391456B2
Authority
JP
Japan
Prior art keywords
prediction mode
prediction
unit
correlation
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022524011A
Other languages
English (en)
Other versions
JP2023500223A (ja
Inventor
宏▲順▼ ▲張▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2023500223A publication Critical patent/JP2023500223A/ja
Application granted granted Critical
Publication of JP7391456B2 publication Critical patent/JP7391456B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本出願は、2020年2月12日に中国特許庁に提出され、出願番号が第202010088822.5号であり、発明の名称が「画像予測処理方法、装置、端末及びコンピュータ可読記憶媒体」である中国特許出願の優先権を主張して、その全ての内容は本出願に援用される。
本出願は、ビデオ符号化の技術分野に関し、特に、画像処理方法、装置、端末及びコンピュータ可読記憶媒体に関する。
ビデオ符号化技術の発展に伴い、多種のビデオ符号化標準が出てきた。ビデオ符号化標準において、一般的に、多種の予測モードを提供する。現在、ビデオ符号化の過程で、最終的に採用する予測モードを決定するために、各種の予測モードでのレート歪みコストを計算する必要がある。
本出願の実施例は、符号化ユニットの符号化予測方式を自己適応且つ迅速に決定できる画像処理方法、装置、端末及びコンピュータ可読記憶媒体を提供する。
本出願の実施例は画像処理方法を提供し、前記方法は、
画像フレームにおける現在符号化ユニットの、相関符号化ユニットを含む相関ユニットセットを決定するステップであって、前記相関符号化ユニットは、前記画像フレームにおいて前記現在符号化ユニットに隣接するターゲットユニット、及び前記画像フレームにおいて前記現在符号化ユニットと親子関係を有する符号化ユニットのうちの少なくとも1つを含むステップと、
前記相関ユニットセットにおける各相関符号化ユニットの予測モードに基づき、第1統計情報を決定するステップと、
前記現在符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得するステップと、
前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定するステップであって、前記符号化予測方式は、選択した予測モード及び/又は予測モードの処理順序を指示することで、前記選択した予測モード及び/又は予測モードの処理順序に基づき、前記現在符号化ユニットに対して予測符号化を行うための方式である、ステップと、を含む。
本出願の実施例は画像処理装置を提供し、前記装置は、
画像フレームにおける現在符号化ユニットの、相関符号化ユニットを含む相関ユニットセットを決定するための処理ユニットであって、前記相関符号化ユニットは、前記画像フレームにおいて前記現在符号化ユニットに隣接するターゲットユニット、及び前記画像フレームにおいて前記現在符号化ユニットと親子関係を有する符号化ユニットのうちの少なくとも1つを含む処理ユニットと、
前記相関ユニットセットにおける各相関符号化ユニットの予測モードに基づき、第1統計情報を決定するための取得ユニットと、を含み、
前記取得ユニットはさらに、前記現在符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得し、
前記処理ユニットはさらに、前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定し、前記符号化予測方式は、選択した予測モード及び/又は予測モードの処理順序を指示することで、前記選択した予測モード及び/又は予測モードの処理順序に基づき、前記現在符号化ユニットに対して予測符号化を行うための方式である。
本出願の実施例は端末を提供し、前記端末は、実行可能なプログラムコードが記憶されるメモリと、前記実行可能なプログラムコードを呼び出すことで、上記の画像処理方法を実行するためのプロセッサーと、を含む。
本出願の実施例はコンピュータ可読記憶媒体を提供し、前記コンピュータ可読記憶媒体には命令が記憶され、前記命令はコンピュータで実行される場合、コンピュータに上記の画像処理方法を実行させる。
本発明の実施例は符号化ユニットに隣接する、及び/又は符号化ユニットと親子関係を有するユニットの予測モードに基づき、第1統計情報を決定し、符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得し、第1統計情報及び第2統計情報に基づき、符号化ユニットの符号化予測方式を決定し、符号化ユニットの符号化予測方式を自己適応且つ迅速に決定でき、符号化予測方式の決定効率を向上させる。
本出願の実施例又は従来技術における技術案をより明らかに説明するために、以下では、実施例又は従来技術の記載の必要な図面を簡単に紹介するが、当然ながら、以下に記載の図面は本出願のいくつかの実施例に過ぎず、当業者にとって、進歩性に値する労働をしない前提で、これらの図面に基づき、他の図面を取得できる。
本出願の実施例が提供するHEVC符号化フレームワークの概略図である。 本出願の実施例に係るフレーム間予測モードに対応する分割方法の概略図である。 本出願の実施例が提供する予測フロー概略図である。 本出願の実施例が提供する画像処理方法のフロー概略図である。 本出願の実施例が提供するユニットの間の位置関係の概略図である。 本出願の実施例が提供する符号化予測方式を決定するフロー概略図である。 本出願の実施例が提供する符号化予測方式を決定する別のフロー概略図である。 本出願の実施例が提供する別の予測フロー概略図である。 本出願の実施例が提供する別の予測フロー概略図である。 本出願の実施例が提供する画像処理装置の構成概略図である。 本出願の実施例が提供する端末の構成概略図である。
以下では、本出願の実施例の図面を結合して、本出願の実施例の技術案を明確且つ完全に記載する。まず、本出願の実施例に係るいくつかの用語を簡単に紹介する。
画像フレーム:1つのビデオはいくつかのフレームの画像フレームからなる。ビデオ圧縮符号化は一般的に、ブロックによる符号化方法を採用し、即ち、ビデオにおける1つのフレームの画像フレームを、互いに重複しない複数のブロックに分けてから、これらのブロックを符号化する。ビデオ符号化の場合、各画像フレームはフレーム間予測符号化方法又はフレーム内予測符号化方法を採用してもよい。
高効率ビデオ符号化(High Efficient Video Coding、HEVC)標準において、符号化ユニット、予測ユニット及び変換ユニットの概念を提出した。符号化ユニット(Coding Uint、CU):1つの画像フレームにおいて符号化を行うための基本的なユニットである。符号化ユニットは64×64、32×32、16×16、8×8などの画素サイズのブロックであってもよい。予測ユニット(Predict Unit、PU):1つの画像フレームにおいて予測するための基本的なユニットである。予測ユニットは64×64、64×32、32×64、32×32、32×16、16×32、16×16、16×8、8×16、8×8、8×4、4×8、4×4などの画素サイズのブロックであってもよい。変換ユニット(Transform Unit、TU):1つの画像フレームにおいて、残差(Residual)又は変換係数(Transform Coefficients)を表現する基本的なユニットである。変換ユニットは、32×32、16×16、8×8、4×4などの画素サイズのブロックであってもよい。
DB:deblocking filter、デブロッキングフィルタ;SAO:Sample Adaptive Offset、自己適応画素補償;ME:Motion Estimation、モーション推定;RDcost:Rate Distortioncost、レート歪みコスト、複数のオプションにおける最高選択に用いられる。
ビデオ符号化技術の発展傾向は、高解像度、高フレームレート及び高圧縮率であり、例えば、H.264のような現在普及されているビデオ圧縮符号化標準は、原理的に一定の局所性があり、ビデオ符号化技術の上記の要求を満たすことができないため、高効率ビデオ符号化HEVC標準が出てきた。図1に示すように、標準なHEVC符号化フレームワークを示す。画像フレームFnを符号器に導入して、まず、一定のサイズ(例えば64×64)に従って、画像フレームFnを複数のコーディングツリーユニット(Coding Tree Uint、CTU)に分割し、コーディングツリーユニットCTUに対して深層分割を行うことで、複数の符号化ユニットCUを取得し、各CUは予測ユニットPU及び変換ユニットTUを含む。そして、各PUに対して予測処理を行って、予測値を取得し、予測値と入力データとを減算し、残差を取得する。残差に対して離散コサイン変換(DCT)及び量子化を行って、残差係数を取得し、残差係数をエントロピー符号化モジュールに導入して処理することで、コードストリームを取得する。同時に、残差係数に対して逆量子化、逆変換を行った後、再構成画像フレームの残差値を取得し、さらに、予測値と加算することで、再構成画像フレームF’nを取得し、再構成画像フレームF’nはループ内フィルタリングを経て、参照フレームキューに入って、次の画像フレームの参照画像として、順次に符号化を行う。
PU予測は、フレーム内予測及びフレーム間予測に分けられ、まず、同一予測タイプで、異なるPU同士を比較し、最適な分割モードを探し出してから、フレーム内予測モードとフレーム間予測モードとの間で比較し、現在CUでの最適予測モードを探し出すとともに、CUに対して、四分木構成による自己適応変換(Residual Quad-tree Transform、RQT)を行って、最適なTUモードを探し出して、最後、画像フレームをそれぞれのCU、及びCUに対応するPU、TUに分ける。
図2に示すように、PUの8つの分割モードを示す。フレーム間予測は、7つの分割モードを有し、2N×2Nモードと、矩形分割(Rectangle、Rect)モードと、非対称分割(Asymmetric Motion Partioning、AMP)モードとを有し、Rectモードは、2N×N及びN×2Nの二つの具体的分割モードを有し、AMPモードは、2N×nU、2N×nD、nL×2N及びnR×2Nの四つの具体的分割モードを有する。上記の7つの分割モードは、フレーム間2N×2Nモード、フレーム間2N×Nモード、フレーム間N×2Nモード、フレーム間2N×nUモード、フレーム間2N×nDモード、フレーム間nL×2Nモード、フレーム間nR×2Nモードという7つのフレーム間予測モードにそれぞれ対応する。上記の7つのフレーム間予測モード以外に、HEVC標準はフレーム間スキップ(skip)モード及びフレーム間マージ(merge)モードという2つのフレーム間予測モードをさらに提供する。フレーム間予測は、上記の9つのフレーム間予測モードから、1つの最適な予測モード、即ち、レート歪みコストが最も小さい予測モードを探し出す必要がある。フレーム間予測の最適結果とフレーム内予測の最適結果とを比較して、最終的に、フレーム間予測を選択するか、それともフレーム内予測を選択するか、を決定する。
最終的に採用する予測モードを決定するために、一般的に、各種の予測モードでのレート歪みコストを計算する必要があるが、レート歪みコストの計算量が大きいため、予測モードの決定過程の期間が長くて、効率が低い。現在、予測を行う場合、一般的に、図3のフローに従って、まず、各種のフレーム間(inter)予測モードを採用して予測し、そして、フレーム内(intra)予測モードを採用して予測する。上記の予測過程は、各種の予測モードを採用して予測するため、大量の冗長計算が存在する恐れがある。例えば、トラバース計算後、最適予測モードがintra予測モードである可能性が高いと事前に決定できると、予測を行う時、inter予測モードを行わず、intra予測のみを行って、inter予測を省略し、予測処理効率を向上させることができる。これに基づき、本出願の実施例は画像処理方法を提供し、符号化ユニットの隣接ユニットの数及び最適予測モード、符号化ユニットと親子関係を有する親符号化ユニットの数及び最適予測モード、画像フレーム前処理により得られた情報における符号化ユニットに対応する画像ブロックの数、最適予測モード及びレート歪みコスト情報を利用して、符号化ユニットの符号化予測方式を自己適応且つ迅速に決定し、当該符号化予測方式は、どの予測モード及び予測モードの処理順序を選択するかを指示することで、符号化予測方式の決定効率を効果的に向上させる。以下は詳しく説明する。
図4を参照し、本出願の実施例が提供する画像処理方法のフロー概略図である。本出願の実施例に記載の画像処理方法は、ビデオ符号化機能を有する端末、例えばコンピュータ、ビデオ符号器、サーバーなどに適用できる。当該方法は以下のステップを含む。
S401:画像フレームにおける現在符号化ユニットの相関ユニットセットを決定する。
本出願の実施例において、符号化ユニットは、画像フレームから分割された何れか1つのコーディングツリーユニットCTUに対して、深層分割を行うことで、得られた何れか1つの符号化ユニットである。画像フレームにおける分割により得られた各ユニットの間の位置関係及び区分階層関係に基づき、端末は現在符号化ユニットの相関ユニットセットを決定する。相関ユニットセットは現在符号化ユニットの相関符号化ユニットからなり、相関符号化ユニットは、画像フレームにおける、現在符号化ユニットに隣接するターゲットユニット、及び画像フレームにおける現在符号化ユニットと親子関係を有する符号化ユニットのうちの1つ又は複数を含む。
いくつかの実施例において、ターゲットユニットは、画像フレームにおける、所定方向で現在符号化ユニットに隣接する隣接ユニットであり、当該所定方向は左方、左上、上方、右上のうちの1つ又は複数であってもよい。ターゲットユニットは、画像フレームにおける、予測ユニット又は符号化ユニットであってもよい。現在符号化ユニットと親子関係を有する符号化ユニットは、現在符号化ユニットと親関係を有する符号化ユニット、即ち、現在符号化ユニットが所属する親符号化ユニット、又は現在符号化ユニットと子関係を有する符号化ユニット、即ち、現在符号化ユニットから分割された子符号化ユニットである。
S402:前記相関ユニットセットにおける各相関符号化ユニットの予測モードに基づき、第1統計情報を決定する。
本出願の実施例において、端末は相関ユニットセットにおける各相関符号化ユニットの、第1予測モード又は第2予測モードを含む予測モードを取得し、取得した各相関符号化ユニットの予測モードに基づき、相関ユニットセットにおいて予測モードが第1予測モードである相関符号化ユニットの数を統計し、相関ユニットセットにおいて予測モードが第1予測モードである相関符号化ユニットの数を第1統計情報に決定する。いくつかの実施形態において、第1予測モードはフレーム内予測モード、即ち、intra予測モードであり、第2予測モードはフレーム間予測モード、即ち、inter予測モードである。
他のいくつかの実施例において、端末は、相関ユニットセットにおける相関符号化ユニットの総数、及び相関ユニットセットにおける各相関符号化ユニットの予測モードを取得し、取得した各相関符号化ユニットの予測モードに基づき、相関ユニットセットにおいて予測モードが第1予測モードである相関符号化ユニットの数を統計し、相関ユニットセットにおいて予測モードが第1予測モードである相関符号化ユニットの数、及び相関ユニットセットにおける相関符号化ユニットの総数を第1統計情報に決定する。
いくつかの実施形態において、相関符号化ユニットの総数は、相関ユニットセットにおける符号化ユニットの親符号化ユニットの数とターゲットユニットの数との和、又は、相関ユニットセットにおける符号化ユニットの子符号化ユニットの数とターゲットユニットの数との和である。予測モードが第1予測モードである相関符号化ユニットの数は、予測モードが第1予測モードであるターゲットユニットの数と、現在符号化ユニットの親符号化ユニットにおいて予測モードが第1予測モードである親符号化ユニットの数との和、又は、予測モードが第1予測モードであるターゲットユニットの数と、現在符号化ユニットの子符号化ユニットにおいて予測モードが第1予測モードである子符号化ユニットの数との和である。
例えば、第1予測モードはintra予測モードであり、ターゲットユニットは予測ユニットである。図5に示すように、Eは符号化ユニットを示し、A、B、C、Dは、符号化ユニットEに隣接する予測ユニットPUであり、予測ユニットA、B、C、Dの最適予測モードは決定されている。501は符号化ユニットEの親符号化ユニットを示し、502は符号化ユニットEの子符号化ユニットを示し、図5において、中点位置に従って、符号化ユニットEを4つの子符号化ユニットに分割する。予測ユニットA、B、C、D及び符号化ユニットEの親符号化ユニット又は子符号化ユニットはいずれも符号化ユニットEの相関符号化ユニットである。符号化ユニットEの、A、B、C、Dという4つの位置での隣接予測ユニットが存在するかどうかを統計し、隣接予測ユニットの数を記録し、nBlock1と記して、隣接予測ユニットにおいて最適予測モードがintra予測モードであるユニットの数を記録し、nIntra1と記する。符号化順序のため、符号化ユニットEの親符号化ユニット及び子符号化ユニットには1つの状況のみが存在し、即ち、親符号化ユニットが存在すると、子符号化ユニットが存在せず、子符号化ユニットが存在すると、親符号化ユニットが存在しない。
符号化ユニットEの親符号化ユニットが存在し、且つ親符号化ユニットが1つだけあると、nBlock1の数に1を加算し、符号化ユニットEの相関符号化ユニットの総数nBlockを取得する。親符号化ユニットの最適予測モードがintra予測モードであると、nIntra1の数に1を加算し、符号化ユニットEの相関符号化ユニットにおいて予測モードがintra予測モードである相関符号化ユニットの数nIntraを取得する。
符号化ユニットEの子符号化ユニットが存在し、且つ子符号化ユニットの数が4であると、nBlock1の数に4を加算し、符号化ユニットEの相関符号化ユニットの総数nBlockを取得し、各子符号化ユニットの最適予測モードがintra予測モードであるかどうかを1つずつ判定する。4つの子符号化ユニットの最適予測モードがいずれもintra予測モードであると、nIntra1の数に4を加算し、符号化ユニットEの相関符号化ユニットにおいて予測モードがintra予測モードである相関符号化ユニットの数nIntraを取得する。
S403:前記現在符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得する。
本出願の実施例において、現在符号化ユニットに対応する前処理画像ブロックは、現在符号化ユニットに対応する画像フレームに対する前処理過程で、画像フレームにおいて現在符号化ユニットに対応する画像領域から分割された画像ブロックを指す。いくつかの実施形態において、端末は、現在符号化ユニットに対応する各前処理画像ブロックの予測モードを取得し、当該予測モードは、第1予測モード又は第2予測モードを含む。取得した各前処理画像ブロックの予測モードに基づき、現在符号化ユニットに対応する前処理画像ブロックにおいて予測モードが第1予測モードである前処理画像ブロックの数を統計し、予測モードが第1予測モードである前処理画像ブロックの数を第2統計情報に決定する。第1予測モードはフレーム内予測モードであってもよく、第2予測モードはフレーム間予測モードであってもよい。
他のいくつかの実施形態において、端末は、現在符号化ユニットに対応する前処理画像ブロックの総数、及び各前処理画像ブロックの予測モードを取得し、取得した各前処理画像ブロックの予測モードに基づき、現在符号化ユニットに対応する前処理画像ブロックにおいて予測モードが第1予測モードである前処理画像ブロックの数を統計し、前処理画像ブロックの総数、予測モードが第1予測モードである前処理画像ブロックの数を第2統計情報に決定する。
他のいくつかの実施形態において、端末は現在符号化ユニットに対応する前処理画像ブロックの総数、及び各前処理画像ブロックの予測モード、レート歪みコスト情報を取得し、レート歪みコスト情報はフレーム内レート歪みコスト及びフレーム間レート歪みコストを含み、フレーム内レート歪みコストは、前処理画像ブロックが第1予測モード(又はフレーム内予測モードとも呼ばれる)を採用する際の最適レート歪みコストであり、フレーム間レート歪みコストは、前処理画像ブロックが第2予測モード(又はフレーム間予測モードとも呼ばれる)を採用する際の最適レート歪みコストである。各前処理画像ブロックの予測モードに基づき、予測モードが第1予測モードである前処理画像ブロックの数を決定し、各前処理画像ブロックのフレーム内レート歪みコストを蓄積して、フレーム内レート歪みコストの総和値を取得し、各前処理画像ブロックのフレーム間レート歪みコストを蓄積して、フレーム間レート歪みコストの総和値を取得する。端末は前処理画像ブロックの総数と、フレーム内レート歪みコストの総和値と、フレーム間レート歪みコストの総和値とのうちの1つ又は複数、及び予測モードが第1予測モードである前処理画像ブロックの数を、第2統計情報に決定する。
画像フレーム符号化過程で、一般的に、前処理過程、例えばx265における予測先行(lookahead)処理過程を有する。シーケンスを事前分析することで、フレームタイプへの判定、ビットレート制御への指導などを目的とする。x265は、高効率ビデオ符号化標準に合うビデオのためのオープンソース・フリーフリーソフトウェア、及び関数ライブラリである。前処理過程により得られる一部の情報は、以降の符号化予測過程に対する指導に用いられる。前処理の実行過程で、固定の画像ブロックのサイズに従って、画像フレームに対して、フレーム内予測及びフレーム間予測を行って、現在符号化ユニットに対応する画像領域における画像ブロックの統計情報である、画像ブロックの総数、フレーム内レート歪みコストの総和値、フレーム間レート歪みコストの総和値、最適予測モードが第1予測モードである画像ブロックの数などを取得し、現在符号化ユニットの符号化予測方式の決定の際に参照できる。
例えば、16×16のサイズに従って、画像フレームを分割し、各16×16の画像ブロックに対して、フレーム内予測及びフレーム間予測処理を行って、各16×16の画像ブロックのフレーム内予測の最適レート歪みコスト、及びフレーム間予測の最適レート歪みコストを取得できる。現在符号化ユニットのサイズが8×8又は16×16であると、現在符号化ユニットに対応する画像領域には、1つの画像ブロックしかなく、現在符号化ユニットのサイズが32×32であると、現在符号化ユニットに対応する画像領域には4つの画像ブロックがあり、現在符号化ユニットのサイズは64×64であると、現在符号化ユニットに対応する画像領域には16個の画像ブロックがある。現在符号化ユニットに対応する画像領域における画像ブロックの総数を取得し、numと記して、現在符号化ユニットに対応する画像領域における画像ブロックのフレーム内予測の最適レート歪みコストの蓄積和、即ち、フレーム内レート歪みコストの総和値を取得し、intracostと記して、現在符号化ユニットに対応する画像領域における画像ブロックのフレーム間予測の最適レート歪みコストの蓄積和、即ち、フレーム間レート歪みコストの総和値を取得し、intercostと記して、現在符号化ユニットに対応する画像領域における画像ブロックのうちの、最適予測モードがintra予測モードである画像ブロックの数を取得し、intra_numと記する。
S404:前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定する。
いくつかの実施例において、第1統計情報は、予測モードが第1予測モードである相関符号化ユニットの数を含み、第2統計情報は、予測モードが第1予測モードである前処理画像ブロックの数を含む。端末は、予測モードが第1予測モードである相関符号化ユニットの数が、第1所定値以上であるかどうか、及び予測モードが第1予測モードである前処理画像ブロックの数が第2所定値以上であるかどうかを検出し、予測モードが第1予測モードである相関符号化ユニットの数が第1所定値以上であり、且つ予測モードが第1予測モードである前処理画像ブロックの数が第2所定値以上であると、第1予測モードを採用して現在符号化ユニットに対して予測処理を行った後、第2予測モードを採用して現在符号化ユニットに対して予測処理を行うように、現在符号化ユニットの符号化予測方式を決定するか、又は、第1予測モードを採用して現在符号化ユニットに対して予測処理を行うように、現在符号化ユニットの符号化予測方式を決定する。
他のいくつかの実施例において、第1統計情報は、予測モードが第1予測モードである相関符号化ユニットの数、及び相関符号化ユニットの総数を含み、第2統計情報は、予測モードが第1予測モードである前処理画像ブロックの数、及び前処理画像ブロックの総数を含む。端末は、予測モードが第1予測モードである相関符号化ユニットの数が、第1所定値以上であるかどうか、及び相関符号化ユニットの総数が第3所定値以上であるかどうかを検出する。第1予測モードの相関符号化ユニットの数が第1所定値以上であり、且つ相関符号化ユニットの総数が第3所定値以上であると、予測モードが第1予測モードである前処理画像ブロックの数が第2所定値以上であるかどうか、及び前処理画像ブロックの総数が第4所定値以上であるかどうかをさらに検出し、予測モードが第1予測モードである前処理画像ブロックの数が第2所定値以上であり、前処理画像ブロックの総数が第4所定値以上であると、第1予測モードを採用して現在符号化ユニットに対して予測処理を行った後、第2予測モードを採用して現在符号化ユニットに対して予測処理を行うように、現在符号化ユニットの符号化予測方式を決定するか、又は、第1予測モードを採用して現在符号化ユニットに対して予測処理を行うように、現在符号化ユニットの符号化予測方式を決定する。
上記の2つの方法において、現在符号化ユニットの相関符号化ユニットにおいて予測モードが第1予測モードである相関符号化ユニットの数、及び現在符号化ユニットに対応する前処理画像ブロックにおいて予測モードが第1予測モードである前処理画像ブロックの数に基づき、現在符号化ユニットの符号化予測方式を自己適応に決定する。予測モードが第1予測モードである相関符号化ユニットの数、及び予測モードが第1予測モードである前処理画像ブロックの数がいずれも所定値よりも大きい場合、現在符号化ユニットの最適予測モードが第1予測モードである可能性が高いと決定でき、この場合、直接的に第1予測モードを現在符号化ユニットの予測モードに決定し、又は第1予測モードを前倒しにするように決定する。数の統計過程及び数の大きさの比較過程に係る計算量が小さくて、時間が短いため、上記の方法を採用すれば、符号化ユニットの符号化予測方式を正確に決定した上で、符号化予測方式の決定効率を効果的に向上させる。
上記の2つの方法の判定条件は簡単であるため、決定した符号化予測方式の正確さが低くて、決定した符号化予測方式の正確さを向上させるために、以下の決定方法を採用すればよい。第1統計情報は、予測モードが第1予測モードである相関符号化ユニットの数、及び相関符号化ユニットの総数を含み、第2統計情報は、予測モードが第1予測モードである前処理画像ブロックの数、前処理画像ブロックの総数、フレーム内レート歪みコストの総和値、及び前記フレーム間レート歪みコストの総和値を含む。
いくつかの実施形態において、予測モードが第1予測モードである相関符号化ユニットの数、相関符号化ユニットの総数、予測モードが第1予測モードである前処理画像ブロックの数、前処理画像ブロックの総数、フレーム内レート歪みコストの総和値及びフレーム間レート歪みコストの総和値が、第1所定条件を満たすかどうかを検出し、第1所定条件を満たすと、第1符号化予測方式を現在符号化ユニットの符号化予測方式に決定する。第1符号化予測方式は、第1予測モードを採用して現在符号化ユニットに対して予測処理を行った後、第2予測モードを採用して現在符号化ユニットに対して予測処理を行う。
第1所定条件を満たすことは、予測モードが第1予測モードである前処理画像ブロックの数と、前処理画像ブロックの総数との間の差値が、ターゲット数値の以下であり、相関符号化ユニットの総数が第1数値以上であり、予測モードが第1予測モードである相関符号化ユニットの数が第2数値以上であり、フレーム内レート歪みコストの総和値が、フレーム間レート歪みコストの総和値と第1参照値とを乗算することにより得られた値よりも小さいことである。なお、当該第2数値は、相関符号化ユニットの総数に基づき決定され、例えば、相関符号化ユニットの総数の半分であり、当該第1参照値は符号化速度と正の相関を有し、0よりも大きく、且つ1以下である数値である。当該ターゲット数値は、例えば0であり、当該第1数値は、例えば2である。
他の実施形態において、予測モードが第1予測モードである相関符号化ユニットの数、相関符号化ユニットの総数、予測モードが第1予測モードである前処理画像ブロックの数、前処理画像ブロックの総数、フレーム内レート歪みコストの総和値及びフレーム間レート歪みコストの総和値が、第1所定条件を満たすかどうかを検出する。第1所定条件を満たすと、予測モードが第1予測モードである相関符号化ユニットの数、相関符号化ユニットの総数、フレーム内レート歪みコストの総和値及びフレーム間レート歪みコストの総和値が第2所定条件を満たすかどをさらに検出し、第2所定条件を満たすと、第2符号化予測方式を現在符号化ユニットの符号化予測方式に決定する。第2所定条件を満たしていないと、第1符号化予測方式を現在符号化ユニットの符号化予測方式に決定する。第2符号化予測方式は第1予測モードを採用して現在符号化ユニットに対して予測処理を行う。
第2所定条件を満たすことは、予測モードが第1予測モードである相関符号化ユニットの数と、相関符号化ユニットの総数との間の差値がターゲット数値の以下であり、フレーム内レート歪みコストの総和値が、フレーム間レート歪みコストの総和値と第2参照値とを乗算することにより得られた値よりも小さいことである。なお、当該第2参照値は符号化速度と正の相関を有し、0以上且つ1以下の数値であるとともに、当該第1参照値よりも小さい。当該ターゲット数値は、例えば0であり、第2所定条件におけるターゲット数値と、第1所定条件におけるターゲット数値とは同様であってもよいし、異なってもよい。第1所定条件を満たすことに関する内容について、以上の記載を参照すればよく、ここで、贅言しない。
例えば、第1予測モードはintra予測モードであり、第2予測モードはinter予測モードである。現在符号化ユニットの相関ユニットセットにおける相関符号化ユニットの総数はnBlockであり、相関ユニットセットにおける予測モードがintra予測モードである相関符号化ユニットの数はnIntraであり、現在符号化ユニットに対応する前処理画像ブロックの総数はnumであり、予測モードがintra予測モードである前処理画像ブロックの数はintra_numであり、前処理画像ブロックのフレーム内レート歪みコストの総和値、及びフレーム間レート歪みコストの総和値はそれぞれintracost、intercostである。第1参照値はthr1であり、第2参照値はthr2である。図6に示すように、nBlock、nIntra、num、intra_num、intracost、intercostという五つの間は、式1に示す関係を満たすかどうかを判定し、式1は以下の通りである。
(nBlock>=2)&(nIntra>nBlock/2)&(num=intra_num)&(intracost<intercost×thr1)
&は「且つ」を意味する。第1参照値thr1の値の範囲は0.9~1であり、符号化速度が遅い場合、thr1の値を0.9にして、符号化速度が速くなることに連れて、thr1も漸増する。式1を満たすと、現在符号化ユニットに対応する各前処理画像ブロックの予測モードはいずれもintra予測モードであり、現在符号化ユニットの相関符号化ユニットの数は2以上であり、現在符号化ユニットの相関符号化ユニットにおける、半分を超えるユニットの予測モードはintra予測モードであり、前処理画像ブロックのフレーム内レート歪みコストの総和値intracostは、フレーム間レート歪みコストの総和値intercostと第1参照値thr1とを乗算することにより得られた値よりも小さいことを示す。この場合、現在符号化ユニットの最適予測モードはintra予測モードである可能性が高くて、intra予測を前倒しにしてもよいため、intra予測モードを採用して、現在符号化ユニットに対して予測処理を行ってから、intra予測モードを採用して、現在符号化ユニットに対して予測処理を行うように、現在符号化ユニットの符号化予測方式を決定する。
intra予測を前倒しにすると決定した後、nIntra、nBlock、intracost、intercostという4つの間は、式2に示す関係を満たすかどうかをさらに判定し、式2は以下の通りである。
(nIntra=nBlock)&(intracost<intercost×thr2)
第2参照値thr2は第1参照値thr1よりも小さく、thr2の値の範囲は0~0.4であってもよく、符号化速度が遅い場合、thr2の値を0にして、符号化速度が速くなることに連れて、thr2も漸増する。式2を満たすと、現在符号化ユニットの各相関符号化ユニットの予測モードはいずれもintra予測モードであり、前処理画像ブロックのフレーム内レート歪みコストの総和値intracostは、フレーム間レート歪みコストの総和値intercostと第2参照値thr2とを乗算することにより得られた値よりも小さいことを示す。この場合、現在符号化ユニットの最適予測モードはintra予測モードである可能性が高くて、intra予測のみをすればよいため、intra予測モードのみを採用して、現在符号化ユニットに対して予測処理を行うように、現在符号化ユニットの符号化予測方式を決定する。
他のいくつかの実施形態において、予測モードが第1予測モードである相関符号化ユニットの数、相関符号化ユニットの総数、予測モードが第1予測モードである前処理画像ブロックの数、前処理画像ブロックの総数、フレーム内レート歪みコストの総和値及びフレーム間レート歪みコストの総和値は、第3所定条件を満たすかどうかを検出し、第3所定条件を満たすと、第3符号化予測方式を現在符号化ユニットの符号化予測方式に決定する。第3符号化予測方式は、第2予測モードを採用して現在符号化ユニットに対して予測処理を行うことである。
第3所定条件を満たすことは、相関符号化ユニットの総数は第3数値以上であり、予測モードが第1予測モードである相関符号化ユニットの数は第4数値以下であり、前処理画像ブロックの総数は第5数値以上であり、予測モードが第1予測モードである前処理画像ブロックの数は第6数値以下であり、フレーム間レート歪みコストの総和値は、前記フレーム内レート歪みコストの総和値と第3参照値とを乗算することにより得られた値よりも小さいことである。当該第3参照値は符号化速度と正の相関を有し、0よりも大きく、且つ1以下の数値である。当該第3数値は、例えば2であり、当該第5数値は、例えば1であり、当該第4数値及び第6数値は、例えば0である。
例えば、第3参照値はthr3である。図7に示すように、nBlock、nIntra、num、intra_num、intracost、intercostという5つの間は、式3に示す関係を満たすかどうかを判定し、式3は以下の通りである。
(nBlock>=2)&(nIntra=0)&(num>=1)&(intra_num=0)&(intercost<intracost×thr3)
第3参照値thr3の値の範囲は0.4~1であってもよく、符号化速度が遅い場合、thr3の値を0.4にして、符号化速度が速くになることに連れて、thr3も漸増する。式3を満たすと、現在符号化ユニットの相関符号化ユニットの数は2以上であり、各相関符号化ユニットの最適予測モードはいずれもinter予測モードであり、現在符号化ユニットは少なくとも1つの前処理画像ブロックに対応し、各前処理画像ブロックの最適予測モードはいずれもinter予測モードであり、前処理画像ブロックのフレーム間レート歪みコストの総和値intercostは、フレーム内レート歪みコストの総和値intracostと第3参照値thr3とを乗算することにより得られた値よりも小さいことを示す。この場合、現在符号化ユニットの最適予測モードはinter予測モードである可能性が高くて、inter予測のみをすればよいため、inter予測モードのみを採用して現在符号化ユニットに対して予測処理を行うように、現在符号化ユニットの符号化予測方式を決定する。
上記の3つの方法において、予測モードが第1予測モードである相関符号化ユニットの数、相関符号化ユニットの総数、予測モードが第1予測モードである前処理画像ブロックの数、前処理画像ブロックの総数、フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値という5つのパラメータの間が満たす所定条件を検出することで、現在符号化ユニットの符号化予測方式を自己適応に決定し、判定条件の複雑さを適切に増やした上で、決定した符号化予測方式の正確さを効果的に向上させ、上記の検出過程に係る計算量が同じく小さく、時間が短くて、符号化予測方式の決定効率が高い。
本出願の実施例において、符号化ユニットの符号化予測方式を決定した後、符号化予測方式の指示に従って、符号化ユニットに対して予測処理を行う。第2符号化予測方式を選択すると、以降の予測処理過程において、第1予測モードのみを採用して符号化ユニットに対して予測処理を行って、第2予測モードによる符号化ユニットに対する予測処理のステップを省略し、予測処理の時間及びソフトウェア・ハードウェアソースを節約し、予測処理の加速を実現する。第3符号化予測方式を選択すると、以降の予測処理過程において、第2予測モードのみを採用して符号化ユニットに対して予測処理を行って、第1予測モードによる、符号化ユニットに対する予測処理のステップを省略し、予測処理の時間及びソフトウェア・ハードウェアソースを節約し、予測処理の加速を実現する。
例えば、図8に示すように、選択した符号化予測方式が、intra予測のみを行うように指示すると、以降の予測処理過程において、符号化ユニットに対してintra予測処理のみを行う。選択した符号化予測方式が、inter予測のみを行うように指示すると、以降の予測処理過程において、符号化ユニットに対してMerge及び/又はskip予測処理、inter 2N×2N予測処理、Rect予測処理、AMP予測処理を順次に行うことで、符号化ユニットの最適inter予測モードを取得する。Rect予測処理は、inter 2N×N予測処理及びinter N×2N予測処理を含み、AMP予測処理はinter 2N×nU予測処理、inter 2N×nD予測処理、inter nL×2N予測処理及びinter nR×2N予測処理を含む。inter 2N×2N予測処理は、フレーム間2N×2Nモードを採用して、予測処理を行い、他の記載は類似する。
いくつかの実施例において、第1符号化予測方式を選択すると、以降の予測処理過程において、まず第1予測モードを採用して符号化ユニットに対して予測処理を行って、符号化ユニットが第1予測モードを採用する際の第1レート歪みコストを計算してから、ターゲットタイプの第2予測モードを採用して符号化ユニットに対して予測処理を行って、符号化ユニットがターゲットタイプの第2予測モードを採用する際の第2レート歪みコストを計算する。いくつかの実施形態において、ターゲットタイプの第2予測モードは、merge予測モード及び/又はskip予測モードを含む。ターゲットタイプの第2予測モードがmerge予測モード及びskip予測モードを含む場合、第2レート歪みコストは、符号化ユニットがmerge予測モードを採用する際のフレーム間レート歪みコスト、及び符号化ユニットがskip予測モードを採用する際のフレーム間レート歪みコストのうちの最小値である。
第1レート歪みコスト及び第2レート歪みコストが第4所定条件を満たすかどうかを検出する。いくつかの実施形態において、第4所定条件を満たすことは、第1レート歪みコストは、第2レート歪みコストと第4参照値とを乗算することにより得られた値よりも小さいことを示す。当該第4参照値は符号化速度と正の相関を有し、0よりも大きく、且つ1以下の数値である。第4所定条件を満たすと、符号化ユニットの最適予測モードは第1予測モードである可能性が極めて高いことを示す、この場合、第1予測モードを符号化ユニットの最適予測モードに決定し、後続の他のタイプの第2予測モードによる、符号化ユニットに対する予測処理のステップを終了させ、第2予測モードによる、符号化ユニットに対する予測処理の一部のステップを省略するとともに、予測処理の時間及びソフトウェア・ハードウェアソースをある程度で節約し、予測処理の加速を実現する。
例えば、第4参照値はthr4である。図9に示すように、符号化予測方式は、まずintra予測を行うように指示する場合、予測処理の過程で、符号化ユニットに対してintra予測を行って、intra予測の最適フレーム内レート歪みコストintrabestcostを計算してから、符号化ユニットに対して、inter予測におけるmerge及びskip予測を行って、merge及びskip予測の最適フレーム間レート歪みコストinterbestcostを計算する。Intrabestcostが、interbestcostと第4参照値thr4とを乗算することにより得られた値よりも小さいと、符号化ユニットの最適予測モードはintra予測モードである可能性が極めて高くて、この場合、intra予測モードを符号化ユニットの最適予測モードに決定し、残りのinter予測を終了させることで、一部のinter予測ステップをスキップし、これによって、予測の加速を実現する。intrabestcostはinterbestcostと第4参照値thr4とを乗算することにより得られた値以上であれば、残りのinter予測を引き続いて実行することで、符号化ユニットの最適予測モードを取得する。
ここで、最適予測モードは、レート歪みコストが最も小さい予測モードである。以上の例において、いずれも第1予測モードがフレーム内予測モードであり、第2予測モードがフレーム間予測モードであることについて説明した。ここで、第1予測モードはフレーム間予測モードであってもよく、第2予測モードはフレーム内予測モードであってもよく、この場合、相応的な処理方法は類似する。
本出願の実施例において、符号化ユニットに隣接する、及び/又は符号化ユニットと親子関係を有するユニットの予測モードに基づき、第1統計情報を決定し、符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得し、第1統計情報及び第2統計情報に基づき、符号化ユニットの符号化予測方式を決定することで、符号化ユニットの符号化予測方式を自己適応且つ迅速に決定でき、符号化予測方式の決定効率を向上させる。
図10を参照し、本出願の実施例が提供する画像処理装置の構成概略図である。本出願の実施例に記載の画像処理装置は、以上に記載の端末に対応し、前記装置は、
画像フレームにおける現在符号化ユニットの、相関符号化ユニットが含まれる相関ユニットセットを決定するための処理ユニット1001であって、前記相関符号化ユニットは、前記画像フレームにおいて前記現在符号化ユニットに隣接するターゲットユニット、及び前記画像フレームにおいて前記現在符号化ユニットと親子関係を有する符号化ユニットのうちの少なくとも1つを含む処理ユニット1001と、
前記相関ユニットセットにおける各相関符号化ユニットの予測モードに基づき、第1統計情報を決定するための取得ユニット1002と、を含み、
前記取得ユニット1002はさらに、前記現在符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得し、
前記処理ユニット1001はさらに、前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定し、前記符号化予測方式は、選択した予測モード及び/又は予測モードの処理順序を指示することで、前記選択した予測モード及び/又は予測モードの処理順序に基づき、前記現在符号化ユニットに対して予測符号化を行う。
いくつかの実施例において、前記第1統計情報は、前記予測モードが第1予測モードである相関符号化ユニットの数、及び前記相関符号化ユニットの総数を含み、
前記第2統計情報は、前記前処理画像ブロックの総数、前記予測モードが第1予測モードである前処理画像ブロックの数、及び前記レート歪みコスト情報を含む。
いくつかの実施例において、前記処理ユニット1001はさらに、前記第1統計情報及び前記第2統計情報が第1所定条件を満たし、前記第1統計情報及び前記第2統計情報が第2所定条件を満たしていないと、第1符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定し、なお、前記第1符号化予測方式は、第1予測モードを採用して前記現在符号化ユニットに対して、予測処理を行った後、第2予測モードを採用して前記現在符号化ユニットに対して、予測処理を行うことである。
いくつかの実施例において、前記処理ユニット1001はさらに、第1符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定した後、前記現在符号化ユニットが前記第1予測モードを採用する際の第1レート歪みコスト、及び前記現在符号化ユニットがターゲットタイプの第2予測モードを採用する際の第2レート歪みコストを計算し、
前記第1レート歪みコスト及び前記第2レート歪みコストが第4所定条件を満たすと、前記第1予測モードを前記現在符号化ユニットの予測モードに決定し、他のタイプの第2予測モードによる、前記現在符号化ユニットに対する予測処理の動作を終了させる。
いくつかの実施例において、前記処理ユニット1001はさらに、前記第1統計情報及び前記第2統計情報が前記第1所定条件、及び前記第2所定条件を満たすと、第2符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定し、なお、前記第2符号化予測方式は、第1予測モードを採用して前記現在符号化ユニットに対して予測処理を行うことである。
いくつかの実施例において、前記処理ユニット1001はさらに、前記第1統計情報及び前記第2統計情報が第3所定条件を満たすと、第3符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定し、なお、前記第3符号化予測方式は第2予測モードを採用して前記現在符号化ユニットに対して予測処理を行うことである。
いくつかの実施例において、前記取得ユニット1002は具体的に、前記相関ユニットセットにおける相関符号化ユニットの総数、及び各相関符号化ユニットの予測モードを取得し、
前記処理ユニット1001は具体的に、前記各相関符号化ユニットの予測モードに基づき、前記相関ユニットセットにおける、予測モードが第1予測モードである相関符号化ユニットの数を決定し、前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数を第1統計情報に決定する。
いくつかの実施例において、前記取得ユニット1002は具体的に、前記符号化ユニットに対応する前処理画像ブロックの総数を取得し、且つ各前処理画像ブロックの予測モード、レート歪みコスト情報を取得し、
前記処理ユニット1001は具体的に、前記各前処理画像ブロックの予測モードに基づき、予測モードが第1予測モードである前処理画像ブロックの数を決定し、前記前処理画像ブロックの総数、前記予測モードが第1予測モードである前処理画像ブロックの数、及び前記レート歪みコスト情報に基づき、第2統計情報を決定する。
いくつかの実施例において、前記レート歪みコスト情報はフレーム内レート歪みコスト及びフレーム間レート歪みコストを含み、前記処理ユニット1001は具体的に、前記各前処理画像ブロックのレート歪みコスト情報に基づき、フレーム内レート歪みコストの総和値及びフレーム間レート歪みコストの総和値を決定し、前記前処理画像ブロックの総数、前記予測モードが第1予測モードである前処理画像ブロックの数、前記フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値を、第2統計情報に決定する。
いくつかの実施例において、前記相関符号化ユニットの総数は、前記ターゲットユニットの数と、前記現在符号化ユニットと親関係を有する親符号化ユニットの数との和であり、又は、前記ターゲットユニットの数と、前記現在符号化ユニットと子関係を有する子符号化ユニットの数との和であり、前記予測モードが第1予測モードである相関符号化ユニットの数は、予測モードが第1予測モードであるターゲットユニットの数、及び前記現在符号化ユニットと親関係を有する符号化ユニットにおいて予測モードが第1予測モードである親符号化ユニットの数に基づき決定され、又は予測モードが第1予測モードであるターゲットユニットの数、及び前記現在符号化ユニットと子関係を有する符号化ユニットにおいて予測モードが第1予測モードである子符号化ユニットの数に基づき決定される。
いくつかの実施例において、前記処理ユニット1001は具体的に、
前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数、前記予測モードが前記第1予測モードである前処理画像ブロックの数、前記前処理画像ブロックの総数、前記フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値が第1所定条件を満たすかどうかを検出し、前記第1所定条件を満たすと、第1符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定し、前記第1符号化予測方式は第1予測モードを採用して前記現在符号化ユニットに対して、予測処理を行った後、第2予測モードを採用して前記現在符号化ユニットに対して、予測処理を行うことである。
いくつかの実施例において、前記第1所定条件を満たすことは、前記予測モードが第1予測モードである前処理画像ブロックの数と前記前処理画像ブロックの総数との間の差値がターゲット数値以下であり、前記相関符号化ユニットの総数が第1数値以上であり、前記予測モードが第1予測モードである相関符号化ユニットの数が第2数値以上であり、前記フレーム内レート歪みコストの総和値は、前記フレーム間レート歪みコストの総和値と第1参照値とを乗算することにより得られた値よりも小さく、前記第2数値は前記相関符号化ユニットの総数に基づき、決定されることを示す。
いくつかの実施例において、前記処理ユニット1001は具体的に、
前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数、前記予測モードが前記第1予測モードである前処理画像ブロックの数、前記前処理画像ブロックの総数、前記フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値が第1所定条件を満たすかどうかを検出し、前記第1所定条件を満たすと、前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数、前記フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値が第2所定条件を満たすかどうかを検出し、前記第2所定条件を満たすと、第2符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定し、前記第2符号化予測方式は第1予測モードを採用して、前記現在符号化ユニットに対して予測処理を行うことである。
いくつかの実施例において、前記第2所定条件を満たすことは、前記予測モードが第1予測モードである相関符号化ユニットの数と前記相関符号化ユニットの総数との間の差値がターゲット数値以下であり、前記フレーム内レート歪みコストの総和値が、前記フレーム間レート歪みコストの総和値と第2参照値とを乗算することにより得られた値よりも小さいことである。
いくつかの実施例において、前記処理ユニット1001は具体的に、
前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数、前記予測モードが前記第1予測モードである前処理画像ブロックの数、前記前処理画像ブロックの総数、前記フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値が第3所定条件を満たすかどうかを検出し、前記第3所定条件を満たすと、第3符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定し、なお、前記第3符号化予測方式は第2予測モードを採用して前記現在符号化ユニットに対して予測処理を行うことである。
いくつかの実施例において、前記第3所定条件を満たすことは、前記相関符号化ユニットの総数が第3数値以上であり、前記予測モードが第1予測モードである相関符号化ユニットの数が第4数値以下であり、前記前処理画像ブロックの総数が第5数値以上であり、前記予測モードが前記第1予測モードである前処理画像ブロックの数が第6数値の以下であり、前記フレーム間レート歪みコストの総和値が、前記フレーム内レート歪みコストの総和値と第3参照値とを乗算することにより得られる値よりも小さいことである。
いくつかの実施例において、前記装置は、前記符号化ユニットが前記第1予測モードを採用する際の第1レート歪みコスト、及び前記符号化ユニットがターゲットタイプの第2予測モードを採用する際の第2レート歪みコストを計算するための計算ユニット1003を含み、
前記処理ユニット1001はさらに、前記第1レート歪みコスト及び前記第2レート歪みコストが第4所定条件を満たすかどうかを検出し、前記第4所定条件を満たすと、前記第1予測モードを前記符号化ユニットの予測モードに決定する。
いくつかの実施例において、前記ターゲットタイプの第2予測モードは、merge予測モード(HEVC標準が提供する予測モードであり)及び/又はskip予測モード(HEVC標準が提供する予測モードである)を含み、前記第4所定条件を満たすことは、上記第1レート歪みコストは、前記第2レート歪みコストと第4参照値とを乗算することにより得られる値よりも小さいことである。
ここで、上記の方法実施例における方法に基づき、本出願の実施例の画像処理装置の各機能ユニットの機能を具体的に実現でき、その具体的な実現過程について、上記の方法実施例の関連記載を参照すればよく、ここで、贅言しない。
本出願の実施例において、符号化ユニットに隣接し、及び/又は符号化ユニットと親子関係を有するユニットの予測モードに基づき、第1統計情報を決定し、符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得し、第1統計情報及び第2統計情報に基づき、符号化ユニットの符号化予測方式を決定することで、符号化ユニットの符号化予測方式を自己適応且つ迅速に決定でき、符号化予測方式の決定効率を向上させる。
図11を参照し、図11は、本出願の実施例が提供する端末の構成概略図である。本出願の実施例に記載の端末は、プロセッサー1101とメモリ1102とを含む。プロセッサー1101、メモリ1102はバス又は他の形態で接続されてもよく、本出願の実施例は、バスによる接続を例とする。
プロセッサー1101は、中央処理装置(central processing unit、CPU)であってもよい。前記プロセッサー1101はハードウェアチップであってもよい。前記ハードウェアチップは専用集積回路(application-specific integrated circuit、ASIC)、プログラマブルロジックデバイス(programmable logic device、PLD)又はその組み合わせであってもよい。前記PLDは複雑なプログラマブルロジックデバイス(complex programmable logic device、CPLD)、フィールドプログラマブルロジックゲートアレイ(field-programmable gate array、FPGA)、汎用アレイロジック(generic array logic、GAL)又はその任意の組み合わせであってもよい。
メモリ1102は、主にプログラ記憶領域及びデータ記憶領域を含み、プログラ記憶領域はオペレーティングシステム、少なくとも1つの機能の必要な記憶プログラム(例えば文字記憶機能、位置記憶機能など)を記憶でき、データ記憶領域は、装置の使用に基づき生成したデータ(例えば画像データ、文字データ)などを記憶でき、アプリケーション記憶プログラムなどを含んでもよい。また、メモリ1102は高速ランダムアクセスメモリを含んでもよいし、非揮発性メモリ、例えば少なくとも1つの磁気ディスク記憶デバイス、フラッシュメモリデバイス、又は他の揮発性固体記憶デバイスを含んでもよい。
前記メモリ1102はさらにプログラム命令を記憶する。前記プロセッサー1101は、前記メモリ1102に記憶されるプログラム命令を実行し、前記プログラム命令を実行する場合、前記プロセッサー1101は、
画像フレームにおける現在符号化ユニットの、相関符号化ユニットを含む相関ユニットセットを決定し、前記相関符号化ユニットは、前記画像フレームにおける、前記現在符号化ユニットに隣接するターゲットユニット、及び前記画像フレームにおける、前記現在符号化ユニットと親子関係を有する符号化ユニットのうちの少なくとも1つを含み、前記相関ユニットセットにおける各相関符号化ユニットの予測モードに基づき、第1統計情報を決定し、前記現在符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得し、前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定し、前記符号化予測方式は、選択した予測モード及び/又は予測モードの処理順序を指示することで、前記選択した予測モード及び/又は予測モードの処理順序に基づき、前記現在符号化ユニットに対して予測符号化を行う。
本出願の実施例において、プロセッサーが実行する方法について、いずれもプロセッサーの角度から記載しているが、本出願の実施例において、プロセッサーは上記の方法を実行しようとすると、他のハードウェア構成の協力を必要とする。具体的な実現過程に対して、本出願の実施例は詳しい記載及び限定をしない。
いくつかの実施例において、前記プロセッサー1101は前記相関ユニットセットにおける各相関符号化ユニットの予測モードに基づき、第1統計情報を決定する場合、具体的に、前記相関ユニットセットにおける相関符号化ユニットの総数、及び各相関符号化ユニットの予測モードを取得し、前記各相関符号化ユニットの予測モードに基づき、前記相関ユニットセットにおける、予測モードが第1予測モードである相関符号化ユニットの数を決定し、前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数を第1統計情報に決定する。
いくつかの実施例において、前記プロセッサー1101は前記符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得する場合、具体的に、前記符号化ユニットに対応する前処理画像ブロックの総数、及び各前処理画像ブロックの予測モード、レート歪みコスト情報を取得し、前記各前処理画像ブロックの予測モードに基づき、予測モードが第1予測モードである前処理画像ブロックの数を決定し、前記前処理画像ブロックの総数、前記予測モードが第1予測モードである前処理画像ブロックの数、及び前記レート歪みコスト情報に基づき、第2統計情報を決定する。
いくつかの実施例において、前記レート歪みコスト情報は、フレーム内レート歪みコスト及びフレーム間レート歪みコストを含み、前記プロセッサー1101は前記前処理画像ブロックの総数、前記予測モードが第1予測モードである前処理画像ブロックの数、及び前記レート歪みコスト情報に基づき、第2統計情報を決定する場合、具体的に、前記各前処理画像ブロックのレート歪みコスト情報に基づき、フレーム内レート歪みコストの総和値及びフレーム間レート歪みコストの総和値を決定し、前記前処理画像ブロックの総数、前記予測モードが第1予測モードである前処理画像ブロックの数、前記フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値を、第2統計情報に決定する。
いくつかの実施例において、前記相関符号化ユニットの総数は、前記ターゲットユニットの数と、前記現在符号化ユニットと親関係を有する符号化ユニットの数との和、又は前記ターゲットユニットの数と、前記現在符号化ユニットと子関係を有する符号化ユニットの数との和であり、前記予測モードが第1予測モードである相関符号化ユニットの数は、予測モードが第1予測モードであるターゲットユニットの数、及び前記現在符号化ユニットと親関係を有する符号化ユニットにおける、予測モードが第1予測モードであるユニットの数に基づき決定され、又は、予測モードが第1予測モードであるターゲットユニットの数、及び前記現在符号化ユニットとの間が子関係を有する符号化ユニットにおける、予測モードが第1予測モードである符号化ユニットの数に基づき決定される。
いくつかの実施例において、前記プロセッサー1101は、前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定する場合、具体的に、前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数、前記予測モードが前記第1予測モードである前処理画像ブロックの数、前記前処理画像ブロックの総数、前記フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値が第1所定条件を満たすかどうかを検出し、前記第1所定条件を満たすと、第1符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定し、前記第1符号化予測方式は第1予測モードを採用して前記現在符号化ユニットに対して、予測処理を行った後、第2予測モードを採用して前記現在符号化ユニットに対して、予測処理を行うことである。
いくつかの実施例において、前記第1所定条件を満たすことは、前記予測モードが第1予測モードである前処理画像ブロックの数と前記前処理画像ブロックの総数との間の差値はターゲット数値以下であり、前記相関符号化ユニットの総数が第1数値以上であり、前記予測モードが第1予測モードである相関符号化ユニットの数が第2数値以上であり、前記フレーム内レート歪みコストの総和値は、前記フレーム間レート歪みコストの総和値と第1参照値とを乗算することにより得られる値よりも小さく、前記第2数値は前記相関符号化ユニットの総数に基づき決定される。
いくつかの実施例において、前記プロセッサー1101は、前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定する場合、具体的に、前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数、前記予測モードが前記第1予測モードである前処理画像ブロックの数、前記前処理画像ブロックの総数、前記フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値が第1所定条件を満たすかどうかを検出し、前記第1所定条件を満たすと、前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数、前記フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値が第2所定条件を満たすかどを検出し、前記第2所定条件を満たすと、第2符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定し、前記第2符号化予測方式は第1予測モードを採用して、前記現在符号化ユニットに対して予測処理を行うことである。
いくつかの実施例において、前記第2所定条件を満たすことは、前記予測モードが第1予測モードである相関符号化ユニットの数と前記相関符号化ユニットの総数との間の差値がターゲット数値以下であり、前記フレーム内レート歪みコストの総和値は、前記フレーム間レート歪みコストの総和値と第2参照値とを乗算することにより得られる値よりも小さいことである。
いくつかの実施例において、前記プロセッサー1101は、前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定する場合、具体的に、前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数、前記予測モードが前記第1予測モードである前処理画像ブロックの数、前記前処理画像ブロックの総数、前記フレーム内レート歪みコストの総和値及び前記フレーム間レート歪みコストの総和値が第3所定条件を満たすかどうかを検出し、前記第3所定条件を満たすと、第3符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定し、前記第3符号化予測方式は、第2予測モードを採用して前記現在符号化ユニットに対して、予測処理を行うことである。
いくつかの実施例において、第3所定条件を満たすことは、前記相関符号化ユニットの総数が第3数値以上であり、前記予測モードが第1予測モードである相関符号化ユニットの数が第4数値以下であり、前記前処理画像ブロックの総数が第5数値以上であり、前記予測モードが前記第1予測モードである前処理画像ブロックの数が第6数値以下であり、前記フレーム間レート歪みコストの総和値は、前記フレーム内レート歪みコストの総和値と第3参照値とを乗算することにより得られる値よりも小さいことである。
いくつかの実施例において、前記プロセッサー1101は、第1符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定した後、前記プロセッサー1101はさらに、前記現在符号化ユニットが前記第1予測モードを採用する際の第1レート歪みコスト、及び前記現在符号化ユニットがターゲットタイプの第2予測モードを採用する際の第2レート歪みコストを計算し、前記第1レート歪みコスト及び前記第2レート歪みコストが第4所定条件を満たすかどうかを検出し、前記第4所定条件を満たすと、前記第1予測モードを前記現在符号化ユニットの予測モードに決定する。
いくつかの実施例において、前記ターゲットタイプの第2予測モードは、merge予測モード及び/又はskip予測モードを含み、前記第4所定条件を満たすことは、前記第1レート歪みコストが、前記第2レート歪みコストと第4参照値とを乗算することにより得られる値よりも小さいことである。
具体的に実現では、本出願の実施例に記載のプロセッサー1101及びメモリ1102は上記の実施例が提供する画像処理方法に記載の端末の実現形態を実行してもよいし、上記の実施例が提供する画像処理装置に記載の実現形態を実行してもよく、ここで、贅言しない。
本出願の実施例は、現在符号化ユニットに隣接する、及び/又は現在符号化ユニットと親子関係を有するユニットの予測モードに基づき、第1統計情報を決定し、現在符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得し、第1統計情報及び第2統計情報に基づき、現在符号化ユニットの符号化予測方式を決定することで、現在符号化ユニットの符号化予測方式を自己適応且つ迅速に決定でき、符号化予測方式の決定効率を向上させる。
本出願の実施例はコンピュータ可読記憶媒体をさらに提供し、前記コンピュータ可読記憶媒体には命令が記憶され、前記命令はコンピュータで実行される場合、コンピュータに本出願の実施例に記載の画像処理方法を実行させる。
本出願の実施例は命令を含むコンピュータプログラム製品を提供し、前記命令はコンピュータで実行される場合、コンピュータに本出願の実施例に記載の画像処理方法を実行させる。
ここで、記載を簡潔するために、前記各方法実施例を一連の動作の組み合わせに表現したが、当業者が知っているように、本出願は記載の動作順序に限定されず、なぜならば、本出願によれば、いくつかのステップに対して、他の順序を採用するか、又は同時に実行してもよいためである。そして、当業者が知っているように、明細書に記載の実施例はいずれも本出願のいくつかの例示に過ぎず、係る動作及びモジュールは必ずしも本出願にとって必要なものであるわけではない。
上記の実施例の各種方法の全て又は一部のステップは、プログラムが関連ハードウェアに命令することで完成され、当該プログラムはコンピュータ可読記憶媒体に記憶され、記憶媒体はフラッシュメモリディスク、読み取り専用メモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、磁気ディスク又は光ディスクなどを含んでもよい。
以上の開示は本出願の一部の実施例のみであるため、本出願の請求項の範囲を限定せず、本出願の請求項に応じてなされる等価変化は、相変わらず本出願の範囲に該当する。
501 親符号化ユニット
502 子符号化ユニット
1001 処理ユニット
1002 取得ユニット
1003 計算ユニット
1101 プロセッサー
1102 メモリ

Claims (13)

  1. 画像処理装置により実行される画像処理方法であって、
    画像フレームにおける現在符号化ユニットの相関ユニットセットを決定するステップであって、前記相関ユニットセットは、相関符号化ユニットを含み、前記相関符号化ユニットは、前記画像フレームにおいて前記現在符号化ユニットに隣接するターゲットユニット、及び前記画像フレームにおいて前記現在符号化ユニットと親子関係を有する符号化ユニットのうちの少なくとも1つを含む、ステップと、
    前記相関ユニットセットにおける各相関符号化ユニットの予測モードに基づき、第1統計情報を決定するステップと、
    前記現在符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得するステップと、
    前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定するステップであって、前記符号化予測方式は、選択した予測モード及び/又は予測モードの処理順序を指示することで、前記選択した予測モード及び/又は予測モードの処理順序に基づき、前記現在符号化ユニットに対して予測符号化を行うための方式である、ステップと、を含み、
    前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定する前記ステップは、
    前記第1統計情報及び前記第2統計情報が第1所定条件を満たすとともに、前記第1統計情報及び前記第2統計情報が第2所定条件を満たしていないと、第1符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定するステップであって、前記第1符号化予測方式は、第1予測モードを採用して前記現在符号化ユニットに対して予測処理を行った後、第2予測モードを採用して前記現在符号化ユニットに対して予測処理を行う方式である、ステップを含み、
    前記第1所定条件は、前記予測モードが第1予測モードである前処理画像ブロックの数と前記前処理画像ブロックの総数との間の差値がターゲット数値以下であり、且つ前記相関符号化ユニットの総数が第1数値以上であり、前記予測モードが第1予測モードである相関符号化ユニットの数が第2数値以上であり、フレーム内レート歪みコストの総和値が、フレーム間レート歪みコストの総和値と第1参照値とを乗算することにより得られる値よりも小さいことであり、前記第2数値は、前記相関符号化ユニットの総数に基づき決定され、
    前記第2所定条件は、前記予測モードが第1予測モードである相関符号化ユニットの数と前記相関符号化ユニットの総数との間の差値がターゲット数値以下であり、且つ前記フレーム内レート歪みコストの総和値が、前記フレーム間レート歪みコストの総和値と第2参照値とを乗算することにより得られる値よりも小さいことである、方法。
  2. 前記第1統計情報は、前記予測モードが第1予測モードである相関符号化ユニットの数、及び前記相関符号化ユニットの総数を含み、
    前記第2統計情報は、前記前処理画像ブロックの総数、前記予測モードが第1予測モードである前処理画像ブロックの数、及びレート歪みコスト情報を含む、請求項1に記載の方法。
  3. 第1符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定する前記ステップの後、
    前記現在符号化ユニットが前記第1予測モードを採用する際の第1レート歪みコスト、及び前記現在符号化ユニットがターゲットタイプの第2予測モードを採用する際の第2レート歪みコストを計算するステップと、
    前記第1レート歪みコスト及び前記第2レート歪みコストが第4所定条件を満たすと、前記第1予測モードを前記現在符号化ユニットの予測モードに決定し、他のタイプの第2予測モードによる、前記現在符号化ユニットに対する予測処理の動作を終了させるステップと、をさらに含む、請求項1又は2に記載の方法。
  4. 前記ターゲットタイプの第2予測モードは、マージ(merge)予測モード及び/又はスキップ(skip)予測モードを含み、前記第4所定条件を満たすことは、前記第1レート歪みコストが、前記第2レート歪みコストと第4参照値とを乗算することにより得られる値よりも小さいことである、請求項に記載の方法。
  5. 前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定する前記ステップは、
    前記第1統計情報及び前記第2統計情報が前記第1所定条件を満たすとともに、前記第2所定条件を満たすと、第2符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定するステップであって、前記第2符号化予測方式は、第1予測モードを採用して前記現在符号化ユニットに対して予測処理を行う方式である、ステップを含む、請求項1又は2に記載の方法。
  6. 前記第1統計情報及び前記第2統計情報が第3所定条件を満たすと、第3符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定するステップであって、前記第3符号化予測方式は、第2予測モードを採用して前記現在符号化ユニットに対して予測処理を行う方式である、ステップをさらに含む、請求項1又は2に記載の方法。
  7. 前記第3所定条件を満たすことは、前記相関符号化ユニットの総数が第3数値以上であり、且つ前記予測モードが第1予測モードである相関符号化ユニットの数が第4数値以下であり、前記前処理画像ブロックの総数が第5数値以上であり、前記予測モードが前記第1予測モードである前処理画像ブロックの数が第6数値以下であり、フレーム間レート歪みコストの総和値は、フレーム内レート歪みコストの総和値と第3参照値とを乗算することにより得られる値よりも小さいことである、請求項に記載の方法。
  8. 前記相関ユニットセットにおける各相関符号化ユニットの予測モードに基づき、第1統計情報を決定する前記ステップは、
    前記相関ユニットセットにおける相関符号化ユニットの総数、及び各相関符号化ユニットの予測モードを取得するステップと、
    前記各相関符号化ユニットの予測モードに基づき、前記相関ユニットセットにおける、予測モードが第1予測モードである相関符号化ユニットの数を決定するステップと、
    前記予測モードが第1予測モードである相関符号化ユニットの数、前記相関符号化ユニットの総数を第1統計情報に決定するステップと、を含む、請求項2に記載の方法。
  9. 前記現在符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得する前記ステップは、
    前記現在符号化ユニットに対応する前処理画像ブロックの総数、及び各前処理画像ブロックの予測モード、レート歪みコスト情報を取得するステップと、
    前記各前処理画像ブロックの予測モードに基づき、予測モードが第1予測モードである前処理画像ブロックの数を決定するステップと、
    前記前処理画像ブロックの総数、前記予測モードが第1予測モードである前処理画像ブロックの数、及び前記レート歪みコスト情報に基づき、第2統計情報を決定するステップと、を含む、請求項2に記載の方法。
  10. 前記レート歪みコスト情報は、フレーム内レート歪みコスト及びフレーム間レート歪みコストを含み、
    前記前処理画像ブロックの総数、前記予測モードが第1予測モードである前処理画像ブロックの数、及び前記レート歪みコスト情報に基づき、第2統計情報を決定するステップは、
    各前記前処理画像ブロックのレート歪みコスト情報に基づき、フレーム内レート歪みコストの総和値及びフレーム間レート歪みコストの総和値を決定するステップと、
    前記前処理画像ブロックの総数、前記予測モードが第1予測モードである前処理画像ブロックの数、前記フレーム内レート歪みコストの総和値、及び前記フレーム間レート歪みコストの総和値を第2統計情報に決定するステップと、を含む、請求項に記載の方法。
  11. 画像処理装置であって、前記装置は、
    画像フレームにおける現在符号化ユニットの相関ユニットセットを決定するための処理ユニットであって、前記相関ユニットセットは、相関符号化ユニットを含み、前記相関符号化ユニットは、前記画像フレームにおいて前記現在符号化ユニットに隣接するターゲットユニット、及び前記画像フレームにおいて前記現在符号化ユニットと親子関係を有する符号化ユニットのうちの少なくとも1つを含む、処理ユニットと、
    前記相関ユニットセットにおける各相関符号化ユニットの予測モードに基づき、第1統計情報を決定するための取得ユニットと、を含み、
    前記取得ユニットはさらに、前記現在符号化ユニットに対応する前処理画像ブロックの第2統計情報を取得し、
    前記処理ユニットはさらに、前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定し、前記符号化予測方式は、選択した予測モード及び/又は予測モードの処理順序を指示することで、前記選択した予測モード及び/又は予測モードの処理順序に基づき、前記現在符号化ユニットに対して予測符号化を行うための方式であり、
    前記第1統計情報及び前記第2統計情報に基づき、前記現在符号化ユニットの符号化予測方式を決定することは、
    前記第1統計情報及び前記第2統計情報が第1所定条件を満たすとともに、前記第1統計情報及び前記第2統計情報が第2所定条件を満たしていないと、第1符号化予測方式を前記現在符号化ユニットの符号化予測方式に決定することであって、前記第1符号化予測方式は、第1予測モードを採用して前記現在符号化ユニットに対して予測処理を行った後、第2予測モードを採用して前記現在符号化ユニットに対して予測処理を行う方式である、ことを含み、
    前記第1所定条件は、前記予測モードが第1予測モードである前処理画像ブロックの数と前記前処理画像ブロックの総数との間の差値がターゲット数値以下であり、且つ前記相関符号化ユニットの総数が第1数値以上であり、前記予測モードが第1予測モードである相関符号化ユニットの数が第2数値以上であり、フレーム内レート歪みコストの総和値が、フレーム間レート歪みコストの総和値と第1参照値とを乗算することにより得られる値よりも小さいことであり、前記第2数値は、前記相関符号化ユニットの総数に基づき決定され、
    前記第2所定条件は、前記予測モードが第1予測モードである相関符号化ユニットの数と前記相関符号化ユニットの総数との間の差値がターゲット数値以下であり、且つ前記フレーム内レート歪みコストの総和値が、前記フレーム間レート歪みコストの総和値と第2参照値とを乗算することにより得られる値よりも小さいことである、装置。
  12. 端末であって、実行可能なプログラムコードが記憶されるメモリと、前記実行可能なプログラムコードを呼び出すことで、請求項1から10のいずれか一項に記載の方法を実行するためのプロセッサーと、を含む端末。
  13. コンピュータプログラムであって、命令が含まれ、前記命令はコンピュータで実行される場合、コンピュータに請求項1から10のいずれか一項に記載の方法を実行させる、コンピュータプログラム。
JP2022524011A 2020-02-12 2020-11-10 画像処理方法、装置、端末及びコンピュータプログラム Active JP7391456B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010088822.5A CN111277824B (zh) 2020-02-12 2020-02-12 图像预测处理方法、装置、终端及计算机可读存储介质
CN202010088822.5 2020-02-12
PCT/CN2020/127690 WO2021159785A1 (zh) 2020-02-12 2020-11-10 图像处理方法、装置、终端及计算机可读存储介质

Publications (2)

Publication Number Publication Date
JP2023500223A JP2023500223A (ja) 2023-01-05
JP7391456B2 true JP7391456B2 (ja) 2023-12-05

Family

ID=70999402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022524011A Active JP7391456B2 (ja) 2020-02-12 2020-11-10 画像処理方法、装置、端末及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US20220182615A1 (ja)
EP (1) EP4016999A4 (ja)
JP (1) JP7391456B2 (ja)
CN (1) CN111277824B (ja)
WO (1) WO2021159785A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111277824B (zh) * 2020-02-12 2023-07-25 腾讯科技(深圳)有限公司 图像预测处理方法、装置、终端及计算机可读存储介质
CN114449283B (zh) * 2020-10-30 2024-06-07 腾讯科技(深圳)有限公司 一种数据处理方法、装置、计算机设备及存储介质
CN114513659B (zh) * 2022-02-15 2023-04-11 北京百度网讯科技有限公司 确定图片预测模式的方法、装置、电子设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010135864A (ja) 2007-03-29 2010-06-17 Toshiba Corp 画像符号化方法及び装置並びに画像復号化方法及び装置
JP2015139013A (ja) 2014-01-20 2015-07-30 日本放送協会 動画符号化装置、及び動画符号化プログラム
JP2018511225A (ja) 2015-03-06 2018-04-19 クアルコム,インコーポレイテッド ビデオ符号化のための適応的なモード確認順序

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100987765B1 (ko) * 2003-09-30 2010-10-13 삼성전자주식회사 동영상 부호화기에서의 예측 수행 방법 및 장치
TWI256258B (en) * 2004-12-16 2006-06-01 Ind Tech Res Inst Method to speed up the mode decision of video coding
CN101969561B (zh) * 2010-10-27 2016-03-30 北京中星微电子有限公司 一种帧内模式选取方法、装置及一种编码器
JP2013012995A (ja) * 2011-06-30 2013-01-17 Sony Corp 画像処理装置および方法
CN104247423B (zh) * 2012-03-21 2018-08-07 联发科技(新加坡)私人有限公司 可伸缩视频编码系统的帧内模式编码方法和装置
US9426473B2 (en) * 2013-02-01 2016-08-23 Qualcomm Incorporated Mode decision simplification for intra prediction
US9148667B2 (en) * 2013-02-06 2015-09-29 Qualcomm Incorporated Intra prediction mode decision with reduced storage
CN115460410A (zh) * 2016-01-27 2022-12-09 韩国电子通信研究院 通过使用预测对视频进行编码和解码的方法和装置
CN109788287B (zh) * 2017-11-10 2022-10-25 腾讯科技(深圳)有限公司 视频编码方法、装置、计算机设备和存储介质
CN110198440B (zh) * 2018-03-29 2022-11-18 腾讯科技(深圳)有限公司 编码预测信息的确定及视频编码的方法、装置及可读介质
CN108924551B (zh) * 2018-08-29 2022-01-07 腾讯科技(深圳)有限公司 视频图像编码模式的预测方法及相关设备
CN111277824B (zh) * 2020-02-12 2023-07-25 腾讯科技(深圳)有限公司 图像预测处理方法、装置、终端及计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010135864A (ja) 2007-03-29 2010-06-17 Toshiba Corp 画像符号化方法及び装置並びに画像復号化方法及び装置
JP2015139013A (ja) 2014-01-20 2015-07-30 日本放送協会 動画符号化装置、及び動画符号化プログラム
JP2018511225A (ja) 2015-03-06 2018-04-19 クアルコム,インコーポレイテッド ビデオ符号化のための適応的なモード確認順序

Also Published As

Publication number Publication date
EP4016999A1 (en) 2022-06-22
JP2023500223A (ja) 2023-01-05
CN111277824A (zh) 2020-06-12
WO2021159785A1 (zh) 2021-08-19
EP4016999A4 (en) 2022-11-30
US20220182615A1 (en) 2022-06-09
CN111277824B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
JP7391456B2 (ja) 画像処理方法、装置、端末及びコンピュータプログラム
CN103220529A (zh) 一种视频编解码环路滤波的实现方法
GB2531003A (en) Method and apparatus for vector encoding in video coding and decoding
CN103051892B (zh) 内嵌式回路滤波方法以及内嵌式回路滤波装置
CN112468821B (zh) 基于hevc核心模块的并行解码方法、装置及介质
CN111492655A (zh) 用于视频压缩的基于纹理的分区决定
EP4262203A1 (en) Method and apparatus for video predictive coding
JP2022511877A (ja) 画像符号化/復号化方法、エンコーダ、デコーダ及び記憶媒体
CN110198443B (zh) 视频帧的编码单元划分方法、装置、存储介质及电子装置
CN112087624A (zh) 基于高效率视频编码的编码管理方法
CN110971896B (zh) 一种h.265编码方法和装置
US20240098248A1 (en) Video predictive coding method and apparatus
CN113498608A (zh) 帧间预测方法及装置、设备、存储介质
CN111918059B (zh) 硬件友好的基于回归树的帧内预测模式决策方法及装置
CN109618152B (zh) 深度划分编码方法、装置和电子设备
CN113785592A (zh) 运动补偿的处理方法、编码器、解码器以及存储介质
CN112637592B (zh) 一种视频预测编码的方法及装置
CN113365077A (zh) 帧间预测方法、编码器、解码器、计算机可读存储介质
CN113259669B (zh) 编码方法、装置、电子设备及计算机可读存储介质
CN113678449A (zh) 图像解码方法、解码器以及存储介质
CN112019848B (zh) 一种预测模式快速分析方法、系统及设备
CN113542738B (zh) 一种视频编码模式快速决策的方法
CN110139097B (zh) 视频编码中自适应模式顺序调整的方法
KR100845644B1 (ko) 고속 움직임 모드 결정 방법
CN116016933A (zh) 一种跳过宏块判定方法、装置及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220422

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220422

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231023

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231116

R150 Certificate of patent or registration of utility model

Ref document number: 7391456

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150