JP2015181225A - 動画像符号化装置および動画像符号化方法 - Google Patents

動画像符号化装置および動画像符号化方法 Download PDF

Info

Publication number
JP2015181225A
JP2015181225A JP2015035041A JP2015035041A JP2015181225A JP 2015181225 A JP2015181225 A JP 2015181225A JP 2015035041 A JP2015035041 A JP 2015035041A JP 2015035041 A JP2015035041 A JP 2015035041A JP 2015181225 A JP2015181225 A JP 2015181225A
Authority
JP
Japan
Prior art keywords
basic
unit
prediction
integrated
integration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015035041A
Other languages
English (en)
Other versions
JP6731574B2 (ja
Inventor
安倍 清史
Seishi Abe
清史 安倍
一仁 木村
Kazuhito Kimura
一仁 木村
秀之 大古瀬
Hideyuki Okose
秀之 大古瀬
荒川 博
Hiroshi Arakawa
博 荒川
耕治 有村
Koji Arimura
耕治 有村
和真 榊原
Kazuma Sakakibara
和真 榊原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2015035041A priority Critical patent/JP6731574B2/ja
Priority to US14/641,086 priority patent/US10225576B2/en
Publication of JP2015181225A publication Critical patent/JP2015181225A/ja
Priority to US16/253,753 priority patent/US20190156392A1/en
Application granted granted Critical
Publication of JP6731574B2 publication Critical patent/JP6731574B2/ja
Priority to US17/386,119 priority patent/US20210358005A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0273Determination of fees for advertising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0629Directed, with specific intent or strategy for generating comparisons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Child & Adolescent Psychology (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】処理量を増加させることなく符号化効率を向上させた動画像符号化装置を提供する。
【解決手段】符号化対象ピクチャを符号化単位(基本CU)毎に分割して出力する分割部と、基本CUのサイズ以下の大きさである予測単位(基本PU)毎に画面内予測もしくは画面間予測し予測画像を生成する予測処理部と、生成した予測画像と、符号化対象ピクチャのうち予測画像に対応する画像とを差分演算し、差分画像を生成する差分演算部と、生成された差分画像に対して直交変換および量子化処理し残差係数を生成する残差符号化部と、統合領域に含まれる複数の基本CUを1つの新たなCUとして統合する統合部と、統合後のCUに対して設定される符号化情報および基本CUに関する残差係数を、可変長符号化および算術符号化し、統合後の新たなCUに対する符号列を生成する符号列生成部とを備える。
【選択図】図2

Description

本開示は、入力された画像をブロックに分割して符号化する動画像符号化装置および、動画像符号化方法に関する。
近年、マルチメディアアプリケーションの発展に伴い、画像、音声およびテキストなど、あらゆるメディアの情報を統一的に扱うことが一般的になってきた。また、ディジタル化された画像は膨大なデータ量を持つため、蓄積および伝送のためには、画像の情報圧縮技術が不可欠である。一方で、圧縮した画像データを相互運用するためには、圧縮技術の標準化も重要である。例えば、動画像圧縮技術の標準規格としては、ITU−T(国際電気通信連合 電気通信標準化部門)のH.261、H.263、H.264、ISO/IEC(国際標準化機構)のMPEG−1、MPEG−3、MPEG−4、MPEG−4AVCなどがある。また、現在は、ITU−TとISO/IECとの共同によるHEVC(High Efficiency Video Coding)と呼ばれる次世代動画像符号化方式の標準化活動が進んでいる。
このような動画像の符号化では、符号化対象の各ピクチャを符号化単位のブロックに分割し、ブロック毎に時間方向および空間方向の冗長性を削減することによって情報量を圧縮する。空間的な冗長性の削減を目的とする画面内予測符号化では、周辺の符号化済みブロックの画素情報から予測画像を生成し、得られた予測画像と符号化対象のブロックとの差分画像を取得する。また時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方の既に符号化が完了しているピクチャを参照してブロック単位で動きの検出および予測画像を生成し、得られた予測画像と符号化対象のブロックとの差分画像を取得する。これらの得られた差分画像に対して離散コサイン変換等の直交変換処理および量子化処理し、可変長符号化および算術符号化を用いて符号列を生成することで情報量が圧縮される。
図1は、HEVC規格に定義されている各ブロックサイズの組み合わせを説明するための概念図である。HEVC(非特許文献1)では、符号化単位(以下、「Cording Unit:CU」と称する)として、図1のように、64×64画素、32×32画素、16×16画素、8×8画素の4種類のブロックサイズの中から任意のサイズを選択して使用することができる。
さらにCUを分割した単位であり、画面内予測符号化および画面間予測符号化において予測画像を生成する予測単位(以下、「Prediction Unit:PU」と称する)として、例えばCUサイズを32x32画素とした場合、図1のように、32×32画素、16×32画素、16×16画素等の8種類のブロックサイズの中から任意のサイズを選択して使用することができる。例えば、撮像物の動きが複雑な画像では小さなブロックサイズを使用し、撮像物の動きが単純な画像では大きなブロックサイズを使用することで高い符号化効率を実現している。
さらにCUを分割した単位であり、前述の直交変換処理および量子化処理する直交変換単位(以下、「Transform Unit:TU」と称する)として、図1のように、例えばCUサイズを32x32画素とした場合、32×32画素、16×16画素、8×8画素、4×4画素の4種類のブロックサイズの中から任意のサイズを選択して使用することができる。例えば、細かい範囲で特徴が異なる画像では小さなブロックサイズを使用し、広い範囲で特徴が同じような画像では大きなブロックサイズを使用することで高い符号化効率を実現している。
ITU−T H.265 : High efficiency video coding (04/2013)
HEVCでは、CUとして4種類のブロックサイズを選択できる。しかし、符号化過程においてCUのブロック数を増やせば増やすほど、CU層におけるヘッダ情報の符号量が増える。その結果、符号化効率が悪くなることがある。
本開示は上記課題を鑑みてなされたものであり、CU層およびPU層のヘッダ情報の符号量を抑制し、処理量を増加させることなく符号化効率を向上させた動画像符号化装置を提供する。
本開示にかかる動画像符号化装置は、符号化対象ピクチャを所定の符号化規格にて符号化し、符号列を生成する。動画像符号化装置は、符号化対象ピクチャを符号化単位(基本CU)毎に分割して出力する分割部と、出力される1つの基本CUを少なくとも1つ以上に分割して得られる単位であって、基本CUのサイズ以下の大きさである予測単位(基本PU)毎に画面内予測もしくは画面間予測し予測画像を生成する予測処理部と、生成した予測画像と、符号化対象ピクチャのうち予測画像に対応する画像とを差分演算し、差分画像を生成する差分演算部と、生成された差分画像に対して直交変換および量子化処理し残差係数を生成する残差符号化部と、(1)統合領域(N×N画素の領域)に属する複数の基本CUおよび基本PUがすべて同じブロックサイズかつ(2)統合領域に属する複数の基本PUの予測情報が同じである場合に、統合領域に含まれる複数の基本CUを1つの新たなCUとして統合する統合部と、統合後の新たなCUに対して設定される符号化情報および統合後の新たなCU内に属していた統合前の複数の基本CUに関する残差係数を可変長符号化および算術符号化し、統合後の新たなCUに対する符号列を生成する符号列生成部と、を備える。
以上より、本発明における動画像符号化装置は、CU層およびPU層のヘッダ情報の符号量を抑制することが可能となり、処理量を増加させることなく符号化効率を向上させることが可能となる。
なお、本開示は、このような動画像符号化装置として実現することができるだけでなく、このような動画像符号化装置に含まれる各手段と同等の処理をプログラムや集積回路としても実現することもできる。
HEVC規格に定義されている各ブロックサイズの組み合わせを説明するための概念図である。 実施の形態1にかかる動画像符号化装置100の構成を示すブロック図である。 実施の形態1にかかる各ブロックサイズの組み合わせを説明するための概念図である。 実施の形態1にかかる統合判定処理を示すフローチャートである。 実施の形態1にかかる統合判定処理を示すイメージ図である 実施の形態1にかかる統合判定処理を示すイメージ図である 実施の形態1にかかる統合判定処理を行うことにより出現する、各ブロックサイズの組み合わせを説明するための概念図である。 実施の形態2にかかる統合判定処理を示すフローチャートである。 実施の形態2にかかる統合判定処理を示すイメージ図である 実施の形態2にかかる統合判定処理を示すイメージ図である 実施の形態2にかかる統合判定処理の条件を説明するための概念図である。 実施の形態2にかかる統合判定処理を行うことにより出現する、各ブロックサイズの組み合わせを説明するための概念図である。 実施の形態3にかかる統合判定処理を示すフローチャートである。 実施の形態3にかかる統合判定処理を示すイメージ図である。 実施の形態3にかかる統合判定処理を示すイメージ図である。 実施の形態3にかかる統合判定処理を示すイメージ図である。 実施の形態3にかかる統合判定処理を行うことにより出現する、各ブロックサイズの組み合わせを説明するための概念図である。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、添付図面および以下の説明は、当業者が本開示を十分に理解するために、提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
(実施の形態1)
実施の形態1にかかる動画像符号化装置100は、例えば、ビデオカメラ、デジタルカメラ、ビデオレコーダ、携帯電話、携帯情報端末およびパーソナルコンピューターなどに搭載されたマイクロプロセッサにより実現される。動画像符号化装置100は、動画圧縮規格であるHEVCに従って、動画像データの符号化処理を実施する。本開示にかかる動画像符号化装置100は、CU(Cording Unit)およびPU(Prediction Unit)の符号化情報に基づいて、複数のCUを1つのCUに統合し、統合後のCUに対して1つのヘッダ情報を付与する。その結果、CU層およびPU層のヘッダ情報の符号量を抑制することが可能となり、処理量を増加させることなく符号化効率を向上させることが可能となる。
以下、実施の形態1にかかる動画像符号化装置100の構成および動作について、図面を参照しながら説明する。
[1−1.動画像符号化装置の構成]
動画像符号化装置100の構成について説明する。図2は、実施の形態1にかかる動画像符号化装置100の構成を示すブロック図である。
図2に示すように、動画像符号化装置100は、ピクチャメモリ101と、基本ブロック分割部102と、基本ブロック単位処理ループ部111と、統合判定部107と、符号列生成部108とを備えている。そして、動画像符号化装置100は、基本ブロック単位処理ループ部111として、予測残差符号化部103と、予測残差復号化部104と、ピクチャバッファ105と、予測処理部106、差分演算部109、加算演算部110とを備えている。この構成により、動画像符号化装置100は、ピクチャ単位で入力された画像を基本ブロックに分割した後に、この分割された基本ブロックの単位で符号化処理を実施し、符号列を出力する。
続いて、動画像符号化装置100を構成する各部について、詳細を説明する。
ピクチャメモリ101は、表示装置に表示される順番に沿って、ピクチャ単位で画像信号を入力する。ピクチャメモリ101は、入力した画像信号を、符号化する順番にピクチャ単位で並び替えて格納する。ピクチャメモリ101は、基本ブロック分割部102からの読出し命令を受け付けると、読出し命令にかかる入力画像信号である符号化対象の符号化対象ピクチャを基本ブロック分割部102に出力する。
分割部としての基本ブロック分割部102は、ピクチャメモリ101から順次入力される符号化対象のピクチャを符号化単位毎に分割して出力する。基本ブロック分割部102は、基本ブロック単位処理ループ部111における処理の基本単位である基本ブロックに分割する。動画像符号化装置100は、基本ブロックのサイズをHEVCで規定されている64×64画素、および32×32画素よりも小さい16×16画素に限定する。基本ブロックは、HEVC規格にて定義されている符号化単位であるCUを1つ以上包含する。図3は、実施の形態1にかかる各ブロックサイズの組み合わせを説明するための概念図である。図3の「基本CUサイズ」の列に示すように、基本CUサイズは、16×16画素の基本ブロックに対して、16×16画素のサイズおよび、8×8画素のサイズを取り得る。16×16画素のサイズのCUは、16×16画素の基本ブロックに対して、1つ包含される。8×8画素のサイズのCUは、16×16画素の基本ブロックに対して、4つ包含される。以下、基本ブロックに包含されるこれらのCUを「基本CU」と称する。
基本ブロック分割部102は、入力されるピクチャを基本ブロックに分割するとともに、基本CUのサイズを選択する。一般的に、基本ブロック分割部102は、入力されたピクチャの画素構成が複雑なときは小さなサイズの基本CUを選択する一方、入力されたピクチャの画素構成が単純なときは大きなサイズの基本CUを選択する。なお、図3の例に記載した基本CUのうち一部のサイズを使用しない場合、もしくは、図3の例に記載されていないサイズで基本ブロック以下のサイズである基本CUを使用した場合であっても同様の説明が可能である。
基本ブロック分割部102は、基本ブロック(基本CUのサイズが選択済み)に分割したピクチャを、予測処理部106および差分演算部109に順次出力する。
予測処理部106は、基本ブロック分割部102から順次入力される基本ブロックに分割されたピクチャを基に、基本ブロック毎に画面内予測もしくは画面間予測のどちらか一方を用いて予測処理を行う。予測処理部106は、基本CUをさらに分割した予測単位であるPU(以下、「基本PU」と称する)毎に予測処理を行う。具体的には、図3の「基本PUサイズ」の列に示すように、基本CUのサイズが16×16画素であるとき、16×16画素の1つの基本PU、16×8画素の2つの基本PUまたは8×16画素の2つの基本PUのいずれかの基本PUに分割される。但し、16×8画素および、8×16画素の基本PUサイズは、画面間予測が選択されたときのみに使用される。一方、基本CUのサイズが8×8画素であるとき、8×8画素の1つの基本PU、8×4画素の2つの基本PUまたは4×8画素の2つの基本PU、もしくは4×4画素の4つの基本PUのいずれかの基本PUに分割される。但し、8×4画素および、4×8画素の基本PUサイズは、画面間予測が選択されたときのみに使用される。4×4画素の基本PUサイズは、画面内予測が選択されたときのみに使用される。一般的に、予測処理部106は、入力された基本CUの画素構成が複雑なときは小さなサイズの基本PUを選択する一方、入力された基本CUの画素構成が単純なときは大きなサイズの基本PUを選択する。なお、図3の例に記載した基本PUのうち一部のサイズを使用しない場合、もしくは、図3の例に記載されていないサイズで基本CU以下のサイズである基本PUを使用した場合であっても同様の説明が可能である。
画面内予測を用いる場合、予測処理部106は、符号化対象とするピクチャ内のブロックについて、同じピクチャ内の既に符号化済みの周辺のブロックの再構成画像信号を用いて予測処理する。再構成画像信号とは、後述する加算演算部110により生成された信号である。予測処理部106は、複数の画面内予測方法(画面内予測モード)の中から、符号化対象とするブロックの画素構成と最も類似度の高い予測画像を生成する画面内予測モードを1つ選択することで予測処理する。
一方、画面間予測を用いる場合、予測処理部106は、ピクチャバッファ105に格納されている既に符号化済みの別のピクチャの再構成画像信号を用いて予測処理する。具体的には、予測処理部106は、符号化対象とするブロックの画素構成と最も類似度の高い画素構成を持った領域を、既に符号化済みの別のピクチャの再構成画像の中から探索する。そして、予測処理部106は、いずれのピクチャの再構成画像を参照するか(以下、参照するピクチャの情報を「参照ピクチャ情報」と称する)、および、参照先のピクチャにおいて、符号化対象とするブロックに対応する位置からどの程度ずれた位置の再構成画像を参照するか(以下、位置のずれ量を示す情報を「動きベクトル情報」と称する)を決定することで予測画像を生成する。
差分演算部109は、基本ブロック分割部102から入力される基本ブロックにおける基本CUに基づいて選択された基本PU単位の入力画像信号と、予測処理部106から入力される基本PU単位の予測画像信号との差分値である差分画像信号を生成する。差分演算部109は、生成した差分画像信号を予測残差符号化部103に出力する。
残差符号化部である予測残差符号化部103は、差分演算部109から入力される差分画像信号に対して直交変換処理し、得られた各周波数成分の直交変換係数に対し量子化処理する。その結果、予測残差符号化部103は、残差係数信号を生成する。予測残差符号化部103は、基本CUを更に分割した直交変換単位であるTU(Transform Unit)(以下、「基本TU」と称する)毎に直交変換処理および量子化処理を行う。具体的には、図3の「基本TUサイズ」の列に示すように、基本CUのサイズが16×16画素であるとき、16×16画素の1つの基本TU、もしくは8×8画素の4つの基本TUに分割され得る。一方、基本CUのサイズが8×8画素であるとき、8×8画素の1つの基本TU、もしくは4×4画素の4つの基本TUに分割され得る。図3に示す例では、基本PUが決定すると基本TUが一意に割り当てられるため、基本TUのサイズを選択するという処理は不要となる。これにより、処理量を大幅に削減することが可能となる。なお、図3の例に記載した基本TUのうち一部のサイズを使用しない場合、もしくは、図3の例に記載されていないサイズで基本PU以下のサイズである基本TUを使用した場合であっても同様の説明が可能である。
予測残差復号化部104は、予測残差符号化部103で処理した基本TUを処理単位とする。予測残差復号化部104は、予測残差符号化部103から入力される残差係数信号に対して逆量子化処理し、さらに逆直交変換処理することで再構成差分画像信号を生成する。
加算演算部110は、予測残差復号化部104から入力される再構成差分画像信号と、予測処理部106から入力される予測画像信号とを基本PU単位で加算することにより再構成画像信号を生成する。
ピクチャバッファ105は、加算演算部110から入力される再構成画像信号を格納する。ピクチャバッファ105に格納された再構成画像信号は、現在の符号化対象ピクチャより時間的に後に符号化するピクチャの画面間予測処理で参照される。
統合部として機能する統合判定部107は、統合判定対象とする複数の基本ブロックについて、基本ブロック単位処理ループ部111の一連の処理が完了した時点で、当該複数の基本ブロックに属する基本CUを統合して1つの統合された符号化単位(以下、「統合CU」と称する)とするかどうかを判定し、統合判定結果信号を生成する。つまり、統合判定部107は、複数の基本ブロックにより構成されるN×N画素(例えば32×32画素)領域に属する複数の基本CUを1つの統合された統合CUにするか否かを判断する。統合判定部107は、基本CUを統合せずにそのまま符号列生成部108へと出力する第1動作のモードと、N×N画素領域内に属する複数の基本CUを1つの新たなCUとして統合して符号列生成部108へと出力する第2動作のモードとを有する。統合判定部107は、統合判定結果に応じて、第1動作モードと、第2動作モードとを切り替えて実行する。すなわち、統合判定部107は、(1)N×N画素の領域に属する複数の基本CUおよび基本PUがすべて同じブロックサイズで、かつ(2)前記N×N画素の領域に属する複数の基本PUの予測情報が同じである場合に、前記N×N画素の領域に含まれる複数の基本CUを1つの新たなCUとして統合する。
符号列生成部108は、統合判定部107から入力される統合判定結果信号に従って、統合CU単位もしくは基本CU単位で、予測残差符号化部103から入力される残差係数信号、およびその他の復号化処理時に必要となる符号化情報信号に対して、可変長符号化および算術符号化することで符号列を生成する。すなわち、符号列生成部108は、統合後の新たなCUに対して設定される符号化情報および統合後の新たなCU内に属していた統合前の複数の基本CUに関する残差係数を、可変長符号化および算術符号化し、統合後の新たなCUに対する符号列を生成する。統合判定部107から統合CUが出力される場合、統合CUに対して設定される符号化情報および、統合CU内に属していた統合前の複数の基本CUに関する残差係数を、可変長符号化および算術符号化することにより、統合CUに対する符号列を生成する。
上記のように、動画像符号化装置100では、基本ブロックサイズを16×16画素に限定した。これにより、図3に示すように、選択され得る基本CU/基本PU/基本TUの組合せが、画面内予測を選択したときは3組のみ、画面間予測を選択したときは6組のみに限定することが可能となる。これにより、基本ブロック単位処理ループ部111の一連の処理において最適な組合せを選択するための処理量を大幅に削減することが可能となる。
なお、上記の実施の形態では、基本ブロックサイズを16×16画素に限定しているが、本開示はこれに限定されない。すなわち、基本ブロックサイズを制限せずに、HEVCの規格にて定義されている図1の組合せから最適な組合せを選択するようにしてもよい。但し、この場合、基本ブロックサイズを制限したときと比べて、処理量が膨大になることになる。或いは、16×16画素には限定せずに、32×32画素などの他のブロックサイズにより限定することもできる。例えば、32×32画素のブロックサイズで限定した場合、基本ブロックサイズに属するCUおよびPUのブロックサイズの選択肢が多くなることから符号化効率の向上が見込める。一方、最適なCUおよびPUのブロックサイズを選ぶための処理量が増加する。従って、処理量の増加が許容できる動画像符号化装置では基本ブロックサイズとして大きなブロックサイズを使用する一方、処理量の増加が許容できない動画像符号化装置では基本ブロックサイズとして小さなブロックサイズを使用するようにしてもよい。
[1−2.統合判定部の動作]
実施の形態1にかかる統合判定部107は、複数の基本ブロックを包含する統合領域を定義している。統合判定部107は、統合領域に含まれる全ての基本ブロックについて、基本ブロック単位処理ループ部111の一連の処理が完了した時点で統合判定処理する。
統合判定部107における、複数の基本ブロックに属する基本CUを統合して1つの統合CUとするか否かを判定する方法について、図4、図5A、図5Bを用いて具体的に説明する。図4は、実施の形態1にかかる統合判定処理を示すフローチャートである。図5A、図5Bは、実施の形態1にかかる統合判定処理を示すイメージ図である。図4は、基本ブロックのサイズが16×16画素、統合領域のサイズが32×32画素とした場合の処理を示す。このとき、統合領域には4つの基本ブロックが包含されている。なお、統合領域のサイズとして、基本ブロックのサイズよりも大きなサイズであれば、基本ブロックのサイズに応じて32×32画素以外のサイズを使用してもよい。
まず、統合判定部107は、統合領域内に包含された4つの基本ブロックが、全て16×16画素の基本CUかつ16×16画素の基本PUから構成されているか否かを判定する(S301)。
S301の条件を満たさない場合(S301におけるNo)、図5Aのように、統合領域内の基本CUは統合されない。
一方、S301の条件を満たす場合(S301におけるYes)、統合判定部107は、統合領域内の4つの基本PUの予測情報が全て同じであるか否かを判定する(S302)。具体的には、画面内予測の場合、統合領域内の4つの基本PUの少なくとも画面内予測モードが全て同じであるか否かを判定する。すなわち、統合判定部107は、統合領域に含まれる全ての基本PUが画面内予測であった場合、予測情報として少なくとも画面内予測モードが全て同じであるか否かを用いて第1動作モードと第2動作モードとを切り換える。一方、画面間予測の場合、統合領域内の4つの基本PUの少なくとも動きベクトル情報および参照ピクチャ情報が全て同じであるか否かを判定する。すなわち、統合判定部107は、統合領域に含まれる全ての基本PUが画面間予測であった場合、予測情報として少なくとも動きベクトル情報と参照ピクチャ情報とが全て同じであるか否かを用いて第1動作モードと第2動作モードを切り換える。
S302の条件を満たさない場合(S301におけるNo)、図5Aのように、当該統合領域内の基本CUは統合されない。
一方、S302の条件を満たす場合(S301におけるYes)、統合判定部107は、図5Bのように、4つの16×16画素の基本CUを1つの32×32画素の統合CUに統合する(S303)。
図6は、統合判定処理を行うことにより出現する、各ブロックサイズの組み合わせを説明するための概念図である。これらのブロックサイズが、符号列生成部108において可変長符号化および算術符号化の対象となる。図3と比較すると、統合判定処理によって、CUサイズが32×32画素、PUサイズが32×32画素、TUサイズが16×16画素の構成からなる統合CUが追加されているのが分かる。
以上のように、実施の形態1にかかる動画像符号化装置100において、統合判定部107は、統合領域(複数の基本ブロックからなるN×N画素の領域)に属する複数の基本CUおよび基本PUがすべて同じブロックサイズかつ、統合領域に含まれる全ての基本PUの予測情報が同じである場合に、統合領域に含まれる複数の基本CUを1つの新たなCUとして統合する。そして、統合後の新たなCUに基づいて符号列を生成する。
図4に示す統合処理を行わない場合、基本PUが同じ予測情報を持っていたとしても、
各基本PUの予測情報をそれぞれ個別に符号列に記述することが必要となるため、CU層およびPU層のヘッダ情報の符号量が無駄に発生してしまう。一方、統合処理を行った場合、統合された1つの予測情報のみを符号列に記述するのみでよいため、CU層およびPU層のヘッダ情報の符号量を抑制することが可能となり、処理量を増加させることなく符号化効率を向上させることが可能となる。
なお、統合判定部107は、統合CUにおいて、CUおよびPUのみを統合する一方、TUについては統合前のままとしている。これにより、統合後に残差係数信号を再構成する必要がなく、CU層およびPU層のヘッダ情報の変更のみで統合CUに変換することが可能となる。
(実施の形態2)
続いて、実施の形態2にかかる動画像符号化装置100について、図面を参照しながら説明する。なお、動画像符号化装置100の構成は、実施の形態1で説明したものと同様であるため、説明を省略する。
実施の形態2にかかる動画像符号化装置100は、実施の形態1にかかる動画像符号化装置100と、統合判定部107による統合判定処理が異なる。
図7は、実施の形態2にかかる統合判定処理を示すフローチャートである。図8A、図8Bは、実施の形態2にかかる統合判定処理を示すイメージ図である。図7は、基本ブロックのサイズが16×16画素、統合領域のサイズが32×32画素とした場合の処理を示す。このとき、統合領域には4つの基本ブロックが包含されている。
まず、統合判定部107は、統合領域内に包含された4つの基本ブロックが、全て16×16画素の基本CUかつ16×16画素の基本PUから構成されているか否かを判定する(S301)。S301の条件を満たさない場合(S301におけるNo)、図8Aのように、統合領域内の基本CUは統合されない。一方、S301の条件を満たす場合(S301におけるYes)、統合判定部107は、統合領域内の4つの基本PUについて統合可能な組合せを構成する基本PUのみの予測情報が全て同じであるか否かを判定する(図7のS502)。図7のS502の判定の詳細を、図9を用いて説明する。
図9は、実施の形態2にかかる統合判定処理の条件を説明するための概念図である。図9のように、統合判定部107は、4つの基本PUの予測情報が全て同じ場合、4つの基本PUを統合した32×32画素の1つの統合PUに統合する。また、4つの基本PUの予測情報が全て同じではなくても、左右に隣り合う2組の基本PUの予測情報がそれぞれ同じ場合は、統合判定部107は、上側の2つの基本PUを統合した32×16画素のPUおよび、下側の2つの基本PUを統合した32×16画素のPUの2つの統合PUに統合する。また、4つの基本PUの予測情報が全て同じではなくても、上下に隣り合う2組の基本PUの予測情報がそれぞれ同じ場合は、統合判定部107は、左側の2つの基本PUを統合した16×32画素のPU、右側の2つのPUを統合した16×32画素の基本PUの2つの統合PUに統合する。なお、32×16画素の統合PUおよび16×32画素の統合PUは画面間予測の場合にのみ統合を選択可能であり、画面内予測の場合は32×32画素の統合PUへの統合のみしか選択できない。
要するに、実施の形態2にかかる統合判定処理では、統合領域(N×N画素の領域)内に属する複数の基本PUを、隣接する2つの基本PUによる1組のグループに分けた場合であって、かつ、それぞれのグループに属する基本PUの予測情報が同じである場合に、統合領域内に含まれる複数の基本PUを1つの新たなPUとして統合する。そして、この場合、統合判定部107は、図8Bのように、4つの16×16画素の基本CUを1つの32×32画素の統合CUに統合する(図7のS303)。
図10は、統合判定処理を行うことにより出現する、各ブロックサイズの組み合わせを説明するための概念図である。これらのブロックサイズが、符号列生成部108において可変長符号化および算術符号化の対象となる。図3と比較すると、統合判定処理によって、CUサイズが32×32画素、PUサイズが32×32画素、TUサイズが16×16画素の構成からなる統合CU、並びに、CUサイズが32×32画素、PUサイズが32×16画素もしくは16×32画素、TUサイズが16×16画素の構成からなる統合CUが追加されているのが分かる。
以上のように、実施の形態2にかかる動画像符号化装置100において、統合判定部107は、統合領域(N×N画素の領域)に属する複数の基本PUを、隣接する2つの基本PUを1組のグループに分けた場合に、分けたそれぞれのグループ内に属する基本PUの予測情報が同じであるとき、統合領域に含まれる複数の基本CUを1つの新たなCUとして統合する。そして、統合後の新たなCUに基づいて符号列を生成する。
例えば、統合判定部107は、統合領域(N×N画素の領域)のうち、上側半分の領域に含まれる全ての基本PUの予測情報が同じ情報であり、かつ下側半分の領域に含まれる全ての基本PUの予測情報が同じ情報であった場合、統合領域に含まれる複数の基本CUを1つの新たなCUとして統合する。或いは、統合判定部107は、統合領域(N×N画素の領域)のうち、左側半分の領域に含まれる全ての基本PUの予測情報が同じ情報であり、かつ右側半分の領域に含まれる全ての基本PUの予測情報が同じ情報であった場合、統合領域に含まれる複数の基本CUを1つの新たなCUとして統合する。
実施の形態1にかかる統合処理では4つの基本PUの予測情報が全て同じ場合しか統合CUへと統合されなかった。これに対し、実施の形態2にかかる統合処理では、2組の基本PUの予測情報がそれぞれ同じ場合にも統合CUへと統合されるため、より多くのCUを統合することが可能となる。これにより、CU層およびPU層のヘッダ情報の符号量をさらに抑制することが可能となり、処理量を増加させることなく符号化効率を向上させることが可能となる。
なお、統合判定部107は、統合CUにおいて、CUおよびPUのみを統合する一方、TUについては統合前のままとしている。これにより、統合後に残差係数信号を再構成する必要がなく、CU層およびPU層のヘッダ情報の変更のみで統合CUに変換することが可能となる。
(実施の形態3)
続いて、実施の形態3にかかる動画像符号化装置100について、図面を参照しながら説明する。なお、動画像符号化装置100の構成は、実施の形態1で説明したものと同様であるため、説明を省略する。
実施の形態3にかかる動画像符号化装置100は、実施の形態1および2にかかる動画像符号化装置100と、統合判定部107による統合判定処理が異なる。
実施の形態3にかかる統合判定部107では、複数の基本ブロックを包含する統合領域として、統合領域1と統合領域2の2段階の統合領域を定義している。統合判定部107は、統合領域に含まれる全ての基本ブロックについて、基本ブロック単位処理ループ部111の一連の処理が完了した時点で統合判定処理する。
統合判定部107における、複数の基本ブロックに属する基本CUを統合して1つの統合CUとするか否かを判定する方法について、図11、図12A、図12B、図12Cを用いて具体的に説明する。図11は、実施の形態3にかかる統合判定処理を示すフローチャートである。図12A、図12B、図12Cは、実施の形態3にかかる統合判定処理を示すイメージ図である。図11は、基本ブロックが16×16画素、統合領域1が32×32画素、統合領域2が64×64画素とした場合の処理を示す。統合領域2は、統合領域1を包含している。このとき、統合領域1には4つの基本ブロックが包含されている。統合領域2には、4つの統合領域1が包含されている。すなわち、統合領域2には、16個の基本ブロックが包含されている。なお、統合領域のサイズとして、基本ブロックのサイズよりも大きなサイズであれば、基本ブロックのサイズに応じて32×32画素および64×64画素以外のサイズを使用してもよい。
まず、統合判定部107は、統合領域1内に内包された4つの基本ブロックが、全て16×16画素の基本CUかつ16×16画素の基本PUから構成されているか否かを判定する(S801)。
S801の条件を満たさない場合(S801におけるNo)、図12Aのように、統合領域1内の基本CUは統合されない。
一方、S801の条件を満たす場合(S801におけるYes)、統合判定部107は、統合領域1内の4つの基本PUの予測情報が全て同じであるか否かを判定する(S802)。具体的には、画面内予測の場合、統合領域1内の4つの基本PUの少なくとも画面内予測モードが全て同じであるか否かを判定する。また、画面間予測の場合、統合領域1内の4つの基本PUの少なくとも動きベクトル情報および参照ピクチャ情報が全て同じであるか否かを判定する。
S802の条件を満たさない場合(S802におけるNo)、図12Aのように、当該統合領域1内の基本CUは統合されない。
一方、S802の条件を満たす場合(S802におけるYes)、統合判定部107は、4つの16×16画素の基本CUを1つの32×32画素の統合CU1に統合する(S803)。
統合判定部107は、S801からS803までの一連の処理を、統合領域2内に属する4つの全ての統合領域1について行う(S804)。すなわち、統合判定部107は、統合領域2内の全ての統合領域1についてS801からS803の一連の処理が完了していない場合(S804におけるNo)、当該処理が完了していない統合領域1についてS801からS803までの一連の動作を行う。その結果、いずれの統合領域1についても統合処理が行われなかった場合、図12Aのように、統合領域2内の16個の基本CUは全て統合されない。一方、4つの統合領域1のうち一部の統合領域1のみが統合された場合、図12Bのように、統合領域2内の一部の基本CUについてのみ32×32画素の統合CU1に統合される。
次に、統合判定部107は、統合領域2内の全ての統合領域1についてS801からS803の一連の処理が完了した場合(S804におけるYES)、統合領域2内に属する4つの統合領域1について、全てのCUが統合CU1に統合されているか否かを判定する(S805)。
S805の条件を満たさない場合(S805におけるNo)、統合判定部107は、統合判定処理を終了する。
S805の条件を満たす場合(S805におけるYes)、統合判定部107は、統合領域2内の4つの統合PU1の予測情報が全て同じであるかどうかを判定する(S806)。
S806の条件を満たさない場合(S806におけるNo)、統合判定部107は、統合判定処理を終了する。
S806の条件を満たす場合(S806におけるYes)、統合判定部107は、図12Cのように、4つの32×32画素の統合CU1をさらに1つの64×64画素の統合CU2に統合する(S807)。動画像符号化装置100は、基本ブロックのサイズをHEVCで規定されている64×64画素および32×32画素よりも小さい16×16画素に限定している。これにより、32×32画素の統合CU1への統合および、64×64画素の統合CU2への統合が可能となる。
図13は、統合判定処理を行うことにより出現する、各ブロックサイズの組み合わせを説明するための概念図である。これらのブロックサイズが、符号列生成部108において可変長符号化および算術符号化の対象となる。図3と比較すると、統合判定処理によって、CUサイズが32×32画素、PUサイズが32×32画素、TUサイズが16×16画素の構成からなる統合CU1、並びにCUサイズが64×64画素、PUサイズが64×64画素、TUサイズが16×16画素の構成からなる統合CU2が追加されているのが分かる。
以上のように、実施の形態3にかかる動画像符号化装置100において、統合判定部107は、統合領域1(複数の基本ブロックからなるN×N画素の領域)に属する複数の基本CUおよび基本PUがすべて同じブロックサイズかつ、統合領域1に含まれる全ての基本PUの予測情報が同じである場合に、統合領域1に含まれる複数の基本CUを1つの新たな統合CU1として統合する。更に、統合判定部107は、統合領域2(複数の統合領域1からなる領域)内の全てのCUが統合CU1に統合されており、かつ、統合領域2内の全ての統合PU1の予測情報が同じである場合に、統合領域2に含まれる複数の基本CUを1つの新たな統合CU2として統合する。そして、統合後の新たなCUに基づいて符号列を生成する。
実施の形態1にかかる統合処理では最大でも4つの基本CUまでしか統合されなかった。これに対し、実施の形態3にかかる統合処理では、最大16個の基本CUまで統合されることになり、より多くのCUを1つのCUに統合することが可能となる。これにより、CU層およびPU層のヘッダ情報の符号量をさらに抑制することが可能となり、処理量を増加させることなく符号化効率を向上させることが可能となる。
なお、統合判定部107は、統合CU1および統合CU2において、CUおよびPUのみを統合する一方、TUについては統合前のままとしている。これにより、統合後に残差係数信号を再構成する必要がなく、CU層およびPU層のヘッダ情報の変更のみで統合CU1および統合CU2に変換することが可能となる。
(その他の実施形態)
以上のように、本出願において開示する技術の例示として、実施の形態1〜3を説明した。しかしながら、本開示における技術は、これに限定されず、変更、置き換え、付加、省略などを行った実施の形態にも適用できる。また、上記実施の形態1〜3で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。
そこで、以下、他の実施の形態を例示する。
実施の形態1〜3において説明した各々の統合判定処理は、それぞれ個別に使用することに限定されない。すなわち、実施の形態1〜3において説明した各々の統合判定処理のうち、いずれか複数の処理を組合せて使用してもよい。例えば、図11に示す実施の形態3のフローチャートにおいて、ステップS802およびステップS805の両方或いは一方を、図7に示す実施の形態2のフローチャートにおけるステップS502と置き換えてもよい。
さらに、上記の実施の形態1〜3で示した動画像符号化装置100に含まれる各手段と同等の機能を備えるプログラムを、フレキシブルディスク等の記録媒体に記録するようにしてもよい。これにより、上記実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。なお、記録媒体としてはフレキシブルディスクに限らず、光ディスク、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
また、上記の実施の形態1〜3で示した動画像符号化装置100に含まれる各手段と同等の機能を集積回路であるLSIとして実現してもよい。これらは各手段の一部または全てを含むように1チップ化されてもよい。またLSIは集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIなどに置き換わる集積回路の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。
なお、上述の実施の形態は、本開示における技術を例示するためのものであるから、特許請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
本開示は、入力画像を構成する各ピクチャを符号化して動画像符号化データとして出力する動画像符号化装置に適用できる。例えば、ビデオカメラ、デジタルカメラ、ビデオレコーダ、携帯電話、携帯情報端末およびパーソナルコンピューターなどに、本開示は適用可能である。
100 動画像符号化装置
101 ピクチャメモリ
102 基本ブロック分割部
103 予測残差符号化部
104 予測残差復号化部
105 ピクチャバッファ
106 予測処理部
107 統合判定部
108 符号列生成部
109 差分演算部
110 加算演算部
111 基本ブロック単位処理ループ部

Claims (12)

  1. 符号化対象ピクチャを所定の符号化規格にて符号化し、符号列を生成する動画像符号化装置であって、
    前記符号化対象ピクチャを符号化単位(基本CU)毎に分割して出力する分割部と、
    前記出力される1つの前記基本CUを少なくとも1つ以上に分割して得られる単位であって、前記基本CUのサイズ以下の大きさの予測単位(基本PU)毎に画面内予測もしくは画面間予測し予測画像を生成する予測処理部と、
    前記生成した予測画像と、前記符号化対象ピクチャのうち前記予測画像に対応する画像とを差分演算し、差分画像を生成する差分演算部と、
    前記生成された差分画像に対して直交変換および量子化処理し残差係数を生成する残差符号化部と、
    (1)N×N画素の領域に属する複数の基本CUおよび基本PUがすべて同じブロックサイズかつ(2)前記N×N画素の領域に属する複数の基本PUの予測情報が同じである場合に、前記N×N画素の領域に含まれる複数の基本CUを1つの新たなCUとして統合する統合部と、
    前記統合後の新たなCUに対して設定される符号化情報および前記統合後の新たなCU内に属していた統合前の複数の基本CUに関する残差係数を可変長符号化および算術符号化し、前記統合後の新たなCUに対する符号列を生成する符号列生成部と、を備えた、
    動画像符号化装置。
  2. 前記統合部は、(1)前記基本CUをそのまま出力する第1動作と、(2)N×N画素の領域に属する複数の前記基本CUを1つの新たなCUとして統合し出力する第2動作を切り換えて実行し、
    前記符号列生成部は、(1)前記基本CUが出力される場合、前記基本CUに対して設定される符号化情報および前記基本CUに関する残差係数を可変長符号化および算術符号化することにより符号列を生成し、一方(2)前記統合後の新たなCUが出力される場合、前記統合後の新たなCUに対して設定される符号化情報および前記統合後の新たなCU内に属していた統合前の複数の基本CUに関する残差係数を可変長符号化および算術符号化し、前記統合後の新たなCUに対する符号列を生成する、請求項1に記載の動画像符号化装置。
  3. 前記統合部は、前記N×N画素の領域に属する複数の基本PUを、隣接する2つの基本PUを1組のグループに分けた場合、当該分けたそれぞれのグループに属する基本PUの予測情報が同じである場合、前記N×N画素の領域に含まれる複数の基本CUを1つの新たなCUとして統合する請求項1に記載の動画像符号化装置。
  4. 前記統合部は、前記N×N画素の領域に含まれる全ての基本PUの予測情報が同じ情報であった場合、前記N×N画素の領域に含まれる複数の基本CUを1つの新たなCUとして統合する請求項3に記載の動画像符号化装置。
  5. 前記統合部は、前記N×N画素の領域のうち、上側半分の領域に含まれる全ての基本PUの予測情報が同じ情報であり、かつ下側半分の領域に含まれる全ての基本PUの予測情報が同じ情報であった場合、前記N×N画素の領域に含まれる複数の基本CUを1つの新たなCUとして統合する請求項3に記載の動画像符号化装置。
  6. 前記統合部は、前記N×N画素の領域のうち、左側半分の領域に含まれる全ての基本PUの予測情報が同じ情報であり、かつ右側半分の領域に含まれる全ての基本PUの予測情報が同じ情報であった場合、前記N×N画素の領域に含まれる複数の基本CUを1つの新たなCUとして統合する請求項3に記載の動画像符号化装置。
  7. 前記統合部は、前記N×N画素の領域に含まれる全ての基本PUが画面内予測であった場合、前記予測情報として少なくとも画面内予測モードを用いて前記第1動作と前記第2動作を切り換えて実行する請求項2に記載の動画像符号化装置。
  8. 前記統合部は、前記N×N画素の領域に含まれる全ての基本PUが画面間予測であった場合、前記予測情報として少なくとも動きベクトル情報と参照ピクチャ情報とを用いて前記第1動作と前記第2動作を切り換えて実行する請求項2に記載の動画像符号化装置。
  9. 前記残差符号化部は、1つの前記基本CUを少なくとも1つ以上に分割して得られる単位であって、前記基本CUのサイズ以下の大きさである直交変換単位(以下、基本TUと称す)毎に前記差分画像に対して直交変換および量子化処理し残差係数を生成し、
    前記統合部は、前記N×N画素の領域に含まれる複数の基本CUを1つの新たなCUとして統合して出力する場合であっても、前記基本TUは統合せずにそのまま前記残差符号化部において生成された残差係数を出力する請求項1に記載の動画像符号化装置。
  10. 前記予測処理部、前記差分演算部および前記残差符号化部は、前記符号化対象ピクチャを16×16画素の大きさのブロック単位で処理し、前記基本CUのブロックサイズとして、前記所定の符号化規格に規定されるCUのブロックサイズのうち、16×16画素又は、8×8画素の大きさのブロックサイズのみ利用して処理する請求項1に記載の動画像符号化装置。
  11. 前記N×N画素の領域は、32×32画素又は、64×64画素の大きさである、請求項10に記載の動画像符号化装置。
  12. 符号化対象ピクチャを所定の符号化規格にて符号化し、符号列を生成する動画像符号化方法であって、
    前記符号化対象ピクチャを符号化単位である基本CU毎に分割して出力し、
    前記出力される1つの前記基本CUを少なくとも1つ以上に分割して得られる単位であって、前記基本CUのサイズ以下の大きさの予測単位である基本PU毎に画面内予測もしくは画面間予測し予測画像を生成し、
    前記生成した予測画像と、前記符号化対象ピクチャのうち前記予測画像に対応する画像とを差分演算し、差分画像を生成し、
    前記生成された差分画像に対して直交変換および量子化処理し残差係数を生成し、
    (1)前記N×N画素の領域に属する複数の基本CUおよび基本PUがすべて同じブロックサイズかつ(2)前記N×N画素の領域に属する複数の基本PUの予測情報が同じである場合、前記N×N画素の領域に含まれる複数の基本CUを1つの新たなCUとして統合し、
    前記統合後の新たなCUに対して設定される符号化情報および前記統合後の新たなCU内に属していた統合前の複数の基本CUに関する残差係数を可変長符号化および算術符号化し、前記統合後の新たなCUに対する符号列を生成する、
    動画像符号化方法。
JP2015035041A 2014-03-06 2015-02-25 動画像符号化装置および動画像符号化方法 Active JP6731574B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015035041A JP6731574B2 (ja) 2014-03-06 2015-02-25 動画像符号化装置および動画像符号化方法
US14/641,086 US10225576B2 (en) 2014-03-06 2015-03-06 Video coding apparatus and video coding method
US16/253,753 US20190156392A1 (en) 2014-03-06 2019-01-22 Video coding apparatus and video coding method
US17/386,119 US20210358005A1 (en) 2014-03-06 2021-07-27 Video coding apparatus and video coding method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014043540 2014-03-06
JP2014043540 2014-03-06
JP2015035041A JP6731574B2 (ja) 2014-03-06 2015-02-25 動画像符号化装置および動画像符号化方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020104935A Division JP2020156106A (ja) 2014-03-06 2020-06-18 動画像符号化装置および動画像符号化方法

Publications (2)

Publication Number Publication Date
JP2015181225A true JP2015181225A (ja) 2015-10-15
JP6731574B2 JP6731574B2 (ja) 2020-07-29

Family

ID=54018737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015035041A Active JP6731574B2 (ja) 2014-03-06 2015-02-25 動画像符号化装置および動画像符号化方法

Country Status (2)

Country Link
US (3) US10225576B2 (ja)
JP (1) JP6731574B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106961604A (zh) * 2017-03-07 2017-07-18 腾讯科技(深圳)有限公司 视频编码的码率分配、编码单元码率分配方法及装置
US10721468B2 (en) 2016-09-12 2020-07-21 Nec Corporation Intra-prediction mode determination method, intra-prediction mode determination device, and storage medium for storing intra-prediction mode determination program
WO2022176019A1 (ja) * 2021-02-16 2022-08-25 日本電信電話株式会社 映像符号化方法、映像符号化装置、及び映像符号化プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190289301A1 (en) * 2016-05-23 2019-09-19 Kaonmedia Co., Ltd. Image processing method, and image encoding and decoding method using same
CN106231302B (zh) * 2016-07-28 2019-03-19 同观科技(深圳)有限公司 一种最优帧内预测模式的确定方法和系统
PL3477949T3 (pl) 2017-02-06 2024-02-19 Huawei Technologies Co., Ltd. Sposób i urządzenie do dekodowania obrazu z zastosowaniem informacji o podziale jednostki drzewa kodowania

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013108330A1 (ja) * 2012-01-18 2013-07-25 パナソニック株式会社 画像復号装置、画像符号化装置、画像復号方法および画像符号化方法
WO2013128010A2 (en) * 2012-03-02 2013-09-06 Canon Kabushiki Kaisha Method and devices for encoding a sequence of images into a scalable video bit-stream, and decoding a corresponding scalable video bit-stream
JP2013545372A (ja) * 2010-10-28 2013-12-19 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 映像情報符号化方法及び復号化方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101487687B1 (ko) * 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR101522850B1 (ko) * 2010-01-14 2015-05-26 삼성전자주식회사 움직임 벡터를 부호화, 복호화하는 방법 및 장치
KR101813189B1 (ko) * 2010-04-16 2018-01-31 에스케이 텔레콤주식회사 영상 부호화/복호화 장치 및 방법
KR102108078B1 (ko) * 2010-05-26 2020-05-08 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
HUE040406T2 (hu) * 2010-08-17 2019-03-28 Samsung Electronics Co Ltd Video dekódolási eljárás felhasználva variábilis fa szerkezetû transzformációs egységet
US8526495B2 (en) * 2010-11-22 2013-09-03 Mediatek Singapore Pte. Ltd. Apparatus and method of constrained partition size for high efficiency video coding
PL2665273T3 (pl) * 2011-01-13 2022-02-28 Nec Corporation Urządzenie do dekodowania wideo, sposób dekodowania wideo i program
US9049452B2 (en) * 2011-01-25 2015-06-02 Mediatek Singapore Pte. Ltd. Method and apparatus for compressing coding unit in high efficiency video coding
US20120294365A1 (en) * 2011-05-17 2012-11-22 Dong Zheng Image and video encoding and decoding
KR20130004173A (ko) * 2011-07-01 2013-01-09 한국항공대학교산학협력단 비디오 부호화 방법 및 복호화 방법과 이를 이용한 장치
US10440373B2 (en) * 2011-07-12 2019-10-08 Texas Instruments Incorporated Method and apparatus for coding unit partitioning
GB2505643B (en) * 2012-08-30 2016-07-13 Canon Kk Method and device for determining prediction information for encoding or decoding at least part of an image
GB2501535A (en) * 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
US10863184B2 (en) * 2012-08-15 2020-12-08 Texas Instruments Incorporated Fast intra-prediction mode selection in video coding
TW201419863A (zh) * 2012-11-13 2014-05-16 Hon Hai Prec Ind Co Ltd 影像切割系統及方法
US11178407B2 (en) * 2012-11-19 2021-11-16 Texas Instruments Incorporated Adaptive coding unit (CU) partitioning based on image statistics
US9357211B2 (en) * 2012-12-28 2016-05-31 Qualcomm Incorporated Device and method for scalable and multiview/3D coding of video information
WO2014190468A1 (en) * 2013-05-27 2014-12-04 Microsoft Corporation Video encoder for images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013545372A (ja) * 2010-10-28 2013-12-19 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 映像情報符号化方法及び復号化方法
WO2013108330A1 (ja) * 2012-01-18 2013-07-25 パナソニック株式会社 画像復号装置、画像符号化装置、画像復号方法および画像符号化方法
WO2013128010A2 (en) * 2012-03-02 2013-09-06 Canon Kabushiki Kaisha Method and devices for encoding a sequence of images into a scalable video bit-stream, and decoding a corresponding scalable video bit-stream

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10721468B2 (en) 2016-09-12 2020-07-21 Nec Corporation Intra-prediction mode determination method, intra-prediction mode determination device, and storage medium for storing intra-prediction mode determination program
CN106961604A (zh) * 2017-03-07 2017-07-18 腾讯科技(深圳)有限公司 视频编码的码率分配、编码单元码率分配方法及装置
US10764586B2 (en) 2017-03-07 2020-09-01 Tencent Technology (Shenzhen) Company Limited Bit rate allocation method, apparatus, and storage medium for code units in video coding
WO2022176019A1 (ja) * 2021-02-16 2022-08-25 日本電信電話株式会社 映像符号化方法、映像符号化装置、及び映像符号化プログラム

Also Published As

Publication number Publication date
JP6731574B2 (ja) 2020-07-29
US20190156392A1 (en) 2019-05-23
US20150256851A1 (en) 2015-09-10
US20210358005A1 (en) 2021-11-18
US10225576B2 (en) 2019-03-05

Similar Documents

Publication Publication Date Title
CN113678441B (zh) 视频编解码的方法和装置
JP2015181225A (ja) 動画像符号化装置および動画像符号化方法
CN111492661B (zh) 视频编解码方法、装置及存储介质
CN116723315A (zh) 视频解码的方法和装置、视频编码的方法和装置及存储介质
TW201830972A (zh) 用於視訊寫碼之低複雜度符號預測
CN114827594B (zh) 图片数据处理方法、装置及存储介质
KR101853998B1 (ko) 동화상 복호화 장치
JP2023053273A (ja) ビデオ符号化の動きベクトル予測子インデックス符号化
JP2024023885A (ja) 動画像符号化装置及び動画像符号化方法
JP2010063092A (ja) 画像符号化装置、画像符号化方法、画像符号化集積回路およびカメラ
CN110944173B (zh) 视频解码方法、装置、电子设备以及存储介质
JP2011250400A (ja) 動画像符号化装置及び動画像符号化方法
JP6013547B2 (ja) 画像符号化装置および画像符号化方法
JP6614935B2 (ja) 映像符号化装置およびプログラム
JP2009111647A (ja) 動きベクトル検出装置および動きベクトル検出方法
JP5593468B1 (ja) 画像符号化装置及び画像符号化方法
WO2012120910A1 (ja) 動画像符号化装置および動画像符号化方法
JP2016106444A (ja) 動画像符号化装置および動画像符号化方法
WO2014147679A1 (ja) 画像符号化装置および画像符号化方法
JP2012191491A (ja) 動画像復号化装置および動画像復号化方法
JP2013009195A (ja) 動画像符号化装置
JP2012235294A (ja) 動画像復号化装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20160523

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170928

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181218

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20190116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200601

R151 Written notification of patent or utility model registration

Ref document number: 6731574

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

SZ03 Written request for cancellation of trust registration

Free format text: JAPANESE INTERMEDIATE CODE: R313Z03

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350