JP2016184894A - 動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法 - Google Patents

動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法 Download PDF

Info

Publication number
JP2016184894A
JP2016184894A JP2015064986A JP2015064986A JP2016184894A JP 2016184894 A JP2016184894 A JP 2016184894A JP 2015064986 A JP2015064986 A JP 2015064986A JP 2015064986 A JP2015064986 A JP 2015064986A JP 2016184894 A JP2016184894 A JP 2016184894A
Authority
JP
Japan
Prior art keywords
image
encoding
decoding
frame
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015064986A
Other languages
English (en)
Other versions
JP6481457B2 (ja
Inventor
数井 君彦
Kimihiko Kazui
君彦 数井
幸二 山田
Koji Yamada
幸二 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015064986A priority Critical patent/JP6481457B2/ja
Priority to EP16158915.5A priority patent/EP3073737B1/en
Priority to US15/068,847 priority patent/US10250891B2/en
Priority to CN201610154130.XA priority patent/CN106028031B/zh
Publication of JP2016184894A publication Critical patent/JP2016184894A/ja
Application granted granted Critical
Publication of JP6481457B2 publication Critical patent/JP6481457B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】静止画符号化と動画像符号化とを併用する符号化方式において、静止画符号化から動画符号化への切り替えによる情報量の増加を抑制する。【解決手段】記憶部311は、静止画符号化と動画像符号化とが適用される動画像に含まれる符号化対象画像よりも前に符号化された符号化画像の復号画像を記憶する。動画像符号化部312は、符号化対象画像よりも1枚前の画像に対して静止画符号化が適用され、符号化対象画像に対して動画像符号化が適用される場合、復号画像を参照画像として用いるインター予測符号化により符号化対象画像を符号化する。【選択図】図3

Description

本発明は、動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法に関する。
動画像データは、非常に大きなデータ量を有することが多い。このため、送信装置から受信装置へ動画像データを送信する場合や、動画像データを記憶装置に格納する場合には、動画像データの圧縮符号化が行われる。
代表的な動画像符号化標準としては、Moving Picture Experts Group phase 2(MPEG−2)、MPEG−4、又はMPEG-4 Advanced Video Coding(MPEG−4 AVC/H.264)が知られている。これらの動画像符号化標準は、International Organization for Standardization/International Electrotechnical Commission(ISO/IEC)により策定されている。
また、新たな動画像符号化標準として、High Efficiency Video Coding(HEVC,MPEG−H/H.265)が策定されている(例えば、非特許文献1を参照)。
上述した動画像符号化標準は、インター予測符号化とイントラ予測符号化の2つの符号化方式を採用している。インター予測符号化は、符号化対象画像を符号化済み画像の情報を用いて符号化する符号化方式であり、イントラ予測符号化は、符号化対象画像が持つ情報のみを用いて符号化対象画像を符号化する符号化方式である。符号化対象画像は、フレーム又はピクチャと呼ばれることがある。
これらの動画像符号化標準が対象とする動画像は、主に各種カメラで撮影された自然画像である。ところが、近年の情報技術の進歩に伴い、自然画像に加えて、パーソナルコンピュータ(PC)のデスクトップ等のスクリーンコンテンツ画像にも動画像符号化を適用する流れが生じている。
スクリーンコンテンツ画像の動画像符号化の具体例としては、PCやゲーム機器の表示映像をフラットパネルディスプレイへ無線伝送するWireless displayが挙げられる。また、別の具体例としては、仮想オペレーティングシステムのユーザ画面をインターネットプロトコルによりモバイル機器に伝送する仮想デスクトップ(Virtual Display Infrastructure,VDI)が挙げられる。
スクリーンコンテンツ画像は、コンピュータグラフィックス等により生成される人工画像であり、自然画像とは異なる特徴を持っている。スクリーンコンテンツ画像の第1の特徴として、画素の低相関性が挙げられる。自然画像では、注目画素の画素値と隣接画素の画素値との間には、高い相関性が存在する。すべての動画像符号化標準が採用する離散コサイン変換(Discrete Cosine Transform,DCT)は、この高い相関性を利用する符号化処理であり、高い圧縮効率を実現することができる。
一方、スクリーンコンテンツ画像では、画素値の相関性が低い領域が多く存在する。例えば、文書編集画面での文字の輪郭部分、Computer Aided Design(CAD)データ編集画面での1画素単位の細線等である。このような領域にDCTを適用すると、特に低ビットレート条件において、モスキート歪と呼ばれる高周波成分の歪が、視覚的に顕著に知覚される。
2013年に国際標準化されたHEVC標準の第1版では、スクリーンコンテンツ画像を高能率に圧縮符号化するための技術が部分的に導入されている。具体的には、イントラ予測符号化及びインター予測符号化における予測誤差に適用されるDCTをスキップする、Transform Skip(TS)等である。
さらに、標準化が進められているHEVC次期版には、スクリーンコンテンツ画像の圧縮効率をさらに高める技術が導入されようとしている(例えば、非特許文献2を参照)。
回路規模の増加を抑えつつ、高画質な静止画を生成することが可能な撮像装置も知られている(例えば、特許文献1を参照)。この撮像装置は、動画像を圧縮して圧縮後の動画像を出力するとともに、圧縮後の動画像を伸張して伸張後の動画像を出力し、伸張後の動画像と、その伸張後の動画像に対応する動画像との差分動画像を生成し、差分動画像を圧縮して圧縮後の差分動画像を出力する。そして、撮像装置は、圧縮後の差分動画像を伸張して伸張後の差分動画像を出力し、伸張後の動画像と、伸張後の差分動画像とを加算して加算動画像を生成し、加算動画像を用いて静止画を生成する。
特開2011−239240号公報
ITU-T H.265 | ISO/IEC 23008-2, "High efficiency video coding", 2013 D. Flynn et al., "High Efficiency Video Coding (HEVC) Range Extensions text specification: Draft 6", JCTVC-P1005, 16th JCT-VC Meeting, San Jose, US, 9-17 January 2014
上述した従来の動画像符号化には、以下のような問題がある。
スクリーンコンテンツ画像を含む動画像に対して静止画符号化及び動画像符号化の両方を適用する場合、静止画符号化から動画符号化への切り替えにより、符号化後の情報量がバースト的に増加することがある。
1つの側面において、本発明の目的は、静止画符号化と動画像符号化とを併用する符号化方式において、静止画符号化から動画符号化への切り替えによる情報量の増加を抑制することである。
1つの案では、動画像符号化装置は、記憶部及び動画像符号化部を含む。
記憶部は、静止画符号化と動画像符号化とが適用される動画像に含まれる符号化対象画像よりも前に符号化された符号化画像の復号画像を記憶する。動画像符号化部は、符号化対象画像よりも1枚前の画像に対して静止画符号化が適用され、符号化対象画像に対して動画像符号化が適用される場合、復号画像を参照画像として用いるインター予測符号化により符号化対象画像を符号化する。
実施形態の動画像符号化装置によれば、静止画符号化と動画像符号化とを併用する符号化方式において、静止画符号化から動画符号化への切り替えによる情報量の増加を抑制することができる。
画像の劣化を示す図である。 発生情報量の変化を示す図である。 動画像符号化装置の構成図である。 動画像復号装置の構成図である。 動画像符号化装置の具体例を示す図である。 符号化部の構成図である。 符号化動画像を示す図である。 静動混合符号化処理のフローチャートである。 動画像復号装置の具体例を示す図である。 復号部の構成図である。 静動混合復号処理のフローチャートである。 情報処理装置の構成図である。
以下、図面を参照しながら、実施形態を詳細に説明する。
スクリーンコンテンツ画像の符号化では、符号化方式に加えて、符号化前の画素値のフィルタリングが問題となる。
MPEG等の動画像符号化標準では、画素値がYCbCr 4:2:0形式で符号化されることが多いが、スクリーンコンテンツ画像はRGB 4:4:4形式でキャプチャリングされることが多い。RGB 4:4:4形式のスクリーンコンテンツ画像に対して動画像符号化を適用する場合は、まず、RGB 4:4:4形式の画像がYCbCr 4:4:4形式の画像に変換される。その後、YCbCr 4:4:4形式の画像に対してダウンサンプリングフィルタを適用することで、YCbCr 4:2:0形式の画像が生成される。
YCbCr 4:2:0形式の画像では、YCbCr 4:4:4形式の画像と比較して、2つの色差成分Cb及びCrがともに、縦方向及び横方向に1/2にダウンサンプリングされている。動画像符号化においてYCbCr 4:2:0形式を使用する理由は、符号化における情報量の削減のためである。
人間の目は、輝度成分Yと比較して、色差成分Cb及びCrに対する空間方向解像度の知覚特性が劣っているが、自然画像においては、ダウンサンプリングによって失われる、空間周波数が高い色差成分は、ほとんど存在しない。このため、結果として、YCbCr 4:4:4形式とYCbCr 4:2:0形式との差はほとんど知覚されない。
一方、スクリーンコンテンツ画像では、YCbCr 4:4:4形式とYCbCr 4:2:0形式との差が明確に知覚されてしまう。例えば、CAD画像の配線のような、1画素単位の細線は、空間周波数が高い色差成分を含み、スクリーンコンテンツ画像に多く見られる平坦な背景においては、細線の劣化が顕著に認知されてしまう。
図1は、ダウンサンプリングによる画像の劣化の例を示している。変換前のYCbCr 4:4:4形式の画像101において、中央の縦線111の画素値(Y,Cb,Cr)は(128,0,0)であり、縦線111以外の領域112の画素値は(0,128,128)である。
この画像101の色差成分Cb及びCrに対して、横方向(及び縦方向)に2:1ダウンサンプリングフィルタを適用して4:2:0形式に変換した後、1:2アップサンプリングフィルタを適用して元の4:4:4形式に戻すと、画像102が得られる。画像102において、縦線113の画素値は(124,64,64)に変化しており、縦線113に隣接する領域114の画素値は(0,96,96)に変化している。
このように、ダウンサンプリングフィルタ及びアップサンプリングフィルタの適用により、縦線及び縦線に隣接する領域の色差成分が変化する。この画素値の変化は、背景が一様な場合には人間の目により明確に知覚される。
1画素単位の細線の劣化を防止するためには、動画像符号化においてYCbCr 4:4:4形式又はRGB 4:4:4形式を適用することが望ましい。しかし、この場合、符号化される色差成分の画素数が4:2:0形式と比較して多くなるため、符号化後の情報量が増加する。
そこで、YCbCr 4:4:4形式で符号化する静止画符号化と、YCbCr 4:2:0形式又はYCbCr 4:2:2形式で符号化する動画像符号化とを併用する静動混合符号化が考えられる。静止画符号化としては、例えば、Joint Photographic Experts Group(JPEG)方式が用いられ、動画像符号化としては、例えば、MPEG方式が用いられる。
静動混合符号化では、画面の全体又は部分に対応する画像が静止しているか又は動いているかによって、符号化方式が動的に切り替えられる。動画像符号化装置は、画面が静止している場合、具体的には2枚の連続するフレーム間の差分が0の場合には、静止後最初のフレームに対して静止画符号化を適用し、後続のフレームは符号化しない。動画像復号装置は、静止画符号化されたフレームを復号した後、次の符号化データを受信するまで同じ復号画像を繰り返し表示する。一方、画面が動いている場合には、動画像符号化装置は、フレームに対して動画像符号化を適用する。
人間の目は、静止領域と比較して、動領域における画像劣化に対する知覚が低下する特性を持つ。このため、静動混合符号化により、人間が知覚する画像劣化を最小限に抑えながら、発生情報量を削減することが可能になる。
なお、自然画像では、撮影時に複数の要因によりノイズが生じ、静止時でも画素値が微妙に変動するため、フレーム間の差分が0になることはない。一方、スクリーンコンテンツ画像では、そのようなノイズは発生せず、静止時にはフレーム間の差分が0になる。
図2は、このような静動混合符号化における発生情報量の変化の例を示している。静動混合符号化において、静止画符号化データ及び動画像符号化データはそれぞれの中で閉じている。
例えば、静止した画面から動きのある画面に移行する場合、動画像符号化装置は、まず、フレームに対して静止画符号化を適用した後、静止画符号化から動画像符号化に切り替える。MPEG等の動画像符号化において、動画像符号化装置は、動画像符号化に切り替えた直後の最初のフレームをイントラ予測符号化により符号化し、後続するフレームをインター予測符号化により符号化する。
イントラ予測符号化では多くの情報が発生するため、ピーク201が示すように、静止画符号化から動画像符号化への切り替え時にはバースト的に情報が発生し、通信ネットワークの輻輳を引き起こす可能性がある。
また、動きのある画面から静止した画面に移行する場合、動画像符号化装置は、インター予測符号化から静止画符号化に切り替える。JPEG等の静止画符号化では、ピーク202が示すように、インター予測符号化と比較して静止画符号による多くの情報が発生する。
静止画符号化から動画像符号化への切り替えによる過剰な情報の発生を抑制するために、静止画符号化された符号化フレームの復号フレームと切り替え後の最初のフレームとの差分を求め、この差分をイントラ予測符号化により符号化する方法が考えられる。しかし、この方法では、最初のフレームの符号化後の情報量を削減することができるが、以降のフレームの情報量は削減されない。
その理由は、以降のフレームのインター予測符号化において、過去に符号化されたフレームと符号化対象フレームとの差分が符号化されるためである。切り替え後の最初のフレームの復号フレームが通常のフレームではなく、2つのフレームの差分である場合、その次の符号化対象フレームである通常のフレームとの差分が非常に大きくなり、インター予測の効率が極端に低下する。
なお、かかる問題は、スクリーンコンテンツ画像を含む動画像を符号化する場合に限らず、画像の劣化が顕著に認知される他の画像を含む動画像を符号化する場合においても生ずるものである。
そこで、静止画符号化された符号化フレームの復号フレームを、切り替え後の最初のフレームよりも前に符号化されたフレームとみなし、参照フレームとして用いて、切り替え後の最初のフレームにインター予測符号化を適用する方法も考えられる。この方法では、切り替え後の最初のフレームがインター予測符号化により符号化されるため、イントラ予測符号化と比較して、発生する符号の情報量が減少する。
図3は、実施形態の動画像符号化装置の構成例を示している。図3の動画像符号化装置301は、記憶部311及び動画像符号化部312を含む。記憶部311は、静止画符号化と動画像符号化とが適用される動画像に含まれる符号化対象画像よりも前に符号化された符号化画像の復号画像を記憶する。動画像符号化部312は、符号化対象画像よりも1枚前の画像に対して静止画符号化が適用され、符号化対象画像に対して動画像符号化が適用される場合、復号画像を参照画像として用いるインター予測符号化により符号化対象画像を符号化する。
図4は、実施形態の動画像復号装置の構成例を示している。図4の動画像復号装置401は、記憶部411及び動画像復号部412を含む。記憶部411は、静止画復号と動画像復号とが適用される符号化動画像に含まれる復号対象画像よりも前に復号された復号画像を記憶する。動画像復号部412は、復号対象画像よりも1枚前の符号化画像に対して静止画復号が適用され、復号対象画像に対して動画像復号が適用される場合、復号画像を参照画像として用いるインター予測復号により復号対象画像を復号する。
図3の動画像符号化装置301又は図4の動画像復号装置401によれば、静止画符号化と動画像符号化とを併用する符号化方式において、静止画符号化から動画符号化への切り替えによる情報量の増加を抑制することができる。
動画像符号化装置301及び動画像復号装置401は、様々な用途に利用される。例えば、動画像符号化装置301又は動画像復号装置401を、ビデオカメラ、動画像送信装置、動画像受信装置、テレビ電話システム、コンピュータ、又は携帯電話機に組み込むことも可能である。
図5は、図3の動画像符号化装置301の具体例を示している。図3の動画像符号化装置301は、モード判定部501、フレーム変換部502〜フレーム変換部505、差分計算部506、加算部507、符号化部508、静止画符号化部509、静止画復号部510、及び多重化部511を含む。
動画像符号化装置301は、例えば、ハードウェア回路として実装することができる。この場合、動画像符号化装置301は、各構成要素を個別の回路として含んでいてもよく、1つの集積回路であってもよい。
動画像符号化装置301は、入力される符号化対象動画像を符号化し、符号化動画像を出力する。符号化対象動画像は、複数のフレームを含む。各フレームは、符号化対象画像(符号化対象フレーム)に対応し、カラー画像であってもよく、モノクロ画像であってもよい。フレームがカラー画像の場合、画素値はRGB信号であってもよく、色差信号であってもよい。以下では、画素値が色差信号の場合について説明する。
モード判定部501は、フレームバッファを含み、符号化対象動画像のフレームレート間隔にて、符号化対象フレームの画素値と、符号化対象フレームよりも1枚前の直前フレームの画素値との差分を計算する。そして、モード判定部501は、2つのフレームの差分に基づいて、符号化対象フレームが静止しているか否かを判定する。
モード判定部501は、符号化対象フレームに動きがある場合、符号化モードとして動画像符号化を選択し、符号化対象フレームが静止している場合、符号化モードとして静止画符号化を選択する。そして、モード判定部501は、選択した符号化モードを示す制御信号を動画像符号化装置301内の各部へ出力する。
フレーム変換部502は、符号化対象フレームの色差形式を、静止画符号化の色差形式に変換し、変換後のフレームを差分計算部506へ出力する。フレーム変換部503は、符号化部508から出力される復号フレームの色差形式(動画像符号化の色差形式)を、静止画符号化の色差形式に変換し、変換後の復号フレームを差分計算部506及び加算部507へ出力する。
符号化対象フレームの色差形式は、YCbCr 4:4:4形式であってもよく、静止画符号化の色差形式は、YCbCr 4:2:2形式であってもよく、動画像符号化の色差形式は、YCbCr 4:2:0形式であってもよい。
差分計算部506は、直前フレームの符号化モードが動画像符号化である場合、フレーム変換部502から出力されるフレームの画素値と、フレーム変換部503から出力されるフレームの画素値との差分を計算する。そして、差分計算部506は、2つのフレームの差分を静止画符号化部509へ出力する。一方、直前フレームの符号化モードが静止画符号化である場合、差分計算部506は、フレーム変換部502から出力されるフレームをそのまま静止画符号化部509へ出力する。
静止画符号化部509は、差分計算部506から出力される差分又はフレームに対して静止画符号化を行って、静止画符号化フレームを生成し、静止画復号部510及び多重化部511へ出力する。静止画復号部510は、静止画符号化部509から出力される静止画符号化フレームを復号し、2つのフレームの差分又は復号フレームを加算部507へ出力する。
加算部507は、静止画復号部510から差分が出力された場合、フレーム変換部503から出力される復号フレームに差分を加算して、加算結果の復号フレームをフレーム変換部504へ出力する。一方、静止画復号部510から復号フレームが出力された場合、加算部507は、その復号フレームをそのままフレーム変換部504へ出力する。
フレーム変換部504は、加算部507から出力される復号フレームの色差形式を、動画像符号化の色差形式に変換し、変換後の復号フレームを符号化部508へ出力する。フレーム変換部505は、符号化対象フレームの色差形式を、動画像符号化の色差形式に変換し、変換後のフレームを符号化部508へ出力する。
符号化部508は、フレーム変換部504から出力される復号フレームを用いて、フレーム変換部505から出力されるフレームを動画像符号化により符号化し、動画像符号化フレームを生成して多重化部511へ出力する。また、符号化部508は、生成した動画像符号化フレームを局所復号して復号フレームを生成し、フレーム変換部503へ出力する。
多重化部511は、静止画符号化部509から出力される静止画符号化フレームと、符号化部508から出力される動画像符号化フレームとを多重化し、符号化動画像として出力する。符号化動画像には、各符号化フレームの符号化モードの情報、各符号化モードにおける色差形式の情報等が付加される。動画像符号化装置301は、通信ネットワークを介して符号化動画像を動画像復号装置401へ送信してもよい。
図6は、図5の符号化部508の構成例を示している。図6の符号化部508は、動画像符号化部312、入力フレームバッファ601、及び参照フレームバッファ602を含む。入力フレームバッファ601及び参照フレームバッファ602は、記憶部311に対応する。動画像符号化部312は、ソース符号化部603及びエントロピー符号化部604を含む。
入力フレームバッファ601は、フレーム変換部505から出力されるフレームを処理対象フレームとして格納し、ソース符号化部603へ出力する。参照フレームバッファ602は、フレーム変換部504から出力される復号フレームを参照フレームとして格納する。この参照フレームは、静止画符号化から動画像符号化への切り替え後の最初のフレームに対してインター予測符号化が適用される際に、ソース符号化部603へ出力される。
ソース符号化部603は、入力フレームバッファ601に格納された処理対象フレームに対してソース符号化を適用して、符号化結果をエントロピー符号化部604へ出力する。ソース符号化は、インター予測符号化又はイントラ予測符号化に対応し、インター予測又はイントラ予測、予測誤差の周波数変換及び量子化、逆量子化及び逆周波数変換の変換結果と予測画素値との加算、及びループ内フィルタによるフィルタリングを含む。
インター予測符号化において、ソース符号化部603は、入力フレームバッファ601に格納された処理対象フレームの画素値と、参照フレームバッファ602に格納された参照フレームの画素値とから予測誤差を計算する。そして、ソース符号化部603は、予測誤差を周波数変換した変換結果を量子化して、量子化結果をエントロピー符号化部604へ出力する。また、ソース符号化部603は、量子化結果を局所復号して復号フレームを生成し、生成した復号フレームを参照フレームとして参照フレームバッファ602に格納する。
エントロピー符号化部604は、ソース符号化部603から出力される量子化結果を、予測符号化パラメータ等とともにエントロピー符号化により符号化して動画像符号化フレームを生成し、多重化部511へ出力する。予測符号化パラメータには、例えば、量子化ステップ、動きベクトル等の情報が含まれる。
図7は、多重化部511が出力する符号化動画像の例を示している。図7の符号化動画像は、伝送順序に従って出力される複数の符号化フレーム701を含む。各符号化フレーム701は、静止画符号化フレーム又は動画像符号化フレームであり、ヘッダ711及び符号化データ712を含む。
ヘッダ711は、符号化フレーム701の符号化モード、符号化対象フレームの色差形式、及び符号化フレーム701の色差形式を示す情報を含む。符号化データ712は、符号化対象フレームの符号化結果に対応する。
図8は、図5の動画像符号化装置301が行う静動混合符号化処理の例を示すフローチャートである。まず、モード判定部501は、符号化対象フレームと直前フレームとの差分を計算し(ステップ801)、差分を閾値と比較する(ステップ802)。
差分が閾値以上である場合(ステップ802,YES)、モード判定部501は、符号化モードを動画像符号化に決定し(ステップ803)、フレーム変換部505は、符号化対象フレームの色差形式を、動画像符号化の色差形式に変換する。
次に、フレーム変換部504は、符号化モードが動画像符号化へ切り替えられた直後であるか否かをチェックする(ステップ804)。直前フレームの符号化モードが静止画符号化である場合、切り替えの直後であると判定され、直前フレームの符号化モードが動画像符号化である場合、切り替えの直後ではないと判定される。
動画像符号化への切り替えの直後である場合(ステップ804,YES)、フレーム変換部504は、静止画符号化された直前フレームの復号フレームの色差形式を、動画像符号化の色差形式に変換する(ステップ805)。そして、符号化部508は、変換後の復号フレームを参照フレームバッファ602内の参照フレームリストに格納する(ステップ806)。
次に、符号化部508は、変換後の復号フレームを参照フレームとして用いて、インター予測符号化により符号化対象フレームを符号化し、動画像符号化フレームを生成する(ステップ807)。このとき、符号化部508は、動画像符号化フレームの復号フレームを生成し、参照フレームバッファ602内の参照フレームリストに追加する。また、フレーム変換部503は、その復号フレームの色差形式を、静止画符号化の色差形式に変換する。
このように、静止画符号化から動画像符号化への切り替え後の最初の符号化対象フレームをインター予測符号化により符号化することで、イントラ予測符号化の場合と比較して、切り替えによる符号量の過剰な増加を抑制することができる。
一方、動画像符号化への切り替えの直後ではない場合(ステップ804,NO)、符号化部508は、参照フレームリスト内のいずれかの参照フレームを用いて、インター予測符号化により符号化対象フレームを符号化する(ステップ807)。
次に、モード判定部501は、未処理のフレームが残っているか否かチェックし(ステップ815)、未処理のフレームが残っている場合(ステップ815,YES)、次のフレームを符号化対象フレームとしてステップ801以降の処理を繰り返す。
差分が閾値未満である場合(ステップ802,NO)、モード判定部501は、符号化モードを静止画符号化に決定し(ステップ808)、フレーム変換部502は、符号化対象フレームの色差形式を、静止画符号化の色差形式に変換する。
次に、フレーム変換部503は、符号化モードが静止画符号化へ切り替えられた直後であるか否かをチェックする(ステップ809)。直前フレームの符号化モードが動画像符号化である場合、切り替えの直後であると判定され、直前フレームの符号化モードが静止画符号化である場合、切り替えの直後ではないと判定される。
静止画符号化への切り替えの直後である場合(ステップ809,YES)、フレーム変換部503は、動画像符号化された直前フレームの復号フレームの色差形式を、静止画符号化の色差形式に変換する(ステップ810)。そして、差分計算部506は、変換後の符号化対象フレームと変換後の復号フレームとの差分を計算する(ステップ811)。
次に、静止画符号化部509は、静止画符号化により差分を符号化し、静止画符号化フレームを生成する(ステップS812)。そして、静止画復号部510は、静止画符号化フレームを復号して差分を生成する。
このように、動画像符号化から静止画符号化への切り替え後の最初の符号化対象フレームは、動画像符号化された直前フレームの復号フレームに対する差分を用いて符号化される。これにより、JPEG等の静止画符号化の場合と比較して、切り替えによる符号量の過剰な増加を抑制することができる。
一方、静止画符号化への切り替えの直後ではない場合(ステップ809,NO)、静止画符号化部509は、変換後の符号化対象フレームを静止画符号化により符号化し、静止画符号化フレームを生成する(ステップS812)。そして、静止画復号部510は、静止画符号化フレームを復号して復号フレームを生成する。
次に、加算部507は、符号化モードが静止画符号化へ切り替えられた直後であるか否かをチェックする(ステップ813)。動画像符号化への切り替えの直後である場合(ステップ813,YES)、加算部507は、変換後の復号フレームに静止画復号部510が生成した差分を加算して、加算結果の復号フレームを生成する(ステップ814)。一方、静止画符号化への切り替えの直後ではない場合(ステップ813,NO)、加算部507は、静止画復号部510が生成した復号フレームをそのまま出力する。
次に、モード判定部501は、ステップ815以降の処理を行う。そして、すべてのフレームが符号化された場合(ステップ815,NO)、モード判定部501は、処理を終了する。
図9は、図4の動画像復号装置401の具体例を示している。図9の動画像復号装置401は、復号制御部901、逆多重化部902、静止画復号部903、復号部904、フレーム変換部905〜フレーム変換部908、加算部909、及びフレームバッファ910を含む。
動画像復号装置401は、例えば、ハードウェア回路として実装することができる。この場合、動画像復号装置401は、各構成要素を個別の回路として含んでいてもよく、1つの集積回路であってもよい。
動画像復号装置401は、入力される符号化動画像を復号し、復号結果である動画像を出力する。符号化動画像は、複数の符号化フレームを含み、各符号化フレームは、復号対象画像(復号対象フレーム)に対応する。
逆多重化部902は、符号化動画像を逆多重化して、静止画符号化フレーム、動画像符号化フレーム、各符号化フレームの符号化モードの情報、及び各符号化モードにおける色差形式の情報を抽出する。そして、逆多重化部902は、静止画符号化フレームを静止画復号部903へ出力し、動画像符号化フレームを復号部904へ出力し、符号化モードの情報及び色差形式の情報を復号制御部901へ出力する。
復号制御部901は、逆多重化部902から出力される符号化モードの情報及び色差形式の情報から、復号対象フレームの符号化モードと、静止画符号化の色差形式、及び動画像符号化の色差形式を取得する。そして、復号制御部901は、符号化モード及び色差形式を示す制御信号を動画像復号装置401内の各部へ出力する。
静止画復号部903は、逆多重化部902から出力される静止画符号化フレームを静止画復号により復号して復号結果を生成し、加算部909へ出力する。復号対象フレームよりも1枚前の直前フレームの符号化モードが動画像符号化である場合、復号結果は2つのフレームの差分を表し、直前フレームの符号化モードが静止画符号化である場合、復号結果は静止画復号フレームを表す。
加算部909は、直前フレームの符号化モードが動画像符号化である場合、静止画復号部903から出力される差分と、フレーム変換部907から出力される変換後の復号フレームとを加算して、加算結果の復号フレームを生成する。そして、加算部909は、加算結果の復号フレームをフレーム変換部905及びフレーム変換部906へ出力する。一方、直前フレームの符号化モードが静止画符号化である場合、加算部909は、静止画復号部903から出力される静止画復号フレームをそのままフレーム変換部906へ出力する。
フレーム変換部906は、加算部909から出力される加算結果の復号フレーム又は静止画復号フレームの色差形式(静止画符号化の色差形式)を、動画像復号装置401が出力する動画像の色差形式に変換する。そして、フレーム変換部906は、変換後の復号フレームをフレームバッファ910へ出力する。フレーム変換部905は、加算部909から出力される加算結果の復号フレームの色差形式を、動画像符号化の色差形式に変換し、変換後の復号フレームを復号部904へ出力する。
静止画符号化の色差形式は、YCbCr 4:2:2形式であってもよく、動画像符号化の色差形式は、YCbCr 4:2:0形式であってもよく、動画像復号装置401が出力する動画像の色差形式は、YCbCr 4:4:4形式であってもよい。
復号部904は、フレーム変換部905から出力される変換後の復号フレームを用いて、逆多重化部902から出力される動画像符号化フレームを動画像復号により復号して、動画像復号フレームを生成する。そして、復号部904は、動画像復号フレームをフレーム変換部907及びフレーム変換部908へ出力する。
フレーム変換部908は、復号部904から出力される動画像復号フレームの色差形式(動画像符号化の色差形式)を、動画像復号装置401が出力する動画像の色差形式に変換し、変換後の復号フレームをフレームバッファ910へ出力する。フレーム変換部907は、復号部904から出力される動画像復号フレームの色差形式を、静止画符号化の色差形式に変換し、変換後の復号フレームを加算部909へ出力する。
フレームバッファ910は、フレーム変換部906及びフレーム変換部908から出力される変換後の復号フレームをバッファリングし、表示タイミングに従って表示装置へ出力する。これにより、動画像が画面上に表示される。
図10は、図9の復号部904の構成例を示している。図10の復号部904は、動画像復号部412及び参照フレームバッファ1001を含む。参照フレームバッファ1001は、記憶部411に対応する。動画像復号部412は、エントロピー復号部1011及びソース復号部1012を含む。
参照フレームバッファ1001は、フレーム変換部905から出力される復号フレームを参照フレームとして格納する。この参照フレームは、静止画符号化から動画像符号化への切り替え後の最初の動画像符号化フレームに対してインター予測復号が適用される際に、ソース復号部1012へ出力される。
エントロピー復号部1011は、逆多重化部902から出力される動画像符号化フレームをエントロピー復号により復号して、復号結果をソース復号部1012へ出力する。復号結果には、予測符号化パラメータ等が含まれる。
ソース復号部1012は、エントロピー復号部1011から出力される復号結果に対してソース復号を適用して動画像復号フレームを生成し、生成した動画像復号フレームを参照フレームとして参照フレームバッファ1001に格納する。ソース復号は、インター予測復号又はイントラ予測復号に対応し、逆量子化及び逆周波数変換、インター予測又はイントラ予測、逆量子化及び逆周波数変換の変換結果と予測画素値との加算、及びループ内フィルタによるフィルタリングを含む。
インター予測復号において、ソース復号部1012は、エントロピー復号部1011から出力される復号結果を逆量子化し、逆量子化結果を逆周波数変換して、予測誤差を生成する。そして、ソース復号部1012は、生成した予測誤差と、参照フレームバッファ1001に格納された参照フレームの画素値とから、動画像復号フレームを生成して、参照フレームバッファ1001に格納する。
参照フレームバッファ1001に格納された動画像復号フレームは、フレーム変換部907及びフレーム変換部908へ出力されるとともに、後続する動画像符号化フレームに対する参照フレームとして用いられる。
図11は、図9の動画像復号装置401が行う静動混合復号処理の例を示すフローチャートである。まず、復号制御部901は、逆多重化部902から符号化モードの情報を取得し(ステップ1101)、復号対象フレームの符号化モードが動画像符号化又は静止画符号化のいずれであるかをチェックする(ステップ1102)。
復号対象フレームの符号化モードが動画像符号化である場合(ステップ1102,YES)、フレーム変換部905は、符号化モードが動画像符号化へ切り替えられた直後であるか否かをチェックする(ステップ1103)。直前フレームの符号化モードが静止画符号化である場合、切り替えの直後であると判定され、直前フレームの符号化モードが動画像符号化である場合、切り替えの直後ではないと判定される。
動画像符号化への切り替えの直後である場合(ステップ1103,YES)、フレーム変換部905は、直前の静止画復号フレームの色差形式を、動画像符号化の色差形式に変換する(ステップ1104)。そして、復号部904は、変換後の復号フレームを参照フレームバッファ1001内の参照フレームリストに格納する(ステップ1105)。
次に、復号部904は、変換後の復号フレームを参照フレームとして用いて、インター予測復号により復号対象フレームを復号し、動画像復号フレームを生成する(ステップ1106)。そして、復号部904は、生成した動画像符号化フレームを参照フレームバッファ1001内の参照フレームリストに追加する。
一方、動画像符号化への切り替えの直後ではない場合(ステップ1103,NO)、復号部904は、参照フレームリスト内のいずれかの参照フレームを用いて、インター予測復号により復号対象フレームを復号する(ステップ1106)。
次に、フレーム変換部908は、動画像復号フレームの色差形式を、動画像復号装置401が出力する動画像の色差形式に変換し、フレームバッファ910は、変換後の復号フレームを表示装置へ出力する(ステップ1111)。
次に、復号制御部901は、未処理のフレームが残っているか否かチェックし(ステップ1112)、未処理のフレームが残っている場合(ステップ1112,YES)、次のフレームを復号対象フレームとしてステップ1101以降の処理を繰り返す。
復号対象フレームの符号化モードが静止画符号化である場合(ステップ1102,NO)、静止画復号部903は、復号対象フレームを静止画復号により復号して復号結果を生成する(ステップ1107)。
次に、フレーム変換部907は、符号化モードが静止画符号化へ切り替えられた直後であるか否かをチェックする(ステップ1108)。直前フレームの符号化モードが動画像符号化である場合、切り替えの直後であると判定され、直前フレームの符号化モードが静止画符号化である場合、切り替えの直後ではないと判定される。
静止画符号化への切り替えの直後である場合(ステップ1108,YES)、フレーム変換部907は、直前の動画像符号化フレームを復号した動画像復号フレームの色差形式を、静止画符号化の色差形式に変換する(ステップ1109)。そして、加算部909は、変換後の復号フレームと、復号対象フレームの復号結果が表す2つのフレームの差分とを加算して、加算結果の復号フレームを生成する(ステップ1110)。
一方、静止画符号化への切り替えの直後ではない場合(ステップ1108,NO)、加算部909は、復号対象フレームを復号した静止画復号フレームをフレーム変換部906へ出力する。
次に、フレーム変換部906は、加算結果の復号フレーム又は静止画復号フレームの色差形式を、動画像復号装置401が出力する動画像の色差形式に変換する(ステップ1111)。そして、フレームバッファ910は、変換後の復号フレームを表示装置へ出力する。
次に、復号制御部901は、ステップ1112以降の処理を行う。そして、すべてのフレームが復号された場合(ステップ1112,NO)、復号制御部901は、処理を終了する。
図3及び図5の動画像符号化装置301と図6の符号化部508の構成は一例に過ぎず、動画像符号化装置301の用途や条件に応じて一部の構成要素を省略又は変更してもよい。
例えば、符号化対象フレームの色差形式、静止画符号化の色差形式、及び動画像符号化の色差形式が同じである場合、図5のフレーム変換部502〜フレーム変換部505を省略することができる。動画像符号化から静止画符号化への切り替え後の最初の符号化対象フレームをJPEG等の静止画符号化により符号化する場合、図5の差分計算部506及び加算部507を省略することができる。エントロピー符号化を行わない場合、図6のエントロピー符号化部604を省略することができる。
図4及び図9の動画像復号装置401と図10の復号部904の構成は一例に過ぎず、動画像復号装置401の用途や条件に応じて一部の構成要素を省略又は変更してもよい。
例えば、動画像復号装置401が出力する動画像の色差形式、静止画符号化の色差形式、及び動画像符号化の色差形式が同じである場合、図9のフレーム変換部905〜フレーム変換部908を省略することができる。動画像符号化から静止画符号化への切り替え後の最初の符号化対象フレームをJPEG等の静止画符号化により符号化する場合、図9の加算部909を省略することができる。エントロピー符号化を行わない場合、図10のエントロピー復号部1011を省略することができる。
図8及び図11に示したフローチャートは一例に過ぎず、動画像符号化装置301及び動画像復号装置401の構成や条件に応じて一部の処理を省略又は変更してもよい。例えば、符号化対象フレームの色差形式、静止画符号化の色差形式、及び動画像符号化の色差形式が同じである場合、図8のステップ805及びステップ810の処理を省略することができる。この場合、ステップ803及びステップ808における色差形式変換処理も不要である。
動画像復号装置401が出力する動画像の色差形式、静止画符号化の色差形式、及び動画像符号化の色差形式が同じである場合、図11のステップ1104及びステップ1109の処理を省略することができる。この場合、ステップ1111における色差形式変換処理も不要である。
動画像符号化から静止画符号化への切り替え後の最初の符号化対象フレームをJPEG等の静止画符号化により符号化する場合、図8のステップ809〜ステップ811、ステップ813、及びステップ814の処理を省略することができる。この場合、図11のステップ1108〜ステップ1110の処理も省略することができる。
図8のステップ807において、動画像符号化への切り替えの直後である場合、符号化部508は、符号化対象フレームよりも1枚前の直前フレームの代わりに、N枚前(Nは2以上の整数)のフレームの復号フレームを参照フレームとして用いてもよい。これにより、参照フレームの選択候補が増加する。この場合、ステップ805において、フレーム変換部504は、符号化対象フレームよりもN枚前のフレームの復号フレームの色差形式を、動画像符号化の色差形式に変換する。
また、図11のステップ1104において、フレーム変換部905は、復号対象フレームよりもN枚前の静止画復号フレームの色差形式を、動画像符号化の色差形式に変換する。そして、ステップ1106において、復号部904は、N枚前の静止画復号フレームに対応する変換後の復号フレームを参照フレームとして用いる。
図8のステップ807において参照フレームとして用いられるN枚前のフレームは、動画像符号化により符号化されたフレームであっても構わない。
図8のステップ811において、静止画符号化への切り替えの直後である場合、差分計算部506は、符号化対象フレームよりも1枚前の直前フレームの代わりに、N枚前のフレームの復号フレームを用いて差分を計算してもよい。これにより、差分の計算に用いられるフレームの選択候補が増加する。この場合、ステップ810において、フレーム変換部503は、符号化対象フレームよりもN枚前のフレームの復号フレームの色差形式を、静止画符号化の色差形式に変換する。
また、図11のステップ1109において、フレーム変換部905は、復号対象フレームよりもN枚前の動画像符号化フレームを復号した動画像復号フレームの色差形式を、静止画符号化の色差形式に変換する。そして、ステップ1110において、加算部909は、N枚前の動画像復号フレームに対応する変換後の復号フレームと、復号対象フレームの復号結果が表す2つのフレームの差分とを加算する。
図8のステップ811において差分の計算に用いられるN枚前のフレームは、静止画符号化により符号化されたフレームであっても構わない。
符号化対象画像は、スクリーンコンテンツ画像を含む動画像に限定されるものではなく、画像の劣化が顕著に認知される他の画像を含む動画像であってもよい。
図3及び図5の動画像符号化装置301と図4及び図9の動画像復号装置401は、ハードウェア回路として実装することもでき、図12に示すような情報処理装置(コンピュータ)を用いて実現することもできる。
図12の情報処理装置は、Central Processing Unit(CPU)1201、メモリ1202、入力装置1203、出力装置1204、補助記憶装置1205、媒体駆動装置1206、及びネットワーク接続装置1207を備える。これらの構成要素はバス1208により互いに接続されている。
メモリ1202は、例えば、Read Only Memory(ROM)、Random Access Memory(RAM)、フラッシュメモリ等の半導体メモリであり、静動混合符号化処理又は静動混合復号処理に用いられるプログラム及びデータを格納する。メモリ1202は、図3の記憶部311、図4の記憶部411、図6の入力フレームバッファ601及び参照フレームバッファ602、図9のフレームバッファ910、又は図10の参照フレームバッファ1001として用いることができる。
CPU1201(プロセッサ)は、例えば、メモリ1202を利用してプログラムを実行することにより、図3及び図6の動画像符号化部312、又は図4及び図10の動画像復号部412として動作する。
CPU1201は、図5のモード判定部501、フレーム変換部502〜フレーム変換部505、差分計算部506、加算部507、符号化部508、静止画符号化部509、静止画復号部510、及び多重化部511としても動作する。CPU1201は、図6のソース符号化部603及びエントロピー符号化部604としても動作する。
CPU1201は、図9の復号制御部901、逆多重化部902、静止画復号部903、復号部904、フレーム変換部905〜フレーム変換部908、及び加算部909としても動作する。CPU1201は、図10のエントロピー復号部1011及びソース復号部1012としても動作する。
入力装置1203は、例えば、キーボード、ポインティングデバイス等であり、ユーザ又はオペレータからの指示や情報の入力に用いられる。出力装置1204は、例えば、表示装置、プリンタ、スピーカ等であり、ユーザ又はオペレータへの問い合わせや処理結果の出力に用いられる。処理結果は、図9のフレームバッファ910から出力される動画像であってもよい。
補助記憶装置1205は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。補助記憶装置1205は、ハードディスクドライブであってもよい。情報処理装置は、補助記憶装置1205にプログラム及びデータを格納しておき、それらをメモリ1202にロードして使用することができる。
媒体駆動装置1206は、可搬型記録媒体1209を駆動し、その記録内容にアクセスする。可搬型記録媒体1209は、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等である。可搬型記録媒体1209は、Compact Disk Read Only Memory(CD−ROM)、Digital Versatile Disk(DVD)、又はUniversal Serial Bus(USB)メモリであってもよい。ユーザ又はオペレータは、この可搬型記録媒体1209にプログラム及びデータを格納しておき、それらをメモリ1202にロードして使用することができる。
このように、処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体は、メモリ1202、補助記憶装置1205、及び可搬型記録媒体1209のような、物理的な(非一時的な)記録媒体である。
ネットワーク接続装置1207は、Local Area Network(LAN)、インターネット等の通信ネットワークに接続され、通信に伴うデータ変換を行う通信インタフェースである。ネットワーク接続装置1207は、符号化動画像を動画像復号装置401へ送信することもでき、動画像符号化装置301から符号化動画像を受信することもできる。情報処理装置は、プログラム及びデータを外部の装置からネットワーク接続装置1207を介して受け取り、それらをメモリ1202にロードして使用することもできる。
なお、情報処理装置が図12のすべての構成要素を含む必要はなく、用途や条件に応じて一部の構成要素を省略することも可能である。例えば、ユーザ又はオペレータとのインタフェースが不要の場合は、入力装置1203及び出力装置1204を省略してもよい。また、情報処理装置が可搬型記録媒体1209にアクセスしない場合は、媒体駆動装置1206を省略してもよい。
開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。
図6乃至図12を参照しながら説明した実施形態に関し、さらに以下の付記を開示する。
(付記1)
静止画符号化と動画像符号化とが適用される動画像に含まれる符号化対象画像よりも前に符号化された符号化画像の復号画像を記憶する記憶部と、
前記符号化対象画像よりも1枚前の画像に対して前記静止画符号化が適用され、前記符号化対象画像に対して前記動画像符号化が適用される場合、前記復号画像を参照画像として用いるインター予測符号化により前記符号化対象画像を符号化する動画像符号化部と、
を備えることを特徴とする動画像符号化装置。
(付記2)
前記符号化対象画像よりも1枚前の前記画像、又は前記符号化対象画像よりも2枚以上前の画像を前記静止画符号化により符号化して、前記符号化画像を生成する静止画符号化部をさらに備えることを特徴とする付記1記載の動画像符号化装置。
(付記3)
前記符号化対象画像よりも後の第1の画像に対して前記動画像符号化が適用され、前記第1の画像よりも1枚後の第2の画像に対して前記静止画符号化が適用される場合、前記動画像符号化により符号化された前記第1の画像の復号画像と前記第2の画像との差分を前記静止画符号化により符号化する静止画符号化部をさらに備えることを特徴とする付記1記載の動画像符号化装置。
(付記4)
前記符号化対象画像と前記符号化対象画像よりも1枚前の前記画像との差分が閾値よりも大きい場合、前記符号化対象画像に対して前記動画像符号化を適用すると判定する判定部をさらに備えることを特徴とする付記1乃至3のいずれか1項に記載の動画像符号化装置。
(付記5)
静止画符号化と動画像符号化とが適用される動画像に含まれる符号化対象画像よりも前に符号化された符号化画像の復号画像を記憶部に格納し、
前記符号化対象画像よりも1枚前の画像に対して前記静止画符号化が適用され、前記符号化対象画像に対して前記動画像符号化が適用される場合、前記復号画像を参照画像として用いるインター予測符号化により前記符号化対象画像を符号化する、
処理をコンピュータに実行させる動画像符号化プログラム。
(付記6)
前記コンピュータは、前記符号化対象画像よりも1枚前の前記画像、又は前記符号化対象画像よりも2枚以上前の画像を前記静止画符号化により符号化して、前記符号化画像を生成することを特徴とする付記5記載の動画像符号化プログラム。
(付記7)
前記コンピュータは、前記符号化対象画像よりも後の第1の画像に対して前記動画像符号化が適用され、前記第1の画像よりも1枚後の第2の画像に対して前記静止画符号化が適用される場合、前記動画像符号化により符号化された前記第1の画像の復号画像と前記第2の画像との差分を前記静止画符号化により符号化することを特徴とする付記5記載の動画像符号化プログラム。
(付記8)
前記コンピュータは、前記符号化対象画像と前記符号化対象画像よりも1枚前の前記画像との差分が閾値よりも大きい場合、前記符号化対象画像に対して前記動画像符号化を適用すると判定することを特徴とする付記5乃至7のいずれか1項に記載の動画像符号化プログラム。
(付記9)
静止画符号化と動画像符号化とが適用される動画像に含まれる符号化対象画像よりも前に符号化された符号化画像の復号画像を記憶部に格納し、
前記符号化対象画像よりも1枚前の画像に対して前記静止画符号化が適用され、前記符号化対象画像に対して前記動画像符号化が適用される場合、前記復号画像を参照画像として用いるインター予測符号化により前記符号化対象画像を符号化する、
ことを特徴とする動画像符号化方法。
(付記10)
前記符号化対象画像よりも1枚前の前記画像、又は前記符号化対象画像よりも2枚以上前の画像を前記静止画符号化により符号化して、前記符号化画像を生成することを特徴とする付記9記載の動画像符号化方法。
(付記11)
前記符号化対象画像よりも後の第1の画像に対して前記動画像符号化が適用され、前記第1の画像よりも1枚後の第2の画像に対して前記静止画符号化が適用される場合、前記動画像符号化により符号化された前記第1の画像の復号画像と前記第2の画像との差分を前記静止画符号化により符号化することを特徴とする付記9記載の動画像符号化方法。
(付記12)
前記符号化対象画像と前記符号化対象画像よりも1枚前の前記画像との差分が閾値よりも大きい場合、前記符号化対象画像に対して前記動画像符号化を適用すると判定することを特徴とする付記9乃至11のいずれか1項に記載の動画像符号化方法。
(付記13)
静止画復号と動画像復号とが適用される符号化動画像に含まれる復号対象画像よりも前に復号された復号画像を記憶する記憶部と、
前記復号対象画像よりも1枚前の符号化画像に対して前記静止画復号が適用され、前記復号対象画像に対して前記動画像復号が適用される場合、前記復号画像を参照画像として用いるインター予測復号により前記復号対象画像を復号する動画像復号部と、
を備えることを特徴とする動画像復号装置。
(付記14)
静止画復号と動画像復号とが適用される符号化動画像に含まれる復号対象画像よりも前に復号された復号画像を記憶部に格納し、
前記復号対象画像よりも1枚前の符号化画像に対して前記静止画復号が適用され、前記復号対象画像に対して前記動画像復号が適用される場合、前記復号画像を参照画像として用いるインター予測復号により前記復号対象画像を復号する、
処理をコンピュータに実行させる動画像復号プログラム。
(付記15)
静止画復号と動画像復号とが適用される符号化動画像に含まれる復号対象画像よりも前に復号された復号画像を記憶部に格納し、
前記復号対象画像よりも1枚前の符号化画像に対して前記静止画復号が適用され、前記復号対象画像に対して前記動画像復号が適用される場合、前記復号画像を参照画像として用いるインター予測復号により前記復号対象画像を復号する、
ことを特徴とする動画像復号方法。
101、102 画像
111、113 縦線
112、114 領域
201、202 ピーク
301 動画像符号化装置
311、411 記憶部
312 動画像符号化部
401 動画像復号装置
412 動画像復号部
501 モード判定部
502〜505、905〜908 フレーム変換部
506 差分計算部
507 加算部
508 符号化部
509 静止画符号化部
510 静止画復号部
511 多重化部
601 入力フレームバッファ
602、1001 参照フレームバッファ
603 ソース符号化部
604 エントロピー符号化部
701 符号化フレーム
711 ヘッダ
712 符号化データ
901 復号制御部
902 逆多重化部
903 静止画復号部
904 復号部
909 加算部
910 フレームバッファ
1011 エントロピー復号部
1012 ソース復号部
1201 CPU
1202 メモリ
1203 入力装置
1204 出力装置
1205 補助記憶装置
1206 媒体駆動装置
1207 ネットワーク接続装置
1208 バス
1209 可搬型記録媒体

Claims (8)

  1. 静止画符号化と動画像符号化とが適用される動画像に含まれる符号化対象画像よりも前に符号化された符号化画像の復号画像を記憶する記憶部と、
    前記符号化対象画像よりも1枚前の画像に対して前記静止画符号化が適用され、前記符号化対象画像に対して前記動画像符号化が適用される場合、前記復号画像を参照画像として用いるインター予測符号化により前記符号化対象画像を符号化する動画像符号化部と、
    を備えることを特徴とする動画像符号化装置。
  2. 前記符号化対象画像よりも1枚前の前記画像、又は前記符号化対象画像よりも2枚以上前の画像を前記静止画符号化により符号化して、前記符号化画像を生成する静止画符号化部をさらに備えることを特徴とする請求項1記載の動画像符号化装置。
  3. 前記符号化対象画像よりも後の第1の画像に対して前記動画像符号化が適用され、前記第1の画像よりも1枚後の第2の画像に対して前記静止画符号化が適用される場合、前記動画像符号化により符号化された前記第1の画像の復号画像と前記第2の画像との差分を前記静止画符号化により符号化する静止画符号化部をさらに備えることを特徴とする請求項1記載の動画像符号化装置。
  4. 静止画符号化と動画像符号化とが適用される動画像に含まれる符号化対象画像よりも前に符号化された符号化画像の復号画像を記憶部に格納し、
    前記符号化対象画像よりも1枚前の画像に対して前記静止画符号化が適用され、前記符号化対象画像に対して前記動画像符号化が適用される場合、前記復号画像を参照画像として用いるインター予測符号化により前記符号化対象画像を符号化する、
    処理をコンピュータに実行させる動画像符号化プログラム。
  5. 静止画符号化と動画像符号化とが適用される動画像に含まれる符号化対象画像よりも前に符号化された符号化画像の復号画像を記憶部に格納し、
    前記符号化対象画像よりも1枚前の画像に対して前記静止画符号化が適用され、前記符号化対象画像に対して前記動画像符号化が適用される場合、前記復号画像を参照画像として用いるインター予測符号化により前記符号化対象画像を符号化する、
    ことを特徴とする動画像符号化方法。
  6. 静止画復号と動画像復号とが適用される符号化動画像に含まれる復号対象画像よりも前に復号された復号画像を記憶する記憶部と、
    前記復号対象画像よりも1枚前の符号化画像に対して前記静止画復号が適用され、前記復号対象画像に対して前記動画像復号が適用される場合、前記復号画像を参照画像として用いるインター予測復号により前記復号対象画像を復号する動画像復号部と、
    を備えることを特徴とする動画像復号装置。
  7. 静止画復号と動画像復号とが適用される符号化動画像に含まれる復号対象画像よりも前に復号された復号画像を記憶部に格納し、
    前記復号対象画像よりも1枚前の符号化画像に対して前記静止画復号が適用され、前記復号対象画像に対して前記動画像復号が適用される場合、前記復号画像を参照画像として用いるインター予測復号により前記復号対象画像を復号する、
    処理をコンピュータに実行させる動画像復号プログラム。
  8. 静止画復号と動画像復号とが適用される符号化動画像に含まれる復号対象画像よりも前に復号された復号画像を記憶部に格納し、
    前記復号対象画像よりも1枚前の符号化画像に対して前記静止画復号が適用され、前記復号対象画像に対して前記動画像復号が適用される場合、前記復号画像を参照画像として用いるインター予測復号により前記復号対象画像を復号する、
    ことを特徴とする動画像復号方法。
JP2015064986A 2015-03-26 2015-03-26 動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法 Active JP6481457B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015064986A JP6481457B2 (ja) 2015-03-26 2015-03-26 動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法
EP16158915.5A EP3073737B1 (en) 2015-03-26 2016-03-07 Video coding device, video coding program, video coding method, and video coding and decoding system
US15/068,847 US10250891B2 (en) 2015-03-26 2016-03-14 Video coding device, video coding method, video decoding device and video decoding method
CN201610154130.XA CN106028031B (zh) 2015-03-26 2016-03-17 视频编码装置和方法、视频解码装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015064986A JP6481457B2 (ja) 2015-03-26 2015-03-26 動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法

Publications (2)

Publication Number Publication Date
JP2016184894A true JP2016184894A (ja) 2016-10-20
JP6481457B2 JP6481457B2 (ja) 2019-03-13

Family

ID=55586138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015064986A Active JP6481457B2 (ja) 2015-03-26 2015-03-26 動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法

Country Status (4)

Country Link
US (1) US10250891B2 (ja)
EP (1) EP3073737B1 (ja)
JP (1) JP6481457B2 (ja)
CN (1) CN106028031B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10880555B2 (en) 2017-10-30 2020-12-29 Fujitsu Limited Information processing system and information processing apparatus
US11557018B2 (en) 2020-09-02 2023-01-17 Fujitsu Limited Image processing apparatus and computer-readable recording medium storing screen transfer program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI664852B (zh) * 2018-03-19 2019-07-01 瑞昱半導體股份有限公司 影像處理裝置及影像處理方法
CN110858829B (zh) * 2018-08-22 2023-02-07 杭州海康威视数字技术股份有限公司 视频处理方法、装置、系统、分析服务器及转码服务器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1065926A (ja) * 1996-08-22 1998-03-06 Sanyo Electric Co Ltd 画像符号化方法及び画像符号化装置
JP2003070002A (ja) * 2001-08-28 2003-03-07 Matsushita Electric Ind Co Ltd 画像符号化装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07222173A (ja) 1994-01-31 1995-08-18 Matsushita Electric Ind Co Ltd 画像処理装置
JP3711571B2 (ja) * 1994-09-29 2005-11-02 ソニー株式会社 画像符号化装置及び画像符号化方法
EP1119979B1 (en) * 1998-09-29 2013-01-23 General Instrument Corporation Method and apparatus for detecting scene changes and adjusting picture coding type in a high definition television encoder
MXPA04001656A (es) * 2001-08-23 2004-11-22 Polycom Inc Sistema y metodo para ocultar errores de video.
KR101407748B1 (ko) * 2004-10-13 2014-06-17 톰슨 라이센싱 복잡도 스케일러블 비디오 인코딩 및 디코딩을 위한 방법 및 장치
JP2006173962A (ja) 2004-12-15 2006-06-29 Nec Engineering Ltd 画像符号化装置
US8170097B2 (en) * 2007-12-04 2012-05-01 Sony Corporation Extension to the AVC standard to support the encoding and storage of high resolution digital still pictures in series with video
JP2011055023A (ja) 2009-08-31 2011-03-17 Hitachi Consumer Electronics Co Ltd 画像符号化装置及び画像復号化装置
JPWO2011121894A1 (ja) * 2010-03-31 2013-07-04 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP2011239240A (ja) 2010-05-11 2011-11-24 Olympus Corp 撮像装置
US8599934B2 (en) * 2010-09-08 2013-12-03 Cisco Technology, Inc. System and method for skip coding during video conferencing in a network environment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1065926A (ja) * 1996-08-22 1998-03-06 Sanyo Electric Co Ltd 画像符号化方法及び画像符号化装置
JP2003070002A (ja) * 2001-08-28 2003-03-07 Matsushita Electric Ind Co Ltd 画像符号化装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10880555B2 (en) 2017-10-30 2020-12-29 Fujitsu Limited Information processing system and information processing apparatus
US11557018B2 (en) 2020-09-02 2023-01-17 Fujitsu Limited Image processing apparatus and computer-readable recording medium storing screen transfer program

Also Published As

Publication number Publication date
EP3073737A1 (en) 2016-09-28
US10250891B2 (en) 2019-04-02
CN106028031B (zh) 2020-04-21
US20160286222A1 (en) 2016-09-29
EP3073737B1 (en) 2019-09-04
CN106028031A (zh) 2016-10-12
JP6481457B2 (ja) 2019-03-13

Similar Documents

Publication Publication Date Title
JP2022017234A (ja) 符号化ビットストリームにおける動きベクトルの提示
JP2019501554A (ja) 動的な解像度切換えを用いたリアルタイムビデオエンコーダレート制御
US10116962B2 (en) Image coding device, image decoding device, image coding method and image decoding method
RU2623200C2 (ru) Обеспечение информации точности в устройстве кодирования изображения, способ и программа кодирования изображения, устройство декодирования изображения и способ и программа декодирования изображения
JP5195032B2 (ja) 符号化装置/復号化装置、符号化方法/復号化方法及びプログラム
JP2014116733A (ja) 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
JP6409516B2 (ja) ピクチャ符号化プログラム、ピクチャ符号化方法及びピクチャ符号化装置
JP6481457B2 (ja) 動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法
JP2014168150A (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法及び画像符号化復号システム
CN106973295B (zh) 视频编码方法/装置以及视频解码方法/装置
JP2010098352A (ja) 画像情報符号化装置
KR102321895B1 (ko) 디지털 비디오의 디코딩 장치
JP2017183910A (ja) 画像符号化装置及び画像符号化方法
KR20150081240A (ko) 무손실 비디오 부호화/복호화 방법 및 장치
CN113243107A (zh) 图像编码设备、图像编码方法、图像解码设备和图像解码方法
WO2013001729A1 (ja) 映像符号化装置及び映像復号装置
WO2017104010A1 (ja) 動画像符号化装置および動画像符号化方法
WO2016088160A1 (ja) 画像復号装置、画像処理システム、及び画像復号方法
WO2021251400A1 (ja) 復号装置及びプログラム
US20220377354A1 (en) Image encoding method and image decoding method
WO2021251398A1 (ja) デブロッキングフィルタ装置、復号装置、及びプログラム
JP2010288070A (ja) 画像符号化装置
US20180184097A1 (en) Apparatus and method for video coding, apparatus and method for video decoding, and non-transitory computer-readable storage medium
WO2012160614A1 (ja) 動画像復号装置
WO2012042645A1 (ja) 動画像符号化装置及び復号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190128

R150 Certificate of patent or registration of utility model

Ref document number: 6481457

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150