JP2013102295A - 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム - Google Patents

画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム Download PDF

Info

Publication number
JP2013102295A
JP2013102295A JP2011243935A JP2011243935A JP2013102295A JP 2013102295 A JP2013102295 A JP 2013102295A JP 2011243935 A JP2011243935 A JP 2011243935A JP 2011243935 A JP2011243935 A JP 2011243935A JP 2013102295 A JP2013102295 A JP 2013102295A
Authority
JP
Japan
Prior art keywords
image
information
encoding
decoding
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011243935A
Other languages
English (en)
Inventor
Masaaki Kobayashi
正明 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011243935A priority Critical patent/JP2013102295A/ja
Priority to US13/669,295 priority patent/US20130114740A1/en
Publication of JP2013102295A publication Critical patent/JP2013102295A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 フィールド画像のラインを補間してプログレッシブ化した画像を、異なる装置で補間したラインを間引いてフィールド画像に再変換する場合、補間したラインを識別することができず、元のフィールド画像に再変換することは難しかった。
【解決手段】 フィールド画像をプログレッシブ化した画像を符号化して画像ストリーム生成する符号化装置に、プログレッシブ化時に補間したラインを識別するライン補間情報を付加する手段を設ける。復号装置には、ライン補間情報を分離する手段を設け、復号したプログレッシブ画像をフィールド画像に再変換する場合には、ライン補間情報を参照して、補間したラインを間引く。
【選択図】 図2

Description

本発明は画像の符号化・復号において、動きベクトルを用いて符号化する際の画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラムに関する。
デジタル放送規格であるARIB−STD−B32では、インターレース形式の映像の放送方法が規定され、実際に多くのインターレース形式の映像が記録、放送されている。映像のフォーマットには、プログレッシブ形式とインターレース形式が存在する。プログレッシブ形式において、フレーム画像は一枚の画像から構成され、例えばフレームレートが30/1.001fpsの映像の場合、フレーム画像は、1.001/30秒ごとに記録、伝送、表示される。
一方、インターレース形式において、フレーム画像は2種類のフィールド画像、一組から構成される。この2種類のフィールド画像の一つは、フレーム画像の水平方向の第0ライン、第2ライン、第4ライン、・・・(以下、トップフィールドラインとする)から構成されるトップフィールド画像である。もう一つのフレーム画像の水平方向の第1ライン、第3ライン、第5ライン、・・・(以下、ボトムフィールドラインとする)から構成されるボトムフィールド画像がある。つまり、フィールド画像の垂直解度像はフレーム画像の解像度の半分となる。また、トップフィールド画像とボトムフィールド画像は、撮像されたタイミング(表示すべきタイミング)がずれている。例えば、フレームレートが30/1.001fpsのインターレース映像の場合、2フィールド=1フレームであるため、フィールド画像間には1.001/60秒の時間のずれが存在する。
現在、コンピュータで映像を視聴する機会が増えている。コンピュータ用のディスプレイの多くはインターレース映像の入力・表示には未対応のため、インターレース映像を視聴するためには、プログレッシブ映像に変換してからディスプレイへ出力する必要がある。また、視聴や映像加工のために画像サイズを変換することがあるが、プログレッシブ映像の画像サイズ変換に比べ、インターレース映像の画像サイズ変換は、その特殊なライン構造のために、複雑な処理を必要とする。そのため、あらかじめ、インターレース形式で撮影・記録された映像をプログレッシブ形式に変換・符号化し、記録したほうが効率よい場合が多い。
インターレース形式で記録された映像をプログレッシブ形式で保存するためには、インターレース映像をプログレッシブ映像に変換するデインターレース処理が必要となる。デインターレース処理の方式としては、大きな分類としてBOB方式とWEAVE方式が知られている。BOB方式は、フィールド画像の上下のラインから足りないラインを補間し、一枚のフレーム画像を生成する方式である。そのフレームレートは元のインターレース映像の2倍になるが、垂直方向の実質的な解像度はフレーム画像の解像度の半分となる問題がある。WEAVE方式は、同一フレームのトップフィールド画像とボトムフィールド画像をラインごとにインターリーブし、一つのフレームを作る方式である。静止シーンでの垂直解像度は高いが、動きのある領域にコーミングノイズとよばれるノイズが発生しやすいという問題がある。また、BOB方式とWEAVE方式を領域適応的に組み合わせたデインターレースも存在するが、適応的に処理をするために処理負荷が重いという問題がある。このような違いがあるため、画像の特性やユースケースによって、最適なデインターレース方式が選択されることになる。
また、映像の放送、記録、運用には、映像を符号化してデータ量を削減する必要がある。符号化方式には、MPEG−2(非特許参考文献1)や、H.264(非特許参考文献2)、Motion JPEG 2000(非特許参考文献3)などがある。MPEG−2は、前述のインターレース形式によるデジタル放送に使われている符号化方式である。H.264は、MPEG−2よりも符号化効率が高い符号化方式であり、近年は、メモリカード、ハードディスク、光メディアなどへの映像の記録に使われることが多くなっている。Motion JPEG 2000は、動画編集などに向いているとされる符号化方式である。MPEG−2やH.264は、プログレッシブ形式、インターレース形式の双方の符号化に対応しているが、Motion JPEG 2000は、プログレッシブ形式の符号化のみ対応している。
非特許参考文献1
ISO/IEC 13818−2:2000 Information technology ―― Generic coding of moving pictures and associated audio information: Video
非特許参考文献2
ISO/IEC 14496−10;2004 Information technology ―― Coding of audio−visual objects ―― Part 10: Advanced Video Coding
非特許参考文献3
ISO−15444−3/ITU−T Rec.802
フィールド画像をBOB方式によりラインを補間して生成したプログレッシブ画像を、再度フィールド画像に再変換するには、補間されたラインを間引いてフィールド画像を生成すればよい。フィールド画像を入力して、プログレッシブ化し、プログレッシブ化された画像を符号化して画像ストリームを生成する機能を有する符号化装置があったとする。また、画像ストリームを復号して、プログレッシブ画像を生成し、プログレッシブ画像をフィールド画像へ再変換する機能を有する復号装置があったとする。符号化装置が生成した画像ストリームを符号化装置から復号装置へ伝送した場合には、伝送先の復号装置はどのラインが補間されたかを識別することはできない。したがって、復号装置は、符号化装置が入力したオリジナルのフィールド画像に存在していたラインを誤って間引いてしまうことがあり、フィールド画像を正しく再生成できない問題があった。
よって本発明は上述の課題を解決するためになされたものであり、伝送元の符号化装置が入力したフィールド画像と同等のフィールド画像を伝送先の復号装置側で再生成可能とすることを目的とする。
前述の問題点を解決するため、本発明の画像符号化装置は以下の構成を有する。すなわち、プログレッシブ画像と前記プログレッシブ画像の特性を表すフォーマット情報から、入力されたプログレッシブ画像がインターレース画像をデインターレース処理した画像であるか否かを判定する判定手段と、前記入力されたプログレッシブ画像がデインターレース処理した画像であった場合にフォーマット情報からデインターレース方法を示す情報を抽出するデインターレース情報抽出手段と、前記判定手段の結果を符号化する第1の符号化手段と、前記デインターレース情報抽出手段の結果を符号化する第2の符号化手段と、入力されたプログレッシブ画像を符号化する画像符号化手段と、前記第1の符号化手段の結果と前記第2の符号化手段の結果と前記画像符号化手段の結果を統合して出力する出力手段を有することを特徴とする。
さらに、本発明の画像復号装置は以下の構成を有する。すなわち、符号化された画像データから、符号化された画像のフォーマット情報であるフォーマット情報符号化データを分離する分離手段と、前記フォーマット情報符号化データから、符号化された画像がプログレッシブ画像であるか、インターレース画像をデインターレース処理した画像であるかを表す情報を復号する第1の復号手段と、前記第1の復号手段の復号の結果がデインターレース処理した画像を示すものであった場合、デインターレースの方法を示す情報を復号する第2の復号手段と、前記符号化された画像データを復号する画像復号手段と、前記第1の復号手段の結果と前記第2の復号手段の結果から復号画像のフォーマット情報を生成するフォーマット情報生成手段とを有することを特徴とする。
復号装置側で、ライン補間情報を参照して補間されたラインを正しく間引くことにより、符号化処理による量子化誤差などの影響を除けば、伝送元の符号化装置が入力したフィールド画像と同等のフィールド画像を伝送先の復号装置側で再生成することができる。
実施形態1として説明する符号化装置のブロック図 実施形態1として説明する符号化装置のストリーム生成部のブロック図 実施形態2として説明する復号装置のブロック図 実施形態2として説明する復号装置のストリーム復号部のブロック図 (a)Yプレーンのボトムフィールドラインを補間する処理例を示す図 (b)Yプレーンのトップフィールドラインを補間する処理例を示す図 (a)フォーマット情報のシンタックスの例を説明する図 (b)フォーマット情報のoriginal_frame_type符号の値を説明する図 (c)フォーマット情報のinterlace_method符号を説明する図 (a)フォーマット情報ビット列と画像ストリームの結合例を示す説明する図 (b)フォーマット情報ビット列と画像ストリームの結合例の第一の変形例を説明する図 符号化装置と復号装置を含むアーカイブシステムの構成例を説明する図 プログラムを実行するハードウェア構成を説明する図 フィールド保存方式によるデインターレース処理および符号化処理を実行するフローを説明した図 画像ストリームとフォーマット情報ビット列を生成し、それらを統合するフローを説明する図 デインターレース情報符号化サブルーチンのフローを説明する図 画像復号処理およびインターレース処理フローを説明する図 画像ストリーム復号サブルーチンのフローを説明する図 デインターレース情報復号サブルーチンのフローを説明する図 フィールド合成方式によるデインターレース処理および符号化処理を実行するフローを説明した図 デインターレース処理および符号化処理を実行するフローを説明した図
以下、添付の図面を参照して、本願発明をその好適な実施形態に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
<実施形態1>
本実施形態では、フィールド画像単位でインターレース画像を入力してインターレース画像からプログレッシブ画像を生成し、または、プログレッシブ画像を入力して、前記のプログレッシブ画像を符号化する符号化装置について図1および図2を用いて説明する。本実施形態の入力画像は、YUV420の面順次形式のインターレース画像、あるいは、YUV420の面順次形式のプログレッシブ画像であるものとして説明する。面順次形式とは、画素値を、各色成分の画素値の集合であるプレーンごとに格納する格納形式である。つまり、YUVの面順次形式の画像は、独立したYプレーン、Uプレーン,Vプレーンから構成されることになる。
図1は、本実施形態で説明する符号化装置を詳細化したブロック図である。101はデインターレース処理を行う画像変換部である。102は画像符号化処理を行うストリーム生成部である。以下、符号化装置の詳細な動作について説明する。なお、処理対象は、複数の画像の連続的な集まりである映像であるが、装置内では、映像に含まれる画像を連続的に処理するものとして説明する。また、本実施形態では、画像変換部101に符号化装置に入力された画像を原画と表現することにする。
画像変換部101は、原画および、原画フォーマット情報を入力する。原画フォーマット情報とは、画像識別情報とフィールド識別情報からなる情報である。画像識別情報とは、原画がインターレース画像であるか、プログレッシブ画像であるかを識別する情報である。フィールド識別情報は、原画がインターレース画像である場合に、入力したフィールド画像がトップフィールド画像であるか、ボトムフィールド画像であるかを示す情報である。画像変換部101は、画像識別情報がプログレッシブ画像を示す情報である場合には、原画とフォーマット情報をストリーム生成部102へ出力する。フォーマット情報とは、画像識別情報、デインターレース情報からなる情報である。画像識別情報がインターレース画像を示す場合には、原画をプログレッシブ画像へ変換し、プログレッシブ画像とフォーマット情報をストリーム生成部102へ出力する。原画をプログレッシブ画像へ変換するデインターレース処理方法およびデインターレース情報については後述する。
本実施形態では、画像変換部101は、BOB方式とWEAVE方式、二種類のデインターレース方式を実行でき、ユーザーはあらかじめ、どちらのデインターレース方式を使って処理を行うかを画像変換部101に設定しておくものとする。なお、本実施形態では、BOB方式でデインターレース処理された場合など、一つのフィールドに対してフレーム画像が生成されるデインターレース方式を「フィールド保存」方式と表現する。また、WEAVE方式でデインターレース処理された場合など、2つのフィールドから一つフレームが合成されるデインターレース方式を「フィールド合成」方式と表現する。
以下、画像変換部101のBOB方式によるデインターレース処理について本実施形態の動作を説明する。
図5(a)はYプレーンのボトムフィールドラインを補間する処理例を示す図である。図5(b)Yプレーンのトップフィールドラインを補間する処理例を示す図である。図5の濃い網掛けの画素は、フレームの画素が存在していることを表し、薄い網掛けの画素はフレームの画素が補間されたことを表し、空白の画素はフレームの画素が欠落していることを表している。入力されたフィールド画像のフィールド識別情報がトップフィールドを示す場合には、フィールド画像を図5(a)のように、画素ごとに上下のトップフィールドラインの画素値の平均を計算して、欠落しているボトムフィールドラインの画素を生成する。フィールド識別情報がボトムフィールドを示す場合には、図5(b)のように画素ごとに上下のボトムフィールドラインの画素値の平均を計算して、欠落しているトップフィールドラインの画素を生成する。このようにしてフィールド画像からプログレッシブ画像を生成する。同様に、Uプレーン,Vプレーンも処理する。生成したプログレッシブ画像を出力する際、デインターレース情報と画像識別情報をストリーム生成部102へ出力する。デインターレース情報は、デインターレース方式情報、ライン補間情報、フィールド合成情報からなる情報である。デインターレース方式情報は、デインターレース方式が「フィールド保存」方式であるか、「フィールド合成方式」であるかを示す情報である。ライン補間情報とは、補間したラインがトップフィールドラインであるかボトムフィールドラインであるかを識別する情報である。フィールド合成情報については後述するが、ライン補間情報とは排他的に存在する情報である。BOB方式によるデインターレース処理の場合、デインターレース方式情報は「フィールド保存」を示し、デインターレース情報にはデインターレース方式情報とライン補間情報のみが存在する。
本実施形態のBOB方式によるデインターレース処理の結果、フレームレートは2倍になる。例えば、入力フレームレートが30fps(毎秒60フィールド)の場合、生成されたプログレッシブ画像のフレームレートは60fpsとなる。
以下、WEAVE方式によるデインターレース処理について本実施形態の動作を説明する。画像変換部101は、フィールド画像を連続的に2枚入力する。トップフィールド画像のラインはトップフィールドラインに、ボトムフィールド画像のラインはボトムラインに配置されたフレーム画像を生成する。また、同時に、デインターレース情報と画像識別情報をストリーム生成部102へ出力する。WEAVE方式によるデインターレース処理の場合、デインターレース方式情報は「フィールド保存」を示し、デインターレース情報にはデインターレース方式情報とフィールド合成情報が存在することになる。
以下、フィールド合成情報について説明する。トップフィールド画像とボトムフィールドフィールド画像の表示タイミングは、例えば、本実施形態では1/60秒ずれていることになる。しかし、フィールドを合成すると、トップフィールドとボトムフィールドの時間が同一に扱われ、時間的な前後関係が識別不能となる。フィールド合成情報は、トップフィールド画像の時間がボトムフィールド画像の時間に対して前であったか否かを識別する情報である。合成したフィールドを再分離する際には、フィールド合成情報を参照することにより、トップフィールド画像とボトムフィールド画像の時間を正しい順番で分離することができる。
なお、本実施形態のWEAVE方式によるデインターレース処理を行っても、フレームレートに変化はない。つまり、この場合、画像変換部101は、2枚のフィールド画像入力に対し、1枚のプログレッシブ画像をストリーム生成部102へ出力することになる。
ストリーム生成部102は、画像変換部101から入力したプログレッシブ画像とフォーマット情報を入力して、画像ストリームを生成する。
図2はストリーム生成部102の内部を詳細化したブロック図である。201は画像符号化部、202は判定部、203は画像識別情報符号化部、204はデインターレース情報抽出部、205はデインターレース情報符号化部、206はストリーム統合部である。
画像符号化部201は、入力したプログレッシブ画像をH.264方式で符号化して画像ストリームを生成し、ストリーム統合部206へ出力する。なお、本実施形態における符号化方式はH.264を利用しているが、それに限定されず、MPEG−2など異なる符号化方式を用いてもよい。とくに、インターレース符号化方式が規定されないMotion JPEG 2000などの符号化方式で符号化することも可能である。
判定部202は、フォーマット情報を入力して、フォーマット情報から画像識別情報を抽出し、画像識別情報を画像識別情報符号化部203とデインターレース情報抽出部204へ出力する。
画像識別情報符号化部203は、画像識別情報を符号化して画像識別情報符号を生成し、ストリーム統合部206へ出力する。画像識別情報符号の符号化方法については後述する。
デインターレース情報抽出部204は、入力した画像識別情報がインターレース画像を示すものである場合に、フォーマット情報を入力して、フォーマット情報からデインターレース情報を抽出し、デインターレース情報符号化部205へ出力する。
デインターレース情報符号化部205は、デインターレース情報を符号化してデインターレース情報符号を生成し、ストリーム統合部206へ出力する。デインターレース情報の符号化方法については後述する。なお、画像識別情報がプログレッシブ画像を示す場合、デインターレース情報が入力されないため、符号化処理は行われない。
ストリーム統合部206は、画像識別情報符号とデインターレース情報符号を結合してフォーマット情報ビット列を生成し、フォーマット情報ビット列を画像ストリームに統合して外部へ出力する。ただし、画像識別情報がプログレッシブ画像を示す場合には、デインターレース情報符号は生成されないため、デインターレース情報符号はフォーマット情報ビット列に含まれない。本実施形態では外部の出力先は、外部ストレージであるものとして説明するが、その詳細は後述する。本実施形態では、画像識別情報符号とデインターレース情報符号を合わせてフォーマット情報ビット列と表現する。フォーマット情報ビット列は、図6で示されるシンタックスにしたがった構造をもつものとして説明する。
以下、本実施形態のフォーマット情報ビット列について図6を使って説明する。図6(a)は、フォーマット情報ビット列の構造を示すシンタックスの例であり、シンタックスを表現するための表記方法は、H.264の規格書で使われる表記方法に準拠する。図6(a)の第一列は符号の名前、および、符号挿入の条件文、第二列はその符号の符号化方法を表現している。図6(a)の第二列のu(n),ue(v)は、それぞれ、nビットの正の整数、可変長の正の整数を表現しており、対応する符号は、nビット固定長符号、Golomb符号として生成されることになる。例えば、図6(a)のoriginal_frame_typeは、2ビットの符号として表現され、0から3までの値をとる。生成された各符号は結合され、ビット列が生成されることになる。また、符号挿入の条件文は、下記のように記述される。
if(条件式){
符号1

この条件文は、条件式が真の場合に符号1が生成され、生成された符号がビット列に挿入されることを示している。また、Reservedと表記された個所は、将来フォーマット情報ビット列が機能拡張された際に、不定長の符号が挿入される可能性があることを示している。
フォーマット情報ビット列のoriginal_frame_type符号は、原画が「プログレッシブ画像」であるか、「インターレース画像」であるか、あるいは「不明」であるかを識別する符号であり、画像識別情報符号のシンタックス上の名称である。その値は、図6(b)に示される。図6(b)は、original_frame_type符号の値と対応する画像形式の関係を示す表である。将来、フォーマット情報ビット列の機能拡張を可能とするために、3の値は予約コードとして割り当てられている。
フォーマット情報ビット列のdeinterlace_method符号は、デインターレース処理が「フィールド保存」方式か「フィールド合成」方式であるかを識別する符号であり、デインターレース方式情報を符号化した符号のシンタックス上の名称である。その値は、図6(c)に示される。図6(c)は、deinterlace_method符号の値と対応するデインターレース方式の対応関係を示す表である。将来、フォーマット情報ビット列の機能拡張を可能とするために、2以上の値は予約コードとして割り当てられている。
フォーマット情報ビット列のtop_field_interpolated符号は、ライン補間情報を符号化したライン補間情報符号のシンタックス上の名称である。本符号の値が1の場合には、フォーマット情報ビット列が統合される画像ストリームの符号化の対象となった画像がトップフィールドを補間して生成された画像であることを示す。本符号の値が0の場合には、フォーマット情報ビット列が統合される画像ストリームの符号化の対象となった画像がボトムフィールドを補間して生成された画像であることを示す。
フォーマット情報ビット列のtop_field_first符号は、フィールド合成情報を符号化したフィールド合成情報符号のシンタックス上の名称である。本符号の値が1の場合には、符号化の対象となった画像のトップフィールド画像がボトムフィールドに対して時間的に前であることを示す。本符号の値が0の場合には、符号化の対象となった画像のトップフィールド画像がボトムフィールドに対して時間的に後であることを示す。
以下、本実施形態でのフォーマット情報ビット列のシンタックスの符号の具体的な値の設定について説明する。
画像識別情報符号化部203は、original_frame_type符号を生成する。original_frame_type符号は、その値に、画像識別情報がプログレッシブ画像を示す場合には0が、インターレース画像を示す場合には1が設定され、2ビット符号として生成される。なお、画像の形式が不明の画像を入力できる構成をとった場合には、original_frame_type符号の値に3を設定する構成をとることも可能である。
また、デインターレース情報符号化部205は、デインターレース情報符号にあたるdeinterlace_method符号、top_field_interpolated符号、top_field_first符号を生成する。ただし、図6(a)に示されるように、top_field_interpolated符号とtop_field_first符号は排他的に生成されることになる。また、前述のとおり、画像識別情報がインターレース画像を示さない場合、これらの符号は生成されない。
deinterlace_method符号は、その値に、デインターレース方式情報が「フィールド保存」を示す場合には0が設定され、「フィールド合成」を示す場合には1が設定され、可変長のGolomb符号として生成される。
top_field_interpolated符号は、「フィールド保存」方式でデインターレース処理を行った場合にのみ生成される。top_field_interpolated符号は、その値に、ライン補間情報がトップフィールドを補間したことを示す場合は1が設定され、ボトムフィールドを補間したことを示す場合0が設定され、1ビットの符号として生成される。
top_field_first符号は、「フィールド合成」方式でデインターレース処理を行った場合にのみ生成される。top_field_first符号は、その値に、フィールド合成情報が「トップフィールド画像が時間的に前である」ことを示す情報の場合には1が設定され、そうでない場合には0が設定され、1ビットの符号として生成される。
以下、ストリーム統合部206のデータの出力動作について説明する。ストリーム統合部206は、フォーマット情報ビット列と画像ストリームなどのデータを外部へ出力する際に、それぞれにスタートコードを付与して、直前に外部へ出力されていたデータに結合するよう動作する。図7(a)は、フォーマット情報ビット列が統合された画像ストリームの例を示しており、フォーマット情報ビット列は対応する画像ストリームの直前に配置される形で複数の画像ストリームが結合されている。図7の例では、前述のようにフォーマット情報ビット列、画像ストリームを区切るために、フォーマット情報ビット列と画像ストリーム、それぞれの先頭にデータの区切りを識別するためのスタートコードが付与されている。図7の太線はスタートコードを示している。スタートコードとは、特定のデータパターンを持つバイトデータである。H.264の場合は、スタートコードは、{0,0,1}と値で構成される3バイトのデータである。H.264のストリーム中には、{0,0,1}というバイトパターンが存在しないため、復号装置は、結合された複数の画像ストリームの中からスタートコードを検出することにより、フォーマット情報ビット列と画像ストリームの区切りを識別することができる。つまり、画像ストリームと対応するフォーマット情報ビット列を一画像単位のデータとして取得することが可能となる。
本符号化装置が生成したストリームは、インターレース画像をプログレッシブ画像に変換してから符号化することにより、インターレース復号に未対応の復号装置でも復号可能となるメリットがある。また、プログレッシブ画像として符号化・保存しておくことにより、復号画像の画像サイズ変換が容易となり、また、インターレース未対応のディスプレーにデインターレース処理なしに出力できるというメリットもある。しかし、復号したプログレッシブ画像を、再度インターレース形式に変換して扱いたいというケースも存在する。例えば、以下のようなケースである。
図8は、符号化装置と復号装置を含むアーカイブシステムの構成例を説明する図である。801は本実施形態で説明する符号化装置である。802は復号装置である。803は放送装置である。804はディスプレーである。805は外部ストレージである。806はネットワークゲートウェイである。
以下、このアーカイブシステムの動作について説明する。符号化装置801は入力したインターレース画像をプログレッシブ画像に変換し、H.264方式で符号化して、ストリームを生成し、ストリームを外部ストレージ805へ記録する。このように、外部ストレージ805には、映像ごとに、複数のストリームが記録される。ネットワークゲートウェイ806は、記録されたストリームをネットワークで配信する。復号装置802は外部ストレージ805に記録されたストリームを復号して、復号されたプログレッシブ画像をインターレース画像に変換し、インターレース画像を放送装置803へ出力する。放送装置803はインターレース画像をMPEG−2方式で再符号化し、符号化されたストリームを規格で規定されたインターレース形式で放送する。また、復号装置802はプログレッシブ画像を出力し、プログレッシブ画像がディスプレー804で表示される構成もとる。
ネットワーク配信のための映像はコンピュータとそれに接続されたインターレース未対応のディスプレーで再生されることが多いことを考慮すると、プログレッシブ画像として記録されており、それを直接配信できることのメリットは小さくない。一方、復号装置802は、用途に応じて、プログレッシブ画像とインターレース画像の双方を出力可能な構成となっている。つまり、本アーカイブシステムは非常に合理性の高いシステムといえる。なお、本アーカイブシステムの説明では、H.264やMPEG−2方式で符号化することを例に説明しているが、符号化方式はこれに限定されない。
本実施形態では、デインターレース処理方法に関する情報を含むシンタックスを定義し、このシンタックスに基づいて生成したフォーマット情報ビット列を画像ストリームに統合している。このフォーマット情報ビット列が統合された画像ストリームが復号装置へ伝送されることにより、復号装置はデインターレース処理方法に関する情報を受け取ることができる。復号装置は、インターレース画像を出力する場合、デインターレース処理方法に関する情報を用いて復号されたプログレッシブ画像をインターレース形式へ再変換することができる。
なお、本実施形態でのフォーマット情報ビット列は、図6(a)に示されるシンタックス構造にしたがって生成されるものとして説明したが、これに限定されない。フォーマット情報ビット列には、デインターレース処理方法に関する符号が含まれていればよい。例えば、原画がインターレース画像である場合にのみ、フォーマット情報ビット列を画像ストリームに統合するという限定を設ければ、フォーマット情報ビット列に画像識別情報符号が含まれなくとも、原画がインターレース画像であるか否かは識別可能である。また、符号化処理と復号処理で、デインターレース方式をフィールド保存に限定する取り決めを行えば、伝送すべきデインターレース処理方法に関する情報は、ライン補間情報のみで十分である。また、各情報の符号の符号化方法は、シンタックスで指定された固定長符号、可変長のGlomb符号に限定されない。また、その順番にも限定はなく、符号量の削減を考慮しなければ条件文の設定による排他的な定義も必要としない。
本実施形態におけるデインターレース処理は、説明した方式に限定されない。例えば、他のフィールド画像参照しラインを補間したり、動き補償を利用したりしてもよい。一つのフィールド画像を基準としてフレーム画像を生成する方式であれば、もともと原画に存在していたラインの画素値の変化に関わらず、デインターレース方式は「フィールド保存」方式とみなされることになる。また、2つのフィールド画像からフレーム画像を生成する方式であれば、コーミングノイズ除去フィルタなどをかけても、「フィールド合成」方式とみなされる。
本実施形態では、「フィールド保存」でデインターレース処理を行う場合に、ライン補間情報を符号化した符号を画像ストリームに統合する構成をとった。しかし、これに限定されず、代わりに入力されたフィールド画像のフィールド識別情報を符号化した符号を画像ストリームに統合してもよい。フィールドを識別できれば補間ラインを導出することができるため、ライン補間情報とフィールド識別情報のどちらを符号化して、画像ストリームに統合しても、得られる効果は同じである。
本実施形態では、フォーマット情報ビット列と画像ストリームは、スタートコードで区切られた独立したデータと記録されるように説明したが、これに限定されない。例えば、図6(a)で示されるシンタックスを画像ストリームのヘッダ情報のシンタックスの一部として埋め込む構成をとってもよい。この場合の符号化方式は、新規の符号化方式であるか従来の符号化方式の新規拡張となる。また、本実施形態では、各画像ストリームに対してフォーマット情報ビット列を生成し統合するように説明している。しかし、それに限定されず、第1フレームを符号化した画像ストリームにのみに対して生成し、図7(b)のように第1フレームの画像ストリームにのみフォーマット情報ビット列を統合する構成をとってもよい。図7(b)は、第一フレームの画像ストリームにのみフォーマット情報ビット列が統合された第一の変形例を示している。同様に、一定間隔画像ごとにフォーマット情報ビット列を生成し統合することも可能である。さらに、スタートコードの代わりにその位置に、フォーマット情報ビット列や画像ストリームのビット長を埋め込むことによって、区切りの位置が識別を可能とする構成をよってもよい。また、複数の画像ストリームを一つファイルとして出力する場合には、各フォーマット情報ビット列と各画像ストリームのファイル内の位置を示すインデックスをファイルに付加する構成をとってもよい。いずれの構成においても、画像ストリームとフォーマット情報ビット列の区切りを識別することができる。
本実施形態では、入力の色差フォーマットとしてYUV420形式の画像が入力されることを例に説明したがそれに限定されない。入力フォーマットとしてYUV422形式、YUV444形式を入力しそれを符号化してもよい。
本実施形態では、インターレース画像をフィールド単位で入力し、処理する例を説明したがそれに限定されない。インターレース画像を2つフィールドのフィールドが合成されたフレーム単位で入力してもよい。フレーム単位で入力した場合も、フレームを2つのフィールドに分離し、順に処理する機能をもつことにより、本実施形態で説明した処理を実施することができる。
<実施形態2>
本実施形態では、実施形態1で説明した符号化装置が生成したフォーマット情報ビット列を統合した画像ストリームを復号し、インターレース画像を出力する復号装置について図3、および、図4を用いて説明する。本実施形態では、YUV420面順次形式のプログレッシブ画像として復号した画像を復号装置内部でYUV420面順次形式のインターレース画像に変換し出力するものとして説明する。ただし、色差フォーマットは、画像ストリームに依存し、この値に限定されるものではない。なお、特別な記述がない限り、用語等については実施形態1で説明されるものと同様とする。
図3は、本実施形態で説明する復号装置のブロック図である。301はストリーム復号部である。302は画像変換部である。
ストリーム復号部301は、フォーマット情報ビット列が統合された画像ストリームを入力し、復号してプログレッシブ画像とフォーマット情報を生成し、プログレッシブ画像とフォーマット情報を画像変換部302へ出力する。なお、フォーマット情報ビット列が統合された画像ストリームは外部ストレージに図7(a)のように複数の画像ストリームが結合され保存されているものとする。しかし、ストリーム復号部301は、スタートコードを検出することにより、1画像分のフォーマット情報ビット列が統合された画像ストリームを取得することができる。また、フォーマット情報ビット列は、図6(a)に示されるシンタックスからなるものとして説明する。つまり、符号化装置において固定長符号、Golomb符号で符号化された符号は、復号装置においては、固定長符号、Golomb符号として復号して読み取られることになる。また、符号化装置において図6(a)で示される条件文に従って生成された符号は、復号装置においても条件文にしたがって符号が取得され、復号されることになる。なお、フォーマット情報ビット列のシンタックス構造は、符号化装置と同一の情報であればよく、図6で説明されるシンタックスに限定されない。ストリーム復号部301の詳細な内部動作については後述する。
画像変換部302は、フォーマット情報を参照して、入力したプログレッシブ画像からインターレース画像を生成し外部へ出力する。画像変換部302の詳細な動作については後述する。
図4は、図3のストリーム復号部301の内部を詳細に説明したブロック図である。401はストリーム分離部である。402は画像識別情報復号部、403はデインターレース情報復号部である。404はフォーマット情報生成部、405は画像復号部である。
ストリーム分離部401は、入力したフォーマット情報ビット列が統合された画像ストリームから画像識別情報符号とデインターレース情報符号を分離して、画像識別情報符号を画像識別情報復号部402へ、画像ストリームを画像復号部405へ出力する。また、画像識別情報を入力して、画像識別情報がインターレースを指すものであった場合には、デインターレース情報符号をデインターレース情報復号部403へ出力する。
画像復号部405は、画像ストリームをH.264方式で復号して、復号されたプログレッシブ画像を外部へ出力する。なお、本特許の実施において復号方式はH.264を利用しているが、それに限定されず、実施形態1で説明した符号化装置が採用する符号化方式と同一であればMPEG−2やMotion JPEG 2000など異なる符号化方式を用いてもよい。
画像識別情報復号部402は、画像識別情報符号を復号して画像識別情報を生成し、フォーマット情報生成部404とストリーム分離部401へ出力する。本実施形態では、図6で示されるシンタックスのoriginal_frame_type符号の復号値が0の場合には、画像識別情報はプログレッシブ画像を示し、復号値が1の場合には、画像識別情報はインターレース画像を示すことになる。
デインターレース情報復号部403は、デインターレース情報符号を復号してデインターレース情報を生成し、フォーマット情報生成部404で出力する。
実施形態1で説明したとおり、デインターレース情報は、デインターレース方式情報、ライン補間情報、フィールド合成情報からなる情報である。それぞれの符号の図6で示されるシンタック上の名称は、deinterlace_method符号、top_field_interpolated符号、top_field_first符号となる。本実施形態では、deinterlace_method符号の復号値が0の場合には、デインターレース情報のデインターレース方式情報は「フィールド保存」を示し、復号値が1の場合には「フィールド合成」を示す。top_field_interpolated符号の復号値が0の場合には、デインターレース情報のライン補間情報はボトムフィールドを補間したことを示し、復号値が1の場合にはライン補間情報はトップフィールドを補間したことを示す。top_field_first符号の復号値が、1の場合にはデインターレース情報のフィールド合成情報は、「トップフィールド画像が時間的に前である」ことを示し、0の場合には「トップフィールド画像が時間的に後である」ことを示す。ただし、top_field_interpolated符号はdeinterlace_method符号の復号値が0のときにのみ復号され、top_field_first符号は同復号値が1のときにのみ復号される。
フォーマット情報生成部404は、デインターレース情報と画像識別情報からフォーマット情報を生成する。
以下、画像変換部302の詳細な処理について説明する。画像変換部302は、画像識別情報がインターレースを示す場合には、下記の動作を行う。デインターレース方式情報が「フィールド保存」を示す場合には、フォーマット情報のライン補間情報に応じて、インターレース処理を行う。ライン補間情報がトップフィールドを補間したことを示す場合には、復号されたプログレッシブ画像のトップフィールドラインを間引いて、フィールド画像を生成する。ライン補間情報がボトムフィールドを補間したことを示す場合には、復号されたプログレッシブ画像のボトムフィールドラインを間引いて、フィールド画像を生成する。これは、図5を使って説明したデインターレース処理と逆の処理を示しており、図5の濃い網掛けの画素以外の画素を間引くことにあたる。このような間引き処理は、Yプレーン、Uプレーン、Vプレーンそれぞれに対して行われる。このインターレース処理により、フレームレートが半分の映像が生成される。例えば、復号したプログレッシブ映像のフレームレートが60fpsであったとすれば、30fps(毎秒60フィールド)のインターレース映像が生成される。
デインターレース方式情報が「フィールド合成」を示す場合には、フレーム画像からトップフィールド画像とボトムフィールド画像を分離する。フィールド合成情報が「トップフィールドが時間的に先である」ことを示す場合には、先にトップフィールド画像を外部へ出力し、次にボトムフィールド画像を外部へ出力する。フィールド合成情報が「トップフィールドが時間的に後である」ことを示す場合には、先にボトムフィールド画像を外部へ出力し、次にトップフィールド画像を外部へ出力する。このような分離処理は、Yプレーン、Uプレーン、Vプレーンそれぞれに対して行われる。このインターレース処理により、例えば、復号したプログレッシブ映像のフレームレートが30fpsであったとすれば、30fps(毎秒60フィールド)のインターレース映像が生成されることになる。
画像変換部302は、画像識別情報がプログレッシブ画像を示す場合には、出力フレームレートに合わせてフレームレート変換を実施する。その後、偶数フレームはトップフィールドラインを間引いてボトムフィールド画像を生成し、奇数フレームはボトムフィールドラインを間引いてトップフィールド画像を生成する。例えば、出力フレームレートが30fps、復号されたプログレッシブ画像のフレームレートが30fpsであった場合、フレームレート変換処理により60fpsの画像を生成する。その後、ラインの間引き処理によりフィールド画像を生成して、30fpsのインターレース画像を生成する。出力フレームレートは、画像を出力するデバイスの入力可能なフレームレートによって設定される。なお、本実施形態では、フレームレート変換処理後、ラインを間引いてフィールド画像を生成するように説明したが、これに限定されず、例えばフレームレート変換処理を実施せず1つのプログレッシブ画像から2つのフィールド画像を生成する処理を行ってもよい。
復号装置がライン補間処理によりプログレッシブ化された画像をインターレース画像へ再変換する場合に、従来は、どのラインを補間したかを識別する手段がなく、補間されたラインを正しく間引くことは難しかった。本実施形態の構成をとることにより、プログレッシブ化された画像をインターレース画像に再変換する場合に、ライン補間情報を参照して補間されたラインを正しく間引くことにより、原画に存在した画素を残したインターレース画像を生成することができる。
なお、外部ストレージに保存された画像ストリームは、図7(b)で示されるように、全ての画像ストリームにフォーマット情報ビット列が統合されない場合も、復号されたプログレッシブ画像をインターレース画像に変換することは可能である。図7(b)の例では、第一フレームの画像ストリームのみにフォーマット情報ビット列が統合されている。デインターレース方式が「フィールド保存」の場合、第一フレームの画像はライン補間情報を参照してインターレース処理を実行したら、ライン補間情報が存在しない次の画像では、第一フレームに対し、間引くラインを切り替えて処理を実行する。このようにして、間引くラインを交互に切り替えながら処理を実行する。デインターレース方式が「フィールド合成」の場合には、第1フレームのフィールド合成情報が、第2フレーム以降も同一であるとして、インターレース処理を実行する。さらに、フォーマット情報ビット列を一定間隔フレームごとに統合しても、第1フレームのみにフォーマット情報ビット列を統合した場合と同じように、フォーマット情報ビット列が統合された画像ストリームを基点として、同様の処理を行うことができる。
また、フォーマット情報ビット列が画像ストリームのヘッダ情報の一部として埋め込まれる場合でも、ストリーム分離部401がフォーマット情報ビット列を画像ストリームから分離する機能を持てば、本実施形態で説明した他の処理は実行可能である。
なお、本実施形態における復号装置はインターレース画像を出力するものとして説明したが、プログレッシブ画像とインターレース画像をユーザーが自由に切り替えて出力する構成をとっても良い。
<実施形態3>
本実施形態では、インターレース画像を入力してインターレース画像からプログレッシブ画像を生成し、または、プログレッシブ画像を入力して、プログレッシブ画像を符号化する符号化方法について図9、図17、図10、図11、図12を用いて説明する。インターレース画像の入力は、フィールド画像単位とする。なお、特別な記述がない限り、用語等については実施形態1で説明されるものと同様とする。
本実施形態の入力画像は、YUV420の面順次形式のインターレース画像、あるいは、YUV420の面順次形式のプログレッシブ画像であるものとして説明する。
図9は、本特許における符号化方法を含んだ符号化プログラムを実行するためのハードウェア構成を示している。本符号化プログラムはハードディスク装置(以下、HDDと略す)903に記録されており、符号化プログラムの起動とともにRAM902にロードされ、以下で示される各ステップをCPU901が実行して符号化処理がなされる。なお、本実施形態では、入力された画像データはHDD903に格納されるものとし、符号化プログラムは、HDD903から画像を取得して、符号化を行うものとする。また、符号化された画像ストリームは外部機器I/F905を介して外部ストレージへ記録されるものとする。
以下、本符号化方法のステップについて図17を使って説明する。図17は、デインターレース処理および符号化処理を実行するフローを説明した図である。なお、処理対象は、複数の画像の連続的な集まりである映像であるが、図17で示される処理が連続的に行われることにより、一連の映像が符号化されるものとする。なお、本符号化プログラムを実行するユーザーはあらかじめ、使用するデインターレース方式を指定しておくものとする。
S17010では、ユーザーが設定したデインターレース方式を取得する。S17020では、ユーザーが設定したデインターレース方式を判定する。ユーザーが設定したデインターレース方式がフィールド合成を示す場合にはS17040が実行され、ユーザーが設定したデインターレース方式がフィールド保存を示す場合には、S17030が実行される。S17030では、フィールド保存方式によるデインターレース処理および符号化処理を実行する。本実施形態では、フィールド保存方式によるデインターレース処理および符号化処理を実行するサブルーチンが実行される。サブルーチンの詳細については後述する。本ステップの処理後、本フローは終了する。
S17040では、フィールド合成方式によるデインターレース処理および符号化処理を実行する。本実施形態では、フィールド合成方式によるデインターレース処理および符号化処理を実行するサブルーチンが実行される。サブルーチンの詳細については後述する。本ステップの処理後、本フローは終了する。
以下、S17030で実行されるフィールド保存方式によるデインターレース処理および符号化処理を実行するサブルーチンのステップについて図10を使って説明する。図10は、フィールド保存方式によるデインターレース処理および符号化処理を実行するサブルーチンのフローを説明した図である。
S10000では、入力画像を取得する。S10010では、入力画像の画像識別情報を取得する。S10014では、画像識別情報が示す画像形式を判定する。画像識別情報がプログレッシブを示す場合にはS10050が実行され、インターレースを示す場合にはS10015が実行される。S10015では、フィールド保存を示すデインターレース方式情報を生成する。S10016では、入力画像のフィールド識別情報を取得する。
S10020では、フィールド識別情報を判定し、フィールド識別情報がボトムフィールドを示す場合にはS10030が実行され、トップフィールドを示す場合にはS10040が実行される。S10030では、取得したフィールド画像のYプレーンに対し、図5(b)のように画素ごとに上下のボトムフィールドラインの画素値の平均をとり、全てのトップフィールドラインの位置の画素を補間する。これらの処理をUプレーン、Vプレーンにも施し、プログレッシブ画像を生成する。S10035では、トップフィールドを補間したことを示すライン補間情報を生成する。その後、S10050が実行される。S10040では、取得したフィールド画像のYプレーンに対し、図5(a)のように画素ごとに上下のトップフィールドラインの画素値の平均をとり、全てのボトムフィールドラインの位置の画素を補間する。これらの処理をUプレーン、Vプレーンにも施し、プログレッシブ画像を生成する。S10045では、ボトムフィールドラインを補間したことを示すライン補間情報を生成する。その後、S10050が実行される。S10046では、画像識別情報からフォーマット情報を生成する。その後、S10060が実行される。S10050では、画像識別情報、デインターレース方式情報とライン補間情報からフォーマット情報を生成する。その後、S10060が実行される。S10060では、画像符号化サブルーチンを実行して、画像ストリームを生成する。画像符号化サブルーチンについては後述する。本ステップの処理後、本フローは終了する。
以下、フィールド合成方式によるデインターレース処理および符号化処理を実行するサブルーチンのステップについて図16を使って説明する。図16は、フィールド合成方式によるデインターレース処理および符号化処理を実行するサブルーチンのフローを説明した図である。
S16010では、第一の入力画像の画像識別情報を取得する。S16020では、第一の入力画像を取得する。第一の入力画像は、画像識別情報がインターレース画像を示す場合にはフィールド画像であり、画像識別情報がプログレッシブ画像を示す場合にはプログレッシブ画像である。S16030では、画像識別情報が示す画像形式を判定する。画像識別情報がプログレッシブを示す場合にはS16095が実行され、インターレースを示す場合にはS16040が実行される。S16040では、フィールド合成を示すデインターレース方式情報を生成する。S16050では、第一の入力画像に対応するフィールド識別情報を取得する。S16060では、第二の入力画像を取得する。第二の入力画像はフィールド画像である。S16070では、第一の入力画像と第二の入力画像を合成してプログレッシブ画像を生成する。本実施形態では、インターレース画像はフィールド画像単位で入力されるので、第一の入力画像がトップフィールド画像である場合には、第二の入力画像はボトムフィールド画像となる。あるいは、第一の入力画像がボトムフィールド画像である場合には、第二の入力画像はトップフィールド画像となる。よって、第一の入力画像と第二の入力画像をラインごとにインターリーブすることによりフレーム画像が生成できる。本実施形態では、デインターレース方法として、このフレーム画像にコーミングノイズ除去フィルタを施すことによりプログレッシブ画像を生成する。なお、本実施形態でのデインターレース方法は、コーミングノイズ除去フィルタをかけるものとして説明しているが、2つのフィールド画像がインターリーブされるデインターレース方式である限りに、デインターレース処理方法に限定はない。
S16080では、フィールド識別情報からフィールド合成情報を生成する。フィールド識別情報は、第一の入力画像に対応するため、フィールド識別情報がトップフィールド画像を示す場合には、フィールド合成情報は「トップフィールドが時間的に前である」ことを示す。フィールド識別情報がボトムフィールド画像を示す場合には、フィールド合成情報は「トップフィールドが時間的に後である」ことを示す。
S16090では、画像識別情報、デインターレース方式情報とフィールド合成情報からフォーマット情報を生成する。その後、S16100が実行される。S16095では、画像識別情報からフォーマット情報を生成する。その後、S16100が実行される。S16100では、画像符号化サブルーチンを実行して、画像ストリームを生成する。
以下、S10060、および、S16100で実行される画像符号化サブルーチンの各ステップの動作について図11を使って説明する。図11は、画像ストリームとフォーマット情報ビット列を生成し、それらを統合するフローを説明した図である。なお、フォーマット情報ビット列は、実施形態1で説明したとおり、図6に示されるフォーマット情報ビット列のシンタックス構造にしたがって生成されるものとする。
S11000では、プログレッシブを取得する。プログレッシブ画像は、S10000で入力した入力画像、あるいは、S10030、S10040、S16070のいずれかで生成したプログレッシブ画像である。
S11010では、フォーマット情報を取得する。フォーマット情報は、S10046、S10050、S16095,S16090のいずれか生成された情報である。S11020では、プログレッシブ画像をH.264方式でプログレッシブ符号化を行い、画像ストリームを生成する。なお、本特許の実施において符号化方式はH.264を利用しているが、それに限定されず、MPEG−2など異なる符号化方式を用いてもよい。とくに、インターレース符号化方式が規定されないMotion JPEG 2000などの符号化方式で符号化することも可能である。
S11030では、フォーマット情報から画像識別情報を抽出する。S11040では、画像識別情報を符号化して画像識別情報符号を生成する。本実施形態では、図6で示されるシンタックスのoriginal_frame_type符号が2ビットの符号として生成される。その値には、画像識別情報がプログレッシブ画像を示す場合には0が設定され、インターレース画像を示す場合には1が設定される。S11050では、画像識別情報を判定する。画像識別情報がプログレッシブを示す場合にはS11060が実行され、インターレースを示す場合には、S11070が実行される。
S11060では、画像識別情報符号からフォーマット情報ビット列を生成する。本実施形態では、図6のoriginal_frame_type符号のみが存在するフォーマット情報ビット列が生成されることになる。original_frame_type符号の値については後述する。次に、S11090が実行される。S11070では、フォーマット情報からデインターレース情報を取得する。S11075では、デインターレース情報からデインターレース情報符号を生成する。本実施形態では、デインターレース情報符号の生成は、デインターレース情報符号化サブルーチンを実行して行われる。デインターレース情報符号化サブルーチンについては、後述する。
S11080では、画像識別情報符号、デインターレース情報符号からフォーマット情報ビット列を生成する。本ステップでは、original_frame_type符号、deinterlace_method符号、top_field_interpolated符号、top_field_first符号が存在するフォーマット情報ビット列が生成される。ただし、図6(a)に示されるように、top_field_interpolated符号とtop_field_first符号は排他的に存在することになる。符号の具体的な値については後述する。次に、S11090が実行される。
S11090では、画像ストリームにフォーマット情報ビット列が統合され、外部に出力される。フォーマット情報ビット列は、図7(a)のように、画像ストリームの直前に統合され、複数の画像ストリームが生成されるに従って、フォーマット情報ビット列と画像ストリームが交互に並ぶ形で、一連の画像ストリームが形成されることになる。このとき、フォーマット情報ビット列、画像ストリームを区切るために、フォーマット情報ビット列と画像ストリームの先頭にスタートコードを付与するものとする。なお、フォーマット情報ビット列の統合方法や画像ストリームの結合方法は、これに限定されない。例えば、フォーマット情報ビット列を画像ストリームのヘッダ情報の一部としたりすることも可能である。S11090のステップが処理後、本フローは終了する。
以下、S11080で実行されるデインターレース情報符号化サブルーチンのステップについて、図12を使って説明する。図12は、デインターレース情報符号化サブルーチンのフローを説明する図である。
S12010では,デインターレース方式情報を取得する。S12015では,デインターレース方式情報を符号化して、デインターレース方式情報符号を生成する。本実施形態では、図6で説明されるdeinterlace_method符号が可変長のGolomb符号として生成される。その値には、デインターレース方式情報が「フィールド保存」方式を示す場合には0が設定され、「フィールド合成」方式を示す場合には1が設定される。S12020では,デインターレース方式を判定する。デインターレース方式情報が「フィールド合成」を示す場合にはS12030が実行され、デインターレース方式情報が「フィールド保存」を示す場合にはS12050が実行される。S12030では,フィールド合成情報を取得する。S12040では,フィールド合成情報を符号化して、フィールド合成情報を生成する。本実施形態では、図6で説明されるtop_field_first符号が1ビットの符号として生成される。その値には、フィールド合成情報が、「トップフィールド画像が時間的に前である」ことを示す情報の場合には1が設定され、そうでない場合には0が設定される。
S12050では,デインターレース方式情報符号、フィールド合成情報符号からデインターレース情報符号を生成する。本ステップの処理後、本フローは終了する。S12060では,ライン補間情報を取得する。S12070では,ライン補間情報を符号化して、ライン補間情報符号を生成する。
本実施形態では、図6で説明されるtop_field_interpolated符号が1ビットの符号として生成される。その値には、ライン補間情報がトップフィールド補間を示す場合は1が設定され、ボトムフィールド補間を示す場合0が設定される。S12080では,デインターレース方式情報、ライン補間情報からデインターレース情報を生成する。本ステップの処理後、本フローは終了する。
本実施形態では、実施形態1と同様に、デインターレース処理方法に関する情報を含むシンタックスを定義し、このシンタックスに基づいて生成したフォーマット情報ビット列を画像ストリームに統合している。このフォーマット情報ビット列が統合された画像ストリームが復号装置へ伝送されることにより、復号装置はデインターレース処理方法に関する情報を受け取ることができる。復号装置では、インターレース画像を出力したい場合、デインターレース処理方法に関する情報を用いて復号されたプログレッシブ画像をインターレース形式へ再変換することができる。
なお、本実施形態でのフォーマット情報ビット列は、図6(a)に示されるシンタックス構造にしたがって生成されるものとして説明したが、これに限定されない。フォーマット情報ビット列には、デインターレース処理方法に関する符号が含まれていればよい。例えば、原画がインターレース画像である場合にのみ、フォーマット情報ビット列を画像ストリームに統合するという限定を設ければ、フォーマット情報ビット列に画像識別情報符号が含まれなくとも、原画がインターレース画像であるか否かは識別可能である。また、符号化処理と復号処理で、デインターレース方式をフィールド保存に限定する取り決めを行えば、伝送すべきデインターレース処理方法に関する情報は、ライン補間情報のみで十分となる。さらに、各情報の符号の符号化方法は、シンタックスで指定された固定長符号、可変長符号に限定されない。また、その順番にも限定はなく、符号量の削減を考慮しなければ条件文の設定による排他的な定義も必要としない。
本実施形態におけるデインターレース処理は、説明した方式に限定されない。例えば、他のフィールド画像参照しラインを補間したり、動き補償を利用したりしてもよい。一つのフィールド画像を基準としてフレーム画像を生成する方式であれば、もともと原画に存在していたラインの画素値の変化に関わらず、デインターレース方式は「フィールド保存」方式とみなされることになる。また、2つのフィールド画像からフレーム画像を生成する方式であれば、「フィールド合成」方式とみなされる。
本実施形態では、「フィールド保存」でデインターレース処理を行う場合に、ライン補間情報を符号化した符号を画像ストリームに統合する構成をとった。しかし、これに限定されず、代わりに入力されたフィールド画像のフィールド識別情報を符号化した符号を画像ストリームに統合してもよい。フィールドを識別できれば補間ラインを導出することができるため、ライン補間情報とフィールド識別情報のどちらを符号化して、画像ストリームに統合しても、得られる効果は同じである。
本実施形態では、フォーマット情報ビット列と画像ストリームは、スタートコードで区切られた独立したデータと記録されるように説明したが、これに限定されない。例えば、図6(a)で示されるシンタックスを画像ストリームのヘッダ情報のシンタックスの一部として埋め込む構成をとってもよい。また、各画像ストリームに対してフォーマット情報ビット列を生成し、統合しているが、それに限定されず、第1フレームを符号化した画像ストリームにのみに対して生成し、図7(b)のように第1フレームの画像ストリームにのみ統合する構成をとってもよい。図7(b)は、第一フレームの画像ストリームにのみフォーマット情報ビット列が統合された第一の変形例を示している。また、一定間隔画像ごとにフォーマット情報ビット列を生成し統合することも可能である。さらに、スタートコードの代わりにその位置に、フォーマット情報ビット列や画像ストリームのビット長を埋め込むことによって、区切りの位置が識別を可能とする構成をよってもよい。また、複数の画像ストリームを一つファイルとして出力する場合には、各フォーマット情報ビット列と各画像ストリームのファイル内の位置を示すインデックスをファイルに付加する構成をとってもよい。いずれの構成においても、画像ストリームとフォーマット情報ビット列の区切りを識別することができる。
本実施形態では、入力の色差フォーマットとしてYUV420形式の画像が入力されることを例に説明したがそれに限定されない。入力フォーマットとしてYUV422形式、YUV444形式を入力しそれを符号化してもよい。
本実施形態では、インターレース画像をフィールド単位で入力し、処理する例を説明したがそれに限定されない。インターレース画像を2つフィールドのフィールドが合成されたフレーム単位で入力してもよい。フレーム単位で入力した場合も、フレームを2つのフィールドに分離し、順に処理する機能をもつことにより、本実施形態で説明した処理を実施することができる。
<実施形態4>
本実施形態では、実施形態3で説明した符号化方法が生成したフォーマット情報ビット列が統合された画像ストリームを復号し、インターレース画像を出力する復号方法について、図13、図14および図15を使って説明する。なお、特別な記述がない限り、用語等については実施形態1で説明されるものと同様とする。本実施形態では、YUV420面順次形式のプログレッシブ画像として復号した画像を復号装置内部でYUV420面順次形式のインターレース画像に変換し出力するものとして説明する。ただし、色差フォーマットは、画像ストリームに依存し、この値に限定されるものではない。
図9は、本特許における復号方法を含んだ復号プログラムを実行するためのハードウェア構成を示している。本復号プログラムはHDD903に記録されており、復号プログラムの起動とともにRAM902にロードされ、以下で示される各ステップをCPU901が実行して復号処理がなされる。なお、本実施形態では、復号対象である画像ストリームは、外部機器I/F905を介して外部ストレージから入力されるものとする。また、生成された画像は、ネットワークI/F904を介して外部へ出力されたり、グラフィック出力部906を介して、ディスプレイへ出力されたりするものとする。
以下、本復号方法の各ステップの動作について図13を使って説明する。図13は、画像復号処理およびインターレース処理を説明するフローである。なお、図13で説明される処理は画像単位で行われるものであるが、これらの処理が連続的に行われることにより、一連の映像が復号されるものとする。
S13010では、画像ストリーム復号サブルーチンを実行して、プログレッシブ画像とフォーマット情報を生成する。画像ストリーム復号サブルーチンについては後述する。S13020では、フォーマット情報から画像識別情報を抽出する。S13030では、画像識別情報が示す画像形式を判定する。画像識別情報がインターレース画像を示す情報である場合S13040が実行され、プログレッシブ画像を示す情報である場合にはS13140が実行される。S13040では、フォーマット情報からデインターレース方式情報を抽出するS13041では、デインターレース方式情報を参照して、デインターレース方式を判定する。デインターレース方式情報がフィールド保存を示す情報である場合にはS13042が実行され、フィールド合成を示す情報である場合にはS13100が実行される。
S13042では、フォーマット情報からフィールド合成情報を抽出する。S13050では、フィールド合成情報が「トップフィールド画像が時間的に前である」ことを示すか否かを判定する。フィールド合成情報が「トップフィールド画像が時間的に前である」ことを示す場合にはS13080が実行され、「トップフィールド画像が時間的に後である」ことを示す場合にはS13060が実行される。S13060では、プログレッシブ画像のボトムフィールド画像を抽出して出力する。このインターレース処理は、Yプレーン、Uプレーン、Vプレーンすべてに対して行われる。この処理は、S13070での処理と合わせて合成されたフィールド画像を分離し、正しいフィールド時間順に出力する処理である。
S13070では、プログレッシブ画像のトップフィールド画像を抽出して出力する。このインターレース処理は、Yプレーン、Uプレーン、Vプレーンすべてに対して行われる。本ステップの処理後、本フローは終了する。S13080では、プログレッシブ画像のトップフィールド画像を抽出して出力する。このインターレース処理は、Yプレーン、Uプレーン、Vプレーンすべてに対して行われる。この処理は、S13090での処理と合わせて合成されたフィールド画像を分離し、正しいフィールド時間順に出力する処理である。
S13090では、プログレッシブ画像のボトムフィールド画像を抽出して出力する。このインターレース処理は、Yプレーン、Uプレーン、Vプレーンすべてに対して行われる。本ステップの処理後、本フローは終了する。
S13100では、フォーマット情報からライン補間情報を抽出するS13110では、ライン補間情報により識別される補間ラインを判定する。ライン補間情報がトップフィールドを示す場合にはS13120が実行され、ボトムフィールドを示す場合にはS13130が実行される。S13120では、プログレッシブ画像のトップフィールドラインを間引いてボトムフィールド画像を生成し出力する。これは、図5(b)を使って説明したデインターレース処理と逆の処理を示しており、図5の濃い網掛けの画素以外の画素を間引くことにあたる。このインターレース処理は、Yプレーン、Uプレーン、Vプレーンすべてに対して行われる。本ステップの処理後、本フローは終了する。S13130では、プログレッシブ画像のボトムフィールドラインを間引いてトップフィールド画像を生成し出力する。これは、図5(a)を使って説明したデインターレース処理と逆の処理を示しており、図5の濃い網掛けの画素以外の画素を間引くことにあたる。このインターレース処理は、Yプレーン、Uプレーン、Vプレーンすべてに対して行われる。本ステップの処理後、本フローは終了する。
S13140では、プログレッシブ画像のボトムフィールド画像を抽出して出力する。このインターレース処理は、Yプレーン、Uプレーン、Vプレーンすべてに対して行われる。この処理は、S13150での処理と合わせて合成されたフィールド画像を分離し、正しいフィールド時間順に出力する処理である。S13150では、プログレッシブ画像のトップフィールド画像を抽出して出力する。このインターレース処理は、Yプレーン、Uプレーン、Vプレーンすべてに対して行われる。本ステップの処理後、本フローは終了する。
以下、S13010で実行される画像ストリーム復号サブルーチンの処理フローについて図14を使って説明する。図14は、画像ストリーム復号サブルーチンのフローを説明する図である。
S14000では、フォーマット情報ビット列が統合された画像ストリームを取得する。
このとき、フォーマット情報ビット列が統合された画像ストリームは、図7(a)のようにフォーマット情報ビット列が画像ストリームの直前にくるように保存されているものとする。スタートコードによる区切りを識別することにより、フォーマット情報ビット列と画像ストリームを1画像分ずつ取得することができる。
S14010では、画像ストリームとフォーマット情報ビット列を分離する。S14020では、分離された画像ストリームをH.264方式のプログレッシブ形式として復号し、復号画像を生成する。なお、本特許の実施において復号方式はH.264を利用しているが、それに限定されず、実施形態3で説明する符号化方法の符号化方式と同一であればMPEG−2やMotion JPEG 2000などの異なる符号化方式を用いてもよい。S14025では、フォーマット情報ビット列から画像識別情報符号を抽出する
S14030では、画像識別情報符号を復号して画像識別情報を生成する。本実施形態では、画像識別情報は、図6で示されるシンタックスのoriginal_frame_type符号の復号値が0の場合にはプログレッシブ画像を示し、復号値が1の場合には画像識別情報はインターレース画像を示すことになる。
S14040では、画像識別情報が示す画像形式を判定する。画像識別情報がインターレースを示す場合にはS14050が実行され、画像識別情報がプログレッシブを示す場合にはS14070が実行される。S14050では、フォーマット情報ビット列からデインターレース情報符号を抽出する。
S14055では、デインターレース情報符号を復号してデインターレース情報を生成する。本実施形態では、デインターレース情報復号サブルーチンを実行してデインターレース情報を生成する。デインターレース情報復号サブルーチンについては後述する。S14060では、画像識別情報とデインターレース情報符号からフォーマット情報を生成する。
S14070では、画像識別情報からフォーマット情報を生成する。以下、S14055で実行されるデインターレース情報復号サブルーチンの処理フローについて図15を使って説明する。図15は、デインターレース情報復号サブルーチンのフローを説明する図である。S15010では、デインターレース情報符号を取得する。S15015では、デインターレース情報符号からデインターレース方式情報符号を抽出する。
S15020では、デインターレース情報符号のデインターレース方式情報符号を復号して、デインターレース方式情報を生成する。本実施形態では、図6で示されるシンタックスのdeinterlace_method符号の復号値が0の場合には、デインターレース方式情報は「フィールド保存」を示し、復号値が1の場合には「フィールド合成」を示すことになる。S15030では、デインターレース方式情報を参照して、デインターレース方式を判定する。デインターレース方式情報が「フィールド保存」を示す場合にはS15040が実行され、「フィールド」合成を示す場合には、S15060が実行される。
S15040では、デインターレース情報符号からライン補間情報符号を抽出する。S15045では、ライン補間情報符号を復号しライン補間情報を生成する。本実施形態では、ライン補間情報は、図6で示されるシンタックスのtop_field_interpolated符号の復号値が0の場合にはボトムフィールドを補間したことを示し、1の場合にはトップフィールドを補間したことを示すことになる。
S15050では、デインターレース方式情報とライン補間情報からデインターレース情報を生成する。本ステップの処理後、本フローは終了する。S15060では、デインターレース情報符号からフィールド合成情報符号を抽出する。S15065では、フィールド合成情報符号を復号しフィールド合成情報を生成する。本実施形態では、フィールド合成情報は、図6のシンタックスのtop_field_first符号の復号値が1の場合には「トップフィールド画像が時間的に前である」ことを示し、0の場合には「トップフィールド画像が時間的に後である」ことを示す。
S15070では、デインターレース方式情報とフィールド合成情報からデインターレース情報を生成する。本ステップの処理後、本フローは終了する。復号装置がライン補間処理によりプログレッシブ化された画像をインターレース画像へ再変換する場合に、従来は、どのラインを補間したかを識別する手段がなく、補間されたラインを正しく間引くことは難しかった。本実施形態の構成をとることにより、プログレッシブ化された画像をインターレース画像に再変換する場合に、ライン補間情報を参照して補間されたラインを正しく間引くことにより、原画に存在した画素を残したインターレース画像を生成することができる。
なお、外部ストレージに保存された複数の画像ストリームは、図7(b)で示されるように、全ての画像ストリームにフォーマット情報ビット列が統合されない場合も、復号されたプログレッシブ画像をインターレース画像に変換することは可能である。図7(b)の例では、第一フレームの画像ストリームのみにフォーマット情報ビット列が統合されている。デインターレース方式が「フィールド保存」の場合、第一フレームの画像はライン補間情報を参照してインターレース処理を実行したら、ライン補間情報が存在しない次の画像では、第一フレームに対し、間引くラインを切り替えて処理を実行する。このようにして、間引くラインを交互に切り替えながら処理を実行する。デインターレース方式が「フィールド合成」の場合には、第1フレームのフィールド合成情報が、第2フレーム以降も同一であるとして、インターレース処理を実行する。このようにして、全ての画像で正しいラインを間引いてフィールド画像を生成することができる。さらに、フォーマット情報ビット列を一定間隔の画像ストリームごとに統合される場合も、第1フレームのみにフォーマット情報ビット列を統合した場合と同じように、その画像ストリームを基点として処理を行うこともできる。
なお、本実施形態における復号方法はインターレース画像を出力するものとして説明したが、プログレッシブ画像とインターレース画像をユーザーが自由に切り替えて出力する構成をとっても良い。
本実施形態では、フォーマット情報ビット列が統合された画像ストリームを1画像分取得してから、後に分離する構成をとっているが、画像ストリームとフォーマット情報ビット列を個別に取得する構成をとってもよい。これは、フォーマット情報ビット列と画像ストリームを分離するステップS14010が図14で示されるフローの外で実行されているだけであり、本質的な処理は同一である。同様に、フォーマット情報ビット列の含まれる符号を個別に取得する構成も可能である。また、フォーマット情報ビット列が画像ストリームのヘッダ情報の一部として埋め込まれる場合でも、フォーマット情報ビット列を画像ストリームから分離するステップを持てば、本実施形態で説明した他の処理は実行可能である。
本実施形態では、S13140、S13150にてプログレッシブ画像をインターレース画像に変換する場合、フレームレートが同一となるインターレース処理を行うものとして説明している。しかし、これに限定されず、フレームレート変換処理を組み合わせて、任意のフレームレートのインターレース画像を生成する構成をとってもよい。
<その他の実施形態>
本発明の目的は、前述した機能を実現するコンピュータプログラムのコードを記録した記憶媒体を、システムに供給し、そのシステムがコンピュータプログラムのコードを読み出し実行することによっても達成される。この場合、記憶媒体から読み出されたコンピュータプログラムのコード自体が前述した実施形態の機能を実現し、そのコンピュータプログラムのコードを記憶した記憶媒体は本発明を構成する。また、そのプログラムのコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した機能が実現される場合も含まれる。
さらに、以下の形態で実現しても構わない。すなわち、記憶媒体から読み出されたコンピュータプログラムコードを、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込む。そして、そのコンピュータプログラムのコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行って、前述した機能が実現される場合も含まれる。
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するコンピュータプログラムのコードが格納されることになる。

Claims (8)

  1. プログレッシブ画像と前記プログレッシブ画像の特性を表すフォーマット情報から、入力されたプログレッシブ画像がインターレース画像をデインターレース処理した画像であるか否かを判定する判定手段と、
    前記入力されたプログレッシブ画像がデインターレース処理した画像であった場合にフォーマット情報からデインターレース方法を示す情報を抽出するデインターレース情報抽出手段と、
    前記判定手段の結果を符号化する第1の符号化手段と、
    前記デインターレース情報抽出手段の結果を符号化する第2の符号化手段と、
    入力されたプログレッシブ画像を符号化する画像符号化手段と、
    前記第1の符号化手段の結果と前記第2の符号化手段の結果と前記画像符号化手段の結果を統合して出力する出力手段を有することを特徴とする画像符号化装置。
  2. 前記デインターレース情報抽出手段は、前記フォーマット情報から補間の基準となったフィールドの情報を抽出することを特徴とする請求項1に記載の画像符号化装置。
  3. 前記デインターレース情報抽出手段は、前記フォーマット情報からフィールドの合成方法を示す情報を抽出することを特徴とする請求項1に記載の画像符号化装置。
  4. 符号化された画像データから、符号化された画像のフォーマット情報であるフォーマット情報符号化データを分離する分離手段と、
    前記フォーマット情報符号化データから、符号化された画像がプログレッシブ画像であるか、インターレース画像をデインターレース処理した画像であるかを表す情報を復号する第1の復号手段と、
    前記第1の復号手段の復号の結果がデインターレース処理した画像を示すものであった場合、デインターレースの方法を示す情報を復号する第2の復号手段と、
    前記符号化された画像データを復号する画像復号手段と、
    前記第1の復号手段の結果と前記第2の復号手段の結果から復号画像のフォーマット情報を生成するフォーマット情報生成手段とを有することを特徴とする画像復号装置。
  5. プログレッシブ画像と前記プログレッシブ画像の特性を表すフォーマット情報から、入力されたプログレッシブ画像がインターレース画像をデインターレース処理した画像であるか否かを判定する判定工程と、
    前記入力されたプログレッシブ画像がデインターレース処理した画像であった場合にフォーマット情報からデインターレース方法を示す情報を抽出するデインターレース情報抽出工程と、
    前記判定工程の結果を符号化する第1の符号化工程と、
    前記デインターレース情報抽出工程の結果を符号化する第2の符号化工程と、
    入力されたプログレッシブ画像を符号化する画像符号化工程と、
    前記第1の符号化工程の結果と前記第2の符号化工程の結果と前記画像符号化工程の結果を統合して出力する出力工程を有することを特徴とする画像符号化装置における画像符号化方法。
  6. 符号化された画像データから、符号化された画像のフォーマット情報であるフォーマット情報符号化データを分離する分離工程と、
    前記フォーマット情報符号化データから、符号化された画像がプログレッシブ画像であるか、インターレース画像をデインターレース処理した画像であるかを表す情報を復号する第1の復号工程と、
    前記第1の復号工程の復号の結果がデインターレース処理した画像を示すものであった場合、デインターレースの方法を示す情報を復号する第2の復号工程と、
    前記符号化された画像データを復号する画像復号工程と、
    前記第1の復号工程の結果と前記第2の復号工程の結果から復号画像のフォーマット情報を生成するフォーマット情報生成工程とを有することを特徴とする画像復号装置における画像復号方法。
  7. コンピュータが読み出して実行することにより、前記コンピュータを、請求項1に記載の画像符号化装置として機能させることを特徴とするプログラム。
  8. コンピュータが読み出して実行することにより、前記コンピュータを、請求項4に記載の画像復号装置として機能させることを特徴とするプログラム。
JP2011243935A 2011-11-07 2011-11-07 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム Pending JP2013102295A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011243935A JP2013102295A (ja) 2011-11-07 2011-11-07 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム
US13/669,295 US20130114740A1 (en) 2011-11-07 2012-11-05 Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011243935A JP2013102295A (ja) 2011-11-07 2011-11-07 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2013102295A true JP2013102295A (ja) 2013-05-23

Family

ID=48223701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011243935A Pending JP2013102295A (ja) 2011-11-07 2011-11-07 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム

Country Status (2)

Country Link
US (1) US20130114740A1 (ja)
JP (1) JP2013102295A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10178400B2 (en) * 2012-11-21 2019-01-08 Dolby International Ab Signaling scalability information in a parameter set

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7124429B2 (en) * 1999-03-05 2006-10-17 Kabushiki Kaisha Toshiba Video coding apparatus and video decoding apparatus
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
KR20060021446A (ko) * 2004-09-03 2006-03-08 삼성전자주식회사 디인터레이싱 방법 및 이를 적용한 영상기기
US7349029B1 (en) * 2005-01-19 2008-03-25 Kolorific, Inc. Method and apparatus for de-interlacing interlaced video fields originating from a progressive video source
US7561206B2 (en) * 2005-06-29 2009-07-14 Microsoft Corporation Detecting progressive video
JP2007043651A (ja) * 2005-07-05 2007-02-15 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
US8879857B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Redundant data encoding methods and device
US9131164B2 (en) * 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
TWI343212B (en) * 2007-03-23 2011-06-01 Via Tech Inc Deinterlacing method and apparatus for digital motion picture
KR101423655B1 (ko) * 2008-03-18 2014-07-29 삼성전자주식회사 필드 픽쳐 부호화/복호화 장치 및 그 방법
US8629898B2 (en) * 2008-09-03 2014-01-14 Sony Corporation Stereoscopic video delivery
KR20100111467A (ko) * 2009-04-07 2010-10-15 삼성전자주식회사 영상 데이터의 타입을 판정하는 영상기기 및 이에 적용되는 영상처리방법

Also Published As

Publication number Publication date
US20130114740A1 (en) 2013-05-09

Similar Documents

Publication Publication Date Title
US6188725B1 (en) Interlaced video signal encoding and decoding method, by conversion of selected fields to progressive scan frames which function as reference frames for predictive encoding
US9338453B2 (en) Method and device for encoding/decoding video signals using base layer
JP4403737B2 (ja) 信号処理装置及びこれを用いた撮像装置
JP2008228282A (ja) 画像処理装置
JP2005176383A (ja) 色空間の符号化フレームワーク
KR20060043051A (ko) 영상 신호의 인코딩 및 디코딩 방법
KR100880640B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
JP5106039B2 (ja) 画像音声同期再生装置
KR100883604B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
KR100878824B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
JP2007043417A (ja) 画像記録装置及び方法
KR100878825B1 (ko) 스케일러블 비디오 신호 인코딩 및 디코딩 방법
US20080181314A1 (en) Image coding apparatus and image coding method
JP2013102295A (ja) 画像符号化方法、画像符号化装置及びプログラム、画像復号方法、画像復号装置及びプログラム
US8312499B2 (en) Tunneling information in compressed audio and/or video bit streams
JP4528043B2 (ja) 映像信号変換装置、変換方法及びこれを用いた映像信号記録装置
JP2011091592A (ja) 画像符号化装置、符号変換装置、画像記録装置、画像再生装置、画像符号化方法及び、集積回路
JP2010062871A (ja) より高いピクチャレートの圧縮hd映像を、h.264規格を用いるレガシーhd映像デコーダでの復号に対応可能な、より低いピクチャレートの圧縮映像に変換する方法および装置
JP2005051287A (ja) トランスコーダおよびこれを用いた記録再生装置
JP2010232885A (ja) Hdを超える解像度の映像を多視点映像符号化規格で符号化する方法および装置ならびに復号する方法および装置
JP3946177B2 (ja) 動画像符号化装置及び復号装置
JP3552045B2 (ja) 画像信号記録媒体の記録方法、画像信号記録装置、および、画像信号再生装置
JP5136546B2 (ja) 動画像ストリーム加工装置及び該装置を備えた動画像再生装置並びに方法とプログラム
JP2001223989A (ja) 画像再生装置
JP2010041408A (ja) 動画像符号化装置、動画像復号化装置、動画像符号化方法および動画像復号化方法