JP4846504B2 - 動画像符号化装置、プログラム及び動画像符号化方法 - Google Patents

動画像符号化装置、プログラム及び動画像符号化方法 Download PDF

Info

Publication number
JP4846504B2
JP4846504B2 JP2006275028A JP2006275028A JP4846504B2 JP 4846504 B2 JP4846504 B2 JP 4846504B2 JP 2006275028 A JP2006275028 A JP 2006275028A JP 2006275028 A JP2006275028 A JP 2006275028A JP 4846504 B2 JP4846504 B2 JP 4846504B2
Authority
JP
Japan
Prior art keywords
picture
image
field
scene change
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006275028A
Other languages
English (en)
Other versions
JP2008098734A (ja
Inventor
将伸 八杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2006275028A priority Critical patent/JP4846504B2/ja
Publication of JP2008098734A publication Critical patent/JP2008098734A/ja
Application granted granted Critical
Publication of JP4846504B2 publication Critical patent/JP4846504B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、動画像符号化装置、プログラム及び動画像符号化方法、特に、画面内予測モード又は画面間予測モードを用いて符号化を行なう動画像符号化装置、プログラム及び動画像符号化方法に関する。
現在、通信・放送・蓄積などの各種用途において、デジタル化された動画像情報を高効率に圧縮する動画像符号化方式が標準規格として普及している。非特許文献1や非特許文献2には、標準規格化された動画像符号化方式の例が記載されている。
非特許文献1や非特許文献2をはじめとする符号化方式では、符号化の単位となる画像はフレーム画像又はフィールド画像であり、フレーム画像は2枚のフィールド画像から構成されることがある。
図13は、従来の動画像再符号化装置500の構成を示すブロック図である。動画像再符号化装置500は、ピクチャタイプ判別部501、符号化情報解析部502、符号化情報復号部503、間引き部504、ビデオメモリ505、画像情報符号化部506、動きベクトル合成部507、動きベクトル検出部508、情報バッファ509、コンプレキシティ算出部510、シーンチェンジ検出部511、GOP構造決定部512を備えている。
動画像再符号化装置500は、入力される第1の符号化動画像情報を、水平及び垂直方向の画素数の間引きとフレームレートの削減を施した上で、第2の符号化動画像情報に再符号化して出力する。
ピクチャタイプ判別部501は、第1の符号化動画像情報についてピクチャタイプの判別とBピクチャの破棄を行なう。符号化情報解析部502は、第1の符号化動画像を解析して、動きベクトル、量子化幅、符号量を取得し出力する。
符号化情報復号部503は、第1の符号化動画像情報を復号してフレーム画像を出力する。間引き部504は、フレーム画像の画素を間引いて縮小する。ビデオメモリ505は、入力された画像を蓄積する。
画像情報符号化部506は、第2の符号化方式を用いて画像を符号化する。符号量の制御には後述のコンプレキシティを用いる。動きベクトル合成部507は、第1の符号化動画像情報で用いられた動きベクトルから、再符号化に用いる動きベクトルを合成する。
動きベクトル検出部508は、与えられた動きベクトルに基づいてより高精度な動きベクトルを検出する。情報バッファ509は、量子化幅と符号量を蓄積する。コンプレキシティ算出部510は、符号量と量子化幅の積であるコンプレキシティの算出及び推定を行なう。
シーンチェンジ検出部511は、コンプレキシティの変動量によってフレーム画像間のシーンチェンジを検出する。GOP構造決定部512は、フレーム毎にピクチャタイプを選択し、GOPの構造を決定する。
この動画像再符号化装置500では、ピクチャタイプ判別部501に入力される第1の符号化動画像情報を符号化情報復号部503が復号化し、その第1の符号化動画像情報を構成する各フレーム画像を、画像情報符号化部506で第2の符号化動画像情報に再符号化する。
動画像再符号化装置500では、再符号化の際にBピクチャを破棄することから、そのままでは再符号化後の動画像では相対的にIピクチャの使用頻度が増えて符号化効率が低下してしまう。このためGOP構造決定部512は符号化効率の低下を防ぐ目的で、Iピクチャである一部のフレーム画像を、Iピクチャよりも符号化効率の良いPピクチャに変更する。ただし、再符号化対象のフレーム画像の直前でシーンチェンジが検出された場合には、Pピクチャに変更しないことを決定し、画質劣化を軽減する。
以上のようにして、特許文献1に記載の従来技術による画像再符号化装置500は、フレーム画像間のシーンチェンジに起因する画質劣化を軽減しつつ、第1の符号化動画像情報から第2の符号化動画像情報へと再符号化を行なう。
また、特許文献2には、再符号化において再符号化対象のピクチャの近隣ピクチャにおける動きベクトルを用いて再符号化対象のピクチャの動きベクトルを推定する技術が開示されている。また、非特許文献3には、画像間差分の非類似度に基づくシーンチェンジの検出方法の技術が開示されている。
特開2002−152759号公報 特開2000−165887号公報 ISO/IEC 13818−2 ISO/IEC 14496−10 特許庁標準技術集「映像ショット切り換え検出手法」(http://www.jpo.go.jp/shiryou/s_sonota/hyoujun_gijutsu/bidirectional_video/111_15.htm)
特許文献1に記載されている技術では、フレーム画像が2枚のフィールド画像から構成されている場合、フィールド画像の間には時刻の差があるためにシーンチェンジが起こり得る。
図14(a)及び図14(b)は、動画像にシーンチェンジが起こる場合について説明するための図である。
図14(a)では、時間の経過とともに、フレーム画像が41、42、43と変化している。フレーム画像42は、フレーム画像42の奇数ラインの画像からなるフィールド画像421と、フレーム画像42の偶数ラインの画像からなるフィールド画像422とからなる。フレーム画像41はシーンAに属しており、フレーム画像42、43はシーンBに属している。フレーム画像41とフレーム画像42との間で、シーンAからシーンBへ変化するシーンチェンジが起こっている。このようなシーンチェンジを、以降ではフレーム間シーンチェンジと呼ぶ。
図14(b)では、時間の経過とともに、フレーム画像が44、45、46と変化している。フレーム画像45は、フレーム画像45の奇数ラインの画像からなるフィールド画像451と、フレーム画像45の偶数ラインの画像からなるフィールド画像452とからなる。フレーム画像44はシーンAに属しており、フレーム画像45はシーンA+Bに属しており、フレーム画像46はシーンBに属している。フレーム画像45のシーンA+Bで、シーンチェンジが起こっている。このようなシーンチェンジを、以降ではフレーム内シーンチェンジと呼ぶ。
図14(a)及び図14(b)に示すフレーム画像は、第1の符号化動画像情報の一部であり、フレーム画像42とフレーム画像45がともにIピクチャである。
従来技術では、シーンチェンジを行なうフレーム画像42(図14(a)参照)及びフレーム画像45(図14(b)参照)を再符号化する際に、当該フレーム画像全体をIピクチャのフレーム画像として符号化している。このとき、フィールド画像単位でみれば、フィールド画像422は、フィールド画像421と相関が高いにも関わらず画面間予測モードを利用せず、画面内予測モードを用いている。
一方、フィールド画像451は、フレーム画像44と相関が高いにもかかわらず画面間予測モードを利用せず、画面内予測モードを用いている。いずれの場合においても、従来技術では、シーンチェンジが存在する動画像を再符号化する際に符号化効率が悪くなるという問題があった。
本発明は、上記事情に鑑みてなされたものであり、その目的は、シーンチェンジが含まれるフレーム画像の符号化効率を向上させることができる動画像符号化装置、プログラム及び動画像符号化方法を提供することにある。
本発明は、上記課題を解決するためになされたもので、本発明の動画像符号化装置は、1枚のフレーム画像を2枚のフィールド画像に変換するフレーム−フィールド変換部と、前記2枚のフィールド画像間にシーンの切り替わり点であるシーンチェンジが含まれているか否かを検出するシーンチェンジ検出部と、前記シーンチェンジ検出部の検出結果に基づいて前記2枚のフィールド画像のそれぞれを画面内予測モード又は画面間予測モードを用いて符号化する画像情報符号化部とを備える。
本発明では、1枚のフレーム画像を2枚のフィールド画像にフレーム−フィールド変換部が変換し、2枚のフィールド画像間にシーンの切り替わり点であるシーンチェンジが含まれているか否かをシーンチェンジ検出部が検出し、シーンチェンジ検出部の検出結果に基づいて2枚のフィールド画像のそれぞれを画面内予測モード又は画面間予測モードを用いて画像情報符号化部が符号化するようにしたので、2枚のフィールド画像のそれぞれに適した画面内予測モード又は画面間予測モードを用いて符号化することにより、情報量を1枚のフレーム画像よりも削減して符号化することができる。
また、本発明の動画像符号化装置の前記画像情報符号化部は、前記シーンチェンジ検出部がシーンチェンジを検出した場合に前記フレーム画像を2枚のフィールド画像として符号化する。
本発明では、2枚のフィールド画像間に相関がある場合に、情報量を1枚のフレーム画像よりも削減して符号化することができる。
また、本発明の動画像符号化装置は、前記シーンチェンジ検出部のシーンチェンジの検出結果に応じてフィールド画像毎に画面内予測モード又は画面間予測モードを選択してGOP構造を決定するGOP構造決定部を備え、前記画像情報符号化部は、前記GOP構造決定部が選択した予測モードを用いて各フィールド画像を符号化する。
本発明では、GOPを構成するフィールド画像ごとに画面内予測モード又は画面間予測モードを選択して符号化するため、GOPを構成するフィールド画像間の相関を利用してGOPの情報量を削減して符号化することができる。
また、本発明の動画像符号化装置の前記GOP構造決定部は、前記シーンチェンジ検出部がシーンチェンジを検出した場合に、前記フレーム−フィールド変換部が変換するフレーム画像に用いられていた予測モードに応じて前記2枚のフィールド画像に用いる予測モードの組み合わせを選択する。
本発明では、フレーム画像に用いられていた予測モードに応じて、2枚のフィールド画像に用いる最適な予測モードの組み合わせを選択することにより、フレーム画像よりも情報量を削減して符号化することができる。
また、本発明の動画像符号化装置の前記GOP構造決定部は、前記シーンチェンジ検出部がシーンチェンジを検出した場合に、シーンチェンジ前のフィールド画像に用いられていた予測モードを画面間予測モードとする。
本発明では、シーンチェンジ前のフィールド画像に用いられていた予測モードを画面間予測モードとすることにより、そのフィールド画像を他のフィールド画像から予測することができ、シーンチェンジ前のフィールド画像の情報量を削減して符号化することができる。
また、本発明の動画像符号化装置の前記フレーム−フィールド変換部は、前記シーンチェンジ検出部がシーンチェンジを検出した場合に、前記2枚のフィールド画像のうち一方のフィールド画像を、もう一方のフィールド画像との差分が減少するように変換する。
本発明では、2枚のフィールド画像のうち一方のフィールド画像を、もう一方のフィールド画像との差分が減少するように変換するので、一方のフィールド画像をもう一方のフィールド画像から容易に予測することができるようになり、フレーム画像を符号化する際の情報量を削減することができる。
また、本発明の動画像符号化装置の前記フレーム−フィールド変換部は、前記シーンチェンジ検出部がシーンチェンジを検出した場合に、前記2枚のフィールド画像のうち一方のフィールド画像を、もう一方のフィールド画像と同一のフィールド画像に変換する。
本発明では、2枚のフィールド画像のうち一方のフィールド画像を、もう一方のフィールド画像と同一のフィールド画像に変換するので、一方のフィールド画像の情報量を0にすることができるようになり、フレーム画像を符号化する際の情報量を削減することができる。
また、本発明の動画像符号化装置の前記画像情報符号化部は、前記シーンチェンジ検出部がシーンチェンジを検出した場合に、符号化対象のフレーム画像を構成しシーンチェンジ前のシーンに属するフィールド画像の符号化に用いられる平均量子化幅を、同一の予測モードで直前のフィールド画像の符号化に用いられる平均量子化幅よりも増加させる。
本発明では、符号化対象のフレーム画像を構成しシーンチェンジ前のシーンに属するフィールド画像の符号化に用いられる平均量子化幅を増加させて情報量を削減することにより、フレーム画像を符号化する際の情報量を削減することができる。
また、本発明の動画像符号化装置の前記画像情報符号化部は、前記シーンチェンジ検出部がシーンチェンジを検出した場合に、符号化対象のフレーム画像を構成しシーンチェンジ後のシーンに属するフィールド画像の符号化に用いられる平均量子化幅を、符号化対象のフレーム画像を構成しシーンチェンジ前のシーンに属するフィールド画像の符号化に用いられる平均量子化幅よりも小さくする。
本発明では、符号化対象のフレーム画像を構成しシーンチェンジ後のシーンに属するフィールド画像の符号化に用いられる平均量子化幅を小さくするようにしたので、シーンチェンジ前のシーンに属するフィールド画像に対して、シーンチェンジ後のシーンに属するフィールド画像の情報量を増加させることができる。
また、本発明のプログラムは、コンピュータに、1枚のフレーム画像を2枚のフィールド画像に変換する第1のステップと、前記2枚のフィールド画像間にシーンの切り替わり点であるシーンチェンジが含まれているか否かを検出する第2のステップと、前記シーンチェンジ検出部の検出結果に基づいて前記2枚のフィールド画像のそれぞれを画面内予測モード又は画面間予測モードを用いて符号化する第3のステップとを実行させる。
また、本発明の動画像符号化方法は、1枚のフレーム画像を2枚のフィールド画像に変換するフレーム−フィールド変換過程と、前記2枚のフィールド画像間にシーンの切り替わり点であるシーンチェンジが含まれているか否かを検出するシーンチェンジ検出過程と、前記シーンチェンジ検出部の検出結果に基づいて前記2枚のフィールド画像のそれぞれを画面内予測モード又は画面間予測モードを用いて符号化する画像情報符号化過程とを有する。
本発明では、シーンチェンジが含まれるフレーム画像の符号化効率を向上させることができる。
以下、図面を参照し、本発明の実施形態について説明する。
図1は、2枚のフィールド画像fld1及びfld2が、1枚のフレーム画像frmを構成する例を示した図である。フレーム画像frmの高さhの半分の高さh/2である2枚のフィールド画像fld1とフィールド画像fld2とが、飛び越し走査でそれぞれフレーム画像frmの奇数ラインと偶数ラインを占めるように交互に格納されている。このような構造をとる場合、フィールド画像fld1とフィールド画像fld2の映像の時刻は異なる。なお、図1のフィールド画像fld1は、映像の時刻の順序及び符号化の順序において、フィールド画像fld2よりも先の画像である。
符号化の対象としてのフレーム画像とフィールド画像は総称してピクチャと呼ばれ、ピクチャはマクロブロックと呼ばれる小領域に分割して符号化される。符号化の際には、予測符号化の方法、すなわち予測モードと、画質及び符号量を調節する値である量子化幅とをマクロブロック毎に選択できるのが一般的である。予測モードには、画面内予測モードと画面間予測モードの2種類がある。
画面内予測モードは、画素値の空間方向における相関性を利用した予測モードである。また、画面間予測モードは、画素値の時間方向における相関性を利用した予測モードである。マクロブロック毎に選択可能な予測モードの組み合わせは、ピクチャ毎にピクチャタイプとして選択する。ピクチャタイプには基本的にI・P・Bの3種類がある。
ピクチャタイプがIであるピクチャはIピクチャといい、画面内予測モードだけが用いられる。ピクチャタイプがPであるピクチャはPピクチャといい、Iピクチャと同じ画面内予測モードに加えて、予測元のデータとなる参照ピクチャが1枚の画面間予測モードを用いることができる。ピクチャタイプがBであるピクチャはBピクチャといい、Pピクチャと同じ予測モードに加えて、2枚の参照ピクチャによる画面間予測モードを用いることができる。
画面間予測モードが利用できるPピクチャ及びBピクチャは、過去に符号化済みのピクチャとの差分だけを符号化するため、符号化対象のピクチャと参照ピクチャとの相関が高いほど、効率の良い符号化が可能である。
後述する第1〜第3の実施形態では、画面間予測モードとしてPピクチャを用い、画面内予測モードとしてIピクチャを用いる場合について説明する。
図2は、ピクチャ間の相関性の例を示す図である。図2は、時間の経過とともに、フレーム画像が、frm1、frm2、frm3、frm4と変化する場合を示している。
同一のシーンに属するピクチャ間であれば、シーンの映像が大きく変化しない限りは高い相関があるが、参照ピクチャと符号化対象のピクチャが異なるシーンに属する場合には相関が低い。具体的に説明すると、フレーム画像frm1とフレーム画像frm2とは、円のパターンm1がフレーム画像内を移動している点で類似しており、相関が高い。また、フレーム画像frm3とフレーム画像frm4とは、四角形のパターンm2がフレーム画像内を移動している点で類似しており、相関が高い。一方、フレーム画像frm2とフレーム画像frm3とは、フレーム画像内に含まれるパターンが異なっており、相関が低い。
あるシーンから異なるシーンへの切り替わりをシーンチェンジといい、シーンチェンジを挟んだピクチャ間での画面間予測モードの利用は一般に符号化効率が低く画質の劣化につながるため、画面内予測モードを利用するのが望ましい。図2では、フレーム画像frm2とフレーム画像frm3との間で、シーンチェンジが起こっている。
一方、画面内予測モードのみを利用するIピクチャは、上記を理由としてシーンチェンジ直後のピクチャの符号化において用いられるほか、一連のピクチャの集まりであるGOP(Group Of Picture)へのランダムアクセスを実現するために、GOPの先頭ピクチャの符号化においても用いられる。なお、従来の符号化方式の場合、フィールド画像単位で符号化する際にも、GOPはフレーム画像単位で構成されるため、ランダムアクセスもフレーム画像単位となる。しかし、フレーム画像内で先に符号化されるフィールド画像がIピクチャでなければGOPの先頭ピクチャとはならず、後に符号化されるフィールド画像がIピクチャとして符号化されていても、そのフレーム画像にはランダムアクセスが不可能である。
ところで、所定の第1の符号化方式によって符号化された第1の動画像情報を、所定の第2の符号化方式によって符号化された第2の動画像情報に変換する処理を一般に、動画像の再符号化という。再符号化は、より符号化効率の高い符号化方式を用いて符号量を削減するほか、解像度の変換や、通信・放送・蓄積機器の仕様への適合などを目的として行われる。いずれの目的にしても、再符号化による画質劣化はできるだけ回避することが好ましい。
(第1の実施形態)
図3は、本発明の第1の実施形態における動画像再符号化装置100(動画像符号化装置とも称する)の構成を示すブロック図である。この動画像再符号化装置100は、動きベクトル合成部101、フレーム−フィールド変換部102、画像情報符号化部103、フレーム内シーンチェンジ検出部104、GOP構造決定部105、ピクチャタイプ判別部201、符号化情報解析部202、符号化情報復号部203、ビデオメモリ205、動きベクトル検出部208、情報バッファ209、コンプレキシティ算出部210を備えている。
動画像再符号化装置100は、第1の符号化方式によるフレーム構造の第1の符号化動画像情報を入力として受け取り、フレーム内シーンチェンジが含まれるフレーム画像に対応して適切な符号化パラメータを選択し、第2の符号化方式によるフィールド構造の第2の符号化動画像情報を出力する。
なお、第1の符号化方式とは、画面内符号化モードと画面間符号化モードがピクチャ毎に選択できる方式であり、例えば、ISO/IEC 13818−2に規定されている方式を用いることができる。
また、第2の符号化方式とは、フィールド画像単位での符号化ができる方式であり、例えば、ISO/IEC 14496−10に規定されている方式を用いることができる。
なお、第1の符号化方式と第2の符号化方式とで同じ符号化方式を用いてもよい。
動きベクトル合成部101は、符号化情報解析部202が出力する第1の符号化方式における動きベクトルから、第2の符号化方式の動きベクトルを合成し、動きベクトル検出部208に出力する。動きベクトルとは、符号化を行なったフレーム画像を参照することにより、次に符号化するフレーム画像を予測したときの空間的なずれをいう。
フレーム−フィールド変換部102は、ビデオメモリから出力されるフレーム構造の画像情報をフィールド構造に変換し、フレーム−フィールド変換部102に出力する。
画像情報符号化部103は、フレーム−フィールド変換部102から出力されるフィールド画像に対して、第2の符号化方式を用いて符号化し、動画像再符号化装置100の外部に出力する。
フレーム内シーンチェンジ検出部104は、フレーム−フィールド変換部102から出力されるフィールド画像に基づいて、フレーム内シーンチェンジの有無を検出し、その検出結果であるシーンチェンジフラグをGOP構造決定部105に出力する。
GOP構造決定部105は、フレーム内シーンチェンジ検出部104が出力するシーンチェンジフラグに基づいてピクチャタイプを選択してGOPの構造を決定し、そのピクチャタイプを画像情報符号化部103に出力する。
ピクチャタイプ判別部201は、動画像再符号化装置100に入力される第1の符号化動画像情報に含まれるフレーム画像のピクチャタイプを判別し、Bピクチャを破棄する。ピクチャタイプ判別部201は、第1の符号化動画像情報を符号化情報解析部202に出力するとともに、判別したピクチャタイプをGOP構造決定部105に出力する。なお、ピクチャタイプ判別部201は、フレームレートの変換を行わない場合には、Bピクチャの破棄を行わない。この場合、符号化情報復号部203には、Bピクチャの復号機能が設けられる。
動きベクトル合成部101は、符号化情報解析部202が出力する第1の符号化方式に対する動きベクトルを、第2の符号化方式における動きベクトルに適合するよう変換し、動きベクトル検出部208に出力する。また、動きベクトル合成部101は、フレーム画像に対する動きベクトルからフィールド画像に対する動きベクトルへの変換を行なう。
フレーム−フィールド変換部102は、フレーム画像とフィールド画像の関係に基づいてフレーム画像を飛び越し走査し、フレーム画像の奇数ラインと偶数ラインそれぞれのみから成る2枚のフィールド画像に変換し、画像情報符号化部103に出力する。
画像情報符号化部103は、第1の符号化動画像情報を用いて符合化された1枚のフレーム画像を、第2の符号化方式を用いて2枚のフィールド画像として符号化し、動画像再符合化装置100の外部に出力する。2枚のフィールド画像に適用するピクチャタイプはそれぞれ、GOP構造決定部105が選択するピクチャタイプpt1及びピクチャタイプpt2である。2枚のフィールド画像を符号化するために、符号量の制御はフィールド画像毎に行われる。符号量の制御には後述のコンプレキシティを用いる。
フレーム内シーンチェンジ検出部104は、画像間差分の非類似度に基づくシーンチェンジの検出方法を使用して、フレーム画像内の2枚のフィールド画像にシーンチェンジが含まれているか否かについて検出する。なお、フレーム内シーンチェンジ検出部104は、画像間差分の非類似度に基づくシーンチェンジの検出方法以外の方法を使用して、2枚のフィールド画像にシーンチェンジが含まれているか否かについて検出してもよい。
具体的には、フレーム内シーンチェンジ検出部104は、2枚のフィールド画像の非類似度が所定の閾値よりも大きい場合には2枚のフィールド画像間にシーンチェンジが存在すると判定し、真のシーンチェンジフラグscをGOP構造決定部105に出力する。一方、2枚のフィールド画像の非類似度が所定の閾値以下である場合には2枚のフィールド画像間にシーンチェンジが存在しないと判定し、偽のシーンチェンジフラグscをGOP構造決定部105に出力する。
GOP構造決定部105は、ピクチャタイプ判別部201が出力するピクチャタイプptと、フレーム内シーンチェンジ検出部104が出力するシーンチェンジフラグscとに基づいて、2枚のフィールド画像のうち一方のフィールド画像に適用するピクチャタイプpt1と、他方のフィールド画像に適用するピクチャタイプpt2を選択し、画像情報符号化部103に出力する。
図4は、本発明の実施形態によるGOP構造決定部105の処理を示すフローチャートである。始めに、GOP構造決定部105は、ピクチャタイプ判別部201(図3)が出力するピクチャタイプがIピクチャであるか否か、つまり、pt=Iであるか否かについて判定する(ステップS10)。
ステップS10でピクチャタイプがIピクチャである場合(pt=I)には、GOP構造決定部105(図3)は、フレーム内シーンチェンジ検出部104が出力するシーンチェンジフラグが真であるか偽であるか否か、つまり、sc=trueであるか否かについて判定する(ステップS11)
GOP構造決定部105は、フレーム内シーンチェンジ検出部104がシーンチェンジを検出した場合(sc=true)に、フレーム−フィールド変換部102が変換するフレーム画像に用いられていたピクチャタイプに応じて2枚のフィールド画像に用いるピクチャタイプの組み合わせを選択する。具体的には、GOP構造決定部105は、シーンチェンジ検出部102がシーンチェンジを検出した場合に、シーンチェンジ前のフィールド画像に用いられていたピクチャタイプをPピクチャとする。
つまり、ステップS11でシーンチェンジフラグが真である場合(sc=true)は、再符号化対象のフレーム画像frm内にシーンチェンジが含まれている場合であり、フレーム画像内に2つのシーンが存在している。この場合、フィールド画像fld1は、同じシーンに属する時間的に前方のピクチャを参照ピクチャとして画面間予測モードを用いると、符号化効率を高めることができる。これに対してシーンチェンジ後のシーンの最初の画像であるフィールド画像fld2は、時間的に前のピクチャから予測することが難しいために画面内予測モードを用いる。
つまり、GOP構造決定部105は、フィールド画像fld1に適用するピクチャタイプとしてPピクチャを選択し、フィールド画像fld2に適用するピクチャタイプとしてIピクチャを選択(pt1=P,pt2=I)する(ステップS12)。
なお、ステップS12において、フィールド画像fld2に適用するピクチャタイプとしてPピクチャを選択し、各マクロブロックにおいて画面内予測モードを選択するようにしてもよい。
ここで、再符号化対象のフレーム画像frmはIピクチャであって動きベクトルを有しないため、フィールド画像fld1に対する新たな動きベクトルが必要となる。不足する動きベクトルに対しては、動きベクトル検出部208で動きベクトルを新規に検出してもよいし、他の方法を用いてもよい。すなわち、動きベクトルを他のピクチャの動きベクトルから推定するようにしてもよい。
ステップS12の処理を行なった場合に、第1の符号化動画像情報においてランダムアクセスが可能であったフレーム画像frmが、再符号化後にはランダムアクセスが不可能な画像となるときには、フィールド画像fld1に適用するピクチャタイプとしてIピクチャを選択することにより、再符号化後もフレーム画像frmへのランダムアクセスが可能となる。この場合には、フィールド画像fld1及びfld2に適用するピクチャタイプを両方ともIピクチャにすることによる符号化効率の低下を避けるため、後述の第3の実施形態を用いるとよい。
ステップS11でシーンチェンジフラグが偽である場合(sc≠true)は、フィールド画像fld1とフィールド画像fld2との間にはシーンチェンジが含まれず、フィールド画像fld1とフィールド画像fld2との間に高い相関があるため、フィールド画像fld2をフィールド画像fld1から予測すれば符号化効率を高めることができる。
したがって、フィールド画像fld1はIピクチャとし、フィールド画像fld2は第1の符号化動画像情報におけるピクチャタイプであるIを継承せずにPピクチャとする(pt1=I,pt2=P)。つまり、GOP構造決定部105は、フィールド画像fld1に適用するピクチャタイプとしてIピクチャを選択し、フィールド画像fld2に適用するピクチャタイプとしてPピクチャを選択する(ステップS13)。
ステップS10でピクチャタイプがIピクチャではない場合(pt≠I)には、GOP構造決定部105は、フィールド画像fld1に適用するピクチャタイプとして第1の符号化動画像情報におけるピクチャタイプを継続して選択し、フィールド画像fld2に適用するピクチャタイプとして第1の符号化動画像情報におけるピクチャタイプを継続して選択(pt1=pt,pt2=pt)する(ステップS14)。
次に、図5及び図6を参照して、GOP構造決定部105の動作例を説明する。
図5は、本発明の第1の実施形態による第1の符号化動画像情報の模式図である。図5では、時間の経過とともに、フレーム画像がI0、P1、P2、I3、P4、P5、I6、P7、P8と変化している。フレーム画像I0、I3、I6には、ピクチャタイプとしてIピクチャが適用されており、ランダムアクセスが可能である。また、フレーム画像P1、P2、P4、P5、P7、P8には、ピクチャタイプとしてPピクチャが適用されている。
フレーム画像I0、P1、P2は、フレーム画像の集まりであるGOP・g1を構成している。同様に、フレーム画像I3、P4、P5はGOP・g2を構成し、フレーム画像I6、P7、P8はGOP・g3を構成している。
図6(a)〜図6(c)は、本発明の第1の実施形態による第2の符号化動画像情報の模式図である。
図6(a)では、フィールド画像fld1に対応するピクチャを、I0t、P1t、P2t、I3t、P4t、P5t、I6t、P7t、P8tで示し、フィールド画像fld2に対応するピクチャを、P0b、P1b、P2b、P3b、P4b、P5b、P6b、P7b、P8bで示している。
また、図6(b)では、フィールド画像fld1に対応するピクチャを、I0t、P1t、P2t、P3t、P4t、P5t、I6t、P7t、P8tで示し、フィールド画像fld2に対応するピクチャを、P0b、P1b、P2b、I3b、P4b、P5b、P6b、P7b、P8bで示している。
また、図6(c)では、フィールド画像fld1に対応するピクチャを、I0t、P1t、P2t、I3t、P4t、P5t、I6t、P7t、P8tで示し、フィールド画像fld2に対応するピクチャを、P0b、P1b、P2b、I3b、P4b、P5b、P6b、P7b、P8bで示している。
図6(a)〜図6(c)では、フィールド画像fld1とフィールド画像fld2とを合わせたフレーム画像を単位としてGOPが構成されている。
図6(a)は、図5に示す動画像にフレーム内シーンチェンジが含まれるフレーム画像が存在しない場合の、再符号化後のGOP構造の例である。g1a、g2a、g3aは再符号化後のGOPであり、それぞれ図5におけるGOP・g1、g2、g3と対応している。第1の符号化動画像情報でIピクチャであったフレーム画像は、再符号化後にはIピクチャのフィールド画像とPピクチャのフィールド画像となる。例えば、第1の符号化動画像情報のフレーム画像I0(図5)は、図6(a)に示すように2枚のフィールド画像(フィールド画像I0tとフィールド画像P0b)として再符号化される。このとき、フィールド画像P0bの参照ピクチャは、フィールド画像I0tである。図5のフレーム画像I3やI6についても同様に、IピクチャとPピクチャの2枚のフィールド画像に分離して再符号化される。Iピクチャ以外の画像については、再符号化前と同じピクチャタイプを再符号化時に適用する。
図6(b)は、図5に示す第1の符号化動画像情報のフレーム画像I3がフレーム内シーンチェンジを含む場合の例である。フレーム画像I3の再符号化においてシーンチェンジフラグscが真となるために、フレーム画像I3は、Pピクチャであるフィールド画像P3tとIピクチャであるフィールド画像I3bとに分けて再符号化される。図6(b)ではフィールド画像P3tの参照ピクチャはフィールド画像P2tであるが、フィールド画像P3tと同一シーンに属していればフィールド画像P2t以外のピクチャでも構わない。いずれにしても、フィールド画像P3tがIピクチャでない限りGOPの先頭とはなりえず、フィールド画像I0tからフィールド画像P5bまでのピクチャが、1つのGOPを構成する。図6(b)のg1bは、図5におけるGOP・g1とGOP・g2とに対応するGOPである。
図6(c)も図6(b)と同じく、図5に示すフレーム画像I3がフレーム内シーンチェンジを含む場合の例である。ただし、フレーム画像I3は、再符号化後もランダムアクセスが可能となるように、図6(b)とは違い、2枚のフィールド画像ともにIピクチャとして再符号化される。GOP・g1c、GOP・g2c、GOP・g3cは、再符号化前(図5参照)のGOP・g1、GOP・g2、GOP・g3に対応する再符号化後のGOPである。
なお、図6(a)〜図6(c)では、フレーム画像がIピクチャとPピクチャのみからなる例を示したが、第1の符号化動画像情報が、Iピクチャ、Pピクチャの他に、Bピクチャを含んでいてもよい。
以上のようにしてGOP構造決定部105は、フレーム画像毎にピクチャタイプpt1及びピクチャタイプpt2を選択してGOP構造を決定する。なお、ピクチャタイプpt1及びピクチャタイプpt2の選択方法は、フィールド画像fld1に対しては画面間予測モード、フィールド画像fld2に対しては画面内予測モードが利用できるようなピクチャタイプを選択する方法を用いることができる。
さらに、図3で示した構成に加えてフレーム間シーンチェンジを検出する機能を設け、フレーム内シーンチェンジの有無及びフレーム間シーンチェンジの有無に基づいてピクチャタイプを制御するようにしてもよい。例えば、フレーム間シーンチェンジとフレーム内シーンチェンジがともに存在しない場合には、ピクチャタイプpt1及びピクチャタイプpt2を、pt1=P、pt2=Pとしてもよい。
次に、本発明の第1の実施形態による動画像再符号化装置100が、再符号化を行なう際の処理について説明する。符号化情報復号部203は、ピクチャタイプ判別部201に入力された第1の符号化動画像情報であるフレーム画像を復号化する。
フレーム−フィールド変換部102は、符号化情報復号部203が復号化した1枚のフレーム画像を2枚のフィールド画像に変換する。
フレーム内シーンチェンジ検出部104は、フレーム−フィールド変換部102が変換した2枚のフィールド画像間にシーンの切り替わり点であるシーンチェンジが含まれているか否かを検出する。
GOP構造決定部105は、フレーム内シーンチェンジ検出部104のシーンチェンジの検出結果に応じてフィールド画像毎にピクチャタイプ(Iピクチャ又はPピクチャ)を選択してGOP構造を決定する。
画像情報符号化部103は、フレーム内シーンチェンジ検出部104の検出結果に基づいて、GOP構造決定部105が選択するピクチャタイプを用いて2枚のフィールド画像のそれぞれを符号化する。
以上説明したように、フレーム内シーンチェンジ検出部104は、第1の符号化動画像情報のうちIピクチャであるフレーム画像についてフレーム内シーンチェンジの有無を検出し、GOP構造決定部105は、その結果に基づいて再符号化時にフィールド画像に適用するピクチャタイプを制御する。これにより、動画像再符号化装置100は、フレーム内シーンチェンジが存在しても、第1の符号化動画像情報を第2の符号化動画像情報へ良好な符号化効率で再符号化できる。
(第2の実施形態)
図7は、本発明の第2の実施形態における動画像再符号化装置110の構成を示すブロック図である。本実施形態による動画像再符号化装置110が、第1の実施形態による動画像再符号化装置100(図3)と同じ構成を取る部分については、同一の符号を付してそれらの説明を省略する。
動画像再符号化装置110は、フレーム−フィールド変換部111、GOP構造決定部112を備えている。
フレーム−フィールド変換部111は、ビデオメモリ205が出力するフレーム構造の画像情報をフィールド構造に変換し、画像情報符合化部103に出力する。
GOP構造決定部112は、ピクチャタイプ判別部201が出力するピクチャタイプに基づいて、GOPの構造及びピクチャタイプを決定する。
フレーム−フィールド変換部111は、シーンチェンジフラグscが偽でフィールド画像fld1を出力する以外の場合にはフレーム−フィールド変換部102と同様の動作をする。シーンチェンジフラグscが真の場合、シーンチェンジ前のシーンに属するフィールド画像fld1の代わりに、シーンチェンジ後のシーンに属するフィールド画像fld2と同一の画像を出力する。フィールド画像fld2の出力は、フレーム−フィールド変換部102と同様である。
図8は、1枚のフレーム画像から2枚のフィールド画像への変換処理を説明するための図である。図8に示すように、フレーム−フィールド変換部111(図7)は、フレーム内シーンチェンジ検出部104がシーンチェンジを検出した場合に、2枚のフィールド画像のうち一方のフィールド画像fld1を、もう一方のフィールド画像fld2と同一のフィールド画像に変換する。逆に、フィールド画像fld2の画像をフィールド画像fld1の画像と同一にして出力することもできるが、GOPの先頭フレーム画像でそのようにすると、GOPの先頭フレーム画像だけがシーンチェンジ前のシーンに属する画像となってしまう。したがって、フィールド画像fld1としてフィールド画像fld2と同一の画像を出力することが望ましい。
GOP構造決定部112は、GOP構造決定部105と同様に、2枚のフィールド画像fld1及びフィールド画像fld2に対してそれぞれピクチャタイプpt1とピクチャタイプpt2を選択してGOPの構造を決定する。
図9は、GOP構造決定部112におけるピクチャタイプpt1とピクチャタイプpt2の選択処理の流れを示すフローチャートである。以下、図9のフローチャートに沿って、GOP構造決定部112におけるピクチャタイプの選択処理の各ステップを説明する。
まず、ステップS20では、再符号化対象のフレーム画像frmのピクチャタイプptがIであるか否か、つまり、pt=Iであるか否かについて判定する。
ステップS21は、ステップS20でピクチャタイプpt=Iの場合に行われる処理である。ここでフレーム内シーンチェンジが検出されていない場合には、フィールド画像fld1とフィールド画像fld2とは相関が高いため、フィールド画像fld2はフィールド画像fld1を参照ピクチャとする画面間予測によって符号化(pt1=I,pt2=P)すれば、符号化効率を向上できる。
一方、フレーム内シーンチェンジが検出されている場合には、フレーム−フィールド変換部111からは、フィールド画像fld1及びフィールド画像fld2として同一の画像が出力される。したがって、フィールド画像fld2は、フィールド画像fld1を参照ピクチャとする画面間予測によって、ほとんど符号量を消費せずに符号化が可能である。結局、フレーム内シーンチェンジが検出されているか否かに関わらず、ピクチャタイプpt1とピクチャタイプpt2は、pt1=I、pt2=Pとする。
一方、ステップS22は、ピクチャタイプpt=Iでない場合に行われる処理である。ここでは、ピクチャタイプpt1及びピクチャタイプpt2は、第1の符号化動画像情報におけるピクチャタイプptを継承する(pt1=pt,pt2=pt)。
GOP構造決定部112の動作例を、図5と図10を例に説明する。図10は図6と同様に再符号化後の第2の符号化動画像情報の模式図であり、第1の符号化動画像情報のフレーム画像I3(図5)がフレーム内シーンチェンジを有した場合の例である。フレーム画像I3は、図9のステップS21の処理によってフィールド画像I3tとフィールド画像P3bとに分けて再符号化される。このとき、フレーム−フィールド変換部111の処理により、フィールド画像I3tはフィールド画像P3bと同一の画像となっており、フィールド画像P3bの参照ピクチャはフィールド画像I3tである。フィールド画像I3tはGOPの先頭ピクチャであるため、ランダムアクセスが可能である。
以上のようにしてGOP構造決定部112は、ピクチャタイプpt1及びピクチャタイプpt2を選択してGOP構造を決定する。なお、ピクチャタイプpt1及びピクチャタイプpt2の選択方法は、フィールド画像fld1に対しては画面内予測モード、フィールド画像fld2に対しては画面間予測モードが利用できるようなピクチャタイプを選択する方法であればよい。
さらに、第1の実施形態と同様に、本実施形態の構成に加えてフレーム間シーンチェンジを検出する機能を設け、フレーム内シーンチェンジの有無及びフレーム間シーンチェンジの有無に基づいてピクチャタイプを制御するようにしてもよい。
以上説明したように、第1の符号化動画像情報においてフレーム内シーンチェンジ検出部104がフレーム内シーンチェンジを検出した際に、フレーム−フィールド変換部111は、フィールド画像fld1としてフィールド画像fld2と同一の画像を出力してフレーム画像frmがフレーム内シーンチェンジを有しない状態にする。これにより、動画像再符号化装置110は、フレーム内シーンチェンジが存在しても、第1の符号化動画像情報を第2の符号化動画像情報へ良好な符号化効率で再符号化できる。
なお、第2の実施形態では、フレーム内シーンチェンジ検出部104がシーンチェンジを検出した場合に、フレーム−フィールド変換部111が、2枚のフィールド画像のうち一方のフィールド画像fld1を、もう一方のフィールド画像fld2と同一のフィールド画像に変換する場合について説明したが、これに限定されるものではない。例えば、フレーム−フィールド変換部111は、フレーム内シーンチェンジ検出部104がシーンチェンジを検出した場合に、2枚のフィールド画像fld1、fld2のうち一方のフィールド画像fld1をもう一方のフィールド画像fld2との差分が減少するように、つまり、フィールド画像fld1とフィールド画像fld2とが類似するように変換してもよい。このような処理を行なうことにより、一方のフィールド画像fld1をもう一方のフィールド画像fld2から容易に予測することができるようになり、フレーム画像frmを符号化する際の情報量を削減することができる。
(第3の実施形態)
図11は、本発明の第3の実施形態による動画像再符号化装置120の構成を示すブロック図である。本実施形態による動画像再符号化装置120が、第1の実施形態による動画像再符号化装置100(図3)と同じ構成を取る部分については、同一の符号を付してそれらの説明を省略する。
画像情報符合化部121は、フレーム−フィールド変換部102が出力するフィールド画像を、第2の符号化方式を用いて符号化し、動画像再符号化装置120の外部に出力する。
画像情報符号化部121は、第2の符号化方式を用いて画像情報を符号化する点については、画像情報符号化部103と同様である。画像情報符号化部103と異なるのは、ピクチャタイプについては、第1の符号化動画像情報におけるフレーム画像のピクチャタイプptを継承して、フィールド画像fld1とフィールド画像fld2のピクチャタイプpt1及びピクチャタイプpt2とする点と、符号量制御の際にシーンチェンジフラグscを参照して量子化幅を決定する点である。
再符号化対象のフレーム画像frmがフレーム内シーンチェンジを有していた場合、シーンチェンジ前のフィールド画像fld1はあるシーンの最後の画像であって、時間的にこれ以降のピクチャから参照される可能性は低く、フィールド画像fld1に多くの符号量を割り当てることは符号化効率の低下につながる。逆に、シーンチェンジ後のフィールド画像fld2は別のシーンの最初の画像であって時間的にそれ以降のピクチャの画質に影響を与える可能性が高く、フィールド画像fld2に多くの符号量を割り当てることにより符号化効率が向上すると考えられる。
これを考慮し、画像情報符号化部121は、フィールド画像fld1及びフィールド画像fld2に対する量子化幅をQ1及びQ2を、各フィールドに対して算出した量子化幅を初期値Q1’及びQ2’と、各フィールド画像に対する量子化幅の補正量ΔQ1及びΔQ2を用いて、Q1=Q1’+ΔQ1、Q2=Q2’+ΔQ2と算出する。
図12は、画像情報符号化部121において、量子化幅の補正量ΔQ1及びΔQ2を決定する処理の流れを示すフローチャートである。
まず、ステップS30では、シーンチェンジフラグscの値を判定する。
ステップS31では、画像情報符号化部121は、フレーム内シーンチェンジ検出部104がシーンチェンジscを検出した場合に、符号化対象のフレーム画像を構成しシーンチェンジ前のシーンに属するフィールド画像の符号化に用いられる平均量子化幅ΔQ1を、同一の予測モードで直前のフィールド画像の符号化に用いられる平均量子化幅ΔQ2よりも増加させる。具体的には、シーンチェンジ前のフィールド画像fld1における量子化幅Q1がQ1’よりも大きく、シーンチェンジ後のフィールド画像fld2における量子化幅Q2がQ2’よりも小さくなるようにΔQ1及びΔQ2を定める。本実施形態では、量子化幅の補正量を、ΔQ1=+a,ΔQ2=−aにより算出する。ここで、aは変数である。なお、ΔQ1、ΔQ2の算出方法として他の方法を使用してもよい。
変数aに正の値を与えればフィールド画像fld1の量子化幅Q1がより大きくなり、フィールド画像fld2の量子化幅Q2がより小さくなる。すなわち、シーンチェンジ前であるフィールド画像fld1の割当て符号量が減少し、シーンチェンジ後であるフィールド画像fld2の割当て符号量が増加することになる。用いる符号化方式に従ってaの絶対値を変えることによって、画質の変化の度合いを調節できる。
ステップS32は、シーンチェンジフラグscが偽である場合に行われる処理であり、ΔQ1=0,ΔQ2=0に設定する。
このようにして画像情報符号化部121では、フレーム画像frmがフレーム内シーンチェンジを有する場合にも適切な符号量制御を行なう。なお、量子化幅の算出方法は、シーンチェンジ前のシーンに属するフィールドに割り当てる符号量を相対的に減らすか、シーンチェンジ後のシーンに属するフィールドに割当てる符号量を相対的に増やす方法であれば、本実施形態の方法に限定されるものではない。
例えば、画像情報符号化部121は、フレーム内シーンチェンジ検出部104がシーンチェンジscを検出した場合に、符号化対象のフレーム画像を構成しシーンチェンジ後のシーンに属するフィールド画像の符号化に用いられる平均量子化幅を、符号化対象のフレーム画像を構成しシーンチェンジ前のシーンに属するフィールド画像の符号化に用いられる平均量子化幅よりも小さくするようにしてもよい。このような処理を行なうことにより、シーンチェンジ前のシーンに属するフィールド画像に対して、シーンチェンジ後のシーンに属するフィールド画像の情報量を増加させることができる。
なお、符号量の制御方法として、上述した説明では各フィールド画像に対する量子化幅は各マクロブロックに対し一律としたが、算出した量子化幅Q1及びQ2を基準としてマクロブロック毎に量子化幅を調整してもよい。
以上説明したように、第1の符号化動画像情報においてフレーム内シーンチェンジ検出部104がフレーム内シーンチェンジを検出した際に、画像情報符号化部121は、シーンチェンジ前後のフィールド画像に適用する量子化幅を補正する。これにより、動画像再符号化装置120は、フレーム内シーンチェンジが存在しても、第1の符号化動画像情報を第2の符号化動画像情報へ良好な符号化効率で再符号化できる。さらに、本実施形態を第1の実施形態あるいは第2の実施形態と組み合わせて実施することも可能であり、そうすれば符号化効率はより向上する。
なお、上述した第1〜第3の実施形態による動画像再符号化装置は、再符号化にはフィールド構造のみを使用しているが、1つの符号化動画像内でフレーム画像毎にフレーム構造とフィールド構造を適応的に選択するフレーム−フィールド適応符号化が可能な符号化方式であれば、それを用いてもよい。
本発明の実施形態に係る動画像再符号化装置は、第1の符号化動画像情報におけるフレーム内シーンチェンジの有無を検出し、その結果に基づいて再符号化処理を制御することにより、フレーム内シーンチェンジが存在しても、良好な符号化効率で第2の符号化動画像情報へと再符号化できる。フレーム内シーンチェンジの検出時に、第1の実施形態の場合にはシーンチェンジ前のシーンに属するフィールド画像をより符号化効率の良いPピクチャとして符号化することで上記効果を得ることができる。
第2の実施形態の場合には、フレーム内シーンチェンジの直前のフィールド画像をシーンチェンジ直後のフィールド画像で代替してフレーム内シーンチェンジを解消することで上記効果を得ることができる。
第3の実施形態の場合には、フレーム内シーンチェンジが起こったフレーム画像を構成するフィールド画像の量子化幅を変化させることにより割り当てる符号量を調節し、符号化効率の低下を防ぐことができる。
なお、以上説明した実施形態において、図3、図7、図11の動きベクトル合成部101、フレーム−フィールド変換部102、画像情報符号化部103、フレーム内シーンチェンジ検出部104、GOP構造決定部105、フレーム−フィールド変換部111、GOP構造決定部112、画像情報符合化部121、ピクチャタイプ判別部201、符号化情報解析部202、符号化情報復号部203、動きベクトル検出部208、コンプレキシティ算出部210の機能又はこれらの機能の一部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより動画像再符号化装置の制御を行なってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時刻の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時刻プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
2枚のフィールド画像fld1及びfld2が、1枚のフレーム画像frmを構成する例を示した図である。 ピクチャ間の相関性の例を示す図である。 本発明の第1の実施形態における動画像再符号化装置100の構成を示すブロック図である。 本発明の実施形態によるGOP構造決定部105の処理を示すフローチャートである。 本発明の第1の実施形態による第1の符号化動画像情報の模式図である。 本発明の第1の実施形態による第2の符号化動画像情報の模式図である。 本発明の第2の実施形態における動画像再符号化装置110の構成を示すブロック図である。 1枚のフレーム画像から2枚のフィールド画像への変換処理を説明するための図である。 GOP構造決定部112におけるピクチャタイプpt1とピクチャタイプpt2の選択処理の流れを示すフローチャートである。 本発明の第2の実施形態による第2の符号化動画像情報の模式図である。 本発明の第3の実施形態による動画像再符号化装置120の構成を示すブロック図である。 画像情報符号化部121において、量子化幅の補正量ΔQ1及びΔQ2を決定する処理の流れを示すフローチャートである。 従来の動画像再符号化装置500の構成を示すブロック図である。 動画像にシーンチェンジが起こる場合について説明するための図である。
符号の説明
100・・・動画像再符号化装置、101・・・動きベクトル合成部、102・・・フレーム−フィールド変換部、103・・・画像情報符号化部、104・・・フレーム内シーンチェンジ検出部、105・・・GOP構造決定部、110・・・動画像再符号化装置、111・・・フレーム−フィールド変換部、112・・・GOP構造決定部、120・・・動画像再符号化装置、121・・・画像情報符合化部、201・・・ピクチャタイプ判別部、202・・・符号化情報解析部、203・・・符号化情報復号部、205・・・ビデオメモリ、208・・・動きベクトル検出部、209・・・情報バッファ、210・・・コンプレキシティ算出部

Claims (5)

  1. 1枚の符号化されたフレーム画像を第1及び第2のフィールド画像に変換するフレーム−フィールド変換部と、
    前記第1及び第2のフィールド画像間にシーンの切り替わり点であるシーンチェンジが含まれているか否かを検出するシーンチェンジ検出部と、
    前記フレーム画像のピクチャタイプを判別するピクチャタイプ判別部と、
    前記ピクチャタイプ判別部がピクチャタイプをIピクチャであると判別した場合であって、前記シーンチェンジ検出部がシーンチェンジが含まれていることを検出した場合には、前記第1のフィールド画像に適用するピクチャタイプとしてPピクチャを選択し、前記第2のフィールド画像に適用するピクチャタイプとしてIピクチャを選択するGOP構造決定部と、
    前記GOP構造決定部が選択したPピクチャ又はIピクチャを用いて、前記第1及び第2のフィールド画像を符号化する画像情報符号化部と、
    を備えることを特徴とする動画像符号化装置。
  2. 前記GOP構造決定部は、
    前記ピクチャタイプ判別部がピクチャタイプをIピクチャであると判別した場合であって、前記シーンチェンジ検出部がシーンチェンジが含まれていないことを検出した場合には、前記第1のフィールド画像に適用するピクチャタイプとしてIピクチャを選択し、前記第2のフィールド画像に適用するピクチャタイプとしてPピクチャを選択することを特徴とする請求項1に記載の動画像符号化装置。
  3. 前記GOP構造決定部は、
    前記第1のフィールド画像に適用するピクチャタイプを、第1のピクチャタイプとして記憶しておくとともに、前記第2のフィールド画像に適用するピクチャタイプを、第2のピクチャタイプとして記憶しておき、
    前記ピクチャタイプ判別部がピクチャタイプをIピクチャではないと判別した場合には、前記第1のフィールド画像に適用するピクチャタイプとして前記第1のピクチャタイプを選択し、前記第2のフィールド画像に適用するピクチャタイプとして前記第2のピクチャタイプを選択することを特徴とする請求項に記載の動画像符号化装置。
  4. コンピュータに、
    1枚の符号化されたフレーム画像を第1及び第2のフィールド画像に変換する第1のステップと、
    前記第1及び第2のフィールド画像間にシーンの切り替わり点であるシーンチェンジが含まれているか否かを検出する第2のステップと、
    前記フレーム画像のピクチャタイプを判別する第3のステップと、
    前記第3のステップでピクチャタイプをIピクチャであると判別した場合であって、前記第2のステップでシーンチェンジが含まれていることを検出した場合には、前記第1のフィールド画像に適用するピクチャタイプとしてPピクチャを選択し、前記第2のフィールド画像に適用するピクチャタイプとしてIピクチャを選択する第4のステップと、
    前記第4のステップで選択したPピクチャ又はIピクチャを用いて、前記第1及び第2のフィールド画像を符号化する第5のステップと、
    を実行させることを特徴とするプログラム。
  5. 1枚の符号化されたフレーム画像を第1及び第2のフィールド画像に変換するフレーム−フィールド変換過程と、
    前記第1及び第2のフィールド画像間にシーンの切り替わり点であるシーンチェンジが含まれているか否かを検出するシーンチェンジ検出過程と、
    前記フレーム画像のピクチャタイプを判別するピクチャタイプ判別過程と、
    前記ピクチャタイプ判別過程でピクチャタイプをIピクチャであると判別した場合であって、前記シーンチェンジ検出過程でシーンチェンジが含まれていることを検出した場合には、前記第1のフィールド画像に適用するピクチャタイプとしてPピクチャを選択し、前記第2のフィールド画像に適用するピクチャタイプとしてIピクチャを選択するGOP構造決定過程と、
    前記GOP構造決定過程で選択したPピクチャ又はIピクチャを用いて、前記第1及び第2のフィールド画像を符号化する画像情報符号化過程と、
    を有することを特徴とする動画像符号化方法。
JP2006275028A 2006-10-06 2006-10-06 動画像符号化装置、プログラム及び動画像符号化方法 Expired - Fee Related JP4846504B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006275028A JP4846504B2 (ja) 2006-10-06 2006-10-06 動画像符号化装置、プログラム及び動画像符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006275028A JP4846504B2 (ja) 2006-10-06 2006-10-06 動画像符号化装置、プログラム及び動画像符号化方法

Publications (2)

Publication Number Publication Date
JP2008098734A JP2008098734A (ja) 2008-04-24
JP4846504B2 true JP4846504B2 (ja) 2011-12-28

Family

ID=39381169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006275028A Expired - Fee Related JP4846504B2 (ja) 2006-10-06 2006-10-06 動画像符号化装置、プログラム及び動画像符号化方法

Country Status (1)

Country Link
JP (1) JP4846504B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2977104B2 (ja) * 1991-07-26 1999-11-10 ソニー株式会社 動画像データエンコード方法および装置、並びに動画像データデコード方法および装置
JP2565057B2 (ja) * 1992-06-30 1996-12-18 日本ビクター株式会社 フレ−ム間又はフィ−ルド間予測符号化方法
JPH09214977A (ja) * 1996-02-06 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> ビデオ符号化方法およびビデオ符号化装置
JP3778721B2 (ja) * 1999-03-18 2006-05-24 富士通株式会社 動画像符号化方法および装置
JP2000324499A (ja) * 1999-05-14 2000-11-24 Fujitsu Ltd 画像処理装置及びシーンチェンジ検出方法

Also Published As

Publication number Publication date
JP2008098734A (ja) 2008-04-24

Similar Documents

Publication Publication Date Title
US8325799B2 (en) Moving picture encoding method, device using the same, and computer program
US8184702B2 (en) Method for encoding/decoding a video sequence based on hierarchical B-picture using adaptively-adjusted GOP structure
US8780989B2 (en) Moving-picture coding device and moving-picture coding method
US20110292997A1 (en) Control of video encoding based on image capture parameters
JP4527677B2 (ja) 動画像符号化方法、動画像符号化装置、動画像符号化プログラム
KR100846512B1 (ko) 영상의 부호화, 복호화 방법 및 장치
JP4774315B2 (ja) 画像復号化装置及び画像復号化方法
US8090029B2 (en) Dynamic image encoding device and method
US8345761B2 (en) Motion vector detection apparatus and motion vector detection method
JP2012089905A (ja) 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法
US20120008685A1 (en) Image coding device and image coding method
US8228985B2 (en) Method and apparatus for encoding and decoding based on intra prediction
JP2007228519A (ja) 画像符号化装置及び画像符号化方法
JP2010258576A (ja) シーンチェンジ検出装置および映像記録装置
JP4846504B2 (ja) 動画像符号化装置、プログラム及び動画像符号化方法
WO2013125171A1 (ja) イントラ予測モード判定装置、方法、プログラム記憶媒体
JP2010050860A (ja) 画像表示装置、録画再生装置、及び画像処理方法
JP2004015351A (ja) 符号化装置及び方法、プログラム、記録媒体
US8179965B2 (en) Moving picture coding method
JP2009232324A (ja) 画像符号化装置、画像符号化方法および画像符号化プログラム
JP2014053831A (ja) 符号化装置
JP2008054182A (ja) 動画像予測符号化方法および装置
JP2008177834A (ja) 符号化装置、及びプログラム
JP5750191B2 (ja) 画像復号化方法
JP2022145499A (ja) 符号化装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090603

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110719

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111004

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111012

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees