JP2005318468A - 画面内予測符号化装置、その方法及びそのプログラム - Google Patents

画面内予測符号化装置、その方法及びそのプログラム Download PDF

Info

Publication number
JP2005318468A
JP2005318468A JP2004136609A JP2004136609A JP2005318468A JP 2005318468 A JP2005318468 A JP 2005318468A JP 2004136609 A JP2004136609 A JP 2004136609A JP 2004136609 A JP2004136609 A JP 2004136609A JP 2005318468 A JP2005318468 A JP 2005318468A
Authority
JP
Japan
Prior art keywords
prediction
block
error information
evaluation value
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004136609A
Other languages
English (en)
Other versions
JP4383240B2 (ja
Inventor
Shinichi Sakaida
慎一 境田
Kazuhisa Iguchi
和久 井口
Seiichi Goshi
清一 合志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2004136609A priority Critical patent/JP4383240B2/ja
Publication of JP2005318468A publication Critical patent/JP2005318468A/ja
Application granted granted Critical
Publication of JP4383240B2 publication Critical patent/JP4383240B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】 動画像の圧縮符号化において、イントラ画像の画面内予測に伴う、復号画像におけるフリッカの発生を抑え、画質の劣化を防止することを可能にした画面内予測符号化装置を提供する。
【解決手段】 画面内予測符号化装置1は、マクロブロックを複数の予測モードに基づいて予測し、画面内及び時間方向(画面間)の予測の度合いを予測評価値として算出するマクロブロック予測評価手段5と、マクロブロックを細分化したサブブロックを複数の予測モードに基づいて予測し、画面内及び時間方向(画面間)の予測の度合いを予測評価値として算出するサブブロック予測評価手段7と、各予測評価値に基づいて、画面をマクロブロック又はサブブロックのいずれの分割モードで分割するか、及び、どの予測モードを使用するかを決定する分割・予測モード決定手段10とを備えていることを特徴とする。
【選択図】 図1

Description

本発明は、動画像符号化技術に係り、より詳細には、動画像のイントラ画像(画面内符号化画像)の画面内予測に起因するフリッカ現象を抑制する画面内予測符号化装置、その方法及びそのプログラムに関する。
現在、動画像を圧縮符号化する方式としては、ISO/IEC JTC1/SC29/WG11(MPEG)で規格化されたMPEG−1、MPEG−2及びMPEG−4、ISO/IEC JTC1/SC29/WG1(JPEG)で規格化されたJPEG、ITU−Tで勧告化されたH.261及びH.263等がある(例えば、非特許文献1参照)。
これらの圧縮符号化方式では、動画像をブロックと呼ばれる特定の大きさの領域(例えば、16×16画素)に分割し、このブロックを単位として動き補償予測、変換処理(離散コサイン変換〔DCT:Discrete Cosine Transform〕等)を行い、さらに、高周波成分を大きく削減するように量子化を行い、可変長符号化を行うことで動画像の符号化を実現している。また、前記した圧縮符号化方式では、動き補償予測を行わないイントラ画像(画面内符号化画像)に対して、符号化対象となるブロックにおけるDCT等の変換係数を、当該ブロックに近接する他のブロックとの差分形式により予測符号化することで、符号化効率の向上を図っている。
また、動画像を圧縮符号化する他の方式として、ITU−TとISO/IEC JTC1/SC29/WG11で規格化されたH.264/MPEG−4 AVC(以下、H.264/AVCという)がある(非特許文献2参照)。
このH.264/AVCでは、動き補償予測を行わないイントラ画像において、当該画像(画面)の画素値を画面内で直接予測(画面内予測)することで符号化の効率を向上させている。すなわち、H.264/AVCでは、マクロブロックと呼ばれる16×16画素の領域(ブロック)を対象に、当該マクロブロックの上部あるいは左部にある、すでに符号化済みのマクロブロックにおける当該マクロブロックに近接した画素値を利用して、当該マクロブロックの画素値を複数の予測モードで予測し、当該マクロブロックの画素値と最も類似する予測モードを選択することで当該マクロブロックの画素値を予測している。
さらに、H.264/AVCでは、マクロブロックを4×4画素の大きさの領域(ブロック)に分割し、この4×4画素のブロック毎に画面内予測を行うモードを備えている。この場合、H.264/AVCは、4×4画素ブロックの上部、右上部、左部、左上部にある、すでに符号化済みのブロックにおける当該ブロックに近接した画素値を利用して、当該ブロックの画素値を複数の予測モードで予測し、当該ブロックの画素値と最も類似する予測モードを選択することで当該ブロックの画素値を予測している。そして、H.264/AVCは、16個の4×4画素ブロックの予測結果と、マクロブロック(16×16画素ブロック)の予測結果とから、当該マクロブロックに、より類似するものを選択することで当該マクロブロックの画素値を予測している。
なお、一般に、動き補償予測を行う圧縮符号化方式においては、時間的に前又は後の画像(画面)を参照して動き補償予測を行う画面間予測(インター予測)により符号化されるインター画像の間に、イントラ画像を挿入(例えば、数秒に一回程度)している。このとき、H.264/AVCは、動画像を低ビットレートで符号化する際に、インター画像における動きのほとんどない(ある一定量以下の)部分では、スキップモードと呼ばれる、前の画像をブロック単位でコピーするモードを多用することで、符号化効率を高めている。
これによって、H.264/AVCは、MPEG−1、MPEG−2、MPEG−4等の圧縮符号化方式に比べて、圧縮効率が格段に向上している。
「ISO/IEC 13818−2:2000 情報技術−映像及び関連オーディオ情報の共通符号化:ビデオ(Information technology-Generic coding of moving pictures and associated audio information : Video)」、2000年12月21日 「ISO/IEC 14496−10:2003 情報技術−オーディオ−ビジュアルオブジェクトの符号化−第10部:先進映像符号化(Information technology-Coding of audio-visual objects-Part10 : Advanced Video Coding)」、2003年11月27日
前記した圧縮符号化方式は、低ビットレートで動画像を符号化する際に、量子化を粗く行うことで、生成される符号化データの情報量を削減している。しかし、イントラ画像で画面内予測を行う場合、量子化対象となるのは、原マクロブロックと、予測されたマクロブロックとの画素値の差分である残差情報(予測誤差情報)であるため、あるマクロブロックが、時間的にほぼ同じ画素値の画像で連続している場合であっても、量子化を粗くすると、予測の仕方(予測モード)によっては、時間方向から見ると全く異なる量子化結果になってしまうことがある。したがって、従来の圧縮符号化方式によって、低ビットレートで圧縮符号化された動画像は、同一位置のマクロブロックであっても、異なる量子化結果に基づいて復号化されることで時間的に異なる画像となり、復号画像にちらつき(フリッカ)が発生し、画質が劣化してしまうという問題がある。
また、前記したH.264/AVCは、動画像中のイントラ画像を符号化する際に、あるマクロブロックが時間的にほぼ同じ画素値の画像で連続している場合であっても、当該マクロブロックに近接した他のマクロブロックの画素値が時間的に異なる場合に、当該マクロブロックの予測モードが時間的に異なってしまう場合がある。これによって、同じマクロブロック位置で、ほぼ同じ画素値の画像であるにもかかわらず、大きく異なる画素値として予測されることになり、符号化された動画像を復号化した場合に、フリッカが発生し、画質が劣化してしまうという問題がある。
このような問題は、動画像の全フレームをイントラ画像として画面内予測により符号化(イントラ符号化)する場合、すべてのフレーム(画像)でフリッカが発生する可能性がある。また、H.264/AVCにおいては、低ビットレートで動画像の圧縮符号化を行う際に、イントラ画像間のインター画像において動きのほとんどない部分では、スキップモードによって、時間的に前の画像のコピーが用いられる。このため、H.264/AVCは、次に挿入されているイントラ画像を符号化する際に、前記したように予測モードの違いと量子化により、前のイントラ画像と異なった画像として符号化されることがある。これによって、H.264/AVCでは、イントラ画像が挿入された短い周期で、フリッカが発生してしまう。
本発明は、以上のような問題点に鑑みてなされたものであり、動画像の圧縮符号化において、イントラ画像の画面内予測に伴う、復号画像におけるフリッカの発生を抑え、画質の劣化を防止することを可能にした画面内予測符号化装置、その方法及びそのプログラムを提供することを目的とする。
本発明は、前記目的を達成するために創案されたものであり、まず、請求項1に記載の画面内予測符号化装置は、動画像を構成する画面内の画素値を特定の大きさのブロックを単位として予測することで、前記画面を符号化する画面内予測符号化装置において、予測誤差情報生成手段と、時間差分情報生成手段と、予測評価値算出手段と、予測モード決定手段とを備える構成とした。
かかる構成によれば、画面内予測符号化装置は、予測誤差情報生成手段によって、符号化対象のブロックである符号化対象ブロックの画素値を、予め定めた複数の予測モードに基づいて予測し、原画像との差分をとることで、予測誤差となる予測誤差情報を生成する。この予測誤差情報は、符号化対象ブロックに近接するブロックの画素値や予測モードによって、大きく異なることがある。そこで、ここでは、1つの予測モードを特定せずに、複数の予測モードによって複数の予測誤差情報を生成する。
また、画面内予測符号化装置は、時間差分情報生成手段によって、予測誤差情報生成手段で生成された予測誤差情報を量子化及び局所復号化し、符号化対象ブロックと同一位置に存在した過去の局所復号画像との差分をとることで、時間方向の差分となる時間差分情報を生成する。すなわち、時間差分情報生成手段は、現時点における予測誤差情報を復号(局所復号化)することで、復号装置側で復号される復号画像(局所復号画像)を再生し、さらに過去(例えば、1フレーム前)に局所復号化した、画面上での同一位置となる復号画像と差分をとることで、時間方向でどれだけ誤差が発生しているかを検出することができる。この時間方向の誤差も、画面内の予測誤差と同様に、予測モードによって大きく異なることがある。そこで、ここでは、予測モード毎に、複数の時間差分情報を生成する。
そして、画面内予測符号化装置は、予測評価値算出手段によって、予測誤差情報と時間差分情報とから、予測モードにおける類似の度合いを示す予測評価値を算出する。この予測誤差情報と時間差分情報とのそれぞれの誤差が小さいほど、画面内及び時間方向(画面間)の予測がより正確であることを意味する。そこで、画面内予測符号化装置は、予測モード決定手段によって、予測評価値算出手段で算出された予測評価値に基づいて、符号化対象ブロックの予測モードを決定する。これによって、画面内予測符号化装置は、画面内及び時間方向の予測誤差が小さくなる予測モードによって、動画像の符号化を行うことができる。
また、請求項2に記載の画面内予測符号化装置は、動画像を構成する画面を特定の大きさに分割したブロックの画素値を、予め定めた複数の予測モードで予測し、その予測誤差に基づいて前記予測モードを決定することで、前記画面を符号化する画面内予測符号化装置であって、ブロック分割手段と、予測誤差情報生成手段と、時間差分情報生成手段と、予測評価値算出手段と、局所復号化手段と、予測モード決定手段と、符号化手段とを備える構成とした。
かかる構成によれば、画面内予測符号化装置は、ブロック分割手段によって、動画像を構成する画面を特定の大きさ(例えば、16×16画素)に分割したブロック単位に分割する。そして、画面内予測符号化装置は、予測誤差情報生成手段によって、符号化対象ブロックの画素値を、予め定めた複数の予測モードに基づいて予測し、原画像との差分をとることで、予測誤差となる予測誤差情報を生成する。なお、ここで符号化対象ブロックの画素値とは、ブロックを構成する複数の画素の画素値を意味している。
また、画面内予測符号化装置は、時間差分情報生成手段によって、予測誤差情報生成手段で生成された予測モード分の予測誤差情報を量子化及び局所復号化し、符号化対象ブロックと同一位置に存在した過去の局所復号画像との差分をとることで、時間方向の差分となる時間差分情報を生成する。そして、画面内予測符号化装置は、予測評価値算出手段によって、予測誤差情報と時間差分情報とから、予測モードにおける類似の度合いを示す予測評価値を算出する。この予測評価値は、予測誤差情報と時間差分情報とのそれぞれの誤差が小さいほど、画面内及び時間方向の予測がより正確であることを示す指標となる。
そして、画面内予測符号化装置は、局所復号化手段によって、予測誤差情報を量子化及び局所復号化することで、量子化データ及び局所復号画像を生成する。
さらに、画面内予測符号化装置は、予測モード決定手段によって、予測評価値算出手段で算出された予測評価値に基づいて、予測モードを決定する。これによって、画面内及び時間方向の予測誤差が小さくなる予測モードが決定される。
そして、画面内予測符号化装置は、符号化手段によって、予測モード決定手段で決定された予測モードに基づいて生成された量子化データを符号化し、符号化データを生成する。これによって、画面内予測符号化装置は、画面内及び時間方向の予測誤差が小さくなる予測モードをブロック単位に適宜決定し予測を行うことで、動画像の符号化を行うことができる。
さらに、請求項3に記載の画面内予測符号化装置は、請求項2に記載の画面内予測符号化装置において、予測評価値算出手段が、符号量算出手段を備え、この符号量算出手段で生成された符号量と、前記予測誤差情報及び前記時間差分情報とに基づいて、前記予測評価値を算出することを特徴とする。
かかる構成によれば、画面内予測符号化装置は、符号量算出手段によって、量子化データの符号量を算出する。そして、予測評価値算出手段が、その符号量と、予測誤差情報及び時間差分情報とに基づいて、予測評価値を算出する。これによって、予測評価値算出手段は、情報量(符号量)と誤差量(予測誤差情報及び時間差分情報)とのどちらの比率を多くして符号化するかを考慮した予測評価値を算出することができる。なお、この予測評価値は、情報量と誤差量とを引数とするコスト関数を予め定義しておくことで算出することができる。これによって、最も適した予測モードであっても、符号量が多くなるため、他の予測モードが採用されることになり、ビットレートに適した予測モードが選択されることになる。
また、請求項4に記載の画面内予測符号化装置は、請求項2又は請求項3に記載の画面内予測符号化装置において、前記予測モード決定手段が、復号画像比較手段と、量子化パラメータ変更手段とを備え、前記符号化対象ブロックの局所復号画像と、前記過去の局所復号画像とが、予め定めた範囲内で類似するまで、前記量子化パラメータの値を小さくすることを特徴とする。
かかる構成によれば、画面内予測符号化装置は、復号画像比較手段によって、局所復号化手段で生成された局所復号画像と、符号化対象ブロックと同一位置の画像である過去の局所復号画像とを比較する。これによって、復号画像比較手段は、時間方向の画面間のブロックにおける誤差を検出する。ここで検出された誤差が予め定めた閾値より大きい場合は、量子化パラメータ変更手段によって、時間差分情報生成手段及び局所復号化手段における、量子化の度合いを示す量子化パラメータを変更する。これによって、局所復号化手段において、符号量は増加するが、時間方向の画面間におけるブロックの誤差が小さくなる量子化データが生成されることになる。
さらに、請求項5に記載の画面内予測符号化装置は、請求項2乃至請求項4のいずれか一項に記載の画面内予測符号化装置において、サブブロック分割手段と、第二の予測誤差情報生成手段と、第二の時間差分情報生成手段と、第二の予測評価値算出手段とを備え、前記予測モード決定手段が、前記予測評価値及び前記サブブロック予測評価値に基づいて、前記ブロック又は前記サブブロックのいずれのブロックを符号化対象とするか、及び、どの予測モードを使用するかを決定することを特徴とする。
かかる構成によれば、画面内予測符号化装置は、サブブロック分割手段によって、符号化対象ブロックを、複数のサブブロック(例えば、4×4画素)に分割する。
そして、画面内予測符号化装置は、第二の予測誤差情報生成手段によって、サブブロック分割手段で分割されたサブブロックの画素値を、予め定めた複数の予測モードであるサブブロック予測モードに基づいて予測し、原画像のサブブロックとの差分をとることで、サブブロック予測モード分の予測誤差情報を生成する。
また、画面内予測符号化装置は、第二の時間差分情報生成手段によって、第二の予測誤差情報生成手段で生成されたサブブロック予測モード分の予測誤差情報を量子化及び局所復号化し、サブブロックと同一位置の過去の局所復号画像との差分をとることで、時間方向の差分となる時間差分情報を生成する。そして、画面内予測符号化装置は、第二の予測評価値算出手段によって、第二の予測誤差情報生成手段で生成された予測誤差情報と、第二の時間差分情報生成手段で生成された時間差分情報とから、サブブロック予測モードにおける類似の度合いを示すサブブロック予測評価値を算出する。この予測評価値は、予測誤差情報と時間差分情報とのそれぞれの誤差が小さいほど、画面内及び時間方向の予測がより正確であることを示す指標となる。
これによって、画面内予測符号化装置は、ブロック単位(例えば16×16画素単位)で複数の予測モードにより予測を行ったときの予測評価値と、サブブロック単位(例えば4×4画素単位)で複数の予測モードにより予測を行ったときの予測評価値とが算出され、どの分割モード(ブロック単位又はサブブロック単位)のどの予測モードで、予測を行ったときが、最も誤差が小さくなるかを判定することができる。
そこで、画面内予測符号化装置は、予測モード決定手段によって、予測評価値により分割モード及び予測モードを決定する。
また、請求項6に記載の画面内予測符号化装置は、請求項2乃至請求項5のいずれか一項に記載の画面内予測符号化装置において、第二の予測評価値算出手段が、第二の符号量算出手段を備え、この第二の符号量算出手段で生成された符号量と、前記サブブロック予測モード分の予測誤差情報及び時間差分情報とに基づいて、前記サブブロック予測評価値を算出することを特徴とする。
かかる構成によれば、画面内予測符号化装置は、第二の符号量算出手段によって、量子化データの符号量を算出する。そして、第二の予測評価値算出手段が、第二の符号量算出手段で生成された符号量と、サブブロック予測モード分の予測誤差情報及び時間差分情報とに基づいて、サブブロック予測評価値を算出する。これによって、第二の予測評価値算出手段は、情報量(符号量)と誤差量(予測誤差情報及び時間差分情報)とのどちらの比率を多くして符号化するかを考慮した予測評価値を算出することができる。なお、この予測評価値は、情報量と誤差量とを引数とするコスト関数を予め定義しておくことで算出することができる。これによって、最も適した予測モードであっても、符号量が多くなるため、他の予測モードが採用されることになり、ビットレートに適した予測モードが選択されることになる。
さらに、請求項7に記載の画面内予測符号化方法は、動画像を構成する画面内の画素値を特定の大きさのブロックを単位として予測することで、前記画面を符号化する画面内予測符号化方法において、予測誤差情報生成ステップと、時間差分情報生成ステップと、予測評価値算出ステップと、予測モード決定ステップとを含んでいることを特徴とする。
この手順によれば、画面内予測符号化方法は、予測誤差情報生成ステップによって、符号化対象ブロックの画素値を、予め定めた複数の予測モードに基づいて予測し、原画像との差分をとることで、予測誤差となる予測誤差情報を生成する。
続けて、画面内予測符号化方法は、時間差分情報生成ステップによって、予測誤差情報生成ステップで生成された予測誤差情報を量子化及び局所復号化し、符号化対象ブロックと同一位置に存在した過去の局所復号画像との差分をとることで、時間方向の差分となる時間差分情報を生成する。
そして、画面内予測符号化方法は、予測評価値算出ステップによって、予測誤差情報と時間差分情報とから、予測モードにおける類似の度合いを示す予測評価値を算出する。この予測誤差情報と時間差分情報とのそれぞれの誤差が小さいほど、画面内及び時間方向の予測がより正確であることを意味する。そこで、画面内予測符号化方法は、予測モード決定ステップによって、予測評価値算出ステップで算出された予測評価値に基づいて、符号化対象ブロックの予測モードを決定する。これによって、画面内予測符号化方法は、画面内及び時間方向の予測誤差が小さくなる予測モードによって、動画像の符号化を行うことができる。
また、請求項8に記載の画面内予測符号化プログラムは、動画像を構成する画面を特定の大きさに分割したブロックの画素値を、予め定めた複数の予測モードで予測し、その予測誤差に基づいて前記予測モードを決定することで、前記画面を符号化するために、コンピュータを、ブロック分割手段、予測誤差情報生成手段、時間差分情報生成手段、予測評価値算出手段、局所復号化手段、予測モード決定手段、符号化手段として機能させることを特徴とする。
かかる構成によれば、画面内予測符号化プログラムは、ブロック分割手段によって、動画像を構成する画面を特定の大きさに分割したブロック単位に分割する。そして、画面内予測符号化プログラムは、予測誤差情報生成手段によって、符号化対象ブロックの画素値を、予め定めた複数の予測モードに基づいて予測し、原画像との差分をとることで、予測誤差となる予測誤差情報を生成する。
また、画面内予測符号化プログラムは、時間差分情報生成手段によって、予測誤差情報生成手段で生成された予測モード分の予測誤差情報を量子化及び局所復号化し、符号化対象ブロックと同一位置に存在した過去の局所復号画像との差分をとることで、時間方向の差分となる時間差分情報を生成する。そして、画面内予測符号化プログラムは、予測評価値算出手段によって、予測誤差情報と時間差分情報とから、予測モードにおける類似の度合いを示す予測評価値を算出する。
そして、画面内予測符号化プログラムは、局所復号化手段によって、予測誤差情報を量子化及び局所復号化することで、量子化データ及び局所復号画像を生成する。
さらに、画面内予測符号化プログラムは、予測モード決定手段によって、予測評価値算出手段で算出された予測評価値に基づいて、予測モードを決定する。
そして、画面内予測符号化プログラムは、符号化手段によって、予測モード決定手段で決定された予測モードに基づいて生成された量子化データを符号化し、符号化データを生成する。
請求項1、請求項2、請求項7又は請求項8に記載の発明によれば、動画像を、画面内及び時間方向の予測誤差が小さくなる予測モードによって、ブロック単位で予測を行うことで、動画像の符号化を行うことができる。これによって、符号化された動画像を復号化した場合に、復号画像のフリッカの発生を抑えることができ、画質の劣化を抑えることができる。なお、本発明における符号化は、一般的な符号化規格(例えば、H.264/AVC等)の範囲内で符号化データを生成することができるため、一般的な復号装置によって、符号化データを復号することができる。
請求項3又は請求項6に記載の発明によれば、誤差量(予測誤差情報及び時間差分情報)と情報量(符号量)とのどちらを優先して符号化を行うかを、予め定めたコスト関数によって決めることができる。これによって、動画像の特徴(動きが少ない、同色が多い等)やビットレートにより予め定めたコスト関数によって、その符号量において最も適した予測モードを決定することができ、その符号量の範囲内で、復号画像のフリッカの発生を抑えることができる。
請求項4に記載の発明によれば、時間方向の画面間におけるブロックの差が予め定めた閾値より大きい場合に、量子化パラメータの値を小さくすることで、量子化を細かくすることができる。このように量子化を細かくすることで、動きの少ないブロックで予測結果が異なる場合に、ブロックをより原画像に忠実に符号化することができるため、時間方向の画面間におけるブロックの誤差を小さくことができる。これによって、復号画像のフリッカの発生を抑えることができ、画質の劣化を抑えることができる。
請求項5に記載の発明によれば、ブロックをさらに細分化したサブブロック単位で行うため、ブロック単位で行う複数の予測モードと、サブブロック単位で行う複数の予測モードとの中で、画面内及び時間方向の予測誤差が最も小さくなる予測モードによって、予測を行い、動画像の符号化を行うことができる。これによって、符号化された動画像を復号化した場合に、復号画像のフリッカの発生を抑えることができ、画質の劣化を抑えることができる。
以下、本発明の実施の形態について図面を参照して説明する。
[画面内予測符号化装置の構成]
まず、図1を参照して、本発明に係る画面内予測符号化装置の構成について説明する。図1は、画面内予測符号化装置の構成を示すブロック図である。
図1に示すように、画面内予測符号化装置1は、時系列に画面が連続した動画像データに対して、画面内の画素値を、特定の大きさのブロック単位で予測することで、画面毎に符号化を行い、符号化データを生成するものである。すなわち、画面内予測符号化装置1は、動き補償予測を行わないイントラ画像(画面内符号化画像)の符号化を行うものである。
この画面内予測符号化装置1は、画像(画面)を、マクロブロックと呼ばれる16×16画素のブロックと、マクロブロックを16分割した4×4画素のブロック(以下サブブロックと呼ぶ)とで、それぞれ独立して、複数の予測モードで画面内予測を行い、過去(例えば、1フレーム前)の画面における同一位置のブロックに最も類似した予測結果により、符号化データを生成する。ここでは、画面内予測符号化装置1は、マクロブロック分割手段2と、原画像蓄積手段3と、類似判定手段4と、マクロブロック予測評価手段5と、サブブロック分割手段6と、サブブロック予測評価手段7と、分割モード判定手段8と、量子化・局所復号化手段9と、分割・予測モード決定手段10と、復号画像蓄積手段11と、符号化手段12とを備えている。
マクロブロック分割手段(ブロック分割手段)2は、入力された動画像データを特定の大きさのブロック単位に分割するものである。ここで分割されたブロックは、逐次原画像蓄積手段3に蓄積されるとともに、類似判定手段4に出力される。ここではマクロブロック分割手段2は、動画像データをH.264/AVCの符号化規格に沿った16×16画素のマクロブロック単位に分割することとする。なお、ここで処理するブロックの大きさは、16×16(画素)の大きさ以外に、16×8、8×16、8×8、8×4等の他の符号化規格に沿った大きさであっても構わない。
原画像蓄積手段3は、マクロブロック分割手段2で分割されたマクロブロックを、蓄積するもので、一般的なハードディスク等の記憶装置である。この原画像蓄積手段3には、過去の画像(イントラ画像)を少なくとも1画像(1画面)分記憶しておく。
類似判定手段4は、マクロブロック分割手段2で分割されたマクロブロックと、原画像蓄積手段3に記憶されている、過去のイントラ画像における当該マクロブロックと画面内の位置が同一であるマクロブロックとが類似しているかどうかを判定するものである。この類似判定手段4によって、符号化対象のマクロブロックと過去のマクロブロックとを比較することで、動画像中で動きの少ないマクロブロックを検出する。これによって、動きが少なく、かつ、過去のマクロブロックとは異なる画素値として予測されるマクロブロックを、フリッカの発生要因となるマクロブロックの候補として検出することができる。
この類似判定手段4は、当該マクロブロックがフリッカの発生要因となるマクロブロックの候補であるかどうかを示す情報を、制御情報として、後記する分割・予測モード決定手段10に通知する。また、類似判定手段4に入力されたマクロブロックは、そのまま、マクロブロック予測評価手段5と、サブブロック分割手段6とに出力される。
なお、この類似判定手段4における判定の方法は、当該マクロブロックと過去のマクロブロックとで、それぞれマクロブロック内の全画素値の差分を計算し、その総和が予め定めた閾値以下となるマクロブロックが、動画像中で動きの少ないマクロブロックであると判定することにより行う。あるいは、当該マクロブロックと過去のマクロブロックとで、それぞれマクロブロック内の全画素値の平均値を計算し、その差が予め定めた閾値以下となるマクロブロックが、動画像中で動きの少ないマクロブロックであると判定することとしてもよい。
マクロブロック(16×16画素ブロック)予測評価手段5は、過去のマクロブロックで局所復号化されたマクロブロック復号画像から、複数の予測モードに基づいて符号化対象のマクロブロックの画素値を予測するとともに、その予測の類似の度合いを示す評価値を算出するものである。このマクロブロック予測評価手段5については、図2を参照して、詳細に説明する。図2は、画面内予測符号化装置のマクロブロック予測評価手段の構成を示すブロック図である。なお、装置全体の構成については、適宜図1を参照することとする。
図2に示すように、マクロブロック予測評価手段5は、予測誤差情報生成手段51と、時間差分情報生成手段52と、予測評価値算出手段53とを備えている。
予測誤差情報生成手段51は、符号化対象のマクロブロックの画素値を、符号化対象のマクロブロックに近接するマクロブロックから予測し、その予測した画素値と、符号化対象のマクロブロックの画素値との差を予測誤差情報として生成するものである。ここでは、予測誤差情報生成手段51は、マクロブロック予測画像生成手段51aとマクロブロック差分計算手段51bとを備えている。
マクロブロック予測画像生成手段51aは、符号化対象のマクロブロックに近接するマクロブロックから、符号化対象のマクロブロックの画素値を、予め定めた複数の予測モードに基づいて予測し、予測画像として生成するものである。ここで生成された予測画像は、マクロブロック差分計算手段51bと時間差分情報生成手段52とに出力される。
なお、このマクロブロック予測画像生成手段51aは、復号画像蓄積手段11に蓄積されているマクロブロック復号画像の中で、符号化対象のマクロブロックに近接する画像(近接復号画像)に基づいて、符号化対象のマクロブロックの画素値を予測する。ここでは、マクロブロック予測画像生成手段51aにおけるマクロブロックの予測を、H.264/AVCで規格化されている4種類の予測モードにより行うこととする。
ここで、図3を参照して、H.264/AVCで規格化されているマクロブロックの予測モード(イントラ16×16予測モード)について、その概略を説明する。図3は、イントラ16×16予測モードの各予測方法を説明するための説明図であって、(a)は垂直方向予測、(b)は水平方向予測、(c)はDC(直流)予測、(d)はプレーン(plane)予測の各予測方法を概念的に示したものである。
図3に示すように、イントラ16×16予測モードには、(a)〜(d)の4種類の予測モードがある。なお、「H」及び「V」は、符号化対象のマクロブロックに隣接する上部及び左部のマクロブロックの中で、符号化対象のマクロブロックに隣接する画素を示している。
図3(a)に示すように、垂直方向予測では、上部に隣接する画素「H」の値を垂直方向にそのまま使用することで、符号化対象のマクロブロックの画素値とする。なお、画素「H」が存在しない場合は、本予測モードは使用されない。
図3(b)に示すように、水平方向予測では、左部に隣接する画素「V」の値を水平方向にそのまま使用することで、符号化対象のマクロブロックの画素値とする。なお、画素「V」が存在しない場合は、本予測モードは使用されない。
図3(c)に示すように、DC(直流)予測では、上部及び左部に隣接する画素「H」及び画素「V」の値を加算し、平均化することで、符号化対象のマクロブロックの画素値とする。また、画素「H」及び画素「V」のいずれかが存在しない場合は、存在する画素「H」又は画素「V」のいずれか一方の値を平均化することで、符号化対象のマクロブロックの画素値とする。なお、画素「H」及び画素「V」の両方とも存在しない場合は、「128」を符号化対象のマクロブロックの画素値とする。
図3(d)に示すように、プレーン(plane)予測では、上部及び左部に隣接する画素「H」及び画素「V」から、平面的に符号化対象のマクロブロックの画素値を予測するものである。なお、画素「H」及び画素「V」のいずれかが存在しない場合は、本予測モードは使用されない。
なお、一般にマクロブロックは、輝度信号を示す16×16画素ブロックと、色差信号を示す2つの8×8画素ブロックとで構成されている。この色差信号を示す8×8画素ブロックは、イントラ16×16予測モードと同様の予測が行われる。
図2(適宜図1参照)に戻って、マクロブロック予測評価手段5の説明を続ける。
マクロブロック差分算出手段51bは、マクロブロック予測画像生成手段51aで生成された予測画像と、類似判定手段4から出力されるマクロブロックの中で、符号化対象ブロックである原画像(原画像ブロック)との差分をとることで、予測モード分の予測誤差情報を算出するものである。ここで算出された予測モード分の予測誤差情報は、時間差分情報生成手段52と、予測評価値算出手段53と、分割モード判定手段8とに出力される。
時間差分情報生成手段52は、予測誤差情報生成手段51で生成された予測モード分の予測誤差情報を復号化し、過去の同一位置の復号画像との差分をとることで、符号化対象のマクロブロックにおける時間方向の差分を時間差分情報として予測モード分生成するものである。ここでは、時間差分情報生成手段52は、変換手段52aと、量子化手段52bと、逆量子化手段52cと、逆変換手段52dと、再構成手段52eと、差分計算手段52fとを備えている。
変換手段52aは、予測誤差情報生成手段51で生成された予測誤差情報を周波数領域の情報である変換係数に変換するものである。ここで変換された変換係数は、量子化手段52bに出力される。この変換手段52aで行われる周波数変換には、例えば、MPEG−1、MPEG−2、MPEG4、H.263等で用いられている離散コサイン変換(DCT)や、H.264/AVCで用いられている変換手法を用いることができる。なお、H.264/AVCで用いられている周波数変換は、離散コサイン変換の浮動小数点計算を整数化(又は小数化)したものである。
量子化手段52bは、変換手段52aで生成された変換係数を量子化して、量子化変換係数を生成するものである。この量子化手段52bは、視覚感度の低い高周波成分を大きく削減するように、外部から入力される量子化の度合いを示す量子化パラメータQpに基づいて量子化を行う。この量子化パラメータQpの値が大きいほど、変換係数は粗く量子化されることになる。ここで生成された量子化変換係数は、逆量子化手段52cと予測評価値算出手段53とに出力される。
なお、この量子化手段52bは、後記する分割・予測モード決定手段10から通知される量子化制御情報Qcに基づいて、同一の変換係数を複数の量子化パラメータで段階的に量子化する。すなわち、量子化手段52bは、量子化パラメータの値を1段階(あるいはそれ以上)小さくする旨の指示を量子化制御情報Qcとして通知される毎に、同一の変換係数をその小さくした量子化パラメータで量子化し、順次逆量子化手段52cと予測評価値算出手段53とに出力する。
逆量子化手段52cは、量子化手段52bで生成された量子化変換係数に対して、量子化手段52bで行った量子化の逆量子化を行うことで、量子化変換係数を逆量子化変換係数に変換するものである。ここで変換された逆量子化変換係数は、逆変換手段52dに出力される。
逆変換手段52dは、逆量子化手段52cで変換された逆量子化変換係数に対して、変換手段52aで行った変換の逆変換を行うものである。この逆変換手段52dで逆変換されて生成された情報は、予測誤差情報生成手段51で生成された予測誤差情報が復元された情報(予測誤差復号情報)となる。ただし、量子化の度合いによっては、予測誤差情報と予測誤差復号情報とは異なっている。ここで生成された予測誤差復号情報は、再構成手段52eに出力される。
再構成手段52eは、逆変換手段52dで生成された予測誤差復号情報と、マクロブロック予測画像生成手段51aで生成された予測画像とを加算することで、局所復号画像を生成するものである。この再構成手段52eで生成された局所復号画像は、当該マクロブロックが、復号装置側で復号される際の画像を再現したものとなる。ここで生成された局所復号画像は、差分計算手段52fに出力される。
差分計算手段52fは、再構成手段52eで生成された局所復号画像と、復号画像蓄積手段11に蓄積されている、過去(例えば1フレーム前)に局所復号化された同一位置の局所復号画像(マクロブロック復号画像)との差分をとることで、マクロブロック毎の時間方向の差分を示す時間差分情報を生成するものである。ここで生成された時間差分情報は、予測モード毎に順次予測評価値算出手段53に出力される。
なお、この差分計算手段52fは、マクロブロック単位に、平均値の差分をとることで、時間差分情報を生成する。あるいは、マクロブロックにおける全画素の差分の和を時間差分情報としてもよい。なお、この時間差分情報は、その差分が小さいほど、時間方向の画像の変化が少なく、復号画像におけるフリッカが目立たないことを意味する。すなわち、この時間差分情報は、フリッカを抑えるための指標として用いることができる。
予測評価値算出手段53は、予測誤差情報生成手段51で生成された、予測モード(4種類)毎の予測誤差情報と、時間差分情報生成手段52で生成された時間差分情報とに基づいて、予測の類似の度合いを示す予測評価値を算出するものである。なお、予測評価値算出手段53は、H.264/AVCで使用されるレート歪み(RD:Rate Distortion)最適化モード決定方法により、動画像データをマクロブロック単位で分割した際の予測評価値を、予め定めたコスト関数によって算出することとする。また、ここでは、予測評価値算出手段53は、マクロブロックに分割したことによる予測評価値(分割モード評価値)と、4種類の予測モード(図3参照)で予測したことによる予測評価値(予測モード評価値)とをそれぞれ算出する。
ここでは、予測評価値算出手段53は、符号量算出手段53aと、分割モード評価値算出手段53bと、予測モード評価値算出手段53cとを備えている。
符号量算出手段53aは、時間差分情報生成手段52の量子化手段52bで量子化された量子化変換係数を符号化することで、予測誤差情報生成手段51で生成される予測誤差情報を符号化データとする際の符号量を算出するものである。ここで算出された符号量は、分割モード評価値算出手段53bに出力される。
分割モード評価値算出手段53bは、動画像データをマクロブロック単位で分割したことによる予測評価値(分割モード評価値)を算出するものである。ここで算出された分割モード評価値は、分割モード判定手段8に出力され、動画像データをマクロブロック単位又はサブブロック単位の、いずれの分割モードで分割するのが適切かを判定するために使用される。
レート歪み最適化モード決定方法では、分割モード評価値を算出するコスト関数Cとして、情報量(R:Rate)と誤差量(D:Distortion)とを、線形和である以下の(1)式で算出することとしている。
C=D+λR (λは係数) …(1)
そこで、分割モード評価値算出手段53bは、誤差量Dとして、予測誤差情報と時間差分情報との線形和を用い、情報量Rとして、符号量算出手段53aで算出された符号量を用いることで、分割モード評価値を算出する。
また、H.264/AVCでは、コスト関数Cの係数λを、以下の(2)式に示すように、量子化パラメータ(Qp)の関数として定義しているため、ここでは、分割モード評価値算出手段53bは、外部から量子化パラメータQpを入力することとする。
λ=0.85×2Qp/3 …(2)
なお、この分割モード評価値算出手段53bでは、レート歪み最適化モード決定方法により、分割モード評価値を算出したが、レート歪みの最適化を行わずに、以下の(3)式に示すように、誤差量D(予測誤差情報及び時間差分情報)のみで分割モード評価値を算出することとしてもよい。この場合、予測評価値算出手段53から符号量算出手段53aを省くことができる。ここで、λは前記(2)式と同じものである。
C=D+6×λ (λは係数) …(3)
予測モード評価値算出手段53cは、マクロブロックを4種類の予測モード毎で予測した際の予測評価値(予測モード評価値)を算出するものである。なお、この予測モード評価値算出手段53cは、予測誤差情報と時間差分情報との線形和を、4種類の予測モード毎に計算し、その値が最も小さくなる値を予測モード評価値とする。ここで算出された予測モード評価値は、分割モード判定手段8に出力され、後記する分割・予測モード決定手段10において、どの予測モードで予測するのが適切かを判定するために使用される。
図1に戻って、画面内予測符号化装置1の全体構成の説明を続ける。
サブブロック分割手段6は、符号化対象となるマクロブロックを、さらに細分化したブロック(サブブロック)に分割するものである。ここでは、サブブロック分割手段6は、類似判定手段4から出力される16×16画素のマクロブロックを4×4画素の16個のブロックに分割する。ここで分割された4×4画素のブロック(サブブロック)は、サブブロック予測評価手段7にサブブロック単位で出力される。
サブブロック(4×4画素ブロック)予測評価手段7は、過去のマクロブロックで局所復号化されたマクロブロック復号画像(サブブロック復号画像の集合)から、複数の予測モードで対象となるサブブロックを予測するとともに、その予測の類似の度合いを示す評価値を算出するものである。このサブブロック予測評価手段7については、図4を参照して、詳細に説明する。図4は、画面内予測符号化装置のサブブロック予測評価手段の構成を示すブロック図である。なお、装置全体の構成については、適宜図1を参照することとする。
図4に示すように、サブブロック予測評価手段7は、予測誤差情報生成手段71と、時間差分情報生成手段72と、予測評価値算出手段73とを備えている。
予測誤差情報生成手段(第二の予測誤差情報生成手段)71は、符号化対象のサブブロックの画素値を、符号化対象のサブブロックに近接するサブブロックから予測し、その予測した画素値と、符号化対象のサブブロックの画素値との差を予測誤差情報として生成するものである。ここでは、予測誤差情報生成手段71は、サブブロック予測画像生成手段71aとサブブロック差分計算手段71bとを備えている。
サブブロック予測画像生成手段71aは、符号化対象のサブブロックに近接するサブブロックから、符号化対象のサブブロックの画素値を、予め定めた複数の予測モード(サブブロック予測モード)に基づいて予測し、予測画像として生成するものである。ここで生成された予測画像は、サブブロック差分計算手段71bと時間差分情報生成手段72とに出力される。
なお、このサブブロック予測画像生成手段71aは、復号画像蓄積手段11に蓄積されているマクロブロック復号画像(サブブロック復号画像の集合)の中で、符号化対象のサブブロックに近接する画像(近接復号画像)に基づいて、符号化対象のサブブロックの画素値を予測する。ここでは、サブブロック予測画像生成手段71aにおけるサブブロックの予測を、H.264/AVCで規格化されている9種類の予測モードにより行うこととする。
ここで、図5を参照して、H.264/AVCで規格化されている4×4画素ブロック(サブブロック)の予測モード(イントラ4×4予測モード)について、その概略を説明する。図5は、イントラ4×4予測モードの予測方法を説明するための説明図であって、(a)は垂直方向予測、(b)は水平方向予測、(c)はDC(直流)予測、(d)は対角左下方向予測、(e)は対角右下方向予測、(f)垂直右方向予測、(g)は水平下方向予測、(h)は垂直左方向予測、(i)は水平上方向予測の各予測方法を概念的に示したものである。
図5に示すように、イントラ4×4予測モードには、(a)〜(i)の9種類の予測モードがある。なお、「A」〜「M」は、サブブロックに隣接する上部、左部、左上部及び右上部のサブブロックの画素を示している。
図5(a)に示すように、垂直方向予測では、上部に隣接する画素「A」、「B」、「C」及び「D」の値を垂直方向にそのまま使用することで、符号化対象のサブブロックの画素値とする。なお、画素「A」、「B」、「C」及び「D」が存在しない場合は、本予測モードは使用されない。
図5(b)に示すように、水平方向予測では、左部に隣接する画素「I」、「J」、「K」及び「L」の値を水平方向にそのまま使用することで、符号化対象のサブブロックの画素値とする。なお、画素「I」、「J」、「K」及び「L」が存在しない場合は、本予測モードは使用されない。
図5(c)に示すように、DC(直流)予測では、上部及び左部に隣接する画素「A」、「B」、「C」、「D」、「I」、「J」、「K」及び「L」の値を加算し、平均化することで、符号化対象のサブブロックの画素値とする。また、上部及び左部の画素のいずれかが存在しない場合は、存在する上部又は左部の画素のいずれか一方の値を平均化することで、符号化対象のサブブロックの画素値とする。なお、上部及び左部の画素が両方とも存在しない場合は、「128」を符号化対象のサブブロックの画素値とする。
図5(d)に示すように、対角左下方向予測では、予測する画素の対角右上方向に存在する画素「A」〜「H」に基づいて該当する画素値を決定する。例えば、サブブロックにおける最右上画素(図中○印)の値は、以下の(4)式によって決定する。
{(Dの画素値)+2×(Eの画素値)+(Fの画素値)+2}/4 …(4)
なお、ここで“+2”は、“4”で除算を行う際の四捨五入を行うための値である。
図5(e)に示すように、対角右下方向予測では、予測する画素の対角左上方向に存在する画素「A」〜「D」、「L」〜「M」に基づいて、該当する画素値を決定する。例えば、符号化対象のサブブロックにおける最左上画素(図中○印)の値は、以下の(5)式によって決定する。
{(Aの画素値)+2×(Mの画素値)+(Iの画素値)+2}/4 …(5)
図5(f)に示すように、垂直右方向予測では、予測する画素の垂直左上方向に存在する画素「A」〜「D」、「L」〜「M」に基づいて、該当する画素値を決定する。例えば、符号化対象のサブブロックにおける最左上画素(図中○印)の値は、以下の(6)式によって決定する。
{(Mの画素値)+(Aの画素値)+1}/2 …(6)
なお、ここで“+1”は、“2”で除算を行う際の四捨五入を行うための値である。
また、例えば、符号化対象のサブブロックにおける最左上画素(図中○印)直下の画素(図中◎印)の値は、以下の(7)式によって決定する。
{(Iの画素値)+2×(Mの画素値)+(Aの画素値)+2}/4 …(7)
図5(g)に示すように、水平下方向予測では、予測する画素の水平左上方向に存在する画素「A」〜「D」、「I」〜「M」に基づいて、該当する画素値を決定する。例えば、符号化対象のサブブロックにおける最左上画素(図中○印)の値は、以下の(8)式によって決定する。
{(Mの画素値)+(Iの画素値)+1}/2 …(8)
また、例えば、符号化対象のサブブロックにおける最左上画素(図中○印)の右側画素(図中◎印)の値は、以下の(9)式によって決定する。
{(Iの画素値)+2×(Mの画素値)+(Aの画素値)+2}/4 …(9)
図5(h)に示すように、垂直左方向予測では、予測する画素の垂直右上方向に存在する画素「A」〜「F」に基づいて、該当する画素値を決定する。例えば、符号化対象のサブブロックにおける最左上画素(図中○印)の値は、以下の(10)式によって決定する。
{(Aの画素値)+(Bの画素値)+1}/2 …(10)
また、例えば、符号化対象のサブブロックにおける最左上画素(図中○印)直下の画素(図中◎印)の値は、以下の(11)式によって決定する。
{(Aの画素値)+2×(Bの画素値)+(Cの画素値)+2}/4 …(11)
図5(i)に示すように、水平上方向予測では、予測する画素の水平右下方向に存在する画素「I」〜「L」に基づいて、該当する画素値を決定する。例えば、符号化対象のサブブロックにおける最左上画素(図中○印)の値は、以下の(12)式によって決定する。
{(Iの画素値)+(Jの画素値)+1}/2 …(12)
また、例えば、符号化対象のサブブロックにおける最左上画素(図中○印)の右側画素(図中◎印)の値は、以下の(13)式によって決定する。
{(Iの画素値)+2×(Jの画素値)+(Kの画素値)+2}/4 …(13)
なお、図中×印の画素の値は、画素Lの値とする。
この図5中、(d)〜(i)の予測モードでは、画素「A」〜「D」、「I」〜「M」がすべて存在する場合にのみ使用される。
図4(適宜図1参照)に戻って、サブブロック予測評価手段7の説明を続ける。
サブブロック差分計算手段71bは、サブブロック予測画像生成手段71aで生成された予測画像と、サブブロック分割手段6で分割されたサブブロック(原画像ブロック)との差分をとることで、予測誤差情報を算出するものである。ここで算出された予測誤差情報は、時間差分情報生成手段72と、予測評価値算出手段73と、分割モード判定手段8とに出力される。
時間差分情報生成手段(第二の時間差分情報生成手段)72は、予測誤差情報生成手段71で生成された予測モード分の予測誤差情報を復号化し、過去の同一位置の復号画像との差分をとることで、符号化対象のサブブロックにおける時間方向の差分を時間差分情報として予測モード分生成するものである。ここでは、時間差分情報生成手段72は、変換手段72aと、量子化手段72bと、逆量子化手段72cと、逆変換手段72dと、再構成手段72eと、差分計算手段72fとを備えている。
なお、この時間差分情報生成手段72の構成は、図2で説明した時間差分情報生成手段52の構成と同様で、扱うブロックが、16×16画素ブロック(マクロブロック)から、4×4画素ブロック(サブブロック)となり、ブロックの大きさが異なっているのみである。そこで、ここでは、時間差分情報生成手段72の詳細な説明を省略することとする。
予測評価値算出手段(第二の予測評価値算出手段)73は、予測誤差情報生成手段71で生成された、予測モード(9種類)毎の予測誤差情報と、時間差分情報生成手段72で生成された時間差分情報とに基づいて、予測の類似の度合いを示す予測評価値を算出するものである。なお、この予測評価値算出手段73においても、前記したレート歪み最適化モード決定方法により、マクロブロックをサブブロック単位で分割した際の予測評価値(分割モード評価値及び予測モード評価値)を、予め定めたコスト関数によって算出することとする。
ここでは、予測評価値算出手段73は、符号量算出手段73aと、分割・予測モード評価値算出手段73bとを備えている。
符号量算出手段73aは、時間差分情報生成手段72の量子化手段72bで量子化された量子化変換係数を符号化することで、予測誤差情報生成手段71で生成される予測誤差情報を符号化データとする際の符号量を算出するものである。ここで算出された符号量は、分割・予測モード評価値算出手段73bに出力される。
分割・予測モード評価値算出手段73bは、マクロブロックをさらに細分化したサブブロック単位で予測を行ったことによる予測評価値を算出するものである。ここでは、分割・予測モード評価値算出手段73bは、分割モード評価値と予測モード評価値とを、レート歪み最適化モード決定方法で定められている同一のコスト関数を用いて算出することとする。なお、ここでは、コスト関数として、前記(1)式のコスト関数を用いることとする。
なお、この予測評価値算出手段73では、レート最適化モード決定方法により、予測評価値を算出したが、レート歪みの最適化を行わずに、誤差量(予測誤差情報及び時間差分情報)のみで予測モード評価値を算出することとしてもよい。
例えば、レート歪みを考慮しない分割モード評価値を算出するコスト関数Cとして、以下の(14)式を用いる。ここで、誤差量Dは予測誤差情報と時間差分情報との線形和とし、λは前記(2)式と同じ量子化パラメータの関数値とする。
C=D+6×λ (λは係数) …(14)
また、レート歪みを考慮しない予測モード評価値を算出するコスト関数Cとして、以下の(15)式を用いる。ここで、誤差量Dは予測誤差情報と時間差分情報との線形和とし、MPM(Most Probable Mode)は、マクロブロック内で当該予測モードが最も多く使用されている場合は“0”、それ以外は“4×λ”とする。
C=D+MPM …(15)
なお、レート歪みの最適化を行わない場合は、予測評価値算出手段73から符号量算出手段73aを省くことができる。
図1に戻って、画面内予測符号化装置1の全体構成の説明を続ける。
分割モード判定手段8は、マクロブロック予測評価手段5から出力される分割モード評価値と、サブブロック予測評価手段7から出力される分割モード評価値とに基づいて、以降の処理で、マクロブロックを使用するか、マクロブロックをさらに細分化したサブブロックを使用するかを判定するものである。
ここでは、分割モード判定手段8は、分割モード評価値が小さいブロックを、以降の処理で使用すると判定し、そのブロックがマクロブロックであるかサブブロックであるかを示す分割モードと、その分割モードにおける予測モード評価値及び予測誤差情報とを、量子化・局所復号化手段9に出力する。
量子化・局所復号化手段(局所復号化手段)9は、分割モード判定手段8で判定された分割モードで示されるブロック単位で、分割モード判定手段8から出力される予測誤差情報を量子化及び局所復号化することで、量子化データ及び局所復号画像を生成するものである。なお、量子化・局所復号化手段9は、予測誤差情報を周波数領域の情報に変換した変換係数を生成し、その変換係数を、外部から入力される量子化パラメータQpに基づいて量子化する。そして、量子化・局所復号化手段9は、その量子化結果である量子化変換係数(量子化データ)を逆量子化し、さらに逆変換することで、予測誤差情報を復号し、復号手段蓄積手段11に蓄積されている過去の同一位置マクロブロック復号信号と加算することで、局所復号化された画像(局所復号画像)を生成(再構成)する。ここで生成された量子化データ及び局所復号画像は、分割・予測モード決定手段10に出力される。
また、ここで説明した変換処理、量子化処理、逆量子化処理、逆変換処理及び再構成処理は、図2に示した変換手段52a、量子化手段52b、逆量子化手段52c、逆変換手段52d及び再構成手段52eと同様の構成とすることで、処理することができる。
なお、量子化・局所復号化手段9は、変換係数を量子化する際に、量子化制御情報Qcが通知された場合は、順次量子化パラメータの値を小さくして、変換係数の量子化を行う。これによって、量子化・局所復号化手段9は、初期の量子化パラメータで量子化した場合よりも情報量を多くした量子化データと局所復号画像とを順次生成する。
分割・予測モード決定手段(予測モード決定手段)10は、量子化・局所復号化手段9から出力される局所復号画像を、過去のすでに復号化されている画像(マクロブロック復号画像)と比較することで、当該局所復号画像を生成する際に用いた分割モード及び予測モードが適切であるかどうかを判定し、最終的な分割モード及び予測モードを決定するものである。ここでは、分割・予測モード決定手段10は、復号画像比較手段10aと、量子化パラメータ変更手段10bとを備えている。
復号画像比較手段10aは、量子化・局所復号化手段9から出力される局所復号画像と、復号画像蓄積手段11に蓄積されている、過去に復号化されている当該局所復号画像と同一位置のマクロブロック復号画像とを比較するものである。
この復号画像比較手段10aは、局所復号画像とマクロブロック復号画像との差が予め定めた閾値以下の場合は、当該局所復号画像を生成した際に用いた分割モード及び予測モードが適切である(誤差が少ない)と判定し、当該分割モード及び予測モードを最終的なモードとして決定する。そして、復号画像比較手段10aは、ここで決定した分割モード及び予測モードと、このモードで生成された量子化データとを、符号化手段12に出力する。また、復号画像比較手段10aは、このときの局所復号画像(マクロブロック復号画像)を、後に続くマクロブロックの参照用に、復号画像蓄積手段11に蓄積する。
一方、復号画像比較手段10aは、局所復号画像とマクロブロック復号画像との差が予め定めた閾値より大きい場合は、量子化パラメータを変更する旨を量子化パラメータ変更手段10bに通知する。
量子化パラメータ変更手段10bは、復号画像比較手段10aから量子化パラメータを変更する旨の通知があったときに、量子化を行う各手段に対して、量子化パラメータを小さくして動作を実行する旨の指示を示す量子化制御情報Qcを通知するものである。例えば、量子化パラメータ変更手段10bは、量子化パラメータの値を1段階下げる旨の指示を、マクロブロック予測評価手段5、サブブロック予測評価手段7及び量子化・局所復号化手段9に出力し、それぞれ1段階下げた量子化パラメータを用いて動作させることで、量子化・局所復号化手段9から出力される量子化データの情報量は増大するが、原画像に類似した画像が生成されることになる。
なお、この処理によっても、復号画像比較手段10aにおいて、局所復号画像とマクロブロック復号画像との差が閾値以下にならない場合は、さらに、量子化パラメータを変更する旨が、量子化パラメータ変更手段10bに通知され、順次量子化パラメータを小さくして動作が繰り返し実行される。
このように、分割・予測モード決定手段10は、局所復号画像と過去のマクロブロック復号画像とが類似した分割モード及び予測モードを決定することができるので、低ビットレートで動画像データを符号化する際でも、イントラ画像間の差を小さくすることができる。
なお、分割・予測モード決定手段10は、類似判定手段4から、処理対象となっているマクロブロックが、フリッカの発生要因となるマクロブロックの候補でない旨を制御情報として通知された場合は、入力された分割モード及び予測モードと、量子化データとをそのまま符号化手段12に出力する。
復号画像蓄積手段11は、分割・予測モード決定手段10で決定された分割モード及び予測モードにより生成された局所復号画像(マクロブロック復号画像)を蓄積するもので、例えば、ハードディスク等の記憶装置である。この復号画像蓄積手段11に蓄積されたマクロブロック復号画像は、マクロブロック予測評価手段5、サブブロック予測評価手段7、量子化・局所復号化手段9及び分割・予測モード決定手段10によって参照される。
符号化手段12は、分割・予測モード決定手段10から出力される分割モード及び予測モードのそれぞれの値と量子化データとを、エントロピ符号化して多重化することで、動画像データを符号化した符号化データを生成するものである。
このように画面内予測符号化装置1を構成することで、複数の分割モード及び予測モードによって予測された各ブロックによって、過去のマクロブロック復号画像に最も類似する分割モード及び予測モードを用いた符号化データを生成することができる。これによって、符号化データを復号する際の、フリッカによる画質の劣化を低減させることが可能になる。
なお、画面内予測符号化装置1は、各手段を機能プログラムとして実現することも可能であり、各機能プログラムを結合して画面内予測符号化プログラムとして動作させることも可能である。この画面内予測符号化プログラムは、通信回線を介して配布することも可能であるし、CD−ROM等の記録媒体に書き込んで配布することも可能である。
[画面内予測符号化装置の動作]
次に、図6乃至図8を参照(適宜図1参照)して、本発明に係る画面内予測符号化装置の動作について説明する。図6は、画面内予測符号化装置の動作を示すフローチャートである。図7は、画面内予測符号化装置のマクロブロック予測評価手段の動作を示すフローチャートである。図8は、画面内予測符号化装置のサブブロック予測評価手段の動作を示すフローチャートである。
(ブロック分割ステップ)
まず、画面内予測符号化装置1は、マクロブロック分割手段2によって、動画像(動画像データ)を特定の大きさのブロック(マクロブロック)単位に分割する(ステップS1)。ここでは、マクロブロック分割手段2は、動画像データを16×16画素ブロックに分割し、原画像蓄積手段3に逐次蓄積する。
そして、画面内予測符号化装置1は、類似判定手段4によって、分割されたマクロブロックと、原画像蓄積手段3に蓄積されている過去の同一位置のマクロブロックとを比較する(ステップS2)。ここで、分割されたマクロブロックと過去の同一位置のマクロブロックとが類似する場合は、当該マクロブロックが、フリッカの発生要因となるマクロブロックの候補であると判定することができる。なお、このステップS2における比較結果は、後記するステップS8で利用される。
(マクロブロック予測評価ステップ)
そして、画面内予測符号化装置1は、マクロブロック予測評価手段5によって、動画像データをマクロブロック単位に分割し、マクロブロック単位で画素値の予測を行った際の評価値を算出する(ステップS3:マクロブロック予測評価処理)。
ここで、図7を参照(適宜2参照)して、マクロブロック予測評価手段5の動作について詳細に説明する。
(予測誤差情報生成ステップ)
まず、マクロブロック予測評価手段5は、予測誤差情報生成手段51のマクロブロック予測画像生成手段51aによって、符号化対象となるマクロブロックに近接し、復号画像蓄積手段11に蓄積されている過去のマクロブロック復号画像から、当該符号化対象マクロブロックの画素値を複数の予測モード(ここでは、4種類の予測モード:図3参照)で予測することで、予測画像を生成する。そして、マクロブロック予測評価手段5は、その予測画像と、原画像との差分をとることで、予測モード分の予測誤差情報を生成する(ステップS31)。
(時間差分情報生成ステップ)
さらに、マクロブロック予測評価手段5は、時間差分情報生成手段52によって、ステップS31で生成された予測誤差情報を、変換し、量子化し、復号化した後に、過去の同一位置の復号画像との差分をとることで、符号化対象のマクロブロックにおける時間方向の差分を時間差分情報として生成する(ステップS32)。
(予測評価値算出ステップ)
そして、マクロブロック予測評価手段5は、符号量算出手段53aによって、ステップS32の量子化時に生成される量子化変換係数を符号化することで、符号量を算出する(ステップS33)。
さらに、マクロブロック予測評価手段5は、分割モード評価値算出手段53bによって、ステップS31で生成された予測誤差情報と、ステップS32で生成された時間差分情報と、ステップS33で算出された符号量とから、予め定めたコスト関数(前記(1)式)により、分割モード評価値を算出する(ステップS34)。
また、マクロブロック予測評価手段5は、予測モード評価値算出手段53cによって、ステップS31で生成された予測誤差情報と、ステップS32で生成された時間差分情報との線形和を、4種類の予測モード(図3参照)毎に計算し、その値が最も小さくなる値を、予測モード評価値として算出する(ステップS35)。
図6(適宜図1参照)に戻って、全体動作について説明を続ける。
(サブブロック分割ステップ)
画面内予測符号化装置1は、サブブロック分割手段6によって、マクロブロック分割手段2で分割されたマクロブロックを、さらに細分化したサブブロック(ここでは、4×4画素ブロック)に分割する(ステップS4)。
(サブブロック予測評価ステップ)
そして、画面内予測符号化装置1は、サブブロック予測評価手段7によって、マクロブロックをサブブロック単位に分割し、サブブロック単位で画素値の予測を行った際の評価値を算出する(ステップS5:サブブロック予測評価処理)。
ここで、図8を参照(適宜図4参照)して、サブブロック予測評価手段7の動作について詳細に説明する。
(予測誤差情報生成ステップ)
まず、サブブロック予測評価手段7は、予測誤差情報生成手段71のサブブロック予測画像生成手段71aによって、符号化対象となるサブブロックに近接し、復号画像蓄積手段11に蓄積されている過去の復号画像から、当該符号化対象サブブロックの画素値を複数の予測モード(ここでは、9種類の予測モード:図5参照)で予測することで、予測画像を生成する。そして、サブブロック予測評価手段7は、その予測画像と、原画像との差分をとることで、予測モード分の予測誤差情報を生成する(ステップS51)。
(時間差分情報生成ステップ)
さらに、サブブロック予測評価手段7は、時間差分情報生成手段72によって、ステップS51で生成された予測誤差情報を、変換し、量子化し、復号化した後に、過去の同一位置の復号画像との差分をとることで、符号化対象のサブブロックにおける時間方向の差分を時間差分情報として生成する(ステップS52)。
(予測評価値算出ステップ)
そして、サブブロック予測評価手段7は、符号量算出手段73aによって、ステップS52の量子化時に生成される量子化変換係数を符号化することで、符号量を算出する(ステップS53)。
さらに、サブブロック予測評価手段7は、分割・予測モード評価値算出手段73bによって、ステップS51で生成された予測誤差情報と、ステップS52で生成された時間差分情報と、ステップS53で算出された符号量とから、予め定めたコスト関数(前記(1)式)により、分割モード評価値及び予測モード評価値を算出する(ステップS54)。
図6(適宜図1参照)に戻って、全体動作について説明を続ける。
続けて、画面内予測符号化装置1は、分割モード判定手段8によって、動画像をマクロブロックで分割するか、さらに細分化したサブブロックで分割するかを判定する(ステップS6)。
そして、画面内予測符号化装置1は、量子化・局所復号化手段9によって、ステップS6で判定された分割モードによって生成された予測誤差情報を用いて、量子化データ及び局所復号化画像を生成する(ステップS7)。
ここで、画面内予測符号化装置1は、分割・予測モード決定手段10によって、ステップS2における比較結果により、当該マクロブロックが、フリッカの発生要因となるマクロブロックの候補であるかどうかを判定し(ステップS8)、その候補である場合(ステップS8でYes)は、ステップS9に進む。一方、候補でない場合(ステップS8でNo)は、以下の量子化パラメータ変更ステップを動作せずにステップS12に進む。
(量子化パラメータ変更ステップ)
そして、画面内予測符号化装置1は、分割・予測モード決定手段10の復号画像比較手段10aによって、ステップS7で生成された局所復号画像と、復号画像蓄積手段11に蓄積されている、過去に復号化されている当該局所復号画像と同一位置のマクロブロック復号画像とを比較する(ステップS9)。
ここで、局所復号画像とマクロブロック復号画像との差が予め定めた閾値よりも大きい場合(ステップS9:>閾値)は、量子化パラメータ変更手段10bによって、量子化パラメータを1段階下げ(ステップS10)、ステップS3に戻る。
(予測モード決定ステップ)
一方、局所復号画像とマクロブロック復号画像との差が予め定めた閾値以下の場合(ステップS9:≦閾値)は、現段階における分割モード及び予測モードを、当該ブロック(マクロブロック又はサブブロック)における最適な分割モード及び予測モードとして最終決定する(ステップS11)。
(符号化ステップ)
そして、画面内予測符号化装置1は、符号化手段12によって、分割モード及び予測モードのそれぞれの値と、ステップS7で生成された量子化データとを、エントロピ符号化し多重化することで、動画像データを符号化した符号化データとして生成する(ステップS12)。
そして、画面内予測符号化装置1は、継続するマクロブロックが存在する場合(ステップS13でYes)には、ステップS2に戻って動作を続ける。さらに、次に続く画面(フレーム)が存在する場合(ステップS14でYes)には、ステップS1に戻って動作を続ける。そして、次に続く画面(フレーム)が存在しない場合(ステップS14でNo)は、動作を終了する。
以上の動作によって、画面内予測符号化装置1は、時間的にほぼ同じ画素値の画像が連続している場合に、復号画像が最も類似する分割モード及び予測モードによって、動画像の圧縮符号化を行うため、時間的にほぼ同じ画素値の画像からは、ほぼ同じ画素値の復号画像が生成されることになり、復号画像におけるフリッカを低減させることができる。
また、画面内予測符号化装置1は、時間的にほぼ同じ画素値の画像が連続している場合に、量子化の度合いを変化させることで、時間的に全く異なる量子化結果となることを回避することができ、低ビットレートの復号画像におけるフリッカを低減させることができる。
以上、最良の形態として、本発明の実施の形態について説明したが、本発明はこれに限定されるものではない。
例えば、図9に示すように、図1の画面内予測符号化装置1から、原画像蓄積手段3、類似判定手段4及び分割・予測モード決定手段10を省き、量子化パラメータを段階的に下げない、画面内予測符号化装置1Bの構成としてもよい。この場合、動画像を低ビットレートで符号化する際に、インター画像における動きのほとんどない(ある一定量以下の)部分で、スキップモードが多用される場合は、フリッカを発生してしまうが、スキップモードを用いない符号化方式においては、十分フリッカの低減を行うことが可能である。
また、別の構成として、図10に示すように、1つのブロック分割単位(ここでは、マクロブロック)で、動画像データを分割し、複数の予測モードによって予測し、時間方向に最も類似する予測モードで、符号化を行う画面内予測符号化装置1Cの構成としてもよい。また、この画面内予測符号化装置1Cの構成において、マクロブロック予測評価手段5を、サブブロック予測評価手段7(図1)として構成してもよい。
本発明に係る画面内予測符号化装置の構成を示すブロック図である。 本発明に係る画面内予測符号化装置のマクロブロック予測評価手段の構成を示すブロック図である。 イントラ16×16予測モードの各予測方法を説明するための説明図であって、(a)は垂直方向予測、(b)は水平方向予測、(c)はDC(直流)予測、(d)はプレーン(plane)予測の各予測方法を概念的に示したものである。 本発明に係る画面内予測符号化装置のサブブロック予測評価手段の構成を示すブロック図である。 イントラ4×4予測モードの予測方法を説明するための説明図であって、(a)は垂直方向予測、(b)は水平方向予測、(c)はDC(直流)予測、(d)は対角左下方向予測、(e)は対角右下方向予測、(f)垂直右方向予測、(g)は水平下方向予測、(h)は垂直左方向予測、(i)は水平上方向予測の各予測方法を概念的に示したものである。 本発明に係る画面内予測符号化装置の動作を示すフローチャートである。 本発明に係る画面内予測符号化装置のマクロブロック予測評価手段の動作を示すフローチャートである。 本発明に係る画面内予測符号化装置のサブブロック予測評価手段の動作を示すフローチャートである。 本発明に係る画面内予測符号化装置の他の構成を示すブロック図である。 本発明に係る画面内予測符号化装置の他の構成を示すブロック図である。
符号の説明
1、1B、1C 画面内予測符号化装置
2 マクロブロック分割手段(ブロック分割手段)
3 原画像蓄積手段
4 類似判定手段
5 マクロブロック予測評価手段
51 予測誤差情報生成手段
52 時間差分情報生成手段
53 予測評価値算出手段
53a 符号量算出手段
6 サブブロック分割手段
7 サブブロック予測評価手段
71 予測誤差情報生成手段(第二の予測誤差情報生成手段)
72 時間差分情報生成手段(第二の時間差分情報生成手段)
73 予測評価値算出手段(第二の予測評価値算出手段)
73a 符号量算出手段(第二の符号量算出手段)
8 分割モード判定手段
9 量子化・局所復号化手段(局所復号化手段)
10 分割・予測モード決定手段(予測モード決定手段)
10a 復号画像比較手段
10b 量子化パラメータ変更手段
11 復号画像蓄積手段
12 符号化手段

Claims (8)

  1. 動画像を構成する画面内の画素値を特定の大きさのブロックを単位として予測することで、前記画面を符号化する画面内予測符号化装置において、
    符号化対象のブロックである符号化対象ブロックの画素値を、予め定めた複数の予測モードに基づいて予測し、原画像との差分をとることで、予測誤差となる予測誤差情報を生成する予測誤差情報生成手段と、
    この予測誤差情報生成手段で生成された予測誤差情報を量子化及び局所復号化し、前記符号化対象ブロックと同一位置に存在した過去の局所復号画像との差分をとることで、時間方向の差分となる時間差分情報を生成する時間差分情報生成手段と、
    前記予測誤差情報と、前記時間差分情報とに基づいて、前記予測モードにおける類似の度合いを示す予測評価値を算出する予測評価値算出手段と、
    この予測評価値算出手段で算出された予測評価値に基づいて、前記符号化対象ブロックの予測モードを決定する予測モード決定手段と、
    を備えていることを特徴とする画面内予測符号化装置。
  2. 動画像を構成する画面を特定の大きさに分割したブロックの画素値を、予め定めた複数の予測モードで予測し、その予測誤差に基づいて前記予測モードを決定することで、前記画面を符号化する画面内予測符号化装置であって、
    前記画面を前記ブロック単位に分割するブロック分割手段と、
    このブロック分割手段で分割された符号化対象のブロックである符号化対象ブロックの画素値を、前記複数の予測モードに基づいて予測し、原画像との差分をとることで、予測誤差となる予測誤差情報を生成する予測誤差情報生成手段と、
    この予測誤差情報生成手段で生成された予測モード分の予測誤差情報を量子化及び局所復号化し、前記符号化対象ブロックと同一位置に存在した過去の局所復号画像との差分をとることで、時間方向の差分となる時間差分情報を生成する時間差分情報生成手段と、
    前記予測誤差情報と前記時間差分情報とに基づいて、前記予測モードにおける類似の度合いを示す予測評価値を算出する予測評価値算出手段と、
    前記予測誤差情報生成手段で生成された予測誤差情報を量子化及び局所復号化することで、量子化データ及び前記局所復号画像を生成する局所復号化手段と、
    前記予測評価値算出手段で算出された予測評価値に基づいて、前記予測モードを決定する予測モード決定手段と、
    この予測モード決定手段で決定された予測モードに基づいて生成された前記量子化データを符号化し、符号化データを生成する符号化手段と、
    を備えていることを特徴とする画面内予測符号化装置。
  3. 前記予測評価値算出手段は、前記予測誤差情報を符号化する際の符号量を算出する符号量算出手段を備え、
    この符号量算出手段で生成された符号量と、前記予測誤差情報及び前記時間差分情報とに基づいて、前記予測評価値を算出することを特徴とする請求項2に記載の画面内予測符号化装置。
  4. 前記予測モード決定手段は、
    前記局所復号化手段で生成された符号化対象ブロックの局所復号画像と、前記符号化対象ブロックと同一位置に存在した過去の局所復号画像とを比較する復号画像比較手段と、
    前記時間差分生成手段及び前記局所復号化手段における、量子化の度合いを示す量子化パラメータの値を変更する量子化パラメータ変更手段とを備え、
    前記符号化対象ブロックの局所復号画像と、前記過去の局所復号画像とが、予め定めた範囲内で類似するまで、前記量子化パラメータの値を小さくすることを特徴とする請求項2又は請求項3に記載の画面内予測符号化装置。
  5. 前記符号化対象ブロックを複数のサブブロックに分割するサブブロック分割手段と、
    このサブブロック分割手段で分割されたサブブロックの画素値を、予め定めた複数の予測モードであるサブブロック予測モードに基づいて予測し、前記サブブロックとの差分をとることで、前記サブブロック予測モード分の予測誤差情報を生成する第二の予測誤差情報生成手段と、
    この第二の予測誤差情報生成手段で生成されたサブブロック予測モード分の予測誤差情報を量子化及び局所復号化し、前記サブブロックと同一位置に存在した過去の局所復号画像との差分をとることで、時間方向の差分となる時間差分情報を生成する第二の時間差分情報生成手段と、
    前記第二の予測誤差情報生成手段で生成された予測誤差情報と、前記第二の時間差分情報生成手段で生成された時間差分情報とに基づいて、前記サブブロック予測モードにおける類似の度合いを示すサブブロック予測評価値を算出する第二の予測評価値算出手段とを備え、
    前記予測モード決定手段が、前記予測評価値及び前記サブブロック予測評価値に基づいて、前記ブロック又は前記サブブロックのいずれのブロックを符号化するか、及び、どの予測モードを使用するかを決定することを特徴とする請求項2乃至請求項4のいずれか一項に記載の画面内予測符号化装置。
  6. 前記第二の予測評価値算出手段は、前記第二の予測誤差情報生成手段で生成される予測誤差情報を符号化する際の符号量を算出する第二の符号量算出手段を備え、
    この第二の符号量算出手段で生成された符号量と、前記サブブロック予測モード分の予測誤差情報及び時間差分情報とに基づいて、前記サブブロック予測評価値を算出することを特徴とする請求項2乃至請求項5のいずれか一項に記載の画面内予測符号化装置。
  7. 動画像を構成する画面内の画素値を特定の大きさのブロックを単位として予測することで、前記画面を符号化する画面内予測符号化方法において、
    符号化対象のブロックである符号化対象ブロックの画素値を、予め定めた複数の予測モードに基づいて予測し、原画像との差分をとることで、予測誤差となる予測誤差情報を生成する予測誤差情報生成ステップと、
    この予測誤差情報生成ステップで生成された予測誤差情報を量子化及び局所復号化し、前記符号化対象ブロックと同一位置に存在した過去の局所復号画像との差分をとることで、時間方向の差分となる時間差分情報を生成する時間差分情報生成ステップと、
    前記予測誤差情報と、前記時間差分情報とに基づいて、前記予測モードにおける類似の度合いを示す予測評価値を算出する予測評価値算出ステップと、
    この予測評価値算出ステップで算出された予測評価値に基づいて、前記符号化対象ブロックの予測モードを決定する予測モード決定ステップと、
    を含んでいることを特徴とする画面内予測符号化方法。
  8. 動画像を構成する画面を特定の大きさに分割したブロックの画素値を、予め定めた複数の予測モードで予測し、その予測誤差に基づいて前記予測モードを決定することで、前記画面を符号化するために、コンピュータを、
    前記画面を前記ブロック単位に分割するブロック分割手段、
    このブロック分割手段で分割された符号化対象のブロックである符号化対象ブロックの画素値を、前記複数の予測モードに基づいて予測し、原画像との差分をとることで、予測誤差となる予測誤差情報を生成する予測誤差情報生成手段、
    この予測誤差情報生成手段で生成された予測モード分の予測誤差情報を量子化及び局所復号化し、前記符号化対象ブロックと同一位置に存在した過去の局所復号画像との差分をとることで、時間方向の差分となる時間差分情報を生成する時間差分情報生成手段、
    前記予測誤差情報と前記時間差分情報とに基づいて、前記予測モードにおける類似の度合いを示す予測評価値を算出する予測評価値算出手段、
    前記予測誤差情報生成手段で生成された予測誤差情報を量子化及び局所復号化することで、量子化データ及び前記局所復号画像を生成する局所復号化手段、
    前記予測評価値算出手段で算出された予測評価値に基づいて、前記予測モードを決定する予測モード決定手段、
    この予測モード決定手段で決定された予測モードに基づいて生成された前記量子化データを符号化し、符号化データを生成する符号化手段、
    として機能させることを特徴とする画面内予測符号化プログラム。
JP2004136609A 2004-04-30 2004-04-30 画面内予測符号化装置、その方法及びそのプログラム Expired - Fee Related JP4383240B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004136609A JP4383240B2 (ja) 2004-04-30 2004-04-30 画面内予測符号化装置、その方法及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004136609A JP4383240B2 (ja) 2004-04-30 2004-04-30 画面内予測符号化装置、その方法及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2005318468A true JP2005318468A (ja) 2005-11-10
JP4383240B2 JP4383240B2 (ja) 2009-12-16

Family

ID=35445402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004136609A Expired - Fee Related JP4383240B2 (ja) 2004-04-30 2004-04-30 画面内予測符号化装置、その方法及びそのプログラム

Country Status (1)

Country Link
JP (1) JP4383240B2 (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006070787A1 (ja) * 2004-12-28 2006-07-06 Nec Corporation 動画像符号化方法、及びこれを用いた装置と、コンピュータプログラム
JP2007235944A (ja) * 2006-03-02 2007-09-13 Mitsubishi Electric Research Laboratories Inc ビデオのフレームシーケンスにおけるマクロブロックの符号化モードを選択する方法及びシステム
JP2008177834A (ja) * 2007-01-18 2008-07-31 Nippon Hoso Kyokai <Nhk> 符号化装置、及びプログラム
JP2008219630A (ja) * 2007-03-06 2008-09-18 Kddi Corp 動画像符号化装置
WO2008111458A1 (ja) * 2007-03-14 2008-09-18 Nippon Telegraph And Telephone Corporation 符号化ビットレート制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
WO2008126135A1 (ja) 2007-03-20 2008-10-23 Fujitsu Limited 動画像符号化方法及び装置並びに動画像復号装置
WO2010067668A1 (ja) * 2008-12-08 2010-06-17 シャープ株式会社 画像符号化装置及び画像復号装置
JP2011239443A (ja) * 2004-06-27 2011-11-24 Apple Inc ビデオ・データを符号化するための符号化タイプおよび予測モードの選択
US8396130B2 (en) 2007-03-14 2013-03-12 Nippon Telegraph And Telephone Corporation Motion vector search method and apparatus, program therefor, and storage medium which stores the program
WO2013125171A1 (ja) * 2012-02-20 2013-08-29 日本電気株式会社 イントラ予測モード判定装置、方法、プログラム記憶媒体
CN103281527A (zh) * 2010-04-15 2013-09-04 华为技术有限公司 图像编解码方法及相关装置
US9161042B2 (en) 2007-03-14 2015-10-13 Nippon Telegraph And Telephone Corporation Quantization control method and apparatus, program therefor, and storage medium which stores the program
KR101608426B1 (ko) 2008-03-28 2016-04-04 삼성전자주식회사 영상의 인트라 예측 부호화/복호화 방법 및 그 장치
US9455739B2 (en) 2007-03-14 2016-09-27 Nippon Telegraph And Telephone Corporation Code amount estimating method and apparatus, and program and storage medium therefor

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11336889B2 (en) 2017-07-19 2022-05-17 Nec Corporation Moving image encoding device and method for reducing flicker in a moving image

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011239443A (ja) * 2004-06-27 2011-11-24 Apple Inc ビデオ・データを符号化するための符号化タイプおよび予測モードの選択
JP2014161094A (ja) * 2004-06-27 2014-09-04 Apple Inc ビデオ・データを符号化するための符号化タイプおよび予測モードの選択
JPWO2006070787A1 (ja) * 2004-12-28 2008-08-07 日本電気株式会社 動画像符号化方法、及びこれを用いた装置と、コンピュータプログラム
JP5234241B2 (ja) * 2004-12-28 2013-07-10 日本電気株式会社 動画像符号化方法、及びこれを用いた装置と、コンピュータプログラム
WO2006070787A1 (ja) * 2004-12-28 2006-07-06 Nec Corporation 動画像符号化方法、及びこれを用いた装置と、コンピュータプログラム
US8325799B2 (en) 2004-12-28 2012-12-04 Nec Corporation Moving picture encoding method, device using the same, and computer program
JP2007235944A (ja) * 2006-03-02 2007-09-13 Mitsubishi Electric Research Laboratories Inc ビデオのフレームシーケンスにおけるマクロブロックの符号化モードを選択する方法及びシステム
JP2008177834A (ja) * 2007-01-18 2008-07-31 Nippon Hoso Kyokai <Nhk> 符号化装置、及びプログラム
JP4628374B2 (ja) * 2007-01-18 2011-02-09 日本放送協会 符号化装置、及びプログラム
JP2008219630A (ja) * 2007-03-06 2008-09-18 Kddi Corp 動画像符号化装置
JPWO2008111458A1 (ja) * 2007-03-14 2010-06-24 日本電信電話株式会社 符号化ビットレート制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
JP5008718B2 (ja) * 2007-03-14 2012-08-22 日本電信電話株式会社 符号化ビットレート制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
US8265142B2 (en) 2007-03-14 2012-09-11 Nippon Telegraph And Telephone Corporation Encoding bit-rate control method and apparatus, program therefor, and storage medium which stores the program
US9455739B2 (en) 2007-03-14 2016-09-27 Nippon Telegraph And Telephone Corporation Code amount estimating method and apparatus, and program and storage medium therefor
US8396130B2 (en) 2007-03-14 2013-03-12 Nippon Telegraph And Telephone Corporation Motion vector search method and apparatus, program therefor, and storage medium which stores the program
WO2008111458A1 (ja) * 2007-03-14 2008-09-18 Nippon Telegraph And Telephone Corporation 符号化ビットレート制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
US9161042B2 (en) 2007-03-14 2015-10-13 Nippon Telegraph And Telephone Corporation Quantization control method and apparatus, program therefor, and storage medium which stores the program
EP3107294A1 (en) 2007-03-20 2016-12-21 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
WO2008126135A1 (ja) 2007-03-20 2008-10-23 Fujitsu Limited 動画像符号化方法及び装置並びに動画像復号装置
US10148966B2 (en) 2007-03-20 2018-12-04 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
US9906800B2 (en) 2007-03-20 2018-02-27 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
US9167254B2 (en) 2007-03-20 2015-10-20 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
US9838699B2 (en) 2007-03-20 2017-12-05 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
US9838698B2 (en) 2007-03-20 2017-12-05 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
US9756345B2 (en) 2007-03-20 2017-09-05 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
EP3107292A1 (en) 2007-03-20 2016-12-21 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
EP3107295A1 (en) 2007-03-20 2016-12-21 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
EP3107293A1 (en) 2007-03-20 2016-12-21 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
KR101608426B1 (ko) 2008-03-28 2016-04-04 삼성전자주식회사 영상의 인트라 예측 부호화/복호화 방법 및 그 장치
WO2010067668A1 (ja) * 2008-12-08 2010-06-17 シャープ株式会社 画像符号化装置及び画像復号装置
CN103281527A (zh) * 2010-04-15 2013-09-04 华为技术有限公司 图像编解码方法及相关装置
WO2013125171A1 (ja) * 2012-02-20 2013-08-29 日本電気株式会社 イントラ予測モード判定装置、方法、プログラム記憶媒体
JPWO2013125171A1 (ja) * 2012-02-20 2015-07-30 日本電気株式会社 イントラ予測モード判定装置、イントラ予測モード判定方法、及びイントラ予測モード判定プログラム

Also Published As

Publication number Publication date
JP4383240B2 (ja) 2009-12-16

Similar Documents

Publication Publication Date Title
US10750177B2 (en) Image coding apparatus, image coding method, and program, and image decoding apparatus, image decoding method, and program
US10218975B2 (en) Transform precision manipulation in video coding
RU2715017C1 (ru) Устройство кодирования с предсказанием видео, способ кодирования с предсказанием видео, устройство декодирования с предсказанием видео и способ декодирования с предсказанием видео
KR100750136B1 (ko) 영상의 부호화, 복호화 방법 및 장치
JP4146444B2 (ja) 動画像符号化の方法及び装置
KR100678911B1 (ko) 방향적 인트라 예측의 적용을 확장하여 비디오 신호를인코딩하고 디코딩하는 방법 및 장치
US8369628B2 (en) Video encoding device, video encoding method, video encoding program, video decoding device, video decoding method, and video decoding program
JP5421408B2 (ja) αチャンネル映像復号化装置、αチャンネル復号化方法及び記録媒体
JP5061179B2 (ja) 照明変化補償動き予測符号化および復号化方法とその装置
KR101473278B1 (ko) 화상 예측 부호화 장치, 화상 예측 복호 장치, 화상 예측 부호화 방법, 화상 예측 복호 방법, 화상 예측 부호화 프로그램, 및 화상 예측 복호 프로그램
US8948243B2 (en) Image encoding device, image decoding device, image encoding method, and image decoding method
JP4908180B2 (ja) 動画像符号化装置
KR101108681B1 (ko) 동영상 코덱에서의 주파수 변환 계수 예측 방법 및 장치,이를 구비한 부호화 및 복호화 장치와 방법
US20100118945A1 (en) Method and apparatus for video encoding and decoding
US20060153299A1 (en) Coded video sequence conversion apparatus, method and program product for coded video sequence conversion
US20120320975A1 (en) Video encoding device and encoding method thereof, video decoding device and decoding method thereof, and directional intra-prediction method to be used thereto
JP4383240B2 (ja) 画面内予測符号化装置、その方法及びそのプログラム
KR101601854B1 (ko) 공간적 예측장치 및 그 예측방법, 그것을 이용한 영상 부호화 장치 및 방법, 및 영상 복호화 장치 및 방법
JP6261658B2 (ja) 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
JP4768779B2 (ja) 動画像符号化/復号化の方法及び装置
JP4775132B2 (ja) 画像理装置および方法、プログラム、並びに記録媒体
JP5388977B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム
KR100667815B1 (ko) 영상 부호화 및 복호화 장치와, 그 방법, 및 이를 수행하기위한 프로그램이 기록된 기록 매체
JP2022070176A (ja) 符号化装置及びプログラム
KR101767950B1 (ko) 예측을 위한 컬러 플레인간의 상관 파라미터 추출 장치와 방법, 및 그것을 이용한 영상 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080722

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080922

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090918

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131002

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees