JP4834772B2 - 画像符号化方法および画像符号化装置 - Google Patents

画像符号化方法および画像符号化装置 Download PDF

Info

Publication number
JP4834772B2
JP4834772B2 JP2009543677A JP2009543677A JP4834772B2 JP 4834772 B2 JP4834772 B2 JP 4834772B2 JP 2009543677 A JP2009543677 A JP 2009543677A JP 2009543677 A JP2009543677 A JP 2009543677A JP 4834772 B2 JP4834772 B2 JP 4834772B2
Authority
JP
Japan
Prior art keywords
slice
picture
pictures
slices
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009543677A
Other languages
English (en)
Other versions
JPWO2009069316A1 (ja
Inventor
眞也 角野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2009543677A priority Critical patent/JP4834772B2/ja
Publication of JPWO2009069316A1 publication Critical patent/JPWO2009069316A1/ja
Application granted granted Critical
Publication of JP4834772B2 publication Critical patent/JP4834772B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は画像符号化方法および画像符号化装置に関する。特に、MPEG(Moving Picture Experts Group)−4 AVC方式によって、または、ITU−T H.264方式によって画像信号を複数ブロックからなるスライスに分割し、各スライスをブロック単位で符号化する画像符号化方法および画像符号化装置に関する。
近年、音声、画像およびその他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア、つまり新聞、雑誌、テレビ、ラジオおよび電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形あるいは、音声、特に画像等を同時に関連づけて表すことをいう。上記従来の情報メディアをマルチメディアの対象とするには、その情報をデジタル形式にして表すことが必須条件となる。
ところが、上記各情報メディアの持つ情報量をデジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトである。それに対し、音声の場合は、1秒当たり64Kbits(電話品質)、さらに動画の場合については、1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となる。それ故、上記情報メディアでその膨大な情報をデジタル形式でそのまま扱うことは現実的ではない。例えば、テレビ電話は、64Kbit/s〜1.5Mbit/sの伝送速度を持つサービス総合デジタル網(ISDN:Integrated Services Digital Network)によって実用化されている。しかし、テレビ・カメラの映像をそのままのデジタル情報量でISDNにて送ることは不可能である。
そこで、必要となってくるのが情報の圧縮技術である。例えば、テレビ電話の場合、ITU−T(国際電気通信連合 電気通信標準化部門)によって勧告されたH.261あるいはH.263規格の動画圧縮技術が用いられている。また、MPEG−1規格の情報圧縮技術では、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。
ここで、MPEG(Moving Picture Experts Group)とは、ISO/IEC(国際標準化機構 国際電気標準会議)によって標準化された動画像信号圧縮の国際規格である。MPEG−1は、動画像信号を1.5Mbit/sまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG−1規格では、対象とする品質を中程度の品質、すなわち伝送速度が主として約1.5Mbit/sで実現できる程度の品質としたことから、さらなる高画質化の要求をみたすべくMPEG−2が規格化された。MPEG−2では、動画像信号を2〜15Mbit/sでTV放送品質を実現する。
さらに、現状では、MPEG−1、MPEG−2と標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11)によって、MPEG−1、MPEG−2を上回る圧縮率を達成し、さらに物体単位で符号化・復号化・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG−4が規格化された。MPEG−4は、MPEG−1、およびMPEG−2を上回る圧縮率を達成し、さらに物体単位で符号化、復号化および操作を可能とする。
このMPEG−4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、インタレース画像も含む高ビットレートの符号化方法も含む、より汎用的な符号化に拡張された。さらに、現在は、ISO/IECとITU−Tとによって共同で、より高圧縮率の画像符号化方式として、MPEG−4 AVCおよびITU−T H.264が規格化された。
ここで、画像信号は同じ時刻の画素の集合であるピクチャ(フレームまたはフィールドとも呼ばれる)が連続したものであると考えることができる。また、画素は、ピクチャ内での近傍画素との相関が強いことから、ピクチャ内の画素の相関を利用した圧縮が行われる。さらに、連続するピクチャ間では、画素の相関も強いことから、ピクチャ間の画素の相関を利用した圧縮も行われる。ここで、ピクチャ間の画素の相関とピクチャ内の画素の相関を利用した圧縮をインター符号化と呼び、ピクチャ間の画素の相関を用いないがピクチャ内の画素の相関を利用した圧縮をイントラ符号化と呼ぶ。このインター符号化は、ピクチャ間の相関を利用しているので、イントラ符号化よりも高い圧縮率を実現できる。
また、MPEG−1、MPEG−2、MPEG−4、MPEG−4 AVCおよびH.264では、2次元の矩形領域の画素の集合であるブロック(もしくはマクロブロック)を構成し、ブロック単位でイントラ符号化とインター符号化とが切り替えられる。
一方、ADSLまたは光ファイバを用いた高速ネットワーク環境が普及しており、これにより一般家庭でも数Mbit/sを越えるビットレートで送受信が可能となっている。さらに、今後数年で数十Mbit/sでの送受信が可能になる見込みである。それにより、上記の画像符号化技術を用いることで、専用回線を用いた企業だけでなく、一般家庭でもTV放送品質およびHDTV放送品質のTV電話およびTV会議システムの導入が進むと予想される。
ところで、ネットワークを介して符号化した画像データ、すなわちストリームを伝送する際には、ネットワーク輻輳などでストリームの一部が消失する可能性がある。ストリームの一部が消失した場合には、受信側で消失したストリームに対応する箇所の画像を正しく復号できない。さらに、ピクチャ間の画素の相関を利用した圧縮では正しく復号できない状態が後続のピクチャにも伝播する。つまり、画質劣化が後続のピクチャにも伝播する。そこで、ブロックを複数まとめた符号化単位であるスライスが定義された。スライスは独立に符号化および復号処理が可能な最小単位であり、ストリームの一部が消失してもスライス単位で復号処理ができる。
図1は、MPEG−2規格のスライス分割方法を用いた場合におけるスライスとブロックとの関係を説明する図である。図1に示すピクチャ(1フレーム)は、複数のブロックで構成されている。また、ピクチャを構成するブロックの中で、同じ行のブロックは1つのスライスを構成している。例えば、斜線をつけたスライスは、Iスライスであり、その他のスライスはPスライスである。Iスライスは、イントラ符号化のブロックのみで構成されるスライスであり、Pスライスはインター符号化またはイントラ符号化のブロックで構成されるスライスである。
なお、H.264規格では、一般に、Iスライスは、スライス内の画素の相関のみを利用して符号化されるスライスを意味し、Pスライスは、スライス内の画素相関とスライス間の画素相関とを利用して符号化されるスライスを意味する。ここで、スライス間とは、当該スライスと当該スライス以外のスライスとの間のことであり、当該スライスを含むピクチャとは異なるピクチャのスライスとの間であってもよい。別の言い方をすると、Iスライスは、周囲(当該スライスの外側)の画像信号からの予測符号化を用いない、すなわちイントラ符号化されるイントラ・マクロブロックのみを集めたスライスであり、Pスライスは、予測符号化によって圧縮効率を高めた、すなわちインター符号化されるインター・マクロブロックとイントラ・マクロブロックとが混在して構成されるスライスである。
なお、1つのピクチャ内でH.264規格で規定するIスライスとPスライスとの混在を許容しない運用規格も存在する。そこで、本明細書のIスライスとは、意図的にスライス内の画素の相関のみを利用して符号化した特殊なPスライスも、便宜上Iスライスと呼ぶことにする。
図2は、ピクチャにおける複数のブロックの符号化順を説明するための図である。この図1に示すピクチャにおけるブロックは、図2で示す順序、すなわち、ピクチャ内において、スライス単位内では左から右へ、かつ、スライス単位で上から下への順序で符号化されてストリームが生成される。
しかし、たとえ当該スライスのストリームを伝送路上での消失なく受信し、スライス単位で復号処理がされたとしても、復号処理された画素が正しく復号できるとは限らない。当該スライスがイントラ符号化されている場合には、以前にストリームの消失により正しく復号できていなくても、イントラ符号化されているスライスのストリームのみで画素を正しく復号できる。しかし、消失したストリームの次のピクチャを復号する際に、当該スライスがインター符号化されている場合には、直前に復号したピクチャを参照して復号を行うので、以前にストリーム消失で画質劣化があるピクチャを参照して復号すると正しく画素を復号できない。
このように、ストリームが消失した場合に、消失したストリームの次のピクチャがインター符号化されていると正しく復号できず、さらに再帰的に後続のピクチャも正しく復号できなくなる課題がある。
そこで、以下に説明する方法で、画質劣化が再帰的に伝播することを防止する。
図3は、時間順に連続するピクチャのスライス分割例を示す図である。ここで、斜線をつけたスライスは、図1と同様に、Iスライスであり、その他のスライスはPスライスである。スライスは行単位である。また、図3(a)〜図3(l)は時間順に連続するピクチャである。すなわち、図3では、図3(a)が時間順に最初のピクチャであり、図3(l)が時間順に最後のピクチャである。図3において、Iスライスの位置は、時間順に次のピクチャでは1行下に移動し、最下位行に移動した次は最上位行に戻っている(図3(j)から図3(k))。
このように、ストリーム消失に強いIスライスと、ストリーム消失には弱いが圧縮率の良いインター符号化を含むPスライスでピクチャを構成し、Iスライスの位置を時間順にピクチャ内で循環する。それにより、ある時点でストリームが消失してPスライスの画質が劣化しても、ストリームが消失したPスライスの位置のスライスが、時間順に後のピクチャでIスライスとなった際に、ピクチャが正しく復号される。すなわち、画像劣化のあったストリームを回復できる。それ故、画質劣化が無限に伝播することを防止できる。
次に、図3に示した画質劣化の伝播防止を実現する画像符号化装置800について説明する。
図4は、MPEG−2規格のスライス分割方法を用いた場合における画像符号化装置800の構成を示すブロック図である。
画像符号化装置800は、ブロック数カウンタ部802と、イントラ/インター決定部804と、スライス決定部806と、ビデオ・エンコーダ808とを備える。
ブロック数カウンタ部802は、ビデオ・エンコーダ808が符号化対象とするピクチャにおけるブロック数を計測する。また、ブロック数カウンタ部802は、ビデオ・エンコーダ808が符号化対象とするピクチャのブロックがピクチャのどの位置に対応するかをイントラ/インター決定部804とスライス決定部806とに通知する。
イントラ/インター決定部804は、ブロック数カウンタ部802から通知されたブロック位置から、ビデオ・エンコーダ808が符号化対象とするピクチャのスライスがIスライスかPスライスのいずれであるかを決定する。イントラ/インター決定部804は、決定したスライスの種類(IスライスまたはPスライス)をビデオ・エンコーダ808に通知する。
スライス決定部806は、ブロック位置取得部8062とスライス境界決定部8066とを備える。
スライス決定部806は、ブロック数カウンタ部802から通知されたブロック位置から、スライスの境界であるか、すなわちスライスを構成するブロックの行の位置の中で、通知されたブロックが最後の位置かどうかを決定する。スライス決定部806は、ブロック数カウンタ部802から通知されたブロック位置をブロック位置取得部8062で取得し、スライス境界決定部8066で、通知されたブロック位置がスライス単位の区切りかどうかを決定する。スライス境界決定部8066は、決定したブロック位置の情報(スライス単位の区切りであるかどうか)をビデオ・エンコーダ808に通知する。
ビデオ・エンコーダ808は、スライス決定部806におけるスライス境界決定部8066から通知されたスライスの境界(スライス単位)と、イントラ/インター決定部804で通知されたスライスの種類とに基づいて、ブロック単位に入力画像VINをそのスライスで使用可能な符号化方法(イントラ符号化もしくはインター符号化)で符号化する。ビデオ・エンコーダ808は、符号化した入力画像VINをストリームSTRとしてパケット化部820に出力する。
ここで、上述したように、MPEG−2規格のスライスを用いているので、ビデオ・エンコーダ808が符号化するピクチャのスライス単位は、ピクチャを構成する複数のブロックの行単位である。
パケット化部820は、ストリームSTRをネットワークの伝送に適した形式に変換する。
図5は、MPEG−4規格のスライス分割方法を用いた場合におけるスライスとブロックとの関係の1例を説明する図である。MPEG−4規格では、スライスを図1に示したMPEG−2規格のスライスのように行単位にすることもできるが、スライスを符号化したビット数が一定となるようにスライスを構成する制御がよく用いられている。従って、スライスの形状は図1で示したような矩形とは限らない。また、スライスに含まれるブロック数も入力される画像信号の絵柄によって可変となる。
ここで、図5に示すピクチャ(1フレーム)は、複数のブロックで構成されている。また、ピクチャを構成するブロックの中で、太い線で囲まれた複数のブロックが1つのスライスを構成している。例えば、斜線をつけた複数のブロックの中で太い線で囲まれた複数のブロックは、Iスライスであり、その他の太い線で囲まれた複数のブロックは、Pスライスである。
また、斜線がある複数のブロックは、イントラ符号化される位置のブロックであることを示している。MPEG−4規格では、斜線で示すイントラ符号化の位置は、スライスの単位とは一致しなくてもよいため、図5では、その1例を示している。
図6は、時間順に連続するピクチャのスライス分割例を示す図である。斜線がある位置のブロックは、Iスライスを含みイントラ符号化されるブロックであり、その他の太い線で囲まれた複数のブロック(スライス)はPスライスである。また、図6(a)〜図6(l)は時間順に連続するピクチャである。このように、図3と同様に、ストリーム消失に強いIスライスと、ストリーム消失には弱いが圧縮率の良いインター符号化を含むPスライスでピクチャを構成し、Iスライスを含むイントラ符号化の位置を時間順にピクチャ内で循環する。それにより、画質劣化が再帰的に伝播することを防止する。
次に、図6に示した画質劣化の伝播防止を実現する画像符号化装置900について説明する。
図7は、MPEG−4規格のスライス分割方法を用いた場合における画像符号化装置800の構成を示すブロック図である。
画像符号化装置900は、ブロック数カウンタ部802と、イントラ/インター決定部804と、スライスサイズ決定部906と、ビデオ・エンコーダ908とを備える。図7において、図4におけるMPEG−2の画像符号化装置のブロック図と同じ動作をする機器は同じ番号を付し、説明を省略する。
ビデオ・エンコーダ908は、スライスサイズ決定部906で通知されるスライスの境界(スライス単位)と、イントラ/インター決定部804で通知されたスライスの種類とに基づいて、ブロック単位に入力画像VINを使用可能な符号化方法(イントラ符号化もしくはインター符号化)で符号化する。ビデオ・エンコーダ908は、符号化した入力画像VINをストリームSTRとしてパケット化部820に出力すると同時に、符号化したビット数をスライスサイズ決定部906に通知する。
スライスサイズ決定部906は、スライス境界決定部9066と符号化ビット数カウンタ部9068とを備える。スライスサイズ決定部906は、ビデオ・エンコーダ908から通知されたビット数を符号化ビット数カウンタ部9068で取得し、通知されたビット数からビデオ・エンコーダ908が符号化しているブロックがスライス単位の区切りのブロックかどうかをスライス境界決定部9066で決定する。
符号化ビット数カウンタ部9068は、取得したビデオ・エンコーダ908から通知されたビット数あるいは、その通知されたビット数が所定のビット数になった時点の情報をスライス境界決定部9066に通知する。
スライス境界決定部9066は、符号化ビット数カウンタ部9068から通知されたビット数の情報から対象ブロックをスライスの最後のブロック、すなわちスライス単位の区切りとなるブロックであるかを判断する。スライス境界決定部9066は、判断結果であるブロックがスライスの境界であることをビデオ・エンコーダ908に通知する。
なお、図5および図6に示すように、斜線で示すイントラ符号化の位置は、ピクチャ毎に上位置から下位置に移動するが、スライスの単位とは一致しない。
以上のように、ピクチャをスライスで分割すると、ネットワークのストリーム消失による画質劣化防止に有効である。
ここで、ストリームをスライス単位でネットワーク伝送する場合のビット数について例を挙げて説明する。
図8は、時間順に連続するピクチャのスライス分割例を示す図であり、図9Aおよび図9Bは、時間順に各スライスを符号化したビット数の例を示す図である。図9Aおよび図9Bでは、ストリームを図8で示すスライス単位でネットワーク伝送する場合に、時間順に各スライスを符号化したビット数の例を示している。
図8に示すように、例えばピクチャは5つのスライスで構成されており、1つのIスライスと4つのPスライスを含んでいるとする。
Iスライスのビット数は、Pスライスのビット数より多く、一般に数倍〜10倍程度のビット数が発生する。図9Aでは、ピクチャを構成するスライスを上から下の順序で符号化し、横軸に時刻、縦軸に当該スライスの符号化で発生するビット数の大きさのイメージを図示している。図8および図9Aから分かるように、ピクチャを構成するIスライスが時間順に上から下の順序、すなわち、周期的に循環する。
また、図9Bは、時間順に連続する複数のピクチャを符号化し、これらピクチャを符号化順に一定のビットレートで伝送している様子を示している。ここで、図9Bでは、横軸方向の幅(長さ)がビット数の大きさであり、そのスライスのデータ伝送に必要な時間を示している。各ピクチャに同数のIスライスが含まれることで、各ピクチャ単位でのビット数はほぼ同じになる。
MPEG−2規格書:ISO/IEC 13818−2、"Information Technology−Generic Coding Of Moving Pictures And Associated Audio Information:Video"、International Standard、Second Edition、December 2000 MPEG−4規格書:ISO/IEC 14496−2、"Information Technology−Coding Of Audio−Visual Objects−Part 2:Visual"、International Standard、Third Edition、July 2004
ビット数の多いIスライスのビット数を少なくするにはIスライスを構成するマクロブロック数を少なくすればよいが、単純にスライスに含まれるブロック数を少なくするとピクチャあたりのスライス数が多くなり、次のような問題がある。
1)スライス符号化の初期化に必要な処理量が多くなる。これは、圧縮率が非常に高くH.264で使用されている算術符号化のように、スライス先頭での変数の初期化処理が多い符号化で特に問題になる。
2)ピクチャに占めるスライス・ヘッダ(スライスに含まれるマクロブロックの復号に必要な共通データ)の符号量が多くなり、圧縮効率が悪くなる。これは、特に低ビットレート符号化で問題になる。
3)スライス単位で初期化が必要となるため、画像符号化をハードウェアで実現する場合にブロック単位の符号化処理のパイプライン処理も初期化される。よって、パイプライン処理が中断する頻度が多くなる。
また、上述したようなMPEG−2規格のスライスまたはMPEG−4規格のスライスを用いてピクチャをスライス数で分割する場合には、下記で示す問題がある。
1)MPEG−2規格のスライスを用いる場合は、ピクチャ内の1行の複数のブロックが1スライスという制約があり、基本的に変更できない。
また、MPEG−2の考え方を独自に拡張し、ピクチャあたりのスライス数を少なくするために、複数のK行にある複数のブロックを1スライスとして拡張したとすると、全スライスの大きさは同じになるので、Iスライスの大きさも大きくなってしまう。すなわち、Iスライスを構成するブロックの数が多くなる。言い換えると、インター符号化よりもビット数が多いイントラ符号化のみからなるIスライスのビット数が特に大きくなる。復号がスライス単位であることを考慮すると、Iスライス自身がストリーム消失してしまう頻度が高くなり、Iスライスによる画質劣化の伝播防止が有効に動作しなくなってしまう。
2)MPEG−4規格のスライスを用いる場合は、ビット数が一定になるようにスライス単位に分割される。しかしながら、スライスの境界が実際に符号化したビット数で決定されるため、ブロックを符号化するまでスライス境界の位置が決定できない。従って、スライス単位の並列化処理構成で高速な画像符号化装置を実現できず、ブロック単位で逐次符号化を行う低速な画像符号化装置になる。
さらに、ブロック単位の符号化処理をパイプライン処理で実現する場合には、対象ブロックの符号化が完了してスライス分割を決定する時点では(本来は次のスライスに含めるべき)後続のブロックの符号化処理が既にパイプライン処理が行われていることになる。従って、後続のブロックの符号化処理からパイプライン処理のやり直しが必要となり、パイプライン処理に適さない。
また、さらに、図9Aで示したように各ピクチャに同数のIスライスを含む場合、時間順に連続する複数のピクチャを符号化し、符号化したこれらピクチャを符号化順にネットワーク伝送するとき、図9BのピクチャN+4とピクチャN+5とでIスライスが2回連続して伝送されることになる。
符号化では、直前に符号化したIスライスあるいはPスライスで発生したビット数に基づき、これから符号化するIスライスあるいはPスライスのビット数を予測することで符号化の制御を行う。しかし、下記に示す場合には予測が困難であり、短時間の平均ビット数が一定となるように制御することが難しい。
1)予測するスライスのピクチャ内の位置が直前に符号化した位置と大きく異なる場合、特にピクチャ内の最上位置と最下位置との場合
2)ピクチャ内の位置によって絵柄が大きく違う画像あるいは動きの大きい動画など、ピクチャ内位置あるいはピクチャ間で画像の統計的特徴が異なる場合
1)、2)の場合では、符号化画質を良くするためのIスライスと、Pスライスとの必要なビット数比率がピクチャ内の符号化位置あるいは、符号化するピクチャ単位で大きく異なる。そのため、図9Bで示すピクチャN+4とピクチャN+5とのように、特に多くのビット数が発生するIスライスを連続して符号化する場合には、一定のビット数にする符号化制御が難しく、所望のビット数にうまく制御できない。そのため、ビット数が一定にできない場合や、ビット数を無理に一定にすると大きな画質劣化も発生してしまう場合がある。
そこで、本発明は、上記問題点に鑑みてなされたものであり、パイプライン化あるいは並列化を阻害することなく、ストリーム消失の頻度を低めつつ、処理量削減と圧縮率とを向上する画像符号化方法および画像符号化装置を実現することを目的とする。
上記の課題を解決するために、本発明に係る画像符号化装置は、画像信号を複数ブロックからなるスライスに分割し、各スライスをブロック単位で符号化する画像符号化装置であって、スライス内の画素相関を利用して符号化される、複数ブロックからなるI(イントラ)スライスと、スライス内の画素相関とスライス間の画素相関とを利用して符号化される、複数ブロックからなるP(インター)スライスとに、ピクチャを分割する分割手段と、前記各スライスをブロック単位で符号化してゆくことにより、時間順に連続する複数のピクチャを符号化する符号化手段とを備え、前記分割手段は、前記時間順に連続する複数のピクチャの中の一定数のピクチャで、当該複数のピクチャ内でのIスライスの位置が循環するように、前記時間順に連続する複数のピクチャそれぞれのピクチャ内でのIスライスの位置を変更し、かつ、前記時間順に連続する複数のピクチャにおいて、Iスライスに含まれるブロック数と、当該Iスライスおよびその次のIスライスの間に含まれる1つ以上のPスライスに含まれるブロック数との和が所定値となるよう前記複数のピクチャのそれぞれを分割することを特徴とする。
この構成により、ある時点でストリームが消失してPスライスの画質が劣化しても、ストリームが消失したPスライスの位置のスライスが、時間順に後のピクチャでIスライスとなった際に、ピクチャが正しく復号することができ、画質劣化が無限に伝播することを防止できる。また、IスライスとPスライスの発生するビット数に偏りがあったとしてもビット数の多いIスライスでのビット数の振れを周期的なものとすることができる。すなわち、ビット数に偏りのあるIスライスが連続してネットワーク伝送されないようにできるので、ネットワーク伝送するビット数を平準化することができる。それにより、パイプライン化あるいは並列化を阻害することなく、ストリーム消失の頻度を低めつつ、処理量削減と圧縮率とを向上する画像符号化方法および画像符号化装置を実現できる。
また、前記分割手段は、さらに、前記ピクチャを、ブロック数M(Mは0以上の整数)からなるIスライスと、前記ピクチャ内の特定位置にあるPスライスを除く、ブロック数N(Nは1以上の整数、かつ、M<N)からなる複数のPスライスとに分割するとしてもよい。
この構成により、Iスライスのブロック数を少なくし、Pスライスのブロック数を多くすることで、ピクチャ内のスライス数を少なくできるので、ピクチャ全体で処理量削減と圧縮率向上とを実現することができる。
また、前記分割手段は、さらに、前記時間順に連続する複数のピクチャにおいて、予め設定された数のピクチャ毎にIスライスの位置が一方端から他方端への移動が繰り返されるように、前記ピクチャをIスライスとPスライスとに分割し、前記符号化手段は、前記Iスライスを当該スライス内の画素相関を利用して符号化し、前記Pスライスを当該スライス内の画素相関、または当該スライスと他のスライスとの間の画素相関を利用して符号化することにより、前記時間順に連続する複数のピクチャの符号化データを生成する符号化データ生成部と、前記時間順に連続する複数のピクチャに共通のデータと、前記時間順に連続する複数のピクチャの符号化データとを含むストリームを生成するストリーム生成部とを備え、前記ストリーム生成手段は、前記Iスライスが前記一方端に位置するピクチャが符号化された符号化データの直前に、前記共通のデータを配置するとしてもよい。
この構成により、Iスライスがピクチャの一方端に位置するピクチャの直前に複数ピクチャに共通するデータを配置することで、画像復号化装置による途中再生時には、ピクチャの一方端から他方端に向かい画像が正しく表示される領域が広がっていく。この表示方法は、画面のスクロールと同様であり、日常よく目にする表示方法と似ているので視聴者が違和感を受け難い。このように、本発明に係る画像符号化方法は、途中再生時において、視聴者が違和感を受け難い映像が表示される動画像ストリームを生成できる。
また、上記の課題を解決するために、本発明に係る画像符号化装置は、画像信号を複数ブロックからなるスライスに分割し、各スライスをブロック単位で符号化する画像符号化装置であって、スライス内の画素相関を利用して符号化される、複数ブロックからなるI(イントラ)スライスと、スライス内の画素相関とスライス間の画素相関とを利用して符号化される、複数ブロックからなるP(インター)スライスとに、前記ピクチャを分割する分割手段と、前記各スライスをブロック単位で符号化してゆくことにより、時間順に連続する複数のピクチャを符号化する符号化手段とを備え、前記分割手段は、前記時間順に連続する複数のピクチャの中の一定数のピクチャで、当該複数のピクチャ内でのIスライスの位置が循環するように、前記時間順に連続する複数のピクチャそれぞれのピクチャ内でのIスライスの位置を変更し、かつ、当該複数のピクチャのそれぞれを、ブロック数M(Mは0以上の整数)からなるIスライスと、当該ピクチャ内の特定位置にあるPスライスを除く、ブロック数N(Nは1以上の整数、かつ、M<N)からなる複数のPスライスとに分割することを特徴とする。
この構成により、Iスライスのブロック数を少なくし、Pスライスのブロック数を多くすることで、ピクチャ内のスライス数を少なくできるので、ピクチャ全体で処理量削減と圧縮率向上とを実現することができる。また、スライスを予め定めたブロック数で分割することができるので、パイプライン化および並列化を阻害しない。さらに、ある時点でストリームが消失してPスライスの画質が劣化しても、ストリームが消失したPスライスの位置のスライスが、時間順に後のピクチャでIスライスとなった際に、ピクチャが正しく復号することができ、画質劣化が無限に伝播することを防止できる。それにより、パイプライン化あるいは並列化を阻害することなく、ストリーム消失の頻度を低めつつ、処理量削減と圧縮率とを向上する画像符号化方法および画像符号化装置を実現できる。
また、前記分割手段は、符号化対象のブロック数を示すカウント値をカウントするブロック数カウンタ手段と、前記ブロック数カウンタがカウントしたブロック数に基づいて、対象スライスの種類を決定するイントラ/インター決定手段とを備え、前記分割手段は、前記イントラ/インター決定手段で決定したスライスの種類と前記カウントしたブロック数とに基づいて、前記複数のピクチャのそれぞれにおける前記Iスライスと前記複数のPスライスとの分割位置を決定することで、前記複数のピクチャのそれぞれを分割してもよい。
この構成により、イントラ/インター決定手段により決定された対象スライスの種類に応じて、対象スライスを構成するブロックの数を決定し、分割することができる。
また、前記分割手段は、前記複数のピクチャのそれぞれの内のブロックの符号化順でIスライスの直前に位置するPスライスを、ブロック数L(Lは1以上の整数、かつ、L<N)からなる前記特定位置のPスライスとして、分割してもよい。
また、前記分割手段は、前記複数のピクチャのそれぞれの内のブロックの符号化順でIスライスの直後に位置するPスライスを、ブロック数J(Jは1以上の整数、かつ、J<N)からなる前記特定位置のPスライスとして、分割してもよい。
また、前記分割手段は、前記複数のピクチャのそれぞれの内で最下位行に位置するPスライスを、ブロック数K(Kは1以上の整数、かつ、K<N)からなる前記特定位置のPスライスとして、分割してもよい。
この構成により、ピクチャ内にある特定の位置のPスライスの大きさを調整することで、他の位置のPスライスに含むブロック数は一定値Nとできるので、ピクチャ内のスライス数を少なくすることができる。
また、前記分割手段は、前記Iスライスを、前記ピクチャの行を構成するブロック数の1/2以下のブロック数M(Mは0以上の整数)からなるスライスに分割してもよい。
それにより、Iスライスを構成するブロック数を少なくして符号化時のビット数を少なくしつつ、ピクチャ内の全スライス数を少なくすることができる。
また、前記分割手段は、前記Iスライスを、前記ピクチャの行を構成するブロック数に等しいブロック数M(Mは0以上の整数)からなるスライスに分割してもよい。
それにより、Iスライスを符号化処理が容易な行単位の最小ブロックサイズとして符号化時のビット数を少なくしつつ、ピクチャ内のスライス数を少なくすることができる。
また、前記分割手段は、さらに、前記時間順に連続する複数のピクチャの中の一定数のピクチャの中で、少なくとも1つのピクチャを、ブロック数が0からなるIスライスと、複数のPスライスとに分割してもよい。
それにより、ストリーム中で、符号化されたIスライスのビット位置を調整することができる。例えばIスライスとPスライスの発生するビット数に偏りがあり、Iスライスのビット数がPスライスのビット数よりも特に大きい場合には、IスライスとIスライスの間のPスライス数を増やすことでIスライスを符号化する頻度を少なくすることができるので、ネットワーク上での伝送ビットレートを低減することができる。
また、前記分割手段は、Iスライスの位置がピクチャ内で最下位行のピクチャの次のピクチャを、Iスライスを含まない複数のPスライスのみに分割してもよい。つまり、前記分割手段は、Iスライスの位置がピクチャ内で最下位行のピクチャの次のピクチャで、ブロック数が0のIスライスと、複数のPスライスとに分割してもよい。
それにより、ストリーム中で、符号化されたIスライスのビット位置をほぼ等間隔とすることができる。例えばIスライスとPスライスの発生するビット数に偏りがあったとしても周期的な変動になるため、ネットワーク上でのストリーム消失を低減することができる。
また、前記分割手段は、前記時間順に連続する複数のピクチャにおいて、ピクチャにおけるIスライスに含まれるブロック数と、当該Iスライスおよび当該ピクチャの次のピクチャにおけるIスライスの間に含まれる1つ以上のPスライスに含まれるブロック数との和が所定値となるよう、前記複数のピクチャのそれぞれを分割してもよい。
それにより、IスライスとPスライスの発生するビット数に偏りがあったとしてもIスライスでのビット数の振れを周期的なものとすることができる。すなわち、ビット数に偏りのあるIスライスが連続してネットワーク伝送されないようにできるので、ネットワーク伝送するビット数を平準化することができる。
また、本発明の画像符号化方法は、画像信号を複数ブロックからなるスライスに分割し、各スライスをブロック単位で符号化する画像符号化方法であって、スライス内の画素相関を利用して符号化される、複数ブロックからなるI(イントラ)スライスと、スライス内の画素相関とスライス間の画素相関とを利用して符号化される、複数ブロックからなるP(インター)スライスとに、前記ピクチャを分割する分割ステップと、前記各スライスをブロック単位で符号化してゆくことにより、時間順に連続する複数のピクチャを符号化する符号化ステップとを含み、前記分割ステップは、前記時間順に連続する複数のピクチャの中の一定数のピクチャで、当該複数のピクチャ内でのIスライスの位置が循環するように、前記時間順に連続する複数のピクチャそれぞれのピクチャ内でのIスライスの位置を変更し、かつ、当該複数のピクチャのそれぞれを、ブロック数M(Mは0以上の整数)からなるIスライスと、当該ピクチャ内の特定位置にあるPスライスを除く、ブロック数N(Nは1以上の整数、かつ、M<N)からなる複数のPスライスとに分割することを特徴とする。
また、上記の課題を解決するために、本発明に係る画像符号化装置は、画像信号を複数ブロックからなるスライスに分割し、各スライスをブロック単位で符号化する画像符号化装置であって、スライス内の画素相関を利用して符号化される、複数ブロックからなるI(イントラ)スライスと、スライス内の画素相関とスライス間の画素相関とを利用して符号化される、複数ブロックからなるP(インター)スライスとに、前記ピクチャを分割する分割手段と、前記各スライスをブロック単位で符号化してゆくことにより、時間順に連続する複数のピクチャを符号化する符号化手段とを備え、前記分割手段は、前記時間順に連続する複数のピクチャの中の一定数のピクチャで、当該複数のピクチャ内でのIスライスの位置が循環するように、前記時間順に連続する複数のピクチャそれぞれのピクチャ内でのIスライスの位置を変更し、かつ、前記時間順に連続する複数のピクチャにおいて、Iスライスに含まれるブロック数と、当該Iスライスおよびその次のIスライスの間に含まれる1つ以上のPスライスに含まれるブロック数との和が所定値となるよう前記複数のピクチャのそれぞれを分割することを特徴とする。
この構成により、IスライスとIスライスの間に含まれるPスライスのブロック数が同じになる。特に、Pスライスを構成するブロック数を一定数とすれば、IスライスとPスライスの区別なく、任意のスライス位置から連続する所定数のスライスに含まれるIスライスとPスライスの個数を一定にすることができるので、スライス符号化の都度、所定スライス数のビット数が一定となるよう符号化制御をすることで、符号化対象画像が急な動きを含む場合あるいは、シーンチェンジなどの画像の統計量が大きく変化する場合でも、画質の大きな劣化なく平均ビット数が一定となる符号化制御が容易に実現できる。
また、前記分割手段は、さらに、前記時間順に連続する複数のピクチャの中の一定数のピクチャの中で、少なくとも1つのピクチャを、Iスライスを含まない複数のPスライスに分割してもよい。つまり、前記分割手段は、さらに、前記時間順に連続する複数のピクチャの中の一定数のピクチャの中で、少なくとも1つのピクチャを、ブロック数が0からなるIスライスと、複数のPスライスとに分割してもよい。
また、上記の課題を解決するために、本発明の画像符号化方法は、画像信号を複数ブロックからなるスライスに分割し、各スライスをブロック単位で符号化する画像符号化方法であって、スライス内の画素相関を利用して符号化される、複数ブロックからなるI(イントラ)スライスと、スライス内の画素相関とスライス間の画素相関とを利用して符号化される、複数ブロックからなるP(インター)スライスとに、前記ピクチャを分割する分割ステップと、前記各スライスをブロック単位で符号化してゆくことにより、時間順に連続する複数のピクチャを符号化する符号化ステップとを含み、前記分割ステップは、前記時間順に連続する複数のピクチャの中の一定数のピクチャで、当該複数のピクチャ内でのIスライスの位置が循環するように、前記時間順に連続する複数のピクチャそれぞれのピクチャ内でのIスライスの位置を変更し、かつ、前記時間順に連続する複数のピクチャにおいて、Iスライスに含まれるブロック数と、当該Iスライスおよびその次のIスライスの間に含まれる1つ以上のPスライスに含まれるブロック数との和が所定値となるよう前記複数のピクチャのそれぞれを分割することを特徴とする。
なお、本発明は、装置として実現するだけでなく、このような装置が備える処理手段を備える集積回路として実現したり、その装置を構成する処理手段をステップとする方法として実現したり、それらステップをコンピュータに実行させるプログラムとして実現したり、そのプログラムを示す情報、データまたは信号として実現したりすることもできる。そして、それらプログラム、情報、データおよび信号は、CD−ROM等の記録媒体あるいはインターネット等の通信媒体を介して配信してもよい。
本発明によれば、パイプライン化あるいは並列化を阻害することなく、ストリーム消失の頻度を低めつつ、処理量削減と圧縮率とを向上する画像符号化方法および画像符号化装置を提供することが可能となる。
具体的には、本発明に係る画像符号化方法および画像符号化装置では、Iスライスの大きさ(ブロック数)をPスライスの大きさ(ブロック数)よりも小さくなるようスライスに分割する。それにより、(1)ピクチャのスライス数を少なくし、スライス分割による処理量増加と圧縮率劣化を防止、(2)Iスライスのブロック数が少ないので、Iスライスのビット数は少なく、画質劣化の伝播防止に重要なIスライスがストリーム消失の影響を受けにくい、という効果が得られる。
図1は、MPEG−2のスライスとブロックの関係の説明図である。 図2は、ピクチャにおける複数のブロックの符号化順の説明図である。 図3は、時間順に連続するピクチャのスライス分割例を示す図である。 図4は、MPEG−2規格のスライス分割方法を用いた場合における画像符号化装置800の構成を示すブロック図である。 図5は、MPEG−4規格のスライス分割方法を用いた場合におけるスライスとブロックとの関係の1例を説明する図である。 図6は、時間順に連続するピクチャのスライス分割例を示す図である。 図7は、MPEG−4規格のスライス分割方法を用いた場合における画像符号化装置の構成を示すブロック図である。 図8は、時間順に連続するピクチャのスライス分割例を示す図である。 図9Aは、時間順に各スライスを符号化したビット数の例を示す図である。 図9Bは、時間順に各スライスを符号化したビット数の例を示す図である。 図10は、本発明のスライス分割方法を用いた場合における画像符号化装置の構成を示すブロック図である。 図11は、本発明の実施の形態1におけるスライス分割方法を用いた場合のスライスとブロックとの関係を説明する図である。 図12は、本発明の実施の形態1における時間順に連続するピクチャのスライス分割例を示す図である。 図13Aは、本発明の実施の形態1におけるストリームをネットワーク伝送する場合を説明するための図である。 図13Bは、本発明の実施の形態1におけるストリームをネットワーク伝送する場合を説明するための図である。 図14は、本発明の実施の形態1における画像符号化装置が符号化する場合の処理を説明するフローチャートである。 図15は、本発明の実施の形態2における時間順に連続するピクチャのスライス分割例を示す図である。 図16は、本発明の実施の形態2における画像符号化装置が符号化する場合の処理を説明するフローチャートである。 図17は、本発明の実施の形態3における時間順に連続するピクチャのスライス分割例を示す図である。 図18は、本発明の実施の形態3における画像符号化装置が符号化する場合の処理を説明するフローチャートである。 図19は、本発明の実施の形態4における時間順に連続するピクチャのスライス分割例を示す図である。 図20は、本発明の実施の形態5における時間順に連続するピクチャのスライス分割例を示す図である。 図21は、本発明の実施の形態6における時間順に連続するピクチャのスライス分割例を示す図である。 図22Aは、本発明の実施の形態6における時間順に各スライスを符号化したビット数の例を示す図である。 図22Bは、本発明の実施の形態6における時間順に各スライスを符号化したビット数の例を示す図である。 図23は、本発明の実施の形態6における画像符号化装置が符号化する場合の処理を説明するフローチャートである。 図24は、本発明の実施の形態6における画像符号化装置が符号化する場合の処理を説明するフローチャートである。 図25は、本発明の実施の形態7における時間順に連続するピクチャのスライス分割例を示す図である。 図26は、本発明の実施の形態7における時間順に連続するピクチャのスライス分割例を示す図である。 図27Aは、本発明の実施の形態7における時間順に各スライスを符号化したビット数の例を示す図である。 図27Bは、本発明の実施の形態7における時間順に各スライスを符号化したビット数の例を示す図である。 図28は、本発明の実施の形態7における時間順に連続するピクチャの別のスライス分割例を示す図である。 図29は、本発明の実施の形態7における時間順に連続するピクチャの別のスライス分割例を示す図である。 図30は、本発明の実施の形態7における時間順に連続するピクチャの別のスライス分割例を示す図である。 図31は、本発明の実施の形態7における時間順に連続するピクチャの別のスライス分割例を示す図である。 図32は、本発明の実施の形態7における時間順に連続するピクチャのスライス分割の変形例を示す図である。 図33Aは、図32における時間順に各スライスを符号化したビット数の例を示す図である。 図33Bは、図32における時間順に各スライスを符号化したビット数の例を示す図である。 図34は、本発明の実施の形態7における時間順に連続するピクチャの別のスライス分割の変形例を示す図である。 図35は、本発明の実施の形態7における時間順に連続するピクチャの別のスライス分割の変形例を示す図である。 図36は、本発明の実施の形態7における時間順に連続するピクチャの別のスライス分割の変形例を示す図である。 図37は、本発明の実施の形態7における時間順に連続するピクチャの別のスライス分割の変形例を示す図である。 図38は、MPEG−2におけるGOP構造を示す図である。 図39は、MPEG−2におけるストリーム構造を示す図である。 図40は、H.264におけるピクチャのスライス構成を示す図である。 図41は、本発明の実施の形態8に係る、画像符号化装置のブロック図である。 図42は、本発明の実施の形態9に係る、画像符号化装置のブロック図である。 図43は、本発明の実施の形態9に係る各ピクチャのスライス分割例を示す図である。 図44は、本発明の実施の形態9に係る、ストリームの構造を示す図である。 図45は、本発明の実施の形態9に係る、スライス分割においてGOPの最初から正しく復号できるスライスを示す図である。 図46は、本発明の実施の形態9に係るストリームが符号化された際の表示例を示す図である。 図47は、GOP先頭ピクチャの最初にIスライスが位置しない場合に正しく復号できるスライスを示す図である。 図48Aは、本発明の実施の形態9に係る、参照ピクチャと対象ピクチャとの関係を示す図である。 図48Bは、本発明の実施の形態9に係る、参照ピクチャと対象ピクチャとの関係を示す図である。 図48Cは、GOP先頭ピクチャの最初にIスライスが位置しない場合の参照ピクチャと対象ピクチャとの関係を示す図である。 図48Dは、GOP先頭ピクチャの最初にIスライスが位置しない場合の参照ピクチャと対象ピクチャとの関係を示す図である。 図49は、本発明の実施の形態9に係る、画像符号化装置によるスライス符号化の流れを示すフローチャートである。 図50は、本発明の実施の形態10に係る、各ピクチャのスライス分割例を示す図である。 図51は、本発明の実施の形態10に係る、ストリームの構造を示す図である。 図52は、本発明の実施の形態11に係る、各ピクチャのスライス分割例を示す図である。 図53は、本発明の実施の形態11に係る、ストリームの構造を示す図である。 図54は、本発明の実施の形態12に係る、各ピクチャのスライス分割例を示す図である。 図55は、本発明の実施の形態12に係る、各ピクチャのスライス分割の変形例を示す図である。 図56は、本発明の実施の形態13に係る、各ピクチャのスライス分割例を示す図である。 図57Aは、本発明の実施の形態14に係る、記録媒体の構成を示す図である。 図57Bは、本発明の実施の形態14に係る、記録媒体の構成を示す図である。 図57Cは、本発明の実施の形態14に係る、コンピュータシステムの構成を示す図である。
以下、本発明の実施の形態について、図を用いて説明する。
図10は、本発明のスライス分割方法を用いた場合における画像符号化装置100の構成を示すブロック図である。
画像符号化装置100は、ブロック数カウンタ部102と、イントラ/インター決定部104と、スライスサイズ決定部106と、ビデオ・エンコーダ108とを備える。
ブロック数カウンタ部102は、符号化するスライスにおけるブロック数を計測する。
また、ブロック数カウンタ部102は、ビデオ・エンコーダ108が符号化対象とするスライスのブロック数、すなわち、スライス内でいくつ目のブロックであるかをイントラ/インター決定部104とスライスサイズ決定部106とに通知する。
イントラ/インター決定部104は、ブロック数カウンタ部102から通知されたブロック数から、ビデオ・エンコーダ108が符号化対象とするスライスがIスライスかPスライスかのいずれであるかを決定する。
イントラ/インター決定部104は、決定したスライスの種類(IスライスまたはPスライス)をビデオ・エンコーダ108とスライス種類取得部1064に通知する。
スライスサイズ決定部106は、ブロック数取得部1062とスライス種類取得部1064と、参照部1065と、スライス分割位置決定部1066とを備える。
スライス種類取得部1064は、イントラ/インター決定部104から通知されたビデオ・エンコーダ808が符号化対象とするスライスの種類(IスライスかPスライス)を取得する。
ブロック数取得部1062は、ブロック数カウンタ部102から通知されたビデオ・エンコーダ808が符号化対象とするスライスのブロック数を取得する。
スライス分割位置決定部1066は、スライス種類取得部1064が取得したスライスの種類に基づきブロック数取得部1062が取得したブロック数から、ビデオ・エンコーダ108が符号化対象とするスライス単位の区切りのブロック(以下、スライス分割位置と記載)であるかどうかを決定する。
スライス分割位置決定部1066は、決定したスライス分割位置をビデオ・エンコーダ808に通知する。スライス分割位置決定部1066から通知されるスライス分割位置によりビデオ・エンコーダ108でスライスに分割される。具体的には、スライス分割位置決定部1066は、スライス種類取得部1064が取得したスライスの種類がIスライスである場合、ブロック数カウンタ部102から通知されたスライス内のブロック数がM個になった時点をスライス分割位置と決定し、ビデオ・エンコーダ108に通知する。
スライス分割位置決定部1066は、スライス種類取得部1064が取得したスライスの種類がPスライスである場合、ブロック数カウンタ部102から通知されたブロック数がN個(N>M)になった時点をスライス分割位置と決定し、ビデオ・エンコーダ108に通知する。ここで、NおよびMは整数である。
ここでは、スライス分割位置決定部1066は、参照部1065に保存されているテーブルなどに記載されたルールに基づいてスライス分割位置を決定している。参照部1065では、例えば、Pスライスならブロック数がN個(N>M)になった時点をPスライス分割位置とし、Iスライスならブロック数がM個(N>M)になった時点をIスライス分割位置とする等のスライス分割位置決定ルールを記載したテーブルが保存されている。
ビデオ・エンコーダ108は、スライスサイズ決定部106で通知されるスライス分割位置毎のスライス単位で、かつイントラ/インター決定部104で通知されたスライスの種類に基づいて、ブロック単位に入力画像VINを使用可能な符号化方法(イントラ符号化もしくはインター符号化)で、符号化する。ビデオ・エンコーダ108は、符号化した入力画像VINをストリームSTRとしてパケット化部200に出力する。
パケット化部200は、ストリームSTRをネットワークの伝送に適した形式に変換する。例えば、ストリームSTRをスライス単位で1つのネットワーク伝送単位に変換する。ここで、ストリームSTRにおいて1つのスライスを複数のネットワーク伝送単位に変換してもよい。
(実施の形態1)
図11は、本発明の実施の形態1におけるスライス分割方法を用いた場合のスライスとブロックとの関係を説明する図である。図11に示すピクチャ(1フレーム)は、複数のブロックで構成されている。ピクチャを構成するブロックの中で、斜線をつけた複数のブロックの領域は、スライスであり、Iスライスである。その他の太い線で囲まれた複数のブロックは、スライスであり、Pスライスである。ここでは、ピクチャはIスライスとPスライスとで構成される例を示している。図1のMPEG−2規格のスライス分割方法と本発明におけるスライス分割方法との違いは、Iスライスに含まれるブロック数がPスライスに含まれるブロック数よりも少ない(スライスサイズが小さい)ことである。
図12は、本発明の実施の形態1における時間順に連続するピクチャのスライス分割例を示す図である。ここで、斜線をつけたスライスは、Iスライスであり、その他のスライスはPスライスである。
図12(a)〜図12(l)はこの順で時間順に連続するピクチャである。Iスライスの位置が、時間順に次のピクチャでは1行下に移動する。PスライスとPスライスの間の分割位置は、Iスライスの位置によらず固定である。すなわち、スライス分割位置決定部1066は、Pスライスを構成するブロック数は原則として一定となるようスライス分割位置を決定している。しかしながら、ピクチャ内のIスライスの直前および直後のPスライスでは、Iスライスが挿入されることでPスライスに含まれるブロック数が、例外的に少なくなる。そのため、スライス分割位置決定部1066は、例外的に少なくなるこの場合を許容してスライス分割位置を決定している。また、ピクチャのブロック数が等サイズのPスライスで分割できない場合は、ピクチャの最下位行のPスライスも例外的にブロック数が少なくなる。スライス分割位置決定部1066は、同様に、例外的に少なくなるこの場合を許容してスライス分割位置を決定している。
このように、Iスライスのブロック数を少なくし、Pスライスのブロック数を多くすることで、ピクチャ内のスライス数を少なくできる。さらに、イントラ符号化のブロックのみで構成されるIスライスをピクチャ単位で巡回的に移動することができるので、ストリームの消失に強い画像符号化を行うことができる。すなわち、ある時点でストリームが消失してPスライスの画質が劣化しても、ストリームが消失したPスライスのピクチャ内の水平・垂直位置のスライスが、時間順に後のピクチャでIスライスとなった際に、ピクチャが正しく復号することができ、画像劣化のあったストリームを回復できる。
また、図12で示すように、ピクチャ内のIスライスの位置が、最下位行に移動した次のピクチャは、Iスライスを含まないPスライスのみのピクチャとして符号化され、次のピクチャで最上位行に戻るように符号化される(図12(j)から図12(l))。すなわち、スライスサイズ決定部106は、スライス決定したスライス分割位置が、ビデオ・エンコーダ108が符号化するスライスが、Iスライスで、かつピクチャの最下位行であった場合に、ビデオ・エンコーダ108が次に符号化するピクチャは、Iスライスを含まないPスライスのみで構成するようビデオ・エンコーダ108に通知する。ビデオ・エンコーダ108は、スライスサイズ決定部106の通知に基づいて、例えば直前のピクチャと同じスライス分割位置で、かつ、Pスライスのみで構成するピクチャを符号化する。
なお、Iスライスを含まないPスライスのみのピクチャを、ブロック数が0であるIスライスと1つ以上のPスライスとで構成されるピクチャと表現してもよい。
また、Iスライスを含まないPスライスのみのピクチャとして符号化する方法は、参照部1065に保存されているテーブルに記載されたルールに基づいている。
これにより、ピクチャのIスライスと、次のピクチャのIスライスとの間にあるPスライスの符号化されるブロック数は、Iスライスが循環する過程(例えば図12(a)から図12(l))で一定になる。その結果、ストリーム中で、符号化されたビット数の多いIスライスのビット位置がほぼ等間隔となる。それ故、例えば、ストリームSTRをスライス単位でネットワーク伝送する場合に、ネットワーク伝送するビット数を平準化することができる。
ビットレートが低い場合あるいは、複雑な動きの少ない画像信号では、Iスライスのビット数と比べてPスライスのビット数が非常に少なくなる。イントラ符号化のブロックあたりのビット数が、インター符号化のビット数の10倍以上になることも多く、Pスライスのブロック数をIスライスのブロック数より多くしても、Iスライスのビット数が非常に多くなることがある。ストリーム中で、符号化されたIスライスのビット位置をほぼ等間隔とすることで、IスライスとPスライスの発生するビット数に偏りがあったとしても周期的な変動になるため、ネットワークの送受信バッファでその変動を吸収しやすくなり、変動が大きい場合に発生頻度が高くなるネットワークでのストリーム消失を低減することができる。
このように、ストリーム消失に強いIスライスと、ストリーム消失には弱いが圧縮率の良いインター符号化を含むPスライスとでピクチャを構成し、Iスライスの位置を時間順にピクチャ内で循環する。例えば、ある時点でストリームが消失してPスライスの画質が劣化すると、ストリームが消失したPスライスの位置のスライスは、後に続くピクチャでIスライスとなるまで画質劣化が伝播する。しかし、ストリームが消失したそのピクチャでの位置のスライスが、時間順に後のピクチャでIスライスとなったときには、Iスライスはスライス内の画素の相関のみを利用して符号化されるスライスであるので、ピクチャのその位置でのスライスが正しく復号される。すなわち、画像劣化のあったストリームが回復される。それ故、画質劣化が無限に伝播することを防止できる。
なお、より確実に画質劣化の伝播を防止するためには、各ピクチャ(例えば図12(a)から図12(l))におけるPスライスが参照する(画素相関を利用する)範囲が、各ピクチャ(例えば図12(a)から図12(l))におけるそのPスライスよりも上(先頭)側に位置するPスライスまたはIスライスに限定するとよい。しかし、そのような限定をしない場合であっても、一般的に参照するのは時間的に近い(例えば直前の)ピクチャの同じ位置のスライスであることが多いことから、以前に生じた画質劣化が、画質劣化を生じた画素と同じ位置の画素を含むスライスがIスライスであるピクチャ以降のピクチャにまで伝播する可能性は低減する。
ここで、ストリームをネットワーク伝送する場合のビット数の振れを図13Aおよび図13Bに示す。
図13Aおよび図13Bは、本発明の実施の形態1におけるストリームをネットワーク伝送する場合を説明するための図である。
図13Aでは、比較のために従来例として、ストリームをピクチャ単位(フレーム単位)でネットワーク伝送する場合を示す図である。
図13Bは、ストリームをスライス単位でネットワーク伝送する場合を示す図である。
本発明では、Iスライスのブロック数をPスライスのブロック数よりも少なくしているので、図13Bに示すように、IスライスとPスライスとのビット数の大きさの隔たりを少なくできる。また、IスライスとPスライスの発生するビット数に偏りがあったとしてもIスライスでのビット数の振れは周期的なものとなる。そのため、ネットワーク伝送するビット数を平準化することができる。
ここで、上述したように、図12(k)においてIスライスを含まないPスライスのみのピクチャとして符号化する。それにより、図13Bで示すフレーム毎だけでなく、連続したフレーム(ストリーム)を符号化した場合に、フレーム境界付近で、Iスライスが連続して符号化されて、大きなビット数が連続しないようにすることができる。すなわち、Iスライスでのビット数の振れを周期的にすることで、ネットワーク伝送するビット数を平準化できる。
なお、図12から明らかなように、ピクチャのスライスの境界となるマクロブロック位置はピクチャ毎に(巡回するが)固定的に決定されており、入力の画像信号の内容に依存しない。従って、スライス単位で符号化処理を並列化し、高速な画像符号化装置を実現することが可能である。
図14は、本発明の実施の形態1における画像符号化装置100が符号化する場合の処理を説明するフローチャートである。
まず、スライスサイズ決定部106は、ビデオ・エンコーダ108の符号化対象スライスがIスライスであるかを判定する(S101)。具体的には、スライス分割位置決定部1066は、スライス種類取得部1064に取得されたスライスの種類を判定する。
スライス種類取得部1064が取得したスライスの種類がIスライスである場合(S101の“はい”の場合)、スライス分割位置決定部1066は、参照部1065に保存されているルールに基づいて、スライス分割位置をMブロック目と決定する。すなわち、スライス分割位置決定部1066は、ブロック数取得部1062に取得されたブロック数から、Iスライスの開始となるブロックからMブロック目をスライス分割位置と決定する。スライス分割位置決定部1066から通知されるスライス分割位置に基づいて、ビデオ・エンコーダ808は、IスライスのスライスサイズをMブロックとして符号化する(S104)。
次に、スライス種類取得部1064に取得されたスライスの種類がIスライスでない場合(S101の“いいえ”の場合)、すなわち、スライス種類取得部1064に取得された符号化対象スライスの種類がPスライスである場合、スライス分割位置決定部1066は、符号化対象スライスがピクチャ最後(最下位行)のスライスであるかどうかを判定する(S102)。すなわち、スライス分割位置決定部1066は、ブロック数取得部1062に取得されたブロック数から、符号化対象スライスがピクチャ最後のスライス位置であるかを判定する。
符号化対象スライスがピクチャ最後のスライスである場合、スライス分割位置決定部1066は、参照部1065に保存されているルールに基づいて、スライス分割位置をN以下(N>M)のブロック目と決定する。スライス分割位置決定部1066から通知されるスライス分割位置に基づいて、ビデオ・エンコーダ808は、ピクチャ最後のPスライスのスライスサイズをN以下(N>M)のブロック数として符号化する(S105)。ピクチャ最後のPスライスのスライスサイズ、すなわちピクチャ最後のPスライスを構成するブロック数はピクチャのブロック数で決定される。例えば、ピクチャがLブロックで構成される場合には、LをNで除算した余りの数が最後のスライスのブロック数になる。
次に、符号化対象スライスがピクチャ最後のスライスでない場合、スライス分割位置決定部1066は、ブロック数取得部1062に取得されたブロック数とスライス種類取得部1064に取得されたスライスの種類に基づいて、符号化対象のPスライスのピクチャ内での位置がIスライスの直前もしくは直後のスライスであるかどうかを判定する(S103)。
符号化対象スライスが、Iスライスの直前もしくは直後のスライスである場合、図12に示すようにIスライス挿入によってPスライスのブロック数がNより少なくなるので、そのブロック数に応じたスライスにする(S105)。すなわち、符号化対象PスライスがIスライスの直前もしくは直後のスライスである場合、スライス分割位置決定部1066は、ブロック数取得部1062に取得されたブロック数とスライス種類取得部1064に取得されたスライスの種類とに基づいて、スライスを構成するブロックの数をN以下として、Iスライスの直前もしくは直後であるPスライスのスライス分割位置を決定する。
次に、符号化対象スライスが、Iスライスの直前でも直後でもないスライスの場合、Nブロック数でスライスを構成する(S106)。すなわち、スライス分割位置決定部1066は、ブロック数取得部1062に取得されたブロック数とスライス種類取得部1064に取得されたスライスの種類とに基づいて、Pスライスを構成するブロックの数をNとしてIスライスの直前もしくは直後でないPスライスのスライス分割位置を決定する。
なお、図14を用いて説明した、S101、S102およびS103の判定順序は、スライスを構成するブロック数が上述で記述した内容と変わらない範囲で入れ替えても構わない。例えば、S102とS103の順序は入れ替え可能である。
以上、本実施の形態1によれば、ある時点でストリームが消失してPスライスの画質が劣化しても、ストリームが消失したPスライスの位置のスライスが、時間順に後のピクチャでIスライスとなった際に、ピクチャが正しく復号することができ、画像劣化のあったストリームを回復できる。それ故、画質劣化が無限に伝播することを防止できる。さらに、スライスのブロック数を少なくし、Pスライスのブロック数を多くすることで、ピクチャ内のスライス数を少なくできる。スライスの分割位置がピクチャ単位で決まっているため、パイプライン化あるいは並列化を阻害することなく、ストリーム消失の頻度を低めつつ、処理量削減と圧縮率とを向上する画像符号化方法および画像符号化装置を実現できる。
なお、本発明におけるスライス単位で符号化の並列処理を行うためには、画像符号化装置100を複数個準備し、各並列単位におけるブロック数カウンタ部102で上述したようにブロック数を計算すればよい。例えば、図11と図12のスライス分割例において2つで並列化する場合は、ピクチャの上半分の6行と、下半分の4行のブロックに分割し、上半分と下半分の処理を並列化することができる。つまり、本実施の形態1では、Pスライスのピクチャ内での境界位置は原則固定である。そのため、単純にブロック数でピクチャを固定の境界位置で分割して、複数の処理ユニット(プロセッサもしくはハードウェア)で処理させることで、スライス単位で処理を並列化することができる。
(実施の形態2)
次に、実施の形態2について、以下説明する。なお、実施の形態1と同じ構成および同じ動作については説明を省略する。
図15は、本発明の実施の形態2における時間順に連続するピクチャのスライス分割例を示す図である。ここで、斜線をつけたスライスは、Iスライスであり、その他のスライスはPスライスである。図12における実施の形態1のスライス分割方法と図15における本実施の形態2のスライス分割方法との違いは、Iスライスの直後のPスライスの大きさが一定(Nブロック)であり、Iスライスより下のPスライスの境界位置(スライス分割位置)がIスライスの行数だけ下に移動することである。
そのため、本実施の形態2では、ピクチャを構成するスライス数が実施の形態1より少ないのが特徴である。例えば、図12と図15とを比較する。図12(a)と図15(a)、図12(b)と図15(b)、図12(d)と図15(d)並びに、図12(e)と図15(e)を比較すると図15で示される実施の形態2におけるピクチャを構成するスライス数が少ない。従って、ピクチャを構成するスライス数が削減でき、処理量削減あるいは圧縮率向上の効果が得られる。
図16は、本発明の実施の形態2における画像符号化装置100が符号化する場合の処理を説明するフローチャートである。なお、図14で説明した処理と同じ処理の箇所は同じ記号を付し、説明を省略する。
本実施の形態2ではIスライス直後の位置でのPスライスのブロック数は、ピクチャ内最後の位置の場合でのPスライスを除外するとNブロックである。よって、図14のS103の代わりに、Iスライスの直前のスライスであれば、図15に示すようにIスライス挿入によってPスライスのブロック数がNより少なくなるので、そのブロック数に応じたスライスにする(S110)。すなわち、符号化対象PスライスがIスライスの直前のスライスである場合、スライス分割位置決定部1066は、ブロック数取得部1062に取得されたブロック数とスライス種類取得部1064に取得されたスライスの種類とに基づいて、スライスを構成するブロックの数をN以下として、Iスライスの直前であるPスライスのスライス分割位置を決定する。
(実施の形態3)
次に、実施の形態3について、以下説明する。なお、実施の形態1および2と同じ構成および同じ動作については説明を省略する。
図17は、本発明の実施の形態3における時間順に連続するピクチャのスライス分割例を示す図である。ここで、斜線をつけたスライスは、Iスライスであり、その他のスライスはPスライスである。
実施の形態1では、最下位行がIスライスのピクチャと最上位行がIスライスのピクチャの間のピクチャを除き、全てのピクチャにIスライスを含む例を示した。本実施の形態3では、ネットワークの品質が高く、Iスライスの挿入頻度が少なくてもよい場合を想定する。その場合には、図17に示すように、Iスライスを含まないピクチャを定期的に挿入する。
ところで、一般的には、ストリームを再生する場合において、2秒間のストリームの中に1つ以上Iピクチャを挿入するのが望ましいといわれている。例えば、ストリーム再生1秒間に30フレームが必要とする場合には、60フレーム毎に1枚のIピクチャが必要ということになる。ここでは、ピクチャ単位でなく、スライス単位での伝送を想定しているので、60フレーム単位で、ピクチャ内でのIスライスの位置が時間順に移動、すなわち、周期的に循環すればよい。
それ故、図17に示すように、時間順に連続する2ピクチャ毎に、Iスライスを含まないピクチャを定期的に挿入しても、ストリーム再生に影響はない。したがって、ネットワークの品質が高くて、Iスライスの挿入頻度が少なくてもよい場合には、ビット数の多いイントラ符号化のブロック数を削減し、圧縮率を向上できる。
図18は、本発明の実施の形態3における画像符号化装置100が符号化する場合の処理を説明するフローチャートである。なお、図14で説明した処理と同じ処理の箇所は同じ記号を付し、説明を省略する。
まず、最初にスライスサイズ決定部106は、ビデオ・エンコーダ108の符号化対象ブロックを含むピクチャにIスライスを含めるかどうかを決定する(S200)。
ここで、符号化対象ブロックを含むピクチャにIスライスを含めるかどうかは、参照部1065に保存されたテーブルに記載されたルールに基づいてスライス分割位置決定部1066が決定する。ここでは、例えば図17に示すように、2ピクチャ毎にIスライスを含まないピクチャがあるように決定している。
スライスサイズ決定部106が、ビデオ・エンコーダ108の符号化対象ブロックを含むピクチャにIスライスを含むと決定した場合は(S200の“はい”の場合)、実施の形態1における図14のフローチャートと同じ処理になるので、説明を省略する。
次に、スライスサイズ決定部106が、ビデオ・エンコーダ108の符号化対象ブロックを含むピクチャにIスライスを含めないと決定した場合(S200の“いいえ”の場合)、スライスサイズ決定部106は、ビデオ・エンコーダ108の符号化対象スライスのピクチャ内の位置が最下位かどうかを判定する(S201)。
ビデオ・エンコーダ108は、スライスサイズ決定部106からの判定結果の通知に基づいて、ピクチャ内で最下位行以外のPスライスのブロック数をNブロックとして符号化し(S106)、最下位行のPスライスは、符号化対象のピクチャと時間順に直前もしくは直後のピクチャの最下位行のPスライスのブロック数と同じにして符号化する(S105)。
(実施の形態4)
次に、実施の形態4について、以下説明する。なお、実施の形態1および実施の形態2と同じ構成および同じ動作については説明を省略する。
図19は、本発明の実施の形態4における時間順に連続するピクチャのスライス分割例を示す図である。ここで、斜線をつけたスライスは、Iスライスであり、その他のスライスはPスライスである。図15における実施の形態2のスライス分割方法と図19における本実施の形態4のスライス分割方法との違いは、実施の形態2のスライス分割方法に加えて、Iスライスを含まないピクチャを定期的に挿入している点にある。例えば、図19(f)、図19(h)および図19(l)がそれに相当する。
実施の形態2のように、ピクチャ全体のPスライスの境界がIスライスの挿入位置に応じて移動する場合は、実施の形態3に示すように、Iスライスを含まないピクチャのPスライスの境界位置を固定的に決定することはできない。それ故、実施の形態4では、ピクチャがIスライスを含まない場合には、符号化対象のピクチャと時間順に直前のPスライスの境界と同じ位置をスライス分割位置とするPスライスにする。
なお、ピクチャがIスライスを含まない場合において、符号化対象のピクチャと時間順に直後のPスライスの境界と同じ位置をスライス分割位置とするPスライスに分割してもよい。また、実施の形態3におけるIスライスを含まないピクチャと同じ位置を固定的にスライス分割位置とするPスライスに分割してもよい。
(実施の形態5)
次に、実施の形態5について、以下説明する。なお、実施の形態1〜実施の形態4と同じ構成および同じ動作については説明を省略する。
図20は、本発明の実施の形態5における時間順に連続するピクチャのスライス分割例を示す図である。ここで、斜線をつけたスライスは、Iスライスであり、その他のスライスはPスライスである。
ここまで(実施の形態1〜実施の形態4)の説明では、Iスライスを構成するブロックは、ピクチャを構成するブロックの行単位である場合について説明した。しかし、Iスライスを構成するブロックは、ピクチャを構成するブロックの行単位でなく、ピクチャを構成するブロックの行の途中の一部のブロックであってもよい。図20では、Iスライスを、ピクチャを構成するブロックの行の半分のブロックであるとし、ピクチャ毎に左半分がIスライスの場合と右半分がIスライスの場合を交互に符号化する。
このようにすることで、ネットワークの品質が高く、Iスライスの挿入頻度が少なくてもよい場合には、ビット数の多いイントラ符号化のブロック数を削減し、圧縮率を向上できる。
(実施の形態6)
次に、実施の形態6について説明する。実施の形態1〜実施の形態5では、Iスライスを構成するブロック数がPスライスを構成するブロック数より少ない場合について、説明した。実施の形態6では、Iスライスを構成するブロック数がPスライスを構成するブロック数と同じ場合を前提に説明する。
図21は、本発明の実施の形態6における時間順に連続するピクチャのスライス分割例を示す図である。ここで、斜線をつけたスライスは、Iスライスであり、その他のスライスはPスライスである。また、ここでは、それぞれのピクチャは5つのスライスで構成される。
図21において、ピクチャNからピクチャN+9は、この順で時間順に連続するピクチャである。Iスライスの位置は、ピクチャNからピクチャN+4まで順番にピクチャ内での位置が1つずつ下に移動し、ピクチャN+4でピクチャ内での最下位置になる。ピクチャN+5では、Iスライスを含まずPスライスのみとなっている。ピクチャN+6では、ピクチャ内での最上位置がIスライスの位置となっている。このように、図21では、時間順に連続するピクチャ内のIスライスの位置が移動する。
図22Aおよび図22Bは、本発明の実施の形態6における時間順に各スライスを符号化したビット数の例を示す図である。図22Aおよび図22Bでは、ストリームを図21で示すスライス単位でネットワーク伝送する場合に、時間順に各スライスを符号化したビット数の例を示している。図22Aは、図21で示すピクチャを構成するスライスを上から下の順序で符号化し、横軸に時刻、縦軸に当該スライスの符号化で発生するビット数の大きさのイメージを図示している。図21および図22Aから分かるように、ピクチャを構成するIスライスが時間順に上から下の順序、すなわち、周期的に循環する。
また、図22Bは、時間順に連続する複数のピクチャを符号化し、これらピクチャを符号化順に一定のビットレートで伝送している様子を示している。ここで、図22Bでは、横軸方向の幅(長さ)がビット数の大きさを示している。
ところで、上述したように、各ピクチャに同数のIスライスを含む図9Bに示す従来例の場合では、ピクチャN+4とピクチャN+5の間でIスライスが2回連続する。これに対して、図22Bに示す実施の形態6の場合、ピクチャN+4、ピクチャN+5、ピクチャN+6の間でも、Iスライスとその次のIスライスとの間のPスライスは5個と固定である。すなわち、ストリームをスライス単位でネットワーク伝送する場合に、Iスライスが2回連続することがないようにすることで、ネットワーク伝送するビット数を平準化している。
実施の形態6におけるスライス構造では、図22Bの区間A〜区間Eに示すように、いずれの区間での6個のスライス、すなわちどの連続する6個のスライスにも、1つのIスライスと5つのPスライスとが含まれることになる。
従って、スライス単位で1つのネットワーク伝送単位に変換して符号化制御を行う場合、“連続する6つのスライスのビット数の和が一定値”となるように符号化を制御すれば、いずれの区間でも一定のビット数となる符号化制御ができる。すなわち、ネットワーク伝送するビット数を平準化することができる。
ここで、例えば、連続する6つのスライスのビット数の和をΣBITとし、1つのIスライスと1つのPスライスとの符号化で発生するビット数を、それぞれRI、RPとする。
まず、区間AにおけるIスライスであるスライス0をBIT0(=ΣBIT×RI/(RI+5×RP))ビットで符号化しようとして制御した結果、実際に符号化で発生したビットがBIT0+ΔBIT0ビットであるとする。この場合、区間Aでは、ΔBIT0だけビット数が変化していることになる。
なお、区間AではΔBIT0だけビット数が変化したため、区間Bでは、ΣBIT−ΔBIT0ビットを割り当てる。また、実際に発生したビット数BIT0+ΔBIT0に基づいて、RIを更新する。
次に、スライス1をBIT1(=(ΣBIT−ΔBIT0)×RP/(RI+5×RP))ビットで符号化しようとして制御した結果、実際に符号化で発生したビットがBIT1+ΔBIT1ビットであるとする。この場合、区間BではΔBIT1だけビット数が変化していることになるため、上述同様に、区間CではΣBIT−ΔBIT1ビットを割り当てる。また、実際に発生したビット数BIT1+ΔBIT1に基づいて、RPを更新する。
次に、スライス2をBIT2(=(ΣBIT−ΔBIT1)×RP/(RI+5×RP))ビットで符号化しようとして制御した結果、実際に符号化で発生したビットがBIT2+ΔBIT2ビットであるとする。この場合、区間CではΔBIT2だけビット数が変化していることになるため、上述同様に、区間CではΣBIT−ΔBIT1ビットを割り当てる。また、実際に発生したビット数BIT2+ΔBIT2に基づいて、RPを更新する。
次に、上述同様に、スライス3以降を符号化して、変動したビット数を、符号化したスライスが属する区間の次の区間で調整する。また、実際に発生したスライスのビット数に基づいて、RPまたはRIを更新する。
以上のようにして、実際に発生したスライスのビット数に基づいて、RIまたはRPを更新することで、符号化対象画像が急な動きを含む場合あるいは、シーンチェンジなどの画像の統計量が大きく変化する場合でも、簡単な計算式で符号化対象スライスのビット数を導出でき、スライス単位のビット数を適切に制御することができる。
なお、ここで特に重要なことは、画像の統計量によって発生するビット数の変動があるものの、Iスライスのビット数はPスライスのビット数よりも遥かに大きいことである。その結果、実際に発生したビット数の誤差(ΔBIT0、ΔBIT1、ΔBIT2、など)の大きさは、Iスライスの場合に大きくなる。
図9Bで示した従来例のように、ネットワーク伝送時に、Iスライスが連続すると大きな誤差変化が連続するため、画質劣化しやすくなるだけでなく、符号化制御が難しくなり一定のビットレートにすることが困難になる。そこで、実施の形態6では、時間順に連続する複数のピクチャにおいて、あるピクチャのIスライスと次のピクチャのIスライスとの間にあるPスライスの個数またはブロック数を一定にする。それにより、ネットワーク伝送のために符号化するときに、実際に発生したビット数の誤差の変化量が抑制できる。
図23は、本発明の実施の形態6における画像符号化装置100が符号化する場合の処理を説明するフローチャートである。
イントラ/インター決定部104は、ブロック数カウンタ部102から通知されたブロック数から、ビデオ・エンコーダ108が符号化対象とするスライスがIスライスかPスライスかのいずれであるかを決定する。実施の形態6では、イントラ/インター決定部104は、Pスライスの行数を示す値をカウンタLとして保持している。イントラ/インター決定部104は、ブロック数カウンタ部102から通知されたブロック数と、カウンタLを用いてスライスの種類を決定する。
まず、イントラ/インター決定部104は、Pスライスの行数を示す値であるカウンタLを0で初期化(S302)した後、イントラ/インター決定部104は、ビデオ・エンコーダ108の符号化対象スライスがIスライスであるかを判定する。すなわち、イントラ/インター決定部104は、Pスライス行数を示す値であるカウンタLが0以下であるかどうかを判定する(S304)。
次に、イントラ/インター決定部104は、カウンタLが0以下である場合(S304の“はい”の場合)、ビデオ・エンコーダ108が符号化対象とするスライスの種類はIスライスであると決定する。ビデオ・エンコーダ108は、スライスサイズ決定部106で通知されるスライス分割位置と、イントラ/インター決定部104で通知されたスライスの種類とに基づき、符号化対象とするスライスをIスライスで符号化する(S306)。
ビデオ・エンコーダ108が、符号化対象とするスライスをIスライスで符号化した後、イントラ/インター決定部104は、カウンタLに、連続するピクチャにおけるIスライス挿入間隔である、Iスライスとその次のIスライスとの間のPスライスの行数の合計の値を代入する(S307)。
次に、イントラ/インター決定部104は、ビデオ・エンコーダ108が全ピクチャに対して符号化が完了したかどうかを確認する(S316)。
なお、イントラ/インター決定部104は、カウンタLが0より大きい場合(S304の“いいえ”の場合)、ビデオ・エンコーダ108が符号化対象とするスライスの種類はPスライスであると決定する。ビデオ・エンコーダ108は、スライスサイズ決定部106で通知されるスライス分割位置と、イントラ/インター決定部104で通知されたスライスの種類とに基づき、符号化対象とするスライスをPスライスで符号化する(S312)。
ビデオ・エンコーダ108が、符号化対象とするスライスをPスライスで符号化した後、イントラ/インター決定部104は、カウンタLから、符号化したPスライスの行数を減算する(S313)。
次に、イントラ/インター決定部104は、ビデオ・エンコーダ108が全ピクチャに対して符号化が完了したかどうかを確認する(S316)。完了していない場合には(S316の“いいえ”の場合)、S304〜S313の処理を全ての画像に対して繰り返す。
以上のように、本発明の実施の形態6における画像符号化装置100は、符号化する場合に、連続するピクチャにおけるIスライスとその次のIスライスとの間に一定数のPスライスを挿入することができる。
図24は、本発明の実施の形態6における画像符号化装置100が符号化する場合の処理を説明するフローチャートである。図24は、図23をさらに詳細にしたものであり、図23と同じ動作をする処理は同じ番号を付し、説明は省略する。
ここで、連続する所定数のスライスのビット数の和、すなわちIスライスのビット数と、Iスライスとその次のIスライスの間にあるPスライスの個数分のビット数との和をΣBITとする。
ここで、スライス分割位置決定部1066は、スライス種類取得部1064に取得されたスライスの種類と、ブロック数取得部1062に取得されたブロック数とに基づき、ビデオ・エンコーダ108が符号化対象とするスライスのスライス分割位置を決定する。実施の形態6では、スライス分割位置決定部1066は、スライス分割位置を決定するために用いるΣBITの変動値であるΔBITと、Iスライスのビット数の値を示すPIとPスライスのビット数の値を示すPRとを保持している。
まず、イントラ/インター決定部104は、Pスライス行数を示す値であるカウンタLを0で初期化する。また、スライス分割位置決定部1066は、ΣBITの変動値であるΔBITを0で初期化し、Iスライスのビット数の値を示すPIとPスライスのビット数の値を示すPRに初期値を代入する(S303)。
次に、イントラ/インター決定部104は、ビデオ・エンコーダ108の符号化対象スライスがIスライスであるかを判定する。すなわち、イントラ/インター決定部104は、Pスライス行数を示す値であるカウンタLが0以下であるかどうかを判定する(S304)。
イントラ/インター決定部104は、カウンタLが0以下である場合(S304の“はい”の場合)、ビデオ・エンコーダ108が符号化対象とするスライスの種類はIスライスであると決定する。スライスサイズ決定部106におけるスライス分割位置決定部1066は、Lが0以下である場合、(ΣBIT−ΔBIT)×RI/(RI+NP×RP)のビット数をIスライスに割り当てる(S305)。すなわち、スライス種類取得部1064に取得されたスライスの種類がIスライスである場合、スライスサイズ決定部106は、上述したビット数でスライス分割位置を決定し、決定したスライス分割位置をビデオ・エンコーダ108に通知する。ここで、NPは、連続するピクチャにおけるIスライスとその次のIスライスとの間にあるPスライスの個数である。
次に、ビデオ・エンコーダ108は、スライスサイズ決定部106で通知されるスライス分割位置と、イントラ/インター決定部104で通知されたスライスの種類とに基づき、符号化対象とするスライスをIスライスで符号化する(S306)。
ビデオ・エンコーダ108が、符号化対象とするスライスをIスライスで符号化した後、イントラ/インター決定部104は、カウンタLに、連続するピクチャにおけるIスライス挿入間隔である、Iスライスとその次のIスライスとの間のPスライスの行数の合計の値を代入する(S307)。
ここで、スライス分割位置決定部1066は、ビデオ・エンコーダ108がIスライスの符号に割り当てたビット数(ΣBIT−ΔBIT)×RI/(RI+NP×RP)と、実際にIスライスを符号化したビット数との差のビット数を保持しているΔBITに代入する(S308)。
また、スライス分割位置決定部1066は、ビデオ・エンコーダ108がIスライスを符号化したビット数を保持しているRIに代入する(S309)。
次に、イントラ/インター決定部104は、ビデオ・エンコーダ108が全ピクチャに対して符号化が完了したかどうかを確認する(S316)。
なお、S304において、カウンタLが0より大きければ(S304の“いいえ”の場合)、イントラ/インター決定部104は、ビデオ・エンコーダ108が符号化対象とするスライスの種類はPスライスであると決定する。スライスサイズ決定部106におけるスライス分割位置決定部1066は、カウンタLが0より大きい場合、(ΣBIT−ΔBIT)×RP/(RI+NP×RP)のビット数をPスライスに割り当てる(S311)。すなわち、スライス種類取得部1064に取得されたスライスの種類がPスライスである場合、スライスサイズ決定部106は、上述したビット数でスライス分割位置を決定し、決定したスライス分割位置をビデオ・エンコーダ108に通知する。
次に、ビデオ・エンコーダ108は、スライスサイズ決定部106で通知されるスライス分割位置と、イントラ/インター決定部104で通知されたスライスの種類とに基づき、符号化対象とするスライスをPスライスで符号化する(S312)。
ビデオ・エンコーダ108が、符号化対象とするスライスをPスライスで符号化した後、イントラ/インター決定部104は、カウンタLから、符号化したPスライスの行数を減算する(S313)。
ここで、スライス分割位置決定部1066は、ビデオ・エンコーダ108がPスライスの符号に割り当てたビット数(ΣBIT−ΔBIT)×RP/(RI+NP×RP)と、実際にPスライスを符号化したビット数との差のビット数を保持しているΔBITに代入する(S314)。
また、スライス分割位置決定部1066は、ビデオ・エンコーダ108がPスライスを符号化したビット数をRPに代入する(S315)。
次に、イントラ/インター決定部104は、ビデオ・エンコーダ108が全ピクチャに対して符号化が完了したかどうかを確認する(S316)。完了していない場合には(S316の“いいえ”の場合)、S304〜S315の処理を全ての画像に対して繰り返す(S316)。
以上のように、本発明の実施の形態6における画像符号化装置100は、連続するピクチャにおけるIスライスとその次のIスライスとの間に一定数のPスライスを挿入し、スライスに適切なビット割り当てを行った符号化を行う。
以上、実施の形態6によれば、ある時点でストリームが消失してPスライスの画質が劣化しても、ストリームが消失したPスライスの位置のスライスが、時間順に後のピクチャでIスライスとなった際に、ピクチャが正しく復号することができ、画像劣化のあったストリームを回復できる。それ故、その画質劣化が無限に伝播することを防止できる。さらに、ネットワーク伝送するビット数を平準化することができるので、パイプライン化あるいは並列化を阻害することなく、ストリーム消失の頻度を低めつつ、処理量削減と圧縮率とを向上することができる。
なお、図23および図24で示す処理を行う際には、スライス分割位置決定部1066が決定するIスライスおよびPスライスの分割位置は、同じブロック数の時点をスライス分割位置と決定することを前提に説明している。しかしながら、実施の形態1〜5と同様に、IスライスおよびPスライスで異なるブロック数の時点をIスライスおよびPスライスのスライス分割位置としてもよく、その場合も本発明の範囲内に含まれる。
また、実施の形態6では、説明を簡単にするために、Iスライスを構成するブロック数とPスライスを構成するブロック数とが同じ場合を前提に説明したが、それに限定されない。例えば、Iスライスを構成するブロック数よりもPスライスを構成するブロック数が多くてもよい。さらに、実施の形態1〜5で示したように、ピクチャ内のIスライスの位置によりPスライスを構成するブロック数が調整されるようにPスライスを構成するブロック数は一定でなくてよい。
(実施の形態7)
次に、実施の形態7について説明する。
図25は、本発明の実施の形態7における時間順に連続するピクチャのスライス分割例を示す図である。
図21における実施の形態6のスライス分割方法と図25における本実施の形態4のスライス分割方法との違いは、実施の形態6のスライス分割方法に加えて、Iスライスを含まないピクチャを定期的に挿入している点にある。例えば、図25におけるピクチャN+1、ピクチャN+3、ピクチャN+5、ピクチャN+9およびピクチャN+12がそれに相当する。
このように、Iスライスを含まないピクチャを定期的に挿入している場合も、時間順に連続するピクチャにおけるIスライスとその次のIスライスとの間にあるPスライスのブロック数を一定にすることで、実施の形態6と同様の効果が得られる。
なお、上述したように、ピクチャを構成するスライス数が一定、かつ、IスライスとPスライスとを構成するブロック数が一定の場合に、時間順に連続するピクチャにおけるIスライスとその次のIスライスとの間のPスライス数を一定にすることで、実施の形態6と同様の効果が得られる。言い換えると、時間順に連続するピクチャにおけるIスライスがピクチャ内で最大1つである図25の例の場合に限らない。時間的に連続するピクチャ内におけるIスライスが2つ以上でもよい。また時間順に連続するピクチャにおけるIスライスとその次のIスライスとの間にあるPスライスの個数は10である、図25の例の場合に限らない。ピクチャを構成するスライス数が一定、かつ、IスライスとPスライスとを構成するブロック数が一定の場合に、時間順に連続するピクチャにおけるIスライスとその次のIスライスとの間のPスライス数を一定にすればよい。以下、その例を示す。
図26は、本発明の実施の形態7における時間順に連続するピクチャのスライス分割例を示す図である。図27Aおよび図27Bは、本発明の実施の形態7における時間順に各スライスを符号化したビット数の例を示す図である。
図21におけるスライス分割方法と図26におけるスライス分割方法との違いは、時間順に連続するピクチャにおけるIスライスがピクチャ内で最大1つではなく2つである点である。また、時間順に連続するピクチャにおけるIスライスとその次のIスライスとの間にあるPスライスの個数は2個である。この場合でも、図27Aおよび図27Bに示すように、時間順に連続するピクチャにおけるIスライスとその次のIスライスとの間のPスライス数を一定(ここでは2個)にすることで、ネットワーク伝送するビット数を平準化することができ、実施の形態6と同様の効果が得られる。
また、図28、図29、図30および図31は、本発明の実施の形態7における時間順に連続するピクチャの別のスライス分割例を示す図である。
図28におけるスライス分割方法では、時間順に連続するピクチャにおけるIスライスがピクチャ内で最大2つである。また、時間順に連続するピクチャにおけるIスライスとその次のIスライスとの間にあるPスライスの個数は2個および1個である。
図29および図30におけるスライス分割方法では、時間順に連続するピクチャにおけるIスライスがピクチャ内で最大2つである。また、時間順に連続するピクチャにおけるIスライスとその次のIスライスの間にあるPスライスの個数とその次のIスライスとその次の次のIスライスの間にあるPスライスの個数は3個および2個である。
図31におけるスライス分割方法では、時間順に連続するピクチャにおけるIスライスがピクチャ内で最大3つである。また、時間順に連続するピクチャにおける3つのIスライスの間にあるPスライスの個数は3個、3個および2個である。
これらの場合でも、時間順に連続するピクチャにおけるIスライスとその次のIスライスとの間のPスライス数を一定にすることができるので、ネットワーク伝送するビット数を平準化することができ、実施の形態6と同様の効果が得られる。
なお、ピクチャ内のIスライスの位置が最下位行に移動する次のピクチャが、Iスライスを含まないPスライスのみのピクチャとして符号化することでビットの平準化を図ってもよい。その例を変形例として以下に説明する。
図32は、本発明の実施の形態7における時間順に連続するピクチャのスライス分割の変形例を示す図である。図33Aおよび図33Bは、図32における時間順に各スライスを符号化したビット数の例を示す図である。
図21におけるスライス分割方法と図32におけるスライス分割方法との違いは、時間順に連続するピクチャのそれぞれに含まれるIスライスが1つではなく2つである点である。また、ピクチャ内のIスライスの位置が、最下位行に移動した次のピクチャは、Iスライスを含まないPスライスのみのピクチャとして符号化され、次のピクチャで最上位行に戻るように符号化される。この場合でも、図33Aおよび図33Bに示すように、ビット数に偏りのあるIスライスが連続してネットワーク伝送されないようにできるので、ネットワーク伝送するビット数を平準化することができる。図32におけるスライス分割方法では、時間順に連続するピクチャにおけるIスライスとその次のIスライスとの間のPスライス数を一定にする場合に比べて、ビット数の偏りがあり、平準化という点では劣るが、Iスライスが連続することがないため、ネットワークでのストリーム消失を低減することができる。
また、図34は、図35、図36および図37は、本発明の実施の形態7における時間順に連続するピクチャの別のスライス分割の変形例を示す図である。
図34、図35および図36におけるスライス分割方法では、時間順に連続するピクチャにおけるIスライスがピクチャ内で最大2つである。また、ピクチャ内のIスライスの位置が、最下位行に移動した次のピクチャ(図34ではピクチャN+3)は、Iスライスを含まないPスライスのみのピクチャとして符号化され、次のピクチャ(図34ではピクチャN+4)で最上位行に戻るように符号化される。ここで、図34に示すように各ピクチャにおけるIスライスの間にあるPスライスの個数は一定(図34では2個および1個)である。
図37におけるスライス分割方法では、時間順に連続するピクチャにおけるIスライスがピクチャ内で最大3つであり、その他は図34、図35および図36と同様である。
なお、スライス分割方法は図26〜図37に示す例に限定されない。時間順に連続するピクチャのそれぞれに含まれる複数のIスライスの位置は違っていてもよい。また、時間順に連続するピクチャのそれぞれに含まれるスライス数も、それぞれのピクチャに含まれるIスライスの数も任意に決めてよい。
以上、実施の形態7によれば、ある時点でストリームが消失してPスライスの画質が劣化しても、ストリームが消失したPスライスの位置のスライスが、時間順に後のピクチャでIスライスとなった際に、ピクチャが正しく復号することができ、画像劣化のあったストリームを回復できる。それ故、画質劣化が無限に伝播することを防止できる。それにより、パイプライン化あるいは並列化を阻害することなく、ストリーム消失の頻度を低めつつ、処理量削減と圧縮率とを向上する画像符号化方法および画像符号化装置を実現できる。
また、時間順に連続するピクチャにおけるIスライスとその次のIスライスとの間のPスライスのブロック数を一定にすることで、連続した所定数のスライス単位で一定のビットレートとなる制御が容易になり、動きの大きい動画あるいは、シーンチェンジを含む動画に対しても、大きな画質劣化なく一定のビットレートでの符号化が実現できるので、ストリーム消失の頻度をさらに低めることができる。
(実施の形態8)
実施の形態1〜7では、時間順に連続するピクチャにおいて、Iスライスの位置をピクチャ毎に、ピクチャの上端から下端に移動させることにより、画質劣化が無限に伝播することを防止する画像符号化方法および画像化装置について説明した。実施の形態1〜7における画像符号化装置は、ある時点でストリームが消失してPスライスの画質が劣化しても、ストリームが消失したPスライスの位置のスライスが、時間順に後のピクチャでIスライスとなった際に、ピクチャが正しく復号することができる。それにより、画質劣化が無限に伝播することを防止できる。
しかし、実施の形態1〜7の画像符号化装置によるストリームでは、ピクチャがIスライスとPスライスとを含む構成をとるため、Iスライスのみを含むIピクチャが存在せず、MPEG−2の場合におけるGOP(Group Of Pictures)構造を明確に定義できない。そのため、このストリームを受けて視聴する視聴者が、このストリームを途中再生するとき、視聴者が違和感を受ける映像が表示される可能性がある。
以下、GOP構造について説明したのち、視聴者が違和感を受ける可能性について説明する。
ピクチャ間の画素の相関を利用した圧縮を行うと、前のピクチャの画素がないと正しく画素が復号できなくなる。そこで、ピクチャ内の画素の相関を利用した圧縮のみが行われるピクチャであるI(イントラ)ピクチャと、ピクチャ間の画素の相関を利用した圧縮が行われるピクチャであるP(インター)ピクチャを組み合わせた符号化を用いるGOP構造がMPEG−1やMPEG−2で導入されている。このGOP構造を用いることで、Iピクチャ以降のピクチャを正しく復号できる。
図38は、MPEG−2のピクチャのGOP構造を示す図である。図38に示すようにIピクチャ1501とそれに続く複数のPピクチャ1502とで構成されるピクチャ群をGOPと呼ぶ。GOPの先頭はIピクチャ1501であるから、GOPをまたぐピクチャ間の画素の相関を利用した圧縮は行われない。これにより、受信側の画像復号化装置は、GOP単位でピクチャを正しく復号することが可能である。このGOPは、ランダムアクセス時、および途中から復号を開始する場合の復号開始単位として、画像復号化装置が用いることができる。
また、ネットワークを介して符号化した画像データ、すなわちストリームを伝送する際に、ネットワーク輻輳などによりストリームの一部が消失した場合には、受信側で消失したストリームに対応する箇所の画像を正しく復号できない。さらに、ピクチャ間の画素の相関を利用した圧縮では正しく復号できない状態が後続のピクチャ復号にも影響する。つまり、画質劣化が後続のピクチャにも伝播する。しかし、GOP構造では、GOPをまたぐピクチャ間の画素の相関を利用した圧縮は行われないので、GOP単位で画質劣化の伝播も停止する。
図39は、MPEG−2のストリーム構造を示す図である。図39に示すように、Iピクチャ501の符号化データ1511、およびPピクチャ1502の符号化データ1512は、それぞれ図38に示すGOPを構成する順序でストリームに配置される。また、Iピクチャ1501の符号化データ1511およびPピクチャ1502の符号化データ1512のそれぞれは、複数のスライスの符号化データを含む。ここで、スライスとは、ブロックを複数まとめた符号化単位である。
Iピクチャ1501は、ピクチャ内の画素の相関を利用した圧縮のみが行われる複数のI(イントラ)スライス1521で構成される。Pピクチャ1502は、ピクチャ間の画素の相関を利用した圧縮が行われる複数のP(インター)スライス1522で構成される。つまり、Iピクチャ1501の符号化データ1511は、複数のIスライス1521の符号化データ1514を含み、Pピクチャ502の符号化データ1512は、複数のPスライス1522の符号化データ1514を含む。
このIスライス1521は、当該Iスライス1521内の画素相関を利用して符号化されるスライス内符号化により符号化される。また、Pスライス1522は、スライス内符号化、または、当該Pスライス1522と他のスライスとの間の画素相関を利用して符号化されるスライス間符号化により符号化される。つまり、Pスライス1522は、当該Pスライス1522内の画素相関、または当該ピクチャ内の当該Pスライス1522以外のスライスとの間の画素相関、または当該Pスライス1522と他のピクチャとの間の画素相関を利用して符号化される。
さらに、GOPの先頭には、GOP内の全てのピクチャに共通に用いられる共通データ1513が付与される。従って、画像復号化装置は、GOP単位でストリームを正しく取得できれば、GOPに含まれるピクチャを全て正しく復号できる。
このように、画像復号化装置は、ランダムアクセス時、および途中再生時には、このGOP単位でストリームを再生できる。
一方、H.264では、1つのピクチャにIスライス1521とPスライス1522とを混在可能である。なお、H.264においても、MPEG−2と同様に、Iスライス1521は、スライス内符号化され、Pスライス1522は、スライス内符号化、またはスライス間符号化される。
図40は、H.264におけるピクチャにおけるスライス分割例を示す図である。図40に示すように、H.264では、MPEG−2と異なり、ピクチャをIスライス1521とPスライス1522とで構成することが可能である。ここでIスライス1521は、画面間の画素の相関を利用しないで符号化されるので、以前のピクチャの画素の有無に関わらず正しく復号できる。
しかし、図40に示すように各ピクチャがIスライス1521とPスライス1522とを含む場合、MPEG−2の場合のように、Iスライス1521のみを含むIピクチャ1501が存在しない。これにより、Iピクチャ1501の直前に共通データ1513を配置できない。つまり、実施の形態1〜7における画像符号化方法では、明確にGOPを定義できないため、途中再生時に、視聴者が違和感を受ける映像が表示される可能性がある。
具体的には、Iスライス1521がピクチャの中央付近に位置する場合、当該中央付近の画像のみが最初に表示されるために、視聴者が違和感を受ける可能性がある。
そこで、以下では、実施の形態1〜7における画像符号化装置が、さらに、途中再生された場合に、視聴者が違和感を受け難い映像が表示される動画像ストリームを生成する例について説明する。
図41は、本発明に係る画像符号化装置1000の構成を示すブロック図である。
画像符号化装置1000は、ブロック数カウンタ部1103と、イントラ/インター決定部1104と、スライスサイズ決定部106と、ビデオ・エンコーダ108と、共通データ生成判定部1106と、共通データ生成部1107とを備える。なお、図10と同様の要素には同一の符号を付しており、詳細な説明は省略する。
ブロック数カウンタ部1103は、符号化するブロック数をカウントすることにより、符号化対象ブロックがピクチャのどの位置に対応するかを計測する。また、ブロック数カウンタ部1103は、符号化対象ブロックがピクチャのどの位置に対応するかを示すブロック位置情報を生成し、生成したブロック位置情報をイントラ/インター決定部1104および共通データ生成判定部1106に通知する。
イントラ/インター決定部1104は、ブロック数カウンタ部102から通知されたブロック位置情報を用いて、符号化対象のスライスがIスライスかPスライスかのいずれであるかを決定する。言い換えると、イントラ/インター決定部1104は、符号化対象ピクチャをIスライスとPスライスとに分割する。
また、イントラ/インター決定部1104は、決定したスライスの種類(IスライスまたはPスライス)を示すスライス情報をビデオ・エンコーダ108におけるスライス符号化部1105および共通データ生成判定部1106に通知する。
スライスサイズ決定部106は、実施の形態1〜7で説明したのと同じ構成要素であるので説明を省略する。
共通データ生成判定部1106は、イントラ/インター決定部1104から符号化対象スライスがIスライスであることが通知された場合、ブロック数カウンタ部1103により通知されたブロック位置情報を用いて、符号化対象のIスライスがピクチャの上端に位置するか否かを判定する。また、共通データ生成判定部1106は、判定結果を共通データ生成部1107に通知する。
共通データ生成部1107は、共通データ生成判定部1106により符号化対象スライスが、Iスライスであり、かつピクチャの上端に位置するスライスであることが通知された場合、複数ピクチャに共通のデータを符号化することにより共通データを生成する。
ビデオ・エンコーダ108は、スライス符号化部1105と、ストリーム生成部1108とから構成される。ビデオ・エンコーダ108は、スライスサイズ決定部106で通知されるスライス分割位置毎のスライス単位で、かつイントラ/インター決定部104で通知されたスライスの種類を示すスライス情報に基づいて、ブロック単位に入力画像を使用可能な符号化方法(イントラ符号化もしくはインター符号化)で、符号化する。
具体的には、スライス符号化部1105は、スライスサイズ決定部106で通知されるスライス分割位置毎のスライス単位で、かつ、イントラ/インター決定部1104から通知されたスライス情報に基づいて、入力画像をIスライスまたはPスライスとして符号化することによりスライス単位の符号化データを生成する。ストリーム生成部1108は、共通データ生成部1107が共通データを生成した場合、共通データ生成部1107が生成した共通データ1211の次にスライス符号化部1105が符号化した符号化データを配置したストリームを出力する。また、ストリーム生成部1108は、共通データ生成部1107が共通データを生成しない場合は、スライス符号化部1105が符号化した符号化データのみを配置したストリームを出力する。
以上の構成により、画像符号化装置1000は、実施の形態1〜7で示したように、時間順に連続するピクチャにおいて、Iスライスの位置をピクチャ毎に、ピクチャの上端から下端に移動させる。さらに、画像符号化装置1000は、複数ピクチャに共通のデータをIスライスの位置が上端のピクチャの直前に配置したストリームを生成する。このストリームを途中再生した場合、ピクチャの上端から下端に向かい画像が正しく表示される領域が広がっていくので、視聴者の違和感を低減できる。
なお、画像符号化装置1000において、Iスライスの位置をピクチャ毎に、ピクチャの上端から下端に移動させる方法は、下記の1)または2)でもよく1)および2)を組み合わせた方法でもよい。
1)Iスライスを構成するブロック数よりもPスライスを構成するブロック数を大きくする。
2)連続するピクチャにおけるIスライスとその次のIスライスとの間に挿入するPスライスを一定にする。
また、画像符号化装置1000において、スライスサイズ決定部106を明示的に備えないとしてもよい。その場合、画像符号化装置において、Iスライスの位置をピクチャ毎に、ピクチャの上端から下端に移動させるとして、複数ピクチャに共通のデータをIスライスの位置が上端のピクチャの直前に配置したストリームを生成させてもよい。その場合の画像符号化装置を前提に以下の実施の形態を説明する。
(実施の形態9)
本発明の実施の形態9に係る画像符号化装置1100は、Iスライスの位置をピクチャ毎に、ピクチャの上端から下端に移動させる。さらに、画像符号化装置1100は、複数ピクチャに共通のデータをIスライスの位置が上端のピクチャの直前に配置したストリームを生成する。このストリームを途中再生した場合、ピクチャの上端から下端に向かい画像が正しく表示される領域が広がっていくので、視聴者の違和感を低減できる。また、実施の形態9では、各ピクチャを行単位でスライス分割することを前提に以下説明する。
まず、本発明の実施の形態9に係る画像符号化装置1100の構成を説明する。
図42は、本発明の実施の形態9に係る画像符号化装置1100の構成を示すブロック図である。
図42に示す画像符号化装置1100は、入力画像1101に含まれる複数のピクチャの各々を、それぞれが複数ブロックを含む複数のスライスに分割する。さらに、画像符号化装置1100は、分割した各スライスをブロック単位で符号化し、符号化した符号化データを含むストリーム1102を生成し、生成したストリーム1102を出力する。
この画像符号化装置1100は、ブロック数カウンタ部1103と、イントラ/インター決定部1104と、スライス符号化部1105と、共通データ生成判定部1106と、共通データ生成部1107と、ストリーム生成部1108とを備える。
ブロック数カウンタ部1103は、符号化するブロック数をカウントすることにより、符号化対象ブロックがピクチャのどの位置に対応するかを計測する。また、ブロック数カウンタ部1103は、符号化対象ブロックがピクチャのどの位置に対応するかを示すブロック位置情報を生成し、生成したブロック位置情報をイントラ/インター決定部1104および共通データ生成判定部1106に通知する。
イントラ/インター決定部1104は、ブロック数カウンタ部1103から通知されたブロック位置情報を用いて、符号化対象のスライスがIスライス1201かPスライス1202かを決定する。言い換えると、イントラ/インター決定部1104は、符号化対象ピクチャをIスライス1201とPスライス1202とに分割する。
具体的には、イントラ/インター決定部1104は、連続する複数のピクチャにおいて、Iスライス1201の位置がピクチャの上端から下端へとピクチャ間で、表示順に順次移動するように(ずれるように)、符号化対象スライスをIスライス1201またはPスライス1202に決定する。さらに、イントラ/インター決定部1104は、予め設定された数のピクチャ毎にIスライス1201の上端から下端への移動が繰り返されるように、符号化対象スライスをIスライス1201またはPスライス1202に決定する。
また、イントラ/インター決定部1104は、決定した、符号化対象スライスがIスライス1201であるかPスライス1202であるかを示すスライス情報をスライス符号化部1105および共通データ生成判定部1106に通知する。
図43は、画像符号化装置1100によるピクチャ1200のスライス分割例を示す図である。図43に示すピクチャ1200a〜1200lは、この順に連続するピクチャである。なお、複数のピクチャ1200a〜1200lを特に区別しない場合には、ピクチャ1200と記す。
図43に示すように、複数のピクチャ1200は、それぞれ(斜線で塗りつぶした)Iスライス1201と、(斜線で塗りつぶしていない)Pスライス1202とを含む。ここで、Iスライス1201は、(ピクチャ1200内の)当該Iスライス1201内の画素の相関を利用した圧縮(スライス内符号化)のみが行われるスライスである。そして、Pスライス1202は、当該Pスライス1202内の画素の相関(スライス内符号化)、または当該Pスライス1202と当該ピクチャ1200に含まれる当該Pスライス1202以外のスライスとの画素の相関、または当該Pスライス1202と他のピクチャ1200との間の画素の相関を利用した圧縮(スライス間符号化)が行われるスライスである。つまり、Iスライス1201は、スライス内符号化が行われるブロックのみを含み、Pスライス1202は、スライス間符号化が行われるブロックのみを含む、または、スライス内符号化が行われるブロックとスライス間符号化が行われるブロックとを含む。
また、ピクチャ1200aでは、Iスライス1201はピクチャ1200aの上端に位置し、次のピクチャ1200bではIスライス1201の位置は1スライス下に移動する。また、Iスライス1201の位置は、ピクチャ1200毎に順次、1スライス下に移動する。Iスライス1201が下端に移動したピクチャ1200jの次のピクチャ1200kでは、Iスライス1201は上端に戻る。
本発明の実施の形態9では、Iスライス1201が1行目に位置するピクチャ1200aおよび1200kをGOPの先頭のピクチャとする。従って、図43では、ピクチャ1200a〜1200jが1つのGOPを構成し、ピクチャ1200k以降は別のGOPを構成する。
このように、本発明の実施の形態9における各ピクチャ1200は、参照ピクチャのストリーム消失に強いIスライス1201と、参照ピクチャのストリーム消失には弱いが圧縮率の良いPスライス1202とを含む。さらに、ピクチャ内におけるIスライス1201の位置は、ピクチャ毎に循環される。これにより、ストリームの一部がネットワーク伝送中にパケットロス等で消失することによりPスライス1202の画質が劣化しても、次に画質劣化が生じた位置にIスライス1201が位置するピクチャにおいて、画質劣化なく復号できる。このように、本発明の実施の形態9に係る画像符号化装置100は、画質劣化が無限に伝播することを防止できる。
また、本発明の実施の形態9では、Pスライス1202と比べてビット数の多いIスライス1201が全てのピクチャに同等数(同等ブロック数)含まれる。これにより、各ピクチャ単位でのビット数はほぼ一定になる。ここで、符号化したストリームを、ネットワークを介して、一定ビットレートで伝送する場合、受信側が、受信したストリームを復号し、復号したピクチャを一定間隔で途切れなく表示するためには、最も伝送に時間がかかるピクチャ1200を伝送し終わるのに必要な時間分だけの遅延時間が必要になる。よって、本発明の実施の形態9では、ピクチャ単位のビット数を一定にする(Iスライス1201が多いピクチャをなくす)ことで、ピクチャ1200のビット数の最大値を小さくできるので、ピクチャ1200の伝送にかかる時間の最大値を小さくでき、これにより遅延時間を削減できる。
スライス符号化部1105は、入力画像1101をイントラ/インター決定部1104から通知されたスライス情報に基づいて、Iスライス1201またはPスライス1202として符号化することによりスライス単位の符号化データ(以下、スライス符号化データ)を生成する。具体的には、スライス符号化部1105は、Iスライス1201を当該Iスライス1201内の画素相関を利用してブロック単位で符号化する。そして、スライス符号化部1105は、Pスライス1202を、当該Pスライス1202内の画素相関、または当該Pスライス1202と当該ピクチャ1200に含まれる当該Pスライス1202以外のスライスとの画素相関、または当該Pスライス1202と他のピクチャとの間の画素相関を利用してブロック単位で符号化する。これらにより、ピクチャ単位の符号化データ(以下、ピクチャ符号化データ)を生成する。このピクチャ符号化データは、複数のスライス符号化データを含む。
共通データ生成判定部1106は、イントラ/インター決定部1104から符号化対象スライスがIスライス1201であることが通知された場合、ブロック数カウンタ部1103により通知されたブロック位置情報を用いて、符号化対象のIスライス1201がピクチャの上端に位置するか否かを判定する。また、共通データ生成判定部1106は、判定結果を共通データ生成部1107に通知する。
共通データ生成部1107は、共通データ生成判定部1106により符号化対象スライスが、Iスライス1201であり、かつピクチャの上端に位置するスライスであることが通知された場合、複数ピクチャに共通のデータを符号化することにより共通データ1211を生成する。
ストリーム生成部1108は、共通データ生成部1107が共通データ1211を生成した場合、共通データ生成部1107が生成した共通データ1211の次にスライス符号化部1105が符号化した符号化データを配置したストリーム1102を出力する。また、ストリーム生成部1108は、共通データ生成部1107が共通データ1211を生成しない場合は、スライス符号化部1105が符号化した符号化データのみを配置したストリーム1102を出力する。つまり、ストリーム生成部1108は、Iスライス1201が一方端に位置するピクチャが符号化されたピクチャ符号化データの直前に、共通データ1211を配置する。また、ストリーム生成部1108は、Iスライス1201が一方端に位置するピクチャが符号化されたピクチャ符号化データの直前以外には共通データ1211を配置しない。
図44は、本発明の実施の形態9に画像符号化装置1100により生成された符号化ストリーム1102の構造を示す図である。また、図44は、図42に示すピクチャを符号化した場合のストリーム1102の構成を示す図である。
図44に示すように、ストリーム1102は、共通データ1211と、複数のピクチャ符号化データ1212a〜1212jとを含む。複数のピクチャ符号化データ1212a〜1212jは、それぞれ複数のピクチャ1200a〜1200jが符号化された符号化データである。また、ストリーム1102において、ピクチャ1200a〜1200jの順序でピクチャ符号化データ1212a〜1212jが配置される。なお、複数のピクチャ符号化データ1212a〜1212jを特に区別しない場合には、ピクチャ符号化データ1212と記す。
各ピクチャ符号化データ1212は、複数のスライス符号化データ1213を含む。複数のスライス符号化データ1213は、それぞれ、Iスライス1201またはPスライス1202が符号化されたデータである。つまり、各ピクチャ符号化データ1212は、それぞれ、Iスライス1201が符号化されたスライス符号化データ1213と、Pスライス1202が符号化されたスライス符号化データ1213とを含む。
また、各ピクチャ符号化データ1212内での、Iスライス1201が符号化されたスライス符号化データ1213の位置は、ピクチャ符号化データ1212内の先頭から末尾へピクチャ符号化データ1212間で順次移動する。また、GOP毎に先頭から末尾への移動が繰り返されるように配置される。
また、GOPの先頭に、共通データ1211と、GOPの先頭であることを示す識別子(図示せず)とが配置される。つまり、Iスライス1201が符号化されたスライス符号化データ1213が、ピクチャ符号化データ1212内で先頭に位置するピクチャ符号化データ1212aの直前に、共通データ1211と上記識別子とが配置される。
この共通データ1211は、画像復号化装置における、GOPに含まれるピクチャの復号化に共通に用いられるデータが符号化されたデータである。具体的には、当該共通に用いられるデータは、ピクチャの画像サイズ、参照ピクチャの情報、および量子化マトリックス等を含む。ここで、参照ピクチャの情報とは、各ピクチャが参照可能なピクチャの範囲(最大何枚前までのピクチャを参照可能か、およびどのピクチャを参照可能か)等を示す情報である。なお、共通データ1211は、ストリーム1102に含まれるピクチャの復号化に共通に用いられるデータともいえる。
また、画像復号化装置では、この共通データ1211を取得するまでは、ピクチャ1200を正しく符号化できない。つまり、画像復号化装置は、途中再生等を行う場合には、共通データ1211以降に配置されたピクチャのみを正しく復号したうえで、表示できる。言い換えると、画像復号化装置は、途中再生等を行う場合に、GOP単位でピクチャを復号できる。
ここで、本発明の実施の形態9では、MPEG−2の場合と異なり、GOPの先頭ピクチャ1200aがPスライス1202を含む。従って、インター符号化が行われるPスライス1202は、GOPの最初のピクチャ1200aでは正しく復号することができない。一方、Iスライス1201は正しく復号できる。よって、正しく復号されたIスライス1201を参照する、後続のピクチャに含まれるPスライス1202も正しく復号できる。
図45は、本発明の実施の形態9におけるスライス分割でGOPの最初から正しく復号できるスライスを説明するための図である。図45に示すように、正しく復号できるスライス1204は、GOPの先頭のピクチャ1200aでは最初の1スライス(Iスライス1201)だけであるが、後続のピクチャ1200になるにつれ、徐々に下方のスライスも正しく復号できるようになる。これにより、GOPの最後のピクチャ1200jでは全てのスライスを正しく復号できる。
なお、このように確実に正しく復号できるのは、Pスライス1202が参照する(画素相関を利用する)範囲が、各ピクチャ1200においてIスライス1201よりも上(先頭)側に位置するスライスまたはIスライス1201に限定される場合である。従って、Pスライス1202を符号化する際は、Iスライス1201よりも上(先頭)側に位置するスライスまたはIスライス1201内の画素を参照するスライス間符号化か、スライス内符号化を行うことが望ましい。しかし、そのような限定がない場合であっても、一般的に参照するのは時間的に近い(例えば直前の)ピクチャの同じ位置のスライスであることが多いことから、以前に生じたエラーが、エラーを生じた画素と同じ位置の画素を含むスライスがIスライスであるピクチャ以降のピクチャにまで伝播する可能性は大幅に低減する。
このように、ストリーム1102を復号する場合、画像復号化装置は、ピクチャ1200の上端から徐々に正しい画像を復号し表示できる。
図46は、画像復号化装置によるストリーム1102の表示例を示す図である。
図46に示すように、ピクチャ1200の上端から下方に向けて徐々に画像が表示される領域が広がっていく。この表示方法は、画面のスクロールと同様であり、日常よく目にする表示方法と似ているので視聴者が違和感を受け難い。このように、本発明に係る画像符号化装置1100は、GOPを途中復号の開始位置として使用してそれ以降のGOPを連続して復号する、いわゆる途中再生時において、視聴者が違和感を受け難い映像を画像復号化装置が表示できる動画像ストリーム1102を生成できる。
ここで、画像復号化装置がGOP単位でランダムに復号する場合には、GOPの最後のピクチャ1200jまでは、全ての画像が正しく復号できないので、ランダムアクセスに対して本発明は必ずしも適しているとはいえない。しかしながら、上述したように、本発明は、途中再生用途の場合は、ピクチャ1200k以降に位置するGOPのスライスは全て正しく復号でき、かつ途中再生開始時の、視聴者の違和感を低減できる。さらに、ネットワーク伝送におけるストリーム消失が生じた場合も、GOPは連続的に復号される。つまり、本発明は、ストリーム消失が生じた場合にも、画像復号化装置が、ピクチャに含まれる全てのスライスを2つ目のGOPから正しく復号できるという効果を有する。
さらに、GOPにおいて、Iスライス1201の位置をピクチャ1200の上端位置から開始するのには、もう1つの利点がある。
図47は、比較のための図であり、上から3スライス目にIスライス1201が位置するピクチャがGOP先頭の場合に正しく復号できるスライスを説明するための図である。図47に示すピクチャ1215a〜1215fは、この順に連続したピクチャであり、ピクチャ1215aはGOPの先頭ピクチャである。
図48A〜Dは、本発明の実施の形態9における参照ピクチャと対象ピクチャとの関係を示す図である。図48Aおよび図48Bは、本発明のようにGOPの先頭ピクチャの上端にIスライス1201が位置する場合の例であり、図48Cおよび図48Dは、GOPの先頭ピクチャの上から3スライス目にIスライス1201が位置する場合の例である。
Pスライス1202を正しく復号するためには、参照ピクチャにおいて正しく復号したIスライス1201または正しく復号できるPスライス1202を参照した符号化が行われているか、スライス内の画素を参照した符号化が行われていなければならない。スライス間の画素を参照して復号する場合に、本発明の場合では、図45に示すように、処理するピクチャ1200のIスライス1201の位置より上の位置のスライスは全て正しく復号できる。よって、図48Aおよび図48Bに示すように対象ピクチャにおいてPスライス1202が参照可能な参照ピクチャのスライスは、“対象ピクチャにおけるIスライス1201から上の位置のスライスの画素のみを参照した符号化を行う”という簡単な規則になるので、符号化装置の実装が容易である。
一方、GOPの先頭ピクチャが上から4スライス目にIスライス1201が位置する場合、図47に示すように上から3スライス目よりも上のスライスは正しく復号できていない。よって、図48Cおよび図48Dに示すように、対象ピクチャのPスライス1202が参照可能な参照ピクチャのスライスは、“対象ピクチャにおけるIスライス1201から上の位置のスライスであり、かつ上から4スライス目から下に位置するスライス”という規則になり条件が増えるので実装が複雑になる。
例えば、本発明に対応する図48Aおよび図48Bに示すPスライス1202aおよび1202bでは、“対象ピクチャにおけるIスライス1201から上の位置のスライスの画素のみを参照した符号化を行う”という規則のみに従い、参照可能なスライスを判定できる。
一方、図48Dに示すPスライス1202dでは、上記と同様に、“対象ピクチャにおけるIスライス1201から上の位置のスライスの画素のみを参照した符号化を行う”という規則のみに従い、当該Pスライス1202dと同じ位置、および直前と直後との位置にあるスライスを参照可能と判定できる。しかしながら、図48Cに示すPスライス1202cでは、参照可能なスライスを判定するために、さらに、“上から4スライス目から下に位置するスライスの画素のみを参照した符号化を行う”という規定が必要になる。
このように、本発明では、GOPの先頭ピクチャの上端にIスライス1201を配置することにより、Pスライスの参照先のピクチャを容易に制御することができる。
また、上記制御により、Pスライス1202は、当該Pスライス1202内の画素相関、または当該Pスライス1202と、当該ピクチャにおけるIスライス1201の位置から当該ピクチャの上端の位置までのスライスとの間の画素相関、または他のピクチャにおけるIスライスの位置から当該他のピクチャの上端に位置するスライスまでのスライスと、当該スライスとの間の画素相関を利用してブロック単位で符号化される。
次に、画像符号化装置1100の動作の流れを説明する。
図49は、画像符号化装置1100によるスライス符号化動作の流れを示すフローチャートである。
まず、イントラ/インター決定部1104は、符号化対象ピクチャを複数のスライスに分割する(S1101)。次に、イントラ/インター決定部1104は、符号化対象スライスがIスライス1201およびPスライス1202のいずれであるかを判定する(S1102)。
符号化対象スライスがIスライス1201の場合(S1102でYes)、共通データ生成判定部1106は、符号化対象のIスライス1201がピクチャの先頭のスライスであるか否かを判定する(S1103)。
符号化対象のIスライス1201がピクチャ先頭のスライスの場合(S1103でYes)、共通データ生成部1107は、複数ピクチャに共通のデータを符号化することで、共通データ1211を生成する(S1104)。また、スライス符号化部1105は、符号化対象のIスライス1201を符号化することによりスライス符号化データを生成する(S1105)。
一方、符号化対象スライスがIスライス1201でない場合(Pスライス1202の場合)(S1102でNo)、および符号化対象のIスライス1201がピクチャの先頭スライスでない場合(S1103でNo)、共通データ生成部1107は、共通データ1211を生成しない。また、スライス符号化部1105は、符号化対象スライスを符号化することによりスライス符号化データを生成する(S1105)。
次に、ストリーム生成部1108は、共通データ生成部1107が共通データ1211を生成した場合(S1104)、共通データ1211の次にスライス符号化部1105が符号化したスライス符号化データを配置したストリーム1102を出力する。また、ストリーム生成部1108は、共通データ生成部1107が共通データ1211を生成しない場合は、スライス符号化部1105が符号化したスライス符号化データのみを配置したストリーム1102を出力する(S1106)。
以上より、本発明の実施の形態9に係る画像符号化装置1100は、Iスライス1201がピクチャの上端に位置するピクチャの直前に共通データ1211を配置したストリーム1102を生成する。これにより、画像復号化装置による途中再生時には、ピクチャの上端から下端に向かい画像が正しく表示される領域が広がっていく。この表示方法は、画面のスクロールと同様であり、日常よく目にする表示方法と似ているので視聴者が違和感を受け難い。このように、本発明に係る画像符号化方法は、途中再生時において、視聴者が違和感を受け難い映像が表示されるストリーム1102を生成できる。
(実施の形態10)
本発明の実施の形態10では、スライス分割の変形例について説明する。
図50は、本発明の実施の形態10における各ピクチャのスライス分割例を示す図である。上述した実施の形態9では、図43に示すように各ピクチャを行単位でスライス分割する例を示した。実施の形態10では、図50に示すようにスライスが行の途中で分割される。この場合も、実施の形態9と同様に、ピクチャの最初のスライス(左上端)がIスライス1201となるピクチャ1220aをGOPの先頭ピクチャとする。
図50に示すピクチャ1220a〜1220vは、この順に連続するピクチャである。また、ピクチャ1220a〜1220tが1つのGOPを構成し、ピクチャ1220u以降が次のGOPを構成する。つまり、Iスライス1201の位置がピクチャの左上端から右下端へピクチャ毎に順次移動する。また、GOP単位で当該移動が繰り返される。
図51は、本発明の実施の形態10におけるストリーム1102の構造を示す図である。また、図51は、図50に示すピクチャを符号化した場合のストリーム1102の構成を示す図である。
図51に示すように、ストリーム1102は、共通データ1211と、複数のピクチャ符号化データ1232a〜1232vとを含む。複数のピクチャ符号化データ1232a〜1232vは、それぞれ複数のピクチャ1220a〜1220vが符号化されたデータである。また、ストリーム1102において、ピクチャ1220a〜1220vの順序でピクチャ符号化データ1232a〜1232vが配置される。
各ピクチャ符号化データ1232a〜1232vは、複数のスライスが符号化されたスライス符号化データ1233を含む。複数のスライス符号化データ1233は、それぞれ、Iスライス1201またはPスライス1202が符号化されたデータである。
また、実施の形態9と同様に、GOPの先頭に、共通データ1211と、GOPの先頭であることを示す識別子(図示せず)とが配置される。
以上の構成でも、実施の形態9と同様の効果を得ることができる。
なお、ここでは、1つの行を2個のスライスに分割する例を述べたが、1つの行を3個以上のスライスに分割してもよい。また、スライスの分割は、任意の単位で行ってもよい。例えば、2つの行を3個のスライスに分割してもよい。
また、1つのピクチャを複数行からなるスライスに分割し、同様にGOPの先頭ピクチャの最初のスライスをIスライス1201としてもよい。
また、分割単位はピクチャ毎に異なってもよい。ただし、Iスライス1201の大きさがピクチャ毎に異なると符号化レートは変動する。
(実施の形態11)
本発明の実施の形態11では、スライス分割の変形例について説明する。
図52は、本発明の実施の形態11における各ピクチャのスライス分割例を示す図である。上述した実施の形態9では、図43に示すように全てのピクチャ1200がIスライス1201を含む例を示した。実施の形態11では、図52に示すようにIスライス1201を含まないピクチャがGOPに含まれる。この場合も、実施の形態9と同様にピクチャの最初のスライスがIスライス1201となるピクチャをGOPの先頭ピクチャとする。
図52に示すピクチャ1240a〜1240vは、この順に連続するピクチャである。また、ピクチャ1240a〜1240tが1つのGOPを構成し、ピクチャ1240u以降が次のGOPを構成する。
図52に示すように連続するピクチャにおいて、Iスライス1201を含むピクチャと、Iスライス1201を含まない(Pスライス1202のみを含む)ピクチャとが交互に配置される。さらに、Iスライス1201を含むピクチャにおいて、Iスライス1201の位置がピクチャの上端から下端へ順次移動する。また、GOP単位で当該移動が繰り返される。
図53は、本発明の実施の形態11におけるストリーム1102の構造を示す図である。また、図53は、図52に示すピクチャを符号化した場合のストリーム1102の構成を示す図である。
図53に示すように、ストリーム1102は、共通データ1211と、複数のピクチャ符号化データ1252a〜1252tとを含む。複数のピクチャ符号化データ1252a〜1252tは、それぞれ複数のピクチャ1240a〜1240vが符号化されたデータである。また、ストリーム1102において、ピクチャ1240a〜1240vの順序でピクチャ符号化データ1252a〜1252tが配置される。
各ピクチャ符号化データ1252a〜1252tは、複数のスライスがそれぞれ符号化された複数のスライス符号化データ1253を含む。複数のスライス符号化データ1253は、それぞれ、Iスライス1201またはPスライス1202が符号化されたデータである。
また、実施の形態9と同様に、GOPの先頭に、共通データ1211と、GOPの先頭であることを示す識別子(図示せず)とが配置される。
以上の構成でも、実施の形態9と同様の効果を得ることができる。
なお、ここではIスライス1201を含むピクチャと、Iスライス1201を含まないピクチャとが交互に配置される例を述べたが、これに限らず、GOPにIスライス1201を含まないピクチャが1個以上含まれる場合も、実施の形態9と同様の効果を得ることができる。
(実施の形態12)
本発明の実施の形態12では、スライス分割の変形例について説明する。
上述した実施の形態9では、図43に示すように各ピクチャ1200が1つのIスライス1201を含む例を示した。実施の形態11では、各ピクチャが2つのIスライス1201を含む例を説明する。この場合も、実施の形態9と同様にピクチャの最初のスライスがIスライス1201となるピクチャをGOPの先頭ピクチャとする。
図54は、本発明の実施の形態12における各ピクチャのスライス分割例を示す図である。
図54に示すピクチャ1260a〜1260fは、この順に連続するピクチャである。また、ピクチャ1260a〜1260eが1つのGOPを構成し、ピクチャ1260f以降が次のGOPを構成する。また、図54に示すように、各ピクチャ1260a〜1260eは、連続した2つのIスライス1201を含む。さらに、連続した2つのIスライス1201の位置がピクチャの上端から下端へ順次移動する。また、GOP単位で当該移動が繰り返される。
図54に示す構造を用いた場合でも、実施の形態9と同様の効果を得ることができる。
なお、本発明の実施の形態12におけるストリーム1102の構造は、上述した実施の形態9におけるストリーム1102の構成と同様である。具体的には、ストリーム1102は、共通データ1211と、複数のピクチャ1260a〜1260eが符号化された複数のピクチャ符号化データとを含む。また、実施の形態9と同様に、GOPの先頭に、共通データ1211と、GOPの先頭であることを示す識別子(図示せず)とが配置される。
また、ここではIスライス1201が連続して配置される例を述べたが、各ピクチャは連続しない複数のIスライス1201を含んでもよい。
図55は、本発明の実施の形態12における各ピクチャのスライス分割例の変形例を示す図である。
図55に示すピクチャ1270a〜1270fは、この順に連続するピクチャである。また、ピクチャ1270a〜1270eが1つのGOPを構成し、ピクチャ1270f以降が次のGOPを構成する。
図55に示すように、各ピクチャ1270a〜1270eは、2つのIスライス1201を含む。この2つのIスライス1201は、1個以上のPスライス1202を挟んで配置される。例えば、当該2つのIスライス1201の間には、4つのPスライス1202が配置される。
図55に示す構造を用いた場合でも、実施の形態9と同様の効果を得ることができる。
なお、各ピクチャは、2個以上のIスライス1201を含んでもよい。
(実施の形態13)
本発明の実施の形態13では、スライス分割の変形例について説明する。
図56は、本発明の実施の形態13における各ピクチャのスライス分割例を示す図である。上述した実施の形態9では、図43に示すように各ピクチャ1200に含まれるIスライス1201とPスライス1202との大きさ(含まれるブロック数)が同じ場合の例を示した。実施の形態13では、図56に示すようにPスライス1202がIスライス1201より大きい。この場合も、実施の形態9と同様にピクチャの最初のスライスがIスライス1201となるピクチャをGOPの先頭ピクチャとする。
図56に示すピクチャ1280a〜1280lは、この順に連続するピクチャである。また、ピクチャ1280a〜1280kが1つのGOPを構成し、ピクチャ1280l以降が次のGOPを構成する。
また、Iスライス1201の位置がピクチャの上端から下端へピクチャ毎に順次移動する。また、GOP単位で当該移動が繰り返される。
図56に示す構造を用いた場合でも、実施の形態9と同様の効果を得ることができる。
また、各ピクチャ1280a〜1280jおよび1280lは、Iスライス1201より大きいPスライス1202を含む。
このように、Pスライス1202を大きくすることで、ピクチャに含まれるスライスの数を少なくできる。これにより、スライス先頭での初期化の回数を削減できるので、符号化の際の処理量を低減できる。また、スライスヘッダの符号量を削減できるので、圧縮効率を向上できる。
ここで、Iスライス1201とPスライス1202との大きさが等しい場合、Iスライス1201のビット数は、Pスライス1202のビット数より多くなる。例えば、Iスライス1201のビット数は、Pスライス1202のビット数の2〜10倍のビット数になる。これに対して、本発明の実施の形態13では、Pスライス1202をIスライス1201より大きくすることで、Iスライス1201とPスライス1202とのビット数の差を縮めることができる。
また、図45に示すピクチャ1200a〜1200lでは、各ピクチャ1200に含まれるIスライス1201の間隔が、等間隔にならないという問題がある。具体的には、ピクチャ1200aのIスライス1201と、ピクチャ1200bのIスライス1201との間には、1ピクチャ分のブロックを含む複数のPスライス1202が配置される。しかしながら、ピクチャ1200jのIスライス1201と、ピクチャ1200kのIスライス201とは連続して配置される。つまり、短時間における平均ビット数が一定とならない。
ここで、符号化の際には、直前に発生したビット数に基づき、これから符号化するスライスの符号化後のビット数を予測することが行われる。上述したように、短時間における平均ビット数が一定とならない場合には、当該ビット数の予測が困難となるという問題がある。
これに対して、本発明の実施の形態13では、GOPの最後のピクチャ1280kは、Iスライス1201を含まない。これにより、ピクチャ1280jのIスライス1201と、その次のIスライス1201である、ピクチャ1280lのIスライス1201との間に配置されるPスライス1202の大きさを同じにできる。よって、符号化の際のビット数の予測を容易に行うことができる。
なお、本発明の実施の形態13におけるストリーム1102の構造は、上述した実施の形態9におけるストリーム1102の構成と同様である。具体的には、ストリーム1102は、共通データ1211と、複数のピクチャ1280a〜1280lが符号化された複数の符号化データとを含む。また、実施の形態9と同様に、GOPの先頭に、共通データ1211と、GOPの先頭であることを示す識別子(図示せず)とが配置される。
なお、上記実施の形態10〜13において、Iスライス1201が、GOP毎に、ピクチャの上端(左上端)から下端(右下端)に移動する例を説明したが、下端(右下端)から上端(左上端)に移動してもよい。つまり、Iスライス1201は、GOP毎にピクチャの一方端から他方端へ移動すればよい。
また、ストリーム生成部1108は、ストリーム1102において、共通データ1211を、Iスライス1201がピクチャの上端(一方端)に位置するピクチャの直前に常に配置する必要はない。言い換えると、上述したGOPを複数含むピクチャを1つのGOPとしてもよい。つまり、1つのGOP内で、ピクチャの一方端から他方端へIスライス1201の移動が複数回繰り返されてもよい。
また、上記実施の形態10〜13において、スライス分割の変形例を個別に説明したが、上記実施の形態10〜13の変形例を組み合わせてもよい。
(実施の形態14)
本発明の実施の形態14では、上記実施の形態1〜13で示した画像符号化装置を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録することにより、上記実施の形態1〜13で示した処理を、独立したコンピュータシステムにおいて実施する例を説明する。
図57A〜図57Cは、上記各実施の形態の画像符号化装置を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
図57Aは、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示す図である。図57Bは、フレキシブルディスク1300を正面からみた外観、フレキシブルディスク1300の断面構造、およびディスク1301を示す図である。
フレキシブルディスク1300は、ケース1302と、ケース1302内に内蔵されるディスク1301とを備える。ディスク1301の表面には、同心円状に外周から内周に向かって複数のトラック1303が形成される。各トラック1303は角度方向に16のセクタ1304に分割される。従って、ディスク1301上に割り当てられた領域に、上記プログラムが記録されている。
また、図57Cは、フレキシブルディスク1300への上記プログラムの記録、およびフレキシブルディスク1300からの上記プログラムの読み出しおよび再生を行うコンピュータシステム1310の構成を示す図である。例えば画像符号化装置1000を実現する上記プログラムをフレキシブルディスク1300に記録する場合は、コンピュータシステム1310は、上記プログラムを、フレキシブルディスクドライブ1311を介してフレキシブルディスク1300に書き込む。
また、フレキシブルディスク1300内のプログラムを実行することにより画像符号化装置1000の機能をコンピュータシステム1310中に構築する場合は、フレキシブルディスクドライブ1311によりプログラムをフレキシブルディスク1300から読み出し、コンピュータシステム1310に転送する。コンピュータシステム1310は、転送されたプログラムを実行することにより、上述した画像符号化装置1000の機能を実現する。
なお、上記説明では、記録媒体としてフレキシブルディスク1300を例に説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。また、コンピュータシステム1310に着脱可能な記録媒体に限らず、コンピュータシステム1310が備えるHDD(ハードディスク・ドライブ)、不揮発性メモリ、RAMおよびROMに記録されるプログラムを、コンピュータシステム1310が実行してもよい。さらに、コンピュータシステム1310は有線または無線の通信網を介して取得したプログラムを実行してもよい。
また、上述した実施の形態1〜13に示す画像符号化装置に関しても、同様に、コンピュータシステム1310で実現可能である。
なお、図41に示す画像符号化装置1000に含まれる各機能ブロックは集積回路であるLSIとして実現されてもよい。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。例えばメモリ以外の機能ブロックが1チップ化されていてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)、またはLSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらに、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、符号化の対象となるデータを格納する手段だけ1チップ化せずに別構成としてもよい。
以上、本発明の画像符号化方法および画像符号化装置について、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものあるいは、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。
本発明は、動画像復号化装置に利用でき、特に、ネットワークを利用した動画像双方向通信あるいは、動画像配信、監視カメラなど、動画像を符号化する通信機器あるいはセット機器に利用することができる。
100、800、900、1000、1100 画像符号化装置
102、802、1103 ブロック数カウンタ部
104、804、1104 イントラ/インター決定部
106、906 スライスサイズ決定部
108、808、908 ビデオ・エンコーダ
200、820 パケット化部
806 スライス決定部
1062 ブロック数取得部
1064 スライス種類取得部
1065 参照部
1066 スライス分割位置決定部
1101 入力画像
1102 ストリーム
1105 スライス符号化部
1106 共通データ生成判定部
1107 共通データ生成部
1108 ストリーム生成部
1200、1200a〜1200l、1215a〜1215f、1220a〜1220v、1240a〜1240v、1260a〜1260f、1270a〜1270f、1280a〜1280l ピクチャ
1201、1521 Iスライス
1202、1202a、1202b、1202c、1202d、1522 Pスライス
1204 正しく復号できるスライス
1211、1513 共通データ
1212、1212a〜1212j、1232a〜1232v、1252a〜1252t ピクチャ符号化データ
1213、1233、1253 スライス符号化データ
1300 フレキシブルディスク
1301 ディスク
1302 ケース
1303 トラック
1304 セクタ
1310 コンピュータシステム
1311 フレキシブルディスクドライブ
1501 Iピクチャ
1502 Pピクチャ
1511、1512、1514 符号化データ
8062 ブロック位置取得部
8066、9066 スライス境界決定部
9068 符号化ビット数カウンタ部

Claims (9)

  1. 画像信号を複数ブロックからなるスライスに分割し、各スライスをブロック単位で符号化する画像符号化装置であって、
    スライス内の画素相関を利用して符号化される、複数ブロックからなるI(イントラ)スライスと、スライス内の画素相関とスライス間の画素相関とを利用して符号化される、複数ブロックからなるP(インター)スライスとに、ピクチャを分割する分割手段と、
    前記各スライスをブロック単位で符号化してゆくことにより、時間順に連続する複数のピクチャを符号化する符号化手段とを備え、
    前記分割手段は、前記時間順に連続する複数のピクチャの中の一定数のピクチャで、当該複数のピクチャ内でのIスライスの位置が循環するように、前記時間順に連続する複数のピクチャそれぞれのピクチャ内でのIスライスの位置を変更し、かつ、前記時間順に連続する複数のピクチャにおいて、Iスライスに含まれるブロック数と、当該Iスライスおよびその次のIスライスの間に含まれる1つ以上のPスライスに含まれるブロック数との和が所定値となるよう前記複数のピクチャのそれぞれを分割する
    ことを特徴とする画像符号化装置。
  2. 前記分割手段は、前記時間順に連続する複数のピクチャにおいて、所定のIスライスとその次のIスライスとの間に含まれるPスライスの数が所定値となるよう前記複数のピクチャのそれぞれを分割する
    ことを特徴とする請求項1記載の画像符号化装置。
  3. 前記複数のピクチャはそれぞれ、少なくとも2つのIスライスを含み、
    前記分割手段は、前記時間順に連続する複数のピクチャにおいて、所定のピクチャ内での前記2つのIスライスのうち、Iスライスと、その次のIスライスとの間に含まれるPスライスのブロック数が所定値となるよう前記複数のピクチャのそれぞれを分割する
    ことを特徴とする請求項1記載の画像符号化装置。
  4. 前記分割手段は、さらに、前記時間順に連続する複数のピクチャの中の一定数のピクチャの中で、少なくとも1つのピクチャを、Iスライスを含まない複数のPスライスに分割する
    ことを特徴とする請求項1記載の画像符号化装置。
  5. 前記分割手段は、さらに、
    前記ピクチャを、ブロック数M(Mは0以上の整数)からなるIスライスと、前記ピクチャ内の特定位置にあるPスライスを除く、ブロック数N(Nは1以上の整数、かつ、M<N)からなる複数のPスライスとに分割する
    ことを特徴とする請求項1記載の画像符号化装置。
  6. 前記分割手段は、さらに、
    前記時間順に連続する複数のピクチャにおいて、予め設定された数のピクチャ毎にIスライスの位置が一方端から他方端への移動が繰り返されるように、前記ピクチャをIスライスとPスライスとに分割し、
    前記符号化手段は、
    前記Iスライスを当該スライス内の画素相関を利用して符号化し、前記Pスライスを当該スライス内の画素相関、または当該スライスと他のスライスとの間の画素相関を利用して符号化することにより、前記時間順に連続する複数のピクチャの符号化データを生成する符号化データ生成部と、
    前記時間順に連続する複数のピクチャに共通のデータと、前記時間順に連続する複数のピクチャの符号化データとを含むストリームを生成するストリーム生成部とを備え、
    前記ストリーム生成手段は、前記Iスライスが前記一方端に位置するピクチャが符号化された符号化データの直前に、前記共通のデータを配置する
    ことを特徴とする請求項1記載の画像符号化装置。
  7. 画像信号を複数ブロックからなるスライスに分割し、各スライスをブロック単位で符号化する画像符号化方法であって、
    スライス内の画素相関を利用して符号化される、複数ブロックからなるI(イントラ)スライスと、スライス内の画素相関とスライス間の画素相関とを利用して符号化される、複数ブロックからなるP(インター)スライスとに、ピクチャを分割する分割ステップと、
    前記各スライスをブロック単位で符号化してゆくことにより、時間順に連続する複数のピクチャを符号化する符号化ステップとを含み、
    前記分割ステップは、前記時間順に連続する複数のピクチャの中の一定数のピクチャで、当該複数のピクチャ内でのIスライスの位置が循環するように、前記時間順に連続する複数のピクチャそれぞれのピクチャ内でのIスライスの位置を変更し、かつ、前記時間順に連続する複数のピクチャにおいて、Iスライスに含まれるブロック数と、当該Iスライスおよびその次のIスライスの間に含まれる1つ以上のPスライスに含まれるブロック数との和が所定値となるよう前記複数のピクチャのそれぞれを分割する
    ことを特徴とする画像符号化方法。
  8. 画像信号を複数ブロックからなるスライスに分割し、各スライスをブロック単位で符号化するためのプログラムであって、
    スライス内の画素相関を利用して符号化される、複数ブロックからなるI(イントラ)スライスと、スライス内の画素相関とスライスの間の画素相関とを利用して符号化される、複数ブロックからなるP(インター)スライスとに、ピクチャを分割する分割ステップと、
    前記各スライスをブロック単位で符号化してゆくことにより、時間順に連続する複数のピクチャを符号化する符号化ステップとを含み、
    前記分割ステップは、前記時間順に連続する複数のピクチャの中の一定数のピクチャで、当該複数のピクチャ内でのIスライスの位置が循環するように、前記時間順に連続する複数のピクチャそれぞれのピクチャ内でのIスライスの位置を変更し、かつ、前記時間順に連続する複数のピクチャにおいて、Iスライスに含まれるブロック数と、当該Iスライスおよびその次のIスライスの間に含まれる1つ以上のPスライスに含まれるブロック数との和が所定値となるよう前記複数のピクチャのそれぞれを分割する
    ことをコンピュータに実行させるためのプログラム。
  9. 画像信号を複数ブロックからなるスライスに分割し、各スライスをブロック単位で符号化する集積回路であって、
    スライス内の画素相関を利用して符号化される、複数ブロックからなるI(イントラ)スライスと、スライス内の画素相関とスライス間の画素相関とを利用して符号化される、複数ブロックからなるP(インター)スライスとに、ピクチャを分割する分割手段と、
    前記各スライスをブロック単位で符号化してゆくことにより、時間順に連続する複数のピクチャを符号化する符号化手段とを備え、
    前記分割手段は、前記時間順に連続する複数のピクチャの中の一定数のピクチャで、当該複数のピクチャ内でのIスライスの位置が循環するように、前記時間順に連続する複数のピクチャそれぞれのピクチャ内でのIスライスの位置を変更し、かつ、前記時間順に連続する複数のピクチャにおいて、Iスライスと、その次のIスライスの間に含まれる1つ以上のPスライスとに含まれるブロック数の和が所定値となるよう前記複数のピクチャのそれぞれを分割する
    ことを特徴とする集積回路。
JP2009543677A 2007-11-28 2008-11-28 画像符号化方法および画像符号化装置 Active JP4834772B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009543677A JP4834772B2 (ja) 2007-11-28 2008-11-28 画像符号化方法および画像符号化装置

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
JP2007308054 2007-11-28
JP2007308054 2007-11-28
JP2008239815 2008-09-18
JP2008239815 2008-09-18
JP2008250075 2008-09-29
JP2008250075 2008-09-29
PCT/JP2008/003530 WO2009069316A1 (ja) 2007-11-28 2008-11-28 画像符号化方法および画像符号化装置
JP2009543677A JP4834772B2 (ja) 2007-11-28 2008-11-28 画像符号化方法および画像符号化装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011208370A Division JP5417402B2 (ja) 2007-11-28 2011-09-26 画像符号化方法および画像符号化装置

Publications (2)

Publication Number Publication Date
JPWO2009069316A1 JPWO2009069316A1 (ja) 2011-04-07
JP4834772B2 true JP4834772B2 (ja) 2011-12-14

Family

ID=40678227

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009543677A Active JP4834772B2 (ja) 2007-11-28 2008-11-28 画像符号化方法および画像符号化装置
JP2011208370A Active JP5417402B2 (ja) 2007-11-28 2011-09-26 画像符号化方法および画像符号化装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011208370A Active JP5417402B2 (ja) 2007-11-28 2011-09-26 画像符号化方法および画像符号化装置

Country Status (5)

Country Link
US (1) US8520730B2 (ja)
EP (1) EP2237562A4 (ja)
JP (2) JP4834772B2 (ja)
CN (1) CN101897190B (ja)
WO (1) WO2009069316A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012008037A1 (ja) * 2010-07-15 2012-01-19 富士通株式会社 動画像復号装置、動画像復号方法及び動画像符号化装置ならびに動画像符号化方法
US8700796B2 (en) 2010-09-22 2014-04-15 Qualcomm Incorporated MAC data service enhancements
US20120243602A1 (en) * 2010-09-23 2012-09-27 Qualcomm Incorporated Method and apparatus for pipelined slicing for wireless display
CA2722993A1 (fr) * 2010-12-01 2012-06-01 Ecole De Technologie Superieure Systeme d'ecodage video parallele multitrames et multitranches avec encodage simultane de trames predites
US9060174B2 (en) 2010-12-28 2015-06-16 Fish Dive, Inc. Method and system for selectively breaking prediction in video coding
JP5741073B2 (ja) * 2011-03-03 2015-07-01 富士通株式会社 画像符号化装置、画像符号化方法、及び画像符号化プログラム
KR101522391B1 (ko) * 2011-03-10 2015-05-21 니폰덴신뎅와 가부시키가이샤 양자화 제어 장치 및 방법, 및 양자화 제어 프로그램
US9445093B2 (en) * 2011-06-29 2016-09-13 Qualcomm Incorporated Multiple zone scanning order for video coding
JP5768565B2 (ja) * 2011-07-28 2015-08-26 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
US20130094571A1 (en) * 2011-10-13 2013-04-18 Ati Technologies Ulc Low latency video compression
PL3780606T3 (pl) * 2012-06-26 2022-06-20 Lg Electronics Inc. Sposób dekodowania wideo, sposób kodowania wideo oraz środek nośnikowy odczytywalny przez dekoder przechowujący zakodowane informacje wideo
EP2941864B1 (en) * 2013-01-07 2016-12-07 Telefonaktiebolaget LM Ericsson (publ) Limiting use of largest transform unit size for intra coding units in inter coded slices of encoded video
JP6206280B2 (ja) * 2014-03-24 2017-10-04 富士通株式会社 動画像符号化装置及び動画像符号化器
EP3134995B1 (en) 2014-08-07 2021-12-22 DivX, LLC Systems and methods for protecting elementary bitstreams incorporating independently encoded tiles
KR20160105203A (ko) 2015-02-27 2016-09-06 삼성전자주식회사 멀티미디어 코덱, 상기 멀티미디어 코덱을 포함하는 애플리케이션 프로세서, 및 상기 애플리케이션 프로세서의 동작 방법
CN113115043A (zh) * 2015-08-07 2021-07-13 辉达公司 视频编码器、视频编码系统和视频编码方法
CN108886633B (zh) 2016-03-29 2021-06-22 三菱电机株式会社 图像接收再现方法和装置以及图像生成发送方法和装置
US10674172B2 (en) 2016-04-19 2020-06-02 Mitsubishi Electric Corporation Image processing apparatus, image processing method, and computer-readable recording medium
JP6767691B2 (ja) * 2016-10-18 2020-10-14 パナソニックIpマネジメント株式会社 画像符号化方法、伝送方法および画像符号化装置
KR102497216B1 (ko) 2017-05-10 2023-02-07 삼성전자 주식회사 슬라이스 기반의 압축을 수행하는 영상 처리 장치 및 영상 처리 방법
JP6943628B2 (ja) * 2017-05-24 2021-10-06 Nttエレクトロニクス株式会社 映像符号化装置および映像符号化方法
CN114245178A (zh) * 2021-12-20 2022-03-25 未来电视有限公司 一种传输视频的方法、装置、设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0364190A (ja) * 1989-08-01 1991-03-19 Matsushita Electric Ind Co Ltd 動画像符号化装置
JPH03136587A (ja) * 1989-10-23 1991-06-11 Nec Corp 動画像符号化装置の周期的リフレッシュ方式
JPH04207780A (ja) * 1990-11-30 1992-07-29 Nec Corp 動画像符号化装置の周期的リフレッシュ回路
JPH06217282A (ja) * 1993-01-19 1994-08-05 Nec Corp 画像符号化装置
JPH06311502A (ja) * 1993-02-26 1994-11-04 Toshiba Corp 動画像伝送装置
JPH0759085A (ja) * 1993-06-30 1995-03-03 Samsung Electron Co Ltd 強制イントラフレーム符号化方法
JPH08279978A (ja) * 1995-04-07 1996-10-22 Sharp Corp 画像蓄積通信装置
JPH11220733A (ja) * 1998-01-30 1999-08-10 Toshiba Corp 動画像符号化装置および動画像符号化方法
JP2005012630A (ja) * 2003-06-20 2005-01-13 Matsushita Electric Ind Co Ltd 画像符号化装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5737022A (en) * 1993-02-26 1998-04-07 Kabushiki Kaisha Toshiba Motion picture error concealment using simplified motion compensation
US7046910B2 (en) * 1998-11-20 2006-05-16 General Instrument Corporation Methods and apparatus for transcoding progressive I-slice refreshed MPEG data streams to enable trick play mode features on a television appliance
US6940904B2 (en) * 2001-05-29 2005-09-06 Broadcom Corporation Artifact-free displaying of MPEG-2 video in the progressive-refresh mode
US6804301B2 (en) * 2001-08-15 2004-10-12 General Instrument Corporation First pass encoding of I and P-frame complexity for compressed digital video
US20050008240A1 (en) * 2003-05-02 2005-01-13 Ashish Banerji Stitching of video for continuous presence multipoint video conferencing
JP2007089035A (ja) * 2005-09-26 2007-04-05 Toshiba Corp 動画像符号化方法、装置及びプログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0364190A (ja) * 1989-08-01 1991-03-19 Matsushita Electric Ind Co Ltd 動画像符号化装置
JPH03136587A (ja) * 1989-10-23 1991-06-11 Nec Corp 動画像符号化装置の周期的リフレッシュ方式
JPH04207780A (ja) * 1990-11-30 1992-07-29 Nec Corp 動画像符号化装置の周期的リフレッシュ回路
JPH06217282A (ja) * 1993-01-19 1994-08-05 Nec Corp 画像符号化装置
JPH06311502A (ja) * 1993-02-26 1994-11-04 Toshiba Corp 動画像伝送装置
JPH0759085A (ja) * 1993-06-30 1995-03-03 Samsung Electron Co Ltd 強制イントラフレーム符号化方法
JPH08279978A (ja) * 1995-04-07 1996-10-22 Sharp Corp 画像蓄積通信装置
JPH11220733A (ja) * 1998-01-30 1999-08-10 Toshiba Corp 動画像符号化装置および動画像符号化方法
JP2005012630A (ja) * 2003-06-20 2005-01-13 Matsushita Electric Ind Co Ltd 画像符号化装置

Also Published As

Publication number Publication date
JPWO2009069316A1 (ja) 2011-04-07
EP2237562A4 (en) 2016-12-28
US20100303153A1 (en) 2010-12-02
US8520730B2 (en) 2013-08-27
CN101897190A (zh) 2010-11-24
JP2012023765A (ja) 2012-02-02
WO2009069316A1 (ja) 2009-06-04
JP5417402B2 (ja) 2014-02-12
EP2237562A1 (en) 2010-10-06
CN101897190B (zh) 2012-06-20

Similar Documents

Publication Publication Date Title
JP4834772B2 (ja) 画像符号化方法および画像符号化装置
JP5232114B2 (ja) 画像符号化装置、及び画像符号化方法
JP5361896B2 (ja) 動画像符号化方法および動画像符号化装置
WO2011004598A1 (ja) 動画像符号化方法、装置、プログラム、および集積回路
JP6681758B2 (ja) デジタルビデオコンテンツのマクロブロックレベルにおける適応フレーム/フィールド符号化
Puri et al. Video coding using the H. 264/MPEG-4 AVC compression standard
JP4755093B2 (ja) 画像符号化方法および画像符号化装置
US7822123B2 (en) Efficient repeat padding for hybrid video sequence with arbitrary video resolution
WO2012060459A1 (ja) 動画像配信システム、動画像配信方法および動画像配信用プログラム
JP2005510985A5 (ja)
US7839933B2 (en) Adaptive vertical macroblock alignment for mixed frame video sequences
US9154669B2 (en) Image apparatus for determining type of image data and method for processing image applicable thereto
Zare et al. Self-contained slices in H. 264 for partial video decoding targeting 3D light-field displays
KR100780844B1 (ko) 다시점 화상 복호화기, 다시점 화상 데이터 처리 시스템,다시점 화상 데이터 처리 방법 및 이를 수행하는프로그램을 기록한 기록매체
JP2005328512A (ja) ディジタル映像信号再生装置および再生方法
Sezer et al. A scalable representation for motion vectors for rate adaptation to network constraints
JPH1079946A (ja) 画像符号化装置および画像復号化装置
US20060072675A1 (en) Method for encoding and decoding video signals
AU2004229063A1 (en) Method and apparatus for improving the average image refresh rate in a compressed video bitstream

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110802

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20110802

TRDD Decision of grant or rejection written
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20110825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110830

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110926

R150 Certificate of patent or registration of utility model

Ref document number: 4834772

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3