JP4321468B2 - 動画像符号化装置及び動画像復号化装置 - Google Patents

動画像符号化装置及び動画像復号化装置 Download PDF

Info

Publication number
JP4321468B2
JP4321468B2 JP2005083053A JP2005083053A JP4321468B2 JP 4321468 B2 JP4321468 B2 JP 4321468B2 JP 2005083053 A JP2005083053 A JP 2005083053A JP 2005083053 A JP2005083053 A JP 2005083053A JP 4321468 B2 JP4321468 B2 JP 4321468B2
Authority
JP
Japan
Prior art keywords
frame
segment
frames
signal
child
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005083053A
Other languages
English (en)
Other versions
JP2006270294A (ja
Inventor
裕 倉持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2005083053A priority Critical patent/JP4321468B2/ja
Publication of JP2006270294A publication Critical patent/JP2006270294A/ja
Application granted granted Critical
Publication of JP4321468B2 publication Critical patent/JP4321468B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は動画像符号化装置及び動画像復号化装置に係り、特にテレビ信号など離散時間のフレームレートで2次元画像が符号化されている動画像符号化信号の符号量の削減の目的で、動画像信号のフレーム数を間引いた後で符号化を行い、符号化すべきフレーム数を減少させることで送信データ量を制限する動画像符号化装置、及びその動画像信号を復号化する動画像復号化装置に関する。
インターネットの普及に伴い、通信帯域の保証されない状況下でテレビ会議やテレビ電話用の動画像符号化装置が利用されるようになっている。代表的なテレビ会議やテレビ電話用の動画像符号化方法として、国際標準規格ITU−T勧告H.261などが知られている(例えば、非特許文献1参照)。
インターネットでは、ネットワークを使用する利用者数やデータ量などが同時刻に集中した場合でも、それらを区別して扱うことが無いため、データストリーム当たりの通信帯域が時々刻々と変化し、通信帯域が保証されていない。この結果、動画像の品質は大きな影響を受けることになり、画質が不安定になるという問題が発生する。具体的には、解像度の低下やブロック歪に代表される圧縮固有の歪の増加、フレームレートの低下による不自然な動きなどがあげられる。
これらの画像品質の低下は、通信帯域の減少により動画像符号化装置から送信されたデータに遅延や欠落が発生して引き起こされる場合と、動画像符号化装置が通信帯域の減少を予め見越して自主的に送信データ量を制限するために起こる場合との2通りがある。
以下では、本発明の主たる目的である動画像符号化装置が自主的に送信データ量を制限する場合におけるフレームレートの低下について説明する。フレームレートを低下させることによる送信データ量の制限方法とは、動画像符号化装置に入力するフレーム数を入力前に間引き、符号化すべきフレーム数を減少させることで送信データ量を制限するものである。この制限されたデータを受信側で復号化して視聴すると、フレーム間引きによる動きの不連続が発生し画像品質の低下となる。
前記フレーム間引きによる動画像の品質低下に対する改善方法として、従来から受信側で復号化するために使用されるフレーム間のベクトル情報を利用して、間引かれたフレームを合成し補間することにより、送信側のデータ量の増加を伴わない方法が知られている(例えば、特許文献1参照)。しかし、この特許文献1記載の方法は、フレーム間のベクトルと同じ方向に補間するフレームの画像内容が動いている場合には有効であるが、実際には異なる方向に動いている場合もあり、この場合には有効な方法とはいえない。これは、符号化のためのベクトルがフレーム間の予測誤差を減少させることを目的にしており、必ずしも動きの方向を表現しているものではないからである。
一例として、図16の場合を考える。図16は球が1フレーム目で球1600の位置にあり、2フレーム目で球1601の位置に落下し地面と衝突した後、3フレーム目で球1602の位置に跳ね返った様子を示している。この3フレームからなる動画像からフレームレー卜を落とす目的で、2フレーム目が間引かれ動画像符号化器へ入力された場合、動画像符号化器はベクトルとして図17のベクトル1700を出力する。このベクトル1700を用いて受信側で間引かれた2フレーム目を合成すると、図18の球1800が補間画像として合成されることになり、実際の動きとは異なる動画像が提示されることになる。
更に、実際の動きの方向とのミスマッチは、例えば符号化単位となる小ブロック内に複数の異なる方向へ動く部分が混在している場合にも発生する。一例を、図19と図20を用いて説明する。ある時点で、2つの球が図19(a)のように球1900と球1901の位置にあった場合に、次のフレームで図19(b)のように球1900が球1902の位置へ移動し、球1901が球1903の位置へ移動したとする。
このとき、図19(b)の破線で示すようにブロック分割し符号化すると、前のフレームである図20(a)から誤差の少ない領域を探索し予測画像を合成すると、図20(b)のようになる。図20(b)において、ブロック2000〜2002は問題ないが、ブロック2003は図19(b)の球1903の予測に図19(a)の球1901を含むブロックである図20(a)のブロック2003を採用するため、図19(a)の球1900の一部が異なる方向へ移動されて見えている。また、図20(b)のブロック2004では図19(a)の球1900の一部を予測ブロックとして採用すると、球1901の一部も一緒に移動され予測誤差が大きくなるために、全く別のブロックが採用されている様子を示している。
この動きのミスマッチを改善する方法として、ベクトルによって移動された小ブロック内の画素を、フレーム間で誤差の少ない領域と誤差の多い領域に分割することで、同一ブロック内の動きの異なる部分を検出し補正する方法が従来から知られている(例えば、特許文献2参照)。同一ブロック内に異なる動き部分が混在する理由は、画像の内容と関係なく一様に画面を小ブロックに分割することが原因で発生する問題である。また、この特許文献2記載の改善方法と前記特許文献1記載の改善方法のいずれも、前述のように補間画像の動きがフレーム間のベクトルとなる方向に動いていた場合には、その動きを知る手段がない点では同一である。
前記のフレーム間のベクトルの方向と補間画像の実際の動きの方向が異なる場合の問題を改善する方法として、送信データ量は増加するが補間フレーム用のベクトルを送信データに付加することで前述のフレーム間のベクトルと異なる方向に補間するフレームの画像内容が動いている場合の問題を解決する方法が従来知られている(例えば、特許文献3参照)。ただし、この特許文献3記載の従来方法は、補間フレーム用のベクトルのデータ量が僅かである場合にのみ有効な方法である。
小野文孝、渡辺裕著「国際標準画像符号化の基礎技術」,株式会社コロナ社,(ISBN4−339−01161−4),pp.217−236,1998年3月 監訳:尾上守夫,「パターン識別」,株式会社新技術コミュニケーションズ,(ISBN4−915851−24−9),2003年2月 特開平7−177514号公報 特開2000−224593号公報 特開平10−271508号公報
前述したように、フレーム補間用のベクトルを付加する特許文献3記載の方法は、付加するベクトルの情報量が少ないことを前提条件として成立するものである。何故ならば、データ量を制限する目的でフレームを間引いているにも拘らず、ベクトルのデータ量が増加すると通信自体が成立しなくなる可能性があるからである。このため、補間フレームを合成するためのベクトルのデータ量を削減する技術が不可欠となる。
本発明は上記の点に鑑みなされたもので、補間フレームの合成に用いられるベクトルのデータ量を大幅に削滅し得る動画像符号化装置及び動画像復号化装置を提供することを目的とする。
上記の目的を達成するため、第1の発明は動画像信号のフレームからフレーム間引きを行い、フレームレートを削減して符号化する動画像符号化装置において、供給される動画像信号に対し、予め定めた規則に従ってフレーム間引きを行うフレーム間引き手段と、フレーム間引き手段によりフレーム間引き処理された動画像信号を符号化して動画像符号化信号を出力する動画像符号化手段と、動画像符号化手段から出力される動画像符号化信号をローカル復号化するローカル復号化手段と、フレーム間引き手段により動画像信号から間引かれた、動画像符号化手段で符号化されない間引きフレームの画像信号を記憶する第1の記憶手段と、ローカル復号化手段から出力されるローカル復号動画像信号で、第1の記憶手段に記憶されている一つの間引きフレームに対して、時間的に前後する2フレームのローカル復号動画像信号を記憶する第2の記憶手段と、第2の記憶手段から出力された時間的に前後する2フレームのローカル復号動画像信号からフレーム間の差分値を求め、その差分値が規定値以上の値を持つ連続した領域の画像信号を親セグメントとして、時間的に前後する2フレームのローカル復号動画像信号のそれぞれから分離する第1の分離手段と、第1の分離手段で時間的に前後する2フレームのそれぞれから分離された親セグメントのうち、一方のフレームの親セグメントを、他方のフレームのローカル復号動画像信号の画像領域と位置をずらしながら誤差を求め、その誤差の極小値が発見される度に画素毎の誤差を求め、閾値よりも画素毎の誤差が小さく、かつ、連続した領域の画像信号を、一方のフレームの親セグメントから子セグメントとして分離する処理を行うことにより、時間的に前後する2フレームのそれぞれから第1及び第2の子セグメントを分離出力する第2の分離手段と、第1の記憶手段から出力された間引きフレームの動画像信号と、第2の分離手段で分離された第1及び第2の子セグメントとのマッチングにより、第1及び第2の子セグメントのうち平均自乗誤差の最小値が規定値よりも小さな子セグメントを選択する子セグメントの選択情報と、選択された子セグメントの平均自乗誤差の最小値を与える位置への画面上の水平及び垂直の移動量を示す動きベクトル情報と、第1及び第2の子セグメントの画面上の上下関係を示す上下関係決定情報とを検出する検出手段と、検出手段で検出された子セグメントの選択情報と動きベクトル情報と上下関係決定情報とを符号化して補間用符号化信号を出力する符号化手段とを有し、動画像符号化信号と補間用符号化信号とをそれぞれ出力することを特徴とする。
この発明では、動画像符号化手段で符号化されない間引きフレームの画像信号に対して、前後の2フレーム(これは直前と直後の2フレームに限らず、間引きフレームに対し1又は2レーム以上前と1又は2フレーム以上後の2フレームも含む)の関係にあるローカル復号化された画像信号から動き方向を求め、セグメントを構成するセグメンテーションを行うことを特徴とする画像分割方法により、ブロック分割する方法のように無駄に細分化することを防止して付加ベクトルの数を削減する。上記の動き方向を示す動きベクトル情報と子セグメントの選択情報と上下関係決定情報とを符号化して得た補間用符号化信号は間引き処理された動画像符号化信号と共に伝送される。
また、上記の目的を達成するため、第2の発明は、第1の発明の動画像符号化装置によりフレーム間引きが行われて符号化された動画像信号を元のフレームレートに復号化する動画像復号化装置であって、間引き処理後の動画像符号化信号を復号化する第1の復号化手段と、補間用符号化信号を復号化する第2の復号化手段と、第1の復号化手段により復号化された時間的に前後する2フレームの復号化画像信号からフレーム間の差分値を求め、差分値が規定値以上の値を持つ連続した領域を親セグメントとして、時間的に前後する2フレームのそれぞれから分離する第1の分離手段と、第1の分離手段で時間的に前後する2フレームのそれぞれから分離された親セグメントのうち、一方のフレームの親セグメントを、他方のフレームの復号化画像信号の画像領域と位置をずらしながら誤差を求め、その誤差の極小値が発見される度に画素毎の誤差を求め、閾値よりも画素毎の誤差が小さく、かつ、連続した領域の画像信号を一方のフレームの親セグメントから子セグメントとして分離する処理を行って、第1及び第2の子セグメントを分離出力する第2の分離手段と、第2の復号化手段から出力された子セグメントの選択情報、動きベクトル情報及び上下関係決定情報に従い、第2の分離手段で分離された第1及び第2の子セグメントを選択及び移動すると共に、上下関係決定情報に従って重ね合わせ、時間的に前後する2フレーム間の補間フレームを合成する補償手段と、補償手段により得られた補間フレームの画像信号と、第1の復号化手段から出力された間引き処理後の動画像信号とを交互に選択する選択手段とを有することを特徴とする。
この発明では、動画像符号化信号を復号化して得た、前後2フレームの画像信号間の差分を求め、画面内で差分のある領域を親セグメントとして分離し、更に親セグメントを2枚の前後フレームを対象に前方マッチングおよび後方マッチングにより動きの方向と移動量が同じ領域に分割し子セグメントとする。更にこの子セグメントに対して、補間フレーム用のベクトル情報を付与する。セグメントの形状は復号化された前後2フレームから求められるため符号化器から復号化器へ伝送する必要はない。また、前後2フレームのセグメントを選択的に採用するため、フレーム間で形状の変化などがある場合には、形状の近い方のセグメントを採用するように補間フレームの前後両方向から補間が選択的に行われる構成とした。
本発明によれば、同一の動き特徴量を持つ領域を1つのセグメントにまとめることができるため、画面を一様にブロック分割する方法に比べて格段にベクトル数を削減することが可能になると共に、ブロック分割のような異なる動きが混在する問題も発生しない。また、セグメントに対して付与されるベクトルは補間フレームの動き情報であるため正確な動きを表現できる。
これらの結果、本発明によれば、データ量の削減という目的を達成しながら、正確なフレーム補間による画像品質の向上が実現され、インターネットなどの帯域が保証されていない通信においても自然な動きの動画像通信が実現される効果がある。
本発明に係る動画像符号化装置及び動画像復号化装置の主たる目的は、符号量の削減のために符号化器側で間引かれたフレームを復号化装置で再合成する手段を提供し、動きの不自然さを解消することにある。以下では、本発明装置の実施の形態について、ブロック図と処理内容を示すフローチャートと共に説明する。
図1は本発明になる動画像符号化装置の一実施の形態のブロック図、図2はその動作説明用フローチャートを示す。図1において、動画像符号化装置は端子100を介して入力される動画像信号に対して1フレームおきに間引く間引き処理を行うフレーム間引器101と、フレーム間引器101から出力された動画像信号の符号化を行う動画像符号化器102と、フレーム間引器101から出力された動画像信号を1フレーム単位で記憶する第1のフレームメモリ105と、ローカル復号化器104と、ローカル復号化器104で復号化された動画像信号を1フレーム単位で記憶する第2のフレームメモリ106と、フレームメモリ106の出力信号を1フレーム単位で記憶する第3のフレームメモリ107と、フレームメモリ106及び107の各出力信号に対して、後述するセグメンテーションを行うセグメント分離器108と、セグメント分離器108の出力信号に基づいてフレームメモリ105から出力された動画像信号のベクトル検出を行うベクトル検出器109と、ベクトル検出器109で検出されたベクトルを符号化するベクトル符号化器110とから構成される。
次に、この動画像符号化装置の動作について、図2のフローチャートを併せ参照して説明する。まず、フレーム間引器101は、端子100を介して入力される動画像信号の時間連続するフレームを、動画像符号化信号の符号量の削減の目的で1フレームおきに間引く間引き処理を行う(図2のステップS11)。このフレーム間引きの一例について説明するに、例えば、図5に示すように球が画面中を移動する時間連続の6つのフレーム500〜505の動画像信号が図1の端子100に入力されたとすると、フレーム間引き処理により1フレームおきのフレーム501、503、505が間引かれ、フレーム500、502、504が図1のフレーム間引器101から出力され、動画像符号化器102へ供給される。
なお、本実施の形態では、1フレームおきに間引く処理を例に取り上げているが、本発明は間引くフレーム数を連続する複数フレームにするなどの方法にも適用可能であり、本実施の形態により間引き方を制限するものではない。また、図1のフレーム間引器101からは間引かれたフレーム501、503、505も出力され、フレームメモリ105へ供給される。
次に、図1の動画像符号化器102では、フレーム間引器101から入力された動画像信号の間引かれたフレームを時間連続したフレームと捉えて通常の動画像符号化を行う(図2のステップS12)。この動画像符号化器102による動画像の符号化方法は特に限定されるものではなく、様々な符号化方法が適用可能である。例えば、前述のH.261で規定された符号化方法などが利用できる。
次に、図1の動画像符号化器102により符号化して得られた、フレームレートが入力端子100の入力動画像信号のそれに比し削減されたビットストリーム(動画像符号化信号系列)は、出力端子103から外部へ出力されて(図2のステップS13)、インターネットなどの通信網を経由して受信装置へ伝送されると同時に、ローカル復号化器104へも供給され、ここでローカル復号化処理が行われる(図2のステップS14)。
図1のローカル復号器104でビットストリームを復号化することにより得られた復号化後のローカル復号画像信号は、フレームメモリ106に入力されて1フレーム単位で蓄積された後、読み出されてフレームメモリ107に入力されて1フレーム単位で蓄積される(図2のステップS15)。一方、フレームメモリ105には、前述したように、フレーム間引器101から動画像符号化器102へ出力される間引き処理された動画像信号の1フレーム後の、動画像符号化器102で符号化されなかった間引きフレームの動画像信号が供給されて蓄積されている。
これにより、フレームメモリ106にはフレームメモリ105の後フレームに相当するローカル復号画像信号が蓄積され、フレームメモリ107にはフレームメモリ105の前フレームに相当するローカル復号画像信号が蓄積されることとなる。これは、フレームメモリ106に新たなフレームがローカル復号化器104から入力されると同時に、フレームメモリ106に蓄積されていた画像信号がフレームメモリ107に入力される構成により実現される。
次に、セグメント分離器108がフレームメモリ106及びフレームメモリ107から出力された画像信号をそれぞれセグメンテーションする(図2のステップS16)。すなわち、本実施の形態では、画像を任意形状のセグメントに分解し、セグメント毎にベクトルを付与する方法をとる。画像のセグメンテーションは画像内の同一の成分を持つ領域を1つのセグメントとして分離することが一般的である。画像内の同一の成分とは、輝度値や色、2次元空間の周波数成分、連続するエッジを境界条件とした力学モデルなど様々な方法が提案されている。
本発明では復号化された前後の2フレームから動き方向を求めセグメントを構成するセグメンテーションを行うことを特徴とする画像分割方法によりブロック分割する方法のように無駄に細分化することを防止して付加ベクトルの数を削減するものである。
このセグメント分離器108によるセグメンテーションの方法を図6のフローチャートを用いて説明する。始めに図1のフレームメモリ106とフレームメモリ107に蓄積されている画像間でフレーム間差分を求め親セグメントを抽出する(図6のステップS31)。
この親セグメントの抽出方法を図7で説明する。図1のフレームメモリ107に図7(a)の画像が蓄積されており、フレームメモリ106に図7(b)の画像が蓄積されていたとする。図7(a)には2個の四角形700と701があり、図7(b)には四角形700が左に移動した四角形702と、四角形701が右に移動した四角形703の様子を示している。図7では、表現上の問題で四角形を一様に塗り潰しているが、図7を含め以後の説明で使用される四角形は画素位置のずれた四角形をフレーム間で画素毎に差分値をとると、四角形の全体において差分が検出されるものとする。
図では、図7(a)と図7(b)の同じ位置にある画素毎の輝度の差分値を求め、連続する画素において閾値以上の差分値が検出された領域をセグメントとして抽出する。ただし、領域はノイズや絵柄によって差分値が孤立点として出現したり、逆に差分値のあるべきところに差分値がでなかったりすることがあるため、孤立点除去を行うものとする。孤立点除去は、差分値の連続する領域の面積(画素数)が閾値以下であれば孤立点と判断して差分値のない周辺領域と統合し、差分値のない連続する領域の面積(画素数)が閾値以下である場合には孤立点と判断して差分値のある周辺領域と統合するものである。
この結果、図7(a)では図7(c)の枠704の内部がセグメントとして検出され、図7(b)では図7(d)の枠705の内部がセグメントとして検出される。この図6のステップS31により抽出されたセグメントを親セグメントと呼ぶ。
次に、前方マッチングによる子セグメントの抽出処理を行う(図6のステップS32)。この前方マッチングによる子セグメントの抽出処理では、まず、図7(c)で抽出された枠704の内部の親セグメントを、図1のフレームメモリ106に蓄積されている図7(b)の画像に対応させながらフレーム間の輝度値の平均自乗誤差(MSE)を求める。MSEは、次式により求められる。
Figure 0004321468
ここで、上式中、xは図7(c)の枠704の内部の画素の輝度値であり、x’は図7(b)の画像に図7(c)の枠704の内部の画素を対応させたときの図7(b)の画素の輝度値である。また、Nは図7(c)の枠704の内部の画素数である。
このMSEを図7(b)の画像上で図7(c)の枠704を1画素ずつ水平垂直に移動させながら求める。図7の例では垂直方向への動きがないので、簡単のため水平方向への移動のみで説明する。横軸Vを水平方向の移動位置としてMSEをグラフ化すると図10のようになる。図10では、V1とV2の位置で極小値があらわれる。
このように1画素ずつ移動させながらMSEを求め、極小値が発見される度に親セグメントの分割操作を行う。この操作を図で説明すると、図8(a)の位置に枠704を移動させたときに、図1のフレームメモリ106の画像である図8(b)の破線枠801と図8(a)の破線枠800の内部が一致する。このときが図10の極小値V1の位置に相当する。この位置で画素毎の自乗誤差(SE)を求めると図11のようになる。
図11の横軸Pは枠704の内部の画素を識別する連番である。図8(a)の破線枠800の内部と図8(b)の破線枠801の内部とは同一成分であるため自乗誤差は図11の横軸区間[P,P]の値をとり、それ以外の画素の自乗誤差は横軸区間[P,P]のようになるので,図11を閾値Eにより領域分割する。このようにして図8(a)の破線枠800の領域が検出される。閾値Eは、求めたSEの分散などから求められる分離平面である。例えば、k−meansクラスタリングなどのアルゴリズムにより分離平面は求められるが、他のアルゴリズムも適用可能であり本発明では分離平面の求め方を特に規定しない。詳細は、前記非特許文献2などに記載されている。
同様にして、図8(c)の位置に枠704を移動させたときに破線枠802と図8(d)の破線枠803の領域が一致して図10の極小値V2をとり、画素毎の自乗誤差は図12のようになる。この結果、閾値Eよりも誤差の少ない横軸区間[P,P]に相当する図8(c)の破線枠802の領域が検出される。以上のようにして、前方マッチングにより図7(c)の親セグメントが分割される。この分割された領域を子セグメントと呼ぶ。
図1のセグメント分離器108は、上記の図6のステップS32の処理に続いて、後方マッチングによる子セグメントの抽出処理(領域分割)を行う(図6のステップS33)。後方マッチングは図6のステップS32とは逆に、図7(d)で抽出された枠705の内部の親セグメントを、図1のフレームメモリ107に蓄積されている図7(a)の画像に対応させながらフレーム間で輝度値のMSEを求める。
分割操作は、図6のステップS32と同様に、図9(b)の位置に枠705を移動させたときに、図9(a)の破線枠901の内部と図9(b)の破線枠900の内部が一致しMSEが極小値をとり、この位置で画素毎の自乗誤差(SE)を求めると図13のようになる。図13の閾値E以下の横軸区間[P,P]が、破線枠900の内部を示しており子セグメントとして分離される。
同様に、図9(d)の位置に枠705を移動させたときに、図9(c)の破線枠903の内部と図9(d)の破線枠902の内部が一致しMSEが極小値をとり、この位置で画素毎の自乗誤差(SE)を求めると図14のようになる。図14の閾値E以下の横軸区間[P,P]間が、破線枠902の内部を示しており、子セグメントとして分離される。また、どちらにも属することの無かった横軸区間[P,P]が、実線枠904の内部を示しており、子セグメントとして分離される。
以上説明した子セグメントの分離においても、親セグメントの分離と同様の孤立点除去を行うことで、孤立的に閾値Eの値を前後している画素を周辺のセグメントに統合する。抽出された子セグメントの位置と画素値の情報は図1のセグメント分離器108から出力され、ベクトル検出器109へ供給される。
図1のベクトル検出器109は、上記の抽出された子セグメントを用いて補間フレームを合成するためのベクトル検出を行う(図2のステップS17)。このベクトル検出の操作を、図15を用いて説明する。いま、図15(b)を、図1のフレーム間引器101で間引かれフレームメモリ105に蓄積された画像とする。また、図15(a)を図1のローカル復号化器104で復号されフレームメモリ107に蓄積された補間フレームの前フレームの画像とする。さらに、図15(c)を図1のローカル復号化器104で復号されフレームメモリ106に蓄積された補間フレームの後フレームの画像とする。
図1のセグメント分離器108により分離された図15(a)、(c)の子セグメント800、802、900、902、904を使用して図15(b)を近似する補間フレームが合成できるように、使用する子セグメントの選択と移動量(ベクトル)及びオーバーラップ部分の上下関係を決定することが図1のベクトル検出器109で行われる操作である。
まず、ベクトル検出のために子セグメント800、802、900、902、904の全てについて、例えば水平方向±32画素、垂直方向±32画素の範囲で1画素ずつ移動させながら、図15(b)の画像との平均自乗誤差を求める。続いて、求めた各子セグメントの平均自乗誤差の最小値が規定値Tよりも大きな子セグメントは不適合セグメントとして破棄する。規定値Tは、全子セグメントの平均自乗誤差の最小値の分散から求められるが、その方法は前述の閾値Eと同様に本発明では特に規定しない。
次に、選択された子セグメントの平均自乗誤差の最小値を与える位置への画面上の水平及び垂直の移動量がベクトル情報として採用される。例えば、図15では子セグメント900、902、904が採用され、各ベクトル1500〜1502が求められる。また、ベクトルにより移動されたセグメントには、オーバーラップ部分が発生するが、オーバーラップしている部分の上下を入れ換えながら、原画像である図15(b)の画像との誤差が少なくなるように、上下間係を決定し情報として出力する。以上の操作により、図1のベクトル検出器109から子セグメントの選択情報、ベクトル情報及びオーバーラップ情報(上下関係決定情報)が出力される。
次に、図1のベクトル符号化器110によりベクトル検出器109から出力された子セグメントの選択情報、ベクトル情報及びオーバーラップ情報が符号化される(図2のステップS18)。その符号化方法は、符号化するデータを効率良く符号化する方法であれば特に規定されるものではなく、例えば、ハフマン符号化や算術符号化などが利用できる。最後に、図1のベクトル符号化器110から符号化後のビットストリームが出力端子111へ出力される(図2のステップS19)。
次に、復号化処理について説明する。図3は本発明になる動画像復号化装置の一実施の形態のブロック図、図4はその動作説明用フローチャートを示す。図3において、動画像復号化装置は、図1の出力端子103から出力されたビットストリ−ムが、例えばインターネットなどの帯域が保証されていないネットワークを介して伝送されて入力端子200から入力される動画像復号化器201と、動画像復号化器201で復号化して得られた動画像信号を1フレーム単位で蓄積するフレームメモリ202と、フレームメモリ202から出力された動画像信号を1フレーム単位で蓄積するフレームメモリ203と、図1の出力端子111から出力されたビットストリームが、例えばインターネットなどの帯域が保証されていないネットワークを介して伝送されて入力端子204から入力される補間用ベクトル復号化器205と、図1のセグメント分離器108と同様のセグメンテーション動作を行うセグメント分離器206と、動き補償器207と、セレクタ208とより構成されている。
次に、この実施の形態の動画像復号化装置の動作について、図4のフローチャートを併せ参照して説明する。まず、動画像復号化器201が、入力端子200を介して入力される、図1の出力端子103から出力されたビットストリームを復号化する(図4のステップS21)。この動画像の復号化処理は、図1の動画像符号化器102の符号化処理に対応したものであればよく、本実施の形態では特に規定はしないが、例えばH.261で規定された復号化方法などが考えられる。
次に、動画像復号化器201で復号化された画像信号のうちの連続する2フレームがフレームメモリ202、203に蓄積される(図4のステップS22)。図3ではフレームメモリ202に新たなフレームの動画像信号が動画像復号化器201から入力されると同時に、フレームメモリ202に蓄積されていた1フレームの動画像信号がフレームメモリ203に入力されて蓄積される。
次に、セグメント分離器206がフレームメモリ202、203に蓄積された計2フレームの画像信号に対してセグメンテーションを実行する(図4のステップS23)。このセグメント分離器206によるセグメンテーションの詳細については、前述の図1のセグメント分離器108と同一であるので省略する。図1のローカル復号器104から出力される画像信号と、図3の動画像復号化器201から出力される画像信号は同一であるので、セグメント分離器206から出力されるセグメント情報も、図1のセグメント分離器108から出力されるセグメント情報と同一である。
上述の処理と並行して、補間用ベクトル復号化器205が、入力端子204を介して入力される、図1の出力端子111から出力されたビットストリームの復号化処理を行い(図4のステップS24)、子セグメントの選択情報、ベクトル情報及びオーバーラップ情報を復号化する。この復号化方法は前述の図1のベクトル符号化器110に対応したものであればよい。
次に、図3の動き補償器207で動き補償処理を実行する(図4のステップS25)。この動き補償器207は、セグメント分離器206から出力された子セグメントの中から、補間用ベクトル復号化器205から出力される子セグメントの選択情報による子セグメントを選択し、ベクトル情報により指定される移動先に移動し、オーバーラップ情報に従った順番で子セグメントを貼り付けて行く。また、補間画像のなかで子セグメントの貼り付けられていない部分は、動きの無い部分であるのでフレームメモリ203の画像をそのまま貼りつける。以上の手順により補間画像が合成され動き補償器207から出力される。
最後に、図3のセレクタ208は、復号化されフレームメモリ203に蓄積された画像信号と、補間処理により合成され動き補償器207から出力される画像信号とを、交互に選択し出力端子209から出力する(図4のステップS26)。以上の一連の復号化処理により、出力端子209からフレーム間引きが行われる前のフレーム周波数と同じフレーム周波数の動画像信号が得られる。
このように、本実施の形態によれば、同一の動き特徴量を持つ領域を1つのセグメントにまとめることができるため、画面を一様にブロック分割する方法に比べて格段にベクトル数を削減することが可能になると共に、ブロック分割のような異なる動きが混在する問題も発生しない。また、上記のセグメントに対して付与されるベクトルは補間フレームの動き情報であるため正確な動きを表現できる。
これらの結果、データ量の削減という目的を達成しながら、正確なフレーム補間による画像品質の向上が実現され、インターネットなどの帯域が保証されていない通信においても自然な動きの動画像通信が実現される。
なお、本発明は以上の実施の形態に限定されるものではなく、例えば、図2のフローチャートに従ってその各ステップを順次にコンピュータに実行させる動画像符号化用プログラム、及び図4のフローチャートに従ってその各ステップを順次にコンピュータに実行させる動画像復号化用プログラムも含むものである。上記の動画像符号化用プログラム及び動画像復号化用プログラムは、記録媒体から再生されてコンピュータに取り込まれてもよいし、通信ネットワークを介して配信されてコンピュータに取り込まれるようにしてもよい。
本発明の動画像符号化装置の一実施の形態のブロック図である。 図1の動作説明用フローチャートである。 本発明の動画像復号化装置の一実施の形態のブロック図である。 図3の動作説明用フローチャートである。 フレーム間引きの一例を説明する図である。 本発明によるセグメンテーションの一例のフローチャートである。 親セグメントの分離方法の一例を説明する図である。 前方マッチングによる子セグメントの分離方法の一例を説明する図である。 後方マッチングによる子セグメントの分離方法の一例を説明する図である。 子セグメントの探索位置における平均自乗誤差の変化を説明する図である。 子セグメントの自乗誤差の分布の第1の例の説明図である。 子セグメントの自乗誤差の分布の第2の例の説明図である。 子セグメントの自乗誤差の分布の第3の例の説明図である。 子セグメントの自乗誤差の分布の第4の例の説明図である。 子セグメントのベクトル情報の検出を説明する図である。 フレーム間引き前の物体の動きを説明する図である。 フレーム間引き後の物体の動きを説明する図である。 従来のフレーム補間による物体の動きを説明する図である。 異なる方向へ動く物体を説明する図である。 異なる方向へ動く物体をブロック符号化した場合の弊害を説明する図である。
符号の説明
100 動画像信号入力端子
101 フレーム間引器
102 動画像符号化器
103、111 出力端子
104 ローカル復号化器
105、106、107、202、203 フレームメモリ
108、206 セグメント分離器
109 ベクトル検出器
110 ベクトル符号化器
200、204 ビットストリーム入力端子
201 動画像復号化器
205 補間用ベクトル復号化器
207 動き補償器
208 セレクタ
209 動画像信号出力端子
704 親セグメント
705 親セグメント
800 前方マッチングによる親セグメントの左マッチング領域
801 前方フレームの左マッチング領域
802 前方マッチングによる親セグメントの右マッチング領域
803 前方フレームの右マッチング領域
900 後方マッチングによる親セグメントの左マッチング領域
901 後方フレームの左マッチング領域
902 後方マッチングによる親セグメントの右マッチング領域
903 後方フレームの右マッチング領域
904 残領域


Claims (2)

  1. 動画像信号のフレームからフレーム間引きを行い、フレームレートを削減して符号化する動画像符号化装置において、
    供給される前記動画像信号に対し、予め定めた規則に従ってフレーム間引きを行うフレーム間引き手段と、
    前記フレーム間引き手段によりフレーム間引き処理された動画像信号を符号化して動画像符号化信号を出力する動画像符号化手段と、
    前記動画像符号化手段から出力される前記動画像符号化信号をローカル復号化するローカル復号化手段と、
    前記フレーム間引き手段により前記動画像信号から間引かれた、前記動画像符号化手段で符号化されない間引きフレームの画像信号を記憶する第1の記憶手段と、
    前記ローカル復号化手段から出力されるローカル復号動画像信号で、前記第1の記憶手段に記憶されている一つの前記間引きフレームに対して、時間的に前後する2フレームのローカル復号動画像信号を記憶する第2の記憶手段と、
    前記第2の記憶手段から出力された前記前後する2フレームのローカル復号動画像信号からフレーム間の差分値を求め、その差分値が規定値以上の値を持つ連続した領域の画像信号を親セグメントとして、前記前後する2フレームのローカル復号動画像信号のそれぞれから分離する第1の分離手段と、
    前記第1の分離手段で前記前後する2フレームのそれぞれから分離された前記親セグメントのうち、一方のフレームの前記親セグメントを、他方のフレームのローカル復号動画像信号の画像領域と位置をずらしながら誤差を求め、その誤差の極小値が発見される度に画素毎の誤差を求め、閾値よりも該画素毎の誤差が小さく、かつ、連続した領域の画像信号を、前記一方のフレームの前記親セグメントから子セグメントとして分離する処理を行うことにより、前記前後する2フレームのそれぞれから第1及び第2の子セグメントを分離出力する第2の分離手段と、
    前記第1の記憶手段から出力された前記間引きフレームの動画像信号と、前記第2の分離手段で分離された前記第1及び第2の子セグメントとのマッチングにより、前記第1及び第2の子セグメントのうち平均自乗誤差の最小値が規定値よりも小さな子セグメントを選択する子セグメントの選択情報と、選択された子セグメントの平均自乗誤差の最小値を与える位置への画面上の水平及び垂直の移動量を示す動きベクトル情報と、前記第1及び第2の子セグメントの画面上の上下関係を示す上下関係決定情報とを検出する検出手段と、
    前記検出手段で検出された前記子セグメントの選択情報と前記動きベクトル情報と前記上下関係決定情報とを符号化して補間用符号化信号を出力する符号化手段と
    を有し、前記動画像符号化信号と前記補間用符号化信号とをそれぞれ出力することを特徴とする動画像符号化装置。
  2. 請求項1記載の動画像符号化装置によりフレーム間引きが行われて符号化された動画像信号を元のフレームレートに復号化する動画像復号化装置であって、
    間引き処理後の前記動画像符号化信号を復号化する第1の復号化手段と、
    前記補間用符号化信号を復号化する第2の復号化手段と、
    前記第1の復号化手段により復号化された時間的に前後する2フレームの復号化画像信号からフレーム間の差分値を求め、差分値が規定値以上の値を持つ連続した領域を親セグメントとして、前記前後する2フレームの復号化画像信号のそれぞれから分離する第1の分離手段と、
    前記第1の分離手段で前記前後する2フレームの復号化画像信号のそれぞれから分離された前記親セグメントのうち、一方のフレームの前記親セグメントを、他方のフレームの復号化画像信号の画像領域と位置をずらしながら誤差を求め、その誤差の極小値が発見される度に画素毎の誤差を求め、閾値よりも該画素毎の誤差が小さく、かつ、連続した領域の画像信号を前記一方のフレームの前記親セグメントから子セグメントとして分離する処理を行って、第1及び第2の子セグメントを分離出力する第2の分離手段と、
    前記第2の復号化手段から出力された前記子セグメントの選択情報、前記動きベクトル情報及び前記上下関係決定情報に従い、前記第2の分離手段で分離された前記第1及び第2の子セグメントを選択及び移動すると共に、前記上下関係決定情報に従って重ね合わせ、前記前後する2フレーム間の補間フレームを合成する補償手段と、
    前記補償手段により得られた補間フレームの画像信号と、前記第1の復号化手段から出力された間引き処理後の前記動画像信号とを交互に選択する選択手段と
    を有することを特徴とする動画像復号化装置。
JP2005083053A 2005-03-23 2005-03-23 動画像符号化装置及び動画像復号化装置 Expired - Fee Related JP4321468B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005083053A JP4321468B2 (ja) 2005-03-23 2005-03-23 動画像符号化装置及び動画像復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005083053A JP4321468B2 (ja) 2005-03-23 2005-03-23 動画像符号化装置及び動画像復号化装置

Publications (2)

Publication Number Publication Date
JP2006270294A JP2006270294A (ja) 2006-10-05
JP4321468B2 true JP4321468B2 (ja) 2009-08-26

Family

ID=37205812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005083053A Expired - Fee Related JP4321468B2 (ja) 2005-03-23 2005-03-23 動画像符号化装置及び動画像復号化装置

Country Status (1)

Country Link
JP (1) JP4321468B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5286805B2 (ja) 2008-01-31 2013-09-11 沖電気工業株式会社 動きベクトル検出装置及び方法、動画像符号化装置及び方法、並びに、動画像復号化装置及び方法
JP5029543B2 (ja) * 2008-09-09 2012-09-19 富士通株式会社 符号化装置および符号化プログラム
JP5103676B2 (ja) * 2010-02-19 2012-12-19 サイレックス・テクノロジー株式会社 映像配信システムにおける送信機

Also Published As

Publication number Publication date
JP2006270294A (ja) 2006-10-05

Similar Documents

Publication Publication Date Title
US9432681B2 (en) Image decoding device and method thereof using inter-coded predictive encoding code
US6192079B1 (en) Method and apparatus for increasing video frame rate
JP4240554B2 (ja) 画像符号化装置および画像符号化方法、並びに画像復号化装置および画像復号化方法
US7224732B2 (en) Motion vector conversion method and conversion apparatus of interlaced MPEG-2 to progressive MPEG-4
US20060062299A1 (en) Method and device for encoding/decoding video signals using temporal and spatial correlations between macroblocks
KR20060043115A (ko) 베이스 레이어를 이용하는 영상신호의 엔코딩/디코딩 방법및 장치
KR20060109247A (ko) 베이스 레이어 픽처를 이용하는 영상신호의 엔코딩/디코딩방법 및 장치
JPH1155664A (ja) 二値形状信号符号化装置
KR20060027778A (ko) 베이스 레이어를 이용하는 영상신호의 엔코딩/디코딩 방법및 장치
US6577352B1 (en) Method and apparatus for filtering chrominance signals of image
US7061981B2 (en) Motion vector conversion method and conversion apparatus
JP4321468B2 (ja) 動画像符号化装置及び動画像復号化装置
JP2001285881A (ja) ディジタル情報変換装置および方法、並びに画像情報変換装置および方法
JP3946781B2 (ja) 画像情報変換装置及び方法
US20060120459A1 (en) Method for coding vector refinement information required to use motion vectors in base layer pictures when encoding video signal and method for decoding video data using such coded vector refinement information
JP2000036963A (ja) 画像符号化装置、画像符号化方法および画像復号化装置
US20040066466A1 (en) Progressive conversion of interlaced video based on coded bitstream analysis
JPH08242457A (ja) 動きベクトル検出方法
JPH0366278A (ja) 映像信号の高能率符号化方法
JP4552263B2 (ja) ディジタル信号処理装置および方法、並びにディジタル画像信号処理装置および方法
JP5742048B2 (ja) カラー動画像構造変換方法及びカラー動画像構造変換装置
JP2001285882A (ja) ノイズ低減装置および方法
JP4779207B2 (ja) 動きベクトル変換装置及び動きベクトル変換方法
JP6099104B2 (ja) カラー動画像構造変換方法及びカラー動画像構造変換装置
JP4552264B2 (ja) エラー修整装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070629

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090512

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090525

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees