JP2005198268A - 動画像変換装置および方法、並びに動画像データフォーマット - Google Patents
動画像変換装置および方法、並びに動画像データフォーマット Download PDFInfo
- Publication number
- JP2005198268A JP2005198268A JP2004357974A JP2004357974A JP2005198268A JP 2005198268 A JP2005198268 A JP 2005198268A JP 2004357974 A JP2004357974 A JP 2004357974A JP 2004357974 A JP2004357974 A JP 2004357974A JP 2005198268 A JP2005198268 A JP 2005198268A
- Authority
- JP
- Japan
- Prior art keywords
- moving image
- moving speed
- block
- moving
- frame rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】観測者が画質の劣化を認識させないようにデータ量の削減を行うことができる。
【解決手段】 ブロック処理部51−1は、水平方向または垂直方向の移動量が2ピクセル以上である場合のN個のブロックに対して、画素数を、同様にブロック分配部32から供給された移動量に応じて間引く処理を行う。ブロック処理部51−2は、水平方向と垂直方向の移動量がともに1ピクセル未満である場合のN個のブロックに対して、フレーム数を間引く処理を行う。ブロック処理部51−3は、水平方向と垂直方向の移動量が1ピクセル以上で、2ピクセル未満である場合のN個のブロックに対して、画素数の間引き処理とフレーム数の間引き処理をそれぞれ行う。
【選択図】図19
【解決手段】 ブロック処理部51−1は、水平方向または垂直方向の移動量が2ピクセル以上である場合のN個のブロックに対して、画素数を、同様にブロック分配部32から供給された移動量に応じて間引く処理を行う。ブロック処理部51−2は、水平方向と垂直方向の移動量がともに1ピクセル未満である場合のN個のブロックに対して、フレーム数を間引く処理を行う。ブロック処理部51−3は、水平方向と垂直方向の移動量が1ピクセル以上で、2ピクセル未満である場合のN個のブロックに対して、画素数の間引き処理とフレーム数の間引き処理をそれぞれ行う。
【選択図】図19
Description
本発明は、動画像変換装置および方法、並びに動画像データフォーマットに関し、特に、動画のデータ量を適切に削減することができるようにした動画像変換装置および方法、並びに動画像データフォーマットに関するものである。
動画像のデータ量は非常に膨大であるため、動画像を保存や送信等する際には、通常、動画像のデータ量の圧縮(削減)が行われる。
動画像のデータ量の圧縮方法として、例えば、被写体速度や輝度によって、動画像全体の解像度やフレームレートを間引く方法(特許文献1参照)や、分割された複数の領域を異なる画像品質で符号化することによりデータ量を圧縮する方法(特許文献2参照)が存在する。
しかしながら、特許文献1に示される方法では、動画の領域の特徴に関わらず動画画質が均一に劣化するので、領域の特徴(例えば、動きがの大きさ)によっては、見難い画像となってしまう場合があった。
また特許文献2に示される方法では、対象となる動画像が固定されたカメラにより取得されたものに限定されており、通常の手持ち撮影には適用することができなかった。また異なる品質で符号化する領域は、初めに手動で決定しなければならず、その領域情報を画像の変化に応じて自動的に修正することで各フレームの領域情報を決定するために、当該方法の適用範囲は非常に限定されたものとなっている。
本発明はこのような状況に鑑みてなされたものであり、主観的な画質劣化を最小限に抑えつつ、広範にわたる方法で取得された動画像のデータ量を削減することができるようにするものである。
本発明の動画像変換方法は、領域毎の移動速度に基づきフレームレートと、空間解像度を決定する決定ステップと、フレームレートと空間解像度にしたがって画像データを変換する変換ステップとを有することを特徴とする。
フレームレートは、移動速度に基づき少なくとも2段階に設定され、移動速度が速い領域では高フレームレートに、移動速度が遅い領域では低フレームレートに設定されるようにすることができる。
空間解像度は、移動速度に基づき少なくとも2段階に設定され、移動速度が速い領域では低空間解像度に設定され、移動速度が遅い領域では高空間解像度に設定されるようにすることができる。
変換ステップは、移動速度が速い領域では空間方向の圧縮処理を、移動速度が遅い領域では時間方向の圧縮処理を行うことができる。
変換ステップは、移動速度に応じて空間方向の圧縮処理と時間方向の圧縮処理を同時に行うことができる。
空間方向の圧縮処理は、画素数の間引き処理とすることができる。
時間方向の圧縮処理は、フレームの間引き処理とすることができる。
各領域内の画素の移動量を検出して領域の移動速度を求める移動速度算出ステップをさらに含ませ、決定ステップには、移動速度算出ステップでの処理で算出された各領域の移動速度に基づいて、フレームレートと空間解像度を決定させることができる。
移動速度算出ステップは、領域毎にブロックマッチングによる動きベクトルの検出を行い、検出した動きベクトルを移動速度とすることができる。
移動速度算出ステップは、連続するN(Nは整数)フレームの全部あるいは一部を用いて、連続するNフレームの各フレームに対して同じ移動速度を出力することができる。
変換ステップは、移動速度が所定の閾値T1より大きいときに空間方向の圧縮処理を行うことができる。
変換ステップは、移動速度が所定の閾値T2より小さいときに時間方向の圧縮処理を行うことができる。
変換ステップは、移動速度が所定の閾値T3とT4の間にあるときに空間方向および時間方向の圧縮を同時に行うことができる。
決定ステップは、領域ごとの移動速度に加え、過去の決定結果に基づき、フレームレートと空間解像度を決定することができる。
変換ステップは、同一領域における過去の処理内容が空間方向の圧縮処理であり、かつ移動速度が所定の閾値V1より大きいときに空間方向の圧縮処理を行うことができる。
変換ステップは、同一領域における過去の処理内容が時間方向の圧縮処理であり、かつ移動速度が所定の閾値V2より小さいときに時間方向の圧縮処理を行うことができる。
変換ステップは、同一領域における過去の処理内容が空間方向および時間方向の圧縮を同時に行う処理であり、かつ移動速度が所定の閾値V3とV4の間にあるときに空間方向および時間方向の圧縮処理を同時に行うことができる。
決定ステップは、人の視覚特性に鑑みて、それ以上高フレームレート、高空間解像度であっても、人が画質の差を認識することが困難であるフレームレート、ならびに空間解像度に決定することができる。
動画像データは、高フレームレート、かつ高空間解像度で撮像された動画像データとし、移動速度は、動画像データの領域毎に検出されたフレーム間の移動量とすることができる。
動画像データは、CG(Computer Graphics)処理によって生成された動画像データとし、移動速度は、動画像データのオブジェクト毎、あるいは領域毎に予め付加されているようにすることができる
本発明の動画像変換装置は、動画像データを入力する第1の入力手段と、動画像データの領域毎の移動速度を入力する第2の入力手段と、移動速度に基づきフレームレートと空間解像度を決定する決定手段と、フレームレートと空間解像度にしたがって画像データを変換する変換手段とを備えることを特徴とする。
変換手段は、移動速度が速い領域では空間方向の圧縮処理を、移動速度が遅い領域では時間方向の圧縮処理を行うことができる。
変換手段は、移動速度に応じて空間方向の圧縮処理と時間方向の圧縮処理を同時に行うことができる。
各領域内の画素の移動量を検出して領域の移動速度を求める移動速度算出手段をさらに設け、決定手段は、移動速度算出手段により算出された各領域の移動速度に基づいて、フレームレートと空間解像度を決定することができる。
移動速度算出手段は、領域毎にブロックマッチングによる動きベクトルの検出を行い、検出した動きベクトルを移動速度とすることができる。
移動速度算出手段は、連続するN(Nは整数)フレームの全部あるいは一部を用いて、連続するNフレームの各フレームに対して同じ移動速度を出力することができる。
変換手段は、移動速度が所定の閾値T1より大きいときに空間方向の圧縮処理を行うことができる。
変換手段は、移動速度が所定の閾値T2より小さいときに時間方向の圧縮処理を行うことができる。
変換手段は、移動速度が所定の閾値T3とT4の間にあるときにf空間方向および時間方向の圧縮を同時に行うことができる。
決定手段は、領域ごとの移動速度に加え、過去の決定結果に基づき、フレームレートと空間解像度を決定することができる。
変換手段は、同一領域における過去の処理内容が空間方向の圧縮処理であり、かつ移動速度が所定の閾値V1より大きいときに空間方向の圧縮処理を行うことができる。
変換手段は、同一領域における過去の処理内容が時間方向の圧縮処理であり、かつ移動速度が所定の閾値V2より小さいときに時間方向の圧縮処理を行うことができる。
変換手段は、同一領域における過去の処理内容が空間方向および時間方向の圧縮を同時に行う処理であり、かつ移動速度が所定の閾値V3とV4の間にあるときに空間方向および時間方向の圧縮処理を同時に行うことができる。
決定手段は、人の視覚特性に鑑みて、それ以上高フレームレート、高空間解像度であっても、人が画質の差を認識することが困難であるフレームレート、ならびに空間解像度に決定することができる。
本発明においては、領域毎の移動速度に基づきフレームレートと、空間解像度が決定され、フレームレートと空間解像度にしたがって画像データが変換される。
本発明の、画像を任意の領域に分割して記述する動画像データフォーマットは、各領域データは、フレームレートを表す第1のタグデータと、空間解像度を表す第2のタグデータと、フレームレートと空間解像度に変換された画像データで構成され、フレームレートと空間解像度は、各領域の移動速度に基づき決定されたフレームレートと空間解像度であることを特徴とする。
本発明によれば、データ量の削減により生じる画質劣化を観測者に認識させないように、動画像のデータ量を削減することができる。
以下に本発明の実施の形態を説明するが、本明細書に記載の発明と、発明の実施の形態との対応関係を例示すると、次のようになる。この記載は、本明細書に記載されている発明をサポートする実施の形態が本明細書に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載されているが、発明に対応するものとして、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その発明に対応するものではないことを意味するものではない。逆に、実施の形態が発明に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その発明以外の発明には対応しないものであることを意味するものでもない。
さらに、この記載は、本明細書に記載されている発明の全てを意味するものではない。換言すれば、この記載は、本明細書に記載されている発明であって、この出願では請求されていない発明の存在、すなわち、将来、分割出願されたり、補正により出現、追加される発明の存在を否定するものではない。
本発明の動画像変換方法は、領域毎の移動速度に基づきフレームレートと、空間解像度を決定する決定ステップ(例えば、図36のステップS3,S5)と、フレームレートと空間解像度にしたがって画像データを変換する変換ステップ(例えば、図36のステップS4,S6,S7)とを有することを特徴とする。
フレームレートは、移動速度に基づき少なくとも2段階に設定され(例えば、入力時のフレームレートと、その1/4のフレームレート)、移動速度が速い領域では高フレームレートに、移動速度が遅い領域では低フレームレートに設定されるようにすることができる。
空間解像度は、移動速度に基づき少なくとも2段階に設定され(例えば、入力時の空間解像度と、その1/4の解像度)、移動速度が速い領域では低空間解像度に設定され、移動速度が遅い領域では高空間解像度に設定されるようにすることができる。
変換ステップは、移動速度が速い領域では空間方向の圧縮処理(例えば、図36のステップS4の処理)を、移動速度が遅い領域では時間方向の圧縮処理(例えば、図36のステップS6の処理)を行うことができる。
変換ステップは、移動速度に応じて空間方向の圧縮処理と時間方向の圧縮処理を同時に行うことができる(例えば、図36のステップS7の処理)。
空間方向の圧縮処理は、画素数の間引き処理とすることができる(例えば、図36のステップS4の処理)。
時間方向の圧縮処理は、フレームの間引き処理とすることができる(例えば、図36のステップS6の処理)。
各領域内の画素の移動量を検出して領域の移動速度を求める移動速度算出ステップ(例えば、図36のステップS2)をさらに含ませ、決定ステップには、移動速度算出ステップでの処理で算出された各領域の移動速度に基づいて、フレームレートと空間解像度を決定させることができる。
移動速度算出ステップは、領域毎にブロックマッチングによる動きベクトルの検出を行い(例えば、図19の移動量検出部31の処理)、検出した動きベクトルを移動速度とすることができる。
移動速度算出ステップは、連続するN(Nは整数)フレームの全部あるいは一部(例えば、連続する2枚のフレーム)を用いて、連続するNフレームの各フレームに対して同じ移動速度を出力することができる。
変換ステップは、移動速度が所定の閾値T1より大きいとき(例えば、2ピクセル/フレーム以上のとき)に空間方向の圧縮処理を行うことができる。
変換ステップは、移動速度が所定の閾値T2より小さいとき(例えば、1ピクセル/フレーム未満のとき)に時間方向の圧縮処理を行うことができる。
変換ステップは、移動速度が所定の閾値T3とT4の間にあるとき(例えば、1ピクセル/フレーム以上で、かつ、2ピクセル/フレーム未満のとき)に空間方向および時間方向の圧縮を同時に行うことができる。
決定ステップは、人の視覚特性に鑑みて、それ以上高フレームレート、高空間解像度であっても、人が画質の差を認識することが困難であるフレームレート、ならびに空間解像度(例えば、式(8)を満たすフレームレートと空間解像度)に決定することができる。
動画像データは、高フレームレート、かつ高空間解像度で撮像された動画像データとし、移動速度は、動画像データの領域毎に検出されたフレーム間の移動量とすることができる。
動画像データは、CG(Computer Graphics)処理によって生成された動画像データ(例えば、図47の動画像変換装置1に入力される動画像データ)とし、移動速度は、動画像データのオブジェクト毎、あるいは領域毎に予め付加されているようにすることができる。
本発明の動画像変換装置は、動画像データを入力する第1の入力手段と(例えば、図19の画像蓄積部21)、動画像データの領域毎の移動速度を入力する第2の入力手段(例えば、図19の移動量検出部31)と、移動速度に基づきフレームレートと空間解像度を決定する決定手段(例えば、図19のブロック分配部32)と、フレームレートと空間解像度にしたがって画像データを変換する変換手段(例えば、図10のブロック処理部51)とを備えることを特徴とする。
変換手段(例えば、図19のブロック処理部51−1,51−2)は、移動速度が速い領域では空間方向の圧縮処理を、移動速度が遅い領域では時間方向の圧縮処理を行うことができる。
変換手段(例えば、図19のブロック処理部51−3)は、移動速度に応じて空間方向の圧縮処理と時間方向の圧縮処理を同時に行うことができる。
各領域内の画素の移動量を検出して領域の移動速度を求める移動速度算出手段(例えば、図20のブロックマッチング部43)をさらに設け、決定手段は、移動速度算出手段により算出された各領域の移動速度に基づいて、フレームレートと空間解像度を決定することができる。
本発明の、画像を任意の領域に分割して記述する動画像データフォーマット(例えば、図32の動画像データフォーマット)は、各領域データは、フレームレートを表す第1のタグデータと、空間解像度を表す第2のタグデータ(例えば、図32のブロック処理の内容を示すフラグ)と、フレームレートと空間解像度に変換された画像データ(例えば、図32のデータ量が削減されたブロックのデータ)で構成され、フレームレートと空間解像度は、各領域の移動速度に基づき決定されたフレームレートと空間解像度であることを特徴とする。
本発明を適用した動画像変換装置は、入力された動画像を、そのデータ量が削減された動画像に変換するが、その際、所定の視覚特性に基づいて実現される超解像度効果を利用した動画像変換処理を行うことにより、データ量の削減による画質劣化を観測者に知覚させないようにすることができる。
はじめにその視覚特性と超解像度効果について説明する。
人の視覚は、受けた光の刺激の総和がある閾値になったとき光を知覚するという機能(以下、時間的積分機能と称する)を有している。すなわち光の知覚は、呈示時間内の光の刺激の分布状態に関係なく、時間的に積分された光の総和に従う。また光を知覚できる刺激(閾値)は、刺激の呈示時間が長くなるにつれて小さくなり、呈示時間が短くなるにつれて大きくなる。
この関係は、ブロックの法則(Bloch's law)として知られ、以下の式が成り立つ。式中、Iは、閾値としての刺激の強度であり、Tは、刺激の呈示時間であり、kは定数である。
I×T=k
I×T=k
またこの関係は、横軸を刺激呈示時間Tとし、縦軸を閾値(強度I)とすると、図1に示すように表すことができる。この曲線は、閾値呈示時間曲線として知られている。図1の閾値呈示時間曲線によれば、強度Iaの光がインパルス的に時間Taの間呈示された場合と、Iaの1/nの強度Ibの光がTaのn倍の時間Tbだけ連続して呈示された場合とでは、人は、同じ明るさを感じることになる。
なお、刺激の呈示時間のある時間(図1の例では時間TL)までは、ブロックの法則が成り立つが(時間TLまでは右下がりの直線になるが)、時間TLを越えると閾値が刺激の強度のみに依存するようになる(呈示時間によって変化しなくなり、その結果閾値呈示時間曲線は折れ線のような特性を示す)。ブロックの法則が成り立つ最大の刺激呈示時間TLは、臨界呈示時間と呼ばれている。この時間TLは、背景光の強度などの刺激呈示条件によって変化するが、およそ25ms乃至100msであるという報告がある。
ブロックの法則の詳細については、例えば、"視覚情報処理ハンドブック,日本視覚学会編,pp.219-220"などに記載されている。
人の視覚はまた、刺激を知覚すると、その刺激を、その刺激の呈示が終了した後もある時間記憶するという機能(以下、感覚記憶機能と称する)を有している。この時間については、10ms乃至200msであるという報告が多数されている。この機能は、アイコニックメモリーとか視覚的持続などとも呼ばれ、例えば、"視覚情報ハンドブック,日本視覚学界編,pp.229-230"などに記載されている。
次に、視覚特性に基づいて実現される超解像度効果について説明する。なお本発明における超解像度効果は、観測者が、ある時間内に複数の画像が加算されたものを知覚するという視覚特性を利用している。これは上記の時間的積分機能および感覚記憶機能が複雑に関係して引き起こされていると考えられるが、以下の説明においては、これを便宜上、時間的積分機能によるものとする。
例えば、水平方向に平行移動する被写体を、所定のフレームレート(以下、入力画像フレームレートと称する)および所定のサンプリングレート(以下、入力画像サンプリングレートと称する)で撮影すると、図2Aに示すような、被写体像Waが、速度v(ピクセル/フレーム)で、図面に向かって右方向(X軸方向)に移動する入力フレームFaが得られる。図2Aには、連続する4枚の入力フレームFa1乃至Fa4が図示されている。
このように得られた入力フレームFaを、X軸方向(被写体像Waの移動方向)に、入力画像サンプリングレートの、1/mのサンプリングレート(以下、表示画像サンプリングレートと称する)でサンプリングするものとする(間引き量mで間引きするものとする)。図2Aの場合、入力フレームFaが間引き量4で間引きされているので、図2Bに示すような、X軸方向の画素数が1/4になった(X軸方向に粗くなった)(画質が劣化した)表示フレームFbが得られる。表示フレームFbには、入力フレームFaの被写体像Waが間引き量4で間引きされた画像(以下、表示被写体像Wbと称する)が含まれている。
そしてこのように得られた表示フレームFbを、所定のフレームレート(以下、表示画像フレームレート)で表示するものとする。その結果観測者は、上述した時間的積分機能における積分時間内に表示された複数の表示フレームFbの積分画像を知覚する。
ここで観測者は、視線が、このように表示された表示フレームFb上の表示被写体像Wbを追従するように見るものとする。この場合観測者の視点は、常に表示被写体像Wbの中心に位置するので、観測者の網膜上の表示被写体像Wbはほぼ静止している。図2Bに示す座標軸Vx,Vyは、網膜上の座標を示し、座標軸X,Yは、フレーム上の座標を示している(ともに、図中表示フレームFb1上に示されているが、表示フレームFb2乃至Fb4についてはその図示は省略されている)。座標軸Vx,Vyは、網膜には実像の反転像が結像するため、座標系の向きは座標軸X,Yと逆になっている。
また表示フレームFbのサンプリングは、図3中の点線で示されているように、フレーム上一定の位置(この例の場合、4画素間隔の位置)がサンプルされる。したがって、移動量がサンプリング間隔の倍数と一致しない場合、サンプリングされる被写体像Waの位置は、フレーム毎にvずつずれるので、表示フレームFbの各表示被写体像Wbは、被写体像Waの、サンプリング位置のずれ分だけ異なる部分で形成される。
被写体像Waの移動速度vが、例えば1(ピクセル/フレーム)である場合、フレーム間の移動量(1ピクセル)がサンプリング間隔(4ピクセル)の倍数と一致しない。したがって、この場合、サンプリングされる被写体像Waの位置は、1画素ずつX軸方向にずれるので、表示フレームFbの各表示被写体像Wbは、被写体像Waの、その分だけ異なる部分から形成されることになる。
このように表示被写体像Wbが、被写体像Waの、サンプリング位置のずれ分だけ異なる部分から形成されている場合、その表示被写体像Wbが視覚系で複数フレームにわたって積分されることにより、表示被写体像Wbより画素が密になった画像(表示被写体像像Wbの解像度より高解像度(以下、超解像度と称する)の画像)が知覚される。
例えば、視覚特性における積分時間が、図2Bにおける4枚分の表示フレームFbの表示時間に相当し、表示フレームFa1乃至Fa4の4個の表示被写体像Wbが積分される場合、図2Cに示すような、表示被写体像Wbの解像度の約4倍、すなわち被写体像Waと同程度の解像度の画像が知覚される(元の解像度で知覚される)。
超解像度効果はこの原理によって実現されるが、間引き処理を施すと折り返し成分が発生し、それが折り返し歪みとなり画質が劣化する。そこで本発明では、以下に説明するようにその折り返し成分を取り除く工夫がなされている。
式(1)は、1次元の原信号f(x)を間隔Xで離散化した信号fs(x)を表している。式(1)中、δ(x)はデルタ関数である。式(2)は、離散化信号fs(x)のフーリエ変換Fs(ω)を表している。式(2)中、F(ω)は原信号f(x)のフーリエ変換であり、ωsはサンプリング角周波数を表している。
・・・(1)
・・・(2)
・・・(1)
・・・(2)
式(3)は、k=0の基本波は原信号と同じになり、k=nのn次高調波は2πnφだけ位相がずれていることを示している。上述のように、被写体像Waがある移動速度vで平行移動しているとし、移動方向に1/mで間引きサンプリングする場合を考えると、原信号は表示フレームFbのナイキスト周波数のm倍の帯域を持っている。したがって、1/mで間引きサンプリングされたサンプリング信号fsφ(x)は折り返し成分を持っており、式(3)において、k=0は原信号成分となり、k=1,2,・・・,(m−1)は折り返し成分となる。
図4は、間引き量m=2としたときのフーリエ変換Fsφ(ω)を示している。このとき、原信号の帯域はナイキスト周波数の2倍となり、1/mで間引きサンプリングされたサンプリング信号fsφ(x)には1次高調波の折り返し成分が存在している。この図からわかるように、サンプリング信号fsφ(x)は原信号f(x)のフーリエ変換F(ω)成分をそのまま持っており、k=1における1次高調波F(ω-ωs)およびF(ω+ωs)が、それぞれ −2πφおよび 2πφだけ位相がずれて折り返している。
間引きサンプリング間隔が1/mの場合には、その1/mで間引きされたサンプリング信号fsφ(x)には1乃至(m−1)次の折り返し成分が存在し、それぞれの位相は2πkφだけずれていることになる。このサンプリング信号fsφ(x)は、φだけずれた原信号f(x)を1/mに間引きサンプリングした信号であるので、図2Bにおける任意の1表示フレームFbに相当すると考えられる。
ここで図2Bにおける時間的に異なる各表示フレームFbの信号について考える。被写体(原信号f(x))が速度vで平行移動している場合、図3で示したように、フレーム毎にサンプル点の位相がずれる。このことから、式(3)におけるサンプリング点のずれ量φは時間tの関数となっており、速度v(ピクセル/フレーム)と間引き量m(ピクセル)に依存して式(4)のようになる。式(4)中Tは、時間間隔を表しており、フレームレートの逆数である。
・・・(4)
・・・(4)
式(4)は、t=0のときにずれ量φ0が0となり、t=T,2T,3T・・・と変化するにつれてずれ量がv/mずつ増えていくことを表している。式(4)を式(3)に当てはめると、各時刻における折り返し成分の位相が求められる。図5は、1次の折り返し成分の時刻t=0,T,2T,3T,・・・における位相を表している。図6は、2次の折り返し成分の、図7は、3次の折り返し成分の、そして図8は、4次の折り返し成分の時刻t=0,T,2T,3T,・・・における位相をそれぞれ表している。
このようにk次の折り返し成分は、時間、すなわちフレームが進むに従って、等間隔(2πkφT間隔)で回転し、時間t=(m/v)Tの時に位相0に戻る。また折り返し成分の次数が上がるに従って、位相の回転間隔が倍になっていく。
このように間引き量mでの間引き処理(間引きサンプリング)によって発生するk(=1,2,・・・,(m−1))次の折り返し成分の位相は、2πkφTで回転するので、位相の方向と積分される画像の数(合成される折り返し成分の数)によっては、折り返し成分が互いに打ち消される場合がある。言い換えれば、φtは、式(4)に示すように移動速度vと間引き量mに依存するので、移動速度vと間引き量m並びに積分される画像の数によって、折り返し成分が互いに打ち消される場合がある。
例えば、v=1である場合、m=4で間引きしたとき、表示フレームFbの画像には、図9に示すように、0(=2π×1×[(1/4)×0/T]),π/2(=2π×1×[(1/4)×(T/T)],π(=2π×1×[(1/4)×2T/T]、3/2π(=2π×1×[(1/4)×3T/T]),・・・で位相が変化する(π/2間隔で位相が変化する)1次の折り返し成分が存在する。なお図9においてt=4T以降の折り返し成分の図示は省略されている。後述する図10および図11においても同様である。
表示フレームFbの画像にはまた、図10に示すように、0(=2π×2×[1/4×0/T]),π(=2π×2×[1/4×T/T])、2π(=2π×2×[(1/4)×(2T/T)])、3π(=2π×2×[(1/4)×3T/T]),・・・で位相が変化する(π間隔で位相が変化する)2次の折り返し成分と、図11に示すように、0(=2π×3×[(1/4)×(0/T)]、3π/2(=2π×3×[(1/4)×(T/T)]、3π(=2π×3×[(1/4)×(2T×T)]),9π/2(=2π×3×[(1/4)×(3T/T)]),・・・で位相が変化する(3π/2間隔で位相が変化する)3次の折り返し成分が存在する。
この場合、t=0,T,2T,3Tそれぞれにおける1次乃至3次の折り返し成分のベクトルは、図9乃至図11に示したように、それぞれ互いに打ち消す方向を向いているので、視覚系で4枚分の表示フレームFbが積分される場合、それらはすべて打ち消される。
すなわち本発明では、被写体像Waの移動速度vに応じて、互いに打ち消される折り返し成分が発生するように間引き量mを決定することによって、折り返し成分を除去するようにしている。
ここで離散化信号fsφ(x)を帯域制限型のデジタルフィルタにより1/mに縮小する場合を考えると、φだけずれた原信号f(x)は折り返しが発生しないようにナイキスト周波数において帯域制限される。このため例えばm=2のとき、フーリエ空間は、図12に示すようになり、1/mに縮小された信号に対応する各フレーム画像は折り返し成分を含まない低解像度の画像となる。したがって、この場合には縮小信号の基本波は原信号とは異なる信号となっており、複数フレームの画像をどのように加算処理してもナイキスト周波数以上の周波数成分を表現することはできず、超解像度効果を得ることができない。したがってこのことから、超解像効果を得るためには、原信号を帯域制限しないことが重要であり、広帯域の空間周波数成分を持つ原画像を間引きサンプリングするのが最適である。
なお以上においては簡単のために、原信号が1次元信号の場合を例として説明したが、2次元画像においても同様である。また図2を参照して被写体像WaのX軸方向の移動を例として説明したが、Y軸方向の移動についても同様である。
次に互いに打ち消される折り返し成分の条件(超解像度効果を得ることができる画像の折り返し成分の条件)について説明する。
超解像度効果を得ることができるための条件は、式(5)が成立する、つまり式(6)および式(7)が成立することである。これは、図13に示すように、時刻tにおけるk次の折り返し成分をベクトルZk(t)とすると、視覚系の積分範囲におけるベクトルZk(t)和がゼロになることである。この条件の成立は、積分時間に依存するが、この積分時間は、観察環境によって変化することが知られている上に、それを正確に計測することが困難なため、この条件を満たす範囲を限定することは難しい。
一方、例えば、所定の移動速度vでX軸方向またはY軸方向に移動する被写体像Waを、所定の間引き量mでサンプリングして所定のフレームレート毎に表示し、表示された表示被写体像Wbを、観測者が実際に見て超解像度で知覚できたかを確認する実験から、フレームレートが高い、つまり積分される画像数が多ければ、間引き量mが大きくなっても超解像度効果が得られることがわかっている。このとき超解像度効果が得られる条件は、移動速度vに依存しており、およそ式(8)のような関係にあると考えられる。
2πn+α≦2πkφT≦2π(n+1)−α・・・(8)
2πn+α≦2πkφT≦2π(n+1)−α・・・(8)
前述のように、各折り返し成分の位相は2πkφT間隔で回転するが、式(8)は、その各次の折り返し成分の位相回転間隔が、2πの倍数に近いときには超解像度効果が得られないことを表している。図14に示すように、位相回転間隔が2πの倍数に近いということは、時刻tが変化しても折り返し成分の位相がほとんど変わらないことを意味しており、折り返し成分は打ち消されずに残ってしまうためである。
例えば、m=4のときに発生する1次乃至3次の折り返し成分について、式(8)の成立条件を検討すると、図15中、陰が付されている移動速度v(ピクセル/フレーム)の範囲では、式(8)が成立せず、超解像度効果を得ることができない。
この1次の折り返し成分については、例えば、v=4のとき、折り返し成分の位相回転間隔=2π×1×(4/4)(2πkφT)となり、折り返し成分の位相回転間隔は2πの1倍となるので、速度v=4を中心とする一定範囲(位相回転間隔が2πの倍数を中心とする2αの範囲となる速度の範囲)において、1次式の折り返し成分が打ち消されなくなる。すなわちv=4n(n=0,1,2,3,・・・)のとき、位相回転間隔は2πのn倍となるので、v=4nを中心とする一定範囲においては、1次式の折り返し成分は打ち消されない。
2次の折り返し成分については、例えば、v=2のとき、位相回転間隔=2π×2×(2/4)(2πの1倍)となり、そしてv=4のとき、位相回転間隔=2π×2×(4/4)(2πの2倍)となるので、速度v=2,4を中心とする一定範囲(位相回転間隔が2πの倍数を中心とする2αの範囲となる速度の範囲)において、2次式の折り返し成分が打ち消されなくなる。すなわちv=2nのとき、位相回転間隔は2πのn倍となるので、v=2nを中心とする一定範囲においては、2次式の折り返し成分は打ち消されない。
3次の折り返し成分については、例えば、v=4/3のとき、位相回転間隔=2π×3×(4/3)/4(2πの1倍)となり、v=8/3のとき、位相回転間隔=2π×3×(8/3)/4(2πの2倍)となり、そしてv=4のとき、位相回転間隔=2π×3×4/4(2πの3倍)となるので、速度v=4/3,8/3,4を中心とする一定範囲(位相回転間隔が2πの倍数を中心とする2αの範囲となる速度の範囲)において、3次式の折り返し成分が打ち消されなくなる。すなわちv=(4/3)nのとき、位相回転間隔は2πのn倍となるので、v=(4/3)nを中心とする一定範囲においては、3次式の折り返し成分は打ち消されない。
なお速度v=0のとき、位相回転間隔2πkφT=0となるので、1次乃至3次の折り返し成分のそれぞれは、v=0付近の一定範囲(0乃至vα1,0乃至vα2,0乃至vα3)において打ち消されなくなる。
m=3のときに存在する1次,2次の折り返し成分(図16)およびm=2のときに存在する1次の折り返し成分(図17)についても、m=4を例として上述したように、位相回転間隔が2πの倍数を中心とする2αの範囲内となる速度では、各次式の折り返し成分は打ち消されない。
また図13に示すように、折り返し成分の次数が上がるに従い、各次数における位相回転間隔は2倍、3倍と大きくなる。位相回転間隔をθとすれば被写体像Waの移動速度vが小さく、位相回転間隔θがαより小さいときには式(8)が成立せず超解像度効果は得られない。被写体像Waの移動速度vが上がり、位相回転間隔がαに達すると超解像度が得られる。このことから、αは超解像度効果が得られる臨界点(位相回転間隔)であると考えられる。このαは、表示画像フレームレートによって変化し、表示画像フレームレートが高いと小さくなる傾向にある。臨界点における被写体像Waの移動速度をvαとすると、式(9)が得られ、それを変形すると式(10)が得られる。したがって表示画像フレームレートが高くなってαが小さくなると、速度vα(図15の例の場合、vα1、vα2、またはvα3)が小さくなり、その結果、移動量が小さくても超解像度効果が得られる。
・・・(9)
・・・(10)
・・・(9)
・・・(10)
また式(10)から、臨界点におけるvαは、間引き量mと折り返し成分の次数kに依存しており、間引き量mが大きくなると臨界点の速度vαも大きくなることがわかる。また次数kが大きくなると臨界点における速度vαは小さくなることから(図15の例の場合、vα2はvα1より小さく、vα3はvα2より小さくなることから)、高次の折り返し成分における超解像度効果が得られない領域は狭くなることがわかる。
以上をまとめると、視覚系における超解像度効果について以下のことが言える。・超解像度効果が得られる臨界点αは、高フレームレート表示において小さくなる。・間引き量がmのとき、1乃至m−1次の折り返し成分が式(8)を満たす必要がある。・間引き量mが小さくなると、臨界点における被写体像Waの速度vαは小さくなる(間引き量mが小さい場合には、移動量が小さくても超解像度効果が得られる)。
以上から、動画像の領域が高速で移動し、かつ動画像が高フレームレートであったときには、その領域の空間解像度を削減しても、超解像度効果により、観測者にその画質劣化を知覚させないようにすることができる。
なおこのように表示画像フレームレートを高くすることは超解像度効果を得るのに有利となるが、表示画像フレームレートを高くすれば、その他、動きぼけやジャーキネス等の画質劣化を改善することにも有利となる。
次に、本発明を適用した動画像変換装置1の構成例を、図18を参照して説明する。この動画像変換装置1は、上述した超解像度効果を利用した動画像変換処理を行うことにより、データ量の削減による画質劣化を観測者が知覚しないようにデータ量を削減することができる。
ブロック分割部11は、入力された動画像の各フレームをブロックに分割し、移動量検出部12に供給する。
移動量検出部12は、ブロック分割部11から供給された各ブロックについての移動量を検出し、ブロックとその移動量を、ブロック処理部13に送信する。
ブロック処理部13は、移動量検出部12から供給されたブロックに対して、その移動量に応じた動画像変換処理を施し、データ量を削減する。ブロック処理部13は、その処理の結果得られた、データ量が削減されたブロックについてのデータを、出力部14に供給する。
出力部14は、ブロック処理部13から供給された、データ量が削減されたブロックについてのデータを、ストリームデータとしてまとめて出力する。
次に、図19を参照して、各部の詳細を説明する。
はじめにブロック分割部11について説明する。
ブロック分割部11の画像蓄積部21には、動画像変換装置1に供給された動画像のフレームが入力される。画像蓄積部21は、入力されたフレームを蓄積する。画像蓄積部21は、蓄積したフレームの数がN枚(Nは正の整数)になる度に、そのN枚のフレームを、ブロック分割部22に供給するとともに、N枚のフレームの中のM番目に記憶したフレーム(以下、M番目のフレームと称する)を、移動量検出部12(移動量検出部31)に供給する。なおこの例の場合N=4とする。
ブロック分割部22は、画像蓄積部21から供給されたN枚のフレーム(連続するN枚のフレーム)のそれぞれを、ある大きさ(例えば8×8、16×16)のブロックに分割し、移動量検出部12(ブロック分配部32)に出力する。ブロック分割部22はまた、N枚のフレームの中の、画像蓄積部21でP番目に記憶されたフレーム(以下、P番目のフレームと称する)の各ブロックを移動量検出部12(移動量検出部31)に供給する。P番目のフレームは、M番目のフレームと異なるフレームである。
次に、移動量検出部12について説明する。
移動量検出部12の移動量検出部31は、ブロック分割部11のブロック分割部22から供給されたP番目のフレームの各ブロックの動きベクトルを、画像蓄積部21から供給されたM番目のフレームを参照して検出し、ブロック分配部32に供給する。なおこの例の場合、M=2で、P=3とするので、動きベクトルは、1フレーム間の水平方向(X軸方向)および垂直方向(Y軸方向)の移動量を表している。
ここで移動量検出部31の構成を図20に示す。拡大処理部41は、ブロック分割部22から供給されたP番目のフレームの各ブロックの縦横を、それぞれ、例えば2倍に拡大する。拡大処理部42は、画像蓄積部21から供給されたM番目のフレームの縦横をそれぞれ2倍に拡大する。
なお拡大処理部41および42で画像を拡大するのは、移動量の検出精度を向上させるためである。したがってここではその倍率を2としたが、それをさらに大きな値にすることにより、移動量検出の精度をさらに向上させることができる。また拡大処理部41および42を設けずに、画像拡大を省略して移動量検出を行うこともできる。
ブロックマッチング部43は、拡大処理部41および42でそれぞれ拡大された画像を利用して、P番目のフレームの各ブロックの動きベクトルを検出する。
具体的にはブロックマッチング部43は、拡大処理部41から供給されたP番目のフレームのブロック(検索対象ブロック)と拡大処理部42から供給されたM番目のフレーム(参照フレーム)の探索領域内の任意ブロックを比較し、平均二乗誤差が最小になる、M番目のフレームのブロック位置を検出する。そしてブロックマッチング部43は、P番目のフレームの検索対象ブロックと検出したM番目のフレームのブロックを結ぶベクトルを動きベクトルとし、それを、ブロック分配部32に供給する。
なお、この例では、N個のフレーム中のP番目のフレームとM番目のフレームを用いて移動量を算出したが、例えばN個のフレームの全フレームという選択を含むどのようなフレームの組み合わせで移動量を算出しても構わない。
図19に戻り、移動量検出部12のブロック分配部32には、ブロック分割部22から、N個単位でブロック(N枚のフレームのそれぞれの同一位置にある合計N個のブロック)が供給され、移動量検出部31から、そのN個のブロックの中のP番目のフレームのブロックの移動量が供給される。ブロック分配部32は、供給されたN個のブロックと移動量を、ブロック処理部13の、その移動量に対応する処理を行うブロック処理部51−1乃至51−3(以下、個々に区別する必要がない場合、単に、ブロック処理部51と称する)の中のいずかに供給する。
具体的にはブロック分配部32は、移動量検出部31から供給された、1フレーム間の水平方向(X軸方向)または垂直方向(Y軸方向)の移動量が2ピクセル以上である場合、ブロック分割部22から供給されたN個のブロックと移動量検出部31から供給された移動量を、ブロック処理部51−1に出力する。また、1フレーム間の水平方向と垂直方向の移動量がともに2ピクセル未満で、かつ1ピクセル以上の場合、ブロック分配部32は、N個のブロックと移動量を、ブロック処理部51−3に出力する。移動量がそのほかの場合には、ブロック分配部32は、N個のブロックと移動量をブロック処理部51−2に供給する。
具体的なブロック分配部32の分配先決定方法として、より時間方向に安定した、別の分配先決定方法を採用することも可能である。時間方向でブロックの分配先が安定していないということ、すなわち、空間上のある特定位置のブロックの分配先が時間の経過とともに頻繁に変わるということは、そのブロックに施される処理が頻繁に変化することを意味する。そのような状況においては画質の劣化が発生する可能性が考えられるが、ブロック分配部32に対して図21のように遅延器33を追加し、分配先決定のための条件をより時間方向に安定したものへと変更することで、画質の劣化を抑制することができる。
図21のブロック分配部32は具体的には以下のようにブロックの分配先を決定する。まず、ブロック分配部32に遅延器33より過去のブロック処理情報が供給される。ブロック処理情報とは各ブロックが51−1から51−3までのいずれのブロック処理部により処理されたのかを示す情報である。また、過去のブロック処理情報とは、現在処理中のフレームが仮にn、 n+1、 n+2、 …、n+N-1番目のフレームであるとした場合、既に処理を行ったn-N、 n-N+1、 n-N+2、 …、n-1番目のフレームに関するブロック処理情報である。つづいてブロック分配部32は供給された過去のブロック処理情報を参照し、現在処理中のブロックと空間的に同一位置にあるブロックが過去いずれのブロック処理部51に分配されたのかを確認する。
現在処理中のブロックが過去においてブロック処理部51−1に分配されていた場合、移動量検出部31から供給された、1フレーム間の水平方向または垂直方向の移動量がVsピクセル以上であれば、ブロック分割部22から供給されたN個のブロックと移動量検出部31から供給された移動量がブロック処理部51−1に出力される。
現在処理中のブロックが過去においてブロック処理部51−3に分配されていた場合、移動量検出部31から供給された、1フレーム間の水平方向または垂直方向の移動量がVtピクセル未満であれば、ブロック分割部22から供給されたN個のブロックと移動量検出部31から供給された移動量がブロック処理部51−3に出力される。
現在処理中のブロックが過去においてブロック処理部51−2に分配されていた場合、移動量検出部31から供給された、1フレーム間の水平方向または垂直方向の移動量がVts1ピクセル以上かつVts2ピクセル未満であれば、ブロック分割部22から供給されたN個のブロックと移動量検出部31から供給された移動量がブロック処理部51−2に出力される。
また、上記の条件に当てはまらない場合には既述の条件、つまり、移動量検出部31から供給された、1フレーム間の水平方向または垂直方向の移動量が2ピクセル以上の場合はブロック処理部51−1へ、1ピクセル未満の場合はブロック処理部51−3へ、それ以外の場合は51−2へN個のブロックと移動量検出部31から供給された移動量が供給される。過去のブロック処理情報が存在しない場合も同様である。
なお移動量Vt、 Vs、 Vts1、 Vts2には以下のような関係がある。
Vts1 ≦ Vt
Vts1 ≦ Vts2
Vs ≦ Vts2
Vts1 ≦ Vt
Vts1 ≦ Vts2
Vs ≦ Vts2
上記を満たすようなVt、 Vs、 Vts1、Vts2を設定することで、時間の経過とともにブロックに施される処理が頻繁に変わることを防ぐことができる。
すなわちブロック分配部32は、移動量検出部21から供給された移動量に基づき、最適なフレームレートおよび空間解像度を決定し、そのフレームレートおよび空間解像度にしたがって画像データを変換する処理を行うブロック処理部51に、ブロック画像を分配する。
なお、分配先決定のためのこの条件はあくまでも一例であり、他の条件で分配先を決定してもよい。
次にブロック処理部13について説明する。ブロック処理部13は、この例の場合、3個のブロック処理部51−1乃至51−3で構成されている。
ブロック処理部51−1は、移動量検出部12のブロック分配部32から供給された、連続するN枚のフレームのそれぞれの同一位置にある合計N個のブロック(水平方向または垂直方向の移動量が2ピクセル以上である場合のN個のブロック)に対して、画素数を、同様にブロック分配部32から供給された移動量に応じて間引く処理(空間方向間引き処理)を行う。
具体的には、1フレーム間の水平方向の移動量が2ピクセル以上である場合、ブロック処理部51−1は、ブロックが8×8ピクセルで構成されているとき、図22に示すように、ブロック内の画素を、1×4ピクセル単位の集合に分割する。
そしてブロック処理部51−1は、図23に示すように、1×4ピクセルの各集合の画素値p1乃至p4を、その中の1つの画素値(この例の場合、p1)にする画素数の間引き(4画素間の画素数の間引き)(間引き量4の間引き)を行う。
1フレーム間の垂直方向の移動量が2ピクセル以上である場合、ブロック処理部51−1は、図24に示すように、ブロック内の画素を、4×1ピクセル単位の集合に分割し、図25に示すように、各集合の画素値p1乃至p4を、その中の1つの画素値(この例の場合、p1)にする画素数の間引きを行う。
また1フレーム間の垂直および水平方向の移動量がともに2ピクセル以上である場合、ブロック処理部51−1は、図26に示すように、ブロック内の画素を、2×2ピクセル単位の集合に分割し、図27に示すように、各集合の画素値p1乃至p4を、その中の1つの画素値(この例の場合、p1)にする画素数の間引きを行う。
ブロック処理部51−1は、このような空間方向間引き処理を、供給された4個のブロックに対してそれぞれ施すので(隣接した4画素毎に1画素選択されるので)、各ブロックのデータ量が1/4に削減され、4個のブロック全体のデータ量が1/4に削減される。ブロック処理部51−1は、データ量が1/4に削減された4個のブロックについてのデータを、出力部14に供給する。
なおここでは、ブロックの移動量が2ピクセル以上である場合、動画像変換装置1に入力された動画像のフレームレートとの関係において、間引き量4の間引きを行った場合に超解像度効果を得るができるものとする。したがって、移動量が2ピクセル以上である場合に、間引き量4の間引きを行っても、超解像度効果により、観測者は、間引きによる(データ削減による)画像劣化を知覚しない(間引き前の解像度で画像を認識する)。
またここでは、N=4の場合を例として説明したが、Nが他の値であっても同様な処理が行われる。
また、各集合の画素値を、図23の例では、1×4ピクセルの中の左端の画素値p1、図25の例では、4×1ピクセルの中の上端の画素値p1、図27の例では、2×2ピクセルの中の左上隅の画素値p1にしたが、p1乃至p4のいずれの画素値にしてもよい。またp1乃至p4を用いた計算によって新たに得られる画素値にすることもできる。
さらに、この例では、画素数の間引きによって空間方向の圧縮を行ったが、フィルタリングによる空間方向の帯域制限を行っても構わない。
図19に戻りブロック処理部51−2は、移動量検出部12のブロック分配部32から供給された、連続するN枚のフレームのそれぞれの同一位置ある合計Nブロック(水平方向と垂直方向の移動量がともに1ピクセル未満である場合のN個のブロック)に対して、フレーム数を間引く処理(時間方向間引き処理)を行う。
具体的にはブロック処理部51−2は、図28に示すように、連続する4枚のフレームF1乃至F4のそれぞれの同一位置ある4個のブロックBiを、その中の1つのブロック(この例の場合、フレームF1のブロックBi)にするフレーム数の間引き(4フレーム間のフレーム数の間引き)を行う。
ブロック処理部51−2は、このような時間方向間引き処理により、データ量が1/4に削減された4個のブロックについてのデータ(1個のブロック)を、出力部14に供給する。なお、ここでは、N=4の場合を例として説明したが、Nが他の値であっても同様な処理が行われる。
この例の場合、図28に示すように、4個のフレームF1乃至F4のそれぞれのブロックBiのうち、フレームF1のブロックBiが出力されたが、他のフレームのブロックが出力されるようにしてもよい。またフレームF1乃至F4を用いた演算によって新たに得られたブロックが出力されるようにしてもよい。さらに、この例では、フレーム数の間引きによって時間方向の圧縮を行ったが、フィルタリングによる時間方向の帯域制限を行っても構わない。
ブロック処理部51−3は、移動量検出部12のブロック分配部32から供給された、連続するN枚のフレームのそれぞれの同一位置ある合計N個のブロック(水平方向と垂直方向の移動量が1ピクセル以上で、2ピクセル未満である場合のN個のブロック)に対して、画素数の間引き処理(空間方向間引き処理)とフレーム数の間引き処理(時間方向間引き処理)をそれぞれ行う。
ブロック処理部51−3の動作を、具体的に説明する。
この場合ブロック処理部51−3に供給されるブロックの移動速度は、間引き量=4における超解像度効果を得るための条件を満たさない。したがって画素数の間引き処理(水平方向および垂直方向の間引き処理)において、ブロック処理部51−3は、ブロック処理部51−1における間引き処理とは異なり、図29および図30に示すように、各集合の画素値p1乃至p4を、その中のいずれか2個の画素値(この例の場合、p1,p3)にする画素数の間引き(2画素間の画素数の間引き)(間引き量2の間引き)を行う。
すなわちブロック処理部51−1では、1×4、4×1、または2×2の3通りの画素数の間引きが行われるが、ブロック処理部51−3では、1×2または2×1の2通りの画素数の間引きが行われる。
フレーム数の間引き処理においては、ブロック処理部51−3は、ブロック処理部51−2における間引き処理と異なり、図31に示すように、連続する4枚のフレームF1乃至F4のぞれぞれの同一位置にある合計4個のブロックBiを、その中のいずれか2つ(いまの場合、フレームF1,F3の2個のブロック)にするフレーム数の間引きを行う(2フレーム間のフレーム数の間引き)を行う。
ブロック処理部51−3は、このような空間方向間引き処理と時間方向間引き処理を、供給された4個のブロックに対して施すので、4個のブロックのデータ量が1/4に削減される。ブロック処理部51−3は、データ量が1/4に削減された4個のブロックについてのデータを、出力部14に供給する。
なお空間方向間引きと時間方向間引きの順序は、いずれが先に行われても同一の結果が得られるので、どちらを先に行ってもよい。
またこの処理はNが正の偶数である場合において、N/2フレーム、N/2個の隣接する画素に対して行うことが可能な処理であるので、必ずしも2(=4/2)フレーム、2画素単位で行われるものではない。
次に、出力部14について説明する。出力部14は、ブロック処理部13のブロック処理部51−1乃至51−3のそれぞれから供給された、データ量が削減されたN個のブロックについてのデータからストリームデータを生成する。
ストリームデータのフォーマットは、図32に示すように、各フレームに関するデータからなり、各フレームに関するデータは、フレームを構成するブロックに関するデータにより構成され、各ブロックに関するデータはデータが削減されたブロックについてのデータと、ブロックに施されたブロック処理を示すフラグが格納されるようになっている。なおブロック処理を示すフラグは、ブロック処理部51−1での処理(空間方向間引き処理)、ブロック処理部51−2での処理(時間方向間引き処理)、またはブロック処理部51−3での処理(時間方向間引き処理と空間方向間引き処理が組み合わさった処理)を表すものとしたり、フレームレートや空間解像度を直接表すタグデータとすることができる。
図32中、斜線が付されている、データ量が削減されたN個のブロックについてのデータの内容は、施されたブロック処理によって異なる。ここでそのデータの内容について具体的に説明する。
ブロック処理部51−1からは、それぞれデータ量が1/4にされたブロックのデータが供給されるので、ブロック処理部51−1からデータの供給があった場合、出力部14は、図33に示すようなデータの内の、対応するフレームのデータを、図32に示す斜線部分に格納する。
図33中、データsp1iは、データ量が1/4にされたフレームF1のブロックBiのデータであり、データsp2iは、データ量が1/4にされたフレームF2のブロックBiのデータであり、データsp3iは、データ量が1/4にされたフレームF3のブロックBiのデータであり、そしてデータsp4iは、データ量が1/4にされたフレームF4のブロックBiのデータである。
例えば、フレームF1のi番目のブロックがブロック処理部51−1によって処理された場合、図32のストリームデータ中のフレームFout1のブロックBiは、ブロック処理部51−1によって処理された旨のフラグと、図33におけるデータsp1iからなる。
ブロック処理部51−2からは、連続する4枚のフレームF1乃至F4のそれぞれの同一位置にある4個のブロックBiの中の1つのブロックBiが供給されるので、ブロック処理部51−2からデータの供給があった場合、出力部14は、図34に示すようなデータの内の、対応するフレームのデータを、図32に示す斜線部分に格納する。
図34中、データtm1iは、ブロック処理部51−2から供給されたフレームF1のブロックBiそのもののデータである。データtm2iは、フレームF2のブロックは、直前のブロック(フレームF1のブロックBi)と同じであることを示すフラグであり、データtm3iは、フレームF3のブロックは、直前のブロック(フレームF2のブロックBi)と同じであることを示すフラグであり、そしてデータtm4iは、フレームF4のブロックは、直前のブロック(フレームF3のブロックBi)と同じであることを示すフラグである。
例えば、フレームF1のi番目のブロックがブロック処理部51−2によって処理された場合、図32のストリームデータ中のフレームFout1のブロックBiは、ブロック処理部51−2によって処理された旨のフラグと、図33におけるデータtm1iからなる。また、フレームF2のi番目のブロックがブロック処理部51−2によって処理された場合、図32のストリームデータ中のフレームFout2のブロックBiは、ブロック処理部51−2によって処理された旨のフラグと、図33におけるデータtm2iからなる。
ブロック処理部51−3からは、それぞれデータ量が1/2にされた、連続する4枚のフレームF1乃至F4のブロックBiの中の2個のフレームF1,F3のブロックBiのデータが供給されるので、ブロック処理部51−3からデータの供給があった場合、出力部14は、図35に示すようなデータの内の、対応するフレームのデータを、図32に示す斜線部分に格納する。
図35中、データst1iは、データ量が1/2にされたフレームF1のブロックBiのデータであり、データst2iは、フレームF2のブロックBiは、直前のブロック(フレームF1のブロックBiのデータ)と同じであることを示すフラグであり、データst3iは、データ量が1/2にされたフレームF3のブロックBiのデータであり、データst4iは、フレームF4のブロックBiは、直前のブロック(フレームF3のブロックBiのデータ)と同じであることを示すフラグである。
例えば、フレームF1のi番目のブロックがブロック処理部51−3によって処理された場合、図32のストリームデータ中のフレームFout1のブロックBiは、ブロック処理部51−3によって処理された旨のフラグと、図34におけるデータst1iからなる。
なおストリームデータの形式は、図32乃至図35に示したものには限られるものではない。
次に、動画像変換装置1の移動量検出部12およびブロック処理部13の動作を、図36のフローチャートを参照して説明する。
ステップS1において、移動量検出部12の移動量検出部31は、ブロック分割部11のブロック分割部22から、動画像変換装置1に連続して入力された4枚のフレームの中のP番目のフレームの各ブロック(検索対象ブロック)の供給と、画像蓄積部21から、M番目のフレーム(参照フレーム)の供給を受け、それを入力する。
次に、ステップS2において、移動量検出部31は、P番目のフレームのブロックの中の1つを検索対象ブロックとするとともに、その検索対象ブロックの動きベクトルを、参照フレームを参照して検出する。移動量検出部31は、検出した動きベクトルをブロック分配部32に供給する。
ステップS3において、ブロック分配部32は、移動量検出部31から供給された動きベクトルの水平方向(X軸方向)または垂直方向(Y軸方向)の大きさ(1フレーム間のX軸方向またはY軸方向の移動量)が、2ピクセル以上であるか否かを判定し、少なくとも一方の移動量が2ピクセル以上であると判定した場合、ステップS4に進む。
ステップS4において、ブロック分配部32は、移動量検出部31からの移動量と、それに対応してブロック分割部22から供給された、連続する4枚のフレームのそれぞれの同一位置にあるN個のブロックとを、ブロック処理部13のブロック処理部51−1に供給する。これによりブロック処理部51−1は、ブロック分配部32から供給された4個のブロックに対して、図22乃至図27に示したような、画素数を1/4にする間引き処理(4画素間の画素数の間引き処理)を施し、その結果得られた、データ量が1/4に削減された4個のブロックについてのデータを、出力部14に供給する。
ステップS3で、いずれの移動量も2ピクセル以上ではないと判定された場合、ステップS5に進み、ブロック分配部32は、X軸方向とY軸方向の移動量がともに1ピクセル未満であるか否かを判定し、ともに1ピクセル未満であると判定した場合、ステップS6に進む。
ステップS6において、ブロック分配部32は、ブロック分割部22からのN個のブロックと移動量検出部31からの移動量を、ブロック処理部51−2に供給する。ブロック処理部51−2は、ブロック分配部32から供給されたN個のブロックに対して、図28に示したような、フレーム数を1/4にする間引き処理(4フレーム間のフレーム数の間引き処理)を施し、その結果得られた、データ量が1/4に削減された4個のブロックについてのデータ(1個のブロック)を、出力部14に供給する。
ステップS5で、X軸方向およびY軸方向の移動量がともに1ピクセル未満ではないと判定された場合(移動量が1ピクセル以上で、2ピクセル未満の場合)、ステップS7に進み、ブロック分配部32は、ブロック分割部22からの4個のブロックと移動量検出部31からの移動量を、ブロック処理部51−3に供給する。これによりブロック処理部51−3は、ブロック分配部32から供給された4個のブロックに対し、図29乃至図31に示したような、画素数を1/2にする間引き処理(2画素間の画素数の間引き処理)と、フレーム数を1/2にする間引き処理(2フレーム間のフレーム数の間引き処理)を施し、その結果得られた、データ量が1/4に削減された4個のブロックについてのデータを、出力部14に供給する。
以上の処理が、ブロック分割部11から4枚のフレームの各ブロックが供給される毎に行われる。
なお図19の例においては、3個のブロック処理部51−1乃至51−3が設けられていたが、図37に示すように、K(K=1,2,・・・)個のブロック処理部51を設けることができる。したがって上述したブロック処理に限らず、各種のブロック処理を行うことができる。
また図19の例においては、ブロック処理部51が並列に接続されていたが、図38に示すように直列に接続することも可能である。この場合、移動量検出部12により検出された動きベクトルに基づき制御部61が、各ブロック処理部51を制御する。すなわち制御部61より処理の実行の指令が入力されたブロック処理部51は、ブロック分割部11または前段のブロック処理部51から供給されたブロックに対して上述した所定の処理を施し、その結果得られたデータを、後段のブロック処理部51または出力部14に供給する。また制御部61より処理実行の指令が入力されないブロック処理部51は、ブロック分割部11または前段のブロック処理部51から供給されたデータを、後段のブロック処理部51または出力部14にそのまま出力する。
また図39に示すように、図18に示した動画像変換装置1の出力部14の後段に、出力部14により出力されたデータを復元する復元部71を設けることができる。これにより、再生可能な動画像を得ることができる。
復元部71は、図40に示すように、分配部81、ブロック拡張部82−1乃至82−3、および合成部83によって構成される。
分配部81は、入力されたストリームデータ(図32)のブロック処理の内容を示すフラグをもとに,ブロック拡張部82−1乃至82−3のいずれかへ、図32の斜線部のデータ、および処理の内容を示すフラグを供給する。
ブロック拡張部82−1は、空間方向の間引きがされたデータを拡張する部分で、入力された、処理の内容を示すフラグに従い、図41乃至図43に示すいずれかの処理を行い、ブロックを再構成する。また、再構成されたブロックを合成部83へと出力する。すなわち空間方向の間引くの方法に応じて、1つの画素値から、4個の画素値が生成される。
ブロック拡張部82−2は、時間方向の間引きがされたデータを拡張する部分で、入力されたデータがブロックを表すものであればそのブロックをそのまま合成部83へと出力する。また、ブロック拡張部82−2は、図示しないメモリを持ち、このメモリにもブロックの内容が保存される。入力されたデータが前フレームのデータをそのまま用いるというフラグであったときには、このメモリの、対応するブロックの内容を合成部83へと出力する。
ブロック拡張部82−3は、空間方向と時間方向の間引きがされたデータを拡張する部分で、ブロック拡張部82−1が間引き量4に対してのものであったのを間引き量2にし、さらにブロック拡張部82−2の処理を行うことができるようにしたものであるので詳細は省略する。
合成部83は、ブロック拡張部82−1乃至82−3から入力されたブロックが1フレーム全体を表現できる量に達したときに、復元された1フレーム全体を出力する。
次に、図44にその構成例を示した他の動画像変換装置2について説明する。この動画像変換装置には、図19の動画像変換装置1のブロック分割部11の画像蓄積部21に代えて、画像遅延部111が、移動量検出部12のブロック分配部32に代えて、ブロック分配部121が設けられ、ブロック処理部13の3個のブロック処理部51−1乃至51−3に代えて、2個のブロック処理部131−1,131−2が、それぞれ設けられている。
この動画像変換装置2に入力された動画像は、ブロック分割部11のブロック分割部22および画像遅延部111のそれぞれに供給される。
画像遅延部111は、入力された動画像をN枚のフレーム分(Nは正の整数)遅延して、移動量検出部12の移動量検出部31に供給する。なおここではN=2とする。
ブロック分割部22は、入力されたフレームをブロックに分割して、移動量検出部12の移動量検出部31およびブロック分配部121のそれぞれに供給する。
移動量検出部12の移動量検出部31には、ブロック分割部22からフレームの各ブロックと、画像遅延部111からのフレームがそれぞれ入力されるが、ブロック分割部22における分割処理は、1フレーム分の入力時間に相当する時間を要するので、画像遅延部111からのフレームは、ブロック分割部22からのブロックのフレーム(現フレーム)よりN−1個前のフレーム(前フレーム)となる。
移動量検出部31は、画像遅延部111からの前フレームを参照フレームとするブロックマッチング処理により、ブロック分割部22からの現フレームのブロックの動きベクトルを検出する。移動量検出部31は、検出した動きベクトルをブロック分配部121に供給する。
ブロック分配部121は、ブロック分割部11のブロック分割部22から供給されたフレームの各ブロックと移動量検出部31から供給されたそのブロックの移動量とを、ブロック処理部13の、その移動量に応じた処理を行うブロック処理部131−1とブロック処理部131−2のいずれかに供給する(分配する)。
具体的には、ブロック分配部121は、1フレーム間の水平方向(X軸方向)または垂直方向(Y軸方向)の移動量が2ピクセル以上である場合、または水平方向および垂直方向の移動量がともに2ピクセル未満でかつ1ピクセル以上である場合、移動量とブロックを、ブロック処理部131−1に供給する。
ブロック分配部121はまた、1フレーム間の水平方向および垂直方向の移動量が1ピクセル未満である場合、また、ブロック分割部22から供給されたブロックに対応する前フレームのブロックについて2画素間の画素数の間引き処理が施されている場合、移動量とブロックを、ブロック処理部131−2に供給する。
なお、分配先決定のための上記の条件はあくまでも一例であり、他の条件であってもよい。
ブロック処理部13のブロック処理部131−1は、移動量検出部12のブロック分配部121から供給されたブロックに対して、画素数を、同様にブロック分配部121から供給された移動量に応じて間引く処理(空間方向間引き処理)を行う。
具体的には、1フレーム間の水平方向(X軸方向)の移動量が2ピクセル以上である場合、ブロック処理部131−1は、そのブロックに対して、図22および図23に示したような4画素間の画素数の間引きを行い、1フレーム間の垂直方向(Y軸方向)の移動量が2ピクセル以上である場合、図24および図25に示したような4画素間の画素数の間引きを行う。
また水平方向および垂直方向の移動量が2ピクセル未満で1ピクセル以上の場合、図29および図30に示したような、2画素間の画素数の間引きを行う。
ブロック処理部131−2は、移動量検出部12のブロック分配部121からブロックが供給されたとき(前フレームのブロックに対して2画素間の画素数の間引き処理が施されている場合、または1フレーム間の移動量が1ピクセル未満である場合)、前フレームのブロックに対して2画素間の画素数の間引き処理が施されている場合には、現フレームのブロックに対応する前フレーム(この例の場合、1個前のフレーム)のブロックをそのまま使用する旨を表すフラグを出力部141に供給する。
また、1フレーム間の移動量が1ピクセル未満であり、さらに前フレームの対応するブロックとの差分が十分に小さい場合には、ブロック処理部131−2は、前フレームのブロックをそのまま使用する旨を表すフラグを出力部141に供給し、前フレームの対応するブロックとの差分が大きい場合には現フレームのブロックの内容を表現しうる更新情報を出力141に供給する。更新情報としては、例えば、前フレームのブロックとの差分などがあるが、現フレームのブロックを表現できるものであればどのようなものであってもよい。
なお、この方法は一実施例に過ぎず、前フレームのブロックとの差分データを出力したりしても構わない。
出力部141は、ブロック処理部13から供給された、それぞれ所定の処理でデータ量が削減された各ブロックについてのデータ、および移動量検出部12のブロック分配部121から供給されたブロックを、ストリームデータとしてまとめて出力する。
ストリームデータのフォーマットは、図32に示したものと同様である。ただし図19の例では、図中、陰が付されている部分には、データ量が削減された、N枚のフレームのブロックについてのデータと、そのブロック処理を示すフラグが格納されたが、この例の場合、データ量が削減された1枚のフレームのブロックについてのデータと、そのブロック処理を示すフラグが格納される。
次に、図44の動画像変換装置2の移動量検出部12およびブロック処理部13の動作を、図45のフローチャートを参照して説明する。
ステップS21において、移動量検出部12の移動量検出部31は、ブロック分割部11のブロック分割部22から、ブロック(検索対象ブロック)の供給と、画像遅延部111から、検索対象ブロックのフレームの1(=2−1)つ前のフレーム(参照フレーム)の供給を受け、それを入力する。
次に、ステップS22において、移動量検出部31は、供給された検索対象ブロックと参照フレームから、検索対象ブロックの動きベクトルを検出し、ブロック分配部121に供給する。
ステップS23において、ブロック分配部121は、検索対象ブロックに対応する前フレームのブロックに対して、2画素間の画素数の間引き処理(後述するステップS28でのブロック処理部131−1の処理)が施されたか否かを判定する。ブロック分配部121は、内蔵する記憶部(図示せず)に、前フレームのブロックの移動量を記憶しているので、その移動量からそのブロックに施されたブロック処理の内容を把握することができる。
ステップS23で、前フレームのブロックに対して、2画素間の画素数の間引き処理が施されていると判定された場合、ステップS24に進み、ブロック分配部121は、ブロック分割部22からのブロックと移動量検出部31からの移動量を、ブロック処理部131−2に供給する。ブロック処理部131−2はこのとき、前フレームのブロックをそのまま使用する旨を示すフラグを出力部14に供給する。出力部14は、前フレームのブロックをストリームデータに組み込む。
ステップS23で、前フレームのブロックに対して2画素間の画素数の間引き処理が施されていないと判定された場合、ステップS25に進み、ブロック分配部121は、移動量検出部31から供給された動きベクトルの水平方向(X軸方向)または垂直方向(Y軸方向)の大きさ(1フレーム間のX軸方向またはY軸方向の移動量)が、2ピクセル以上であるか否かを判定し、少なくともいずれか一方が2ピクセル以上であると判定した場合、ステップS26に進む。
ステップS26において、ブロック分配部121は、ブロック分割部22からのブロックと移動量検出部31からの移動量をブロック処理部131−1に供給する。ブロック処理部131−1はこのとき、ブロック分配部121から供給されたブロックに対して、4画素間の画素数の間引き処理を施し、その結果得られたデータを出力部141に供給する。
ステップS25で、いずれの移動量も2ピクセル以上ではないと判定された場合、ステップS27に進み、ブロック分配部121は、移動量検出部31から供給された1フレーム間のX軸方向およびY軸方向の移動量がともに1ピクセル以上であるか否かを判定し、1ピクセル以上であると判定した場合(2ピクセル未満で、1ピクセル以上である場合)、ステップS28に進む。
ステップS28において、ブロック分配部121は、ブロック分割部22からのブロックと移動量検出部31からの移動量をブロック処理部131−1に供給する。ブロック処理部131−1はこのとき、ブロック分配部121から供給されたブロックに対して、2画素間の画素数の間引き処理を施し、その結果得られたデータを出力部141に供給する。
ステップS27で、移動量がともに1ピクセル以上ではないと判定された場合、ブロック分配部121はブロック分割部22からのブロックと移動量検出部31からの移動量をブロック処理部131−2に供給する。その後、ステップS29に進み、ブロック処理部131−2は前フレームのブロックをそのまま使用できるか否かを判定する。たとえば、対応する前フレームのブロックとの差分が十分に小さければ画像の変化が少ないことから、前フレームのブロックをそのまま使用することができる。
ステップS29で、前フレームのブロックをそのまま使用できると判定された場合、ステップS24に進み、ブロック処理部131−2は、前フレームのブロックをそのまま使用する旨を示すフラグを出力部14に供給する。
ステップS29で、前フレームのブロックをそのまま使用できないと判定された場合、ステップS30に進み、ブロック処理部131−2は、更新情報を送信する旨を示すフラグと入力されたブロックに関する更新情報を、出力部14に直接供給する。更新情報としては前フレームのブロックとの差分などが考えられる。
以上のように、図44の例では、各ブロック処理を1フレーム単位で行っているため、図19の例の場合のように、N個のブロック単位で処理する場合に比べ、各フレームの特徴を正確に反映した変換処理を行うことができる。
またこの例では、移動量の大きいブロックは、フレームレートを落とさず、画素数の間引き処理により最適な空間解像度で出力される。また、ほぼ静止しているブロックは、空間解像度を落とさず、画像が変化するまでフレーム数を間引くことで最適なフレームレートで出力される。
さらに、移動量の小さいブロックについて、画素数の間引き量を小さくし、フレームレートを落とすことで、最適な空間解像度で、かつ最適なフレームレートで出力することができる。これらの処理は、視覚特性に鑑みて実現されており、処理による劣化を人が知覚するのが困難だと思われる最大の間引きを実現している。
なお図44の例では、移動量検出部31が、画像遅延部111から供給されたフレームを参照フレームとして移動量を検出していたが、移動量を外部から取得できるようにすれば、図46に示すように、画像遅延部111および移動量検出部31を省くことができる。
また、実際の処理は画像の任意の領域毎に画像処理が施されればよく、必ずしもブロック単位でなくてもよい。たとえば画像から同一の性質を持つ領域を検出し、その領域毎に移動量に応じた処理が施されるようにしてもよい。
また、その図示は省略するが、図39の場合と同様に、出力部141の後段に、復元部71を設けることができる。それにより、再生可能な映像を得ることが可能となる。
次に、図47にその構成例を示す他の動画像変換装置1について説明する。この動画像変換装置1は、CG(Computer Graphics)などで生成されたデータを入力とし、オブジェクト毎に指定されている動きデータに基づいて最適なフレームレートと最適な空間解像度を決定し、オブジェクト毎にこのフレームレートと空間解像度に従ってレンダリングを行い、動画像データに動画像変換する。
ここで、オブジェクトデータは、オブジェクトの形状、材質、位置などを数値として表すデータであり、たとえば多数の三角形ポリゴンの集まりとして表されている。動きデータは、オブジェクトの時間的な動きを表すデータであり、たとえば時刻tをパラメータとする曲線式で表されている。出力されるストリームデータのフレームレートは、受信する表示装置(図示せず)などが表示可能な最大のフレームレートで決定される。
制御部211は、入力されるオブジェクト毎に指定されている動きデータに応じて最適なフレームレートと最適な空間解像度を求め、それに従ってレンダリング部212を制御する。
具体的には制御部211は、外部から入力されるオブジェクト毎の動きデータから、現フレームにおける移動速度を求め、オブジェクトの最適なフレームレートと最適な空間解像度を計算する。
ここで、最適なフレームレートとは、フレーム間の変化がある閾値以下になるレートであり、移動速度の小さいオブジェクトでは低フレームレートになり、移動速度の大きいオブジェクトでは高フレームレートになる。最適な空間解像度とは、超解像効果が得られる空間解像度であり、オブジェクトのテクスチャなどの空間解像度が復元可能となる最低の空間解像度である。
制御部211は、出力のストリームデータのフレームレートで駆動されており、現フレームがフレーム間引きの対象でありレンダリングが必要ない場合には、フレーム間引きフラグを、レンダリング部212に供給する。一方、現フレームがレンダリング対象の場合には、制御部211は、最適な空間解像度情報をレンダリング部212に供給する。
レンダリング部212は、制御部211から与えられる信号に従い、入力されるオブジェクトデータをレンダリングして画像に変換する。
具体的にはレンダリング部212は、制御部211よりフレーム間引きフラグが入力された場合、オブジェクトのレンダリングを行わず、前フレームのデータと同じであることを示すフラグを出力部213に出力する。このとき出力部213は、前フレームデータをストリームデータに組み込む。
制御部211より空間解像度情報が入力された場合、レンダリング部212は、その解像度に従ってオブジェクトをレンダリングし、画像データを出力部213に供給する。
なおこのときのレンダリング手段は、2次元画像が得られる方法であらばどのような方法でも構わない。
出力部213は、オブジェクト毎のレンダリング部212からの出力をストリームデータとしてまとめ出力する。
なお、本明細書において、記録媒体により提供されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
1 動画像変換装置, 11 ブロック分割部, 12 移動量検出部, 13 ブロ
ック処理部, 14 出力部, 21 画像蓄積部, 22 ブロック分割部, 31 移動量検出部, 32 ブロック分配部, 33 遅延器, 41 拡大処理部, 42 拡大処理部, 43 ブロックマッチング部, 51 ブロック処理部, 71 復元部, 91 分配部, 82 ブロック拡張部, 83 合成部, 111 画像遅延部, 121 ブロック分配部, 131 ブロック処理部, 141 出力部, 211 制御部, 212 レンダリング部, 213 出力部
ック処理部, 14 出力部, 21 画像蓄積部, 22 ブロック分割部, 31 移動量検出部, 32 ブロック分配部, 33 遅延器, 41 拡大処理部, 42 拡大処理部, 43 ブロックマッチング部, 51 ブロック処理部, 71 復元部, 91 分配部, 82 ブロック拡張部, 83 合成部, 111 画像遅延部, 121 ブロック分配部, 131 ブロック処理部, 141 出力部, 211 制御部, 212 レンダリング部, 213 出力部
Claims (44)
- 動画像データの領域毎に画像変換を行う動画像変換方法において、
領域毎の移動速度に基づきフレームレートと、空間解像度を決定する決定ステップと、
前記フレームレートと空間解像度にしたがって前記画像データを変換する変換ステップと
を有することを特徴とする動画像変換方法。 - 前記フレームレートは、移動速度に基づき少なくとも2段階に設定され、前記移動速度が速い領域では高フレームレートに、前記移動速度が遅い領域では低フレームレートに設定される
ことを特徴とする請求項1に記載の動画像変換方法。 - 前記空間解像度は、前記移動速度に基づき少なくとも2段階に設定され、前記移動速度が速い領域では低空間解像度に設定され、前記移動速度が遅い領域では高空間解像度に設定される
ことを特徴とする請求項1に記載の動画像変換方法。 - 前記変換ステップは、前記移動速度が速い領域では空間方向の圧縮処理を、前記移動速度が遅い領域では時間方向の圧縮処理を行う
ことを特徴とする請求項1に記載の動画像変換方法。 - 前記変換ステップは、前記移動速度に応じて空間方向の圧縮処理と時間方向の圧縮処理を同時に行う
ことを特徴とする請求項1に記載の動画像変換方法。 - 前記空間方向の圧縮処理は、画素数の間引き処理である
ことを特徴とする請求項4に記載の動画像変換方法。 - 前記時間方向の圧縮処理は、フレームの間引き処理である
ことを特徴とする請求項4に記載の動画像変換方法。 - 各領域内の画素の移動量を検出して前記領域の移動速度を求める移動速度算出ステップをさらに含み、前記決定ステップは、前記移動速度算出ステップでの処理で算出された各領域の移動速度に基づいて、前記フレームレートと前記空間解像度を決定する
ことを特徴とする請求項4に記載の動画像変換方法。 - 前記移動速度算出ステップは、領域毎にブロックマッチングによる動きベクトルの検出を行い、検出した前記動きベクトルを前記移動速度とする
ことを特徴とする請求項8に記載の動画像変換方法。 - 前記移動速度算出ステップは、連続するN(Nは整数)フレームの全部あるいは一部を用いて、前記連続するNフレームの各フレームに対して同じ移動速度を出力する
ことを特徴とする請求項8に記載の動画像変換方法。 - 前記変換ステップは、前記移動速度が所定の閾値T1より大きいときに前記空間方向の圧縮処理を行う
ことを特徴とする請求項4に記載の動画像変換方法。 - 前記変換ステップは、前記移動速度が所定の閾値T2より小さいときに前記時間方向の圧縮処理を行う
ことを特徴とする請求項4に記載の動画像変換方法。 - 前記変換ステップは、前記移動速度が所定の閾値T3とT4の間にあるときに前記空間方向および時間方向の圧縮を同時に行う
ことを特徴とする請求項5に記載の動画像変換方法。 - 前記決定ステップは、領域ごとの移動速度ならびに過去の決定結果に基づき、フレームレートと空間解像度を決定する
ことを特徴とする請求項1に記載の動画像変換方法。 - 前記変換ステップは、同一領域における過去の処理内容が前記空間方向の圧縮処理であり、かつ前記移動速度が所定の閾値V1より大きい時に前記空間方向の圧縮処理を行う
ことを特徴とする請求項14に記載の動画像変換方法。 - 前記変換ステップは、同一領域における過去の処理内容が前記時間方向の圧縮処理であり、かつ前記移動速度が所定の閾値V2より小さい時に前記時間方向の圧縮処理を行う
ことを特徴とする請求項14に記載の動画像変換方法。 - 前記変換ステップは、同一領域における過去の処理内容が前記空間方向および時間方向の圧縮を同時に行う圧縮処理であり、かつ前記移動速度が所定の閾値V3とV4の間にある時に前記空間方向および時間方向の圧縮処理を同時に行う
ことを特徴とする請求項14に記載の動画像変換方法。 - 前記決定ステップは、人の視覚特性に鑑みて、それ以上高フレームレート、高空間解像度であっても、人が画質の差を認識することが困難であるフレームレート、ならびに空間解像度に決定する
ことを特徴とする請求項1に記載の動画像変換方法。 - 前記動画像データは、高フレームレート、かつ高空間解像度で撮像された動画像データであり、
前記移動速度は、前記動画像データの領域毎に検出されたフレーム間の移動量である
ことを特徴とする請求項1に記載の動画像変換方法。 - 前記動画像データは、CG(Computer Graphics)処理によって生成された動画像データであり、
前記移動速度は、前記動画像データのオブジェクト毎、あるいは領域毎に予め付加されている
ことを特徴とする請求項1に記載の動画像変換方法。 - 動画像データを入力する第1の入力手段と、
前記動画像データの領域毎の移動速度を入力する第2の入力手段と、
前記移動速度に基づきフレームレートと空間解像度を決定する決定手段と、
前記フレームレートと空間解像度にしたがって前記画像データを変換する変換手段と
を備えることを特徴とする動画像変換装置。 - 前記フレームレートは、移動速度に基づき少なくとも2段階に設定され、前記移動速度が速い領域では高フレームレートに設定され、前記移動速度が遅い領域では低フレームレートに設定される
ことを特徴とする請求項21に記載の動画像変換装置。 - 前記空間解像度は、前記移動速度に基づき少なくとも2段階に設定され、前記移動速度が速い領域では低空間解像度に設定され、前記移動速度が遅い領域では高空間解像度に設定される
ことを特徴とする請求項21に記載の動画像変換装置。 - 前記変換手段は、前記移動速度が速い領域では空間方向の圧縮処理を、前記移動速度が遅い領域では時間方向の圧縮処理を行う
ことを特徴とする請求項21に記載の動画像変換装置。 - 前記変換手段は、前記移動速度に応じて空間方向の圧縮処理と時間方向の圧縮処理を同時に行う
ことを特徴とする請求項21に記載の動画像変換装置。 - 前記空間方向の圧縮処理は、画素数の間引き処理である
ことを特徴とする請求項24に記載の動画像変換装置。 - 前記時間方向の圧縮処理は、フレームの間引き処理である
ことを特徴とする請求項24に記載の動画像変換装置。 - 各領域内の画素の移動量を検出して前記領域の移動速度を求める移動速度算出手段をさらに備え、
前記決定手段は、前記移動速度算出手段により算出された各領域の移動速度に基づいて、前記フレームレートと前記空間解像度を決定する
ことを特徴とする請求項24に記載の動画像変換装置。 - 前記移動速度算出手段は、領域毎にブロックマッチングによる動きベクトルの検出を行い、検出した前記動きベクトルを前記移動速度とする
ことを特徴とする請求項28に記載の動画像変換装置。 - 前記移動速度算出手段は、連続するN(Nは整数)フレームの全部あるいは一部を用いて、前記連続するNフレームの各フレームに対して同じ移動速度を出力する
ことを特徴とする請求項28に記載の動画像変換装置。 - 前記変換手段は、前記移動速度が所定の閾値T1より大きいときに前記空間方向の圧縮処理を行う
ことを特徴とする請求項24に記載の動画像変換装置。 - 前記変換手段は、前記移動速度が所定の閾値T2より小さいときに前記時間方向の圧縮処理を行う
ことを特徴とする請求項24に記載の動画像変換装置。 - 前記変換手段は、前記移動速度が所定の閾値T3とT4の間にあるときに前記空間方向および時間方向の圧縮を同時に行う
ことを特徴とする請求項25に記載の動画像変換装置。 - 前記決定手段は、領域ごとの移動速度ならびに過去の決定結果に基づき、フレームレートと空間解像度を決定する
ことを特徴とする請求項21に記載の動画像変換装置。 - 前記変換手段は、同一領域における過去の処理内容が前記空間方向の圧縮処理であり、かつ前記移動速度が所定の閾値V1より大きい時に前記空間方向の圧縮処理を行う
ことを特徴とする請求項34に記載の動画像変換装置。 - 前記変換手段は、同一領域における過去の処理内容が前記時間方向の圧縮処理であり、かつ前記移動速度が所定の閾値V2より小さい時に前記時間方向の圧縮処理を行う
ことを特徴とする請求項34に記載の動画像変換装置。 - 前記変換手段は、同一領域における過去の処理内容が前記空間方向および時間方向の圧縮を同時に行う圧縮処理であり、かつ前記移動速度が所定の閾値V3とV4の間にある時に前記空間方向および時間方向の圧縮処理を同時に行う
ことを特徴とする請求項34に記載の動画像変換装置。 - 前記決定手段は、人の視覚特性に鑑みて、それ以上高フレームレート、高空間解像度であっても、人が画質の差を認識することが困難であるフレームレート、ならびに空間解像度に決定する
ことを特徴とする請求項21に記載の動画像変換装置。 - 前記動画像データは、高フレームレート、かつ高空間解像度で撮像された動画像データであり、
前記移動速度は、前記動画像データの領域毎に検出されたフレーム間の移動量である
ことを特徴とする請求項21に記載の動画像変換装置。 - 前記動画像データは、CG(Computer
Graphics)処理によって生成された動画像データであり、
前記移動速度データは、前記動画像データのオブジェクト毎、あるいは領域毎に予め付加されている
ことを特徴とする請求項21に記載の動画像変換装置。 - 画像を任意の領域に分割して記述する動画像データフォーマットにおいて、
各領域データは、フレームレートを表す第1のタグデータと、空間解像度を表す第2のタグデータと、前記フレームレートと空間解像度に変換された画像データで構成され、
前記フレームレートと空間解像度は、各前記領域の移動速度に基づき決定されたフレームレートと空間解像度である
ことを特徴とする動画像データフォーマット。 - 前記フレームレートは、移動速度に基づき少なくとも2段階に設定され、前記移動速度が速い領域では高フレームレートに設定され、前記移動速度が遅い領域では低フレームレートに設定される
ことを特徴とする請求項41に記載の動画像データフォーマット。 - 前記空間解像度は、前記移動速度に基づき少なくとも2段階に設定され、前記移動速度が速い領域では低空間解像度に設定され、前記移動速度が遅い領域では高空間解像度に設定される
ことを特徴とする請求項41に記載の動画像データフォーマット。 - 前記フレームレートと、空間解像度の決定は、人の視覚特性に鑑みて、それ以上高フレームレート、高空間解像度であっても人が画質の差を認識することが困難であるフレームレート、ならびに空間解像度に決定される
ことを特徴とする請求項41に記載の動画像データフォーマット。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004357974A JP2005198268A (ja) | 2003-12-10 | 2004-12-10 | 動画像変換装置および方法、並びに動画像データフォーマット |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003412501 | 2003-12-10 | ||
JP2004357974A JP2005198268A (ja) | 2003-12-10 | 2004-12-10 | 動画像変換装置および方法、並びに動画像データフォーマット |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005198268A true JP2005198268A (ja) | 2005-07-21 |
Family
ID=34829007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004357974A Pending JP2005198268A (ja) | 2003-12-10 | 2004-12-10 | 動画像変換装置および方法、並びに動画像データフォーマット |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005198268A (ja) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006005904A (ja) * | 2004-05-18 | 2006-01-05 | Sony Corp | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム |
JP2008085860A (ja) * | 2006-09-28 | 2008-04-10 | Sanyo Electric Co Ltd | 画像符号化装置 |
EP2003876A2 (en) * | 2006-03-31 | 2008-12-17 | Sony Corporation | Video image processing device, video image processing, and computer program |
JP2009000158A (ja) * | 2007-06-19 | 2009-01-08 | Konami Digital Entertainment:Kk | 走行玩具システム |
JP2009017425A (ja) * | 2007-07-09 | 2009-01-22 | Sony Corp | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム |
JP2009077189A (ja) * | 2007-09-21 | 2009-04-09 | Hitachi Ltd | 映像送受信方法、受信装置、映像蓄積装置 |
JP2009535969A (ja) * | 2006-05-03 | 2009-10-01 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | メディア表現からメディアを再構成する方法及び装置 |
US7609900B2 (en) | 2005-06-10 | 2009-10-27 | Sony Corporation | Moving picture converting apparatus and method, and computer program |
JP2009253767A (ja) * | 2008-04-08 | 2009-10-29 | Fujifilm Corp | 画像処理装置、画像処理方法、およびプログラム |
JP2009253766A (ja) * | 2008-04-08 | 2009-10-29 | Fujifilm Corp | 画像処理装置、画像処理方法、およびプログラム |
US7813430B2 (en) | 2004-05-18 | 2010-10-12 | Sony Corporation | Method and apparatus for decimation mode determination utilizing block motion |
JP2011030034A (ja) * | 2009-07-28 | 2011-02-10 | Nippon Telegr & Teleph Corp <Ntt> | 映像符号化プレフィルタリング方法,装置およびそのプログラム |
US8213497B2 (en) | 2006-07-04 | 2012-07-03 | Sony Corporation | Moving image converting apparatus, moving image converting method, and computer program |
JP2014522600A (ja) * | 2011-05-31 | 2014-09-04 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 分解能トレードオフおよび最適化を実装するビデオ圧縮 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01200882A (ja) * | 1987-12-22 | 1989-08-14 | Philips Gloeilampenfab:Nv | 信号処理方法及び該信号受信装置 |
JPH07222145A (ja) * | 1994-01-31 | 1995-08-18 | Mitsubishi Electric Corp | 画像符号化装置 |
-
2004
- 2004-12-10 JP JP2004357974A patent/JP2005198268A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01200882A (ja) * | 1987-12-22 | 1989-08-14 | Philips Gloeilampenfab:Nv | 信号処理方法及び該信号受信装置 |
JPH07222145A (ja) * | 1994-01-31 | 1995-08-18 | Mitsubishi Electric Corp | 画像符号化装置 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4552691B2 (ja) * | 2004-05-18 | 2010-09-29 | ソニー株式会社 | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム |
JP2006005904A (ja) * | 2004-05-18 | 2006-01-05 | Sony Corp | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム |
US7813430B2 (en) | 2004-05-18 | 2010-10-12 | Sony Corporation | Method and apparatus for decimation mode determination utilizing block motion |
US7609900B2 (en) | 2005-06-10 | 2009-10-27 | Sony Corporation | Moving picture converting apparatus and method, and computer program |
EP2003876A2 (en) * | 2006-03-31 | 2008-12-17 | Sony Corporation | Video image processing device, video image processing, and computer program |
US8072498B2 (en) | 2006-03-31 | 2011-12-06 | Sony Corporation | Image processing apparatus, image processing method, and computer program |
EP2003876A4 (en) * | 2006-03-31 | 2011-06-22 | Sony Corp | VIDEO IMAGE PROCESSING, VIDEO IMAGE PROCESSING AND COMPUTER PROGRAM |
JP2009535969A (ja) * | 2006-05-03 | 2009-10-01 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | メディア表現からメディアを再構成する方法及び装置 |
US8213497B2 (en) | 2006-07-04 | 2012-07-03 | Sony Corporation | Moving image converting apparatus, moving image converting method, and computer program |
JP2008085860A (ja) * | 2006-09-28 | 2008-04-10 | Sanyo Electric Co Ltd | 画像符号化装置 |
JP2009000158A (ja) * | 2007-06-19 | 2009-01-08 | Konami Digital Entertainment:Kk | 走行玩具システム |
US8257133B2 (en) | 2007-06-19 | 2012-09-04 | Konami Digital Entertainment Co., Ltd. | Travelling toy system |
JP2009017425A (ja) * | 2007-07-09 | 2009-01-22 | Sony Corp | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム |
US8421914B2 (en) | 2007-07-09 | 2013-04-16 | Sony Corporation | Method and apparatus converting moving image, method and apparatus for reproducing moving image, and computer program |
JP2009077189A (ja) * | 2007-09-21 | 2009-04-09 | Hitachi Ltd | 映像送受信方法、受信装置、映像蓄積装置 |
JP2009253766A (ja) * | 2008-04-08 | 2009-10-29 | Fujifilm Corp | 画像処理装置、画像処理方法、およびプログラム |
JP2009253767A (ja) * | 2008-04-08 | 2009-10-29 | Fujifilm Corp | 画像処理装置、画像処理方法、およびプログラム |
JP2011030034A (ja) * | 2009-07-28 | 2011-02-10 | Nippon Telegr & Teleph Corp <Ntt> | 映像符号化プレフィルタリング方法,装置およびそのプログラム |
JP2014522600A (ja) * | 2011-05-31 | 2014-09-04 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 分解能トレードオフおよび最適化を実装するビデオ圧縮 |
US9554132B2 (en) | 2011-05-31 | 2017-01-24 | Dolby Laboratories Licensing Corporation | Video compression implementing resolution tradeoffs and optimization |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005198268A (ja) | 動画像変換装置および方法、並びに動画像データフォーマット | |
US8009934B2 (en) | Image processing method and apparatus setting spatial decimation to movement within image regions | |
EP1990997A1 (en) | Image display device and method, and image processing device and method | |
US9204086B2 (en) | Method and apparatus for transmitting and using picture descriptive information in a frame rate conversion processor | |
US20060222077A1 (en) | Method, apparatus and computer program product for generating interpolation frame | |
JP2003274414A (ja) | 動きベクトル検出方法、補間画像作成方法及び画像表示システム | |
JP2010093779A (ja) | 動き補償において周期的構造に対処する方法および装置 | |
US8031191B2 (en) | Apparatus and method for generating rendering data of images | |
JP2010278898A (ja) | 超解像画像処理装置、超解像画像処理方法及びipモジュールデータ | |
JP2006092450A (ja) | 画像処置装置および画像処理方法 | |
US8692933B1 (en) | Method and apparatus for buffering anchor frames in motion compensation systems | |
JP4761102B2 (ja) | 画像表示装置および方法、並びにプログラム | |
JP2006345445A (ja) | 動画像変換装置、および動画像変換方法、並びにコンピュータ・プログラム | |
JP2017062279A (ja) | 画像処理装置および画像処理方法 | |
JP4552691B2 (ja) | 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム | |
JP4431973B2 (ja) | 動画像処理装置および方法 | |
JP2007060192A (ja) | 補間フレーム生成装置、その方法、画像表示システム、並びに、プログラムおよび記録媒体 | |
JP4412062B2 (ja) | 動画像変換装置、および動画像変換方法、並びにコンピュータ・プログラム | |
JP5409245B2 (ja) | 画像処理装置及びその制御方法 | |
JP4379100B2 (ja) | 撮像装置および方法、並びにプログラム | |
JP4354799B2 (ja) | 補間画像生成方法および装置 | |
JP2014003990A (ja) | 内視鏡装置および内視鏡観察システム | |
JP2018084997A (ja) | 画像処理装置、画像処理方法 | |
JP2009290710A (ja) | 画像処理装置および表示装置 | |
JP4779424B2 (ja) | 動画像変換装置、および動画像変換方法、並びにコンピュータ・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101021 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101217 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110920 |